Hadoop是个很流行的分布式计算解决方案,是Apache的一个开源项目名称,核心部分包括HDFS及MapReduce。其中,HDFS是分布式文件系统,MapReduce是分布式计算引擎。时至今日,Hadoop在技术上已经得到验证、认可甚至到了成熟期,同时也衍生出了一个庞大的生态圈,比较知名的包括HBase、Hive、Spark等。HBase是基于HDFS的分布式列式数据库,HIVE是一个基于HBase数据仓库系统。Impala为存储在HDFS和HBase中的数据提供了实时SQL查询功能,基于HIVE服务,并可共享HIVE的元数据。Spark是一个类似MapReduce的并行计算框架,也提供了类似的HIVE的Spark SQL查询接口,Hive是基于hadoop的数据分析工具。
很多企业比如银行流水作业很多,数据都是实时更新且数据量很大。会采用hadoop作为底层数据库,借由中间商处理底层数据,然后通过BI系统去连接这些中间数据处理厂商的中间表,接入处理数据,尤其以星环、华为这类hadoop大数据平台商居多,使用也较为广泛。
这里以星环大数据平台与帆软大数据BI工具FineBI的结合应用来简单介绍下。
由于星环也是处理hadoop下的hive数据库,其本质都是差不多的,可以使用Hive提供的jdbc驱动,这个驱动同样可以让FineBI连接星环的数据库并进行一些类关系型数据库的sql语句查询等操作,部分特殊sql的公式需要与星环人员确认是否可以使用。
首先将这些驱动拷贝到报表工程下面,然后重启BI服务器。重启后可以建立与星环数据库的数据连接,最后通过连接进行数据查询。
1、本地部署
下图是FineBI内部测试用的hadoop的jar包(将以下jar包放置于webinf-lib文件夹下),亲测,可连接成功,如下图所示:
2、数据连接
数据连接如下图所示:
测试连接成功之后,点击确定,可直接选择数据库中对应的表加入业务包中,类似于Mysql这些最常见的数据库取表方式。
3、实际分析案例
某银行的总行层面-机构维度-四象限图
(2)总行层面-机构维度-趋势分析
(3)总行层面-产品维度-盈利产品
4.关于FineBI的FineIndex和FineDirect功能
hadoop是底层,hive是数据库,上述案例采用的是FineIndex(cube连)连接,用的是hiveserver的方式进行数据连接的;数据连接成功之后,将hive数据库中的表添加到业务包中,也就是将库中数据拿到我们的多维数据库(FineIndex),当然抓取的过程中也可以读取数据库关联和转义,也可以手动转义和进行关联,同时也可以做一些etl操作如新增公式列/行列转换/join/union/过滤/分组统计/自循环列/新增分组列/使用部分字段等,做过处理的这些数据表用于前端分析。
也就是说数据库-FineIndex-前端分析,这里的FineIndex相当于一个中间库的形式,用来存储数据表,关联转义索引等。这些都对后续前台分析处理数据效率有很大的提升(因为直接sql取数,效率受数据库本身的限制,数据量大时,一般分析工具很容易就卡死升职内存溢出导致系统无响应),这也是FineIndex方案的初衷。FineIndex存在有两个意义,一个是提升效率,一个就是对数据进行二次整合处理。
FineBI还有一个连接方式FineDirect(数据库直连),主要是应对如下需求:
- 分析结果的实时性
企业用户在使用BI工具的时候,多数情况下是对大量的历史数据进行OLAP分析,但是也有部分用户需要展现结果的实时性。例如金融行业对于交易风险的分析,是对每一笔流水实时进行分析的,如果需要经过构建多维数据库的过程,数据到来就会有延迟,影响分析结果的准确性。但是因为计算的过程交给了数据库,响应速度更多的取决于数据库的性能。
- 大数据平台的充分利用
随着各种分布式计算方案的不断优化,数据的计算性能也有了快速的发展,计算能力有了显著的提高,不少企业已经有了自己的大数据计算平台,例如hadoop,kylin,greenplum,vertica等,这些平台的对于大数据量的处理性能已经足以满足使用需求,不再有建模的需求,因此FineBI直连引擎提供了对接这些数据平台的功能。
相关推荐
在商业智能BI中,数据可视化的应用主要体现在以下几个方面: 1. 数据探索与发现:通过图表、地图等形式展示数据,可以帮助用户快速识别数据中的异常值、趋势和模式,进一步深入挖掘隐藏的业务洞察。 2. 业绩监控:...
Smartbi作为一种支持Hadoop/Hive的商业智能解决方案,在实际应用中展现出了强大的数据处理能力和灵活性。未来,随着大数据技术的不断发展,Smartbi等BI工具与Hadoop/Hive的集成将更加紧密,为企业提供更多样化、更...
4. **误解:Hadoop 等同于商业智能(BI)** **正解:** Hadoop 虽然适合进行数据分析,但它并不直接等于BI。BI通常关注数据呈现和决策支持,而Hadoop 更多是作为数据存储和预处理的平台。它们在数据链的不同阶段...
商业智能BI主要包括数据收集、清洗、转换、存储、分析和可视化等多个环节。它通过整合企业内部和外部的数据,提供实时或近实时的报表、仪表盘和预测模型,帮助管理者理解业务状况,支持决策制定。 二、平台建设目标...
7. 大数据商务智能BI平台的应用:大数据商务智能BI平台可以应用于零售行业商业运营指标分析、智能供应链分析、个性化推荐系统、互联网金融征信等多个领域。 8. 大数据开发及运行环境:大数据开发及运行环境包括...
标签中的"hadoop-common-bi"可能指的是Hadoop Common在商业智能(BI)场景的应用,这意味着Hadoop Common在数据仓库、数据分析和报表生成等场景中起到了关键作用。Hadoop Common提供的文件系统接口和数据处理工具...
IBM作为业界领先的技术提供商,深入探讨了这两个领域的交汇点,阐述了如何有效地将大数据应用于商业智能实践中。 大数据,通常定义为具有高容量、高速度和多样性的数据集合,其价值在于通过复杂分析揭示隐藏的模式...
1. **商业智能BI的基本概念**:BI是信息技术和数据分析的结合,它包括数据仓库、数据挖掘、报表和仪表板、预测分析等多个方面。其核心目标是将大量数据转化为有价值的信息,支持战略决策。 2. **数据仓库与ETL过程*...
西北工业大学提供的商业智能课程,很可能是为了让学生深入理解这门技术在实际商业场景中的应用。 在商业智能的课程中,学生可能会学习到以下核心知识点: 1. 数据仓库与数据湖:商业智能的基础是数据,数据仓库是...
"商业智能(BI)白皮书1.0"是一个深入探讨BI概念、技术、应用及趋势的行业报告,对于想要了解或深入BI领域的读者来说具有很高的参考价值。 首先,BI的核心是数据仓库。数据仓库是BI系统的基础,它将来自企业不同...
睿思BI商业智能系统使用手册.zip中的内容涵盖了多个IT领域的知识点,主要集中在商业智能(BI)、系统开发以及人工智能的应用上。下面将详细阐述这些领域的核心概念及其在毕设与课程作业中的应用。 首先,让我们从...
这些问题限制了商业智能技术在企业信息化发展中的作用和应用。 云计算技术的出现和应用,为商业智能处理带来了新的解决方案。基于云计算的商业智能处理技术具有以下优点: 1. 成本降低:云计算技术按需分配资源,...
商业智能(Business Intelligence,简称BI)是现代金融业中不可或缺的一环,尤其在商业银行中,BI架构体系对于数据的分析、决策支持以及业务优化起着至关重要的作用。本篇将深入探讨商业银行BI架构体系,旨在帮助...
智慧医院BI智能决策大数据分析平台建设综合解决方案是基于大数据和商业智能(BI)技术的医院信息化解决方案。该解决方案旨在帮助医疗机构提高医疗质量、降低医疗成本、提高医疗效率和服务质量。 1. 大数据BI分析...
6. **BI(商业智能)报告**:基于Hadoop的数据可以用于生成复杂的商业智能报告,帮助决策者理解业务趋势。 7. **RDBMS(关系型数据库管理系统)**:虽然Hadoop本身不支持关系型数据,但可以通过Thrift等工具与传统...
商业智能(BI,Business Intelligence)是一种信息技术应用,用于将企业中的大量数据转化为有意义的信息和洞察,帮助企业决策者做出更明智的业务决策。本方案主要关注BI的总体架构规划设计,包括数据采集、处理、...
5. 人工智能在商业智能中的应用:人工智能的诸多技术,如自然语言处理、图像识别等,与商业智能相结合可以为用户提供更智能、更个性化的数据分析服务。 6. 云计算与商业智能:云计算提供了弹性的计算资源和存储空间...