最近开始做一个大规模数据分析的项目,一直在看一些BI方面的东西,每接触到一种新技术,就像站在一个山顶,先要站在制高点去眺望山下都有什么,才知道哪个方向的风景最有魅力,卖弄完毕,开始总结下这几天看到的一些对于BI方面的整体介绍。
BI(商业智能),英文名就是Business Intelligence,简单的来说就是将我们目前的数据转化为知识,为企业决策提供支持,让企业在以后的决策上少走弯路。准确的定义是:BI(Business Intelligence) 是一种运用了数据仓库、在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策支持。
举个入门级的例子吧!虽然很入门。
假如你是一个销售公司的老板,公司的业务面比较广泛,随着时间的积累,慢慢有了长达几年的各个方面的数据,不管这些数据是自己公司,或者来源于竞争对手的业绩数据,这些数据越来越多,也越来越占用空间,可是丢掉也觉得弃之不舍,又不知道这么一大堆的数据用处是什么?这个时候BI就派上用场了,特别是在大量的数据处理上,能通过提取转换,很直观(通常是各种报表形式)的反应给公司管理人员,这样你就知道你竞争对手的各个方面的业务状况,也很清晰的看到自己各个业务的进展和发展状况,对于公司以后发展方向很可能起着决定性作用,这个时候,可以说BI就相当于指挥棒。
BI不是一门新的技术,而是很多技术的一个综合,比如数据仓库用到ETL,在线分析OLAP,数据挖掘,不管怎么说BI离不开数据,特别是在这个大数据的年代!
BI从上个世纪1996年提出,国内的发展也有十年之久,目前已经有一些比较成熟的解决方案,主要说一些用的多的吧,Obviously,用的多,基本上就是开源的了。
1.Mondrian
Mondrian不能算一个方案,可是目前很多方案都不能离开它。Mondrian是用java编写的一个开源OLAP(在线联机分析)引擎,实现了xmla和jolap规范,而且自定义了一种使用mdx语言的客户端接口,MDX简单来说就是基于SQL的进行多维分析的查询语句吧。这些后面细说。Mondrian是一个OLAP服务器,也就是说不是数据仓库服务器,不负责存储等方面的任务,Mondrian从数据仓库中取出数据,然后转换为多维数据模型,放到内存中,它的主要任务就是数据的转换和提取。
2.JPivot
JPivot也不是一个完整解决方案,但是也是一个开源的项目,负责数据的渲染展现。简单说就是一个基于WCF(Web Compont Framework)的jsp标签库,它的数据基于Mondrian服务器,分析结果通过若干个报表,并且可以导出Excel(其实Excel也可以算个简单的BI分析工具)和PDF。个人觉得呢,Mondrian和JPivot可以算是一对基佬,很多方案都是基于Mondrian+JPivot,另外加上一套报表工具和数据仓库等东东。还有不得不吐槽的是JPivot的画面,工具栏缺少亲和力。
3. OpenI
OpenI算是一个轻量级的BI工具,基于Mondrian和JPivot,侧重于数据展现,Openi是一个Java开发的Web应用,能对OLAP服务器、关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署,界面美观友好,后续还将支持数据挖掘和ETL等。
Openi主要包括:
1、 OLAP展示:JPivot
2、 报表工具:JFreeChart
3、 分析数据源连接器
由于OpenI也看不惯JPivot的界面,所以对部分功能进行了改善,比较友好,而且易于部署,目前比较成熟,适用于中小型项目开发。
4. JasperSoft
JasperSoft 和OpenI比较类型,都是基于Mondrian+JPivot,由于是做报表(JasperReports起家),所以JasperSoft 的报表功能比OpenI较强大,基于世界上最流行的开源 JAVA 报表库及图形化的报表设计工具-JasperReport和iReport,报表内容比较丰富全面
5.SpagoBI
SpagoBI是一个重量级适用于大型企业的成熟开源解决方案,统一集成了Mondrain和JProvit,能够通过OpenLaszlo产生实时报表。SpagoBI使用java开发,所以适用性较强。它主要包括:
1、 报表工具:JasperReports /Eclipse BIRT/ iReport
2、 OLAP Server:Mondrian
3、 OLAP展示:JPivot
4、 数据挖掘组件:Weka
5、 Map引擎:Geo
6、 ETL:BIE
7、 搜索引擎:Lucene
8、 Dashboard:OpenLaszlo
9、 Portal Server:JBoss/ Tomcat/ JOnAS
它涵盖了一个BI系统所有方面的功能,包括:数据挖掘、查询、分析、报告、Dashboard仪表板等等。功能强大全面,系统架构合理。
6. Pentaho
Pentaho是一个以工作流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。Pentaho是一个很完善的BI解决方案。Pentaho偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。目前pentaho资料比较全面而且竟然有专门的中文文档,说明还是很注意中国市场的,连Mondrian都加入了pentaho,国内一些大型的BI方案使用pentaho的比较多。最后还要提出一点的是,SpagoBI和Pentaho都是基于Mondrian和JPivot的,所以理解Mondrian和JPivot的内部结构还是很有必要的,虽然这几天看JPivot的源代码看的要吐,而且JPivot代码有一定的可优化性。
最后是一些官方链接
Mondrian http://sourceforge.net/projects/mondrian/
JPivot http://jpivot.sourceforge.net/
OpenI http://openi.org/
JasperSoft http://www.jaspersoft.com/
SpagoBI http://www.spagoworld.org/
Pentaho http://www.pentaho.com/
相关推荐
本报告将对BI开源工具进行深入研究,涵盖其基本概念、主要类型以及常用工具的特点。 1. BI系统的构成与分类 BI系统主要包括ETL(Extract, Transform, Load)、数据仓库(DW)、在线分析处理(OLAP)和数据挖掘(DM...
这里提供了一些开源BI工具的具体示例: - **Saiku 2.5**:展示了如何使用 Saiku 进行多维数据分析。 - **Openi 2.0**:介绍了 Openi 的数据可视化功能。 - **Mondrian & Jpivot**:展示了如何使用 Mondrian 和 ...
MOLAP已成为中小企业管理决策的首选工具软件,与excel结合使用大大节省企业在IT方面的投入,而且简单易学,容易在公司内普及。 如对软件感兴趣,欢迎与我联系。 邮件:wormbus#163.com (请把#换成@)
metabase,一款开源的BI分析工具
### 开源工具调研报告 #### 一、BI系统的简述及分类 商务智能(Business Intelligence,简称BI)系统是一套全面的数据分析与决策支持体系,它涵盖了数据的收集、整理、分析以及展示等多个方面。从技术层面来看,BI...
商业智能(BI)是企业数据分析的关键工具,帮助组织从海量数据中提取有价值的洞察。本文将对比分析四大BI开发软件:SAP Business Objects(BO)、IBM Cognos、Oracle Hyperion和Microsoft的Visual Studio 2005/SQL ...
标题中的“Pentaho BI开源报表系统”是指该系统的核心特性是开源,这意味着任何人都可以免费下载、使用、修改其源代码,并根据自身需求定制功能。这个系统以其灵活性和可扩展性赢得了全球众多用户的青睐,尤其适合中...
**SpagoBI与Pentaho BI平台:开源商业智能的深度探索** SpagoBI与Pentaho BI都是广受欢迎的开源商业智能(BI)平台,它们为企业提供了数据整合、分析和可视化的能力,使得非技术人员也能理解和利用数据进行决策。...
开源BI工具Dataease安装包(v2.10.1),DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。DataEase 支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以...
《数据之魅:基于开源工具的数据分析》是一本全面介绍了如何利用开源工具进行数据分析的书籍。本书由Philipp K. Janert撰写,由O'Reilly Media出版。本书不仅深入浅出地讲解了数据分析的基本概念和技术,还详细介绍...
过去,有关企业数据分析的重担都压在IT部门,传统BI分析更多面向的是具有IT背景的人员。...但同时,分析工具毕竟作为一个系统架设在企业数据分析平台的前端,需要适应企业的复杂业态,于是自助式BI成了不二选择。
【2022年BI工具选型对比】报告聚焦了帆软、永洪、PowerBI和观远这四款主流的商业智能(BI)工具,从产品背景、数据对接能力和数据可视化能力等八大方面进行了全面的评分比较,旨在为企业的BI工具选择提供决策依据。...
【开源BI系统】是指那些基于开放源代码的商业智能(Business Intelligence)系统,它们提供了一种经济、可定制化的途径,使用户...用户可以根据自身的需求和资源,选择合适的开源工具,构建适合自己业务的BI解决方案。
本项目提供的是一个非开源的完整数据可视化BI工具的源码,主要基于Java和Vue.js技术栈开发,具备前后端分离的架构设计。 首先,前端部分采用了Vue.js框架。Vue.js是一个轻量级的JavaScript库,因其易学易用、高效...
开源BI(Business Intelligence)系统是一种基于开放源代码的商业智能解决方案,它允许用户根据自身需求构建、定制和扩展BI工具,以实现数据的分析、报表生成、决策支持等功能。相较于商业BI系统,开源BI系统提供了...
kettle_使用中的一些常见问题.pdf Kettle_命令行使用.pdf kettle中文文档之output.pdf Kettle例子.pdf Kettle关于平面数据的导入.pdf Kettle初探.pdf Kettle命令行使用说明.pdf Kettle培训.ppt KETTLE基本...
- 开源 BI 平台如 Openi 提供了经济高效的数据分析工具,帮助企业利用大数据驱动决策。 - 随着技术的不断发展,Openi 等开源 BI 平台将持续演进,提供更多功能以满足日益复杂的业务需求。 综上所述,Openi 开源 ...
【BI开源项目现状和对比分析】 商业智能(Business Intelligence,BI)开源项目近年来发展迅速,为各类企业和组织提供了经济高效的数据分析解决方案。本篇将详细分析几个关键的BI开源项目,包括它们的功能特性、...
我们将从了解 CentOS 和 Docker 的基本概念开始,然后逐步介绍如何在 CentOS 中安装 Docker,安装 Wyn BI 工具,最后实现基于 Docker 部署 BI 数据分析。 了解 CentOS CentOS 是一个免费且开源的操作系统,是一个...
BI工具选型报告是企业在构建商业智能(BI)系统时的关键步骤,旨在寻找最符合企业需求的BI解决方案。本报告涵盖了多个方面的评估标准,以确保所选工具的全面性和适用性。以下是一些主要的知识点: 1. **操作系统...