开源BI系统简述<o:p></o:p>
<o:p> </o:p>
1. 概述
开源的BI项目在在2005年之前并没有太大的发展,到了2005年才开始呈现繁荣之势,并在2006年蓬勃发展。这些众多的BI项目从规模和对BI系统支撑的完善程度上来说,大体可以分为Framework、Stand-alone Tools和BI Suit三种类型。
l Framework
开源框架,这是在商业BI系统中所没有的。我们可以使用它们来构建自己的BI工具,或者增强和扩展我们的BI解决方案。
l Stand-alone Tools
独立的BI工具,这是开源项目中数量最多的一类。很多工具只侧重BI系统中的某个环节和方面,如ETL、Report、OLAP和Database等等。
l BI Suit
在统一的架构下提供了多种BI系统的特性的工具集合。就目前的情况看,不管是商业软件还是开源软件,还没有任何一个套件提供了完整的端到端的BI解决方案。这些开源的BI Suit是通过连接多个其他的组件和工具的方式形成套件的,由于BI系统涉及到的工具是非常多的,所以整合一套完整的BI解决方案是很困难的。
<o:p> </o:p>
一个完整的BI解决方案中有多种工具来完成BI系统中各个阶段的工作。
数据抽取、转换和加载工具。优秀的ETL工具应该具有以下特性:
1、 Workflow Management, Job Execution and Scheduling Manager。能方便地定义流程并自动化执行ETL任务。
2、 Centralized Metadata Repository and Management。集中存储和管理符合业界标准的元数据。
3、 Data Profile and Validation。可以检验数据的质量。
4、 High Performance。在大负荷的任务执行中仍然有良好的性能。
5、 Scalable, Platform Independent。具有良好的弹性,支持多种操作系统和数据库系统,能操作多种异构的数据源。
6、 Open Architecture and API。具有开放的架构和易于使用的二次开发接口。
<o:p> </o:p>
目前较为知名的开源ETL工具有:
1、 KETL,由具有IBM和KPMG背景的Kinetic Networks公司开发,现在已经有三年多的产品应用历史,成功应用于一些产品中,在点击流(ClickStream)分析应用中表现出色。KETL采用Plug-in的架构,使用Java开发。
2、 KETTLE,为一个元数据驱动的ETL工具。已经加入Pentaho。
3、 Clover ETL,为一个基于Java的ETL Framework,可以用来开发自己的ETL应用。
4、 Enhydra Octopus,为一个基于Java的ETL工具,使用JDBC来连接各种数据源,易于使用和部署。曾有人应用于电信网络资源分析系统中。
优秀的报表工具通常具有以下特性:
1、 支持多种数据源。
2、 直观的可视化设计器,简单易用的报表定制功能。
3、 方便的数据访问和格式化,丰富的数据呈现方式。
4、 符合数据呈现的通用标准,能和应用程序很好地进行结合。
5、 易于扩展和部署。
<o:p> </o:p>
目前较为知名的开源报表工具有:
1、 JasperReports,一个优秀的Java报表工具,始于2001,现在JasperSoft公司持续开发和支持该工具。该工具类似于商业软件Crystal Report,支持PDF、HTML、XLS、CSV和XML文件输出格式,现在是Java开发者最常用的报表工具。
2、 OpenReports,提供基于web的灵活报表解决方案,通过浏览器自动生成动态PDF,XLS,HTMLCSV 和Chart报表,它是用Java开发的,使用JasperReports 作为报表引擎,利用到的开源技术有Hibernate,Veloctiy,Webwork。
3、 JFreeReport,现在是Pentaho的一部分,它是一个优秀的用来生成报表的Java类库。它为Java应用程序提供一个灵活的打印 功能并支持输出到打印机和PDF, Excel, HTML和XHTML, PlainText, XML和CSV文件中。
4、 Eclipse BIRT,是Eclipse下面的一个企业智能和报表 工具,能为J2EE的WEB应用程序创建漂亮醒目的PDF或者HTML格式的报表,它提供了核心的报表功能。
联机分析处理工具。目前开源的OLAP工具也分为MOLAP、ROLAP和HOLAP,优秀的OLAP工具通常有以下特性:
1、 良好的执行性能,能快速地进行分析处理工作。
2、 良好的适用性和可伸缩性。
3、 开放式接口和丰富的API。
<o:p> </o:p>
目前较为知名的开源OLAP工具有:
1、 Mondrian,是Pentaho的一部分,为一个用Java开发的OLAP服务器,实现了MDX语言、XML解析和JOLAP规范,可以不写SQL就能分析存储于SQL 数据库的庞大数据集,可以封装JDBC数据源并把数据以多维的方式展现出来。<o:p></o:p>
2、 JPivot,是一个JSP 自定制的标签库,可以绘制一个OLAP表格和图表。用户可以执行 典型的OLAP导航,如下钻,切片和方块。它使用Mondrian 作为其OLAP服务器。它使用WCF (Web Component Framework) ,基于XML/XSLT来渲染Web UI组件。JPivot在元数据缓存方面的过于简化的整体性初始化装载的做法将限制它只能处理很小的立方体(Cube)。
开源的数据库也有很多,大多数为关系型数据库,少数为应用于数据仓库环境做了专门的优化工作。Bizgres以PostgreSQL为基础进行了数据仓库环境下的优化,提高了分析查询性能。
下面列出相对成熟和完整,并且有借鉴意义的开源BI套件。
为GreenPlum公司主导的开源项目,和Sun公司达成合作关系。Bizgres为BI应用而对PostgreSQL做了优化,提高了大负荷的并行计算能力,在BI环境中,相对于普通的关系型数据库具有卓越的数据处理性能。Bizgres的数据库平台可以和KETL和JasperReports进行整合,从而形成一个BI套件:
1、 数据库:BI专业数据库Bizgres,或者大型应用中的高性能服务器Bizgres MPP,能比普通关系数据库快20倍
2、 ETL工具:KETL
3、 报表工具:JasperReports
是一个Java开发的Web应用,能对OLAP服务器、关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署,界面美观友好,后续还将支持数据挖掘和ETL等。Openi主要包括:
1、 OLAP展示:JPivot
2、 报表工具:JFreeChart
3、 分析数据源连接器
是一个以工作流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它包括:
1、 工作流引擎:Shark and JaWE
2、 数据库:Firebird RDBMS
3、 集成管理和开发环境:Eclipse
4、 报表工具:Eclipse BIRT
5、 ETL工具:Enhydra/Kettle
6、 OLAP Server:Mondrian
7、 OLAP展示:JPivot
8、 数据挖掘组件:Weka
9、 应用服务器和Portal服务器:JBoss
10、 单点登陆服务及LDap认证:JOSSO
11、 自定义脚本支持:Mozilla Rhino Javascript脚本处理器
由上可见Pentaho是一个很完善的BI解决方案。Pentaho偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。
SpagoBI 集成了Mondrain和JProvit,能够通过OpenLaszlo产生实时报表。SpagoBI使用java开发,不依赖于具体的操作系统,有很强的扩展能力。它主要包括:
1、 报表工具:JasperReports /Eclipse BIRT/ iReport
2、 OLAP Server:Mondrian
3、 OLAP展示:JPivot
4、 数据挖掘组件:Weka
5、 Map引擎:Geo
6、 ETL:BIE
7、 搜索引擎:Lucene
8、 Dashboard:OpenLaszlo
9、 Portal Server:JBoss/ Tomcat/ JOnAS
根据其Roadmap可以看出,SpagoBI将融入更多的BI功能,甚至BI之外的功能。
<o:p> </o:p>
分享到:
相关推荐
【开源BI系统】是指那些基于开放源代码的商业智能(Business Intelligence)系统,它们提供了一种经济、可定制化的途径,使用户能够收集、分析和理解业务数据,从而支持决策制定。开源BI系统通常分为三类:Framework...
开源BI(Business Intelligence)系统是一种基于开放源代码的商业智能解决方案,它允许用户根据自身需求构建、定制和扩展BI工具,以实现数据的分析、报表生成、决策支持等功能。相较于商业BI系统,开源BI系统提供了...
【Openi 开源 BI 平台的开发数据仓库系统】 Openi 是一款开源的商业智能(BI)平台,专门用于构建数据仓库系统。BI 平台的核心任务是将企业的现有数据转化为可指导业务决策的知识。Openi 提供了一个全面的解决方案...
开源轻量级BI系统前端项目源码,共140个文件,采用TypeScript、Vue、HTML和CSS等语言开发,涉及多种文件...该项目是一个基于TypeScript和Vue的开源轻量级BI系统前端设计,旨在提供一个高效、稳定的BI系统前端解决方案。
**SpagoBI与Pentaho BI平台:开源商业智能的深度探索** SpagoBI与Pentaho BI都是广受欢迎的开源商业智能(BI)平台,它们为企业提供了数据整合、分析和可视化的能力,使得非技术人员也能理解和利用数据进行决策。...
### 开源BI平台Openi的开发数据仓库系统 #### 一、开源的BI平台概述 商业智能(Business Intelligence, BI)作为一个重要的管理决策工具,旨在帮助企业通过对现有数据的有效利用来进行科学决策。这些数据来源广泛,...
Pentaho Business Intelligence(BI)开源报表系统是一款强大的数据分析和商业智能解决方案,旨在帮助企业和组织从海量数据中提取有价值的信息,并以直观的方式呈现出来。这款工具提供了报表设计、数据挖掘、数据...
尽管存在一些开源BI套件,如Pentaho、JasperServer等,但它们通常通过集成多个独立工具来实现功能齐全的BI解决方案,这增加了实施和维护的复杂性。 4. 开源BI工具的优势 开源BI工具的优势在于其灵活性、成本效益...
开源BI工具Dataease安装包(v2.10.1),DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。DataEase 支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以...
metabase,一款开源的BI分析工具
【Java开源企业考勤系统】是一个专为企业设计的考勤管理解决方案,它基于Java编程语言,为企业的员工考勤提供了一套完整的系统。这个开源项目旨在帮助企业管理员工的上下班时间,自动计算迟到、早退、请假等情况,...
在这个压缩包中包含的“开源BI平台Openi的开发数据仓库系统.doc”文档,很可能是详细介绍如何利用Openi构建和优化数据仓库的指南。 首先,我们需要理解数据仓库的基本概念。数据仓库是一个面向主题的、集成的、非易...
开源MES系统如MES-master,提供了一种经济高效的选择,企业可以自由定制和扩展,降低初期投入成本。开源系统的优势在于透明度高、灵活性强,开发者社区活跃,能够持续获得技术支持和更新。 总的来说,MES系统是企业...
【优惠券开源系统】是一种专为站长设计的软件解决方案,旨在快速搭建具备优惠券功能的购物网站。这个系统的核心特点是其开源性质,意味着用户可以自由查看、修改和分发源代码,根据自身需求定制功能,适应不同的商业...
学之思开源考试系统是一款 java + vue 的前后端分离的考试系统。主要优点是开发、部署简单快捷、界面设计友好、代码结构清晰。支持web端和微信小程序,能覆盖到pc机和手机等设备。 支持多种部署方式:集成部署、前后...
开源支付系统是一个允许开发者和企业构建自己支付解决方案的开放源代码项目。这个压缩包“开源支付系统.rar”可能包含了所有必要的文件和文档,用于搭建一个自定义的、可扩展的支付处理平台。以下是对这个系统的一些...
1.轻量级BI, 支持快速建模,快速可视化数据。 2.多维分析功能强大,支持下钻/上卷/排序/筛选/计算/聚合等多种操作方式。 3.报表使用简单,功能强大,通过拖放等方式构建分析界面, 0代码编写。 4.开放...
SpagoBI是一款强大的开源商业智能(BI)平台,被誉为开源BI领域的领导者。它提供了一整套全面的数据分析和报表工具,旨在帮助企业从海量数据中提取价值,进行有效的决策支持。5.X版本是SpagoBI的一个重要里程碑,...
开源云计算系统简介
本文旨在比较三个不同的开源BI平台——JasperSoft、Pentaho和SpagoBI,探讨它们当前的特点、未来潜力以及在实际项目中的限制,同时也为研究原型提供基础。我们试图了解开源现象是否能在BI领域成为商业平台的有效替代...