`

(转)Java开源BI系统介绍

 
阅读更多
BI解决方案中的工具
  一个完整的BI解决方案中有多种工具来完成BI系统中各个阶段的工作。
  ETL工具
  数据抽取、转换和加载工具。优秀的ETL工具应该具有以下特性:
  1、 Workflow Management, Job Execution and Scheduling Manager。能方便地定义流程并自动化执行ETL任务。
  2、 Centralized Metadata Repository and Management。集中存储和管理符合业界标准的元数据。
  3、 Data Profile and Validation。可以检验数据的质量。
  4、 High Performance。在大负荷的任务执行中仍然有良好的性能。
  5、 Scalable, Platform Independent。具有良好的弹性,支持多种操作系统和数据库系统,能操作多种异构的数据源。
  6、 Open Architecture and API。具有开放的架构和易于使用的二次开发接口。
  目前较为知名的开源ETL工具有:
  1、 KETL,由具有IBM和KPMG背景的Kinetic Networks公司开发,现在已经有三年多的产品应用历史,成功应用于一些产品中,在点击流(ClickStream)分析应用中表现出色。KETL采用Plug-in的架构,使用Java开发。
  2、 KETTLE,为一个元数据驱动的ETL工具。已经加入Pentaho。
  3、 Clover ETL,为一个基于Java的ETL Framework,可以用来开发自己的ETL应用。
  4、 Enhydra Octopus,为一个基于Java的ETL工具,使用JDBC来连接各种数据源,易于使用和部署。曾有人应用于电信网络资源分析系统中。

  表工具
  优秀的报表工具通常具有以下特性:
  1、 支持多种数据源。
  2、 直观的可视化设计器,简单易用的报表定制功能。
  3、 方便的数据访问和格式化,丰富的数据呈现方式。
  4、 符合数据呈现的通用标准,能和应用程序很好地进行结合。
  5、 易于扩展和部署。
  目前较为知名的开源报表工具有:
  1、 JasperReports,一个优秀的Java报表工具,始于2001,现在JasperSoft公司持续开发和支持该工具。该工具类似于商业软件 Crystal Report,支持PDF、HTML、XLS、CSV和XML文件输出格式,现在是Java开发者最常用的报表工具。
  2、 OpenReports,提供基于web的灵活报表解决方案,通过浏览器自动生成动态PDF,XLS,HTMLCSV 和Chart报表,它是用Java开发的,使用JasperReports 作为报表引擎,利用到的开源技术有hibernate,Veloctiy,Webwork。
  3、 JFreeReport,现在是Pentaho的一部分,它是一个优秀的用来生成报表的Java类库。它为Java应用程序提供一个灵活的打印功能并支持输出到打印机和PDF, Excel, HTML和XHTML, PlainText, XML和CSV文件中。
  4、 Eclipse BIRT,是Eclipse下面的一个企业智能和报表 工具,能为J2EE的WEB应用程序创建漂亮醒目的PDF或者HTML格式的报表,它提供了核心的报表功能。

  OLAP工具
  联机分析处理工具。目前开源的OLAP工具也分为MOLAP、ROLAP和HOLAP,优秀的OLAP工具通常有以下特性:
  1、 良好的执行性能,能快速地进行分析处理工作。
  2、 良好的适用性和可伸缩性。
  3、 开放式接口和丰富的API。
  目前较为知名的开源OLAP工具有:
  1、 Mondrian,是Pentaho的一部分,为一个用Java开发的OLAP服务器,实现了MDX语言、XML解析和JOLAP规范,可以不写SQL就能分析存储于SQL 数据库的庞大数据集,可以封装JDBC数据源并把数据以多维的方式展现出来。
  2、 JPivot,是一个JSP 自定制的标签库,可以绘制一个OLAP表格和图表。用户可以执行典型的OLAP导航,如下钻,切片和方块。它使用Mondrian 作为其OLAP服务器。它使用WCF (Web Component Framework) ,基于XML/XSLT来渲染Web UI组件。JPivot在元数据缓存方面的过于简化的整体性初始化装载的做法将限制它只能处理很小的立方体(Cube)。

  数据库
  开源的数据库也有很多,大多数为关系型数据库,少数为应用于数据仓库环境做了专门的优化工作。Bizgres以PostgreSQL为基础进行了数据仓库环境下的优化,提高了分析查询性能。

  开源BI套件
  下面列出相对成熟和完整,并且有借鉴意义的开源BI套件。
  Bizgres
  为GreenPlum公司主导的开源项目,和Sun公司达成合作关系。Bizgres为B
  I应用而对PostgreSQL做了优化,提高了大负荷的并行计算能力,在BI环境中,相对于普通的关系型数据库具有卓越的数据处理性能。Bizgres的数据库平台可以和KETL和JasperReports进行整合,从而形成一个BI套件:
  1、 数据库:BI专业数据库Bizgres,或者大型应用中的高性能服务器Bizgres MPP,能比普通关系数据库快20倍
  2、 ETL工具:KETL
  3、 报表工具:JasperReports
  Openi
  是一个Java开发的Web应用,能对OLAP服务器、关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署,界面美观友好,后续还将支持数据挖掘和ETL等。Openi主要包括:
  1、 OLAP展示:JPivot
  2、 报表工具:JFreeChart
  3、 分析数据源连接器
   Pentaho
  是一个以工作流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它包括:
  1、 工作流引擎:Shark and JaWE
  2、 数据库:Firebird RDBMS
  3、 集成管理和开发环境:Eclipse
  4、 报表工具:Eclipse BIRT
  5、 ETL工具:Enhydra/Kettle
  6、 OLAP Server:Mondrian
  7、 OLAP展示:JPivot
  8、 数据挖掘组件:Weka
  9、 应用服务器和Portal服务器:JBoss
  10、 单点登陆服务及LDap认证:JOSSO
  11、 自定义脚本支持:Mozilla Rhino JavaScript脚本处理器
  由上可见Pentaho是一个很完善的BI解决方案。Pentaho偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。
   SpagoBI
  SpagoBI 集成了Mondrain和JProvit,能够通过OpenLaszlo产生实时报表。SpagoBI使用java开发,不依赖于具体的操作系统,有很强的扩展能力。它主要包括:
  1、 报表工具:JasperReports /Eclipse BIRT/ iReport
  2、 OLAP Server:Mondrian
  3、 OLAP展示:JPivot
  4、 数据挖掘组件:Weka
  5、 Map引擎:Geo
  6、 ETL:BIE
  7、 搜索引擎:Lucene
  8、 Dashboard:OpenLaszlo
  9、 Portal Server:JBoss/ Tomcat/ JOnAS


目前在java领域较常见的BI前端框架(商业智能项目)主要有以下几个Pentaho,spagoBi, OpenI, JASPER intelligence等开源框架。

他们都有自己的强项和不足,下面简要介绍下:

轻量级的:

OpenI使用Mondrian和Jpivot框架,报表引擎是jasper report,数据挖掘接口是R-Project,

相对来说开发和学习比较简单,而且OpenI支持使用MS的数据仓库(xmla),但是其国际化比较失败(中文乱码),要深入改造。

JASPER intelligence也是个轻型项目,对jasper report的支持最好,所以报表部分比较好。

重量级的:

Pentaho,spagoBi是两个比较大的框架了,集成了相当多的开源项目,JfreeReport、Mondrian、Kettle、Weka基本都使用了。特别适合大型复杂项目的开发。

      Pentaho在中国使用的比较多,文档什么的也多一点。尤其值得一提的是网络上对他的中文支持做的相当好,很多志愿者翻译了它的文档。这给我们开发带来很大便利。



      Pentaho的模块工作流引擎、中心资源库、审计组件、报表设计工具、ETL工具、OLAP Server、多维展示、数据挖掘组件各种组建都有。

而且Pentaho得到了很大的投资,开发后劲很大,而且会有付费的官方发售版本。

http://blog.csdn.net/dust_bug/archive/2006/09/18/1240753.aspx

这个是《Pentaho源代码阅读报告》,介绍Pentaho构架相当的全面。

Pentaho的中文论坛在http://www.bipub.org/

Pentaho相对spagoBi来说功能较强,尤其是工作流一块做的相当不错。

官方站的demos在http://www.pentaho.com/products/demos/

spagoBi功能也很强,尤其是最近发布的1。9版本,在http://spagobi.eng.it:8080/sbiportal/faces/public/exo(或http://spagobi.eng.it:8080/sbiportal)

的demos里展现了spagoBi很多功能。

后记
这几款BI框架因为都是开源的前端框架,所以核心部分使用的还是一些开源项目,

Mondrian,Jpivot,JfreeReport,所以在使用的时候搭建合适的框架会占用项目很大一部分时间,但是一旦框架搭建好了,基本就可以象流水线一样出报表了。

但是期望在原始功能上添加性能功能是比较麻烦的,为了一个新加的功能可能需要相当长的时间来实现。

另外这些开源框架的权限管理都不怎么强,可能需要改造。

另外,全球话的问题也是问题。象OpenI完全不支持中文,必须改造。

分享到:
评论

相关推荐

    开源BI系统、.docx

    开源BI(Business Intelligence)系统是一种基于开放源代码的商业智能解决方案,它允许用户根据自身需求构建、定制和扩展BI工具,以实现数据的分析、报表生成、决策支持等功能。相较于商业BI系统,开源BI系统提供了...

    开源BI平台Openi的开发数据仓库系统.doc

    【Openi 开源 BI 平台的开发数据仓库系统】 Openi 是一款开源的商业智能(BI)平台,专门用于构建数据仓库系统。BI 平台的核心任务是将企业的现有数据转化为可指导业务决策的知识。Openi 提供了一个全面的解决方案...

    SpagoBI开源BI平台_安装配置及使用说明v1.5,pentaho_Bi开源商业智能平台的搭建

    **SpagoBI与Pentaho BI平台:开源商业智能的深度探索** SpagoBI与Pentaho BI都是广受欢迎的开源商业智能(BI)平台,它们为企业提供了数据整合、分析和可视化的能力,使得非技术人员也能理解和利用数据进行决策。...

    开源BI平台Openi的开发数据仓库系统.docx

    通过上述介绍,我们可以看出,开源BI平台Openi在数据仓库系统的设计与开发方面具有较强的实用性和前瞻性。它不仅集成了OLAP、数据仓库等核心技术,还关注用户体验和功能完整性,是构建现代商业智能系统的理想选择之...

    BI开源报表工具调研报告

    尽管存在一些开源BI套件,如Pentaho、JasperServer等,但它们通常通过集成多个独立工具来实现功能齐全的BI解决方案,这增加了实施和维护的复杂性。 4. 开源BI工具的优势 开源BI工具的优势在于其灵活性、成本效益...

    非开源完整的数据可视化BI工具源码(java+vue)

    本项目提供的是一个非开源的完整数据可视化BI工具的源码,主要基于Java和Vue.js技术栈开发,具备前后端分离的架构设计。 首先,前端部分采用了Vue.js框架。Vue.js是一个轻量级的JavaScript库,因其易学易用、高效...

    6款常用的Java开源报表制作工具

    ### 6款常用的Java开源报表制作工具 #### 1. JasperReports - **简介**:JasperReports是一款基于Java的开源报表工具,它能够在Java环境下像其他集成开发环境(IDE)中的报表工具那样来制作报表。JasperReports支持...

    推荐6款常用的Java开源报表制作工具.pdf

    本文将对六款常用的 Java 开源报表制作工具进行详细的介绍和分析,为开发者提供学习和参考的资源。 一、JasperReports JasperReports 是一个基于 Java 的开源报表工具,可以在 Java 环境下像其他 IDE 报表工具一样...

    睿思bi开源版后台系统,基于Springboot构建,快速分析数据及可视化,0代码编写+源代码+文档说明

    1.轻量级BI, 支持快速建模,快速可视化数据。 2.多维分析功能强大,支持下钻/上卷/排序/筛选/计算/聚合等多种操作方式。 3.报表使用简单,功能强大,通过拖放等方式构建分析界面, 0代码编写。 4.开放...

    基于Java框架开发的WMS管理系统+完整源码+数据库备份

    9. **报表和分析**:系统可能会集成BI工具(如JasperReports或Tableau)生成库存报表,进行数据分析,帮助企业决策。 10. **单元测试与持续集成**:JUnit和Maven等工具用于编写和执行单元测试,保证代码质量;而...

    推荐6款常用的Java开源报表制作工具.docx

    Java 开源报表制作工具推荐 Java 开源报表制造工具是 Java 开发者常用的报表解决方案。本文推荐了 6 款常用的 Java 开源报表制作工具,供开发者学习、参考。 JasperReports JasperReports 是一个基于 Java 的开源...

    基于双向LSTM的Java开源软件漏洞检测.zip

    在Java开源软件漏洞检测中,Bi-LSTM可以用于识别代码中的潜在安全缺陷。 **1. 双向LSTM (Bi-LSTM)** 双向LSTM结合了正向和反向LSTM的特性,能够同时考虑序列的前向和后向信息。正向LSTM从左到右处理输入序列,而...

    SpagoBI开源BI套件平台安装与使用说明

    **SpagoBI开源BI套件平台安装与使用详解** **一、SpagoBI简介** SpagoBI是一款由意大利Engineering Group开发并维护的开源商务智能(BI)平台。它提供了全面的分析工具,包括数据集成、报表、仪表板、数据挖掘等,...

    SpagoBI开源BI平台_安装配置及使用说明

    根据给定的文件信息,以下是对“SpagoBI开源BI平台_安装配置及使用说明”文档的内容知识点的详细说明: 一、SpagoBI平台概述 SpagoBI是一个开源的商业智能(BI)平台,由意大利CNR(意大利国家研究委员会)下属的...

    rsbi-os:睿思bi开源版后台系统,基于Springboot合并,快速分析数据及可视化,0代码编写-后台

    睿思BI开源版-初步系统睿思BI开源版初步系统,基于Springboot合并,采用sqlite数据库,直接运行com.ruisitech.bi.RsbiOsApplication启动系统。 :warning:此项目前端地址: : :warning: “睿思BI”智能商业系统-的...

    推荐6款常用的Java开源报表制作工具.doc

    推荐6款常用的Java开源报表制作工具 Java是一种广泛应用于企业级应用的编程语言,其报表制作工具也变得越来越丰富多样。今天,我们将推荐6款常用的Java开源报表制作工具,每个工具都有其特点和优点,下面让我们来...

    毕设&课程作业_智能 BI 系统.zip

    10. **学习资源**:学习BI系统设计,学生可参考相关教材、在线教程,以及开源项目,以提高实际操作能力。 通过这份“毕设&课程作业_智能 BI 系统.zip”,学生不仅能理论联系实际,还能提升解决实际问题的能力,为...

    powerBI-rest-java:一个简单的API,用于与Java中的PowerBI REST API进行交互

    这个开源项目提供了一个简单的API,允许Java开发者通过RESTful接口与Power BI服务进行交互。REST(Representational State Transfer)是一种网络应用程序的设计风格和开发方式,基于HTTP协议,可以轻松地实现客户端...

    睿思bi开源版后台系统,基于Springboot构建,快速分析数据及可视化,0代码编写.zip

    睿思BI开源版后台系统是一个基于Springboot框架构建的数据分析和可视化平台,它提供了一种无需编码的方式,让用户能够快速地对数据进行深入分析并生成直观的可视化报表。这个系统的核心理念是简化数据分析过程,使得...

Global site tag (gtag.js) - Google Analytics