`
xiangxingchina
  • 浏览: 520347 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

开源BI系统简述

    博客分类:
  • BI
 
阅读更多

1.   概述

开源的 BI 项目在在 2005 年之前并没有太大的发展,到了 2005 年才开始呈现繁荣之势,并在 2006 年蓬勃发展。这些众多的 BI 项目从规模和对 BI 系统支撑的完善程度上来说,大体可以分为 Framework Stand-alone Tools BI Suit 三种类型。

l         Framework

开源框架,这是在商业 BI 系统中所没有的。我们可以使用它们来构建自己的 BI 工具,或者增强和扩展我们的 BI 解决方案。

l         Stand-alone Tools

独立的 BI 工具,这是开源项目中数量最多的一类。很多工具只侧重 BI 系统中的某个环节和方面,如 ETL Report OLAP Database 等等。

l         BI Suit

在统一的架构下提供了多种 BI 系统的特性的工具集合。就目前的情况看,不管是商业软件还是开源软件,还没有任何一个套件提供了完整的端到端的 BI 解决方案。这些开源的 BI Suit 是通过连接多个其他的组件和工具的方式形成套件的,由于 BI 系统涉及到的工具是非常多的,所以整合一套完整的 BI 解决方案是很困难的。

<o:p> </o:p>

2.   BI 解决方案中的工具

一个完整的 BI 解决方案中有多种工具来完成 BI 系统中各个阶段的工作。

2.1. ETL 工具

数据抽取、转换和加载工具。优秀的 ETL 工具应该具有以下特性:

1、  Workflow Management, Job Execution and Scheduling Manager 。能方便地定义流程并自动化执行 ETL 任务。

2、  Centralized Metadata Repository and Management 。集中存储和管理符合业界标准的元数据。

3、  Data Profile and Validation 。可以检验数据的质量。

4、  High Performance 。在大负荷的任务执行中仍然有良好的性能。

5、  Scalable, Platform Independent 。具有良好的弹性,支持多种操作系统和数据库系统,能操作多种异构的数据源。

6、  Open Architecture and API 。具有开放的架构和易于使用的二次开发接口。

<o:p> </o:p>

目前较为知名的开源 ETL 工具有:

1、  KETL ,由具有 IBM KPMG 背景的 Kinetic Networks 公司开发,现在已经有三年多的产品应用历史,成功应用于一些产品中,在点击流( ClickStream )分析应用中表现出色。 KETL 采用 Plug-in 的架构,使用 Java 开发。

2、  KETTLE ,为一个元数据驱动的 ETL 工具。已经加入 Pentaho

3、  Clover ETL ,为一个基于 Java ETL Framework ,可以用来开发自己的 ETL 应用。

4、  Enhydra Octopus ,为一个基于 Java ETL 工具,使用 JDBC 来连接各种数据源,易于使用和部署。曾有人应用于电信网络资源分析系统中。

2.2. 报表工具

优秀的报表工具通常具有以下特性:

1、  支持多种数据源。

2、  直观的可视化设计器,简单易用的报表定制功能。

3、  方便的数据访问和格式化,丰富的数据呈现方式。

4、  符合数据呈现的通用标准,能和应用程序很好地进行结合。

5、  易于扩展和部署。

<o:p> </o:p>

目前较为知名的开源报表工具有:

1、  JasperReports ,一个优秀的 Java 报表工具,始于 2001 ,现在 JasperSoft 公司持续开发和支持该工具。该工具类似于商业软件 Crystal Report ,支持 PDF HTML XLS CSV XML 文件输出格式,现在是 Java 开发者最常用的报表工具。

2、  OpenReports ,提供基于 web 的灵活报表解决方案,通过浏览器自动生成动态 PDF,XLS,HTMLCSV Chart 报表,它是用 Java 开发的,使用 JasperReports 作为报表引擎,利用到的开源技术有 Hibernate,Veloctiy,Webwork

3、  JFreeReport ,现在是 Pentaho 的一部分,它是一个优秀的用来生成报表的 Java 类库。它为 Java 应用程序提供一个灵活的打印 功能并支持输出到打印机和 PDF, Excel, HTML XHTML, PlainText, XML CSV 文件中。

4、  Eclipse BIRT ,是 Eclipse 下面的一个企业智能和报表 工具,能为 J2EE WEB 应用程序创建漂亮醒目的 PDF 或者 HTML 格式的报表,它提供了核心的报表功能。

2.3. OLAP 工具

联机分析处理工具。目前开源的 OLAP 工具也分为 MOLAP ROLAP HOLAP ,优秀的 OLAP 工具通常有以下特性:

1、  良好的执行性能,能快速地进行分析处理工作。

2、  良好的适用性和可伸缩性。

3、  开放式接口和丰富的 API

<o:p> </o:p>

目前较为知名的开源 OLAP 工具有:

1、  Mondrian ,是 Pentaho 的一部分,为一个用 Java 开发的 OLAP 服务器,实现了 MDX 语言、 XML 解析和 JOLAP 规范,可以不写 SQL 就能分析存储于 SQL 数据库的庞大数据集,可以封装 JDBC 数据源并把数据以多维的方式展现出来。 <o:p></o:p>

2、  JPivot 是一个 JSP 自定制的标签库,可以绘制一个 OLAP 表格和图表。用户可以执行 典型的 OLAP 导航,如下钻,切片和方块。它使用 Mondrian 作为其 OLAP 服务器。它使用 WCF (Web Component Framework) ,基于 XML/XSLT 来渲染 Web UI 组件。 JPivot 在元数据缓存方面的过于简化的整体性初始化装载的做法将限制它只能处理很小的立方体( Cube )。

2.4. 数据库

开源的数据库也有很多,大多数为关系型数据库,少数为应用于数据仓库环境做了专门的优化工作。 Bizgres PostgreSQL 为基础进行了数据仓库环境下的优化,提高了分析查询性能。

3.   开源 BI 套件

下面列出相对成熟和完整,并且有借鉴意义的开源 BI 套件。

3.1. Bizgres

GreenPlum 公司主导的开源项目,和 Sun 公司达成合作关系。 Bizgres BI 应用而对 PostgreSQL 做了优化,提高了大负荷的并行计算能力,在 BI 环境中,相对于普通的关系型数据库具有卓越的数据处理性能。 Bizgres 的数据库平台可以和 KETL JasperReports 进行整合,从而形成一个 BI 套件:

1、  数据库: BI 专业数据库 Bizgres ,或者大型应用中的高性能服务器 Bizgres MPP ,能比普通关系数据库快 20

2、  ETL 工具: KETL

3、  报表工具: JasperReports

3.2. Openi

是一个 Java 开发的 Web 应用,能对 OLAP 服务器、关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署,界面美观友好,后续还将支持数据挖掘和 ETL 等。 Openi 主要包括:

1、  OLAP 展示: JPivot

2、  报表工具: JFreeChart

3、  分析数据源连接器

3.3. Pentaho

是一个以工作流为核心的、强调面向解决方案而非工具组件的 BI 套件,整合了多个开源项目,目标是和商业 BI 相抗衡。它包括:

1、  工作流引擎: Shark and JaWE

2、  数据库: Firebird RDBMS

3、  集成管理和开发环境: Eclipse

4、  报表工具: Eclipse BIRT

5、  ETL 工具: Enhydra/Kettle

6、  OLAP Server Mondrian

7、  OLAP 展示: JPivot

8、  数据挖掘组件: Weka

9、  应用服务器和 Portal 服务器: JBoss

10、              单点登陆服务及 LDap 认证: JOSSO

11、              自定义脚本支持: Mozilla Rhino Javascript 脚本处理器

由上可见 Pentaho 是一个很完善的 BI 解决方案。 Pentaho 偏向于与业务流程相结合的 BI 解决方案,侧重于大中型企业应用。

3.4. SpagoBI

SpagoBI 集成了 Mondrain JProvit ,能够通过 OpenLaszlo 产生实时报表。 SpagoBI 使用 java 开发,不依赖于具体的操作系统,有很强的扩展能力。它主要包括:

1、  报表工具: JasperReports /Eclipse BIRT/ iReport

2、  OLAP Server Mondrian

3、  OLAP 展示: JPivot

4、  数据挖掘组件: Weka

5、  Map 引擎: Geo

6、  ETL BIE

7、  搜索引擎: Lucene

8、  Dashboard OpenLaszlo

9、  Portal Server JBoss/ Tomcat/ JOnAS

根据其 Roadmap 可以看出, SpagoBI 将融入更多的 BI 功能,甚至 BI 之外的功能。

 

 

 

分享到:
评论

相关推荐

    开源BI系统、.pdf

    【开源BI系统】是指那些基于开放源代码的商业智能(Business Intelligence)系统,它们提供了一种经济、可定制化的途径,使用户能够收集、分析和理解业务数据,从而支持决策制定。开源BI系统通常分为三类:Framework...

    开源BI系统、.docx

    开源BI(Business Intelligence)系统是一种基于开放源代码的商业智能解决方案,它允许用户根据自身需求构建、定制和扩展BI工具,以实现数据的分析、报表生成、决策支持等功能。相较于商业BI系统,开源BI系统提供了...

    开源BI平台Openi的开发数据仓库系统.doc

    【Openi 开源 BI 平台的开发数据仓库系统】 Openi 是一款开源的商业智能(BI)平台,专门用于构建数据仓库系统。BI 平台的核心任务是将企业的现有数据转化为可指导业务决策的知识。Openi 提供了一个全面的解决方案...

    商业与开源BI工具对比分析

    ### 商业与开源BI工具对比分析 #### 一、商业化BI工具 **1.1 商业化BI产品供应商简介** **1.1.1 IBM** IBM是一家全球知名的科技企业,其商业智能(BI)解决方案非常全面。IBM 提供的BI解决方案主要基于其可视化的...

    SpagoBI开源BI平台_安装配置及使用说明v1.5,pentaho_Bi开源商业智能平台的搭建

    **SpagoBI与Pentaho BI平台:开源商业智能的深度探索** SpagoBI与Pentaho BI都是广受欢迎的开源商业智能(BI)平台,它们为企业提供了数据整合、分析和可视化的能力,使得非技术人员也能理解和利用数据进行决策。...

    开源BI平台Openi的开发数据仓库系统.docx

    ### 开源BI平台Openi的开发数据仓库系统 #### 一、开源的BI平台概述 商业智能(Business Intelligence, BI)作为一个重要的管理决策工具,旨在帮助企业通过对现有数据的有效利用来进行科学决策。这些数据来源广泛,...

    开源BI平台Openi的开发数据仓库系统.rar

    在这个压缩包中包含的“开源BI平台Openi的开发数据仓库系统.doc”文档,很可能是详细介绍如何利用Openi构建和优化数据仓库的指南。 首先,我们需要理解数据仓库的基本概念。数据仓库是一个面向主题的、集成的、非易...

    开源BI工具Dataease安装包

    开源BI工具Dataease安装包(v2.10.1),DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。DataEase 支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以...

    基于开源框架的推荐搜索BI系统

    标题中提到的“基于开源框架的推荐搜索BI系统”指的是利用开放源代码的软件框架来构建一个能够提供个性化推荐和搜索功能的商业智能系统。商业智能(BI)系统是企业用于分析业务数据,以支持决策制定的解决方案,其...

    开源支付系统.rar

    开源支付系统是一个允许开发者和企业构建自己支付解决方案的开放源代码项目。这个压缩包“开源支付系统.rar”可能包含了所有必要的文件和文档,用于搭建一个自定义的、可扩展的支付处理平台。以下是对这个系统的一些...

    睿思bi开源版后台系统,基于Springboot构建,快速分析数据及可视化,0代码编写+源代码+文档说明

    1.轻量级BI, 支持快速建模,快速可视化数据。 2.多维分析功能强大,支持下钻/上卷/排序/筛选/计算/聚合等多种操作方式。 3.报表使用简单,功能强大,通过拖放等方式构建分析界面, 0代码编写。 4.开放...

    Gitee上的开源ERP系统源码

    Gitee上的开源ERP系统源码

    开源BI领袖-SpagoBI5.X详细介绍中文版V1.1.zip

    SpagoBI是一款强大的开源商业智能(BI)平台,被誉为开源BI领域的领导者。它提供了一整套全面的数据分析和报表工具,旨在帮助企业从海量数据中提取价值,进行有效的决策支持。5.X版本是SpagoBI的一个重要里程碑,...

    Java 开源用户管理系统

    【Java 开源用户管理系统】是一个基于Java编程语言开发的用户管理解决方案,旨在提供一个易于学习、可扩展且功能丰富的平台,适用于初学者和有经验的开发者。这个系统的核心目标是帮助用户有效地管理和操作用户数据...

    Piwigo 开源相册系统 v2.9.3.zip

    Piwigo 开源相册系统简介 Piwigo是一个PHP开源图片管理系统,Piwigo带有非常简单的安装界面和管理面板的,Piwigo它具有强大的功能来发布和管理您的图片。扩展使Piwigo轻松定制,锦上添花。 Piwigo的特点 可设置...

    SpagoBI开源BI套件平台安装与使用说明

    **SpagoBI开源BI套件平台安装与使用详解** **一、SpagoBI简介** SpagoBI是一款由意大利Engineering Group开发并维护的开源商务智能(BI)平台。它提供了全面的分析工具,包括数据集成、报表、仪表板、数据挖掘等,...

    Open Source BI Comparison

    本文旨在比较三个不同的开源BI平台——JasperSoft、Pentaho和SpagoBI,探讨它们当前的特点、未来潜力以及在实际项目中的限制,同时也为研究原型提供基础。我们试图了解开源现象是否能在BI领域成为商业平台的有效替代...

    java开源的文件管理系统

    Java开源文件管理系统是一种基于Java技术构建的用于存储、管理和检索文件的应用程序。它提供了一种高效、安全且灵活的方式来组织和访问大量的数据。在本文中,我们将深入探讨Java开源文件管理系统的相关知识点,包括...

    thinkphp 5.0开源商城系统,开源多用户系统.zip

    《深入解析ThinkPHP 5.0开源商城系统》 在当今互联网时代,电子商务已经成为不可或缺的一部分,而PHP作为服务器端编程语言中的热门选择,其在电商领域应用广泛。本篇文章将聚焦于基于ThinkPHP 5.0框架开发的开源...

    SpagoBI开源BI平台_安装配置及使用说明

    根据给定的文件信息,以下是对“SpagoBI开源BI平台_安装配置及使用说明”文档的内容知识点的详细说明: 一、SpagoBI平台概述 SpagoBI是一个开源的商业智能(BI)平台,由意大利CNR(意大利国家研究委员会)下属的...

Global site tag (gtag.js) - Google Analytics