`

四个开源商业智能平台比较(五)

阅读更多
lumi 问JPivot能否单独使用,不能,根据其主页上的描述, JPivot is a JSP custom tag library that renders an OLAP table and let users perform typical OLAP navigations like slice and dice, drill down and roll up. It uses Mondrian as its OLAP Server. JPivot also supports XMLA datasource access.
换句话说,它必须使用一个OLAP的服务器做后台,大多数选择Mondrian,当然,JPivot也支持XMLA的数据源,我不太清楚除了SQLServer外还有谁是的。
要使用JPivot就必须使用多维数据表,我想你们公司应该是普通OLTP的数据表,那么就需要ETL工具了,工作量恐怕也非常之大。

JPivot在展示向上钻取和向下钻取的功能需求时是否比较方便?
是的,非常的方便,JPivot是一个JSP custom tag,你要需要指定数据源和写一个xml的描述文件就可以了,它本身是很简单,问题是前面的步骤。

你 说你们的SQL有40M我一点也不惊讶,我们公司小的也差不多有10多M,从20多个表取数据,如果什么都选的话,会有50多M,顺便问一句,你计算出有 40多M是用的P6SPY吗?我是用这计算的,用TOAD格式化的时候没有死机,其实这个大小很平常的,不过速度倒是差到了不行,最近我当了回DBA把 oracle优化了一下,硬盘空间只给我30G,没空间你叫我怎么做优化,我们公司developer用的机器是512M内存跑oracle, eclipse ,tomcat,toad,这种配置的确让我很无奈。不过报表最后速度还算可以接受,大概1分钟不到可以Run出一个Excel的报表6 worksheet,每个worksheet数据大概在6K到2W左右,哦,对了,我们还使用了线程,run  excel的时候,是弹出一个单独的窗口来run的。
普通的报表跟BI的报表是完全不一样的,所以不知道还有什么能帮你的,希望你早日脱离苦海,也祝我自己早日脱离苦海。阿弥陀佛

这次要比较的是四个平台的体系结构,
首先看openI的体系结构:



RDL是Report Define Language
openI具有一个BI应有的大部分特性了,
report :  jasperreport ,JFreeChart
olap :   mondrian +  JPivot
data mining:   weka
它的各层衔接的非常的紧,好像用了eigenbase做数据管理,不是很清楚这部分,openI在做数据挖掘的时候它没有调度器,它的Portlet Interface 主要是指在用JPivot的时候JPivot可以到处使用
openI没有自己的开发专属工具,入门门槛也相对较低。

JasperSoft



JasperSoft最重要的就是它的报表,但是它支持输出的格式很多,管理的方式也很多,也用了eigenbase做数据管理。
有比较完善的权限控制,用的acegi,
支持多种数据源,只要有JDBC驱动。
它的产品已经形成了一个产品线,最著名当然还是它的JasperReport。
你可以看到它为了更好的管理各种报表和数据,有自己专属的展现平台JasperServer,这个平台是 06/26/2006才创建的,完全是JasperSoft为了实现BI而迈出的重要一步。jasper没有数据挖掘。
有任务调度器,用了quartz。
有自己专属的ETL: JasperETL
它有自己的OLAP SERVER : jasperAnalysis
展示层用到了AJAX和applet, 也有DashBoard。
查询语句支持SQL, Hibernate (HQL), XPath (XML), EJBQL, MDX(多维查询语言,OLAP专用,SQLSERVER用的是XMLA)

SpagoBI



spagoBI平台厉害很多,也复杂了很多。
它的各个组件之间模块化很好,Plugin加载,来看一下它的各个组件:
report : BirtReportDriver ,  BirtReportEngine , JasperReportDriver ,JasperReportEngine
GEO :  GeoDriver , GeoEngine(用地图显示数据和查询的)
OLAP : JPivotDriver , JPivotEngine
QBE  :  QbeDriver, QbeEngine   (以前学Hibernat的时候记得总是说QBE功能很弱,不知道这个这么说 )
Data Mining : WekaDriver  ,  WekaEngine
Security :  ExoPortalSecurityProvider
Booklet (小册子) : BookletsComponent: it is a component for booklets generation.主要包括文件上传,工作流,OpenOffice支持。

它还有文档管理,用的是apache的JackRabbit,有搜索功能,用的lucene.不愧是做cms,portlet,workflow出身的,技术就是牛。

spagoBI的使用的工具也比较多:
Report :  Bird  ,   JasperReport
ETL :   Octupus  和  talend   (talend是官方合作伙伴,顺便说一句,官方主页好像打不开,www.talend.com ,我是直接在sf.net上搜索然后下载下来的)
OLAP :  Mondrian  和  JPivot
Data Mining   : Weka
Portal   : eXoPortal

它 的展现层也使用了AJAX特性,另外它在DashBoard也使用了openlaszlo,(一个用Java code 生成Flash的框架,主页是http://www.openlaszlo.org/。新版的4.0好像也要支持生成DHTML) 所以spagoBI的DashBoard看上去很爽.
spagoBI的ETL是非常之牛的。你可以看到它下面的数据处理层是单独分出来的,至于为什么牛,我在后面ETL部分会专门提到的。
还有一些很细节的东西,想BIPortlet,BIMessage , Notify ,Schedule , Workflow ,Rule Engine ,Profiling ,Analytical Document 我会在后面尽量把我知道的说一下。


pentaho



pentaho的体系结构跟spagoBI非常相像,我甚至都没看出来有上面很大的区别,
不过pentaho喜欢把自己的东西称作solution,以下引用自pentaho的whitepaper:
pentaho BI 平台不同于传统的BI产品。它是一个以流程为中心的,面向解决方案的(Solution)的框架,具有商业智能(BI)组件,使得公司可以开发商业智能问题的完整解决方案
pentaho一样把数据处理层看的很重要,多种数据显示方式,甚至有RSS输出。
pentaho是有各种开源组件组成的。
ETL :  Kettle  (界面上显示的是pentaho Data Integration ,previously Kettle)
Report : Pentaho Report (它也支持Birt 和  JasperReport 的集成 ,还有专门的文档)
OLAP  : Mondrian 和  JPivot  (Mondrian已经加入了pentaho , 估计pentaho跟JPivot有仇,双方互看对方不爽,所以JPivot没有加入pentaho,呵呵,看玩笑)
Platform : Pentaho Planform
Data Mining: Weka  (Weka也加入了pentaho)


下一篇介绍他们的roadmap ,你一定会发现惊奇的事情的。
分享到:
评论

相关推荐

    开源商业智能平台比较.doc

    【开源商业智能平台比较】 商业智能(Business Intelligence, BI)是一种技术驱动的过程,用于提取、转换、加载(ETL)数据,并进行分析、报告和可视化,以帮助企业做出更好的决策。开源商业智能平台提供了与传统...

    Pentaho开源商业智能平台在CentOS中的搭建.docx

    ### Pentaho 开源商业智能平台在 CentOS 中的搭建详解 #### 一、Pentaho 概述 Pentaho 是一款非常受欢迎的开源商务智能(Business Intelligence, BI)平台,以其全面的功能和易于使用的特性而著称。它不仅提供了一个...

    商业与开源BI工具对比分析

    - **Oracle Express**:由 Oracle Express Server、Oracle Express Web Agent、Oracle Express Objects 和 Oracle Express Analyzer 四个组件组成。其中 Oracle Express Server 是一个多维 OLAP 服务器,支持多维...

    可信开源人工智能大模型案例汇编(第一期)

    - **商业模式模糊**:开源大模型如何形成有效的盈利模式仍是一个待解决的问题。 #### 二、可信开源大模型案例汇编的目标与意义 - **目标**: - **洞察应用场景**:深入了解开源人工智能大模型的实际应用场景,...

    中国信通院-人工智能行业:开源生态白皮书(2020年)精品报告2020.pdf

    开源商业模式多样化发展,企业通过开源战略来扩大用户群体,提升市场影响力。中国的企业开始构建有影响力的开源项目,比如一些头部科技公司通过在GitHub上发布开源项目来吸引全球开发者参与和贡献。与此同时,开源...

    开源时代(1-4)开源时代 1-4

    开源时代,一个在信息技术领域备受关注的话题,涵盖了从操作系统到应用程序、从数据库到云计算的广泛领域。这个概念的出现,不仅改变了软件开发的模式,也推动了整个IT行业的创新与发展。"开源时代 1-4"很可能是系列...

    人工智能技术的免费开源SAAS框架.zip

    对于想要利用这个开源框架的开发者,他们首先需要解压文件,然后在合适的环境中(如Git)克隆ktadmin-master项目。开发者可以阅读文档,了解如何配置、运行和集成AI模型。对于贡献者,他们可以参与代码审查,提交...

    12种优秀开源报表工具整理

    BIRT的报表有四个主要部分:数据(Data)、数据转换(Data Transforms)、业务逻辑(Business Logic)、展示(Presentation)。使用BIRT,用户可以在应用中增加多种形式的报表:列表(Lists)、图表(Charts)、交叉...

    开源生态白皮书(2020 年).pdf

    全球开源商业模式多样,开源企业通过收购等方式扩大用户群体,形成更具影响力的项目。我国开源企业在这一方面也展现出积极的发展势头,逐渐构建形成有影响力的开源项目。 四、全球开源基金会运营模式成熟,我国率先...

    人工智能商业化研究报告-36Kr-2019.7-90页.pdf

    人工智能的商业化进程正在加速,开源算法和开放平台降低了技术门槛,使得更多企业能够利用AI提升业务效能。同时,AI解决方案日益精细化,解决特定问题的能力增强,这将进一步推动行业创新。构建完整的商业生态系统,...

    开源BI平台Openi的开发数据仓库系统.docx

    3. **Pentaho**:以工作流为核心,整合多个开源项目,旨在提供与商业BI相抗衡的全面解决方案。适用于大中型企业。 4. **SpagoBI**:集成了Mondrian和JProvit,可通过OpenLaszlo生成实时报表。具备良好的跨平台能力和...

    中英开源双语对话语言模型

    "ChatGLM2-6B-main"很可能是这个开源项目的名称,暗示这是一个拥有大约60亿参数的对话语言模型,可能基于Google的T5或BERT等大型模型进行扩展。这种规模的模型通常具备更强的语言理解和生成能力,能够处理复杂的对话...

    大数据分析平台(商业智能)解决方案.pptx

    平台的总体架构分为四个主要层面。数据源层整合了来自不同来源的数据,如关系型和非关系型数据库、API接口等。数据处理层则负责数据清洗、整合和转换,确保数据的预处理质量。数据存储层采用分布式系统,如Hadoop和...

    中国开源发展研究分析2022-最终发布版.pptx

    开源商业化:2021年为中国开源商业重要的⽀程碑,多家企业获得商业融资;开源模式对于商业企业的价值主要体现为聚合⽀才和商业转化;50.33%的开发者认为开源可以加速企业研发;15.57%的开发者认为开源是全球垂直媒介...

    1.0.1 开源软件简史 (完善篇).docx

    - **MySQL数据库**:MySQL作为一个开源数据库系统,在服务器端得到广泛应用。2008年,MySQL被Sun Microsystems以10亿美元的价格收购;随后,Sun Microsystems又被Oracle以74亿美元的价格收购。这些事件展示了开源...

    商用、开源规则引擎资料汇总

    - **Jess**:一个非开源项目,可用于学术研究目的,但如果用于商业用途则需付费。它提供了丰富的功能,适用于复杂的数据处理任务。 #### 八、总结 规则引擎是现代软件架构中不可或缺的一部分,它们帮助企业在面对...

    探讨开源软件的思想与应用

    【开源的未来】随着云计算、大数据、人工智能等新兴技术的发展,开源软件将继续发挥关键作用。开源社区将持续创新,解决新出现的问题,推动技术的边界。同时,开源也需要面对如何保持可持续发展、保护开发者权益等...

Global site tag (gtag.js) - Google Analytics