阅读更多
据国外媒体报道,Pentaho开发商近日开源了部分数据集成软件,并将整个Kettle数据集成平台移植到Apache 2.0许可证下,以便从目前蓬勃发展的Hadoop和NoSQL业务中得到更多的份额,从而奠定其在大数据市场的地位。


Pentaho是目前世界上最流行的开源商务智能(Business Intelligence,BI)解决方案。它是一个基于Java平台的BI套件,包括一个Web Server平台和几个工具软件:报表、分析、图表、数据集成、数据挖掘等工具,可以说包括了商业智能的方方面面。Pentaho BI提供了社区套件和企业套件两个版本,社区版完全免费。

Kettle是Pentaho的一个重要组成部分,是一个ETL(Extraction-Transformation-Loading,数据提取、转换和加载)工具,允许用户管理来自不同数据库的数据,通过提供一个图形化的环境来描述你想做什么,而不是你想怎么做。

据Pentaho 称,此次Kettle项目中被开源的软件的大数据功能包括“可以对以下Hadoop和NoSQL数据库中的数据进行输入、输出、处理和报告操作:Cassandra、Hadoop HDFS、Hadoop MapReduce、Hadapt、HBase, Hive、HPCC Systems 和 MongoDB”。与这些功能相比,传统的关系型数据库和相关工具的大数据集处理能力明显不足。

Pentaho称,此次基于Apache许可证开源数据集成产品,将会显著提升开发者、分析师和数据科学家的效率,并促使他们成功。

Pentaho大数据社区主页:http://wiki.pentaho.com/display/BAD/Pentaho+Big+Data+Community+Home

Via Zdnet
  • 大小: 6.2 KB
5
0
评论 共 6 条 请登录后发表评论
6 楼 haiweb 2012-03-18 15:18
用的人还真不少。

我就在用
5 楼 awol2005ex 2012-02-13 10:12
到底谁在用这个呢?国内好像都是cognos 一大片
4 楼 aixinnature 2012-02-12 21:24
3 楼 elan1986 2012-02-11 09:57
2 楼 yin_bp 2012-02-10 17:49
1 楼 Jekey 2012-02-10 15:12

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 大数据平台最常用的30款开源工具

    本文整理出了大数据平台常见的一些开源工具,并且依据其主要功能进行分类,以便大数据学习者及应用者快速查找和参考。 ▲ 大数据平台常见的一些工具汇集 主要包含:语言工具类、数据采集工具、ETL工具、数

  • 大数据平台常见开源工具

    大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。...此片文章整理出了大数据平台常见的一些开源工具,并且依据其主要功能进行分类,以便大数据学习者...

  • 大数据平台常见开源工具集锦(强烈推荐收藏)

    引言大数据平台是对海量结构化、非结构化、半机构化数据进行采集、存储、计算、统计、分析处理的一系列技术平台。大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这...

  • 万字整理 最新主流大数据技术分类大全(持续更新)

    目前绝大多数企业正在使用的技术,大部分都是基于Apache协议开源框架,因为有些框架有多种分类方式,而且篇幅有限,只做简要介绍,仅供参考调研(截止今年目前已总结80多个),本文大约7000字,阅读需完要20分钟。

  • ❤️ 爆肝三万字《数据仓库体系》轻松拿下字节offer ❤️【建议收藏】

    2、萌芽阶段 在80年代中后期,作为当时技术最先进的公司,DEC已经开始采用分布式网络架构来支持其业务应用,并且DEC公司首先将业务系统移植到其自身的RDBMS产品:RdB。并且,DEC公司从工程部、销售部、财务部以及信息...

  • Kettle构建Hadoop ETL实践(二):安装与配置

    点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源大数据技术与架构点击右侧关注,大数据开发领域最强公众号!大数据真好玩点击右侧关注,大数据真好玩!猜你想看系列:Kettle构建H...

  • 大数据技术的概论(2)

    1.5大数据带来多大变革 1技术变革特征 2管理模式变革(人力,流程,制造,市场) 1)数据资产化 2)决策智能化 3信息技术IT向数据技术DI的转变

  • kettle 学习小结

    kettle 学习总结 What is ETL ETL Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。 ETL工具有:OWB(Oracle Warehouse Builder)、ODI(Oracle Data Integrator)、Informatic ...

  • 优秀Java开源项目

    从开源数据库、应用服务器,到开源的Web服务器,我们已经带您领略开源软件世界的旖旎风光。此次的“开源之旅”将进行一次系列景点的汇萃,而且这次旅游的内容与以往不同,不再是基础平台类的开源产品,而是偏重于...

  • Kettle构建Hadoop ETL实践(三):Kettle对Hadoop的支持

    目录 一、Hadoop相关的步骤与作业项 ...3. 从HDFS抽取数据到MySQL 4. 从Hive抽取数据到MySQL 四、执行HiveQL语句 五、执行MapReduce 1. 生成聚合数据集 (1)准备文件与目录 (2)建立一个

  • GIS开源软件大全

    GIS开源软件大全 3 - F 3map:行星地球项目由3map驱动,这是一个自由软件,由Telstra宽带基金会创建并支持,提供客户端与服务器的能力以在线再现虚拟地球。 Amein!:其界面介于ArcMap和UMN Mapserver之间...

  • 《CSS样式表行为手册》中文chm最新版本

    CSS样式表里重点讲述“行为”功能的一本CHM参考手册,很实用方便,内容也很丰富,收藏一下哦!

  • 1-中国各地区-固定资产投资-房地产开发投资情况(1999-2020年)-社科数据.zip

    中国各地区固定资产投资中的房地产开发投资数据集涵盖了1999至2020年的详细统计信息。该数据集包含了全国各城市地级市州的房地产开发投资情况,这些数据对于理解中国城市化进程、经济发展和房地产市场趋势至关重要。数据集中的指标包括年份、地区以及对应的房地产开发投资额(以亿元为单位),这些数据来源于中国区域统计年鉴及各省市统计年鉴。通过这些数据,研究者和决策者可以深入了解不同地区的经济动态,评估房地产市场的健康状况,并据此制定相应的政策和战略。这些数据不仅有助于宏观经济分析,还能为房地产开发商提供市场进入和扩张的决策支持。

  • 1-中国各地区数字经济发展对环境污染的影响数据(2011-2021年)-社科数据.zip

    中国各地区数字经济发展对环境污染的影响数据集(2011-2021年)提供了深入分析数字经济与环境污染关系的实证数据。该数据集涵盖了中国各地区在数字经济发展水平、环境污染物排放量、人口与经济指标、外资利用情况以及绿色专利指标等多个维度的数据。具体来说,数据集包括了行政区划代码、年份、所属省份等基本信息,以及数字经济水平熵值法、PM2.5均值、工业烟粉尘排放量、工业二氧化硫排放量、工业废水排放量等关键指标。此外,数据集还涉及了人口密度、人均地区生产总值、实际利用外资额占GDP之比、科学支出占比等经济和人口统计数据,以及绿色专利申请和授权总量等创新指标。这些数据不仅有助于研究者探讨数字经济对环境污染的直接影响,还能分析其潜在的中介机制和影响因素,为理解数字经济如何影响环境质量提供了宝贵的数据资源。

  • 1-中国各区县-工业行业企业数2004-2020年-社科数据.zip

    中国各区县工业行业企业数数据集覆盖了2004至2020年的时间跨度,提供了全国范围内区县级工业企业数量的详细统计。这些数据不仅能够反映中国工业企业的发展趋势和分布状况,而且对于研究工业行业的区域差异、发展质量和效益具有重要意义。数据集中包含了省份、地区、时间以及工业行业企业数目等关键指标,总计超过33000条数据记录。这些数据来源于各地方统计局,并经过整理,为研究者提供了一个宝贵的资源,以支持对中国经济特别是工业行业的深入分析和研究。

  • BGM坏了吗111111

    BGM坏了吗111111

  • 毕业设计&课设_主要语言为 Java,含相关文件及配置.zip

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。

  • Puppet 模块用于安装和管理 Python、pip、virtualenvs 和 Gunicorn 虚拟主机 .zip

    puppet-python The Puppet module is used to install and manage python, pip, virtualenvs, and Gunicorn virtual hosts. Please note that the module stankevich/python has been deprecated and is now available under Vox Pupuli: puppet/python. Usage For usage of classes, see Resources. If contributed, update to bundle exec rake strings:generate\[',,,,false,true'] hierarchical configuration. This module supports configuration through hiera. The following example creates two python3 virtual environments.

  • WorldPO连接器标准尺寸及其选型指南,包含1.27mm、0.8mm、0.5mm间距的高速连接器

    WORLDPO(沃德披欧)是在政策支持下,成功做出对标进口品质和多达15个系列型号的连接器品牌,并且在专业机构的检测下,成功通过ISO 9001认证,FCC认证,CE认证。 内容概要:本文档为WorldPO连接器产品的选型手册,详细介绍了多种型号连接器的产品规格和参数, 包括标准的引脚间距(1.27mm、0.8mm、0.5mm、0.635mm等)、具体的引脚数量(如6-500针)、各式引脚样式(如贴片式、直插式等)、电镀方式(金镀层厚度不同)、 此外,还提供了配对合高高度、接触材料、电流负载能力、额定电流、不同型号的最大插拔次数和温度范围以及操作环境条件等多种关键属性说明。文中所有技术数据均有详细的图表辅助解读,方便用户快速查找所需参数。此外,还支持非标准定制服务。 使用场景及目标:帮助用户快速查找并选择适合自己应用需求的电连接器型号。例如,针对不同的信号传输要求,如高速数据传输、电力供应或是模拟信号传输,可以选择具有相应特性的连接器。 可以通过直接联系供应商来获取进一步的支持和服务建议。 其他说明:文档末尾提供联系人邮箱和电话,方便客户进行业务洽谈和技术支持查询。

  • 操作系统概述期末复习题(含解析)

    操作系统期末复习题

Global site tag (gtag.js) - Google Analytics