资讯月刊下载
[数据库]
Twitter将开源MySQL/Hadoop转移工具
根据国外媒体报道,Twitter计划开源Hadoop-happy架构的一个附加部分,Twitter用来作为内部数据分析。作为知名的Crane,这个是用来将MySQL转化到Hadoop的工具。这一开源数据分析平台建立在Google的私有设施上。 Twitter使用Hadoop来进行数据分析,同时该平台也被使用在站点上,包括Twitter的名称搜索功能。 Twitter的大部分表格数据存储在 ...
[企业架构]
Grid Engine 6.2 U5发布,集成Hadoop分布式计算平台
上周,Grid Engine 6.2 U5版本发布了!在此次更新中,最引人注目的功能就是集成了Hadoop。Grid Engine 6.2 U5是第一个使用开源的Hadoop编程环境(由Apache软件基金会提供支持)创建应用的workload管理器,你不必设定一个专门的Hadoop集群,可以向对待其他应用一样提交作业到一个Grid Engine grid。 新特性: Inspect增强 Mult ...
[编程语言]
DataNucleus AccessPlatform 2.0 M4发布,Java持久化 ...
DataNucleus AccessPlatform 2.0 M4版本发布!DataNucleus AccessPlatform 是一个开源的Java持久化平台,源自开源项目JPOX(http://www.jpox.org),致力于JDO的实现。 DataNucleus AccessPlatform通过JDO和JPA APIs向RDBMS、ODBMs、ODF 、LDAP、JSON 、Goo ...
[数据库]
hadoop hive发布0.40版本,将sql语句转为MapReduce ...
hive是facebook发布的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行. 优点:学习成本低,可以通过类SQL语句快速实现简单的 MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析 并且有正在逐步完善的jdbc,odbc接口. 下载: http://had ...
[编程语言]
Cloudera 宣布Hadoop World大会10月2日举行:NYC 20 ...
Cloudera 宣布Hadoop World大会NYC 2009将于10月2日在纽约举行,赞助商将包括:Yahoo!, IBM, Intel, eHarmony等。 Hadoop world大会将深入探讨Hadoop个案研究和在现实世界实现例子,展示传统企业如何使用Hadoop。代表企业有About.com , Booz Allen Hamilton的,Facebook, IBM ,英特尔, ...
[编程语言]
雅虎开源Yahoo! Distribution of Hadoop
不久前,雅虎的网格计算团队使用自己开发的Apache Hadoop在GraySort年度比赛中,打破了世界数据排序记录。6月10日,在硅谷举行的Hadoop Summit会议上,雅虎宣布将其内部使用的Apache Hadoop开源。Apache Hadoop是一个开源的分布式计算Java平台,可帮助处理大规模的数据集,广泛使用在搜索工具和数据挖掘软件中,如 Facebook便是使用Hadoop作为站 ...
[编程语言]
Apache Mahout 0.1 发布:机器学习算法
Apache Lucene 开发团队很高兴的宣布Apache Mahout 0.1 发布。Apache Mahout是Apache Lucene一个子项目,目标是提供可扩展的机器学习算法实现,也采用 Apache license许可。第一个公开发布版本包括 聚类 clustering,分类classification,合作过滤collaborative filtering 和 进化编程evoluti ...
[编程语言]
Cascading:一个简单的Hadoop MapReduce应用
Cascading是一个架构在Hadoop上的API,用来创建复杂和容错数据处理工作流。它抽象了集群拓扑结构和配置来快速开发复杂分布式的应用,而不用考虑背后的MapReduce。 Cascading目前依赖于Hadoop提供存储和执行架构,但是Cascading API为开发者隔离了Hadoop的技术细节,提供了不需要改变初始流程工作流定义就可以在不同的计算框架内运行的能力。 Cascading ...
[编程语言]
Lucene 2.3 发布,Hadoop成为Apache顶级项目
Apache Lucene可以说是Java社区全文检索引擎的事实标准,无人不晓,Lucene社区是相当活跃的,几乎每年都有两个版本发布,21号Lucene正式发布2.3版本,官方网站虽然还没有提供下载,但镜像网站已有下载。 Lucene下载地址:http://www.eng.lsu.edu/mirrors/apache/lucene/java/ Hadoop原本由Lucene的子项目Nutch ...
[编程语言]
Yahoo成为Apache基金会的白金赞助人
Yahoo在一份新闻稿上宣布成为Apache软件基金会(ASF)的白金赞助人。Yahoo表示他们的资金赞助是非盈利性质的,向ASF提供必要的营业资金,硬件基础设施,为ASF的一些项目产业化提供资源。 在公司的blog上,Yahoo特别表达了对ApacheLucene和Hadoop两个项目的兴趣,他们已经雇用了这两个项目的创始人兼 Apache副总裁Doug Cutting。Apache Lucen ...