资讯月刊下载
[行业应用] 像Apache Storm一样简单的分布式图计算
原文:distributed-graph-computation-as-simple-as-it-gets-with-apache-storm 作者:Kobi Hikri 翻译:无阻我飞扬 摘要:本文从计算机领域的“祖师爷”艾伦·图灵提出的图灵机概念开始,介绍了图形计算的概念,并以示例介绍了apache storm,基于apache storm如何进行分布式图形计算。apache stor ...
[行业应用] Apache Spark 内存管理详解
Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优。本文旨在梳理出 Spark 内存管理的脉络,抛砖引玉,引出读者对这个话题的深入探讨。本文中阐述的原理基于 Spark 2.1 版本,阅读本文需要读者有一定的 Spark 和 Java 基础,了解 RDD、Shuffl ...
[开源软件] 阿里巴巴向 Apache基金会捐赠移动开发框架Weex
12月15日,阿里巴巴宣布将移动开源项目 Weex 捐赠给 Apache 基金会开始孵化,Weex 有望成为中国移动领域的首个Apache顶级项目,这意味着中国移动技术开始反哺世界。据悉,这也是继JStorm、RocketMQ 之后,阿里向 Apache 捐赠的第三个项目。 2016 年 12 月 15 日,阿里巴巴宣布将移动开源项目 Weex 捐赠给 Apache 基金会开始孵化。 Wee ...
[开源软件] 甲骨文准备将NetBeans交给Apache管理
甲骨文在NetBeans官网发表声明,它已经提议将NetBeans IDE转变成一个Apache孵化器项目,最终成为Apache软件基金会管理的一个开源项目。Apache基金会正在讨论这一提议。Java创始人James Gosling已经表示了支持。将NetBeans IDE的管辖权从甲骨文转移到中立的Apache软件基金会,将有助于它吸引更多的代码贡献者。大型企业正使用NetBeans应用框架构建 ...
[开源软件] Github上最具影响力的组织机构排行
哪些组织机构是Github最具有影响力的,本文使用gh-impact工具评估得出了如下TOP 10名单前三名分别是:Google、Facebook、Apache。 1.Google 得分:185 2.Facebook 得分:147 3.Apache 得分:130 4.Microsoft 得分:104 5.Mozilla 得分:95 6.Codrops 得分:92 7.Twitter 得分:88 8 ...
[数据库] 实时流处理系统的用例
本文阐述了为什么比起Hadoop之类的知名技术,类似Apache Storm这样的系统更加有用。 让我们以经典的笔记本品牌实时情感分析(SENTIMENT ANALYSIS)为例,在进行观点分析时,处理流程应当如下图所示: 从类似Twitter、Facebook、电子商务网站之类的不同来源收集数据。 以一些“高吞吐量”这样的关键字为基础,我们筛选出了一些数据。 为不同来源的各条信息生成情感 ...
[开源软件] Apache六大尚未广为人知的大数据项目
引用原文地址:On the Rise: Six Unsung Apache Big Data Projects 作者:SAM DEAN 译者:吴洁 世界各地无数的组织,他们使用的数据现在日益庞大而复杂,使用传统的数据处理程序已无法再进行优化分析及获得洞察。而这正是的新一代的大数据应用程序要解决的问题。近期Apache软件基金会(ASF)又将一批有趣的开源大数据项目毕业为的Apache顶级项目。这意味 ...
[开源软件] Apache Flink :回顾2015,展望2016
回顾2015,总体而言Flink在功能方面已经从一个引擎发展成为最完整的开源流处理框架之一。与此同时,Flink社区也从一个相对较小,并且地理上集中的团队,成长为一个真正的全球性的大型社区,并在Apache软件基金会成为最大的大数据社区之一。接下来看看一些有趣的统计数据,其中就包括Flink每周最繁忙的时间是星期一,肯定出乎很多人所料:) 社区发展 首先,我们从Flink的GitHub库中看一些 ...
[数据库] Apache HBase 2015 年发展回顾与未来展望
编者按:高可用架构推出 2015 年度回顾系列文章,分享在架构领域具有典型意义的年度案例,本文由张虔熙分享。转载请注明来自高可用架构公众号「ArchNotes」。 引用张虔熙,Hulu 网,专注于分布式存储和计算,HBase contributor。 HBase 2015 年技术发展 在2015年,HBase 迎来了一个里程碑——HBase 1.0 release,这也代表着 HBase 走向了稳 ...
[数据库] 2015年有关Hadoop的10个预测
计算及商业评论杂志给出了2015年Hadoop的10个预测。既包括了企业端的Hadoop(增长率,整合),也包括了技术整合,像Spark vs Hadoop和SQL for Hadoop。 这是你需要了解的2015年大数据分析工具的指南。 1.市场份额增长至$2.2bn 根据MarketAnalysis.com的分析,在未来的五年内, Hadoop-MapReduce市场预计将达到22亿美元, ...
[编程语言] Groovy即将加入Apache软件基金会
Groovy 项目负责人 Guillaume Laforge 于近日宣布 Groovy 将加入 Apache Software Foundation。 如果该提案被接受,Apache PMCs,负责管理 groovy 项目 更多内容请看这里:http://jaxenter.com/groovy-join-apache-software-foundation-115162.html。 Groovy ...
[数据库] 如何挑选合适的大数据或Hadoop平台?
IBM、Oracle、SAP、甚至Microsoft等几乎所有的大型软件提供商都采用了Hadoop。然而,当你已经决定要使用Hadoop来处理大数据时,首先碰到的问题就是如何开始以及选择哪一种产品。本文讨论了不同的选择,并推荐了每种选择的适用场合。 Hadoop平台的多种选择 下图展示了Hadoop平台的多种选择。你可以只安装Apache 发布版本,或从不同提供商所提供的几个发行版本中选择一个,或 ...
[开源软件] Apache基金会宣布Falcon成为顶级项目
Apache 基金会宣布了 Apache Falcon 项目通过了孵化阶段,目前已经成为基金会的顶级项目。 新的项目网址:http://falcon.apache.org/ Apache Falcon 提供了一个用于治理和编排 Hadoop 内部和周边数据流的数据处理框架。该框架为获取和处理数据集、复制与保留数据集、重新定向位于非Hadoop扩展中的数据集、维护审核跟踪与沿袭提供了关 键性的管控 ...
[研发管理] Apache Mesos联合创始人Benjamin Hindman:谈分布式应 ...
摘要:目前分布式应用越来越普遍,而这股热潮似乎已涌入到数据中心管理领域。近日Apache Mesos联合创始人Benjamin Hindman撰文分析当前分布式应用的现状、开发者/运营者面临的困境及解决之道! 【编者按】 目前分布式应用越来越普遍,而这股热潮似乎也正在涌入到传统的数据中心管理领域。然而却不利于开发者/运营者,这是因为这些应用不再仅限于在一台服务器上工作,更多地会是在数据中心多个服务 ...
[开源软件] Apache Drill 成为 Apache 基金会顶级项目
Apache 基金会今天宣布 Apache Drill 成为基金会的顶级项目。项目新的首页是:http://drill.apache.org/ 为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel. 该项目将会创建出开源版本的谷歌Dremel Hadoop工具( ...
[企业架构] 基于Apache Samza,揭秘LinkedIn架构背后的技术
摘要:Samza是由LinkedIn开源的一个分布式流处理系统。近日,LinkedIn资深SRE Jon Bringhurst发表了一篇博文,揭秘LinkedIn是如何利用Samza与Yarn、Kafka进行扩展的。 【编者按】Samza是由LinkedIn开源的一个分布式流处理系统,与之配合使用的是开源分布式消息处理系统Apache Kafka。很多人会将Samza与Twitter Storm相媲 ...
[开源软件] NSA将开源数据分析工具Nifi
NSA和开源软件并非水火不容。NSA本周宣布与Apache软件基金会合作,在Apache许可证下开源数据分析工具Niagarafiles (Nifi)。NSA称Nifi能在多个计算机网络中自动化数据流,即使数据格式和协议存在差异。目前关于Nifi的细节透露的不多。Nifi首席开发者Joseph L Witt称,软件提供了一种方法更有效的区分数据流优先级,移除识别和传输关键信息的人为延迟。NSA ...
[开源软件] Firefly 3.0.3 正式版发布
Firefly 3.0.3 正式版发布。Firefly 3.0.3版修复了20多项bug,增强了框架的性能,并且完善了文档和例子程序,Firefly文档。现在Firefly已经提交到了Apache Central Repository,现在可以轻松使用maven下载依赖: <dependency> <groupId>com.fireflysource</groupId ...
[开源软件] 10个强大的Apache模块
Apache 是世界上使用最为广泛的Web服务器,没有之一! 因为其具有高效、功能强大、超强可扩展性等特点。本文向你推荐10个非常强大的Apache扩展模块,可以帮助你的Web应用更加灵活。 1.SSO Module - LemonLDAP LemonLdap 是 Apache 的一个实现了 Web SSO 的模块,可处理超过 20 万的用户。 website : http://wiki.lemo ...