资讯月刊下载

第121期(18-03)

2018年03月 - 总第121期
  • Java程序员开发常用的工具
  • 3月全球数据库排名:PostgreSQL 再迎暴涨
点击下载>>

第120期(18-02)

2018年02月 - 总第120期
  • 开源巨献:2017 年 Google 开源了这些超赞的项目
  • 关于区块链,程序员需要了解什么
点击下载>>

第119期(18-01)

2018年01月 - 总第119期
  • 编写高性能Java代码的最佳实践
  • 从15000个Python开源项目中精选的Top30,Github平均star为3707,赶紧收藏!
点击下载>>

更多月刊下载

活跃编辑

资讯编辑

原创新闻 [互联网] 【招募】大数据时代,Hadoop竟是最好的框架?

Hadoop的Logo是一头大象,其名字并不是一个缩写,而是一个虚构的名字。该项目的创建者,Doug Cutting解释Hadoop的得名 :“这个名字是我孩子给一个棕黄色的大象玩具命名的。我的命名标准就是简短,容易发音和拼写,没有太多的意义,并且不会被用于别处。小孩子恰恰是这方面的高手。 提到大数据,很多同学会想到Hadoop技术。大家都知道,Hadoop是Apache的一个开源项目,它是一 ...
mengyidan1988 评论(0) 有4835人浏览 2017-03-23 0 0

转载新闻 [开源软件] 云计算的核心技术

云计算的“横空出世”让很多人将其视为一项全新的技术,但事实上它的雏形已出现多年,只是最近几年才开始取得相对较快的发展。确切地说,云计算是大规模分布式计算技术及其配套商业模式演进的产物,它的发展主要有赖于虚拟化、分布式数据存储、数据管理、编程模式、信息安全等各项技术、产品的共同发展。近些年来,托管、后向收费、按需交付等商业模式的演进也加速了云计算市场的转折。云计算不仅改变了信息提供的方式,也颠覆了传统 ...
cao345657340 评论(2) 有5958人浏览 2015-01-13 3 0

原创新闻 [数据库] HBase 0.98发布,安全和性能提升

Apache软件基金会今天发布了HBase 0.98版本。 HBase(Hadoop Database)是一个分布式的、面向列的开源数据库,是Google Bigtable的开源实现,是Apache Hadoop项目的子项目。不同于一般的关系数据库,HBase适合于非结构化数据存储,此外,HBase采用基于列的而不是基于行的模式。 新版本中包含了一些新的安全特性:cell可见性标签、cell ...
wangguo 评论(0) 有28135人浏览 2014-02-17 4 0

原创新闻 [开源软件] Hadoop v2 时代正式到来

Apache基金会近日正式发布了Hadoop 2.2版本,该版本是Hadoop 2.x分支中的首个稳定版本(2.0.x为alpha版本,2.1.x为beta版本),标志着Hadoop 2时代的正式到来。 Apache建议用户升级至最新版本,因为这个版本更加稳定,并保持与之前版本API和相关协议条款的兼容。与Hadoop 1.x相比,Hadoop 2的主要亮点如下: 新的Hadoop MapR ...
wangguo 评论(10) 有18625人浏览 2013-10-21 7 0

转载新闻 [互联网] Hadoop:用还是不用?

当人们提到“大数据”或是“数据分析”等相关问题的时候,会听到脱口而出的回答:Hadoop!Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。 实际上Hadoop被设计和建造出来,是用来解决一系列特定问题的。对某些问题来说,Hadoop至多算是一个不好的选择。对另一些问题来说,选择Hadoop甚至会是一个错误。对于数据转换的操作,或者更广泛意义上的抽取-转换-装载的操作(译者注:Extrac ...
WnouM 评论(8) 有14287人浏览 2013-10-15 21 0

原创新闻 [数据库] MongoDB MapReduce 性能提升20倍的优化宝典

自从MongoDB被越来越多的大型关键项目采用后,数据分析也成为了越来越重要的话题。人们似乎已经厌倦了使用不同的软件来进行分析(这都利用到了Hadoop),因为这些方法往往需要大规模的数据传输,而这些成本相当昂贵。 MongoDB提供了2种方式来对数据进行分析:Map Reduce(以下简称MR)和聚合框架(Aggregation Framework)。MR非常灵活且易于使用,它可以很好地与分片( ...
wangguo 评论(3) 有32402人浏览 2013-07-09 13 8

原创新闻 [互联网] 国内首套免费的大数据技术(Hadoop)视频教程上线

Hadoop作为Nutch的重要组成部分,在《Nutch相关框架视频教程》中具有举足轻重的地位。 目前Hadoop部分已经上线的内容为第9-16共8讲,主要内容有: cygwin下使用hadoop运行nutch、Hadoop单机本地模式 Ubuntu上的Hadoop单机伪分布式模式 Windows上的HADOOP单机伪分布式模式 Ubuntu上的Hadoop多机完全分布式模式 Hadoop分散 ...
yangshangchuan 评论(6) 有15277人浏览 2013-04-15 16 2

原创新闻 [行业应用] 为解决扩展性瓶颈雅虎计划重构Hadoop-MapReduce

最近雅虎开发者博客发了一篇介绍Hadoop重构计划的文章。因为他们发现当集群的规模达到4000台机器的时候,Hadoop遭遇到扩展性的瓶颈,目前他们正准备开始对Hadoop进行重构。 Mapreduce面临的瓶颈 从集群大小和工作量中观察到的趋势是,MapReduce的JobTracker需要彻底改革,以解决其可扩展性,内存消耗,线程模型,可靠性和性能的几个缺陷。Mapreduce在过去5年 ...
lzj0470 评论(4) 有10968人浏览 2011-02-25 16 2

原创新闻 [数据库] hadoop hive发布0.40版本,将sql语句转为MapReduce ...

hive是facebook发布的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行. 优点:学习成本低,可以通过类SQL语句快速实现简单的 MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析 并且有正在逐步完善的jdbc,odbc接口. 下载: http://had ...
badqiu 评论(3) 有7821人浏览 2009-10-29 8 0

原创新闻 [数据库] Greenplum发布免费的分析数据库

GreenPlum公司发布了分析数据库软件的免费版本。此免费版与Greenplum Database 3.3的功能大体相同,但它只能运行在一个节点上,称为单节点版。Greenplum是世界上最强大的分析数据库。不论是传统的SQL操作命令还是目前具有领导地位的MapReduce技术,都可以结合在同一个平台上执行。 这样大幅简化了应用程序的开发和实施。用户可以对于大量的数据进行高速复杂的分析,通常用传统 ...
zly06 评论(1) 有8343人浏览 2009-10-20 7 0

翻译新闻 [编程语言] Myspace发布基于windows平台的mapreduce框架

MySpace Qizmt - MySpace's Mapreduce FrameworkMySpace Qizmt [kiz-mit] 是一个基于windows操作系统的大规模集群的mapreduce计算框架。特性内置的IDE/调试器 可以在集群上开发调试程序可以在任何节点上执行命令Delta-only exchange option for Mapreduce jobs.可配置的数据冗余和故障转 ...
baseworld 评论(2) 有5018人浏览 2009-09-20 5 0

转载新闻 [移动开发] GridGain 2.1发布:开源的网格计算框架

GridGain System 宣布 GridGain 2.1 发布-新版本的创新的基于Java的开源网格计算平台。GridGain 2.1提供了业界唯一的cloud云开发和运行环境,能发展本地cloud云应用,并提供结合强大和优雅简洁,着眼于企业级Java和业界领先的功能。自从2007年8月GridGain首次发布以来,基于java的cloud云开发着运行平台迅速发展,目前有数以万计的下载,被应用 ...
QQbyte 评论(0) 有4588人浏览 2009-01-09 3 0

原创新闻 [数据库] Google能够在6个小时排序1 PB数据

google日前宣布,他们能够在6小时2分钟操作4000台电脑排序1 PB的数据,1 PB = 1,024 TB ! 根据google的博客,从这个数据量的角度来看,1 PB相当于2008年5月份美国国会图书馆存档web数据的12倍,都是通过google MapReduce实例来处理巨大的数据,数据额在2008年一月差不多是每天 20 PB。强大的MapReduc 技术可能成为一个编程模型 和 一个 ...
QQbyte 评论(14) 有9925人浏览 2008-11-24 10 3

原创新闻 [编程语言] Cascading:一个简单的Hadoop MapReduce应用

Cascading是一个架构在Hadoop上的API,用来创建复杂和容错数据处理工作流。它抽象了集群拓扑结构和配置来快速开发复杂分布式的应用,而不用考虑背后的MapReduce。 Cascading目前依赖于Hadoop提供存储和执行架构,但是Cascading API为开发者隔离了Hadoop的技术细节,提供了不需要改变初始流程工作流定义就可以在不同的计算框架内运行的能力。 Cascading ...
QQbyte 评论(4) 有22824人浏览 2008-09-12 8 2

转载新闻 [编程语言] Skynet,全新的Ruby MapReduce实现

2004年,Google提出用于分布式数据处理的MapReduce设计模式,同时还提供了第一个C++的实现。现在,一个名为Skynet的Ruby实现已经由Adam Pisoni发布。 引用Skynet是可适配、可容错的、可自我更新的,而且完全是分布式的系统,不存在单一的失败节点。 Skynet和Google在设计上有两点重要的区别: Skynet无法向工作者(Worker)发送原生代码(Raw c ...
shaka 评论(1) 有3392人浏览 2008-02-18 6 0

原创新闻 [编程语言] Lucene 2.3 发布,Hadoop成为Apache顶级项目

Apache Lucene可以说是Java社区全文检索引擎的事实标准,无人不晓,Lucene社区是相当活跃的,几乎每年都有两个版本发布,21号Lucene正式发布2.3版本,官方网站虽然还没有提供下载,但镜像网站已有下载。 Lucene下载地址:http://www.eng.lsu.edu/mirrors/apache/lucene/java/ Hadoop原本由Lucene的子项目Nutch ...
rainsf 评论(11) 有10989人浏览 2008-01-24 14 0

转载新闻 [编程语言] MapReduce是一大倒退吗

最近Database Column有一场关于MapReduce的讨论,背景是在"云计算"逐渐兴起之际, Google和IBM挑选一些大学并计划为他们提供有10000个处理器的集群好让这些学校能教授如何使用MapReduce工具对集群进行编程.Berkeley大学已经计划让大学新生学习如何使用MapReduce框架。 Database Column质疑MapReduce,认为对大规 ...
cryolite 评论(0) 有6132人浏览 2008-01-20 3 1

转载新闻 [互联网] Google每天处理的数据量已超20PB

  要在搜索领域超越Google绝非易事,即使对微软和Yahoo!这样的企业而言,也是极困难的。其中一个重要的原因是即使别的企业可以复制或模仿 Google的搜索技术、界面,但它们却无法完全复制Google最引以为荣的软硬件基础架构。Google的硬件方面包括了自行组装的服务器群,以及建设于世界各地的超大型数据中心等 等,这一点我们早就已经知道了。而在软件方面,我们也知道Google服务器里运行的 ...
coderChen 评论(10) 有11318人浏览 2008-01-13 7 0

最近热门TAG

Google(1441) 浏览器(540) Firefox(483) Chrome(386) 互联网(306) Facebook(252) 云计算(231) IE(183) Twitter(156) 搜索引擎(150) 网络应用(116) Opera(116) 百度(115) WordPress(79) 腾讯(77) Yahoo(70) 阿里巴巴(68) Safari(67) Gmail(67) Bing(51)

热门资讯

Global site tag (gtag.js) - Google Analytics