`
run_xiao
  • 浏览: 195391 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

两本关于Hadoop的书

阅读更多

昨天刚从同事那拿到两本关于hadoop的书。

 

一本是hadoop的committer Tom White的大作《hadoop_The_definitive_guide》,大致看了下前言和目录,非常

 

详细的介绍了hadoop的各个方面。

 

另一本《Data-Intensive Text Processing with MapReduce》貌似还没有正式出版,介绍了如何用MapReduce设计一

 

些算法的技巧,包括常见的连接多个表,Inverted Indexing的实现,包括宽度优先、PageRank等图相关算法,以及

 

EM、HMM等机器学习算法是现实,总之感觉是本非常棒且实用。

 

不敢独享,拿出来与大家share.

分享到:
评论
1 楼 hagendashao 2013-09-17  
此两本书都写的很细致,感谢楼主分享。

相关推荐

    Hadoop书籍

    在Hadoop的学习过程中,有两本书籍被誉为经典:《Hadoop实战》和《Hadoop权威指南》。 《Hadoop实战》(第2版)这本书主要面向实践,适合对Hadoop有一定了解并希望深入应用的读者。书中详细介绍了如何配置和管理...

    hadoop学习资料书

    本学习资料书主要针对Hadoop的初学者,旨在提供全面的基础知识解析,帮助读者快速掌握这一强大的大数据处理工具。 一、Hadoop概述 Hadoop是由Doug Cutting和Mike Cafarella于2005年基于Nutch搜索引擎项目发展起来...

    hadoop实验指导书

    在本实验指导书中,我们将围绕以下几个关键知识点展开: 1. **Hadoop架构**:Hadoop由HDFS(Hadoop Distributed File System)和MapReduce两大部分构成。HDFS为海量数据提供了分布式存储解决方案,而MapReduce则...

    深入理解Hadoop 书中源码

    MapReduce是Hadoop用于大规模数据处理的编程模型,它将复杂的数据处理任务分解为“映射”(map)和“化简”(reduce)两个阶段。映射阶段将输入数据拆分为键值对并进行处理,化简阶段则对结果进行聚合。通过研究源码...

    hadoop配置相关的好书

    总的来说,一本关于Hadoop配置的好书应该会详细讲解这些概念,包括它们的工作原理、配置参数、最佳实践以及故障排查。对于程序员来说,掌握这些知识不仅可以提升他们的Hadoop技能,还有助于他们在大数据项目中发挥...

    Hadoop权威指南(中文版)(带书签

    《Hadoop权威指南》是大数据领域的一本经典著作,它深入浅出地介绍了Apache Hadoop这一开源分布式计算框架。Hadoop是由Doug Cutting和Mike Cafarella共同创建,旨在处理和存储大量数据,尤其适合大规模数据集的并行...

    Hadoop技术详解.Hadoop Operation

    《Hadoop技术详解》这本书是关于Hadoop操作的详尽指南,它涵盖了Hadoop生态系统中的核心组件、工作原理以及实际操作技巧。Hadoop是大数据处理领域的重要工具,它以其分布式计算框架闻名,允许企业在大规模数据集上...

    HADOOP权威指南第3版

    Hadoop权威指南第3版这本书,作为学习Hadoop的重要参考资料,为读者提供了关于Hadoop架构、各个组件的功能和配置方法以及如何使用Hadoop进行大规模数据处理和分析的全面指南。 首先,Hadoop的核心概念包括它的...

    Hadoop权威指南第3版PDF电子书下载带目录书签完整版

    Hadoop的核心组件包括Hadoop Distributed File System (HDFS) 和 MapReduce,这两个组件共同构建了一个可靠、可扩展的分布式平台。 在Hadoop权威指南第三版中,读者可以深入了解到: 1. **HDFS**:Hadoop的基石,...

    【免费】Hadoop权威指南(第3版) 修订版(带目录书签) 中文高清晰PDF

    总的来说,《Hadoop权威指南》(第3版) 修订版不仅是一本技术手册,更是一部引导读者逐步掌握Hadoop技术的教科书。无论你是初学者还是经验丰富的开发者,都能从中受益匪浅,提升自己在大数据处理和云计算领域的专业...

    Hadoop The Definitive Guide

    《Hadoop:The Definitive Guide》是O'REILLY出版社出版的一本关于Apache Hadoop的权威指南,目前流行的是第四版。这本书为读者提供了一个全面的Hadoop学习平台,内容涵盖了如何构建和维护一个既可靠又可扩展的...

    hadoop权威指南第三版中文pdf

    首先,书中会详细解释Hadoop的两个核心组件:Hadoop Distributed File System(HDFS)和MapReduce。HDFS是一种高度容错性的文件系统,能处理硬件故障,并保证数据的高可用性和可恢复性。MapReduce则是一种并行计算...

    Hadoop the definition guide

    1. Hadoop定义指南:本书是一本关于Hadoop的定义性指南,旨在向读者解释Hadoop的概念、使用场景和应用。它不仅是一本关于Hadoop的技术指南,还是一本大数据学习的必读书籍。 2. 大数据与Hadoop的关系:在描述中提到...

    Hadoop权威指南第2版中文版-带书签目录扫描版

    《Hadoop权威指南》第二版中文版是一本深入解析Hadoop生态系统的专业书籍,它为读者提供了全面且详细的Hadoop知识体系。这本书以其丰富的书签目录结构,方便读者快速定位到所需内容,使得学习和查阅更为高效。扫描版...

    Hadoop及源码.7

    "Hadoop实战 第2版 陆嘉恒著2012(linuxidc.com).pdf"是一本关于Hadoop实战的书籍,由陆嘉恒撰写,可能包含了Hadoop的安装配置、使用案例、优化技巧等内容,对于学习和掌握Hadoop非常有帮助。"LinuxIDC.com.png"和...

    hadoop权威指南中英两本和代码

    《Hadoop权威指南》是大数据领域的一本经典之作,它详细介绍了Apache Hadoop生态系统的核心组件、工作原理以及实际应用。这本书分为中文和英文两个版本,为读者提供了双语学习的便利,适合不同语言背景的读者深入...

    深入理解Hadoop.第2版-无书签的扫描PDF版本,清晰度还行

    《深入理解Hadoop》第二版是一本专注于Hadoop技术的权威指南,对于想要深入了解和掌握这一分布式计算框架的读者来说,具有极高的参考价值。这本书虽然没有书签,但其扫描版的质量尚可,足以满足学习和查阅的需求。 ...

Global site tag (gtag.js) - Google Analytics