- 浏览: 114883 次
- 性别:
- 来自: 北京
-
文章分类
- 全部博客 (109)
- hive (5)
- web (1)
- spring (7)
- struts2 (1)
- s2sh (2)
- mysql (3)
- hadoop (31)
- hbase (6)
- java (8)
- ubuntu (8)
- pig (2)
- Interview (2)
- zookeeper (1)
- system (1)
- 遥控 (1)
- linux (3)
- myeclipse (2)
- Oracle (1)
- redis (9)
- ibatis (2)
- 架构 (2)
- 解析xml (1)
- autoProxy (0)
- jedis (6)
- http://www.infoq.com/cn/articles/tq-redis-copy-build-scalable-cluster (1)
- xmemcached (1)
- 图片服务器 (1)
- 对象池 (0)
- netty (1)
最新评论
-
laoma102:
已经不好使了,能找到最新的吗
spring官方文档 -
di1984HIT:
不错,。不错~
pig安装
http://www.easyigloo.org/?p=1143
发表评论
-
mapreduce Bet
2012-04-11 15:00 926import java.io.IOException; imp ... -
hadoop 输出格式
2012-04-05 17:18 731http://blog.csdn.net/dajuezhao/ ... -
hadoop mapreduce 原理
2012-03-31 16:14 700http://www.cnblogs.com/forfutur ... -
hadoop搭建问题
2012-03-30 13:23 811file:///E:/hadoop/搭建/hadoop集群搭建 ... -
hadoop输出文件格式
2012-03-26 10:09 659http://apps.hi.baidu.com/share/ ... -
hadoop 学习
2012-03-26 09:48 660http://hi.baidu.com/shuyan50/bl ... -
hadoop提高性能建议
2012-03-22 22:40 686http://langyu.iteye.com/blog/91 ... -
hadoop例子
2012-03-22 22:09 737http://www.hadoopor.com/thread- ... -
hadoop
2012-04-25 13:16 756精通HADOOP http://blog.csdn.net/ ... -
Hadoop Hive与Hbase整合
2012-03-07 15:02 363http://www.open-open.com/lib/vi ... -
hive hadoop 代码解析
2012-04-25 13:16 799http://www.tbdata.org/archives/ ... -
Hadoop MapReduce操作MySQL
2012-03-05 17:33 896http://www.javabloger.com/artic ... -
hadoop hdfs常用操作类
2012-03-05 10:03 1963import java.io.IOException; ... -
hdfs 操作类自己的
2012-03-02 17:57 563package operateFile; import ... -
hadoo 文件常用操作
2012-03-02 15:53 782http://www.360doc.com/content/1 ... -
Mapper,Reducer,Wrapper的Java模板
2012-03-02 08:24 1120http://www.easyigloo.org/?p=114 ... -
hadoop基础知识
2012-03-02 08:00 745http://www.blogjava.net/killme2 ... -
hadoop 自己封装的接口
2012-04-25 13:16 697http://www.360doc.com/content/1 ... -
HadoopFileUtil
2012-03-01 14:42 1841import java.io.File; import jav ... -
hadoop ExtendedFileUtil
2012-03-01 14:34 1057在Hadoop编写生产环境的任务时,定义以下任务,要求是相同的 ...
相关推荐
这些组件在Hadoop 2.x(YARN)中被ResourceManager和NodeManager替代,以提高系统可扩展性和资源利用率。 3. **InputFormat与OutputFormat**:InputFormat负责将原始输入数据分割成RecordReader可以处理的块,而...
Hadoop 源代码分析 Hadoop 是一个开源的分布式计算框架,由 Apache 基金会维护。Hadoop 的核心组件包括 HDFS(Hadoop Distributed File System)和 MapReduce。HDFS 是一个分布式文件系统,可以存储大量的数据,而 ...
这本书全面介绍了Hadoop生态系统,包括HDFS、MapReduce、YARN以及相关的工具和扩展。代码库`tomwhite-hadoop-book-32dae01`应该是作者Tom White在书中提到的示例代码的一个特定版本。 Hadoop分布式文件系统(HDFS)...
7. **扩展性与插件机制**:Hadoop允许用户自定义InputFormat、OutputFormat、Partitioner和Reducer等,源码分析可以帮助我们理解这些接口的实现,以及如何为特定需求定制Hadoop组件。 8. **Hadoop与其他组件的集成*...
1. **YARN(Yet Another Resource Negotiator)**:这是Hadoop的重大架构变革,将原来的JobTracker功能拆分为ResourceManager和ApplicationMaster两个角色,增强了资源调度的灵活性和可扩展性。 2. **HDFS(Hadoop ...
8. **Hadoop与其他组件的集成**:Hadoop可以与Hive、Pig、Spark等其他大数据工具结合使用,扩展其功能。例如,通过Hive的HQL查询语言,可以方便地对Hadoop集群上的数据进行分析。 9. **Hadoop的版本更新**:随着...
标题 "hadoop2.8.4安装扩展、依赖文件" 描述了在Windows操作系统上部署Hadoop 2.8.4版本时所面临的一个关键问题,即需要特定的Windows扩展和工具来支持其正常运行。这里的核心是`hadoop.dll`和`winutils.exe`,它们...
这种“蜘蛛网”式的依赖关系反映了Hadoop架构设计上的灵活性和扩展性,但也增加了理解和维护的难度。 #### 三、关键组件解析 - **HDFS(Hadoop Distributed File System)**:作为Hadoop的核心组件之一,HDFS提供...
"Hadoop源代码分析完整版" Hadoop作为一个开源的分布式计算框架,具有高可扩展性和高性能的特点。Hadoop的源代码分析可以分为多个部分,包括HDFS、MapReduce、YARN等。 首先,让我们了解Hadoop的架构。Hadoop的...
【标题】"Hadoop源代码归档"涉及的是开源大数据处理框架Hadoop的源代码分析与学习。Hadoop是Apache软件基金会的一个项目,其核心设计理念是分布式存储和计算,为海量数据提供了高可靠、高扩展性的解决方案。 【描述...
"hadoop-book-master.zip"可能是一个包含更多Hadoop书籍或教程源代码的压缩文件,其中可能有详细的概念解释、实例代码和项目实践,对于深入学习Hadoop的源码和实现原理非常有价值。 总之,Hadoop是大数据处理的关键...
通过研究Hadoop源代码,开发者不仅可以了解其设计思想,还可以学习如何优化分布式系统,以及如何针对特定需求扩展Hadoop。对于想要深入理解和定制Hadoop的人来说,阅读源代码是不可或缺的步骤。在“hadoop 源代码...
源代码的提供对于学习和理解Hadoop的工作原理及其实现细节至关重要。通过研究这些源码,我们可以深入了解Hadoop在大数据处理中的核心组件——HDFS(Hadoop Distributed File System)和MapReduce。 1. Hadoop分布式...
- YARN(Yet Another Resource Negotiator)是Hadoop 2引入的新特性,分离了资源管理和作业调度功能,提高了系统的灵活性和可扩展性。 - 资源管理器(ResourceManager):全局资源调度中心,负责分配和监控集群...
在IT行业中,大数据处理是一项至关重要的任务,而Hadoop作为开源的大数据处理框架,因其高效、可扩展的特性,被广泛应用于气象数据分析等场景。在这个项目中,我们重点关注的是一套完整的Hadoop分析气象数据的代码,...
本资源是“云计算Hadoop Java写的源代码”,来自中国人民大学的教学实践,对于学习和理解Hadoop的运作机制以及Java在云计算环境下的应用具有极高的价值。 首先,我们需要了解Hadoop的基本架构。Hadoop主要由两个...
【标题】:“Hadoop源代码归档3” 【描述】:“Hadoop源代码归档3”指的是一个包含Hadoop开源项目源代码的压缩文件集合,可能是版本更新或特定开发阶段的代码备份。Hadoop是一个由Apache基金会开发的分布式计算框架...