内容说明:
Hadoop开发者第一期
1 Hadoop 介绍
2 Hadoop 在国内应用情况
3 Hadoop 源代码 eclipse 编译教程
7 在 Windows 上安装 Hadoop 教程
13 在 Linux 上安装 Hadoop 教程
19 在 Windows 上使用 eclipse 编写 Hadoop 应用程序
24 在 Windows 中使用 Cygwin 安装 HBase
28 Nutch 与 Hadoop 的整合与部署
31 在 Windows eclipse 上单步调试 Hive 教程
38 Hive 应用介绍
42 Hive 执行计划解析
50 MapReduce 中的 Shuffle 和 Sort 分析
53 海量数据存储和计算平台的调试器研究
56 探讨 MapReduce 模型的改进
58 运行 eclipse 编译出的 Hadoop 框架
59 表关联在 MapReduce 上的实现
63 Hadoop 计算平台和 Hadoop 数据仓库的区别
Hadoop开发者第二期
1、Hadoop 业界资讯......................................... - 1 -
2、Nutch + Hadoop 构建商用分布式搜索引擎的问题探究 ........... - 5 -
3、支持自定义爬虫的 Nutch segment 文件存储接口改写........... - 11 -
4、Nutch 中 mapreduce 应用的几个特殊点 ...................... - 14 -
5、Java RMI + Lucene 构建分布式检索应用初探 ................ - 17 -
6、一对多的表关联在 mapreduce 中的应用(续) .................. - 26 -
7、InputSplit 文件格式分析................................. - 32 -
8、短评:HDFS、MapReduce 和 HBase 三者相辅相成、各有长处 ..... - 34 -
9、HDFS 在 web 开发中的应用................................. - 35 -
10、Mapreduce 中 value 集合的二次排序 ....................... - 38 -
11、Hive SQL手册翻译 ................................... - 47 -
12、Mahout Kmeans 简介 .................................... - 57 -
Hadoop开发者第三期
1 Hadoop 中的数据库访问.............................................. 5
2 MapReduce 中多文件输出的使用.............................. 13
3 Zookeeper 使用与分析............................................... 22
4 浅析一种分类数据模型..............................................30
5 Sector 框架分析........................................................... 34
6 Run on Hadoop...........................................................49
Hadoop开发者第四期
mooon................................................................................................................... 1
海量数据处理平台架构演变....................................................................................................................... 4
计算不均衡问题在Hive 中的解决办法....................................................................................................15
Join 算子在Hadoop 中的实现................................................................................................................... 20
配置Hive元数据DB为PostgreSQL........................................................................................................32
ZooKeeper权限管理机制.......................................................................................................................... 36
ZooKeeper服务器工作原理和流程...........................................................................................................39
ZooKeeper实现共享锁.............................................................................................................................. 47
Hadoop最佳实践........................................................................................................................................50
通过Hadoop的API管理Job....................................................................................................................54
Hadoop集群的配置调优............................................................................................................................60
Hadoop平台的Java 规范及经验...............................................................................................................63
MapReduce开发经验总结......................................................................................................................... 67
Hadoop中的tar 命令的实现......................................................................................................................70
Hadoop技术论坛运营数据分享................................................................................................................92
下载地址:
http://www.aiitee.com/thread-4386-1-1.html
分享到:
相关推荐
描述中提到"金额不多,博主收集文件不易",这可能意味着这个压缩包的作者花费了一定时间和精力去整理和打包这些配置文件,以供需要的人免费下载。"有需求可以拿走"表明作者愿意分享资源,而"详情可见博客 eclipse...
在IT行业中,打包工具起着至关重要的作用,它们主要用于整理、组织和压缩文件,以便于存储、传输或分发。"打包工具.rar"这个压缩包很可能包含了一系列用于创建、管理和解压RAR格式文件的工具。RAR是一种高效的数据...
总的来说,"Python大数据+人工智能基础.txt打包整理.zip"提供的内容涵盖了Python在大数据处理和人工智能领域的核心知识点,包括但不限于数据处理库、机器学习算法、深度学习框架以及相关的理论知识。学习并掌握这些...
这份"Java面试真题整理打包"资源,包含了上百个真实的Java面试问题,以及作者的学习心得,为准备Java求职面试的你提供了宝贵的参考资料。 首先,我们可以从01_Java公司面试真题中了解Java基础部分的考察重点。这...
在Python编程环境中,它是一个非常受欢迎的库,能够帮助用户自动化地下载、整理和管理网络上的数据。PyPI(Python Package Index)是Python软件的官方仓库,提供了丰富的Python库供开发者下载和使用。在本例中,我们...
1. **Hadoop**:Hadoop是大数据处理的基础框架,提供分布式存储(HDFS)和分布式计算(MapReduce)功能。译文中可能包含了Hadoop的安装配置、API使用以及实际案例分析等内容。 2. **Spark**:Spark是新一代的大数据...
Spark 是一种快速通用的大规模数据处理系统,而Hive 则是一种数据仓库工具,主要用于对存储在 Hadoop 文件中的数据集进行数据整理、特殊查询和分析存储。然而,在实际应用中,开发人员可能会遇到一个常见问题——...