2、hadoop子项目 - - ITeye博客

`

nickfover

浏览: 44747 次
性别:
来自: 杭州

最近访客更多访客>>

bitbooboo

ccmanwuyunduan

tanjung123456

gwqiang

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

2014-11 ( 14)
2014-10 ( 42)
2014-09 ( 33)
更多存档...

最新评论

yunchow：可以把EJB集成到Spring里面，将pojo发布为ejb
12、EJB3.0

2、hadoop子项目

博客分类：

hadoop

阅读更多

##Pig---hadoop客户端

Pig是一个基于Hadoop的大规模数据分析平台，它提供的SQL-LIKE语言叫Pig Latin，该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

http://guoyunsky.iteye.com/blog/1317084

http://blackproof.iteye.com/blog/1791980

##Hbase--apache顶级项目

Hbase query language(HQL Not only sql)

google3大论文之一bigtable的开源实现；适合高速读写数据场景。

http://blog.csdn.net/viewcode/article/details/9967497

http://www.csdn.net/article/2014-02-17/2818431-HDFS+MapReduce+Hbase

##Hive(蜂巢)--Hbase的数据仓库项目

http://sishuok.com/forum/blogPost/list/6220.html

http://zhangwei20086.blog.163.com/blog/static/230557182012619111956724/

HiveQL支持大部分SQL

##zookeeper

通信协调软件，google chubby的开元实现，确认消息是否到达，防止单点失效，处理负载均衡。

http://www.blogjava.net/BucketLi/archive/2010/12/21/341268.html

http://cailin.iteye.com/blog/2014486

sqoop

实现hadoop与关系型数据库的交互

avro(avro)

数据序列化工具，用于大数据交互

chukwa--数据收集与分析框架

cassanda--facebook提供与hbase类似

分享到：

3、Hbase | 2、鸟哥linux--计算机硬件

2014-11-13 14:06
浏览 363
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

基于hadoop子项目_Hive的云计算性能测试_沙恒.pdf: ### 基于Hadoop子项目Hive的云计算性能测试 #### 一、引言在信息化时代，数据量的增长速度惊人，据IDC的一项预测显示，2006年全球的数据总量约为0.18ZB（1ZB=10亿TB），而在2011年这一数字已达到了1.8ZB。随着...

Hadoop源码分析（完整版）: Hadoop项目包括了多个子项目，其中最核心的是HDFS和MapReduce，这两个组件共同构成了Hadoop分布式文件系统和数据处理模型的基础。在分布式计算领域，Google是领先的公司之一，它的计算平台成为了后来类似开源项目...

Hadoop整本书电子教案完整版ppt课件全书教学教程最全教学课件.ppt: Hadoop生态包括众多相关工具和项目，如HBase（分布式数据库）、Hive（数据仓库工具）、Pig（数据分析平台）、Spark（快速、通用的大数据处理引擎）和Zookeeper（分布式协调服务）。这些组件共同构建了一个全面的数据...

hadoop winutils hadoop.dll: 这个工具通常位于Hadoop安装目录的bin子目录下，并且需要配置环境变量以便系统能够找到它。 **hadoop.dll** 是一个动态链接库文件，它包含了Hadoop在Windows系统中运行所需的特定功能。这个文件通常与winutils.exe...

Hadoop.chm HadoopAPI Hadoop英文版最新API: Hadoop的子项目及其后续项目所用的名称也与其本身的功能多数相关，通常以动物的名字。一些小的组件，名称通常具有很好的描述性。比如：jobtracker是用于跟踪MapReduce作业的。从零开始构建一个网络搜索引擎是一个很...

Hadoop在互联网企业中的应用案例；集成各个子项目形成企业级数据分析平台；Hadoop与机器学习: 通过集成各个子项目（如HDFS、MapReduce、Mahout、MLLib等），企业可以构建起一个高效的数据分析平台，实现从数据采集、存储、处理到分析的全流程自动化。未来，随着技术的不断进步和发展，Hadoop及其生态系统将在更...

hadoop笔记2.pdf: 2005年，Hadoop作为Nutch的子项目被引入Apache基金会。2006年，MapReduce和NDFS成为Hadoop项目的一部分，Hadoop正式诞生。 **Hadoop的主要发行版本** Hadoop的三个主要发行版本包括Apache、Cloudera、Hortonworks...

winutils+hadoop.dll+eclipse插件（hadoop2.7）: 2. 设置环境变量`HADOOP_HOME`指向Hadoop的安装目录，并将`%HADOOP_HOME%\bin`添加到系统`PATH`变量中，以便命令行能识别`winutils.exe`。 3. 验证配置是否成功，可以在命令行输入`winutils.exe help`，如果返回帮助...

hadoop的项目开发，基于java.zip: 本项目以"人工智能-hadoop"为主题，显然旨在利用Hadoop的分布式能力来处理与人工智能相关的数据。Java作为Hadoop的主要编程语言，是进行Hadoop项目开发的基础。接下来，我们将深入探讨Hadoop、Java在人工智能中的...

Hadoop大数据期末考试重点: 13. **Windows上的Hadoop开发环境**：在Windows上开发HDFS项目，必须设置Hadoop开发环境，否则会出现错误。 14. **MapReduce的定义**：MapReduce是Hadoop的核心组件，提供了一种并行处理大数据的计算模型。 15. **...

【Hadoop项目】全国各省市酒店数据的分析与处理: 2. 数据导入：使用Hadoop的HDFS命令将酒店数据上传到分布式文件系统。 3. 编写MapReduce程序：根据需求设计Map函数和Reduce函数，实现数据的过滤、分组和聚合。 4. 编译和测试：在本地环境或小型集群上编译和测试...

各个版本Hadoop，hadoop.dll以及winutils.exe文件下载大合集: `winutils.exe`通常位于Hadoop安装目录的`bin`子目录下，对于配置Hadoop环境和执行Hadoop命令至关重要。在压缩包`winutils-master`中，我们可以推测这可能是一个包含`winutils.exe`源码的项目，或者是对Windows...

Hadoop (2.X版本) 管理与开发: 随着技术发展，Hadoop成为了Apache的顶级项目，并在2005年秋天作为Nutch的子项目正式加入Apache基金会，进而快速发展成为一个强大的开源框架。本文档还提到了用于搭建Hadoop环境的介质和工具，如虚拟机管理器...

大数据系列-Hadoop 2.0: 0104 实战应用可能涵盖了如何在实际项目中部署和使用Hadoop 2.0，包括数据导入导出、查询分析、容错处理等具体操作。六、进阶学习 0103 高级Hadoop 2.x、0102 深入Hadoop 2.x这两部分可能涉及更深层次的Hadoop技术...

Hadoop源码分析完整版共55章: - **Hadoop生态系统**：Hadoop不仅包括HDFS和MapReduce两大核心组件，还包括了其他多个重要的子项目和技术，形成了一个完整的生态系统。 - **包结构及依赖**：Hadoop的包结构非常复杂，这主要归因于HDFS提供了统一的...

hadoop2.7.5 在windows下需要的hadoop.dll winutils.exe等文件(bin目录): 将这些文件放入Hadoop安装目录的`bin`子目录下，通常是`C:\hadoop\bin`，这样Hadoop就可以正确地找到并执行这些工具。在`bin`目录下还有其他几个重要的命令脚本，如`yarn.cmd`、`hadoop.cmd`、`hdfs.cmd`和`mapred...

大数据运维技术第2章 Hadoop平台安装课件.pptx: 2006年2月，MapReduce和HDFS（NDfs重新命名为HDFS）成为Lucene的一个子项目，称为Hadoop，Apache Hadoop项目正式启动。 1.1.2 Hadoop生态圈 Hadoop生态圈广义上来说，是指大数据的一个生态圈，包括很多软件框架。...

深入理解Hadoop.第2版: MapReduce则是Hadoop的并行计算模型，它将大型任务分解为小的子任务并行处理，然后将结果合并。Map阶段处理输入数据，Reduce阶段整合中间结果。书中会详细解析MapReduce的工作流程、编程模型，以及优化MapReduce作业...

hadoop实验+作业.zip: 这个"hadop实验+作业.zip"文件显然包含了一些与Hadoop相关的实验和作业资料，可能是某个课程或培训项目的材料。以下是对这些知识点的详细解释：一、Hadoop概述 Hadoop是由Apache软件基金会开发的一个开源框架，它...

本地调试所需hadoop包，hadoop-common-bin-master，winutils.exe: Hadoop Common就是这些组件的基础，它提供了一套跨所有Hadoop子项目的共享实用程序和库。 “hadoop.rar”这个文件很可能是Hadoop的二进制发行版，包含了运行Hadoop所需的JAR文件和其他资源。用户可以通过解压这个...

Global site tag (gtag.js) - Google Analytics