- 浏览: 114770 次
- 性别:
- 来自: 北京
-
文章分类
- 全部博客 (109)
- hive (5)
- web (1)
- spring (7)
- struts2 (1)
- s2sh (2)
- mysql (3)
- hadoop (31)
- hbase (6)
- java (8)
- ubuntu (8)
- pig (2)
- Interview (2)
- zookeeper (1)
- system (1)
- 遥控 (1)
- linux (3)
- myeclipse (2)
- Oracle (1)
- redis (9)
- ibatis (2)
- 架构 (2)
- 解析xml (1)
- autoProxy (0)
- jedis (6)
- http://www.infoq.com/cn/articles/tq-redis-copy-build-scalable-cluster (1)
- xmemcached (1)
- 图片服务器 (1)
- 对象池 (0)
- netty (1)
最新评论
-
laoma102:
已经不好使了,能找到最新的吗
spring官方文档 -
di1984HIT:
不错,。不错~
pig安装
http://www.tbdata.org/archives/1019
发表评论
-
mapreduce Bet
2012-04-11 15:00 924import java.io.IOException; imp ... -
hadoop 输出格式
2012-04-05 17:18 729http://blog.csdn.net/dajuezhao/ ... -
hadoop mapreduce 原理
2012-03-31 16:14 699http://www.cnblogs.com/forfutur ... -
hadoop搭建问题
2012-03-30 13:23 810file:///E:/hadoop/搭建/hadoop集群搭建 ... -
hadoop输出文件格式
2012-03-26 10:09 658http://apps.hi.baidu.com/share/ ... -
hadoop 学习
2012-03-26 09:48 658http://hi.baidu.com/shuyan50/bl ... -
hadoop提高性能建议
2012-03-22 22:40 686http://langyu.iteye.com/blog/91 ... -
hadoop例子
2012-03-22 22:09 736http://www.hadoopor.com/thread- ... -
hadoop
2012-04-25 13:16 754精通HADOOP http://blog.csdn.net/ ... -
Hadoop Hive与Hbase整合
2012-03-07 15:02 362http://www.open-open.com/lib/vi ... -
Hadoop MapReduce操作MySQL
2012-03-05 17:33 894http://www.javabloger.com/artic ... -
hadoop hdfs常用操作类
2012-03-05 10:03 1962import java.io.IOException; ... -
hdfs 操作类自己的
2012-03-02 17:57 562package operateFile; import ... -
hadoo 文件常用操作
2012-03-02 15:53 779http://www.360doc.com/content/1 ... -
Mapper,Reducer,Wrapper的Java模板
2012-03-02 08:24 1118http://www.easyigloo.org/?p=114 ... -
hadoop基础知识
2012-03-02 08:00 744http://www.blogjava.net/killme2 ... -
hadoop 自己封装的接口
2012-04-25 13:16 695http://www.360doc.com/content/1 ... -
HadoopFileUtil
2012-03-01 14:42 1840import java.io.File; import jav ... -
hadoop ExtendedFileUtil
2012-03-01 14:34 1056在Hadoop编写生产环境的任务时,定义以下任务,要求是相同的 ... -
hadoop StringUtil
2012-03-01 14:33 863import java.util.*; public cla ...
相关推荐
在本案例中,我们关注的是`presto-hive-hadoop1-0.65.zip`,这是一个针对Apache Hadoop 1.x版本的Presto Hive连接器。 Presto的设计目标是解决大数据查询的延迟问题,它采用了MPP(Massively Parallel Processing)...
在大数据处理领域,Hive、Hadoop和Spark是三个至关重要的组件。它们分别扮演着不同的角色,共同构建了高效的数据处理框架。本文将深入探讨如何对这三个组件进行优化,以提高大数据处理的效率和性能。 首先,让我们...
Hive SQL是Hadoop生态系统中的一个重要组件,它提供了一种SQL-like的接口来查询存储在HDFS或者其他Hadoop兼容存储系统上的大规模数据。Hive SQL的语法在很大程度上与标准SQL兼容,但为了处理分布式计算和大数据环境...
* Hive:是一个基于 Hadoop 的数据仓库工具,提供了 SQL -like 的查询语言。 * Pig:是一个基于 Hadoop 的数据处理工具,提供了高级的数据处理语言。 Hadoop 的源代码分析可以帮助开发者更好地理解 Hadoop 的架构和...
《深入解析Hive 1.2.2源代码》 Hive是Apache软件基金会开发的一个数据仓库工具,它允许用户使用SQL(HQL)查询、管理、分析存储在Hadoop中的大规模数据集。Hive 1.2.2是其历史版本之一,尽管现在已经有更新的版本...
在大数据处理领域,Hive是一个不可或缺的工具,它是一个基于Hadoop的数据仓库系统,用于处理和分析大规模数据集。Hive提供了SQL(HiveQL)接口,使得非Java背景的用户也能轻松地对存储在Hadoop分布式文件系统(HDFS...
1. `hive-exec-1.3.0.jar`:这是Hive执行引擎的主要库,包含执行HQL查询所需的类和功能,如解析器、编译器和优化器等。 2. `hive-metastore-1.3.0.jar`:这个文件包含了Hive元数据存储的相关类,元数据包括表结构、...
3. **获取 Hive 源码或可执行代码**: - 可以从 Apache 官方网站下载 Hive 的二进制发行版,例如使用 `wget` 命令下载:`wget http://www.apache.org/dist/hadoop/hive/hive-0.5.0/hive-0.5.0-bin.tar.gz` - 解压...
这可能涉及解析SQL,生成相应的Thrift请求,并通过网络发送到Hive服务器。 6. **错误处理和调试**:在VC中处理Hive的错误和异常是必不可少的,需要编写合适的错误处理代码,以便在出现网络问题、语法错误或数据不...
在大数据处理领域,Hive作为一个基于Hadoop的数据仓库工具,被广泛用于结构化数据的查询、分析和存储。为了满足特定的业务需求,Hive提供了用户定义函数(UDF)的功能,允许用户自定义处理数据的逻辑。在这个“hive-...
源码中的 `org.apache.hadoop.hive.ql.metadata.Partition` 类表示分区,`org.apache.hadoop.hive.ql.plan.CreateTableDesc` 中定义了如何创建分区的规则。 5. **MapReduce 与 Tez 执行引擎** Hive 默认使用 ...
根据提供的文件信息,以下是有关Hadoop入门进阶课程中Hive介绍和安装部署的知识点: 1. Hive介绍: - Hive是Facebook开发的数据仓库工具,运行于Hadoop集群之上。 - 提供类SQL的HQL(Hive Query Language)查询...
首先,Hive是基于Hadoop的数据仓库工具,它允许通过SQL-like语言(HQL)对存储在HDFS上的大规模数据进行查询和分析。Hive的主要设计理念是将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,极大地降低了大...
《Hadoop权威指南》是Hadoop领域的经典著作,旨在深入解析这一分布式计算框架的核心概念、工作原理以及实际应用。书中包含了大量的示例代码,帮助读者理解Hadoop的使用方法和最佳实践。这些示例代码覆盖了Hadoop生态...
删除hive-exec与hadoop-common的maven依赖,使得项目更加的轻量级。 重构项目代码,优化解析,修复无字段血缘时,不能获取表血缘的BUG。 规范化接口输入输出,血缘图均为自定义实体,方便进行JSON序列化。 新增接口...
案例可能包含通过命令行或者Hadoop API进行这些操作的实例代码。 4. **Web日志分析**:分析网站服务器日志可以提供用户行为、流量来源等有价值信息。使用Hadoop进行日志分析,可以快速处理大量日志数据,找出访问...
### Hadoop、HBase、Hive 相关面试知识点解析 #### 1. HBase与Hive的关系 **知识点解析:** HBase 和 Hive 是两种不同的大数据存储与处理技术,但它们之间存在一定的互补关系。 - **HBase**:是一个分布式的、...
3. **获取 Hive 源码或可执行代码**:可以通过下载最新的发布包或从 Git 仓库克隆源代码。 4. **配置 Hive**:设置 Hive 如何连接到 Hadoop 和数据库。 5. **启动 Hive**:成功配置后,可以通过命令行界面启动 Hive...
5. **Hadoop生态**:Hadoop生态还包括许多其他项目,如Hive(基于SQL的查询工具)、Pig(高级数据流语言)、Spark(快速、通用的大数据处理引擎)、HBase(NoSQL数据库)、Oozie(工作流调度系统)等,它们共同构建...
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。(1)解析器(SQL Parser):将SQL字符串转换成抽象语法树AST,这一步一般都用第三方工具库完成,比如antlr;对AST...