在hive-site.xml里面有两个配置选项,配置好后可以应用hive执行到hbase集群
<property>
<name>hive.aux.jars.path</name>
<value>file:///app/java/hive/lib/hive-hbase-handler-0.7.1.jar,file:///app/java/hive/lib/hbase-0.90.3.jar,file:///app/java/hive/lib/zookeeper-3.3.1.jar</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>dfsname1.cptrue.com</value>
<description>The directory shared by region servers.
</description>
</property>
Currently, we allocated mapred.child.java.opts = -Xmx455037693, we need to increase to 1G. That would be tuning number 1.
we need to increase the usage of mapred.job.reuse.jvm.num.tasks to -1. So every maps/reducers will reuse JVM instead of spanning the new ones.
用mapreduce jobtracker查看hive执行情况
http://jobtracker_server:50030/jobtracker.jsp
hbase调优
http://hbase.apache.org/book/important_configurations.html#recommended_configurations
Hadoop的运行痕迹
http://www.cnblogs.com/forfuture1978/archive/2010/11/23/1884967.html
hive udaf 函数库 例子
http://blog.chinaunix.net/uid-9460004-id-3264684.html
http://www.cloudera.com/blog/2010/06/integrating-hive-and-hbase/
https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration
https://cwiki.apache.org/confluence/display/Hive/StorageHandlers
https://cwiki.apache.org/confluence/display/Hive/GettingStarted
http://blog.csdn.net/hguisu/article/details/7282050
http://running.iteye.com/blog/898399
http://newitfarmer.com/bbs/
http://developer.yahoo.com/blogs/hadoop/posts/2010/08/pig_and_hive_at_yahoo/
http://www.cnblogs.com/OnlyXP/archive/2009/10/14/1583450.html
http://www.cnblogs.com/harrychinese/archive/2011/03/13/some_hadoop_hive_intro_articles.html
http://www.antlr.org/
https://issues.apache.org/jira/secure/attachment/12413737/hive_benchmark_2009-07-12.pdf
http://en.wikipedia.org/wiki/Directed_acyclic_graph
分享到:
相关推荐
在大数据领域,构建一个完整的生态系统是至关重要的,其中包括多个组件,如Hadoop、Spark、Hive、HBase、Oozie、Kafka、Flume、Flink、Elasticsearch和Redash。这些组件协同工作,提供了数据存储、处理、调度、流...
毕业设计基于hadoop+hive+hbase+echarts的招聘信息大数据分析平台源码+论文PDF(高分毕设)毕业设计基于hadoop+hive+hbase+echarts的招聘信息大数据分析平台源码+论文PDF(高分毕设)毕业设计基于hadoop+hive+hbase+...
毕业设计基于hadoop+hive+hbase+echarts的招聘信息大数据分析平台源码+文档说明(高分毕设)毕业设计基于hadoop+hive+hbase+echarts的招聘信息大数据分析平台源码+文档说明(高分毕设)毕业设计基于hadoop+hive+...
### Centos+Hadoop+Hive+HBase 环境搭建详解 #### 一、Centos基础环境搭建 ##### 1.1 软件准备 为了搭建一个基于Centos的操作系统,需要准备以下软件: - **VMware-workstation-full-8.0.4-744019.exe**:这是...
毕业设计 基于hadoop+hive+hbase+echarts的招聘信息大数据分析平台源码+详细说明+全部数据资料 高分项目.毕业设计 基于hadoop+hive+hbase+echarts的招聘信息大数据分析平台源码+详细说明+全部数据资料 高分项目. ...
jdk1.8.0_131、apache-zookeeper-3.8.0、hadoop-3.3.2、hbase-2.4.12 mysql5.7.38、mysql jdbc驱动mysql-connector-java-8.0.8-dmr-bin.jar、 apache-hive-3.1.3 2.本文软件均安装在自建的目录/export/server/下 ...
spark练习2 hadoop+hive+hbase
HDFS+MapReduce+Hive+HBase十分钟快速入门.pdf
HDFS+MapReduce+Hive+HBase十分钟快速入门,包括这几个部分的简单使用
在大数据处理领域,Hadoop生态系统中的HDFS(Hadoop Distributed File System)、MapReduce、Hive和HBase是四个至关重要的组件。本资料“HDFS+MapReduce+Hive+HBase十分钟快速入门”旨在帮助初学者迅速理解这些技术...
基于Flink+ClickHouse构建的分析平台,涉及 Flink1.9.0 、ClickHouse、Hadoop、Hbase、Kafka、Hive、Jmeter、Docker 、HDFS、MapReduce 、Zookeeper 等技术
源代码主要用于学习:1. Spring Boot+Hadoop+Hive+Hbase实现数据基本操作,Hive数据源使用Alibaba DruidDataSource,以及JDBCTemplate操作数
《hadoop-HDFS+MapReduce+Hive+Hbase快速入门》,一门入门hadoop的经典书籍,相信能够给学习云计算的大家带来帮助。
标题中的“Spring Boot+Hadoop+Hive+Hbase实现数据基本操作”是一个关于大数据处理技术集成应用的项目。这个项目结合了四个重要的组件来处理和管理大规模数据: 1. **Spring Boot**: 是一个基于Java的框架,用于...
Hadoop+Hbase+Spark+Hive搭建指南 Hadoop是Apache开源的大数据处理框架,它提供了可靠的高效的数据存储和处理能力。Hbase是基于Hadoop的分布式NoSQL数据库,提供了高效的数据存储和检索能力。Spark是基于内存的数据...
### 第15章-Sqoop+Hive+Hbase+Kettle+R某技术论坛日志分析项目案例 #### 案例概述 本案例详细介绍了如何利用一系列大数据处理工具,包括Sqoop、Hive、Hbase、Kettle以及R语言,对一个技术论坛的日志数据进行分析的...