`

Hive安装与配置——深入浅出学Hive

    博客分类:
  • hive
 
阅读更多

Hadoop环境介绍
•Hadoop安装路径
•/home/test/Desktop/hadoop-1.0.0/
•Hadoop 元数据存放目录
•/home/test/data/core/namenode
•Hadoop 数据存放路径
•/home/test/data/core/datanode
Hive环境规划
•Hive安装路径
•/home/test/Desktop/
•Hive数据存放路径
•hdfs
•/user/hive/warehouse
•Hive元数据
•第三方数据库
•derby mysql
软件准备
•OS
•ubuntu
•JDK
•java 1.6.0_27
•Hadoop
•hadoop-1.0.0.tar
•Hive
•hive-0.8.1.tar
第二部分:Hive项目介绍
项目结构
 
Hive配置文件介绍
•hive-site.xml      hive的配置文件
•hive-env.sh        hive的运行环境文件
•hive-default.xml.template  默认模板
•hive-env.sh.template     hive-env.sh默认配置
•hive-exec-log4j.properties.template   exec默认配置
• hive-log4j.properties.template log默认配置
hive-site.xml
< property>
  <name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
  <description>JDBC connect string for a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
  <description>Driver class name for a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
   <description>username to use against metastore database</description>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
   <value>test</value>
   <description>password to use against metastore database</description>
</property>
  
hive-env.sh
•配置Hive的配置文件路径
•export HIVE_CONF_DIR= your path
•配置Hadoop的安装路径
•HADOOP_HOME=your hadoop home
第三部分:使用Derby数据库的安装方式
什么是Derby安装方式
•Apache Derby是一个完全用java编写的数据库,所以可以跨平台,但需要在JVM中运行
•Derby是一个Open source的产品,基于Apache License 2.0分发
•即将元数据存储在Derby数据库中,也是Hive默认的安装方式
 安装Hive
•解压Hive
•tar zxvf  hive-0.8.1.tar  /home/test/Desktop
•建立软连接
•ln –s hive-0.8.1 hive
•添加环境变量
•export HIVE_HOME=/home/test/Desktop/hive
•export PATH=….HIVE_HOME/bin:$PATH:.
配置Hive
•进入hive/conf目录
•依据hive-env.sh.template,创建hive-env.sh文件
•cp  hive-env.sh.template hive-env.sh
•修改hive-env.sh
•指定hive配置文件的路径
•export HIVE_CONF_DIR=/home/test/Desktop/hive/conf
•指定Hadoop路径
• HADOOP_HOME=/home/test/Desktop/hadoop  
hive-site.xml
<property>
  <name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:derby:;databaseName=metastore_db;create=true</value>
  <description>JDBC connect string for a JDBC metastore</description>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionDriverName</name>
  <value>org.apache.derby.jdbc.EmbeddedDriver</value>
  <description>Driver class name for a JDBC metastore</description>
</property>
<property>
  <name>javax.jdo.option.ConnectionUserName</name>
  <value>APP</value>
  <description>username to use against metastore database</description>
</property>
 
<property>
  <name>javax.jdo.option.ConnectionPassword</name>
  <value>mine</value>
  <description>password to use against metastore database</description>
</property>
 
启动Hive
•命令行键入
•Hive
•显示
WARNING: org.apache.hadoop.metrics.jvm.EventCounter is deprecated. Please use org.apache.hadoop.log.metrics.EventCounter in all the log4j.properties files.
Logging initialized using configuration in jar:file:/home/test/Desktop/hive-0.8.1/lib/hive-common-0.8.1.jar!/hive-log4j.properties
Hive history file=/tmp/test/hive_job_log_test_201208260529_167273830.txt
hive>
测试语句
•建立测试表test
•create table test  (key string);
•show tables;
 
 
第四部分:使用MySQL数据库的安装方式
安装MySQL
•Ubuntu 采用apt-get安装
•sudo apt-get install mysql-server
•建立数据库hive
•create database hive 
•创建hive用户,并授权
•grant all on hive.* to hive@'%'  identified by 'hive';  
•flush privileges;  
 
安装Hive
•解压Hive
•tar zxvf  hive-0.8.1.tar  /home/test/Desktop
•建立软连接
•ln –s hive-0.8.1 hive
•添加环境变量
•export HIVE_HOME=/home/test/Desktop/hive
•export PATH=….HIVE_HOME/bin:$PATH:.
修改hive-site.xml
<property> 
   <name>javax.jdo.option.ConnectionURL </name> 
   <value>jdbc:mysql://localhost:3306/hive </value> 
</property> 
 
<property> 
   <name>javax.jdo.option.ConnectionDriverName </name> 
   <value>com.mysql.jdbc.Driver </value> 
</property>
<property> 
   <name>javax.jdo.option.ConnectionPassword </name> 
   <value>hive </value> 
</property> 
 
<property> 
   <name>hive.hwi.listen.port </name> 
   <value>9999 </value> 
   <description>This is the port the Hive Web Interface will listen on</descript ion> 
</property> 
<property> 
   <name>datanucleus.autoCreateSchema </name> 
   <value>false </value> 
</property> 
 
<property> 
   <name>datanucleus.fixedDatastore </name> 
   <value>true </value> 
</property> 
<property> 
         <name>hive.metastore.local </name> 
         <value>true </value> 
        <description>controls whether to connect to remove metastore server or open a new metastore server in Hive Client JVM</description> 
</property> 
启动Hive
•命令行键入
•Hive
•显示
WARNING: org.apache.hadoop.metrics.jvm.EventCounter is deprecated. Please use org.apache.hadoop.log.metrics.EventCounter in all the log4j.properties files.
Logging initialized using configuration in jar:file:/home/test/Desktop/hive-0.8.1/lib/hive-common-0.8.1.jar!/hive-log4j.properties
Hive history file=/tmp/test/hive_job_log_test_201208260529_167273830.txt
hive>
测试语句
•建立测试表test
•create table test (key string);
•show tables;
 
0
4
分享到:
评论

相关推荐

    Java私塾:Hive Shell 基本操作——深入浅出学Hive

    **Java私塾:深入浅出学Hive——Hive Shell基本操作** 在大数据处理领域,Apache Hive 是一种基于 Hadoop 的数据仓库工具,它允许用户使用 SQL 类似的查询语言(HiveQL)来管理和处理存储在 HDFS 上的大量数据。...

    Hive_优化——深入浅出学Hive

    【Hive 优化——深入浅出学 Hive】 在大数据领域,Hive 是一个不可或缺的工具,主要用于数据仓库和商业智能(BI)分析。虽然它的主要操作是通过 SQL 进行,但理解其内部原理和优化策略对于提升集群执行效率至关重要...

    深入浅出 Hive

    【深入浅出 Hive】 Hive 是一款基于 Hadoop 的数据仓库工具,它的主要目标是提供对大规模分布式存储在 HDFS 上的数据集进行便捷的查询和分析能力。Hive 提供了类 SQL 的查询语言——HiveQL(HQL),使得熟悉 SQL 的...

    王家林hive学习资料

    课程特色在于理论与实践相结合,通过深入浅出的讲解和动手实操,让学员能够全面理解Hive的内部机制。课程内容包括Hadoop的四大核心技术——HDFS、MapReduce、HBase和Hive,以及Hive集群的搭建、管理和监控。此外,...

    Hive编程指南

    《Hive编程指南》作为市场上第一本专门针对Hive的图书,深入浅出地介绍了Hive的核心概念、设计原理以及实际操作技巧,旨在帮助读者掌握在Hadoop生态系统中运用Hive进行大数据处理的能力。 Hive是Apache软件基金会的...

    Apache Hive Essentials

    Apache Hive Essentials是一本旨在帮助数据挖掘工程师快速上手并掌握Hive使用...书籍深入浅出地介绍了Hive的基本概念、使用方法和性能优化技术,使读者能够有效地利用Hive在大数据场景下进行数据仓库的管理和分析工作。

    清华大学精品大数据实战课程(Hadoop、Hbase、Hive、Spark)PPT课件含习题(30页) 第4章 数据仓库工具Hi

    这门课程深入浅出地介绍了大数据处理技术,包括Hadoop、Hbase、Hive以及Spark,并且提供了丰富的PPT课件,内含习题,共计30页,旨在帮助学习者掌握大数据领域的核心概念和实际操作。 Hadoop是大数据处理的基础框架...

    《大数据日知录——架构与算法》PDF版本下载.txt

    通过对以上内容的介绍,我们可以看到,《大数据日知录——架构与算法》这本书涵盖了大数据处理的各个方面,不仅深入浅出地介绍了大数据的基本概念和技术框架,还探讨了许多前沿的算法应用案例。对于希望深入了解...

    H3C认证大数据平台工程师(H3CNE-DataEngine)-学习书

    这本书籍深入浅出地讲解了大数据的理论基础、关键技术以及实际应用,为学习者提供了全面的学习路径。 一、大数据基础理论 大数据的基础理论包括数据的定义、特点、来源以及数据的价值。在这一部分,你会了解到...

    Hadoop权威指南(第2版)-周敏奇.zip

    《Hadoop权威指南》是大数据领域的一本经典著作,作者周敏奇在第二版中深入浅出地介绍了Hadoop生态系统的核心技术和应用实践。Hadoop是一个开源的分布式计算框架,最初由Apache软件基金会开发,旨在处理和存储大规模...

    Hadoop权威指南(中文版)(带书签)

    《Hadoop权威指南》是大数据领域的一本经典之作,它深入浅出地介绍了Hadoop及其生态系统的核心技术。这本书中文版的出现,对于国内学习者来说,无疑提供了更便捷的阅读途径,尤其是配合书签功能,使得查找和学习相关...

    Hadoop权威指南(中文版-带目录索引).zip

    《Hadoop权威指南》是大数据领域的一本经典著作,它深入浅出地介绍了Apache Hadoop这一分布式计算框架的方方面面。这本书对于理解Hadoop的核心概念、架构以及如何在实际项目中运用具有极大的指导价值。以下是对这...

    Hadoop实战中文版

    《Hadoop实战中文版》这本书深入浅出地介绍了大数据处理技术的核心组件——Hadoop生态系统,包括HBase、MapReduce、Hive和Pig等。这些技术是当今数据处理领域的基石,广泛应用于各种规模的企业和组织中,用于存储、...

    hadoop权威指南

    《Hadoop权威指南》是大数据领域的一本经典著作,它深入浅出地介绍了Apache Hadoop这一开源分布式计算框架。Hadoop是由Apache软件基金会开发的,主要用于处理和存储大量数据,尤其适合那些不适合在单机或传统关系型...

    hadoop for dummies

    这本书深入浅出地介绍了Hadoop的起源、全球数据增长的现状以及该平台的实际应用场景。通过本书,读者可以系统地学习Hadoop的核心组件和分布式框架,并了解如何将Hadoop应用于结构化数据。 在“Getting Started With...

    hadoop权威指南第四版高清

    《Hadoop权威指南》第四版是大数据领域里一本极为重要的参考书籍,它深入浅出地介绍了Apache Hadoop生态系统的核心技术和应用。Hadoop是开源的分布式计算框架,它为大规模数据处理提供了可靠、可扩展的解决方案。这...

    hadoop自学书籍汇总

    2. "Hadoop in Action":这本书由Chuck Lam和Manning Publications共同创作,通过实例深入浅出地讲解了如何使用Hadoop解决实际问题。 3. "Learning Hadoop":适合初学者,覆盖了Hadoop生态系统的基础知识,包括HDFS...

    Hadoop权威指南 第四版 英文版 Hadoop_The Definitive Guide 4th Edition

    这本书深入浅出地介绍了Hadoop生态系统的核心组件和技术,为读者提供了全面了解和掌握Hadoop所需的知识。 Hadoop是Apache软件基金会开发的一个开源分布式计算框架,基于Java实现,主要用于处理和存储海量数据。其...

Global site tag (gtag.js) - Google Analytics