安装Hive
•解压Hive
•tar zxvf hive-0.8.1.tar /home/test/Desktop
•建立软连接
•ln –s hive-0.8.1 hive
•添加环境变量
•export HIVE_HOME=/home/test/Desktop/hive
•export PATH=….HIVE_HOME/bin:$PATH:.
配置Hive
•进入hive/conf目录
•依据hive-env.sh.template,创建hive-env.sh文件
•cp hive-env.sh.template hive-env.sh
•修改hive-env.sh
•指定hive配置文件的路径
•export HIVE_CONF_DIR=/home/test/Desktop/hive/conf
•指定Hadoop路径
• HADOOP_HOME=/home/test/Desktop/hadoop
hive-site.xml
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:derby:;databaseName=metastore_db;create=true</value>
<description>JDBC connect string for a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>org.apache.derby.jdbc.EmbeddedDriver</value>
<description>Driver class name for a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>APP</value>
<description>username to use against metastore database</description>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>mine</value>
<description>password to use against metastore database</description>
</property>
•命令行键入
•Hive
•显示
WARNING: org.apache.hadoop.metrics.jvm.EventCounter is deprecated. Please use org.apache.hadoop.log.metrics.EventCounter in all the log4j.properties files.
Logging initialized using configuration in jar:file:/home/test/Desktop/hive-0.8.1/lib/hive-common-0.8.1.jar!/hive-log4j.properties
Hive history file=/tmp/test/hive_job_log_test_201208260529_167273830.txt
hive>
测试语句
•建立测试表test
•create table test (key string);
•show tables;
第四部分:使用MySQL数据库的安装方式
安装MySQL
•Ubuntu 采用apt-get安装
•sudo apt-get install mysql-server
•建立数据库hive
•create database hive
•创建hive用户,并授权
•grant all on hive.* to hive@'%' identified by 'hive';
•flush privileges;
安装Hive
•解压Hive
•tar zxvf hive-0.8.1.tar /home/test/Desktop
•建立软连接
•ln –s hive-0.8.1 hive
•添加环境变量
•export HIVE_HOME=/home/test/Desktop/hive
•export PATH=….HIVE_HOME/bin:$PATH:.
修改hive-site.xml
<property>
<name>javax.jdo.option.ConnectionURL </name>
<value>jdbc:mysql://localhost:3306/hive </value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName </name>
<value>com.mysql.jdbc.Driver </value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword </name>
<value>hive </value>
</property>
<property>
<name>hive.hwi.listen.port </name>
<value>9999 </value>
<description>This is the port the Hive Web Interface will listen on</descript ion>
</property>
<property>
<name>datanucleus.autoCreateSchema </name>
<value>false </value>
</property>
<property>
<name>datanucleus.fixedDatastore </name>
<value>true </value>
</property>
<property>
<name>hive.metastore.local </name>
<value>true </value>
<description>controls whether to connect to remove metastore server or open a new metastore server in Hive Client JVM</description>
</property>
启动Hive
•命令行键入
•Hive
•显示
WARNING: org.apache.hadoop.metrics.jvm.EventCounter is deprecated. Please use org.apache.hadoop.log.metrics.EventCounter in all the log4j.properties files.
Logging initialized using configuration in jar:file:/home/test/Desktop/hive-0.8.1/lib/hive-common-0.8.1.jar!/hive-log4j.properties
Hive history file=/tmp/test/hive_job_log_test_201208260529_167273830.txt
hive>
测试语句
•建立测试表test
•create table test (key string);
•show tables;
相关推荐
**Java私塾:深入浅出学Hive——Hive Shell基本操作** 在大数据处理领域,Apache Hive 是一种基于 Hadoop 的数据仓库工具,它允许用户使用 SQL 类似的查询语言(HiveQL)来管理和处理存储在 HDFS 上的大量数据。...
【Hive 优化——深入浅出学 Hive】 在大数据领域,Hive 是一个不可或缺的工具,主要用于数据仓库和商业智能(BI)分析。虽然它的主要操作是通过 SQL 进行,但理解其内部原理和优化策略对于提升集群执行效率至关重要...
【深入浅出 Hive】 Hive 是一款基于 Hadoop 的数据仓库工具,它的主要目标是提供对大规模分布式存储在 HDFS 上的数据集进行便捷的查询和分析能力。Hive 提供了类 SQL 的查询语言——HiveQL(HQL),使得熟悉 SQL 的...
课程特色在于理论与实践相结合,通过深入浅出的讲解和动手实操,让学员能够全面理解Hive的内部机制。课程内容包括Hadoop的四大核心技术——HDFS、MapReduce、HBase和Hive,以及Hive集群的搭建、管理和监控。此外,...
《Hive编程指南》作为市场上第一本专门针对Hive的图书,深入浅出地介绍了Hive的核心概念、设计原理以及实际操作技巧,旨在帮助读者掌握在Hadoop生态系统中运用Hive进行大数据处理的能力。 Hive是Apache软件基金会的...
Apache Hive Essentials是一本旨在帮助数据挖掘工程师快速上手并掌握Hive使用...书籍深入浅出地介绍了Hive的基本概念、使用方法和性能优化技术,使读者能够有效地利用Hive在大数据场景下进行数据仓库的管理和分析工作。
这门课程深入浅出地介绍了大数据处理技术,包括Hadoop、Hbase、Hive以及Spark,并且提供了丰富的PPT课件,内含习题,共计30页,旨在帮助学习者掌握大数据领域的核心概念和实际操作。 Hadoop是大数据处理的基础框架...
通过对以上内容的介绍,我们可以看到,《大数据日知录——架构与算法》这本书涵盖了大数据处理的各个方面,不仅深入浅出地介绍了大数据的基本概念和技术框架,还探讨了许多前沿的算法应用案例。对于希望深入了解...
这本书籍深入浅出地讲解了大数据的理论基础、关键技术以及实际应用,为学习者提供了全面的学习路径。 一、大数据基础理论 大数据的基础理论包括数据的定义、特点、来源以及数据的价值。在这一部分,你会了解到...
《Hadoop权威指南》是大数据领域的一本经典著作,作者周敏奇在第二版中深入浅出地介绍了Hadoop生态系统的核心技术和应用实践。Hadoop是一个开源的分布式计算框架,最初由Apache软件基金会开发,旨在处理和存储大规模...
《Hadoop权威指南》是大数据领域的一本经典之作,它深入浅出地介绍了Hadoop及其生态系统的核心技术。这本书中文版的出现,对于国内学习者来说,无疑提供了更便捷的阅读途径,尤其是配合书签功能,使得查找和学习相关...
《Hadoop权威指南》是大数据领域的一本经典著作,它深入浅出地介绍了Apache Hadoop这一分布式计算框架的方方面面。这本书对于理解Hadoop的核心概念、架构以及如何在实际项目中运用具有极大的指导价值。以下是对这...
《Hadoop实战中文版》这本书深入浅出地介绍了大数据处理技术的核心组件——Hadoop生态系统,包括HBase、MapReduce、Hive和Pig等。这些技术是当今数据处理领域的基石,广泛应用于各种规模的企业和组织中,用于存储、...
《Hadoop权威指南》是大数据领域的一本经典著作,它深入浅出地介绍了Apache Hadoop这一开源分布式计算框架。Hadoop是由Apache软件基金会开发的,主要用于处理和存储大量数据,尤其适合那些不适合在单机或传统关系型...
这本书深入浅出地介绍了Hadoop的起源、全球数据增长的现状以及该平台的实际应用场景。通过本书,读者可以系统地学习Hadoop的核心组件和分布式框架,并了解如何将Hadoop应用于结构化数据。 在“Getting Started With...
《Hadoop权威指南》第四版是大数据领域里一本极为重要的参考书籍,它深入浅出地介绍了Apache Hadoop生态系统的核心技术和应用。Hadoop是开源的分布式计算框架,它为大规模数据处理提供了可靠、可扩展的解决方案。这...
2. "Hadoop in Action":这本书由Chuck Lam和Manning Publications共同创作,通过实例深入浅出地讲解了如何使用Hadoop解决实际问题。 3. "Learning Hadoop":适合初学者,覆盖了Hadoop生态系统的基础知识,包括HDFS...
这本书深入浅出地介绍了Hadoop生态系统的核心组件和技术,为读者提供了全面了解和掌握Hadoop所需的知识。 Hadoop是Apache软件基金会开发的一个开源分布式计算框架,基于Java实现,主要用于处理和存储海量数据。其...