Hive安装(apache-hive-0.13.1-bin.tar.gz):
1.vi hive-env.sh
48 HADOOP_HOME=/usr/local/hadoop
51 export HIVE_CONF_DIR=/usr/local/hive/conf
2.在hdfs中添加目录
[root@master hadoop]#hdfs dfs -mkdir -p /tmp
[root@master hadoop]#hdfs dfs -mkdir -p /user/hive/warehouse
[root@master hadoop]# bin/hdfs dfs -chmod g+x /tmp
[root@master hadoop]# bin/hdfs dfs -chmod g+x /user/hive/warehouse
mysql安装:
MySQL-server-5.6.24-1.el6.x86_64.rpm、MySQL-client-5.6.24-1.el6.x86_64.rpm
1.查看是否安装mysql
# rpm -qa|grep mysql
2.安装mysql server
# rpm -ivh MySQL-server-5.6.24-1.el6.x86_64.rpm
可能报错:
file /usr/share/mysql/charsets/swe7.xml from install of MySQL-server-5.6.24-1.el6.x86_64 conflicts with file from package mariadb-libs-1:5.5.52-1.el7.x86_64
删除mariadb-libs-1:5.5.52-1.el7.x86_64:
#rpm -e --nodeps mariadb-libs-1:5.5.52-1.el7.x86_64
重新安装:
# rpm -ivh MySQL-server-5.6.24-1.el6.x86_64.rpm
安装后生成一个随机密码
#cat /root/.mysql_secret
E0HDIov6IO5leHWr
3.安装mysql client
#rpm -ivh MySQL-client-5.6.24-1.el6.x86_64.rpm
4.更改密码(改为:123456)
#mysql -uroot -pE0HDIov6IO5leHWr
mysql> SET PASSWORD=PASSWORD('123456');
Query OK, 0 rows affected (0.00 sec)
mysql> exit
更改完成、重新进入mysql
# mysql -uroot -pgsdjsj (用户名:root、密码:gsdjsj)
5.更改用户连接
mysql> use mysql;
mysql> show tables;
查看可连接用户:(只有表中用户可连接mysql)
mysql> select User,Host,Password from user;
+------+-----------+-------------------------------------------+
| User | Host | Password |
+------+-----------+-------------------------------------------+
| root | localhost | *6BB4837EB74329105EE4568DDA7DC67ED2CA2AD9 |
| root | master | *9EA1750BD72323ED75587BF130428B247DEAFD18 |
| root | 127.0.0.1 | *9EA1750BD72323ED75587BF130428B247DEAFD18 |
| root | ::1 | *9EA1750BD72323ED75587BF130428B247DEAFD18 |
+------+-----------+-------------------------------------------+
4 rows in set (0.00 sec)
设置任意用户都能连接mysql:
mysql> update user set Host='%' where User='root' and Host='localhost';
删除其余用户,并刷新:
mysql> delete from user where User='root' and Host='master';
Query OK, 1 row affected (0.00 sec)
mysql> delete from user where User='root' and Host='127.0.0.1';
Query OK, 1 row affected (0.00 sec)
mysql> delete from user where User='root' and Host='::1';
Query OK, 1 row affected (0.00 sec)
mysql> flush privileges;
Query OK, 0 rows affected (0.00 sec)
拷贝mysql驱动jar包,到Hive安装目录的lib下(附件):
# tar -zxvf mysql-connector-java-5.1.27.tar.gz
# cd mysql-connector-java-5.1.27/
# cp mysql-connector-java-5.1.27-bin.jar /usr/local/hive/lib/
配置Hive(conf):
配置hive-log4j.properties:
#mv hive-log4j.properties.template hive-log4j.properties
#vi hive-log4j.properties
hive.log.dir=/usr/local/hive/logs
配置hive-site.xml(创建hive-site.xml文件):
?xml version="1.0"?>
2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
3 <configuration>
4 <property>
5 <name>javax.jdo.option.ConnectionURL</name>
6 <value>jdbc:mysql://master:3306/metastore?createDatabaseIfNotExist=true</value>
7 <description>JDBC connect string for a JDBC metastore</description>
8 </property>
9 <property>
10 <name>javax.jdo.option.ConnectionDriverName</name>
11 <value>com.mysql.jdbc.Driver</value>
12 <description>Driver class name for a JDBC metastore</description>
13 </property>
14 <property>
15 <name>javax.jdo.option.ConnectionUserName</name>
16 <value>root</value>
17 <description>username to use against metastore database</description>
18 </property>
19 <property>
20 <name>javax.jdo.option.ConnectionPassword</name>
21 <value>123456</value>
22 <description>password to use against metastore database</description>
23 </property>
24
25 <property>
26 <name>hive.cli.print.header</name>
27 <value>true</value>
28 <description>Whether to print the names of the columns in query output.</description>
29 </property>
30
31 <property>
32 <name>hive.cli.print.current.db</name>
33 <value>true</value>
34 <description>Whether to include the current database in the Hive prompt.</description>
35 </property>
36 </configuration>
在hive目录下新建日志目录
#mkdir logs
hive常用命令:
[root@master hive]# bin/hive -help
usage: hive
-d,--define <key=value> Variable subsitution to apply to hive
commands. e.g. -d A=B or --define A=B
--database <databasename> Specify the database to use
-e <quoted-query-string> SQL from command line
-f <filename> SQL from files
-H,--help Print help information
-h <hostname> connecting to Hive Server on remote host
--hiveconf <property=value> Use value for given property
--hivevar <key=value> Variable subsitution to apply to hive
commands. e.g. --hivevar A=B
-i <filename> Initialization SQL file
-p <port> connecting to Hive Server on port number
-S,--silent Silent mode in interactive shell
-v,--verbose Verbose mode (echo executed SQL to the
console)
[root@master hive]#bin/hive -e <quoted-query-string>
eg:
bin/hive -e "select * from db_hive.student ;"
[root@master hive]# bin/hive -f <filename>
eg:
$ touch hivef.sql
select * from db_hive.student ;
$ bin/hive -f /opt/datas/hivef.sql
$ bin/hive -f /opt/datas/hivef.sql > /opt/datas/hivef-res.txt
[root@master hive]#bin/hive -i <filename>
与用户udf相互使用
在hive cli命令窗口中查看hdfs文件系统
hive (default)> dfs -ls / ;
在hive cli命令窗口中查看本地文件系统
hive (default)> !ls /opt/datas ;
hive基本操作:
show databases ;
create database db_hive ;
create table student(id int, name string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';
show tables ;
desc student ;
desc extended student ;
desc formatted student ;
//导入数据到表中
load data local inpath '/opt/datas/student.txt' into table db_hive.student ;
//查看函数
show functions ;
//查看upper函数
desc function upper ;
desc function extended upper ;
相关推荐
【大数据技术基础实验报告-Hive安装配置与应用】 在大数据处理领域,Apache Hive是一个非常重要的组件,它提供了基于Hadoop的数据仓库工具,用于数据查询、分析以及存储。本实验报告将详细阐述如何安装、配置Hive,...
hive配置 在hadoop集群搭建完成后,我们可以开始配置hive。hive是hadoop集群中的一种数据仓库,可以对hadoop集群中的数据进行查询和分析。 首先,我们需要下载hive的安装包,并将其上传到master机器的/home/hadoop...
以下是对 Hive 安装配置、常用命令及其功能的详细说明: 1. **Hive 的安装配置** - **下载与解压**:从 Apache 官方镜像站点下载稳定版本的 Hive,例如 `hive-0.7.1.tar.gz`,并将其解压到已安装 Hadoop 的主机...
hive的安装与配置
本压缩包文件"hive"可能包含了Hive安装过程中所需的配置文件,这些文件对于正确、高效地运行Hive至关重要。以下是对Hive安装配置文件的详细解释: 1. **`core-site.xml`**: 这个文件包含了Hadoop核心的配置参数,...
从提供的文件内容中,我们可以提取到关于Hive安装与配置的相关知识点,同时也包括了MySQL的安装知识,因为MySQL是Hive常用的后端数据库。接下来,我将详细介绍这些知识点。 **Hive的安装与配置** 1. Hive是一个...
本篇文章将详细介绍如何在Linux环境下安装配置Hadoop和Hive。 首先,Hadoop是一个开源的分布式计算框架,主要由Apache基金会维护,用于处理和存储海量数据。它的核心组件包括HDFS(Hadoop Distributed File System...
**hive-env.sh**文件则包含了Hive配置文件的路径以及Hadoop的安装路径,例如: ```bash # 设置Hive配置文件的路径 export HIVE_CONF_DIR=/home/test/Desktop/hive/conf # 设置Hadoop的安装路径 export HADOOP_HOME...
在本压缩包中,"文档.pdf" 和 "资料必看.zip" 可能包含了关于 Hive 安装与配置的详细步骤和指南。现在,我们将深入探讨 Hive 的安装与配置过程。 首先,安装 Hive 需要先确保你已经安装了 Hadoop 环境,因为 Hive ...
* 配置HIVE环境变量 * 启动HIVE服务 使用方式: * 使用HIVE命令行工具执行查询 * 使用HIVE API开发应用程序 * 使用HIVE与其他工具集成 HIVE是一种功能强大且灵活的数据仓库工具,广泛应用于大数据分析和处理领域...
Hive大数据开发的重要工具。Hive用于解决海量结构化日志的数据统计工具。 基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
在完成Hive配置后,需要初始化Hive的元数据存储。这一步骤通常涉及到Hive的元数据存储(例如MySQL数据库)的设置。可以使用以下命令初始化Hive元数据: ```bash schematool -initSchema -dbType ``` 这里`...
2. 修改Hive配置文件($HIVE_HOME/conf/hive-site.xml),添加以下内容: ```xml <name>javax.jdo.option.ConnectionURL <value>jdbc:derby:;databaseName=/var/lib/hive/metastore;create=true <name>...
### Hive在Linux下的安装与配置详解 #### 一、引言 Hive 是基于 Hadoop 的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,可以将 SQL 语句转换为 MapReduce 任务进行运行。...
Hive的安装过程涉及到了一系列的配置,例如配置Hive的环境变量,指定Hive使用的元数据库(在本例中是MySQL),并进行相应的环境配置和初始化。之后,就可以使用Hive的命令行工具(hive CLI)进行操作,比如创建表、...
在 MySQL 配置中,我们需要安装和配置 MySQL 服务器,以便 Hive 服务器可以连接到 MySQL 服务器。在这个例子中,我们需要卸载默认的 MySQL 服务器,然后安装新的 MySQL 服务器。接着,我们需要创建一个新的 MySQL ...
hive的安装与配置 hive的安装与配置 hive的安装与配置 hive的安装与配置 hive的安装与配置
非常全面的hive参数配置,总共有600多项,中文注释是用软件翻译的,勉强能看,引用请注明出处。