Hive的meta数据支持以下三种存储方式,其中两种属于本地存储,一种为远端存储。远端存储比较适合生产环境。Hive官方wiki详细介绍了这三种方式,链接为:Hive Metastore。
这种方式是最简单的存储方式,只需要在hive-site.xml做如下配置便可
- <?xml version="1.0"?>
- <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
- <configuration>
- <property>
- <name>javax.jdo.option.ConnectionURL</name>
- <value>jdbc:derby:;databaseName=metastore_db;create=true</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionDriverName</name>
- <value>org.apache.derby.jdbc.EmbeddedDriver</value>
- </property>
- <property>
- <name>hive.metastore.local</name>
- <value>true</value>
- </property>
- <property>
- <name>hive.metastore.warehouse.dir</name>
- <value>/user/hive/warehouse</value>
- </property>
- <property>
- <name>hive.metastore.warehouse.dir</name>
- <value>/user/hive/warehouse</value>
- </property>
- </configuration>
注:使用derby存储方式时,运行hive会在当前目录生成一个derby文件和一个metastore_db目录。这种存储方式的弊端是在同一个目录下同时只能有一个hive客户端能使用数据库,否则会提示如下错误
- hive> show tables;
- FAILED: Error in metadata: javax.jdo.JDOFatalDataStoreException: Failed to start database 'metastore_db', see the next exception for details.
- NestedThrowables:
- java.sql.SQLException: Failed to start database 'metastore_db', see the next exception for details.
- FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask
二、本地mysql
这种存储方式需要在本地运行一个mysql服务器,并作如下配置(下面两种使用mysql的方式,需要将mysql的jar包拷贝到$HIVE_HOME/lib目录下)。
- <?xml version="1.0"?>
- <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
- <configuration>
- <property>
- <name>hive.metastore.warehouse.dir</name>
- <value>/user/hive_remote/warehouse</value>
- </property>
- <property>
- <name>hive.metastore.local</name>
- <value>true</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionURL</name>
- <value>jdbc:mysql://localhost/hive_remote?createDatabaseIfNotExist=true</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionDriverName</name>
- <value>com.mysql.jdbc.Driver</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionUserName</name>
- <value>hive</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionPassword</name>
- <value>password</value>
- </property>
- </configuration>
三、远端mysql
这种存储方式需要在远端服务器运行一个mysql服务器,并且需要在Hive服务器启动meta服务。
这一种适合线上生产环境
这里用mysql的测试服务器,ip位192.168.1.214,新建hive_remote数据库,字符集位latine1
- <?xml version="1.0"?>
- <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
- <configuration>
- <property>
- <name>hive.metastore.warehouse.dir</name>
- <value>/user/hive/warehouse</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionURL</name>
- <value>jdbc:mysql://192.168.1.214:3306/hive_remote?createDatabaseIfNotExist=true</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionDriverName</name>
- <value>com.mysql.jdbc.Driver</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionUserName</name>
- <value>hive</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionPassword</name>
- <value>password</value>
- </property>
- <property>
- <name>hive.metastore.local</name>
- <value>false</value>
- </property>
- <property>
- <name>hive.metastore.uris</name>
- <value>thrift://192.168.1.188:9083</value>
- </property>
- </configuration>
注:这里把hive的服务端和客户端都放在同一台服务器上了。
服务端和客户端可以拆开,将hive-site.xml配置文件拆为如下两部分
1)、服务端配置文件
- <?xml version="1.0"?>
- <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
- <configuration>
- <property>
- <name>hive.metastore.warehouse.dir</name>
- <value>/user/hive/warehouse</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionURL</name>
- <value>jdbc:mysql://192.168.1.214:3306/hive_remote?createDatabaseIfNotExist=true</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionDriverName</name>
- <value>com.mysql.jdbc.Driver</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionUserName</name>
- <value>root</value>
- </property>
- <property>
- <name>javax.jdo.option.ConnectionPassword</name>
- <value>test1234</value>
- </property>
- </configuration>
2)、客户端(需要有hadoop环境)配置文件
- <?xml version="1.0"?>
- <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
- <configuration>
- <property>
- <name>hive.metastore.local</name>
- <value>false</value>
- </property>
- <property>
- <name>hive.metastore.uris</name>
- <value>thrift://192.168.1.188:9083</value>
- </property>
- </configuration>
启动hive服务端程序
- $ bin/hive --service metastore
客户端直接使用hive命令即可
- root@my188:~$ hive
- Hive history file=/tmp/root/hive_job_log_root_201301301416_955801255.txt
- hive> show tables;
- OK
- test_hive
- Time taken: 0.736 seconds
- hive>
相关推荐
hive metastore是hive的元数据管理服务,实际应用中很多第三方框架需要访问metastore服务,如spark,impala等。同样hive metastore也提供了java接口。 使用 import org.apache.hadoop.hive.conf.HiveConf; import org...
总结起来,将Hive metastore迁移到达梦数据库涉及创建数据库用户和表空间、修改Hive配置文件以及初始化元数据等步骤。这个过程不仅可以提升元数据管理的性能,还可以利用达梦数据库的特性来增强数据安全性。然而,...
了解Hive Metastore的工作原理有助于我们优化Hive性能,例如,合理配置Metastore的缓存策略可以减少元数据的查询延迟;定期清理无用的元数据可以节省存储空间;选择合适的元数据库类型(如MySQL、PostgreSQL)可以...
在这个配置中,我们将介绍如何配置 Hive 客户端与 Hive 服务器的连接,包括远程 MySQL 和远程存储 metastore 的配置。 Hive 客户端配置 在 Hive 客户端配置中,我们需要配置 Hive 客户端连接到远程 metastore ...
通过这种方式,我们可以利用systemd的管理系统来更方便地控制HiveServer2和Metastore服务的启停,提高了运维效率。此外,这种方法还可以与其他systemd服务集成,实现更复杂的自动化流程。 总结一下,本文介绍了如何...
在这篇文章中,我们将详细介绍如何配置Hive环境,包括安装Hive、配置Hadoop环境、配置Hive Metastore数据库等步骤。同时,我们还将使用Xshell6工具来远程连接到Hive服务器,并学习如何使用Hive命令行工具来执行查询...
6. Hive的配置包括设置Hive Metastore服务,它负责管理Hive数据库的元数据信息。Metastore可以配置为使用内嵌的Derby数据库或者MySQL、PostgreSQL这样的外部数据库。如果选择MySQL,需要进行连接配置并初始化数据库...
- 在 `hive-site.xml` 文件中,配置 Hive 的各种属性,如 Metastore 数据库连接信息、HDFS 存储位置等。例如: ```xml <name>hive.metastore.uris <value>thrift://localhost:9083 <name>hive.metastore....
需要导入hive运行所需的jar包,导入jar包有两种方式可实现 1.使用maven依赖直接修改配置文件,以下为配置内容:(不推荐,会下载额外很多无用包,而且时间很长在1小时左右) 2.挑选必须的jar包,编辑成自己的lib...
背景:由于Hive需要开启权限管理,安装网上教程,开启权限配置,重启集群后。 使用root用户登录,进入Hive命令行界面。 执行 create database test; 发现报错: Authorization failed:No privilege 'Create' found ...
通过本文,我们了解了Hive的三种元数据存储方式——内嵌Derby方式、Local方式和Remote方式,并详细介绍了每种方式的配置步骤及注意事项。对于不同的应用场景,可以选择合适的方式来搭建Hive环境。内嵌Derby方式适用...
在HBase中查询数据可以通过`Get`和`Scan`两种方式实现。 - **使用Get**:当已知行键时,可以直接获取指定的数据。 - **使用Scan**:当需要扫描表中的一部分或全部数据时,可以使用Scan。 示例代码如下: ```java ...
这篇博客主要探讨了Hive的三种启动方式及其用途,这对于我们理解如何有效管理和操作Hive系统至关重要。 1. **独立模式(Standalone Mode)** 在独立模式下,Hive运行在本地模式,不与任何Hadoop集群交互。这种模式...
logger.HiveMetaStore.name = org.apache.hadoop.hive.metastore.HiveMetaStore.audit logger.HiveMetaStore.level = INFO logger.HiveMetaStore.appenderRef.all.ref = DRFB ``` 5. **找到配置文件**: 默认...
### 三、配置Hive 修改`/usr/local/hive/conf/hive-env.sh`文件,设置Hive的相关环境变量: 1. **HADOOP_HOME**:指向你的Hadoop安装目录。 2. **HIVE_CONF_DIR**:Hive配置文件的路径,通常是`/usr/local/hive/...
#### 三、使用Derby数据库的安装方式 ##### 1. Apache Derby简介 - **Apache Derby**是一个完全由Java编写的开源关系型数据库管理系统。 - **优点**: - 可以跨平台运行。 - 支持多种部署模式,如嵌入式和客户端/...
独立的Hive Metastore 该项目可在本地运行Hive Metastore,或将其嵌入到容器中。 尽管是公开的,但该项目目前尚未记录,并且可能仍承载某些基础结构特定配置。 该项目的灵感来自和多亏了他
在使用Hive时,管理员可能需要对Metastore进行一些配置和优化,例如选择合适的数据库作为后端存储、定期备份Metastore数据库、管理好连接Metastore服务的权限等。在生产环境中,确保Metastore的稳定性对整个Hive的...
* 配置HIVE环境变量 * 启动HIVE服务 使用方式: * 使用HIVE命令行工具执行查询 * 使用HIVE API开发应用程序 * 使用HIVE与其他工具集成 HIVE是一种功能强大且灵活的数据仓库工具,广泛应用于大数据分析和处理领域...
3. **配置MySQL作为Hive的Metastore** - **检查MySQL是否已安装**:使用`rpm -qa | grep -i mysql`检查是否已安装MySQL。若已安装,可以通过`rpm -qa | grep -i mysql`查看具体版本。 - **安装MySQL**:若未...