http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH5/latest/CDH5-Security-Guide/cdh5sg_sentry.html
条件:
Kerberos安全认证(使用cm配置安全认证后,hive自动也添加了认证,所以hive认证配置http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH5/latest/CDH5-Security-Guide/cdh5sg_hive_security.html可以省略)
该条件是cloudera官方文档中说明的,据了解,可以不配置kerberos安全认证,同样可以使用sentry,但试过,求试过的同学个回复
步骤:
sudo -u hdfs hdfs dfs -chmod -R 770 /user/hive/warehouse
sudo -u hdfs hdfs dfs -chown -R hive:hive /user/hive/warehouse
cm的hive配置中找到 hive.sentry.provider设置成org.apache.sentry.provider.file.LocalGroupResourceAuthorizationProvider
(如此hive将识别policy file的user group配置)
sentry-provider.ini配置。例如:
[databases]
# Defines the location of the per DB policy file for the customers DB/schema
customers = hdfs://namenode11.yeahmobi.com:8020/etc/sentry/customers.ini
-------------某个数据库权限配置
[groups]
# Assigns each Hadoop group to its set of roles
manager = analyst_role, junior_analyst_role
analyst = analyst_role
jranalyst = junior_analyst_role
customers_admin = customers_admin_role
admin = admin_role
[roles]
# The uris below define a define a landing skid which
# the user can use to import or export data from the system.
# Since the server runs as the user "hive" files in that directory
# must either have the group hive and read/write set or
# be world read/write.
analyst_role = server=server1->db=analyst1, \
server=server1->db=jranalyst1->table=*->action=select,\
server=server1->db=default->table=*->action=select,\
server=server1->db=test->table=*->action=select
junior_analyst_role = server=server1->db=jranalyst1
# Implies everything on server1 -> customers. Privileges for
# customers can be defined in the global policy file even though
# customers has its only policy file. Note that the Privileges from
# both the global policy file and the per-DB policy file
# are merged. There is no overriding.
customers_admin_role = server=server1->db=customers
# Implies everything on server1.
admin_role = server=server1
[users]
-----------------------------user group在此生效
hive = manager,customers_admin
hue = analyst
rube = analyst
qiulp= analyst
上传此文件至hdfs的某个目录项,此目录授权给hive用户hive组。
hive启用sentry
cm中找到hive hive.server2.session.hook配置为:org.apache.sentry.binding.hive.HiveAuthzBindingSessionHook
配置hive.sentry.conf.url
使用hive jdbc时,出现如下异常:
Exception in thread "main" java.sql.SQLException: Error while compiling statement: FAILED: SemanticException No valid privileges
at org.apache.hive.jdbc.Utils.verifySuccess(Utils.java:167)
at org.apache.hive.jdbc.Utils.verifySuccessWithInfo(Utils.java:155)
at org.apache.hive.jdbc.HiveStatement.execute(HiveStatement.java:210)
是权限赋值的有问题。
分享到:
相关推荐
大数据技术之CM6.3.1+CDH6.3.2配置Hue+Sentry权限管理 本文档主要介绍了CDH6.3.2配置Hue+Sentry权限管理的步骤,旨在帮助读者了解大数据技术中的权限管理机制。 一、Sentry概述 Sentry是Apache开源组件,提供了细...
1. **登录与权限问题**:有时用户无法成功登录Hue,可能是由于认证配置错误或者用户权限不足。解决方法包括检查配置文件`core-site.xml`和`hue.ini`中的认证设置,以及确保用户已添加到Hue的授权组。 2. **Hive查询...
Supervisor Process是Hue的监控进程,负责启动和管理Hue服务端。Auxiliary Processes是Hue的辅助进程,负责提供一些辅助性的服务。 Hue的可靠性 Hue提供了高可靠性的实现机制,包括HA(高可用性)和 Load ...
- **用户和组**:创建 hue 用户和组,以便于权限管理。 - **MySQL 数据库**:预先创建名为 hue 的数据库,并授予 Hue 用户相应的权限,以便存储配置信息。 - **HDFS 目录**:在 HDFS 上为 hue 创建家目录,并设置...
Hue管理功能为管理员提供了检查配置的选项,可以查看和校验HUE的各个配置部分,确保所有配置都是正确和完整的。如果发现配置有遗漏或错误,可以在检查配置界面中进行修正。 总的来说,HUE作为一个与Hadoop生态系统...
6. **用户权限管理**:Hue支持LDAP或Kerberos集成,实现用户身份验证和权限管理,确保只有授权用户才能访问和操作数据。 【应用场景】 1. **数据探索**:Hue是数据科学家和分析师的理想工具,他们可以快速浏览数据...
8. **权限管理**:Hue支持Hadoop的HDFS和Oozie的ACLs(访问控制列表),允许管理员配置用户和组的访问权限,确保数据安全。 9. **插件扩展**:Hue设计为可扩展的,开发者可以为其添加自定义的插件,以适应特定的...
6. **元数据管理**:Hue提供了元数据浏览器,帮助用户理解Hadoop集群上的表结构和字段信息。 7. **开发工具**:如Pig和HBase的交互式编辑器,便于数据处理和NoSQL操作。 在CDH 5.3.6版本中,包含了以下组件的改进...
7. **Beeswax**:这是Hue早期版本中的Hive查询接口,现在已经被更强大的Hive Editor替代。 8. **Kafka监控**:通过Kafka的API,用户可以查看消息队列的状态和消息流。 Hue 3.11.0的发布可能是在2015年左右,当时的...
它支持包括文件浏览(File Browser)、SQL查询(Beeswax/Sqoop2)、工作流设计(Oozie)、HBase管理(HBase Browser)以及更多功能。 2. **系统需求**:在搭建Hue之前,你需要一个运行Hadoop、HBase等组件的环境。...
Hue 是一个开源的数据浏览和交互工具,主要用于 Hadoop 生态系统,它提供了直观的 Web 界面,使得用户无需编写代码即可进行数据查询、分析和管理。本篇将详细介绍如何在 CentOS 7.9 操作系统上,使用 Python 2.7.5 ...
6. **权限管理**:集成Hadoop的访问控制模型,用户可以管理角色和权限,确保数据安全性。 7. **改进的性能和稳定性**:3.9.0版本针对CDH 5.7.1进行了优化,提升了响应速度和系统的稳定性。 8. **自定义插件**: ...
5.4.6 创建数据库hue,并给hue用户授权。 5.4.7 如果有备份数据,可以进行恢复。 5.4.8 删除不必要的外键约束。 5.4.12 再次启动HUE 配置完MySQL后,需要重新启动Hue服务。 6. FAQ帮助 在安装和配置Hue的过程中,...
编译过程涉及安装依赖、配置环境、运行构建脚本等多个环节,对于有经验的系统管理员或开发者来说,这是一个了解Hue内部机制的好机会。 5. **可用性与稳定性** 尽管官方下载可能有时不可用,但社区成员分享的Hue ...
`about` 文件可能包含有关Hue的基本信息,如版本、版权和许可信息,这对于用户了解软件的授权和版本历史是很有帮助的。 `metastore` 目录涉及Hue与Hive元数据的交互。Hive是一个基于Hadoop的数据仓库工具,它可以将...
安装完成后,用户可以通过Web浏览器访问Hue的管理界面,根据需求配置服务连接、创建用户账户并分配权限,然后就可以开始利用Hue提供的功能进行大数据分析工作了。 总的来说,Hue 3.12.0作为Hue的一个版本,旨在简化...
此外,HUE的权限管理系统也值得一提。它支持基于角色的访问控制,可以精确地分配不同用户或组对数据和操作的访问权限,确保了数据的安全性和合规性。同时,HUE的文档和教程资源丰富,对新用户非常友好,帮助他们快速...
6. **权限管理**:集成Kerberos安全机制,实现用户和组的权限控制,确保数据的安全性。 7. **API和插件**:开放的API允许开发人员扩展Hue的功能或集成到其他系统中,同时提供多种语言的SDK。 在解压" hue-4.2.0.tgz...
Hue是一个开源的Web界面,用于与多种Hadoop组件进行交互。它提供了一个图形化界面来操作Hadoop集群,使得非技术用户也能使用复杂的Hadoop技术进行数据分析和查询。然而,在使用Hue的过程中,用户可能会遇到各种问题...
3. **Beeswax**:提供了SQL查询接口,支持Hive、Impala等数据查询引擎,允许用户编写和执行SQL查询。 4. **Oozie工作流编辑器**:图形化设计和管理Oozie工作流,Oozie是Hadoop的工作流调度系统。 5. **Spark和...