1、sql
select ROUND(RAND()*1000,0) from dual; 生成随机数
2、hive创建临时表
create TEMPORARY table up_speed select a.place,a.quart,a.year,a.kwh/b.kwh-1 as elec_speed_up from (select c.place,c.year,c.quart,sum(c.kwh) as kwh from user_h_growth c group by place,quart,year) a JOIN (select d.place,d.year,d.quart,sum(d.kwh) as kwh from user_h_growth d grou```
3、
drop database aaa cascade⋯⋯傻琪记不住命令
4、

支持Python中运行hive语句,还需要安装bison 下载thrift依赖的东西 yum -y install automake libtool flex bison pkgconfig gcc-c++ boost-devel libevent-devel zlib-devel Python-devel ruby-devel crypto-utils openssl openssl-devel
8、
hive调用的包明明在本机存在,却报不存在,需要把端口kill掉重启hive --service hiveserver 重启,因为ambari开机时会自动起一个10086,这个端口是不能用的。
10、
ORA-12899: value too large for column 列宽太小,修改列宽
11、
hive的join 要用on 用where的时候outer join不起作用和inner join一样····(这都能差······)

17、
Hive没有关系数据库的临时表,只能先生成一个表后再用完再删除

18、oracle insert数据后需要commit 否则不生效
20、
今天完成一个简单的join,却一直报
org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error while processing row
这样的错误,还具体列出了某行,查询两表,均有该字段···
最后解决。
就是把小的表加入内存,可以配置以下参数,是hive自动根据sql,选择使用common join或者map join
set hive.auto.convert.join = true;
hive.mapjoin.smalltable.filesize 默认值是25mb
21、hive oracle语句有很多函数区别,比如参数,hive没有to_char,oracle需要trun之类,最大的区别是字段标识 hive子查询可以没有标识符,字段得加AS
oracle子查询表需要加标识符
22、
不能从表中查取数据存入csv中
2015-05-22 14:23:44,354 WARN org.apache.hadoop.mapred.Child: Error running child
java.lang.RuntimeException: java.lang.AbstractMethodError: com.bizo.hive.serde.csv.CSVSerde.getSerDeStats()Lorg/apache/hadoop/hive/serde2/SerDeStats;
at org.apache.hadoop.hive.ql.exec.ExecMapper.map(ExecMapper.java:161)
at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:50)
at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:436)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:372)
at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:396)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1059)
at org.apache.hadoop.mapred.Child.main(Child.java:249)
Caused by: java.lang.AbstractMethodError: com.bizo.hive.serde.csv.CSVSerde.getSerDeStats()Lorg/apache/hadoop/hive/serde2/SerDeStats;
at org.apache.hadoop.hive.ql.exec.FileSinkOperator.processOp(FileSinkOperator.java:574)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.SelectOperator.processOp(SelectOperator.java:84)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.TableScanOperator.processOp(TableScanOperator.java:83)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.MapOperator.process(MapOperator.java:529)
at org.apache.hadoop.hive.ql.exec.ExecMapper.map(ExecMapper.java:143)
... 8 more
java.lang.RuntimeException: java.lang.AbstractMethodError: com.bizo.hive.serde.csv.CSVSerde.getSerDeStats()Lorg/apache/hadoop/hive/serde2/SerDeStats;
at org.apache.hadoop.hive.ql.exec.ExecMapper.map(ExecMapper.java:161)
at org.apache.hadoop.mapred.MapRunner.run(MapRunner.java:50)
at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:436)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:372)
at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:396)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1059)
at org.apache.hadoop.mapred.Child.main(Child.java:249)
Caused by: java.lang.AbstractMethodError: com.bizo.hive.serde.csv.CSVSerde.getSerDeStats()Lorg/apache/hadoop/hive/serde2/SerDeStats;
at org.apache.hadoop.hive.ql.exec.FileSinkOperator.processOp(FileSinkOperator.java:574)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.SelectOperator.processOp(SelectOperator.java:84)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.TableScanOperator.processOp(TableScanOperator.java:83)
at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:471)
at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:762)
at org.apache.hadoop.hive.ql.exec.MapOperator.process(MapOperator.java:529)
at org.apache.hadoop.hive.ql.exec.ExecMapper.map(ExecMapper.java:143)
... 8 more
23、libthrift JAR包冲突导致,libthrift-0.9.0 替换为 libthrift-0.8.0
Exception in thread "main" java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.metastore.HiveMetaStoreClient
at org.apache.hadoop.hive.ql.session.SessionState.start(SessionState.java:346)
at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:681)
at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:625)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at org.apache.hadoop.util.RunJar.main(RunJar.java:156)
Caused by: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.metastore.HiveMetaStoreClient
at org.apache.hadoop.hive.metastore.MetaStoreUtils.newInstance(MetaStoreUtils.java:1412)
at org.apache.hadoop.hive.metastore.RetryingMetaStoreClient.<init>(RetryingMetaStoreClient.java:62)
at org.apache.hadoop.hive.metastore.RetryingMetaStoreClient.getProxy(RetryingMetaStoreClient.java:72)
at org.apache.hadoop.hive.ql.metadata.Hive.createMetaStoreClient(Hive.java:2453)
at org.apache.hadoop.hive.ql.metadata.Hive.getMSC(Hive.java:2465)
at org.apache.hadoop.hive.ql.session.SessionState.start(SessionState.java:340)
... 7 more
Caused by: java.lang.reflect.InvocationTargetException
at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:39)
at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:27)
at java.lang.reflect.Constructor.newInstance(Constructor.java:513)
at org.apache.hadoop.hive.metastore.MetaStoreUtils.newInstance(MetaStoreUtils.java:1410)
... 12 more
Caused by: java.lang.NoSuchMethodError: org.apache.thrift.EncodingUtils.setBit(BIZ)B
at org.apache.hadoop.hive.metastore.api.PrivilegeGrantInfo.setCreateTimeIsSet(PrivilegeGrantInfo.java:245)
at org.apache.hadoop.hive.metastore.api.PrivilegeGrantInfo.<init>(PrivilegeGrantInfo.java:163)
at org.apache.hadoop.hive.metastore.HiveMetaStore$HMSHandler.createDefaultRoles(HiveMetaStore.java:563)
at org.apache.hadoop.hive.metastore.HiveMetaStore$HMSHandler.init(HiveMetaStore.java:398)
at org.apache.hadoop.hive.metastore.HiveMetaStore$HMSHandler.<init>(HiveMetaStore.java:356)
at org.apache.hadoop.hive.metastore.RetryingHMSHandler.<init>(RetryingHMSHandler.java:54)
at org.apache.hadoop.hive.metastore.RetryingHMSHandler.getProxy(RetryingHMSHandler.java:59)
at org.apache.hadoop.hive.metastore.HiveMetaStore.newHMSHandler(HiveMetaStore.java:4944)
at org.apache.hadoop.hive.metastore.HiveMetaStoreClient.<init>(HiveMetaStoreClient.java:171)
at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:681)
at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:625)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at org.apache.hadoop.util.RunJar.main(RunJar.java:156)
Caused by: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.metastore.HiveMetaStoreClient
at org.apache.hadoop.hive.metastore.MetaStoreUtils.newInstance(MetaStoreUtils.java:1412)
at org.apache.hadoop.hive.metastore.RetryingMetaStoreClient.<init>(RetryingMetaStoreClient.java:62)
at org.apache.hadoop.hive.metastore.RetryingMetaStoreClient.getProxy(RetryingMetaStoreClient.java:72)
at org.apache.hadoop.hive.ql.metadata.Hive.createMetaStoreClient(Hive.java:2453)
at org.apache.hadoop.hive.ql.metadata.Hive.getMSC(Hive.java:2465)
at org.apache.hadoop.hive.ql.session.SessionState.start(SessionState.java:340)
... 7 more
Caused by: java.lang.reflect.InvocationTargetException
at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:39)
at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:27)
at java.lang.reflect.Constructor.newInstance(Constructor.java:513)
at org.apache.hadoop.hive.metastore.MetaStoreUtils.newInstance(MetaStoreUtils.java:1410)
... 12 more
Caused by: java.lang.NoSuchMethodError: org.apache.thrift.EncodingUtils.setBit(BIZ)B
at org.apache.hadoop.hive.metastore.api.PrivilegeGrantInfo.setCreateTimeIsSet(PrivilegeGrantInfo.java:245)
at org.apache.hadoop.hive.metastore.api.PrivilegeGrantInfo.<init>(PrivilegeGrantInfo.java:163)
at org.apache.hadoop.hive.metastore.HiveMetaStore$HMSHandler.createDefaultRoles(HiveMetaStore.java:563)
at org.apache.hadoop.hive.metastore.HiveMetaStore$HMSHandler.init(HiveMetaStore.java:398)
at org.apache.hadoop.hive.metastore.HiveMetaStore$HMSHandler.<init>(HiveMetaStore.java:356)
at org.apache.hadoop.hive.metastore.RetryingHMSHandler.<init>(RetryingHMSHandler.java:54)
at org.apache.hadoop.hive.metastore.RetryingHMSHandler.getProxy(RetryingHMSHandler.java:59)
at org.apache.hadoop.hive.metastore.HiveMetaStore.newHMSHandler(HiveMetaStore.java:4944)
at org.apache.hadoop.hive.metastore.HiveMetaStoreClient.<init>(HiveMetaStoreClient.java:171)
24、
csv-serde下载地址:http://ogrodnek.github.io/csv-serde/
用法:
add jar path/to/csv-serde.jar; create table my_table(a string, b string,...) row format serde 'com.bizo.hive.serde.csv.CSVSerde' stored as textfile ;
自定义分隔符:
add jar path/to/csv-serde.jar; create table my_table(a string, b string,...) row format serde 'com.bizo.hive.serde.csv.CSVSerde'with serdeproperties ("separatorChar"="\t","quoteChar"="'","escapeChar"="\\") stored as textfile ;
相关推荐
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的 sql查询功能,可以将sql语句转换 为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL 语句快速实现简单的...
第一部分:完全以日常使用为目标,整理了常用的Hive 语法,而抛弃了不常用的部分,用来 满足不懂技术的分析人员来快速使用Hive 进行常见的日常数据分析。 第二部分:如果想能写出高效的Hive 语句,必须要先了解Hive ...
在大数据处理领域,Hive作为一个基于Hadoop的数据仓库系统,起着至关重要的作用。...在日常工作中,这样的知识不仅能帮助我们排查和修复问题,也能指导我们编写更高效的Hive SQL,提升大数据处理的能力。
在大数据处理领域,Hive是一个基于Hadoop的数据仓库工具,它允许用户使用SQL类查询语言(HQL)来处理存储在...理解这些JAR包的作用以及如何在环境中正确使用它们,是大数据分析师和开发人员日常工作中的一项基本技能。
在Hive中,内置的时间函数可以满足大部分日常需求,如获取年份、月份、日期等,但并不直接支持按月份加减。为了实现这样的功能,我们可以自定义UDF(User Defined Function),扩展Hive的功能。标题中的“hive时间按...
标题中的“hive-jdbc-uber-2.6.5.0-292.zip”指的是Hive JDBC驱动的Uber版本,版本号为2.6.5.0-292。...在日常开发和数据分析工作中,正确配置和使用Hive JDBC驱动对高效地进行大数据处理至关重要。
通过导入jar包,连接hive数据库驱动,DbVisualizer连接Hive数据库所需jar包,包含:hadoop-common-2.2.0.jar,hive-jdbc-2.1.1-standalone.jar,hive-jdbc-2.1.1.jar,满足日常hive查询需求。
### hive开发中常遇到的坑 在大数据处理领域,Hive作为一款广泛使用的数据仓库工具,为用户提供了SQL查询功能,极大地简化了大...通过对以上几个方面的学习,可以帮助开发者更好地应对日常开发中可能遇到的各种挑战。
在大数据处理领域,Apache Hive是一个基于Hadoop的数据仓库工具,它允许用户使用SQL(HQL,Hive ...在日常使用中,根据业务需求对Hive进行适当优化,如调整内存参数、启用Hive的缓存机制等,可以进一步提升Hive的效率。
### Hive常用命令详解 #### 创建外部表(分区表) 在Hive中,创建外部表时通常会使用`CREATE EXTERNAL TABLE`语句。这有助于在Hive与HDFS之间建立良好的解耦关系,使得即使Hive表被删除,其对应的数据仍然保留在...
在Hive的日常管理和使用过程中,HiveThrift服务是非常关键的一个组件,它提供了远程客户端访问Hive的方式。以下是对启动和服务连接的具体步骤: 1. **启动方式**: - **启动为前台**:直接在终端执行`bin/...
最后,文章指出,学术研究为Hive的日常操作改进奠定了基础。Hive的持续发展受益于广泛的学术研究和技术社区的共同努力。这不仅体现在上述的技术改进中,还包括在数据仓库设计、查询优化理论、数据存储和管理等领域的...
### Hive介绍 Hive是一种构建在Hadoop之上的数据仓库工具,主要用来进行数据提取、转换、加载(ETL),并能以结构化的形式存储数据,以便进行更方便的查询和分析。它提供了类似SQL的查询语言(HQL),允许用户以SQL...
- **数据库**主要用于事务处理,即日常的增删改查操作。 - **数据仓库**主要用于数据分析,通常包含历史数据,用于生成报表和分析报告。 2. **数据更新**: - 数据库支持频繁的数据更新。 - 数据仓库更侧重于...
#### 四、日常运维 - **表维护**:包括添加、删除分区等操作。 - **性能调优**:通过对Hive配置参数的调整,优化查询性能。 - **安全设置**:设置访问控制列表,确保数据的安全性。 通过以上介绍,我们可以了解到...
在日常开发中,建立一个汇总常见问题的知识库是提高效率的关键。遇到问题时,能够快速查找和应用解决方案,可以极大地提高团队的工作效率。同时,定期审查和更新这个知识库,确保它包含最新的错误信息和解决方案,将...
Hive作为一款数据仓库工具,主要用于处理大数据,它提供了一种类SQL语言HiveQL,用以简化对大数据集的管理、查询和分析。...对于数据科学家和工程师而言,深入理解Hive的各种函数对于日常工作的开展至关重要。
根据提供的文件信息,本文将详细解释Hive中的比较运算符、值判断操作、字符串匹配以及基本的算术运算。这些内容对于理解Hive查询语言的...这些功能不仅能够满足日常的数据分析需求,还能帮助用户更高效地处理大数据集。
在大数据处理领域,Apache Hive是一个基于Hadoop的数据仓库工具,用于结构化数据的查询和分析。本篇将重点探讨Hive中的窗口函数以及如何利用它们...因此,建议开发者们在日常工作中多加练习,不断提升自己的Hive技能。
在IT行业中,数据库管理和数据分析是至关重要的环节,而Hive作为一个大数据处理的工具,它提供了对大规模数据集的SQL查询能力...无论是在日常的数据分析还是复杂的ETL流程中,这样的组合都能大大提高开发和运维的效率。