本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- siemens800
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
最新文章列表
数据生成器
data-generator是一个Java实现的数据生成器开源项目。
如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin、ClickHouse等不同实现方案之间的表现,那你就需要一份标准的数据进行测试,这个开源项目就是为了生成这样的标准数据。
...
hive视频教程|Hive入门及实战演练(2017版本)
Hive入门及实战演练(2017版本)
网盘地址:https://pan.baidu.com/s/1XjVARW7-CrfmZNPmwJDcZQ 密码:cts9
备用地址(腾讯微云):https://share.weiyun.com/5rDivzP 密码:xsdfyq
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql ...
hive udf 唯一bigInt 生成器
一、背景
mysql数据由于自增的bigint 主键,会插入更快,因为能持续往文件末尾插入嘛,因此需要这个东西。
然后呢,服务端有专门生产id的接口,但是数据中心批量插入,肯定会拉暴他们,不让我们一起玩,只能自己玩。
二、方案
1.redis 获取数据段,程序内部自增。
问题:要用外部redis麻烦,而且要持久化
...
hive message:Hive Schema version 2.1.0 does not match 错误
按照链接http://blog.csdn.net/qq_32166627/article/details/51823928 安装完成hive后,如果启动的时候碰到message:Hive Schema version 2.1.0 does not match错误,那么就需要进入/$HIVE_HOME/bin目录下执行
schematool -dbType mysql -initSchema
...
hive本地模式 schematool无法初始化mysql数据库
这是个很坑的问题
异常信息:
[root@kdg01 bin]# schematool -initSchema -dbType mysql
which: no hbase in (/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/tmp/myshell:/root/myshell:/usr/mysoft/jdk1.8.0_111/bin ...
Hive的体系结构之HQL的执行过程
一 一条HQL语句如何在hive中进行查询
解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中,并在随后有MapReduce调用执行。
二 怎样查看oracle的执行计划
1、不创建索引的执行计划
2、创建索引的执行计划
Hive的执行计划和oracle的执行计划类似
hive java api
1.启动 hadoop
start-all.sh
2.启动hive
./hive --service hiveserver2
3.新建Java 工程
导入jar包
导入hive\lib目录下的hive-jdbc-1.2.0-standalone.jar
导入hadoop-2.7.1\share\hadoop\common下的hadoop-common-2.7.1.jar
4.编写jdbc ...
Hive JDBC 配置session properties
在使用hive jdbc的时候,需要有一些hive session的配置,
比如说:
当前作业使用的是哪条队列
当前作业的map大小,reduce大小,map个数,reduce的个数。
等等
解决方案是:在jdbc url上面,进行初始化的配置。
Connection URL Format
The HiveServer2 URL is a string with the fol ...
hive 自定义函数
HIVE - UDF use define funcion
用户自定义hive 的function
toUpper(str) 将 str 转换为 大写
一、新增 java 工程
1.新增 lib 文件夹
解压 hive.jar 复制 lib 下的 jar 包 至 lib 文件夹
右键 add builde path
2.新增 包 com.hive.test
新增 类 MyUDF ...
Hadoop与Hive日志
1、包准备
http://archive.cloudera.com/cdh5/cdh/5/
hadoop-2.5.0-cdh5.3.0.tar.gz
zookeeper-3.4.5-cdh5.3.0.tar.gz
hive-0.13.1-cdh5.3.0.tar.gz
https://repo1.maven.org/maven2/org/apache/hive/hive- ...