本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- siemens800
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
最新文章列表
hive 文件分割的一些经验
最近在工作中用到了hive,因数据量大,需要将hive的文件进行分割:
hive的分割方式一,用tasks进行分割:
execute immediate 'set mapred.reduce.tasks=5'
这种分割方式有时会失效,可用下面的分割方式,
hive的分割方式二:
execute immediate 'set hive.merge.size.per.task ...
【赵强老师】在Hive中使用Load语句加载数据
一、Hive中load语句的语法说明
Hive Load语句不会在加载数据的时候做任何转换工作,而是纯粹的把数据文件复制/移动到Hive表对应的地址。语法格式如下:
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename \
[PARTITION (partcol1=val1, partcol2=val2 ...
linux pig 安裝使用
0.准备工作 hadoop 服务器
10.156.50.35 yanfabu2-35.base.app.dev.yf zk1 hadoop1 master1 master
10.156.50.36 yanfabu2-36.base.app.dev.yf zk2 hadoop2 master2
10.156.50.37 yanfabu2-37.base.app.dev.yf zk3 ...
sqoop2 安装 与使用
0.准备工作 hadoop 服务器
10.156.50.35 yanfabu2-35.base.app.dev.yf zk1 hadoop1 master1 master
10.156.50.36 yanfabu2-36.base.app.dev.yf zk2 hadoop2 master2
10.156.50.37 yanfabu2-37.base.app.dev.yf zk3 ...
[sqoop1 error] java.lang.ClassNotFoundException org.apache.hadoop.hive.conf.Hiv
问题:
[zkkafka@yanfabu2-37 ~]$ sqoop import \
> --connect jdbc:mysql://10.156.50.36:3306/mqh \
> --username root \
> --password root \
> --table device \
> --fields-terminated ...
hive-ha 安装
hive-ha 安装
0.准备工作 hadoop 服务器
10.156.50.35 yanfabu2-35.base.app.dev.yf zk1 hadoop1 master1 master
10.156.50.36 yanfabu2-36.base.app.dev.yf zk2 hadoop2 master2
10.156.50.37 yanfabu2-37.ba ...
[hive error] check the manual that corresponds to your MySQL server version for
问题
[zkkafka@yanfabu2-36 tmp]$ schematool -dbType derby -initSchema
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/home/zkkafka/hive/lib/log4j-slf4j-impl-2.6 ...
[hive error ] You need either to explicitly disable SSL by setting useSSL=false
问题
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/home/zkkafka/hive/lib/log4j-slf4j-impl-2.6.2.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found ...
异常-hsql 小文件过多
1.背景:
hive 做 insert overwrite select * from table 操作
出现异常:
[Fatal Error] total number of created files now is 100028, which exceeds 100000. Killing the job.
2.实际默认限制:
hive> set ...
sqoop导入数据脚本
sqoop export \
-D mapred.job.queue.name=hive_user \
--connect jdbc:mysql://${host}:${port}/${db} \
--username ${username} \
--password ${password} \
--tab ...
Hadoop之Hive
Hive基本介绍
查询管理存储在HDFS中的大数据集合,提供像SQL的查询语句HiveQL。Hive表的元数据存储在Derby数据库中,Mysql和Oracle也可以作为Hive的存储源
Hive操作
use:切换数据库
hive> use default;
OK
Time taken: 0.454 seconds
hive> show tables;
OK
...
hive转换科学计数法
hive中的科学计数法如何转换回数字,搜了半天终于找到了一篇好文章,这里记录转换代码为自己日后参考。(转自:https://blog.csdn.net/zreodown/article/details/15506637)
case
--处理非科学计数法表示的字符串
when length(regexp_extract('字符串','([0-9]+\\.)([0-9]+)(E-* ...