本月博客排行
-
第1名
龙儿筝 -
第2名
johnsmith9th -
第3名
wy_19921005 - zysnba
- sgqt
- lemonhandsome
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- benladeng5225
- wy_19921005
- fantaxy025025
- e_e
- zysnba
- ssydxa219
- sam123456gz
- javashop
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- wiseboyloves
- xiangjie88
- ranbuijj
- ganxueyun
- xyuma
- sichunli_030
- wangchen.ily
- jh108020
- lemonhandsome
- zxq_2017
- jbosscn
- Xeden
- luxurioust
- johnsmith9th
- lzyfn123
- zhanjia
- forestqqqq
- ajinn
- nychen2000
- wjianwei666
- hanbaohong
- daizj
- 喧嚣求静
- mwhgJava
- silverend
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
- jveqi
- java-007
- sunj
最新文章列表
hive实战(1)hive安装准备
1.安装Hadoop环境,参见 http://zilongzilong.iteye.com/blog/2245547
2.安装hbase环境,参见http://zilongzilong.iteye.com/blog/2254460
3.安装MySQL
注意:安装MySQL不是必须的,hive自带数据库Derby也是可行的,那为什么要推荐安装MySQL呢,原因是Derby只支 ...
Spark SQL+Hive历险记
基础依赖环境
Apache Hadoop2.7.1
Apache Spark1.6.0
Apache Hive1.2.1
Apache Hbase0.98.12
(1)提前安装好scala的版本,我这里是2.11.7
(2)下载spark-1.6.0源码,解压进入根目录编译
(3)dev/change-scala-version.sh 2.11
修改pom文件,修改对应的hadoop,hb ...
hive on spark 测试
基础环境:
Apache Hadoop2.7.1
Centos6.5
Apache Hadoop2.7.1
Apache Hbase0.98.12
Apache Hive1.2.1
Apache Tez0.7.0
Apache Pig0.15.0
Apache oozie4.2.0
Apache Spark1.6.0
Cloudrea Hue3.8.1
...
hive是基于Hadoop的一个数据仓库工具
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 Hive最早由facebook开源,最初用于解决海量结构化的日志数据统计问题,是 ...
安装的Hive
安装的Hive是Hive最新版本中的稳定版本,是基于Hadoop2.2.0,以前有写过,如何在hadoop1.x下面安装Hive0.8,本次Hive的版本是Hive0.13,可以直接在Hive官网上下载二进制包,无须进行源码编译。Hive需要依赖底层的Hadoop环境,所以在安装Hive前,请确保你的hadoop集群环境已经可以正常工作。 Hive0.13稳定版本的下载地址 http://apa ...
使用Hive如何和Hbase集成
使用Hive如何和Hbase集成,Hbase和Hive的底层存储都在HDFS上,都是hadoop生态系统中的重要一员,所以他们之间有着很亲密的联系,可以相互转换与操作。 hadoop,hbase和hive的搭建就不重复说了,不会的朋友,可以看散仙前面的博客,下面直接进入重点,关于hive集成hbase这一块,网上资料不算多,有的版本比较旧,散仙这里使用的版本是hive0.12和hbase0.96 ...
Hive集成Tez让大象飞起来
基础环境
Apache Hadoop2.7.1
Centos6.5
Apache Hadoop2.7.1
Apache Hbase0.98.12
Apache Hive1.2.1
Apache Tez0.7.0
Apache Pig0.15.0
Apache oozie4.2.0
Apache Spark1.6.0
Cloudrea Hue3.8.1
安装Tez,请参考上篇 ...
Apache Tez0.7编译笔记
目前最新的Tez版本是0.8,但还不是稳定版,所以大家还是先下载0.7用吧
下载地址: wget http://archive.apache.org/dist/tez/0.7.0/apache-tez-0.7.0-src.tar.gz
由于编译Tez-UI模块,需要使用nodejs,所以建议还是
提前安装nodejs 和npm工具,安装方式,可以下载源码安装
也可以yum安装,安装步骤:
...
hive on spark的安装及问题
配置hive
hive-site
<property>
<name>hive.metastore.uris</name>
<value>thrift://database:9083</value>
</property>
<property>
<nam ...
FineReport中hadoop,hive数据库连接解决方案
1. 描述
Hadoop是个很流行的分布式计算解决方案,Hive是基于hadoop的数据分析工具。一般来说我们对Hive的操作都是通过cli来进行,也就是Linux的控制台,但是,这样做本质上是每个连接都存放一个元数据,各个之间都不相同,这样的模式用来做一些测试比较合适,并不适合做产品的开发和应用。
因此,就产生了Hive的JDBC连接的方式。本文介绍报表开发工具FineReport中,ha ...
hive启动报错org.apache.hadoop.hive.ql.metadata.,org.apache.derby.jdbc.EmbeddedDriver
使用CHD版本HIVE:hive-1.1.0-cdh5.4.8.tar.gz
在HIVE_HOME/bin目录 使用 ./hive启动HIVE报错,错误如下:
Logging initialized using configuration in jar:file:/home/hadoop/hive-1.1.0-cdh5.4.8/lib/hive-common-1.1.0-cdh5.4.8.ja ...
ClassNotFoundException: Class org.apache.hadoop.hive.contrib.serde2.RegexSerDe n
今天使用flume采集apache access log到hive表中,然后使用hiveQL进行日志分析,出现错误:
需要修改
1,HIVE_HOME/conf/hive-env.sh
加上HADOOP_HOME=you home
2,HIVE_HOME/conf/hive-site.xml
加上
<property>
< ...
total number of created files now is 100385, which exceeds 100000. Killing the j
今天将临时表里面的数据按照天分区插入到线上的表中去,出现了Hive创建的文件数大于100000个的情况,我的SQL如下:
hive> insert overwrite table test partition(dt)
> select * from table_tmp;
table_tmp表里面一共有570多G的数据,一共可以分成76个分区,SQL运行的时候 ...