最新文章列表

数据生成器

data-generator是一个Java实现的数据生成器开源项目。   如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin、ClickHouse等不同实现方案之间的表现,那你就需要一份标准的数据进行测试,这个开源项目就是为了生成这样的标准数据。 ...
yangshangchuan 评论(0) 有4916人浏览 2018-04-29 23:02

Linux搭建Hive开发环境

Linux搭建Hive开发环境 1.Hive The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL. Structure can be projected ont ...
马智霖 评论(0) 有755人浏览 2018-04-29 20:57

hive视频教程|Hive入门及实战演练(2017版本)

Hive入门及实战演练(2017版本) 网盘地址:https://pan.baidu.com/s/1XjVARW7-CrfmZNPmwJDcZQ 密码:cts9 备用地址(腾讯微云):https://share.weiyun.com/5rDivzP 密码:xsdfyq hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql ...
勤奋耕耘 评论(0) 有1281人浏览 2018-04-18 13:41

hive udf 唯一bigInt 生成器

一、背景         mysql数据由于自增的bigint 主键,会插入更快,因为能持续往文件末尾插入嘛,因此需要这个东西。         然后呢,服务端有专门生产id的接口,但是数据中心批量插入,肯定会拉暴他们,不让我们一起玩,只能自己玩。   二、方案         1.redis 获取数据段,程序内部自增。         问题:要用外部redis麻烦,而且要持久化 ...
greemranqq 评论(0) 有3185人浏览 2018-03-08 17:31

hive message:Hive Schema version 2.1.0 does not match 错误

按照链接http://blog.csdn.net/qq_32166627/article/details/51823928  安装完成hive后,如果启动的时候碰到message:Hive Schema version 2.1.0 does not match错误,那么就需要进入/$HIVE_HOME/bin目录下执行 schematool -dbType mysql -initSchema ...
bestchenwu 评论(0) 有713人浏览 2018-03-03 22:45

数据接入ElasticSearch方式培训PPT

写道 数据接入ElasticSearch几种方式总结,涉及技术hive、flume、logstash、elasticsearch、kafka   
yangyangmyself 评论(0) 有1900人浏览 2018-01-28 11:53

hive'笔记

一, 基本了解 1.Hive的简介 -1. 由Facebook开源用于解决海量结构化日志的数据统计,后称为Apache Hive为一个开源项目。 -2. Hive是基于Hadoop的一个数据仓库 ...
于佳磊 评论(0) 有2468人浏览 2017-11-23 15:52

hive本地模式 schematool无法初始化mysql数据库

这是个很坑的问题 异常信息: [root@kdg01 bin]#  schematool -initSchema -dbType mysql which: no hbase in (/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/tmp/myshell:/root/myshell:/usr/mysoft/jdk1.8.0_111/bin ...
VallyGan 评论(0) 有8973人浏览 2017-11-09 11:43

Hive的安装

一 Hive安装官网 1、Hive官网(新版本从这下载) httpp://hive.apache.org 2、老版本Hive安装包 http://archive.apache.org/ 下载0.13版本Hive [root@localhost ~]# wget http://archive.apache.org/dist/hive/hive-0.13.0/apache-hive-0.1 ...
cakin24 评论(0) 有524人浏览 2017-10-22 08:53

Hive的体系结构图

Hive的体系结构图  
cakin24 评论(0) 有926人浏览 2017-10-22 08:46

Hive的体系结构之HQL的执行过程

一 一条HQL语句如何在hive中进行查询 解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中,并在随后有MapReduce调用执行。     二 怎样查看oracle的执行计划 1、不创建索引的执行计划   2、创建索引的执行计划     Hive的执行计划和oracle的执行计划类似
cakin24 评论(0) 有1055人浏览 2017-10-22 08:43

什么是Hive

一 什么是Hive 1、Hive是构建于Hadoop HDFS之上的一个数据仓库基础架构。 2、Hive可以用来进行数据提取转化加载(ETL)。 3、Hive定义了简单的类似SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据。 4、Hive允许熟悉MapReduce开发者开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作。 ...
cakin24 评论(0) 有858人浏览 2017-10-21 07:53

Hive基本概念

一 什么是Hive Hive是构建于Hadoop HDFS之上的一个数据仓库,它本身就是一个数据库。   二什么是数据仓库 数据仓库就是一个数据库,数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于支持企业或组织的决策分析处理。 面向主题:数据仓库中的数据是按照一定的主题进行组织的,是用户进行决策时关注的重点方面。例如商品推荐系统,主题当然是商品信息。 集成 ...
cakin24 评论(0) 有737人浏览 2017-10-20 20:33

CENTOS6.5安装Hive

本文主要说明在CentOS6.5上安装Hive及在安装的过程中遇到的问题、解决办法,分为MySQL的安装、Hive的安装配置和测试、遇到的问题及解决方法三个部分来 ...
chy0919 评论(0) 有740人浏览 2017-08-10 14:42

hive java api

1.启动 hadoop start-all.sh 2.启动hive ./hive --service hiveserver2 3.新建Java 工程 导入jar包 导入hive\lib目录下的hive-jdbc-1.2.0-standalone.jar 导入hadoop-2.7.1\share\hadoop\common下的hadoop-common-2.7.1.jar 4.编写jdbc ...
mingyun 评论(0) 有553人浏览 2017-07-10 21:47

Hive JDBC 配置session properties

在使用hive jdbc的时候,需要有一些hive session的配置, 比如说: 当前作业使用的是哪条队列 当前作业的map大小,reduce大小,map个数,reduce的个数。 等等   解决方案是:在jdbc url上面,进行初始化的配置。 Connection URL Format The HiveServer2 URL is a string with the fol ...
dacoolbaby 评论(0) 有3026人浏览 2017-07-09 23:13

hive 自定义函数

HIVE - UDF use define funcion 用户自定义hive 的function toUpper(str) 将 str 转换为 大写 一、新增 java 工程 1.新增 lib 文件夹 解压 hive.jar 复制 lib 下的 jar 包 至 lib 文件夹 右键 add builde path 2.新增 包 com.hive.test 新增 类 MyUDF ...
mingyun 评论(0) 有492人浏览 2017-07-09 22:03

Hadoop与Hive日志

1、包准备 http://archive.cloudera.com/cdh5/cdh/5/ hadoop-2.5.0-cdh5.3.0.tar.gz zookeeper-3.4.5-cdh5.3.0.tar.gz hive-0.13.1-cdh5.3.0.tar.gz https://repo1.maven.org/maven2/org/apache/hive/hive- ...
yangyangmyself 评论(0) 有3463人浏览 2017-07-08 11:33

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics