Hive分享教程1-Hive简介 - valder fields - ITeye博客

`

yugouai

浏览: 505760 次
性别:
来自: 深圳

最近访客更多访客>>

淡定情绪

spaceandroid

fengbin2005

hundun

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

IT_LDB：哥们你帮我大忙了，谢啦。一直在尝试使用内嵌的disco ...
FaceBook PrestoDB 安装文档
wxcking： yugouai 写道wxcking 写道请问，Windows下 ...
阿里DataX编译与案例
yugouai： wxcking 写道请问，Windows下怎么配置呢？Data ...
阿里DataX编译与案例
wxcking：请问，Windows下怎么配置呢？
阿里DataX编译与案例
developerinit：总结的非常好，每次都来看
HIVE中的排序细谈

Hive分享教程1-Hive简介

博客分类：

Hive分享

阅读更多

    HIVE是一个SQL解释引擎，它将SQL语句转译成M/R JOB，然后在Hadoop执行，来达到快速开发的目的。Hive的表其实就是一个Hadoop的目录/文件（HIVE默认表存放路径一般是工作目录的Hive目录里面），按表名做文件夹分开，如果有分区表，分区值都是子文件夹，可以直接在其他的M/R JOB里面直接应用这部分数据。

    Hive的特点有一下几点：
      1.为超大数据集设计的计算/拓展能力-based on Hadoop
      2.支持SQL like查询语言
      3.统一的元数据管理
    Hive与SQL类似，使用的语句区别不大，如：

    select word,count(*) from(select expolde(split(sentence,' '))) word from article) t group by word;

    Hive的数据类型有以下分类：
    原始类型：int/bigint/smallint/tinyint/boolean/double/float/string
    数组类型：Array
    映射：Map
    结构：Struct
    备注：原始类型长度跟平常的大小无异，其中HiveQL没有date/datetime类型

分享到：

Hive分享教程2-Hive语法 | Q+WebQQ的聊天记录保存路径很奇怪

2012-07-03 11:46
浏览 2052
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz: 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-3.1.2-bin.tar.gz 含两个文件hive-jdbc-3.1.2-standalone.jar和apache-hive-...

hive驱动包hive-jdbc-uber-2.6.5.0-292.jar（用户客户端连接使用）: 1. **下载驱动**：获取像`hive-jdbc-uber-2.6.5.0-292.jar`这样的Hive JDBC驱动。 2. **配置Dbeaver**：在Dbeaver中，创建一个新的Hive数据源，然后在“Driver Settings”中选择或添加新的JDBC驱动，上传下载的JAR...

apache-hive-2.1.1-bin.tar: apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tarapache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tarapache-hive-2.1.1-bin.tar apache-hive-2.1.1-...

DBeaver链接hive驱动包下载： hive-jdbc-uber-2.6.5.0-292.jar: 1. 下载驱动：首先，你需要从官方源或可靠的第三方网站下载"hive-jdbc-uber-2.6.5.0-292.jar"驱动包，确保版本与你的Hive服务器兼容。 2. 添加驱动：在DBeaver中，选择“工具”-> "数据库" -> "驱动管理器"，点击右...

Hive-2.1.1-CDH-3.6.1 相关JDBC连接驱动 Jar 包集合: 02、hive-exec-2.1.1-cdh6.3.1.jar 03、hive-jdbc-2.1.1-cdh6.3.1.jar 04、hive-jdbc-2.1.1-cdh6.3.1-standalone.jar 05、hive-metastore-2.1.1-cdh6.3.1.jar 06、hive-service-2.1.1-cdh6.3.1.jar 07、libfb303-...

hive-jdbc-3.1.2-standalone: hive-jdbc-3.1.2-standalone适用于linux

hive-testbench-hive14.zip大数据TPCDS-99SQL自动测试脚本: 在“hive-testbench-hive14.zip”这个压缩包中，包含了针对Hive 1.4版本的测试脚本，这是一组精心设计的测试用例，用于评估Hive在处理TPCDS标准数据集时的性能。TPCDS包含99个标准SQL查询，这些查询涵盖了从简单到...

Apache Hive（apache-hive-3.1.3-bin.tar.gz）: Apache Hive（apache-hive-3.1.3-bin.tar.gz、apache-hive-3.1.3-src.tar.gz）是一种分布式容错数据仓库系统，支持大规模分析，并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...

Apache Hive（hive-storage-2.8.1.tar.gz): Apache Hive（hive-storage-2.8.1.tar.gz、hive-storage-2.7.3.tar.gz）是一种分布式容错数据仓库系统，支持大规模分析，并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache ...

hive-jdbc-uber-2.6.5.jar: hive-jdbc-uber-2.6.5.0-292.jar DbVisualizer (as of version 9.5.5) Below is an example configuration using DbVisualizer: Open the Diver Manager dialog ("Tools" > "Driver Manager...") and hit the ...

hive-jdbc-2.1.1-cdh6.2.0-standalone.jar: hive-jdbc-2.1.1-cdh6.2.0（ieda等jdbc链接hive2.1.1）；cdh6.2.0安装的hive2.1.1

hive-jdbc-2.1.0-standalone.jar: hive-jdbc-2.1.0-standalone.jar

hive-jdbc-2.3.7-standalone.jar: hive-jdbc-2.3.7-standalone,可用dbeaver连接hive数据库，在工具中进行数据库记录的新增改查

hive-jdbc-1.2.1-standalone.jar: hive-jdbc-1.2.1-standalone.jar hive-jdbc驱动jar包，欢迎下载

Apache Hive（apache-hive-1.2.2-bin.tar.gz）: Apache Hive（apache-hive-1.2.2-bin.tar.gz、apache-hive-1.2.2-src.tar.gz）是一种分布式容错数据仓库系统，支持大规模分析，并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...

hive-jdbc-1.1.0-cdh5.12.1-standalone.jar: hive连接jdbc的jar包hive-jdbc-1.1.0-cdh5.12.1-standalone.jar

hive-jdbc-uber-2.6.5.0-292.rar: hive客户端工具DBever连接时所使用的驱动，hive-jdbc-uber-2.6.5.0-292.jar，hive-jdbc-uber-2.6.5.0-292.jar，hive-jdbc-uber-2.6.5.0-292.jar

hive-jdbc-1.1.0-cdh5.12.1 连接库 jar包: 1. `hive-jdbc-1.1.0-cdh5.12.1-standalone.jar`：这是一个独立的jar包，包含了所有必要的依赖，可以直接在没有其他CDH库的情况下运行。这意味着如果你的客户端环境中无法或不便解决所有依赖问题，你可以选择使用这...

hive案例之---------微博数据分析及答案.zip: Hive是Apache Hadoop生态系统中的一个数据仓库工具，它允许用户使用SQL-like查询语言（HQL）来处理存储在Hadoop分布式文件系统（HDFS）上的大数据集。在这个“hive案例之---------微博数据分析及答案”的项目中，...

hive-hcatalog-core-1.2.1.jar: hive-hcatalog-core-1.2.1.jarhive-hcatalog-core-1.2.1.jarhive-hcatalog-core-1.2.1.jar

Global site tag (gtag.js) - Google Analytics