`
cutesunshineriver
  • 浏览: 200551 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Hive初体验

阅读更多
在hive中创建表
CREATE TABLE bgjd (domain string, hotelname string, hotelno string,lxr string,bgjddh string,bgjddz string,bgjdssq string,bz string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '\n'
STORED AS TEXTFILE;


从本地文件系统中加载数据,覆写之前的数据
LOAD DATA LOCAL INPATH '/home/hadoop/hive-0.8.1/mock/BGJD_10w.txt' OVERWRITE INTO TABLE bgjd;


从本地文件系统中加载数据,追加到之前的数据中
LOAD DATA LOCAL INPATH '/home/hadoop/hive-0.8.1/mock/BGJD_1e.txt' INTO TABLE bgjd;


从HDFS中加载数据
LOAD DATA INPATH '/data/datawash/1.txt' INTO TABLE table1;


启动hive服务器
bin/hive --service hiveserver;


只能对单一字段进行group by,对多个字段进行group by的时候报错。
分享到:
评论

相关推荐

    高级软件人才培训专家-Hadoop课程资料-4-第四章 - 分布式SQL计算 Hive 入门

    #### Hive 初体验 初次使用 Hive 时,用户可以通过以下步骤开始: 1. **启动 Hive CLI**:通过命令行进入 Hive 环境。 2. **创建表**:使用 SQL 语句创建表,并指定数据格式和存储位置。 3. **加载数据**:将数据...

    大数据Hive数仓开发精讲到企业级实战应用

    ├─01.视频 │ │ 02--数据仓库基础理论--场景互动:数仓为何而来.avi │ │ 04--数据仓库基础理论--OLTP、OLAP系统.avi ...│ │ 25--Apache Hive--初体验1--Hive使用起来和MySQL差不多吗?.avi │ │  │ 

    大数据技术之impala.docx

    Impala 的初体验可以通过启动 Impala shell,查看数据库,打开默认数据库等操作来实现。 Impala 是一种高性能的交互式 SQL 查询引擎,具有多种优点,但也存在一些缺点。Impala 的架构、安装和监护管理都是非常重要...

    Web请求异步处理和海量数据即时分析在淘宝开放平台的实践(岑文初)

    这篇文章将深入探讨这两个关键领域,并基于岑文初的实践经验进行解析。 首先,Web请求异步处理是提升系统性能和可扩展性的重要手段。在传统的Web服务中,每个请求都是同步的,即服务器接收到请求后立即处理并返回...

    藏经阁-Modeling Catastrophic events in Spark.pdf

    他们拥有数千个Spark、Pig、Hive和Presto作业,生产集群由2600个d2.4xl节点组成,查询集群则包含400个m4.16xl节点。数据仓库规模达到60PB以上,利用工具如Tableau和Micro Strategy进行可视化分析。 5. **Spark开发...

    云计算下非结构化大数据存储系统设计.pdf

    在具体实现过程中,非结构化大数据存储系统可能会采用分布式文件系统,如HDFS(Hadoop Distributed File System)作为存储基础架构,因为HDFS设计之初就是为了处理大数据而生,能够提供高吞吐量的数据访问,同时具有...

    Hadoop权威指南中文版(第2版高清扫描版本)

    此外,还深入讨论了Hadoop的生态系统,包括HBase、Hive、Pig、ZooKeeper、Oozie等工具,这些工具极大地扩展了Hadoop的功能,使得数据处理更加便捷和灵活。 YARN作为Hadoop 2.x的主要改进,引入了新的资源调度机制,...

    藏经阁-Sparking up Data Engineering.pdf

    Netflix,全球知名的流媒体服务提供商,利用Spark来优化其服务,提升用户体验,以及进行内容推荐和业务决策。本文将深入探讨Spark在Netflix的运用及其开发流程。 ## Netflix背景 Netflix拥有超过9300万会员,覆盖...

    基于hadoop的商品推荐系统.zip

    总结来说,基于Hadoop的商品推荐系统利用Java和Hadoop的分布式计算能力,对大规模用户行为数据进行处理和分析,通过协同过滤、基于内容的推荐等算法生成个性化推荐,最终提升用户体验和业务效益。随着技术的发展,...

    Impala A Modern, Open-Source SQL Engine for Hadoop.pdf

    Impala旨在处理大数据环境下的读取密集型BI/分析查询,而且比传统批处理框架如Apache Hive具有更低的延迟和更高的并发性能。 知识点二:架构与组件概述 Impala采用了主从分布式架构,该架构包含负责执行查询的守护...

    浅谈大数据平台在智慧校园中的应用.pdf

    从20世纪末期的数据挖掘阶段,到2000年代初的自由探索阶段,再到并行计算和分布式系统的形成,直至现在大数据技术被广泛应用于各个行业,智慧校园的建设也更加依赖于大数据平台来处理大量的教育数据。 大数据平台在...

    nosql 入门教程

    第2章 NoSQL上手初体验 17 2.1 第一印象——两个简单的例子 17 2.1.1 简单的位置偏好数据集 17 2.1.2 存储汽车品牌和型号数据 22 2.2 使用多种语言 30 2.2.1 MongoDB驱动 30 2.2.2 初识Thrift 33 2.3 小结 ...

    机器学习平台如何建设与指南

    2. **业务需求**:在构建之初,需充分调研并理解业务需求,明确哪些业务场景需要机器学习的支持。例如,推荐系统、预测分析、图像识别等。这一步骤有助于确定平台所需提供的具体功能和服务。 #### 二、技术架构与...

    基于Hadoop的油田勘探开发云平台数据存储模型研究与应用.docx

    2. **HDFS数据存储模型**:HDFS设计之初就是为了克服传统文件系统在处理大规模数据时的局限性。它通过将数据分块存储在不同的节点上,实现了数据的冗余存储,从而提高了数据的安全性和可用性。此外,HDFS还支持数据...

Global site tag (gtag.js) - Google Analytics