hive运行sql时生成的mapreduce - - ITeye博客

`

jxauwxj

浏览: 117324 次
性别:
来自: 北京

最近访客更多访客>>

mengqingyu

skypiggy

qja

xushaomin1122

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

phenix9527：楼主这问题解决了吗，我还没整出来
调用RemoteObject时一个很奇怪的现象
chenq.net：我每次在remoting-config.xml里作修改后都不能 ...
调用RemoteObject时一个很奇怪的现象
jxauwxj：我就加上了endpoint
调用RemoteObject时一个很奇怪的现象
zju2004：也遇到了相同的状况，希望能有人指点下，
调用RemoteObject时一个很奇怪的现象

hive运行sql时生成的mapreduce

博客分类：

hive

阅读更多

hive的sql语句被解析成了mapreduce，最终生成了一个jar文件。然后通过hadoop jar命令来执行这个jar文件。在http://master:50060/tasklog?attemptid=。。。可以看成jar所在文件目录，不过这个jar文件在mapreduce结束时，就会自动删除。这个jar文件大概有3M多。

路径大概是在:

/setup/hadoop/tmp/mapred/local/taskTracker/root/jobcache/job_201309092128_0001/jars/job.jar

查看图片附件

分享到：

hive将查询结果，直接导入到mysql | Multiple initializers for property 'data ...

2013-09-09 21:57
浏览 3630
评论(0)
分类:数据库
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hive SQL 编译过程详解: 本文将深入探讨Hive SQL如何被编译成MapReduce任务，以及在这个过程中涉及到的关键原理。 1. MapReduce实现基本SQL操作的原理： - **Join的实现原理**：在Hive中，Join操作通常通过MapReduce来实现。例如，在一个...

Hive原理与实现: - **执行引擎**：Hive通过ExecMapper和ExecReducer执行MapReduce任务，支持本地模式和分布式模式两种执行模式。 #### 四、Hive执行流程详解 - **编译阶段**： - **Parser**：将HQL查询解析成抽象语法树（AST）。 ...

HiveSQL解析原理.docx: 本文旨在深入探讨HiveSQL解析原理及其如何将SQL转化为MapReduce过程，并解释MapReduce如何实现基本SQL操作。 #### 二、MapReduce实现基本SQL操作的原理在深入理解Hive如何将SQL语句转换为MapReduce任务之前，我们...

HiveSQL编译原理: 本文将深入探讨HiveSQL的编译过程，包括词法分析、语法分析、优化以及执行计划生成等关键步骤。 1. **词法分析**：这是编译过程的第一步，也称为扫描或Tokenization。HiveSQL的解析器接收用户输入的SQL语句，将其...

hive sql详解经典: 驱动器解析SQL查询并生成执行计划，执行器负责在Hadoop集群上执行这些计划。 2. **HiveQL**： HiveQL是Hive的SQL方言，支持常见的SQL操作，如SELECT、FROM、WHERE、GROUP BY等，同时也有针对大数据处理的独特功能...

hadoop1.1.2操作例子包括hbase hive mapreduce相应的jar包: Hive将SQL语句转换为MapReduce任务，在Hadoop集群上执行。`hive`目录可能包含了Hive的JAR文件，这些文件在执行Hive查询时是必需的。 **MapReduce**： MapReduce是Hadoop的核心组件，它将大型数据集分解成小块，然后...

hive数仓、hive SQL 、 hive自定义函数、hive参数深入浅出: 通过以上内容的学习，你将能熟练掌握Hive在大数据处理中的运用，理解其数仓设计原则，编写高效的Hive SQL查询，以及根据业务需求定制函数，并懂得如何调整参数来优化Hive的运行效率。在实践中，你可以结合实际数据集...

hadoop+ha+hive+mapreduce: 【Hive】Hive是基于Hadoop的数据仓库工具，它将SQL-like查询语言转换为MapReduce任务进行运行。Hive提供了数据整理、查询和分析的功能，使得非Java背景的分析师也能操作Hadoop集群。Hive通过元数据来定义表结构，...

Hive on Spark源码分析DOC: Hive 的 SQL 解析引擎会将每句 SQL 解析成任务，并且根据不同的执行引擎调用不同子类去生成 TASK。例如，对于 SELECT 语句，Hive 会生成一个 QueryTask 对象，并将其提交到 Spark 集群中执行。在 Hive on Spark 中...

Hive优化以及执行原理: 6. **执行计划的动态调整**：在运行时，Hive可以基于数据分布和任务进度动态调整任务执行策略，如动态分区和推测执行。 7. **资源调度**：YARN或Tez的资源调度器负责分配集群资源，确保任务按需获取计算资源。总...

mysql数据抽取，自动生成hive建表语句: 6. **执行Hive语句**：连接Hive服务，执行生成的建表语句，创建Hive表。 7. **数据导入**：使用ETL工具（如Apache Sqoop）或编写脚本，将MySQL数据导入到Hive中。这一步可能涉及数据格式转换、数据清洗等操作。 8....

二万字讲解HiveSQL技术原理、优化与面试.pdf: 本文旨在深入探讨HiveSQL的技术原理，特别是其如何将SQL查询转换为MapReduce任务的过程。 #### 二、HiveSQL到MapReduce的转换过程 Hive将SQL查询转换为MapReduce任务的过程中，主要分为六个阶段： 1. **词法、...

HiveSQL使用考核题.zip: 在大数据处理领域，HiveSQL是一种广泛使用的查询语言，它基于SQL语法，为Apache Hadoop提供了数据仓库工具，使得分析大规模分布式数据集变得更加便捷。这个名为"HiveSQL使用考核题"的压缩包文件很可能是为了测试或...

hive环境搭建和建表加载数据: 最后，Hive SQL提交作业后，会生成MapReduce作业，并在YARN（Yet Another Resource Negotiator）上运行。YARN是Hadoop的一个子项目，负责资源管理和作业调度，使得Hive可以在分布式环境中高效地运行复杂的查询任务。...

spark或mr引擎插入的数据，hive表查询数据为0: 通过上述分析可以看出，对于“Spark或MR引擎插入的数据，Hive表查询数据为0”的问题，主要是因为Tez引擎在执行`UNION ALL`操作时生成了额外的子目录，而查询引擎未能正确处理这些子目录。通过改变数据写入方式或是...

HDFS+MapReduce+Hive+HBase十分钟快速入门.zip_hbase_hdfs_hive_mapReduce: - MapReduce用于执行Hive的查询任务，将HQL转换为MapReduce作业执行，实现大数据的离线分析。 - Hive则提供了一种更友好的SQL接口，使得数据分析师能更方便地查询和分析HDFS上的数据。 - HBase则提供实时的数据读写...

hive-exec-2.1.1.jar: 这个组件负责解析 SQL 查询，生成执行计划，并协调与 Hadoop 集群的交互以执行这些计划。它还包括了用于数据处理的逻辑和与 Hadoop 组件（如 MapReduce、Tez 或 Spark）的集成。具体来说，hive-exec 可能包括以下...

Hive总结.docx: Hive并不存储数据，而是依赖于HDFS进行数据存储，并利用MapReduce、Tez或Spark作为计算引擎执行SQL语句转化的分布式计算任务。它是一个读多写少的系统，主要用于静态数据分析，不支持频繁的数据修改和删除。 1.1 ...

深入浅出数据仓库中SQL性能优化: 一个Hive查询可能会生成多个MapReduce作业，而每个MapReduce作业又包含Map、Reduce、Spill、Shuffle、Sort等多个阶段。因此，针对Hive查询的性能优化可以从以下几个方面入手： 1. **针对MapReduce单个步骤的优化** ...

Global site tag (gtag.js) - Google Analytics