hive基本wiki
FaceBook 镜像(被墙):http://mirror.facebook.com/facebook/hive
Wiki 页面:http://wiki.apache.org/hadoop/Hive
入门指南:http://wiki.apache.org/hadoop/Hive/GettingStarted
查询语言指南:http://wiki.apache.org/hadoop/Hive/HiveQL
演示文稿:http://wiki.apache.org/hadoop/Hive/Presentations
蓝图:http://wiki.apache.org/hadoop/Hive/Roadmap
hive运行原理浅析
hive基本原理:http://www.cnblogs.com/uttu/archive/2013/02/28/2936953.html
hive初始化运行流程:http://bupt04406.iteye.com/blog/1096504
hive compile解析:http://blog.csdn.net/lalaguozhe/article/details/9339679
hive源码解析之hive执行过程:http://blog.csdn.net/lpxuan151009/article/details/7956518
hive部署
hive部署手册:http://www.cnblogs.com/ggjucheng/archive/2012/04/26/2471341.html
相关推荐
通过学习将Oracle和Hive的常用函数整理出来做了个对比,提供他们各自支持的常用函数。
第一部分:完全以日常使用为目标,整理了常用的Hive 语法,而抛弃了不常用的部分,用来 满足不懂技术的分析人员来快速使用Hive 进行常见的日常数据分析。 第二部分:如果想能写出高效的Hive 语句,必须要先了解Hive ...
最近整理了一下关于hive常用基本函数和基础用法,具体参考附件文档,该资料仅供参考,希望整理的资料可以帮到你!
6. **Hive性能优化**:Hive可以通过多种方式优化查询性能,比如使用分区过滤减少数据扫描量,使用物化视图预计算常用查询,或者通过设置合适的执行引擎(如Tez或Spark)来提高效率。 7. **Hive与HBase的对比**:...
《Hive 口袋手册》是笔者根据自己对 Apache Hive 的知识点的理解汇总而成的小册子。...写这本册子的初衷一是为了总结自己关于 Hive 的学习过程,二是为了将自己学习过程中七零八乱的笔记做个整理、汇总。
TPCDS(Transaction Processing Performance Council Data Warehouse Benchmark)是大数据领域常用的一种数据仓库基准测试套件,主要用于衡量数据仓库系统的性能。Hive作为Apache Hadoop生态系统中的一个数据仓库...
在数据分析过程中,Excel是一个常用的工具,可以方便地进行数据整理、计算和可视化。从数据库或查询结果自动生成Excel文件,可以简化数据分享和报告制作。这可能通过编程方式实现,例如使用Python的pandas库读取数据...
排序(ORDER BY)和模糊查询(LIKE)也是常见的查询功能,有助于数据的整理和检索。 函数在SQL中有着广泛的应用,比如聚合函数(SUM, COUNT, AVG, MAX, MIN)用于对一组数据进行统计计算,而其他函数如CONCAT用于...
通过整理和学习这些常用SQL语句,可以提高数据操作的效率,更好地理解和运用数据库管理系统。 总的来说,无论是Hive还是MySQL,理解并熟练掌握SQL语句是每个IT从业者必备的技能之一。通过不断的实践和学习,可以...
常用工具有Hive、Pig、Spark SQL以及机器学习库(如TensorFlow、PyTorch)。 5. 决策支持系统(DSS):基于大数据分析的结果,DSS为决策者提供直观的报告和仪表板,帮助他们理解复杂情况并制定策略。BI工具(如...
这份资源集合可能包含了从安装基础软件到配置复杂大数据工具的所有指导文档,对于想要在短时间内进入大数据学习的人来说,是一份非常实用的资料。 首先,大数据环境的搭建通常涉及以下几个核心组件: 1. **操作...
4. 常见数据类型的数据抓取,实现数据抓取、解析和初步整理,常见的网络数据、数据文件、关系数据库等数据源的数据抓取掌握 Hive 数据仓库导入、导出以与 Hadoop 数据文件的转换,掌握 Hive 数据管理常用命令。...
例如,推荐系统是电商网站常用的一种技术,它可以分析用户行为,为用户推荐可能感兴趣的商品。Mahout的分布式特性使其能在Hadoop集群上高效运行,处理大规模的数据。 Hadoop家族技能图谱不仅涵盖了Hadoop的基本概念...
hadoop hadoop 导图笔记 hive hive基本是大数据入门必学的,在离线计算用的比较多,市场需求大,有sql基础入门比较快 Scala ...流计算利器,但是资料比较少,建议直接看官方文档 我会不定期的将整理的文档和
"mianshi:整理一些常用面试题"这个压缩包文件很可能是为面试者提供了一个宝贵的资源库,涵盖了各种常见问题和重要概念。让我们逐一探讨这些可能包含在"mianshi-master"中的面试知识点。 1. **数据结构与算法**: -...
8. **工具使用**:介绍常用的Hadoop管理工具,如Hadoop命令行工具、Hadoop administration tools(如Hadoop fsadmin, dfsadmin等),以及监控工具Ambari、Ganglia和Nagios。 9. **最佳实践**:分享Hadoop集群的优化...
整理了python从基础入门到高级进阶的所有资料: 01.初识Python.md 02.语言元素.md 03.分支结构.md 04.循环结构.md 05.构造程序逻辑.md 06.函数和模块的使用.md 07.字符串和常用数据结构.md 08.面向对象编程基础.md ...
16. **机器学习与人工智能**:基础概念如监督学习、无监督学习、半监督学习,以及常用算法如决策树、随机森林、支持向量机、神经网络等。 以上内容只是冰山一角,面试中还可能涉及到项目经验、问题解决能力、团队...