Pig和Hive对比
Apache Pig uses a language called Pig Latin. It was originally created atYahoo. | Hive uses a language called HiveQL. It was originally created at Facebook. |
Pig Latin is a data flow language. | HiveQL is a query processing language. |
Pig Latin is a procedural language and it fits in pipeline paradigm. | HiveQL is a declarative language. |
Apache Pig can handle structured, unstructured, and semi-structured data. | Hive is mostly for structured data. |
Pig执行模式
-----------------------------------
1. local
所有文件都在本地,for test
2. mapreduce
数据在HDFS上
Pig运行模式
1. 交互模式(grunt shell)
输入-执行-输出
2. batch mode 批处理模式
编写pig为扩展名的pig脚本
3. enbed mode 嵌入式
编写udf,在脚本使用
安装PIG
1. download pig
wget https://mirrors.tuna.tsinghua.edu.cn/apache/pig/latest/pig-0.16.0.tar.gz
tar -zxvf pig-0.16.0.tar.gz
ln -s pig-0.16.0.tar.gz pig
2. config ~/.bashrc
vi ~/.bashrc
export PIG_HOME=/usr/local/pig
export PATH=:$PIG_HOME/bin
source ~/.bashrc
3. verify
pig -version
参考:
http://pig.apache.org/docs/r0.16.0/
https://www.tutorialspoint.com/apache_pig/index.htm
相关推荐
《Apache Pig 0.17.0 安装与配置指南》 ...正确安装并配置Pig,结合Pig Latin的使用,可以极大地提高数据处理的效率和便捷性。通过不断的实践和学习,你将能更好地掌握Pig的潜力,为大数据分析带来强大的动力。
本文将详细介绍如何在Hadoop环境下安装和配置Pig-0.9.1。 一、Pig-0.9.1简介 Pig的设计目标是简化大数据处理任务,通过其自定义的Pig Latin语言,用户可以编写简单的数据流转换,而无需深入理解MapReduce的工作原理...
#### 二、Pig简介 Pig是由Yahoo贡献给Apache基金会的一个开源项目,它提供了一种简单的SQL-like语言——Pig Latin,允许用户编写复杂的MapReduce任务而无需深入理解底层的Hadoop MapReduce细节。Pig Latin语法简洁...
因此,对于大数据分析和处理技术的需求催生了包括Pig在内的新技术和工具。 #### NoSQL与SQL的关系 NoSQL是“Not Only SQL”的缩写,它代表着一种不同于传统关系型数据库的数据存储解决方案。NoSQL的出现并不是要...
#### 一、Apache Pig简介 **Apache Pig** 是一个用于处理大规模数据集的强大平台。它由两部分组成:一个高级语言(Pig Latin)用于表达数据分析程序,以及基础设施层用于执行这些程序。Pig 的主要特点是它的结构...
"d2l-zh-1.0.zip_D2L 文件_d2lzh安装_deeplearning_mxnet_pig17v" 是该教程的一个版本,它包含了一系列用于学习和实践的代码,主要基于MXNet框架。MXNet是一个高效的深度学习库,支持多种编程语言,如Python,便于...
课程中,从Hadoop的简介和安装入门开始,深入到HDFS的文件接口、序列化、Shell命令及YARN的管理模型,让学习者了解Hadoop集群的运行机制。 【MapReduce编程】MapReduce是Hadoop中的编程模型,用于大规模数据集的...
### Hue简介及编译安装详解 ...通过以上步骤,我们可以成功地安装和配置Hue,并利用其丰富的功能来管理和操作Hadoop生态系统中的多个组件。Hue不仅简化了日常操作,还提供了强大的功能集来支持数据分析和处理需求。
1. **安装 Hadoop**:由于 HBase 依赖于 HDFS 和 MapReduce,因此首先需要安装和配置 Hadoop 集群。 2. **安装 Zookeeper**:Zookeeper 对于 HBase 的运行至关重要,因此也需要事先安装配置。 3. **下载 HBase**:...
第2章详细讲解storm 集群环境的安装和搭建,以及如何将topology部署 到分布式环境中;第3章通过传感器数据实例详细 介绍Trident topology;第4章讲解如何使用Storm 和Tridentj挂行实时趋势分析;第5章介绍如何使用 ...
本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。
Hadoop生态系统还包括其他工具,如HBase(分布式NoSQL数据库)、Pig(高级数据分析语言)、Hive(数据仓库工具,支持SQL查询)、Sqoop(用于在Hadoop和传统数据库间导入导出数据)、Zookeeper(分布式协调服务)等。...
10. Pig安装:需要下载和安装Pig版本为pig-0.12.0,并配置相应的环境变量。 11. Hive安装:需要下载和安装Hive版本为hive-0.12.0,并配置相应的环境变量。 12. Ganglia安装:需要下载和安装Ganglia,并配置相应的...
本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。
本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。
【大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第11期_HBase简介及安装_V1.0 共21页.pdf】这篇文档主要介绍了HBase这一大数据处理的重要组件,以及其在Hadoop生态系统中的角色。HBase是一个基于列族的...
Hadoop权威指南(第三版),本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。
Hadoop权威指南(第2版)的英文版 ...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。 本书是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群
YUM(Yellowdog Updater, Modified)是一种RPM包管理器,使得安装和更新过程更为简单。 2.4 YUM原理 YUM通过在线仓库自动下载和安装所需的RPM包,简化了软件管理和升级流程。 2.5 配置YUM - 方式一:添加Cloudera...