`

Pig简介和安装

    博客分类:
  • Pig
 
阅读更多

 

Pig和Hive对比

Apache Pig Hive
Apache Pig uses a language called Pig Latin. It was originally created atYahoo. Hive uses a language called HiveQL. It was originally created at Facebook.
Pig Latin is a data flow language. HiveQL is a query processing language.
Pig Latin is a procedural language and it fits in pipeline paradigm. HiveQL is a declarative language.
Apache Pig can handle structured, unstructured, and semi-structured data. Hive is mostly for structured data.

 

Pig执行模式

-----------------------------------

1. local  

所有文件都在本地,for test

2. mapreduce

数据在HDFS上

 

Pig运行模式

1. 交互模式(grunt shell)

输入-执行-输出

2. batch mode 批处理模式

编写pig为扩展名的pig脚本

3. enbed mode 嵌入式

编写udf,在脚本使用

 

 

 

 

安装PIG

1. download pig

wget https://mirrors.tuna.tsinghua.edu.cn/apache/pig/latest/pig-0.16.0.tar.gz

tar -zxvf pig-0.16.0.tar.gz

ln -s pig-0.16.0.tar.gz pig

 

2. config ~/.bashrc

vi ~/.bashrc

export PIG_HOME=/usr/local/pig

export PATH=:$PIG_HOME/bin

source ~/.bashrc

 

3. verify

pig -version 

 

 

参考:

http://pig.apache.org/docs/r0.16.0/

https://www.tutorialspoint.com/apache_pig/index.htm

分享到:
评论

相关推荐

    pig-0.17.0.tar的安装包,

    《Apache Pig 0.17.0 安装与配置指南》 ...正确安装并配置Pig,结合Pig Latin的使用,可以极大地提高数据处理的效率和便捷性。通过不断的实践和学习,你将能更好地掌握Pig的潜力,为大数据分析带来强大的动力。

    pig-0.9.1.tar

    本文将详细介绍如何在Hadoop环境下安装和配置Pig-0.9.1。 一、Pig-0.9.1简介 Pig的设计目标是简化大数据处理任务,通过其自定义的Pig Latin语言,用户可以编写简单的数据流转换,而无需深入理解MapReduce的工作原理...

    7.Hadoop入门进阶课程_第7周_Pig介绍、安装与应用案例.pdf

    #### 二、Pig简介 Pig是由Yahoo贡献给Apache基金会的一个开源项目,它提供了一种简单的SQL-like语言——Pig Latin,允许用户编写复杂的MapReduce任务而无需深入理解底层的Hadoop MapReduce细节。Pig Latin语法简洁...

    大数据pig实战

    因此,对于大数据分析和处理技术的需求催生了包括Pig在内的新技术和工具。 #### NoSQL与SQL的关系 NoSQL是“Not Only SQL”的缩写,它代表着一种不同于传统关系型数据库的数据存储解决方案。NoSQL的出现并不是要...

    Programming Pig

    #### 一、Apache Pig简介 **Apache Pig** 是一个用于处理大规模数据集的强大平台。它由两部分组成:一个高级语言(Pig Latin)用于表达数据分析程序,以及基础设施层用于执行这些程序。Pig 的主要特点是它的结构...

    d2l-zh-1.0.zip_D2L 文件_d2lzh安装_deeplearning_mxnet_pig17v

    "d2l-zh-1.0.zip_D2L 文件_d2lzh安装_deeplearning_mxnet_pig17v" 是该教程的一个版本,它包含了一系列用于学习和实践的代码,主要基于MXNet框架。MXNet是一个高效的深度学习库,支持多种编程语言,如Python,便于...

    精品课程推荐 大数据与云计算教程课件 优质大数据课程 21.Pig模式与函数(共64页).pptx

    课程中,从Hadoop的简介和安装入门开始,深入到HDFS的文件接口、序列化、Shell命令及YARN的管理模型,让学习者了解Hadoop集群的运行机制。 【MapReduce编程】MapReduce是Hadoop中的编程模型,用于大规模数据集的...

    HUE简介及编译安装

    ### Hue简介及编译安装详解 ...通过以上步骤,我们可以成功地安装和配置Hue,并利用其丰富的功能来管理和操作Hadoop生态系统中的多个组件。Hue不仅简化了日常操作,还提供了强大的功能集来支持数据分析和处理需求。

    细细品味Hadoop_Hadoop集群(第11期)_HBase简介及安装.pdf

    1. **安装 Hadoop**:由于 HBase 依赖于 HDFS 和 MapReduce,因此首先需要安装和配置 Hadoop 集群。 2. **安装 Zookeeper**:Zookeeper 对于 HBase 的运行至关重要,因此也需要事先安装配置。 3. **下载 HBase**:...

    细细品味Storm_Storm简介及安装

    第2章详细讲解storm 集群环境的安装和搭建,以及如何将topology部署 到分布式环境中;第3章通过传感器数据实例详细 介绍Trident topology;第4章讲解如何使用Storm 和Tridentj挂行实时趋势分析;第5章介绍如何使用 ...

    hadoop权威指南第三版 中文 pdf

    本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。

    精品课程推荐 大数据与云计算教程课件 优质大数据课程 01.Hadoop简介与安装入门(共29页).pptx

    Hadoop生态系统还包括其他工具,如HBase(分布式NoSQL数据库)、Pig(高级数据分析语言)、Hive(数据仓库工具,支持SQL查询)、Sqoop(用于在Hadoop和传统数据库间导入导出数据)、Zookeeper(分布式协调服务)等。...

    Hadoop云计算平台搭建最详细过程(共22页).docx

    10. Pig安装:需要下载和安装Pig版本为pig-0.12.0,并配置相应的环境变量。 11. Hive安装:需要下载和安装Hive版本为hive-0.12.0,并配置相应的环境变量。 12. Ganglia安装:需要下载和安装Ganglia,并配置相应的...

    hadoop权威指南

    本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。

    Hadoop权威指南.pdf

    本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。

    大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第11期_HBase简介及安装_V1.0 共21页.pdf

    【大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第11期_HBase简介及安装_V1.0 共21页.pdf】这篇文档主要介绍了HBase这一大数据处理的重要组件,以及其在Hadoop生态系统中的角色。HBase是一个基于列族的...

    Hadoop权威指南(第三版)

    Hadoop权威指南(第三版),本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。

    Hadoop The Definitive Guide 2nd Edition

    Hadoop权威指南(第2版)的英文版 ...Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。 本书是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群

    CHD3安装部署手册

    YUM(Yellowdog Updater, Modified)是一种RPM包管理器,使得安装和更新过程更为简单。 2.4 YUM原理 YUM通过在线仓库自动下载和安装所需的RPM包,简化了软件管理和升级流程。 2.5 配置YUM - 方式一:添加Cloudera...

Global site tag (gtag.js) - Google Analytics