Apache Pig 0.10.1已经发布,这个版本并没有什么特性,更多的是为了稳定性以及一些bug的修正
显著变化:
1. 代码独立以及支持多种格式的下载.
下载地址: http://www.fightrice.com/mirrors/apache/pig/pig-0.10.1/
可以通过tar.gz,rpm,deb等方式下载获取
2. 更好的支持 Apache Hadoop 0.23.x/2.x
从0.10.0开始,pig就已经加入了Maven仓库.你可以通过以下方式配置pom.xml来使用pig0.10.1
<dependency> <groupId>org.apache.pig</groupId> <artifactId>pig</artifactId> <version>0.10.1</version> <classifier>h2</classifier> </dependency>
同时Pig团队修正了Pig运行在Hadoop 0.23X/2.X版本上的一些Bug( PIG-3035, PIG-2783, PIG-2761, PIG-2912, PIG-2791)
3.更好的支持Oracle JDK7.0
4.单元测试的错误修正
具体修改如下:
IMPROVEMENTS
PIG-2907: Publish pig jars for Hadoop2/23 to maven (rohini)
PIG-3019: Need a target in build.xml for source releases (gates)
PIG-2794: Pig test: add utils to simplify testing on Windows (jgordon via gates)
PIG-2908: Fix unit tests to work with jdk7 (rohini via dvryaboy)
PIG-2852: Update documentation regarding parallel local mode execution (cheolsoo via jcoveney)
PIG-2712: Pig does not call OutputCommitter.abortJob() on the underlying OutputFormat (rohini via gates)
PIG-2727: PigStorage Source tagging does not need pig.splitCombination to be turned off (prkommireddi via dvryaboy)
PIG-2711: e2e harness: cache benchmark results between test runs (thw via daijy)
PIG-2680: TOBAG output schema reporting (andy schlaikjer via jcoveney)
PIG-2650: Convenience mock Loader and Storer to simplify unit testing of Pig scripts (julien)
BUG FIXES
PIG-3107: bin and autocomplete are missing in src release (daijy)
PIG-3106: Missing license header in several java file (daijy)
PIG-3099: Pig unit test fixes for TestGrunt(1), TestStore(2), TestEmptyInputDir(3) (vikram.dixit via daijy)
PIG-3035: With latest version of hadoop23 pig does not return the correct exception stack trace from backend (rohini)
PIG-2953: "which" utility does not exist on Windows (daijy)
PIG-2960: Increase the timeout for unit test (daijy)
PIG-2958: Pig tests do not appear to have a logger attached (daijy)
PIG-2942: DevTests, TestLoad has a false failure on Windows (jgordon via daijy)
PIG-2943: DevTests, Refactor Windows checks to use new Util.WINDOWS method for code health (jgordon via dvryaboy)
PIG-2801: grunt "sh" command should invoke the shell implicitly instead of calling exec directly with the command tokens
(jgordon via daijy)
PIG-2800: pig.additional.jars path separator should align with File.pathSeparator instead of being hard-coded to ":"
(jgordon via azaroth)
PIG-2798: pig streaming tests assume interpreters are auto-resolved (jgordon via daijy)
PIG-2797: Tests should not create their own file URIs through string concatenation, should use Util.generateURI
instead (jgordon via daijy)
PIG-2796: Local temporary paths are not always valid HDFS path names (jgordon via daijy)
PIG-2795: Fix test cases that generate pig scripts with "load " + pathStr to encode "\" in the path (jgordon via daijy)
PIG-2940: HBaseStorage store fails in secure cluster (cheolsoo via daijy)
PIG-2821: HBaseStorage should work with secure hbase (rohini via daijy)
PIG-2890: Revert PIG-2578 (dvryaboy)
PIG-2859: Fix few e2e test failures (rohini via daijy)
PIG-2729: Macro expansion does not use pig.import.search.path - UnitTest borked (johannesch via daijy)
PIG-2791: Pig does not work with Namenode Federation (rohini via daijy)
PIG-2783: Fix Iterator_1 e2e test for Hadoop 23 (rohini via daijy)
PIG-2761: With hadoop23 importing modules inside python script does not work (rohini via daijy)
PIG-2759: Typo in document "Built In Functions" (daijy)
PIG-2745: Pig e2e test RubyUDFs fails in MR mode when running from tarball (cheolsoo via daijy)
PIG-2741: Python script throws an NameError: name 'Configuration' is not defined in case cache dir is not created
(knoguchi via daijy)
PIG-2669: Pig release should include pig-default.properties after rebuild (daijy)
PIG-2739: PyList should map to Bag automatically in Jython (daijy)
PIG-2730: TFileStorage getStatistics incorrectly throws an exception instead of returning null (traviscrawford via daijy)
PIG-2717: Tuple field mangled during flattening (daijy)
PIG-2721: Wrong output generated while loading bags as input (knoguchi via daijy)
PIG-2912: Pig should clone JobConf while creating JobContextImpl and TaskAttemptContextImpl in Hadoop23 (rohini via daijy)
PIG-2775: Register jar does not goes to classpath in some cases (daijy)
粗鲁的翻译自:http://hortonworks.com/blog/apache-pig-0-10-1-released/
更多技术文章、感悟、分享、勾搭,请用微信扫描:
相关推荐
这个"apache-iotdb-0.10.1-incubating-bin.zip"压缩包包含的是IoTDB的0.10.1版本的二进制发行版,适合在生产环境中快速部署和使用。 IoTDB的核心功能包括高效的时间序列数据存储、查询以及管理。时间序列数据是指随...
Apache Mahout 项目旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout 的创始者 Grant Ingersoll 介绍了机器学习的基本概念,并演示了如何使用 Mahout 来实现文档集群、提出建议和组织内容。
这个"apache-log4cxx-0.10.1.zip"压缩包包含了Log4cxx的0.10.1版本,这是一个稳定且广泛使用的版本,适合在Linux环境下进行日志管理和输出。 Log4cxx的设计目标是提供一个灵活的日志系统,允许开发者根据需要调整...
总结来说,Tez-0.10.1-SNAPSHOT.tar.gz是Apache Tez的一个开发版本,它提供了一个高效的数据处理框架,尤其是作为Hive的执行引擎,提升了大数据分析的性能。这个压缩包包含了Tez的核心组件、API、运行时库以及测试...
Kafka是Apache软件基金会开发的一个开源流处理平台,它最初由LinkedIn设计并开源,现在已经成为大数据领域中的重要组件。此压缩包包含的是Kafka 0.10.0和0.10.1两个版本的API文档,对于理解这两个版本之间的差异以及...
Tez是Hadoop生态系统中的一个开源任务执行框架,它由Apache Software Foundation开发,用于提高Hive、Pig等数据处理工具的性能。 【描述】"tez-0.10.1-SNAPSHOT-minimal.tar.gz" 指示这是一个特定版本(0.10.1)的...
Tez是Apache最新的支持DAG作业的开源计算框架,它可以将多个有依赖的作业转换为一个作业从而大幅提升DAG作业的性能。Tez并不直接面向最终用户——事实上它允许开发者为最终用户构建性能更快、扩展性更好的应用程序。...
Tez是Apache开源的支持DAG作业的计算框架,它直接源于...(1)Apache二级开源项目(源代码今天发布的) (2)运行在YARN之上 (3) 适用于DAG(有向图)应用(同Impala、Dremel和Drill一样,可用于替换Hive/Pig等
1、可以根据excel存储的邻接矩阵生成图数据结构的节点拓扑形式,进行可视化 2、可以用于实体关系图的绘制
尽管checkra1n最初主要是针对macOS设计的,但随着0.10.1版本的发布,它也支持Windows操作系统。这使得更多Windows用户也能体验到越狱的乐趣。为了在Windows上使用checkra1n,你需要创建一个启动盘,将checkra1n工具...
Tez 是一个由 Apache Hadoop 社区开发的通用、灵活且高效的处理框架,其设计目标是替代 MapReduce,成为Hadoop 生态系统中的新计算模型。在 `tez-0.10.1.zip` 这个压缩包中,包含了 Tez 的最新稳定版本,编译日期为...
Flask是一个使用 Python 编写的轻量级 Web 应用框架。其 WSGI 工具箱采用 Werkzeug ,模板引擎则使用 Jinja2 。Flask使用 BSD 授权。 Flask也被称为 “microframework” ,因为它使用简单的核心,用 extension 增加...
【checkra1n0.10.1.iso_checkra1n镜像文件】是一个用于在Windows操作系统上执行苹果设备越狱的工具。checkra1n是一款广受欢迎的越狱工具,它利用了iOS系统的checkm8漏洞,该漏洞是硬件级别的,因此在大多数设备上都...
servo-core-0.10.1.jar
这个是把checktrain在WIN系统上运行,进行苹果越狱工作,会制作 启动盘的朋友,可以下载下去使用。有4G的就够用的了。
【checkra1n0.10.1.iso - checkra1n镜像文件】是一个针对苹果设备的越狱工具的镜像文件版本,主要用于在Windows操作系统上执行越狱过程。checkra1n是一款广受欢迎的越狱工具,它利用了iOS系统的checkm8漏洞,这是一...
pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-...
pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-...
pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-...
pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-...