`
guoyunsky
  • 浏览: 854143 次
  • 性别: Icon_minigender_1
  • 来自: 上海
博客专栏
3d3a22a0-f00f-3227-8d03-d2bbe672af75
Heritrix源码分析
浏览量:206217
Group-logo
SQL的MapReduce...
浏览量:0
社区版块
存档分类
最新评论

Apache Pig 0.10.1发布

 
阅读更多

       Apache Pig 0.10.1已经发布,这个版本并没有什么特性,更多的是为了稳定性以及一些bug的修正

      

       显著变化:

      1. 代码独立以及支持多种格式的下载.

            下载地址: http://www.fightrice.com/mirrors/apache/pig/pig-0.10.1/

             可以通过tar.gz,rpm,deb等方式下载获取

      2. 更好的支持 Apache Hadoop 0.23.x/2.x 

            从0.10.0开始,pig就已经加入了Maven仓库.你可以通过以下方式配置pom.xml来使用pig0.10.1

<dependency>
 
 <groupId>org.apache.pig</groupId>
 
 <artifactId>pig</artifactId>
 
 <version>0.10.1</version>
 
 <classifier>h2</classifier>
 
</dependency>

           同时Pig团队修正了Pig运行在Hadoop 0.23X/2.X版本上的一些Bug( PIG-3035PIG-2783PIG-2761PIG-2912, PIG-2791)

      3.更好的支持Oracle JDK7.0

      4.单元测试的错误修正

      

       具体修改如下:

       IMPROVEMENTS

 

PIG-2907: Publish pig jars for Hadoop2/23 to maven (rohini)

 

PIG-3019: Need a target in build.xml for source releases (gates)

 

PIG-2794: Pig test: add utils to simplify testing on Windows (jgordon via gates)

 

PIG-2908: Fix unit tests to work with jdk7 (rohini via dvryaboy) 

 

PIG-2852: Update documentation regarding parallel local mode execution (cheolsoo via jcoveney)

 

PIG-2712: Pig does not call OutputCommitter.abortJob() on the underlying OutputFormat (rohini via gates)

 

PIG-2727: PigStorage Source tagging does not need pig.splitCombination to be turned off (prkommireddi via dvryaboy)

 

PIG-2711: e2e harness: cache benchmark results between test runs (thw via daijy)

 

PIG-2680: TOBAG output schema reporting (andy schlaikjer via jcoveney)

 

PIG-2650: Convenience mock Loader and Storer to simplify unit testing of Pig scripts (julien)

 

BUG FIXES

 

PIG-3107: bin and autocomplete are missing in src release (daijy)

 

PIG-3106: Missing license header in several java file (daijy)

 

PIG-3099: Pig unit test fixes for TestGrunt(1), TestStore(2), TestEmptyInputDir(3) (vikram.dixit via daijy)

 

PIG-3035: With latest version of hadoop23 pig does not return the correct exception stack trace from backend (rohini)

 

PIG-2953: "which" utility does not exist on Windows (daijy)

 

PIG-2960: Increase the timeout for unit test (daijy)

 

PIG-2958: Pig tests do not appear to have a logger attached (daijy)

 

PIG-2942: DevTests, TestLoad has a false failure on Windows (jgordon via daijy)

 

PIG-2943: DevTests, Refactor Windows checks to use new Util.WINDOWS method for code health (jgordon via dvryaboy)

 

PIG-2801: grunt "sh" command should invoke the shell implicitly instead of calling exec directly with the command tokens

(jgordon via daijy)

 

PIG-2800: pig.additional.jars path separator should align with File.pathSeparator instead of being hard-coded to ":"

(jgordon via azaroth)

 

PIG-2798: pig streaming tests assume interpreters are auto-resolved (jgordon via daijy)

 

PIG-2797: Tests should not create their own file URIs through string concatenation, should use Util.generateURI

instead (jgordon via daijy)

 

PIG-2796: Local temporary paths are not always valid HDFS path names (jgordon via daijy)

 

PIG-2795: Fix test cases that generate pig scripts with "load " + pathStr to encode "\" in the path (jgordon via daijy)

 

PIG-2940: HBaseStorage store fails in secure cluster (cheolsoo via daijy)

 

PIG-2821: HBaseStorage should work with secure hbase (rohini via daijy)

 

PIG-2890: Revert PIG-2578 (dvryaboy)

 

PIG-2859: Fix few e2e test failures (rohini via daijy)

 

PIG-2729: Macro expansion does not use pig.import.search.path - UnitTest borked (johannesch via daijy)

 

PIG-2791: Pig does not work with Namenode Federation (rohini via daijy)

 

PIG-2783: Fix Iterator_1 e2e test for Hadoop 23 (rohini via daijy)

 

PIG-2761: With hadoop23 importing modules inside python script does not work (rohini via daijy)

 

PIG-2759: Typo in document "Built In Functions" (daijy)

 

PIG-2745: Pig e2e test RubyUDFs fails in MR mode when running from tarball (cheolsoo via daijy)

 

PIG-2741: Python script throws an NameError: name 'Configuration' is not defined in case cache dir is not created

(knoguchi via daijy)

 

PIG-2669: Pig release should include pig-default.properties after rebuild (daijy)

 

PIG-2739: PyList should map to Bag automatically in Jython (daijy)

 

PIG-2730: TFileStorage getStatistics incorrectly throws an exception instead of returning null (traviscrawford via daijy)

 

PIG-2717: Tuple field mangled during flattening (daijy)

 

PIG-2721: Wrong output generated while loading bags as input (knoguchi via daijy)

 

PIG-2912: Pig should clone JobConf while creating JobContextImpl and TaskAttemptContextImpl in Hadoop23 (rohini via daijy)

 

PIG-2775: Register jar does not goes to classpath in some cases (daijy)

 

粗鲁的翻译自:http://hortonworks.com/blog/apache-pig-0-10-1-released/    

 

更多技术文章、感悟、分享、勾搭,请用微信扫描:

2
2
分享到:
评论

相关推荐

    apache-iotdb-0.10.1-incubating-bin.zip

    这个"apache-iotdb-0.10.1-incubating-bin.zip"压缩包包含的是IoTDB的0.10.1版本的二进制发行版,适合在生产环境中快速部署和使用。 IoTDB的核心功能包括高效的时间序列数据存储、查询以及管理。时间序列数据是指随...

    apache-mahout-distribution-0.10.1

    Apache Mahout 项目旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout 的创始者 Grant Ingersoll 介绍了机器学习的基本概念,并演示了如何使用 Mahout 来实现文档集群、提出建议和组织内容。

    apache-log4cxx-0.10.1.zip

    这个"apache-log4cxx-0.10.1.zip"压缩包包含了Log4cxx的0.10.1版本,这是一个稳定且广泛使用的版本,适合在Linux环境下进行日志管理和输出。 Log4cxx的设计目标是提供一个灵活的日志系统,允许开发者根据需要调整...

    kafka -0.10.0与0.10.1的API文档

    Kafka是Apache软件基金会开发的一个开源流处理平台,它最初由LinkedIn设计并开源,现在已经成为大数据领域中的重要组件。此压缩包包含的是Kafka 0.10.0和0.10.1两个版本的API文档,对于理解这两个版本之间的差异以及...

    tez-0.10.1-SNAPSHOT-minimal.tar.gz

    Tez是Hadoop生态系统中的一个开源任务执行框架,它由Apache Software Foundation开发,用于提高Hive、Pig等数据处理工具的性能。 【描述】"tez-0.10.1-SNAPSHOT-minimal.tar.gz" 指示这是一个特定版本(0.10.1)的...

    apache-tez-0.10.1-src.tar.gz

    Tez是Apache最新的支持DAG作业的开源计算框架,它可以将多个有依赖的作业转换为一个作业从而大幅提升DAG作业的性能。Tez并不直接面向最终用户——事实上它允许开发者为最终用户构建性能更快、扩展性更好的应用程序。...

    tez-0.10.1-SNAPSHOT.tar.gz

    总结来说,Tez-0.10.1-SNAPSHOT.tar.gz是Apache Tez的一个开发版本,它提供了一个高效的数据处理框架,尤其是作为Hive的执行引擎,提升了大数据分析的性能。这个压缩包包含了Tez的核心组件、API、运行时库以及测试...

    gephi0.10.1

    1、可以根据excel存储的邻接矩阵生成图数据结构的节点拓扑形式,进行可视化 2、可以用于实体关系图的绘制

    apache-tez-0.8.3-src.tar.gz

    Tez是Apache开源的支持DAG作业的计算框架,它直接源于...(1)Apache二级开源项目(源代码今天发布的) (2)运行在YARN之上 (3) 适用于DAG(有向图)应用(同Impala、Dremel和Drill一样,可用于替换Hive/Pig等

    checkra1n 0.10.1.iso苹果越狱软件工具下载

    尽管checkra1n最初主要是针对macOS设计的,但随着0.10.1版本的发布,它也支持Windows操作系统。这使得更多Windows用户也能体验到越狱的乐趣。为了在Windows上使用checkra1n,你需要创建一个启动盘,将checkra1n工具...

    tez-0.10.1.zip

    Tez 是一个由 Apache Hadoop 社区开发的通用、灵活且高效的处理框架,其设计目标是替代 MapReduce,成为Hadoop 生态系统中的新计算模型。在 `tez-0.10.1.zip` 这个压缩包中,包含了 Tez 的最新稳定版本,编译日期为...

    Flask 0.10.1.pdf

    Flask是一个使用 Python 编写的轻量级 Web 应用框架。其 WSGI 工具箱采用 Werkzeug ,模板引擎则使用 Jinja2 。Flask使用 BSD 授权。 Flask也被称为 “microframework” ,因为它使用简单的核心,用 extension 增加...

    checkra1n0.10.1.iso_checkra1n镜像文件

    【checkra1n0.10.1.iso_checkra1n镜像文件】是一个用于在Windows操作系统上执行苹果设备越狱的工具。checkra1n是一款广受欢迎的越狱工具,它利用了iOS系统的checkm8漏洞,该漏洞是硬件级别的,因此在大多数设备上都...

    servo-core-0.10.1.jar

    servo-core-0.10.1.jar

    checkra1n 0.10.1.iso

    这个是把checktrain在WIN系统上运行,进行苹果越狱工作,会制作 启动盘的朋友,可以下载下去使用。有4G的就够用的了。

    pandas-0.10.1.win32-py3.2.exe

    pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-py3.2.exe pandas-0.10.1.win32-...

    pandas-0.10.1.win32-py3.1.exe

    pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-py3.1.exe pandas-0.10.1.win32-...

    pandas-0.10.1.win32-py2.7.exe

    pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-py2.7.exe pandas-0.10.1.win32-...

    pandas-0.10.1.win32-py2.6.exe

    pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-py2.6.exe pandas-0.10.1.win32-...

    pandas-0.10.1.zip

    pandas-0.10.1.zip pandas-0.10.1.zip pandas-0.10.1.zip pandas-0.10.1.zip pandas-0.10.1.zip pandas-0.10.1.zip pandas-0.10.1.zip pandas-0.10.1.zip pandas-0.10.1.zip pandas-0.10.1.zip

Global site tag (gtag.js) - Google Analytics