`
conkeyn
  • 浏览: 1523074 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

安装hadoop-lzo压缩库

 
阅读更多

 

Ubuntu或debain可以使用以下命令进行安装即可。

 

sudo apt-get install liblzo2-dev lzop

 CentOS或RedHat需要从以下地址去下载:

liblzo2-2.06-alt1.i586.rpm

 

liblzo2-devel-2.06-alt1.i586.rpm

 

2、下载apache ant


3、 https://github.com/kevinweil/hadoop-lzo
     a, git clone https://github.com/kevinweil/hadoop-lzo 
     b, download *.tar.gz

4、修改 hadoop-lzo的build.xml
    搜索javah
    加上<classpath refid="classpath"/>
        <javah classpath="${build.classes}"
           destdir="${build.native}/src/com/hadoop/compression/lzo"
           force="yes"
           verbose="yes">
      <class name="com.hadoop.compression.lzo.LzoCompressor" />
      <class name="com.hadoop.compression.lzo.LzoDecompressor" />
      <classpath refid="classpath"/>
    </javah>

5、编译hadoop-lzo

export CFLAGS=-m32 && export CXXFLAGS=-m32 &&  ant compile-native tar

 

6、复制libgplcompression.so

 

 cp build/native/Linux-i386-32/lib/libgplcompression.so $HADOOP_HOME/lib/native/Linux-i386-32/

  
7、拷贝 build/hadoop-lzo-0.4.15.jar 到 $HADOOP_HOME/lib

cp build/hadoop-lzo-0.4.15.jar $HADOOP_HOME/lib

8、 修改core-site.xml

<property> 
	<name>io.compression.codecs</name> 
	<value>org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.BZip2Codec,com.hadoop.compression.lzo.LzopCodec</value>
</property>
<property> 
	<name>io.compression.codec.lzo.class</name> 
	<value>com.hadoop.compression.lzo.LzoCodec</value> 
</property>

 

 

分享到:
评论

相关推荐

    hadoop-lzo-0.4.21-SNAPSHOT jars

    总的来说,Hadoop-LZO是一个针对Hadoop的LZO压缩解决方案,它提供了一种高效的数据压缩方式,尤其适合大数据处理场景,通过这个特定版本的库,开发者可以在Mac环境下为Hadoop 2.8.0实现LZO压缩功能,提升数据处理的...

    hadoop-lzo-0.4.20.jar

    5. **与Hadoop的集成**:Hadoop-LZO库提供了与Hadoop的无缝集成,允许用户直接在Hadoop作业中使用LZO压缩,无需额外的复杂配置。 然而,值得注意的是,虽然LZO速度快,但其压缩比低可能会导致存储成本增加。因此,...

    hadoop-lzo-0.4.21-SNAPSHOT.jar

    hadoop-lzo-0.4.21-SNAPSHOT.jar是该工具的Java归档(JAR)文件,它是Hadoop LZO的核心组件,包含了实现LZO压缩和解压缩功能的所有类和库。这个JAR文件需要添加到Hadoop的类路径(classpath)中,以便Hadoop集群能够...

    hadoop-lzo-master.zip

    Hadoop-LZO是一款专门为Apache Hadoop设计的高效数据压缩库,它基于开源的LZO压缩算法,旨在提高Hadoop生态系统中的数据存储和处理效率。在大数据领域,压缩技术是至关重要的,因为它可以显著减少存储需求,加快数据...

    hadoop-lzo-master

    1.安装 Hadoop-gpl-compression 1.1 wget http://hadoop-gpl-compression.apache-extras.org.codespot.com/files/hadoop-gpl-compression-0.1.0-rc0.tar.gz 1.2 mv hadoop-gpl-compression-0.1.0/lib/native/Linux-...

    hadoop-lzo所需包

    标题提到的“hadoop-lzo所需包”指的是为了在Hadoop环境中使用LZO压缩功能,需要安装的相关软件包。这些包通常包括编译环境、LZO库本身、Hadoop的LZO插件以及其他依赖项。32位和64位版本的包是为了适应不同的操作...

    lzo 2.0.6、hadoop-lzo-master、apache-maven

    【标题】"lzo 2.0.6、hadoop-lzo-master、apache-maven" 涉及的主要是三个关键元素:LZO压缩库、Hadoop-LZO项目以及Apache Maven,这些都是在大数据处理和软件构建领域的重要工具。 【LZO 2.0.6】: LZO(Lempel-...

    hadoop-lzo-0.4.15.tar.gz

    当我们谈论“hadoop-lzo-0.4.15.tar.gz”时,我们实际上是在讨论一个特定版本的Hadoop LZO库,这个库将LZO压缩技术集成到Hadoop生态系统中,以提高数据处理效率。 Hadoop LZO是由Gopala Krishna阿德瓦尼创建的,它...

    hadoop-lzo-0.4.20-SNAPSHOT.jar

    hadoop配置支持LZO压缩必备,版本号hadoop-lzo-0.4.20-SNAPSHOT.jar,

    2.Hadoop-lzo.7z lzo源码+包

    - `hadoop-lzo-0.4.20.jar`:这是一个已经编译好的Hadoop-LZO库,可以直接添加到Hadoop的类路径中,以便在不修改Hadoop源码的情况下使用LZO压缩。 - `hadoop-lzo-master.zip`:这是Hadoop-LZO项目的源代码,用户可以...

    lzo-2.06&hadoop;-lzo

    文件“lzo-2.06.tar.gz”是LZO源代码的归档文件,通过解压可以获得LZO的源代码,开发者或系统管理员可以编译安装这个库,以便在自己的系统上使用LZO压缩和解压缩工具。而“hadoop-lzo-master.zip”则是Hadoop-LZO...

    hadoop-lzo-release-0.4.20.zip

    `hadoop-lzo`是针对Hadoop优化的LZO压缩库,它为Hadoop生态系统提供了对LZO压缩格式的支持。 在这个`hadoop-lzo-release-0.4.20.zip`压缩包中,我们可能会找到以下关键组件和相关信息: 1. **源代码**:通常,开源...

Global site tag (gtag.js) - Google Analytics