Ubuntu或debain可以使用以下命令进行安装即可。
sudo apt-get install liblzo2-dev lzop
CentOS或RedHat需要从以下地址去下载:
liblzo2-devel-2.06-alt1.i586.rpm
2、下载apache ant
3、 https://github.com/kevinweil/hadoop-lzo
a, git clone https://github.com/kevinweil/hadoop-lzo
b, download *.tar.gz
4、修改 hadoop-lzo的build.xml
搜索javah
加上<classpath refid="classpath"/>
<javah classpath="${build.classes}"
destdir="${build.native}/src/com/hadoop/compression/lzo"
force="yes"
verbose="yes">
<class name="com.hadoop.compression.lzo.LzoCompressor" />
<class name="com.hadoop.compression.lzo.LzoDecompressor" />
<classpath refid="classpath"/>
</javah>
5、编译hadoop-lzo
export CFLAGS=-m32 && export CXXFLAGS=-m32 && ant compile-native tar
6、复制libgplcompression.so
cp build/native/Linux-i386-32/lib/libgplcompression.so $HADOOP_HOME/lib/native/Linux-i386-32/
7、拷贝 build/hadoop-lzo-0.4.15.jar 到 $HADOOP_HOME/lib
cp build/hadoop-lzo-0.4.15.jar $HADOOP_HOME/lib
8、 修改core-site.xml
<property> <name>io.compression.codecs</name> <value>org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.BZip2Codec,com.hadoop.compression.lzo.LzopCodec</value> </property> <property> <name>io.compression.codec.lzo.class</name> <value>com.hadoop.compression.lzo.LzoCodec</value> </property>
相关推荐
总的来说,Hadoop-LZO是一个针对Hadoop的LZO压缩解决方案,它提供了一种高效的数据压缩方式,尤其适合大数据处理场景,通过这个特定版本的库,开发者可以在Mac环境下为Hadoop 2.8.0实现LZO压缩功能,提升数据处理的...
5. **与Hadoop的集成**:Hadoop-LZO库提供了与Hadoop的无缝集成,允许用户直接在Hadoop作业中使用LZO压缩,无需额外的复杂配置。 然而,值得注意的是,虽然LZO速度快,但其压缩比低可能会导致存储成本增加。因此,...
hadoop-lzo-0.4.21-SNAPSHOT.jar是该工具的Java归档(JAR)文件,它是Hadoop LZO的核心组件,包含了实现LZO压缩和解压缩功能的所有类和库。这个JAR文件需要添加到Hadoop的类路径(classpath)中,以便Hadoop集群能够...
Hadoop-LZO是一款专门为Apache Hadoop设计的高效数据压缩库,它基于开源的LZO压缩算法,旨在提高Hadoop生态系统中的数据存储和处理效率。在大数据领域,压缩技术是至关重要的,因为它可以显著减少存储需求,加快数据...
1.安装 Hadoop-gpl-compression 1.1 wget http://hadoop-gpl-compression.apache-extras.org.codespot.com/files/hadoop-gpl-compression-0.1.0-rc0.tar.gz 1.2 mv hadoop-gpl-compression-0.1.0/lib/native/Linux-...
标题提到的“hadoop-lzo所需包”指的是为了在Hadoop环境中使用LZO压缩功能,需要安装的相关软件包。这些包通常包括编译环境、LZO库本身、Hadoop的LZO插件以及其他依赖项。32位和64位版本的包是为了适应不同的操作...
【标题】"lzo 2.0.6、hadoop-lzo-master、apache-maven" 涉及的主要是三个关键元素:LZO压缩库、Hadoop-LZO项目以及Apache Maven,这些都是在大数据处理和软件构建领域的重要工具。 【LZO 2.0.6】: LZO(Lempel-...
当我们谈论“hadoop-lzo-0.4.15.tar.gz”时,我们实际上是在讨论一个特定版本的Hadoop LZO库,这个库将LZO压缩技术集成到Hadoop生态系统中,以提高数据处理效率。 Hadoop LZO是由Gopala Krishna阿德瓦尼创建的,它...
hadoop配置支持LZO压缩必备,版本号hadoop-lzo-0.4.20-SNAPSHOT.jar,
- `hadoop-lzo-0.4.20.jar`:这是一个已经编译好的Hadoop-LZO库,可以直接添加到Hadoop的类路径中,以便在不修改Hadoop源码的情况下使用LZO压缩。 - `hadoop-lzo-master.zip`:这是Hadoop-LZO项目的源代码,用户可以...
文件“lzo-2.06.tar.gz”是LZO源代码的归档文件,通过解压可以获得LZO的源代码,开发者或系统管理员可以编译安装这个库,以便在自己的系统上使用LZO压缩和解压缩工具。而“hadoop-lzo-master.zip”则是Hadoop-LZO...
`hadoop-lzo`是针对Hadoop优化的LZO压缩库,它为Hadoop生态系统提供了对LZO压缩格式的支持。 在这个`hadoop-lzo-release-0.4.20.zip`压缩包中,我们可能会找到以下关键组件和相关信息: 1. **源代码**:通常,开源...