系统: gentoo
HDFS: hadoop:hadoop-0.20.2-cdh3u0
HBase: HBase:0.90.3
安装过程:
1、安装lzo
emerge dev-libs/lzo
2.1 下载
download from:
wget http://www.apache.org/dist//hbase/hbase-0.90.3/hbase-0.90.3.tar.gz
wget http://hadoop-gpl-compression.apache-extras.org.codespot.com/files/hadoop-gpl-compression-0.1.0-rc0.tar.gz
2.2 编译
tar -zxvf hadoop-gpl-compression-0.1.0-rc0.tar.gz
cd hadoop-gpl-compression-0.1.0
cp $HADOOP_HOME//hadoop-core-0.20.2-cdh3u0.jar lib/
nano -w src/java/com/hadoop/compression/lzo/LzoCompressor.java
......
import org.apache.hadoop.conf.Configuration;
.....
public void reinit(Configuration conf) {
// do nothing
}
ant compile-native tar
2.3 拷贝需要的文件
cp build/hadoop-gpl-compression-0.1.0-dev.jar $HADOOP_HOME/lib/
cp build/hadoop-gpl-compression-0.1.0-dev.jar $HBASE_HOME/lib/
rsync -auPv lib/native $HADOOP_HOME/lib/
rsync -auPv lib/native $HBASE_HOME/lib/
3.修改配置重启HBase和Hadoop
nano core-site.xml
<property>
<name>io.compression.codecs</name>
<value>com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec</value>
</property>
<property>
<name>io.compression.codec.lzo.class</name>
<value>com.hadoop.compression.lzo.LzoCodec</value>
</property>
4 测试是否成功
bin/hbase org.apache.hadoop.hbase.util.CompressionTest hdfs://test1.namenode.uc.uuwatch.com:9000/test_path lzo
5 参考资料
http://wiki.apache.org/hadoop/UsingLzoCompression
http://wiki.apache.org/hadoop/Hbase/HdfsSyncSupport
http://koven2049.iteye.com/blog/983502
分享到:
相关推荐
总结来说,安装和配置HBase中的LZO压缩涉及到多个步骤,包括下载源码、编译、配置Hadoop和HBase,以及在Master节点上确保压缩功能的正确运行。合理使用LZO压缩可以显著提升HBase的存储和性能,但也要注意适时的性能...
1. **修改HBase配置**: 在`hbase-site.xml`配置文件中,你需要添加或修改以下配置项: ```xml <name>hbase.hregion.block压编码 <value>org.apache.hadoop.hbase.io.compress.SnappyCodec <name>hbase...
1 介绍 大数据时代,海量数据的存储和分析是一个巨大的挑战...主流的HBase压缩方式有LZO和Snappy,Snappy的压缩比会稍微优于LZO,具体的对比,可参考这篇文章:http://www.cnblogs.com/zhengrunjian/p/4527165.html Sna
启用LZO压缩可以将数据压缩到原来的一半大小,从而提高存储效率和查询性能。 调整Handler Count HBase的RegionServer处理器数量直接影响着写入性能。默认情况下,HBase的RegionServer处理器数量为10,可以根据实际...
### 云计算Hadoop伪集群与HBase安装配置详解 #### 1. 综述 本文档旨在为IT工程师提供在单台Linux服务器上...此外,还介绍了XData、Solr以及LZO压缩模块的安装配置流程,这些组件能够进一步增强系统的功能性和效率。
3. **HBase配置调整**:例如增大`hbase.hregion.max.filesize`以控制Region大小,调整`hbase.regionserver.handler.count`以增加处理线程数,或者优化`hbase.hregion.memstore.flush.size`以平衡内存和磁盘IO。...
3. **适合随机访问**:LZO压缩后的数据块较小,适合于需要频繁进行随机读取的场景。 **在CDH4.3中安装LZO** 1. **下载LZO库**:首先,你需要从官方网站或第三方源下载适用于Hadoop的LZO库。 2. **编译和安装**:...
2. 表和Column Family的压缩优化:支持更多压缩算法,如LZO、Snappy和Gzip,可以灵活配置以节省存储空间。 3. Coprocessor框架:允许用户自定义逻辑在服务器端运行,实现细粒度的数据处理和验证,提高效率。 4. 新的...
大象鸟(Elephant Bird)是一个由Twitter开源的项目,主要用于处理LZO压缩的数据和协议缓冲区相关的Hadoop、Pig、Hive以及HBase的代码。这个项目的核心在于提供了一套高效的工具,使得在大数据处理框架中对LZO压缩...
* 启用压缩:使用GZIP、Snappy、LZO等压缩算法可以提高HBase的性能 * MemStore缓存配置: MemStore缓存可以提高HBase的性能 * Region拆分和合并:预建分区可以避免自动split,提高HBase的响应速度 * Region均衡:...
对于大内存机器,可能需要调整特定配置以优化性能,如增大 BlockCache 大小或启用 LZO 压缩。此外,客户端连接 HBase 集群也需要相应的配置。 **升级** HBase 的升级过程需要注意版本兼容性和迁移策略,例如从 ...
1. 修改HBase配置文件(如:hbase-site.xml),添加如下配置: ``` <name>hbase.regionserver.blockcompress.table.default <value>SNAPPY ``` 2. 重启HBase集群,新配置将生效,所有新创建的表默认使用...
总结,HBase性能调优是一项综合性的任务,涉及JVM配置、数据压缩策略、region管理等多个方面。理解这些关键点并根据实际应用场景进行优化,能够显著提高HBase系统的整体性能和稳定性。在实际操作中,还需要不断监控...
HBase和BigTable都提供了数据块压缩功能,不过BigTable使用BMDiff和Zippy算法,而HBase则使用GZip和LZO压缩。 在列族管理上,BigTable的列族数量有限制,但理论上行数和列数是无限的。相比之下,HBase虽然理论上也...
Snapp用户界面一个Web界面,用于查看随时间推移的照片系列。用法单击(或点击)图像的右/左一半转到下一个/上一个图像。安装与配置启动它git clone git@github.... # install nvm (node
标题中的“hadoop毅哥的...总之,这个压缩包提供了一个学习和操作Hadoop 2.7.2以及LZO压缩的起点,对于熟悉Hadoop的分布式存储和处理,以及数据压缩有极大的帮助。无论是初学者还是经验丰富的开发者,都可以从中受益。
选择合适的压缩算法(如Snappy、LZO、GZ等)可以兼顾存储和计算的平衡。 5. **缓存策略**:HBase 使用BlockCache和MemStore来缓存数据,合理配置缓存大小和策略能显著提升读写速度。例如,热数据可以设置在缓存中,...
在数据压缩方面,Hadoop和Hbase支持Gzip、LZO和Snappy三种压缩算法。选择合适的压缩方式不仅能减少传输数据,还能提高I/O和带宽效率。实际应用中,应根据业务需求和硬件性能对比测试,选取最佳方案。 对于写表操作...
在淘宝主搜索系统中,采用的是Hadoop CDH3U4和HBase 0.92.11版本,同时利用LZO进行数据压缩。选择LZO的主要原因是其提供更高效的数据压缩率,对于降低存储空间需求和提高读写效率有显著作用。然而,在优化过程中,需...