系统相关属性设置:
HTableDescriptor tableDesc = new HTableDescriptor("test");
//日志flush的时候是同步写,还是异步写
tableDesc.setDurability(Durability.SYNC_WAL);
//MemStore大小 tableDesc.setMemStoreFlushSize(256*1024*1024);
HColumnDescriptor colDesc = new HColumnDescriptor("f");
//块缓存,保存着每个HFile数据块的startKey colDesc.setBlockCacheEnabled(true);
//块的大小,默认值是65536 //加载到内存当中的数据块越小,随机查找性能更好,越大,连续读性能更好
colDesc.setBlocksize(64*1024);
//bloom过滤器,有ROW和ROWCOL,ROWCOL除了过滤ROW还要过滤列族 colDesc.setBloomFilterType(BloomType.ROW);
//写的时候缓存bloom
colDesc.setCacheBloomsOnWrite(true);
//写的时候缓存索引
colDesc.setCacheIndexesOnWrite(true);
//存储的时候使用压缩算法
colDesc.setCompressionType(Algorithm.SNAPPY);
//进行compaction的时候使用压缩算法 colDesc.setCompactionCompressionType(Algorithm.SNAPPY);
//压缩内存和存储的数据,区别于Snappy colDesc.setDataBlockEncoding(DataBlockEncoding.PREFIX);
//写入硬盘的时候是否进行编码
colDesc.setEncodeOnDisk(true);
//关闭的时候,是否剔除缓存的块
colDesc.setEvictBlocksOnClose(true);
//是否保存那些已经删除掉的
kv colDesc.setKeepDeletedCells(false);
//让数据块缓存在LRU缓存里面有更高的优先级
colDesc.setInMemory(true);
//最大最小版本 colDesc.setMaxVersions(3);
colDesc.setMinVersions(1);
//集群间复制的时候,如果被设置成REPLICATION_SCOPE_LOCAL就不能被复制了 colDesc.setScope(HConstants.REPLICATION_SCOPE_GLOBAL);
//生存时间 colDesc.setTimeToLive(18000);
tableDesc.addFamily(colDesc);
分享到:
相关推荐
阿里云专有云企业版V3.12.0的云数据库HBase版开发指南,是针对企业级用户的详尽参考资料,旨在帮助开发者和管理员更好地理解和利用阿里云的HBase数据库服务。此版本的文档发布于2020年7月2日,包含了最新的功能和...
阿里云专有云企业版V3.8.2的云数据库HBase版开发指南主要针对的是阿里云的HBase服务,这是一个分布式、高吞吐量、面向列的NoSQL数据库,特别适合处理大规模数据。HBase是构建在Hadoop之上的,提供了实时的数据访问和...
虽然没有提供具体的操作细节,但可以推断,这份运维指南会详细介绍如何使用阿里云提供的工具和服务来确保HBase数据库的稳定运行,包括但不限于性能监控、问题诊断、容量规划、安全策略设定、数据迁移和备份策略等。...
阿里云专有云企业版V3.8.2的云数据库HBase版运维指南主要针对的是企业级用户,旨在提供一套详细的管理和维护方案,确保HBase数据库在专有云环境中的稳定运行。以下是对运维指南中涉及的关键知识点的详细解释: 1. *...
这份文档详细介绍了如何管理和维护在阿里云上运行的HBase数据库实例,旨在确保系统的稳定性和数据的安全性。 1. **法律声明**: - 用户在使用阿里云提供的文档前,需要同意不非法复制、分发或使用文档内容,且只能...
- 用户可能需要学习如何创建HBase实例,配置集群,设置安全策略,以及进行数据导入导出。 - HBase支持的数据模型、表设计原则以及查询语言(如HBase Shell)也是重要的学习内容。 5. **监控与维护**: - 用户...
快速入门部分可能会涵盖创建HBase实例、配置集群、数据导入导出、查询操作、性能调优以及监控和维护等内容。这部分将引导用户熟悉HBase的基本操作和特性,以便他们能快速开始使用服务。 在后续章节,用户指南会详细...
HBase API是开发者与HBase数据库交互的重要工具,它提供了创建、查询、更新和删除表等基本操作的方法。通过API,用户可以实现对HBase集群的自动化管理和监控,例如动态调整集群规模、管理表和列族、执行数据导入...
在用户指南的后续章节中,通常会涵盖如何登录控制台、创建和管理实例、配置集群、进行数据导入导出、监控与报警设置、备份与恢复策略、性能优化等方面的内容。用户可以通过这些章节逐步学习如何有效利用云数据库...
- 用户可以学习如何创建和管理HBase集群,进行数据读写,以及设置和调整集群参数等。 6. **最佳实践**: - 文档可能包含如何优化性能、保证数据安全、备份与恢复策略等方面的建议。 7. **故障排查**: - 提供了...
阿里云专有云企业版V3.7.0的云数据库HBase用户指南详细阐述了阿里云提供的分布式NoSQL数据库服务——HBase的相关知识。HBase是基于Apache HBase构建,设计用于处理大规模数据,适合半结构化和非结构化数据的存储。...
阿里云专有云企业版V3.6.1的云数据库HBase版开发指南,主要面向的是使用阿里云HBase服务的企业开发者,提供了详尽的API参考和操作指导。HBase是一款基于Apache HBase的分布式列存储数据库,特别适合处理大规模数据,...
阿里云专有云企业版V3.7.0的云数据库HBase开发指南是一份针对开发者和管理员的重要参考资料,旨在帮助用户理解和使用阿里云提供的分布式列存储数据库服务——HBase。此版本的文档适用于2019年3月22日的产品状态。 1...
所有列族下的列共享相同的前缀,每个列族下可以存储许多列,列族需要在表创建时定义,之后不得修改。 - 行(Row):表中的数据是按行存储的,每行都有一个唯一的行键(Row Key)。 - 行键(Row Key):行键用于唯一...
阿里云专有云企业版V3.12.0的云数据库HBase版运维指南主要针对使用阿里云HBase服务的企业用户,旨在提供详细的管理和维护指导。以下是对这份运维指南主要内容的详细说明: 1. **法律声明**: - 用户在使用此文档前...
阿里云专有云企业版V3.7.1的云数据库HBase产品是为企业级大数据存储和处理场景设计的一款高可用、高性能、分布式列式数据库服务。HBase是基于Apache HBase的云化版本,提供了丰富的管理功能和优化的性能表现,旨在...
阿里云专有云企业版V3.7.1的云数据库HBase技术白皮书是针对阿里云HBase服务的一份详细技术文档,旨在提供关于该服务的核心特性和使用指导。HBase是一款基于Apache HBase的分布式列式存储系统,特别适合处理大规模...
阿里云专有云企业版V3.8.2的云数据库HBase版用户指南主要针对的是使用阿里云HBase服务的企业和技术人员。阿里云HBase是一款基于Apache HBase的分布式列存储数据库,适用于大规模结构化数据的存储和实时查询。在V...
进入分布式计算框架,Hadoop是一个不得不提的重量级开源项目。Hadoop的核心是HDFS(Hadoop Distributed File System),它是一种分布式文件系统,可以在廉价的商用硬件上提供高吞吐量的数据访问。HBase则是在Hadoop...