`
san_yun
  • 浏览: 2637732 次
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

hbase 写入性能

 
阅读更多

 

hbase单表的平均写入QPS大概在5000-7000左右。

测试代码:

 

 

private static void doMigrate(HTable inTable, HTable outTable, Date beginTime, Date endTime) throws ParseException,
			IOException {
		Scan scan = new Scan();
		scan.setCacheBlocks(false);
		scan.setTimeRange(beginTime.getTime(), endTime.getTime());
		scan.setCaching(100);

		ResultScanner scanner = inTable.getScanner(scan);
		Iterator<Result> res = scanner.iterator();
		int count = 0;
		List<Put> puts = new ArrayList<Put>();

		long begin = System.currentTimeMillis();

		while (res.hasNext()) {
			try {
				count++;
				Result result = res.next();
				KeyValue[] allKvs = result.raw();
				byte[] rowkey = result.getRow();
				if (count % 200 == 0) {
					outTable.put(puts);
					puts.clear();
				}
				if (count % 10000 == 0) {
					long end = System.currentTimeMillis();
					System.out.println("put " + (count - 10000) + " to " + count + " cost:" + (end - begin));
					begin = System.currentTimeMillis();
				}
				Put put = new Put(rowkey);
				for (KeyValue kv : allKvs) {
					put.add(kv);
				}
				puts.add(put);
				System.out.println("put " + count + ",rowkey=" + Bytes.toString(rowkey));
			} catch (Exception e) {
				System.out.println("error!!!");
				System.out.println(e.getMessage());
				e.printStackTrace();
			}

		}

 参考:提升HBase写性能

 

 

分享到:
评论

相关推荐

    HBase写性能优化策略

    批量操作是另一个显著影响HBase写入性能的因素。在单条put操作与批量put操作之间,后者可以明显减少客户端到RegionServer的RPC连接数,从而提高写入性能。HBase提供的批量put接口能够将多个写入请求打包,一起处理,...

    HBase的性能优化

    HBase的RegionServer处理器数量直接影响着写入性能。默认情况下,HBase的RegionServer处理器数量为10,可以根据实际情况调整这个值。例如,将Handler Count设置为100,可以明显提高写入性能。 调整HFile Block ...

    HBase性能深度分析

    ### HBase性能深度分析 HBase,作为BigTable的一个开源实现,因其...未来,针对HBase的性能优化,可以从调整上述参数配置、优化数据写入模式、强化集群资源管理等方面入手,以满足不同场景下的高效率数据处理需求。

    hbase性能测试.docx

    - **Elapsed time in milliseconds**:460,290 毫秒,这是随机读取1048570行数据所花费的时间,比写入时间要长,说明HBase在随机读取上的性能相对较低。 - **Row count**:与写入测试相同,读取了1048570行数据,...

    某大数据公司内部Hbase性能测试详细设计文档及用例

    "HBase性能测试详细设计文档及用例" 本文档旨在详细介绍HBase性能测试的设计文档和实践经验,涵盖了HBase性能测试需要注意的一些参数...如果WAL Flag设置为false,那么写入操作将不会被记录到WAL中,以提高写入性能。

    hadoop hbase性能报告(英文)

    HBase在处理大量柱族时面临性能挑战,特别是在高柱族数量下的写入和读取操作。然而,通过合理配置和避免极端使用场景,HBase能够提供令人满意的性能。此外,与BigTable相比,HBase的性能差距表明了进一步优化和开发...

    藏经阁-HBase in Practise- 性能、监控和问题排查.pdf

    * Flush 机制:Flush 是 HBase 中的一种机制,用于将内存中的数据写入磁盘以确保数据的一致性。可以通过调整 Flush 的阈值、频率和策略来优化性能。 监控 HBase 的监控是指对 HBase 的运行状态和性能进行实时监控...

    hbase性能优化

    在HBase的使用中,如果直接将时间戳作为行健,会导致写入单个region时出现热点问题。因为HBase的rowkey是有序存储,时间集中会导致同一时间戳的数据集中到一个region中,导致该region成为热点,其他region访问速度变...

    同步代码异常.docx

    - HBase写入性能下降可能与RowKey设计和Block Size设置有关。优化RowKey设计以分散写入,调整Block Size和RegionSplit策略可以提升写入性能。Phoenix的预分区(SALT_BUCKETS)也可以改善写入效率。 在处理这些问题...

    Phoenix_on_HBase性能测试报告.pdf

    Phoenix on HBase 是一个基于 HBase 的高性能数据处理引擎,它可以提供快速的数据查询和写入性能。在本报告中,我们对 Phoenix on HBase 的性能进行了测试,以探索其在数据查询和写入方面的特性和限制。 测试环境 ...

    Hbase调用JavaAPI实现批量导入操作

    - 合理配置HBase:调整HBase的Region大小,负载均衡,以及写入缓冲区等参数,优化导入性能。 6. **错误处理和重试机制**: 在批量导入过程中,可能会遇到网络异常、Region Server故障等问题,因此需要实现错误...

    java操作Hbase之从Hbase中读取数据写入hdfs中源码

    在Java编程环境中,操作HBase并将其数据写入HDFS(Hadoop Distributed File System)是一项常见的任务,特别是在大数据处理和分析的场景下。本篇将详细介绍如何使用Java API实现这一功能,以及涉及到的关键技术和...

    HBase性能监控及最佳实践.pptx

    虽然在1.2.0版本之前存在复制问题,但多WAL能显著提高写入性能,提升约20%。配置项hbase.wal.provider设为multiwal,hbase.wal.regiongrouping.strategy设为bounded,可根据磁盘数量调整hbase.wal.regiongrouping....

    hbase性能调优手册

    本文主要介绍HBase性能调优的几种常用方法,重点在于理解性能优化背后的核心概念及其应用。 ### Rowkey设计 Rowkey是HBase中每行数据的唯一标识,它的设计对于性能有着至关重要的影响。一个良好的Rowkey设计应当...

    HbaseTemplate 操作hbase

    在IT行业中,尤其是在大数据处理领域,HBase是一个广泛使用的分布式、高性能、列式存储的NoSQL数据库。HBase是建立在Hadoop文件系统(HDFS)之上,为处理大规模数据提供了一个高效的数据存储解决方案。而Spring Data...

    HBASE性能调优方法1

    然而,对于不那么重要的数据,可以通过设置`Put.setWriteToWAL(false)`或`Delete.setWriteToWAL(false)`来跳过WAL,提高写入性能,但牺牲了一定的数据安全性。 4. 数据压缩(Compression): 使用SNAPPY压缩算法可以...

    HBase性能优化指南

    - **预分割表**: 通过预先分割表,减少Region的分裂次数,可以改善写入性能。 - **负载均衡**: 确保RegionServer负载均衡,避免某些服务器过载而其他空闲。 #### HBase客户端优化 - **批量操作**: 使用批量get和...

    hbase性能优化.pdf

    这些参数对HBase的写入性能、数据一致性和系统稳定性有显著影响。 1. `hbase.hregion.max.filesize`的设定: 这个参数定义了单个HStoreFile的最大大小。默认值是256MB,当一个列族的HStoreFile超过这个大小时,...

    Kafka集成Spark Streaming并写入数据到HBase

    **Kafka、Spark Streaming与HBase的集成**...6. **数据写入HBase**:将处理后的数据转换为Put操作,然后使用`hbaseContext.bulkPut`将数据批量写入HBase表。 **参考链接** 对于更详细的实现步骤,可以参考以下链接: ...

Global site tag (gtag.js) - Google Analytics