hbase 写入性能 - san_yun - ITeye博客

`

san_yun

浏览: 2685233 次
来自: 杭州

最近访客更多访客>>

空城旧梦why

sd3870181

alexqdjay

hanmiao

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

siphlina：课程——基于Python数据分析与机器学习案例实战教程分享网盘 ...
Python机器学习库
san_yun： leibnitz 写道hi,我想知道,无论在92还是94版本, ...
hbase的行锁与多版本并发控制(MVCC)
leibnitz： hi,我想知道,无论在92还是94版本,更新时(如Puts)都 ...
hbase的行锁与多版本并发控制(MVCC)
107x：不错，谢谢！
Latent Semantic Analysis(LSA/ LSI)算法简介
107x：不错，谢谢！
Python机器学习库

hbase 写入性能

博客分类：

性能

阅读更多

hbase单表的平均写入QPS大概在5000-7000左右。

测试代码：

private static void doMigrate(HTable inTable, HTable outTable, Date beginTime, Date endTime) throws ParseException,
			IOException {
		Scan scan = new Scan();
		scan.setCacheBlocks(false);
		scan.setTimeRange(beginTime.getTime(), endTime.getTime());
		scan.setCaching(100);

		ResultScanner scanner = inTable.getScanner(scan);
		Iterator<Result> res = scanner.iterator();
		int count = 0;
		List<Put> puts = new ArrayList<Put>();

		long begin = System.currentTimeMillis();

		while (res.hasNext()) {
			try {
				count++;
				Result result = res.next();
				KeyValue[] allKvs = result.raw();
				byte[] rowkey = result.getRow();
				if (count % 200 == 0) {
					outTable.put(puts);
					puts.clear();
				}
				if (count % 10000 == 0) {
					long end = System.currentTimeMillis();
					System.out.println("put " + (count - 10000) + " to " + count + " cost:" + (end - begin));
					begin = System.currentTimeMillis();
				}
				Put put = new Put(rowkey);
				for (KeyValue kv : allKvs) {
					put.add(kv);
				}
				puts.add(put);
				System.out.println("put " + count + ",rowkey=" + Bytes.toString(rowkey));
			} catch (Exception e) {
				System.out.println("error!!!");
				System.out.println(e.getMessage());
				e.printStackTrace();
			}

		}

参考：提升HBase写性能

分享到：

Hadoop Metrics体系架构分析 | 通过设置SolrInputDocument 的boost来改变 ...

2014-02-05 16:35
浏览 1897
评论(0)
分类:非技术
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

HBase写性能优化策略: 批量操作是另一个显著影响HBase写入性能的因素。在单条put操作与批量put操作之间，后者可以明显减少客户端到RegionServer的RPC连接数，从而提高写入性能。HBase提供的批量put接口能够将多个写入请求打包，一起处理，...

HBase的性能优化: HBase的RegionServer处理器数量直接影响着写入性能。默认情况下，HBase的RegionServer处理器数量为10，可以根据实际情况调整这个值。例如，将Handler Count设置为100，可以明显提高写入性能。调整HFile Block ...

HBase性能深度分析: ### HBase性能深度分析 HBase，作为BigTable的一个开源实现，因其...未来，针对HBase的性能优化，可以从调整上述参数配置、优化数据写入模式、强化集群资源管理等方面入手，以满足不同场景下的高效率数据处理需求。

hbase性能测试.docx: - **Elapsed time in milliseconds**：460,290 毫秒，这是随机读取1048570行数据所花费的时间，比写入时间要长，说明HBase在随机读取上的性能相对较低。 - **Row count**：与写入测试相同，读取了1048570行数据，...

某大数据公司内部Hbase性能测试详细设计文档及用例: "HBase性能测试详细设计文档及用例" 本文档旨在详细介绍HBase性能测试的设计文档和实践经验，涵盖了HBase性能测试需要注意的一些参数...如果WAL Flag设置为false，那么写入操作将不会被记录到WAL中，以提高写入性能。

hadoop hbase性能报告(英文): HBase在处理大量柱族时面临性能挑战，特别是在高柱族数量下的写入和读取操作。然而，通过合理配置和避免极端使用场景，HBase能够提供令人满意的性能。此外，与BigTable相比，HBase的性能差距表明了进一步优化和开发...

藏经阁-HBase in Practise- 性能、监控和问题排查.pdf: * Flush 机制：Flush 是 HBase 中的一种机制，用于将内存中的数据写入磁盘以确保数据的一致性。可以通过调整 Flush 的阈值、频率和策略来优化性能。监控 HBase 的监控是指对 HBase 的运行状态和性能进行实时监控...

hbase性能优化: 在HBase的使用中，如果直接将时间戳作为行健，会导致写入单个region时出现热点问题。因为HBase的rowkey是有序存储，时间集中会导致同一时间戳的数据集中到一个region中，导致该region成为热点，其他region访问速度变...

同步代码异常.docx: - HBase写入性能下降可能与RowKey设计和Block Size设置有关。优化RowKey设计以分散写入，调整Block Size和RegionSplit策略可以提升写入性能。Phoenix的预分区（SALT_BUCKETS）也可以改善写入效率。在处理这些问题...

Phoenix_on_HBase性能测试报告.pdf: Phoenix on HBase 是一个基于 HBase 的高性能数据处理引擎，它可以提供快速的数据查询和写入性能。在本报告中，我们对 Phoenix on HBase 的性能进行了测试，以探索其在数据查询和写入方面的特性和限制。测试环境 ...

java操作Hbase之从Hbase中读取数据写入hdfs中源码: 在Java编程环境中，操作HBase并将其数据写入HDFS（Hadoop Distributed File System）是一项常见的任务，特别是在大数据处理和分析的场景下。本篇将详细介绍如何使用Java API实现这一功能，以及涉及到的关键技术和...

HBase性能监控及最佳实践.pptx: 虽然在1.2.0版本之前存在复制问题，但多WAL能显著提高写入性能，提升约20%。配置项hbase.wal.provider设为multiwal，hbase.wal.regiongrouping.strategy设为bounded，可根据磁盘数量调整hbase.wal.regiongrouping....

hbase性能调优手册: 本文主要介绍HBase性能调优的几种常用方法，重点在于理解性能优化背后的核心概念及其应用。 ### Rowkey设计 Rowkey是HBase中每行数据的唯一标识，它的设计对于性能有着至关重要的影响。一个良好的Rowkey设计应当...

HbaseTemplate 操作hbase: 在IT行业中，尤其是在大数据处理领域，HBase是一个广泛使用的分布式、高性能、列式存储的NoSQL数据库。HBase是建立在Hadoop文件系统（HDFS）之上，为处理大规模数据提供了一个高效的数据存储解决方案。而Spring Data...

HBASE性能调优方法1: 然而，对于不那么重要的数据，可以通过设置`Put.setWriteToWAL(false)`或`Delete.setWriteToWAL(false)`来跳过WAL，提高写入性能，但牺牲了一定的数据安全性。 4. 数据压缩(Compression)：使用SNAPPY压缩算法可以...

HBase性能优化指南: - **预分割表**: 通过预先分割表，减少Region的分裂次数，可以改善写入性能。 - **负载均衡**: 确保RegionServer负载均衡，避免某些服务器过载而其他空闲。 #### HBase客户端优化 - **批量操作**: 使用批量get和...

hbase性能优化.pdf: 这些参数对HBase的写入性能、数据一致性和系统稳定性有显著影响。 1. `hbase.hregion.max.filesize`的设定：这个参数定义了单个HStoreFile的最大大小。默认值是256MB，当一个列族的HStoreFile超过这个大小时，...

Kafka集成Spark Streaming并写入数据到HBase: **Kafka、Spark Streaming与HBase的集成**...6. **数据写入HBase**：将处理后的数据转换为Put操作，然后使用`hbaseContext.bulkPut`将数据批量写入HBase表。 **参考链接** 对于更详细的实现步骤，可以参考以下链接： ...

HBase 表设计写表、读表性能优化 word文档: 使用 HBase 的批量写入 API，可以大幅提高写入性能。 2. 异步写入使用 HBase 的异步写入 API，可以提高写入性能。读表优化 1. scan 优化使用 HBase 的 scan API，可以快速读取大量数据。 2. get 优化使用...

Global site tag (gtag.js) - Google Analytics