最新文章列表

使用HBase的一个典型例子,涉及了HBase中很多概念

http://hi.baidu.com/xuelianglv/blog/item/8c68bb01633166d0267fb552.html 一个使用HBase的例子,如下。 import java.io.IOException;import org.apache.hadoop.hbase.client.HTable;import org.apache.hadoop.hbase.client ...
nlslzf 评论(0) 有2491人浏览 2010-11-01 10:00

HBase vs Cassandra: 我们迁移系统的原因

http://wangxu.me/blog/?p=371 原文: http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/ 原作者:Dominic Williams 原文发布日期:February 24, 2010 at 7:27 pm 译者:王旭(http://wangxu.me/blog/ , @gnaw ...
nlslzf 评论(0) 有1338人浏览 2010-11-01 10:00

HBase分布式安装手

http://blog.csdn.net/dajuezhao/archive/2010/07/07/5717541.aspx 一、安装准备 1、下载HBASE 0.20.5版本:http://www.apache.org/dist/hbase/hbase-0.20.5/ 2、JDK版本:jdk-6u20-linux-i586.bin 3、操作系统:Linux s132 2.6.9-7 ...
nlslzf 评论(0) 有1315人浏览 2010-11-01 09:58

HBase简介

http://hi.baidu.com/lkf0217/blog/item/3ce51b872ba04a21c75cc376.html Hbase是一个分布式开源数据库,基于Hadoop分布式文件系统,模仿并提供了基于Google文件系统的Bigtable ...
nlslzf 评论(0) 有1498人浏览 2010-11-01 09:57

终于安装好HBase并成功运行了!

本文转自我的ChinaUnix博客: http://blog.chinaunix.net/u3/107162/showart_2353772.html       2010-10-13       今晚在实验室环境下把hbase0.20.5装好了,按照网上各种指导一步步操作是没问题的,关键是部署好之后启动,执行 hbase shell和list没响应。。。。     查看其中一个HReg ...
bhjackson 评论(0) 有1899人浏览 2010-10-27 22:11

HBase的条件查询

一、环境HBase版本hbase-0.20.5,Hadoop的版本hadoop-0.20.2,JDK1.6二、需求背景 在HBase中,进行条件查询,很多的文件都说过,但是大多数都是在说明如何设置合理的表结构以及如何设置rowkey进行查询检索,这样的结构设计可以在一定层度上通过rowkey来定位查询(速度很快),但是,如果我是已知某个列的值,需要看有多少行的列包含这个值,那么这样的需求通 ...
dajuezhao 评论(0) 有3354人浏览 2010-10-27 09:46

配置HBase使用Map/Reduce

1、HBase版本hbase-0.20.5,Hadoop的版本hadoop-0.20.2,JDK1.62、如果想通过MR对hbase进行一些操作,首先是需要做一些配置内容的,配置的流程如下:a、默认安装完成了hadoop和hbaseb、首先引入环境变量(修改/etc/profile文件,在文件末尾追加下面内容):# set java environmentexport JAVA_HOME=/usr/ ...
dajuezhao 评论(0) 有1822人浏览 2010-10-27 09:44

HBase中关于中文的处理

1、HBase版本hbase-0.20.5,Hadoop的版本hadoop-0.20.2,JDK1.62、在HBase中创建了表,如果想通过控制台使用命令写入含有汉字的数据,录入是不成功的。3、如果想对汉字进行录入,可以通过代码实现,这里我使用的是java,代码如下: /** * 向指定的表插入单个Put对象 * * @param tablename * @param co ...
dajuezhao 评论(0) 有1297人浏览 2010-10-27 09:42

HBase分布式安装手册

一、安装准备1、下载HBASE 0.20.5版本:http://www.apache.org/dist/hbase/hbase-0.20.5/2、JDK版本:jdk-6u20-linux-i586.bin 3、操作系统:Linux s132 2.6.9-78.8AXS2smp #1 SMP Tue Dec 16 ...
dajuezhao 评论(0) 有1719人浏览 2010-10-27 09:42

Hadoop组成简介

Hadoop是Apache的一个项目(它是包含了很多子项目的集合,见下图),它是一个实现了MapReduce计算模型的可以运用于大型集群并行计算的分布式并行计算编程框架,当然分布式计算离不开分布式存储,Hadoop框架包含了分布式存储系统HDFS(Hadoop Distributed File System),其存储和数据结构很类似Google的GFS.HBase是Hadoop的其中一个子项目,它是 ...
eryk 评论(0) 有2243人浏览 2010-10-25 17:40

HBase中几个存在thread contention的地方

hbase code 0.26 从thread dump的结果看出来有几个地方是会导致线程BLOCKED。 "Thread-29" tid=38 daemon=false priority=5 state=BLOCKED at org.apache.hadoop.hbase.client.HConnectionManager$TableServers.loc ...
standalone 评论(0) 有1746人浏览 2010-10-25 17:10

Bad connect ack with firstBadLink

hbase报的错误,经过分析是Hadoop不能写入数据了。可恶的是hbase会丢失该阶段put的的数据。   DFSClient: Exception in createBlockOutputStream java.io.IOException: Bad connect ack with firstBadLink DFSClient: Abandoning block blk_ DFSC ...
iammonster 评论(1) 有8330人浏览 2010-10-25 13:20

不同的数据中心之间的数据同步方案 设想

1. 数据的分布式存储与计算应该是基于一个数据中心内的,即使用户参与的计算也应该是基于区域内的,例如南北两个数据中心。 2. 数据应该与数据的管理信息(Meta)内容应该是分开存放的,因为meta(数据的唯一标识,路径或者key,大小,更新时间,增量更新的长度与内容)数据的量非常小,对meta信息的南北同步可以在非常短时间内来完成,通过对meta的定期扫描可以对数据做增量的更新,然后对meta对应的 ...
duming115 评论(0) 有2263人浏览 2010-10-22 22:17

Hadoop云 PK Google云

google云计算平台由下图结构构成:                                                 图1:google云平台   然后开源的呢,开源的当然要算apache 的hadoop平台了,他完全给google给复制了一份,结构如下图2                                                   图 2:h ...
凤凰山 评论(0) 有1818人浏览 2010-10-22 13:45

HDFS的缺点及改进策略

HDFS是一个不错的分布式文件系统,它有很多的优点,但也存在有一些缺点。目前而言,它在以下几个方面就效率不佳:   低延时访问   HDFS不太适合于那些要求低延时(数十毫秒)访问的应用程序,因为HDFS是设计用于大吞吐量数据的,这是以一定延时为代价的。HDFS是单Master的,所有的对文件的请求都要经过它,当请求多时,肯定会有延时。当前,对于那些有低延时要求的应用程序,HBase是一个更好的选择 ...
p_x1984 评论(0) 有2046人浏览 2010-10-20 17:05

HBase 在Hadoop中的目录结构及文件内容(待补充)

1. HBase根目录以下以"/hbase"作为默认目录   由hbase-default.xml中的"hbase.rootdir"定义,在hadoop中保存的推荐目录为hdfs://namenode:9000/hbase 2. HBase root 目录  ,用户表目录例如KeySpace1表下的Standard1 column family,+ 表示未打开 ...
duming115 评论(0) 有6413人浏览 2010-10-19 17:02

HBase配置选项--HRegionServer

1. dfs.block.size hadoop分区块的大小,应该大于HFile文件和HLog文件的大小. 3. HRegion.blockingMemStoreSize ,MemStore中阻塞的threshold,=HRegion.memstoreFlushSize * conf.getLong(" ...
duming115 评论(0) 有5207人浏览 2010-10-19 17:00

HBase的RPC服务器端--HBaseServer

1. HBaseServer创建后有几个重要的角色.   1.1 Listener deamon线程,负责接收HMaster,HRegionServer,HBase Client的http请求.   1.2 Responder demon线程,负责将处理完的请求,发送回调用者.   1.3 Connection listener接收到的每个Socket请求都会创建一个Connection 实例.   ...
duming115 评论(1) 有2756人浏览 2010-10-14 18:04

细说HBase怎么完成一个Get操作 (client side)

    源码解析基于HBase-0.20.6。 先看HTable类get()方法的code:      HTable.java /** * Extracts certain cells from a given row. * @param get The object that specifies what data to fetch and from which r ...
standalone 评论(1) 有5354人浏览 2010-10-14 14:37

Hbase read performance with increasing number of client threads

  在跑ycsb的时候,发现在做heavy的get操作的时候,ycsb统计的latency很大,100个thread的时候就接近100ms,而从ganglia上看hbase的“get_avg_time"这个metric发现只有20~30左右。最终查看code,发现100个thread共享同一个连接,所有Call的请求数据都走这一个连接,所以在大量请求并发时会造成拥堵,latency变大。 ...
standalone 评论(0) 有1619人浏览 2010-10-12 23:19

最近博客热门TAG

Oracle(49876) MySQL(37268) SQL Server(17623) Access(9329) DB2(4271) Redis(3181) Sybase(2414) 数据挖掘(2098) MongoDB(2014) SQLite(1817) PostgreSQL(1635) HBase(1492) NoSQL(1000) HSQLDB(620) Informix(581) Derby(578) Cassandra(375) PowerBuilder(333) CouchDB(113) TokyoCabinet(87)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics