最新文章列表

Hbase

HBase是Hadoop中的一个简单数据库。它与Google的Bigtable特别相似,但也存在许多的不同之处。 数据模型 HBase数据库使用了和Bigtable非常相似的数据模型。用户在表格里存储许多数据行。每个数据行都包括一个可排序的关键字,和任意数目的列。表格是稀疏的,所以同一个表格里的行可能有非常不同的列,只要用户喜欢这样做。   列名是“<族名>:<标 ...
samuschen 评论(0) 有1977人浏览 2010-09-15 15:02

Hbase和RDBMS的区别

转自http://www.jdon.com/jivejdon/thread/38244 最近因为项目原因,研究了Cassandra,Hbase等几个NoSQL 数据库,最终决定采用HBase。在这里,我就向大家分享一下自己对HBase的理解。 在说HBase之前,我想再唠叨几句。做互联网应用的哥们儿应该都清楚,互联网应用这东西,你没办法预测你的系统什么时候会被多少人访问,你面临 ...
samuschen 评论(0) 有4317人浏览 2010-09-15 11:11

Hadoop 客户端长期运行造成Datanode 连接泄露, 0.21.0 仍然存在这问题

上篇文章中说到我在Hadoop的50070的web页面增加了每个node的xceiver count,这个问题也是通过这个指标发现的。 由于我的客户端从始至终都是一个Filesystem实例,因此在put完文件时java实例并不会销毁,客户端在运行较长时间后,发现每个Node的xceiver count值很高,当初以为是节点读写量比较大,但通过stack分析来看,却是写的线程比较多,难道又是当初的 ...
david.org 评论(2) 有3003人浏览 2010-09-09 17:29

hbase0.20.支持多个主节点容灾切换功能(只激活当前某个节点,其他节点备份)

http://wiki.apache.org/hadoop/Hbase/MultipleMasters   发现Hbase支持多个主节点的,万一某个主节点挂了,还可以切换到备用节点上。   据说hadoop-0.21支持备份主节点,万一主节点挂了的话,还是可以切换的。   不过本人稍微尝试了下hbase的主节点切换功能,不太好使。并且还没有支持hadoop-0.21.0版本的hbase出 ...
iammonster 评论(0) 有2864人浏览 2010-09-09 14:53

[原创]HbaseClient

Hbase Client端源码分析—详见附件
Hera 评论(0) 有783人浏览 2010-09-07 07:31

HBase源码阅读-4-HMaster与HRegionServer的RPC

4.HMaster与HRegionServer的RPC             启动master时创建一个Server的实例,利用反射机制提供HMaster的方法调用服务;Server继承自抽象类HBaseServer;             HBaseServer通过异步io(nio包)提供了非阻塞的网络连接             4.1 RPC Server的创建及启动过程      ...
run_xiao 评论(0) 有4779人浏览 2010-09-06 11:25

升级hadoop0.20.2到hadoop-0.21.0

按照新的文档来 更新配置: http://hadoop.apache.org/common/docs/current/cluster_setup.html   发现多了很多东西,新的文档也比以前的详细,好的多.   不过此次只为了升级hadoop0.20.2到hadoop-0.21.0     看看发布的版本:http://hadoop.apache.org/common/relea ...
iammonster 评论(2) 有7747人浏览 2010-09-05 11:52

HBase源码阅读-3-HRegionServer

3.HRegionServer:管理regions,并向HMaster报告自己状态                3.1 regionserver启动过程             (1)读取一些配置:机器名,端口,客户端重试次数,与master交互间隔,rpc超时             (2)创建Worker线程处理来自master的请求(????)             (3)创建一 ...
run_xiao 评论(0) 有3182人浏览 2010-09-02 20:33

HBase源码阅读-2-HMaster

2.HMaster:实现master的功能 A.负责分配region到regionserver,检测新增或失败的regionserver,与regionserver交互,regionserver间的负载均衡等; B.处理shcema的变更; C.实现Zoo ...
run_xiao 评论(0) 有4030人浏览 2010-09-02 20:32

HBase源码阅读-1-脚本

1.脚本    start-hbase.sh,hbase-daemon.sh,hbase-daemons.sh,zookeepers.sh,regionservers.sh,hbase,hbase-config.sh 1.1 hbase    hbase命令行入口,最终控制master,regionserver,zookeeper等启 ...
run_xiao 评论(0) 有5253人浏览 2010-09-02 20:30

HBase源代码阅读

最近比较空闲,好好研究下了下HBase的源码(0.89.20100621),其中一部分整理了下,写了些notes,贴出来Share一   下。后面计划期望能有空整理成一个完整的系列出来:   1.脚本 2.HMaster 3.HRegionServer 4.HMaster与HRegionServer的RPC 5.HMaster对HRegion的管理 ...
run_xiao 评论(0) 有3354人浏览 2010-09-02 20:28

RedHat上安装hadoop+hbase问题记录

安装在vshpere 虚拟机上,虚拟两台RedHat系统。 1  在/etc/hosts 中,将172.0.0.1   与主机名映射后,slave找不到master。  要将主机名删掉。。 2  hbase上的hbase-site.xml配置文件里的hbase.rootdir的值要与hadoop-site.xml里的端口对应。。。。大意了  罪过啊罪过。。。。
085567 评论(0) 有1260人浏览 2010-08-27 14:16

Fedora13中安装HBase笔记

1.(1)HBase需要Hadoop和jdk的支持,故需要先安装好jdk和hadoop并配置好,具体步骤可参见上篇日志。    (2)在 Hadoop 分布式文件系统中创建两个目录 hbase 和 tmp ,这两个目录将在下面安 装 HBase 的过程中使用,切换到目录$HADOOP_HOME/在 Shell 中输入命令如下: bin/hadoop dfs –mkdir hbase bin/h ...
qiemengdao 评论(1) 有1739人浏览 2010-08-26 09:47

分布式online与offline设计 slides

花了两个小时简单了做了一个ppt,给兄弟公司相关人员讲解offline分析(例如hadoop,hive, pig这种应用)与online(例如bigtable, hbase)在设计上的不同,希望能解开大家对两种不同应用在设计上的一些误区。
coderplay 评论(1) 有4185人浏览 2010-08-25 00:24

初识ycsb

ycsb yahoo! cloud serving system benchmark. 显然,这是yahoo!应"云"而生的评价体系,用于测试云平台相关store\DB\serving system如cassandra\hbase\mysql\pnuts的系统. 开源,当前版本0.1.2,下载地址:http://github.com/brianfrankcooper/YCSB/d ...
weijinxian 评论(0) 有1274人浏览 2010-08-16 16:42

HBase的Region分配探索

Region 分配  HBase 的 cluster 中, Region 是如何分配这个问题,困扰了我很久,经过代码分析和调试,得出了一些见解,缺点和错误请大家批评指正。   参与 Region 分配的重要对象 在 Region 分配过程中,起着重要作用有如下一些对象。   HMaster— 是 HBase 中的 ...
tangay 评论(0) 有13365人浏览 2010-08-13 16:47

谷歌Jeff Dean的分布式系统设计模式

IKS workshop: semantic technology Parsing a large JSON file efficiently and easily  » In a recent keynote at SOCC, Jeff Dean of Google listed a number of design patterns for system design and a number ...
yinwufeng 评论(0) 有1328人浏览 2010-08-07 10:10

Hadoop 介绍

题要:           一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high thro ...
cyc315 评论(0) 有1249人浏览 2010-08-06 17:07

最近博客热门TAG

Oracle(49876) MySQL(37268) SQL Server(17623) Access(9329) DB2(4271) Redis(3181) Sybase(2414) 数据挖掘(2098) MongoDB(2014) SQLite(1817) PostgreSQL(1635) HBase(1492) NoSQL(1000) HSQLDB(620) Informix(581) Derby(578) Cassandra(375) PowerBuilder(333) CouchDB(113) TokyoCabinet(87)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics