最新文章列表

基于Hadoop的一些工具一句话介绍

      Pig 是在MapReduce上构建的查询语言(SQL-like),适用于大量并行计算。       Chukwa 是基于Hadoop集群中监控系统,可以用他来分析和收集系统中的数据(日志)       Hive 是DataWareHouse 和 Map Reduce交集,适用于ETL方面的工作     HBase 是一个面向列的分布式数据库。       Map R ...
chakey 评论(0) 有1960人浏览 2011-02-17 16:05

zookeeper学习笔记二

这几天尝试进行leader/follower的测试,当然目前还没去看源码实现.但觉得还是相当的. 以下是对网上一段代码的修改,因为原来的测不出来什么东西. note: ...
leibnitz 评论(0) 有1686人浏览 2011-02-17 13:11

hbase&hadoop初探

见附件。。。
lingqi1818 评论(0) 有957人浏览 2011-02-17 10:44

hbase海量数据的全量导入方法

最近有个需求要对mysql的全量数据迁移到hbase,虽然hbase的设计非常利于高效的读取,但是它的compaction实现对海量数据写入造成非常大的影响,数据到一定量之后,就开始抽风。 分析hbase的实现,不管其运行的机制,其最终存储结构为分布式文件系统中的hfile格式。 刚好hbase的源代码中提供一个HFileOutputFormat类,分析其源代码可以看到: /** * Copyr ...
lingqi1818 评论(3) 有16394人浏览 2011-02-17 10:35

hbase 简介

我的废话1:   任何一项新技术并非救命稻草,一抹一擦立马药到病除的百宝箱,并非使用Spring或者NOSQL的产品就神乎其神+五光十色,如果那样基本是 ...
houzhaowei 评论(0) 有4052人浏览 2011-02-16 17:59

[1] HBase集群配置安装

HBase集群配置安装 hadoop-0.20.2 hbase-0.20.3 zookeeper-3.3.0 1: tar zxvf hbase-0.20.3.tar.gz 2: 修改 ./hbase-0.20.3/conf/hbase-env.sh export JAVA_HOME=/usr/local/java/ 3: 创建文件./hbase-0.20.3/con ...
chakey 评论(0) 有2389人浏览 2011-02-16 16:03

ZZNoSQL漫谈 NoSql = Not Only Sql != No Sql

原文出处:http://hi.baidu.com/yandavid/blog/item/bf13ee03a326b0e209fa931f.html.com.cn (原文有图)   NoSQL漫谈 NoSql = Not Only Sql != No Sql 什么是NoSQL?wiki上的定义是“NoSQL is a movement promoting a loosel ...
shuofenglxy 评论(0) 有1372人浏览 2011-02-15 10:13

nosql 介绍

转发自:http://blog.csdn.net/DL88250/archive/2010/01/14/5191092.aspx NoSQL 是非关系型数据存储的广义定义。它打破了长久以来关系型数据库与 ACID理论大一统的局面。NoSQL 数据存储不需要固定的表结构,通常也不存在连接 操作。在大数据存取上具备关系型数据库无法比拟的性能优势。该术语在 2009 年初得到了广泛认同。     当 ...
kuchaguangjie 评论(0) 有1617人浏览 2011-02-11 15:49

了解 NoSQL 的必读资料

了解 NoSQL 的必读资料 http://blog.csdn.net/DL88250/archive/2010/01/14/5191092.aspx   NoSQL 是非关系型数据存储的广义定义。它打破了长久以来关系型数据库与 ACID 理论大一统的局面。NoSQL 数据存储不需要固定的表结构,通常也不存在连接 操作。在大数据存取上具备关系型数据库无法比拟的性能优势。该术语在 2009 年 ...
outlaw 评论(0) 有572人浏览 2011-02-11 15:04

cloudera 的hbase集群搭建简录 (centos5)

官方doc https://wiki.cloudera.com/display/DOC/HBase+Installation   首先升级yum: 在 /etc/yum.repos.d/ 下创建cloudera-cdh3.repo 然后把   [cloudera-cdh3] name=Cloudera's Distribu ...
houzhaowei 评论(0) 有6043人浏览 2011-02-10 18:51

关于HBASE里的一个问题

安装了HADOOP HBASE,运行起来了,虽然功能没有任何问题,但是,在日志文件里会出现这样的错误 java.io.IOException: Read error rc = -1 java.nio.DirectByteBuffer[pos=0 lim=4 cap=4]         at org.apache.zookeeper.ClientCnxn$SendThread.doIO(Client ...
亦梦亦真 评论(3) 有9397人浏览 2011-02-09 10:40

The Apache HBase Book学习篇(二)

1.3 Not-so-quick Start Guide 1.3.1 Requirements   HBase有如下一些要求。请务必认真的阅读以确保所有的要求都被满足了。如果有配置有问题将可能导致出现一个 ...
CSAPP 评论(0) 有2369人浏览 2011-01-31 11:30

The Apache HBase Book学习篇(一)

一段时间以来一直在使用Hadoop和Hive进行数据仓库的开发,最近感觉HBase逐渐在实时处理方面能力显示出来,这也是数据开发人员梦寐以求的一件事情,看 ...
CSAPP 评论(0) 有2748人浏览 2011-01-30 16:39

HBase简介(很好的梳理资料)

一、 简介 history started by chad walters and jim 2006.11 G release paper on BigTable 2007.2 inital HBase prototype created as Hadoop contrib 2007.10 First useable Hbase 2008.1 Hadoop b ...
iammonster 评论(7) 有130741人浏览 2011-01-30 10:18

hbase初探之三(小结)

经过几天来的看资料,写代码,终于对这个东东有点眉目了。 package linhon.crud; import java.util.Date; import java.util.Map.Entry; import java.util.NavigableMap; import org.apache.hadoop.hbase.HBaseConfiguration; import or ...
leibnitz 评论(0) 有5212人浏览 2011-01-30 02:28

Hive HBase 整合

hive hbase整合,要求比较多,1.hive的得是0.6.0(当前最新的版本) 2.hive本身要求hadoop的最高版本是hadoop-0.20.2 3.要求hbase的版本是0.20.3,其他版本需要重新编译hive_hbase-handler 但是新版的hbase(0.90)变动特别大,根本无法从编译。这点比较恶心,hbase目前升级比较快,当前是0.90(从0.20.6直接跳到0.89 ...
奔跑的羚羊 评论(4) 有17049人浏览 2011-01-27 16:35

Hbase使用已经安装的zookeeper

1.修改conf/hbase-env.sh,添加jdk支持 export JAVA_HOME=/usr/local/jdk export HBASE_MANAGES_ZK=false 2.拷贝zookeeper的配置文件zoo.cfg到HBase的CLASSPATH(官方推荐的方式) root@master:/data/soft/hbase# cp /data/soft/zookeeper/ ...
奔跑的羚羊 评论(0) 有2449人浏览 2011-01-27 16:18

Hbase配置手册

Hbase配置手册 1)下载hbase 解压到每台服务器的/data/soft 解压root@master:/data/soft# tar zxvf hbase-0.90.0.tar.gz 建立软连root@master:/data/soft# ln -s hbase-0.90.0 hbase 2)配置hbase 前提是安装完成hadoop,默认在namenode上进行 1.修改conf/hbas ...
奔跑的羚羊 评论(0) 有9384人浏览 2011-01-26 14:31

难忘2010

其实在2011元旦的时候就打算写些东西用以回顾2010年,但是由于时间上紧张,实在是抽不出时间来写点东西,因此拖延到现在才写。干IT这个行业也有些 ...
dajuezhao 评论(0) 有805人浏览 2011-01-21 12:00

最近博客热门TAG

Oracle(49876) MySQL(37268) SQL Server(17623) Access(9329) DB2(4271) Redis(3181) Sybase(2414) 数据挖掘(2098) MongoDB(2014) SQLite(1817) PostgreSQL(1635) HBase(1492) NoSQL(1000) HSQLDB(620) Informix(581) Derby(578) Cassandra(375) PowerBuilder(333) CouchDB(113) TokyoCabinet(87)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics