`
Tristan_S
  • 浏览: 378662 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

HBase 相关

 
阅读更多
水平扩展测试
用3个节点和1个节点做比较,3反而小于1
不过由于数据量小,虚拟机无法说明问题
hbase org.apache.hadoop.hbase.PerformanceEvaluation --nomapred --rows=10000 sequentialWrite 1
hbase org.apache.hadoop.hbase.PerformanceEvaluation --nomapred --rows=10000 sequentialRead 1
===3 nodes=======
[SequentialWriteTest] Min: 3879ms Max: 3879ms Avg: 3879ms
[SequentialReadTest] Min: 6646ms Max: 6646ms Avg: 6646ms
===1 nodes=======
[SequentialWriteTest] Min: 2470ms Max: 2470ms Avg: 2470ms
[SequentialReadTest] Min: 5325ms Max: 5325ms Avg: 5325ms

-------------------
hbase 大数据统计时 15w
count 'TestTable'   150000 row(s) in 126.0820 seconds
count 'TestTable',CACHE=>1000, INTERVAL => 100000    150000 row(s) in 8.3270 seconds


调试hbase的PerformanceEvaluation源代码
在bin/hbase中对client启动增加远程调试参数
if [[ $server ]]; then
echo "this is a server"
HBASE_OPTS="$HBASE_OPTS $SERVER_GC_OPTS"
else
echo "this is a client"
        #HBASE_OPTS="$HBASE_OPTS $HBASE_MASTER_OPTS -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=10444"
HBASE_OPTS="$HBASE_OPTS $CLIENT_GC_OPTS"
fi

echo "this is a war"

发现需要有参数--nomapred才能使用本地的, 不然会使用mapred的所以日志结果出不来。

-----------
slave上停止不了hbase相关进程,可以用一下命令
hbase-daemon.sh stop regionserver
hbase-daemon.sh stop zookeeper


shell 命令
hbase shell
create 'mytable', 'cf'
put 'mytable','first','cf:info','patience and courage'
list
scan "users"
get "users","TheRealMT"
count "users"
scan "follows",{COLUMNS=>"f:from"}
第一步 disable '表名称' 第二步  drop '表名称'
scan 'TestTable',{LIMIT=>10}

Linux 命令
start-hbase.sh
hbase shell

------------------------
eclipse
hbase 0.96.2 匹配hadoop2.2
maven找不到hbase0.96的jar包(只有pom包), 将server中hbase的lib包拷贝到本地

------------
java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.InitTables -f
java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.UsersTool add "TheRealMT" "Mark Twain" "samul@ss.com" "abc123"
java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.UsersTool list
java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.mapreduce.TimeSpent src/test/resource/listing\ 3.3.txt ./out

java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.LoadUsers 100
java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.LoadTwits 100
java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.TwitsTool list ayant68
java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.UsersTool get ayant68
java -cp target/twitbase-1.0.0.jar HBaseIA.TwitBase.RelationsTool list follows tristan

java -cp target/twitbase-async-1.0.1.jar HBaseIA.TwitBase.AsyncUsersTool update
分享到:
评论

相关推荐

    hbase相关的安装包

    在这个“hbase相关的安装包”中,包含了两个关键组件:hadoop-common-2.2.0-bin-master和hbase-0.98.3-hadoop2。 1. **Hadoop Common**: Hadoop Common是Hadoop项目的基础模块,包含Hadoop运行所需的通用工具和...

    HBase相关资料.zip

    本资料包“HBase相关资料.zip”包含了丰富的学习资源,包括2021年的HBase课程资料文档、详细的day1-hbase.pdf教程、readme.txt指南以及实践性的homework和data文件。下面将对这些内容进行详尽解析: 1. **2021-...

    hbase 相关的笔记

    **HBase:分布式大数据存储系统** HBase,全称为Apache HBase,是构建在Hadoop文件系统(HDFS)之上的...这份"Hbase相关的笔记"很可能包含了关于HBase的基础概念、架构、操作和优化等内容,是深入学习HBase的好资源。

    hbase jar包.zip

    《Spring集成HBase的必备库解析》 在Java开发领域,Spring框架的广泛使用与HBase这样的大数据存储系统的结合日益紧密。"hbase jar包.zip" 提供了整合Spring与HBase所需的关键库文件,使得开发者能够高效地利用...

    Hbase的安装过程及基本操作

    如果看到Hbase相关的进程,如HMaster和HRegionServer,说明启动成功。 9. **伪分布式配置**: 对于更真实的环境模拟,可以配置Hbase在伪分布式模式下运行。设置`hbase.cluster.distributed`为`true`,并确保Hadoop...

    HbaseTemplate 操作hbase

    1. **HbaseTemplate的初始化**:在使用HbaseTemplate之前,我们需要在Spring配置文件中配置HBase的相关连接信息,如Zookeeper地址、HBase表名等,并实例化HbaseTemplate。这通常通过@Autowired注解和@Configuration...

    HBase配置文件与HBase doc文档

    5. **zoo.cfg**:虽然HBase使用Zookeeper,但Zookeeper的配置通常是在Zookeeper自己的配置文件中完成的,不过这里也可能包含一些与HBase相关的Zookeeper设置。 ### HBase Doc文档 HBase的官方文档提供了详尽的指南...

    hadoop hbase 全jar包

    Hadoop和HBase是大数据处理领域中的重要组件,它们在分布式存储和实时数据访问...通过这个名为“hbase全jar包”的压缩文件,开发者可以获得完整的一套HBase相关jar包,从而快速搭建开发环境,进行HBase的学习和实践。

    hbase客户端连接工具winutils-2.2.0.zip

    1. **安装JDK**:HBase和Hadoop都是用Java编写的,因此在运行任何Hadoop或HBase相关的程序之前,确保已经在系统上安装了兼容版本的Java Development Kit(JDK)。 2. **解压并配置路径**:下载并解压`winutils-...

    HBase实现批量存取

    为了在Eclipse中运行HBase程序,我们需要添加HBase相关的JAR包到项目的类路径中。这包括HBase的客户端库、Hadoop的相关库以及Zookeeper的库。同时,还需要在项目中配置HBase的连接参数,如Zookeeper的地址和HBase的...

    spring操作hbase demo

    -- HBase相关 --> <groupId>org.apache.hbase <artifactId>hbase-client <version>2.x.x <groupId>org.apache.hbase <artifactId>hbase-protocol <version>2.x.x <groupId>org.apache.hbase ...

    zookeeper+hbase集群搭建

    这时,可以尝试删除HDFS上的Hbase目录,然后在Zookeeper Shell中清除Hbase相关数据,最后重启Hbase服务。 关于Zookeeper的知识点: - **Zookeeper的角色**:Zookeeper是一个分布式协调服务,用于管理分布式应用的...

    hadoop-2.7.2-hbase-jar.tar.gz

    该压缩包包含了Hadoop 2.7.2版本与HBase相关的JAR文件,这些文件对于在Hadoop集群上运行HBase至关重要。 首先,我们需要了解Hadoop 2.7.2版本的特点。这一版本的Hadoop引入了YARN(Yet Another Resource Negotiator...

    Hadoop与HBase自学笔记

    - **安装HBase插件**:使用Eclipse Marketplace安装HBase相关的插件,以简化HBase的开发过程。 - **项目配置**:在Eclipse中配置HBase SDK和其他必要的依赖库。 #### 六、集群下开发HBase - **集群部署**:HBase...

    hbase-client_lib.rar

    至于“hbase_lib”这个压缩包子文件,很可能是所有HBase相关jar包的集合。这些库通常包括HBase自身的API,Zookeeper客户端用于协调集群,Hadoop的相关库用于与HDFS交互,以及其他的依赖,如protobuf用于序列化和反...

    hbase版本1.2.6,Hadoop版本2.7.1,eclipse链接hbase所需jar包

    在配置完成后,你就可以在Eclipse中编写HBase相关的代码了,如创建表、插入数据、查询数据等。同时,记得配置HBase的`hbase-site.xml`和Hadoop的`core-site.xml`、`hdfs-site.xml`到项目的类路径中,以便程序能够...

    (转)HBase技术介绍

    【HBase技术介绍】 HBase,全称是Apache HBase,是一个分布式的、面向列的开源数据库,基于Google的Bigtable设计思想构建于Hadoop文件系统(HDFS)之上。它是Apache软件基金会Hadoop项目的一部分,专为处理大规模...

    Hbase设置Snappy压缩测试

    HBase的源码分析可以帮助我们深入理解其内部工作原理,而使用HBase相关的工具(如HBase Shell、HBaseAdmin等)则可以方便地进行集群管理和操作。 例如,在`HbaseCommons.java`这个文件中,可能包含了HBase操作的...

Global site tag (gtag.js) - Google Analytics