Hbase 基础知识整理

博客分类：

hadoop实践

1、扫描操作scan 可以输入startRow和stopRow参数，其中起始行包括在内，而终止行是不包括在内的，用区间表示就是【startRow,stopRow). 2、Region的rowKey也是前开后闭模式【startRow,stopRow).

2014-01-11 09:43
浏览 529
评论(0)
分类:开源软件

14/01/06 21:31:31 WARN client.HConnectionManager$HConnectionImplementation: Encountered problems when prefetch META table: org.apache.hadoop.hbase.TableNotFoundException: Cannot find row in .META. for table: edit_user, row=edit_user,,99999999999999 at org.apache.hadoop.hbase.client.MetaScanner.met ...

2014-01-06 21:35
浏览 6903
评论(1)
分类:开源软件

hadoop无法停止

博客分类：

hadoop实践

hadoop无法停止 hadoop运行一段时间后，无法正常停止。解决方法： 1.jps查询所有的相关进程，如namenode，然后kill -9 进程号 2.修改etc/hadoop/hadoop-env.sh 中的 hadoop-pid-dir 指定到一个有效的目录、如：export hadoop-pid-dir=/data/hadoop/pids 产生的原因是 hadoop-pid-dir 这个环境变量默认是 /tmp，而/tmp中的所有的内容是要被操作系统定期清除的，清除后，hadoop-daemon.sh stop xxx 无法找到相应的进程 ...

2014-01-05 17:49
浏览 1745
评论(0)
分类:开源软件

hbase 启动报错解决

博客分类：

hadoop实践

转载自：http://hi.baidu.com/coconutnut/item/97ba15ca5da3820fac092f6c hbase 启动解决今天搞了一天。经常出现Server is not running yet 的错误。找了几个小时。终于发现是 hadoop 启动的问题。 -------- NameNode在启动的时候首先进入安全模式，如果datanode丢失的block达到一定的比例（1-dfs.safemode.threshold.pct），则系统会一直处于安-全模式状态即只读状态。dfs.safemode.threshold.pct（缺省值0.999f）表示HD ...

2014-01-05 15:19
浏览 972
评论(0)
分类:开源软件

启动hive 抛异常 "org.eclipse.core.resources" but it cannot be resolved.ERROR

博客分类：

hadoop实践

运行命令启动hive hive --service metastore 命令运行后 ERROR DataNucleus.Plugin: Bundle "org.eclipse.jdt.core" requires "org.eclipse.core.resources" but it cannot be resolved.ERROR DataNucleus.Plugin: Bundle "org.eclipse.jdt.core" requires "org.eclipse.core.resource ...

2014-01-04 23:18
浏览 910
评论(0)
分类:开源软件

Hadoop启动时进入安全模式 SafeModeException

博客分类：

hadoop实践

用这个http://www.cnblogs.com/hustcat/archive/2010/06/30/1768506.html 解决的问题。备忘~~ org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/root/input. Name node is in safe mode. 解决方法： NameNode在启动的时候首先进入安全模式，如果datanode丢失的block达到一定的比例（1-dfs.safemode.threshold.pct） ...

2014-01-04 23:06
浏览 1158
评论(0)
分类:开源软件

hive 集成hbase 笔记

博客分类：

hadoop实践

转载地址：http://blog.csdn.net/daniel_ustc/article/details/12795627 按这个博文安装成功，留个参考。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的sql查询功能，可以将sql语句转换为 MapReduce任务进行运行。其优点学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。Hive与HBase的整合功能的实现是利用两者本身对外的API接口互相进行通信，相互通信主要是依靠hive_hba ...

2014-01-01 18:07
浏览 1601
评论(0)
分类:开源软件

OOZIE上传mapReduce任务

博客分类：

hadoop实践

例子路径：下载oozie-2.3.2-cdh3u6包例子在oozie-2.3.2-cdh3u6/oozie-2.3.2-cdh3u6/docs/DG_Examples.html 文档中，可以用 Command方式 oozie job -oozie http://localhost:11000/oozie -config examples/apps/map-reduce/job.properties -run 还有使用cron定时功能在cron包中，按例子执行一遍就大概明白流程，暂时写到这详细后续跟上~

2013-12-31 23:05
浏览 874
评论(0)
分类:开源软件

Storm 本地运行统计字母出现次数

博客分类：

hadoop实践

说明：这个例子是在网上下载的，我将storm0.7.1的jar包引入，在windows环境eclipse下可以跑通。可以有助于理解storm处理流程，不用安装storm环境 , 将工程引入到项目执行TopologyMain.java 传参words.txt路径即可。

2013-12-25 15:21
浏览 1810
评论(1)
分类:开源软件

Linux SSH远程文件/目录传输命令scp

博客分类：

Linux shell

出处：http://www.vpser.net/manage/scp.html 相信各位VPSer在使用VPS时会经常在不同VPS间互相备份数据或者转移数据，大部分情况下VPS上都已经安装了Nginx或者类似的web server，直接将要传输的文件放到web server的目录，然后在目标机器上执行：wget http://www.vpser.net/testfile.zip 就行了。当VPS上没有安装web server和ftp server的时候或感觉上面的方法比较麻烦，那么用scp命令就会排上用场。一、scp是什么？ scp是secure copy的简写，用于在Linu ...

2013-12-19 09:51
浏览 696
评论(0)
分类:操作系统

Google Protocol Buffers浅析（一）转载

博客分类：

Java基础知识

原文出处：http://www.cnblogs.com/royenhome Google Protocol Buffers浅析（一）本文主要偏向于介绍怎么使用Google的Protocol Buffer技术来压缩与解析你的数据文件，更加详细的信息请参阅Google开放的开发者网页文档，地址为：http://code.google.com/apis/protocolbuffers/docs/overview.html 。一、简单的介绍当然，在继续本文之前，读者还是需要对Google Protocol Buffers有一些基本的认识。Protoco ...

2013-12-11 14:44
浏览 873
评论(0)
分类:开源软件

Apache Thrift - 可伸缩的跨语言服务开发框架

博客分类：

Java基础知识

转载自：http://www.ibm.com/developerworks/cn/java/j-lo-apachethrift/ 简介： Apache Thrift 是 Facebook 实现的一种高效的、支持多种编程语言的远程服务调用的框架。本文将从 Java 开发人员角度详细介绍 Apache Thrift 的架构、开发和部署，并且针对不同的传输协议和服务类型给出相应的 Java 实例，同时详细介绍 Thrift 异步客户端的实现，最后提出使用 Thrift 需要注意的事项。前言：目前流行的服务调用方式有很多种，例如基于 SOAP 消息格式的 Web Serv ...

2013-12-10 21:50
浏览 820
评论(0)
分类:开源软件

Linux下高并发socket最大连接数所受的各种限制

博客分类：

hadoop实践

Linux下高并发socket最大连接数所受的各种限制 12/06. 2013 1、修改用户进程可打开文件数限制在Linux平台上，无论编写客户端程序还是服务端程序，在进行高并发TCP连接处理时，最高的并发数量都要受到系统对用户单一进程同时可打开文件数量的限制(这是因为系统为每个TCP连接都要创建一个socket句柄，每个socket句柄同时也是一个文件句柄)。可使用ulimit命令查看系统允许当前用户进程打开的文件数限制： [speng@as4 ~]$ ulimit -n 1024 1 2 [speng@as4~]$

2013-12-10 10:21
浏览 810
评论(0)
分类:操作系统

python网络框架twisted TCP客户端连接服务端例子

博客分类：

python

服务端： from twisted.internet import reactor from twisted.internet.protocol import Factory,Protocol class Echo(Protocol): def connectionMade(self): self.transport.write('hello yy:') # self.transport.loseConnection() def dataReceived(self ...

2013-12-06 15:00
浏览 2188
评论(0)
分类:编程语言

常用Python第三方库简介

博客分类：

python

如果说强大的标准库奠定了python发展的基石，丰富的第三方库则是python不断发展的保证，随着python的发展一些稳定的第三库被加入到了标准库里面，这里有6000多个第三方库的介绍：点这里或者访问：http://pypi.python.org/pypi?%3Aaction=index。下表中加粗并且标红的都是我平时使用较多的一些第三方库。（P.S.CSDN的这个表格功能太难用了，改HTML代码调整了好半天啊，才见得人！）转载：http://blog.csdn.net/magictong/article/details/6788208

2013-12-04 16:45
浏览 3005
评论(0)
分类:编程语言

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hbase 基础知识整理

Hbase异常正在找解决办法 ~~

hadoop无法停止

hbase 启动报错解决

启动hive 抛异常 "org.eclipse.core.resources" but it cannot be resolved.ERROR

Hadoop启动时进入安全模式 SafeModeException

hive 集成hbase 笔记

OOZIE上传mapReduce任务

Storm 本地运行统计字母出现次数

Linux SSH远程文件/目录传输命令scp

Google Protocol Buffers浅析（一）转载

Apache Thrift - 可伸缩的跨语言服务开发框架

Linux下高并发socket最大连接数所受的各种限制

python网络框架twisted TCP客户端连接服务端例子

常用Python第三方库简介

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>