`
文章列表
hive使用速查手册(HQL) hive, hql 1: http://wiki.apache.org/hadoop/Hive/LanguageManual 介绍基本的hive SQL (HQL) 2:http://wiki.apache.org/hadoop/Hive/GettingStarted hive的GettingStarted手册 3: https://svn.apache.org/repos/asf/hadoop/hive/trunk/ql/src/test/ 有足够多的HQL例子让你学习滴 4.hive结构剖析: hive随谈:http://luobeng.blogbus ...
1.map/reduce框架介绍,及实例:http://www.360doc.com/content/10/0803/13/2159920_43357680.shtml 2.hadoop 0.21.0集群配置 http://wenku.baidu.com/view/92cbe435eefdc8d376ee32eb.html 3.WordCount 程序分析及eclipse 运行http://kb.cnblogs.com/page/72865/ http://kb.cnblogs.com/page/72949/ 4.map分析 http://ai-longyu.iteye.com/blog/156 ...
http://blog.csdn.net/fox009/archive/2010/05/01/5549148.aspx

bigtable介绍

一个分布式的结构化数据存储系统 地址链接:http://peopleyun.com/?p=744
最近在本地用cygwin环境来配置和使用hadoop。 遇到了一些问题,下面的这篇文章讲的比较全。 原文地址:http://shutiao2008.iteye.com/blog/319128 如果有补充的,我会补充进去 关于hadoop如何配置的教程网上已经有不少了,配合hadoop主页上 ...
今天装cygwin,遇到一些问题,这篇文章整理的很全,遇到的问题解决方法基本都有。 [问题1] # /usr/local/sbin/sshd /usr/local/sbin/sshd: error while loading shared libraries: libnsl.so.1: cannot open shared object file: No such file or directory [分析与解决] 用strace跟踪sshd,查询缺少的目录和文件,给与相应的添补。 strace -f  -F  /usr/local/sbin/sshd cp libnsl* /work/l ...
Hive 体系结构 Hive 的结构如图所示, 主要分为以下几个部分: 用户接口,包括 CLI,Client,WUI。 元数据存储,通常是存储在关系数据库如 mysql, derby 中。 解释器、编译器、优化器、执行器。 Hadoop:用 HDFS 进行存储,利用 MapReduce 进行计算。 用户接口主要有三个:CLI,Client 和 WUI。其中最常用的是 CLI,Cli 启动的时候,会同时启动一个 Hive 副本。Client 是 Hive 的客户端,用户连接至 Hive Server。在启动 Client 模式的时候,需要指出 Hive Server 所在节 ...
摘要:由于 Hive 采用了 SQL 的查询语言 HQL,因此很容易将 Hive 理解为数据库。其实 从结构上来看,Hive 和数据库除了拥有类似的查询语言,再无类似之处。本文将 从多个方面来阐述 Hive 和数据库的差异。数据库可以用在 Online ...
转载:http://hi.baidu.com/li_zhongnan/blog/item/318effa9611d2bf91f17a26a.html 最近在一个项目中,利用ProcessBuilder在java中调用其他程序时,由于没有捕获标准错误输出,process.waitFor()出现了阻塞,进程被卡死了。 转载的这篇文章,讲的非常详细。大家在用ProcessBuilder,特别是调用waitFor时,要注意捕获标准错误输出。最好将标准错误输出和标准错误输出合二为一。 在编写Java程序时,有时候需要在Java程序中执行另外一个程序。 1、启动程序 Java提供了两种方法用来启动其它程 ...
转载:http://samuschen.iteye.com/blog/763921 HBase是Hadoop中的一个简单数据库。它与Google的Bigtable特别相似,但也存在许多的不同之处。 数据模型 HBase数据库使用了和Bigtable非常相似的数据模型。用户在表格里存储许多数据行。每个数据 ...
转载:http://www.jdon.com/jivejdon/thread/38244 最近因为项目原因,研究了Cassandra,Hbase等几个NoSQL数据库,最终决定采用HBase。在这里,我就向大家分享一下自己对HBase的理解。 在说HBase之前,我想再唠叨几句。做互联网应用的哥们儿应该都清楚,互联网应用这东西,你没办法预测你的系统什么时候会被多少人访问,你面临的用户到底有多少,说不定今天你的用户还少,明天系统用户就变多了,结果您的系统应付不过来了了,不干了,这岂不是咱哥几个的悲哀,说时髦点就叫“杯具啊”。 其实说白了,这些就是事先没有认清楚互联网应用什么才是最重要的。从系 ...
最近同事在做一个日常,涉及到增加一个数据源的配置。数据源配置一定要有容灾的方式。了解的一些rjdbc。 以下内容来自:http://hi.baidu.com/jackbillow/blog/item/f6ea2322000bd1a84723e82f.html 看到TB在使用RJDBC,应用于数据库的切换,学习一下RJDBC。 应用使用Oracle Driver的Failover连接方式,在addresslist的第一个IP不存在的时候会导致建立连接很慢。如果应用使用RJDBC,可以在数据库切换的时候,能够让应用快速重新建立和数据库的连接。RJDBC对主备数据库进行了独立的管理(底层还是使用数据 ...
分布式设计与开发入口: http://www.iteye.com/topic/748177
一、散列表类与性能优化 线程同步散列表类 1.Vector 与ArrayList 对于线程安全而言,一些散列表核心类是线程安全的,如Vector类,一些核心类不是线程安全的,如ArrayList类。 原则:对线程安全有严格要求时,尽量选用线程安全的散 ...
Global site tag (gtag.js) - Google Analytics