最新文章列表

hive auto map join

旧的mapjoin实现,0.6及其以前的版本 新的mapjoin实现,0.7版本,HIVE-1641、HIVE-1754 将小表加载到分布式缓存 automapjoin依赖与新的mapjoin实现 https://issues.apache.org/jira/browse/HIVE-1642 Hiveconf: hive.auto.convert.join SemanticAnalyzer. ...
bupt04406 评论(0) 有3835人浏览 2011-08-15 20:11

Hive JobHooks

ExecDriver.execute(DriverContext driverContext) {       JobClient jc = new JobClient(job);       // make this client wait if job trcker is not behaving well.       Throttle.checkJobTracker(job, LOG); ...
bupt04406 评论(0) 有1304人浏览 2011-08-07 00:12

hive groupby

hive> select distinct value from src; hive> select max(key) from src; 因为没有grouping keys,所以只有一个reducer。         2.2 如果有聚合函数或者groupby,做如下处理:             插入一个select operator,选取所有的字段,用于优化阶段Colum ...
bupt04406 评论(0) 有2717人浏览 2011-07-26 00:32

hive和hbase的整合

使用hbase作为用户行为分析的数据库,为了提高效率,集成了hive。 安装 使用cloudera的cdh3u0版本,hbase安装见http://jinghong.iteye.com/blog/1051732, 解压hive到/home/hadoop/cdh3 tar zxvf hive-0.7.0-cdh3u0.tar.gz -C /home/hadoop/cdh3 在hive/conf目录下复 ...
jinghong 评论(0) 有8874人浏览 2011-07-19 14:55

hive genPlan

(TOK_QUERY (TOK_FROM (TOK_TABREF src)) (TOK_INSERT (TOK_DESTINATION (TOK_DIR TOK_TMP_FILE)) (TOK_SELECT (TOK_SELEXPR TOK_ALLCOLREF)) (TOK_WHERE (< (. (TOK_TABLE_OR_COL src) key) 10)) ) ...
bupt04406 评论(1) 有2683人浏览 2011-07-17 21:42

hive 行分隔符

hive 的行分隔符目前只支持 \n  SemanticAnalyzer.analyzeCreateTable           case HiveParser.TOK_TABLEROWFORMATLINES:             lineDelim = unescapeSQLString(rowChild.getChild(0).getText());             if (! ...
bupt04406 评论(0) 有2163人浏览 2011-06-21 14:33

hiveQL 优化

1.当hive执行join内存溢出时,可以修改hive的配置文件hive-site.xml,增大内存,如下: mapred.child.java.opts -Xmx 1024m 2.hive默认建表时的路径也可以在hive-site.xml里配置,如下: hive.metastore.warehouse.dir value >/user/hive/warehouse description ...
085567 评论(0) 有1860人浏览 2011-01-13 20:52

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics