Hive hql

博客分类：

hive

[Hadoop大数据]——Hive连接JOIN用例详解 http://www.cnblogs.com/xing901022/p/5804836.html 清空表数据 insert overwrite table t_table1 select * from t_table1 where 1=0; 建表 create table test_part (id int,name string,no int) partitioned by (dt string) row format delimited fields terminated by '\t' stored as ...

2017-02-21 11:06
浏览 426
评论(0)
分类:互联网

Maven Hive-Jdbc教程

博客分类：

hive

Maven Hive-Jdbc教程 http://www.cnblogs.com/ae6623/p/5686504.html http://blog.csdn.net/jethai/article/details/52345271

2017-02-20 22:32
浏览 587
评论(0)
分类:互联网

sqoop1.4.6安装

博客分类：

sqoop

sqoop1.4.6安装 http://blog.csdn.net/linlinv3/article/details/49589615 sqoop import --connect jdbc:mysql://u13:3306/hive --username hive --password hive --table test --hive-import --hive-overwrite --hive-table testt --fields-terminated-by '\t' Sqoop-1.4.4工具import和export使用详解 http://shiyanjun ...

2017-02-19 22:21
浏览 380
评论(0)
分类:互联网

mysql安装

博客分类：

db

mysql在linux下的安装 http://www.cnblogs.com/bookwed/p/5896619.html #启动mysql

2017-02-14 20:49
浏览 307
评论(0)
分类:互联网

Spark安装配置

博客分类：

Spark

spark-1.2.0 集群环境搭建 http://blog.csdn.net/stark_summer/article/details/42458081 管理界面 http://u13:8080/ Spark Idea Maven 开发环境搭建 http://www.cnblogs.com/fillPv/p/5882364.html scala + intellij idea 环境搭建及编译、打包 http://www.cnblogs.com/yjmyzz/p/4694219.html Idea scala plugin https:/ ...

2017-02-10 23:07
浏览 265
评论(0)
分类:互联网

Hive 三种配置方式

博客分类：

hive

hive on spark安装(hive2.3 spark2.1) https://blog.csdn.net/Dante_003/article/details/72867493 Hive metastore三种配置方式 https://www.cnblogs.com/snowbook/p/5886438.html http://blog.csdn.net/reesun/article/details/8556078 (服务端，客户端及服务客户一并配置，3种样例) ...

2017-02-10 16:41
浏览 385
评论(0)
分类:互联网

Hadoop hdfs命令

博客分类：

hadoop

hdfs fsck /home/hive/warehouse/music_rec.db/fact_user_events_all -files -blocks Format the filesystem: $ bin/hdfs namenode -format Start NameNode daemon and DataNode daemon: $ sbin/start-dfs.sh The hadoop daemon log output is written to the $HADOOP_LOG_DIR director ...

2017-02-09 22:40
浏览 389
评论(0)
分类:互联网

Hadoop完全分布式安装

博客分类：

hadoop

Hadoop2.6.2完全分布式集群HA模式安装配置详解 http://blog.csdn.net/ltliyue/article/details/51144381 http://www.open-open.com/lib/view/open1436855630959.html Hadoop的HA集群启动和停止流程 1. hadoop-daemon.sh start namenode 主节点 2. hdfs namenode -bootstrapStandby 备节点 sbin/hadoop-daemons.sh start zkfc Hadoop的HA集群启 ...

2017-02-07 21:35
浏览 381
评论(0)
分类:互联网

Linux常用命令

博客分类：

Linux

用户环境变量 vi ~/.bash_profile Linux添加/删除用户和用户组 du -sh : 查看当前目录总共占的容量。而不单独列出各子项占用的容量 du -lh --max-depth=1 : 查看当前目录下一级子文件和子目录占用的磁盘容量。查找并删除某天前文件 find . -mtime +30 -name "*.log" -exec rm -rf {} \; 标签: Linux

2017-02-07 21:33
浏览 430
评论(1)
分类:操作系统

Hadoop 部署

博客分类：

Linux

http://v.youku.com/v_show/id_XMzc5MzM1NDQw.html VMware keyNY0K2-2ULDJ-LZUP1-MV154-8363F 4F4R4-AEK53-TZYU9-KK9X4-9AWPQ Hadoop实战_1.avi 链接:http://pan.baidu.com/share/link?shareid=3449193448&uk=808459810 密码:8lw8Hadoop实战_2.avi 链接:http://pan.baidu.com/share/link?shareid=3463589493&uk=808459810 密 ...

2014-07-08 21:11
浏览 633
评论(0)
分类:互联网

Twitter Storm源代码分析之acker工作流程

博客分类：

Storm

转载：http://xumingming.sinaapp.com/410/twitter-storm-code-analysis-acker-merchanism/ Twitter Storm源代码分析之acker工作流程概述我们知道storm一个很重要的特性是它能够保证你发出的每条消息都会被完整处理，完整处理的意思是指：一个tuple被完全处理的意思是：这个tuple以及由这个tuple所导致的所有的tuple都被成功处理。而一个tuple会被认为处理失败了如果这个消息在timeout所指定的时间内没有成功处理。也就是说对于任何一个spout-tu ...

2014-05-21 23:06
浏览 518
评论(0)
分类:开源软件

Twitter Storm源代码分析之ZooKeeper中的目录结构

博客分类：

Storm

转载：http://xumingming.sinaapp.com/466/twitter-storm-code-analysis-zookeeper-dirs/ Twitter Storm源代码分析之ZooKeeper中的目录结构我们知道Twitter Storm的所有的状态信息都是保存在Zookeeper里面，nimbus通过在zookeeper上面写状态信息来分配任务，supervisor，task通过从zookeeper中读状态来领取任务，同时supervisor, task也会定义发送心跳信息到zookeeper，使得nimbus可以监控整个storm集群的状态，从而可以 ...

2014-05-21 23:05
浏览 417
评论(0)
分类:开源软件

Twitter Storm源代码分析之Nimbus/Supervisor本地目录结构

博客分类：

Storm

转载：http://xumingming.sinaapp.com/483/twitter-storm-code-analysis-local-dir/ Twitter Storm源代码分析之Nimbus/Supervisor本地目录结构我们知道，storm集群里面工作机器分为两种一种是nimbus, 一种是supervisor, 他们通过zookeeper来进行交互，nimbus通过zookeeper来发布一些指令，supervisor去读zookeeper来执行这些指令，具体nimbus和supervisor在zookeeper上交换了哪些信息可以看一下这篇文章: Twitter ...

2014-05-21 23:03
浏览 504
评论(0)
分类:开源软件

Twitter Storm源代码分析之Topology的执行过程

博客分类：

Storm

转载：http://xumingming.sinaapp.com/647/twitter-storm-code-analysis-topology-execution/ 我们通过前面的文章(Twitter Storm源代码分析之ZooKeeper中的目录结构)知道了storm集群里面nimbus是通过zookeeper来给supervisor发送指令的，并且知道了通过zookeeper到底交换了哪些信息。那么一个topology从提交到执行到底是个什么样的过程？nimbus和supervisor到底做了什么样的事情呢？本文将带你去探寻这些答案。代码列表 nimbus.clj s ...

2014-05-21 23:01
浏览 620
评论(0)
分类:开源软件

Twitter Storm源代码分析之Tuple是如何发送的

博客分类：

Storm

转载：http://xumingming.sinaapp.com/727/twitter-storm-code-analysis-tuple-send-proc/ 这篇文章里面我们来看一下Storm里面的tuple到底是如何从一个tuple是怎么从一个bolt到另一个bolt上去的。首先Bolt在发射一个tuple的时候是调用OutputCollector的emit或者emitDirect方法，而这两个方法最终调用的是clojure代码里面的mk-transfer-fn方法: 帮助123456 ； worker.clj (defn mk-transfer-fn [transfer-qu ...

2014-05-21 22:59
浏览 471
评论(0)
分类:开源软件

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hive hql

Maven Hive-Jdbc教程

sqoop1.4.6安装

mysql安装

Spark安装配置

Hive 三种配置方式

Hadoop hdfs命令

Hadoop完全分布式安装

Linux常用命令

Hadoop 部署

Twitter Storm源代码分析之acker工作流程

Twitter Storm源代码分析之ZooKeeper中的目录结构

Twitter Storm源代码分析之Nimbus/Supervisor本地目录结构

Twitter Storm源代码分析之Topology的执行过程

Twitter Storm源代码分析之Tuple是如何发送的

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>