[置顶] hadoop2.x的编译 & hadoop-snappy编译 & hadoop2.x 配置 snappy压缩

博客分类：

Hadoop

hadoop2.x的编译 hadoop-snappy编译 hadoop2.x 配置 snappy压缩

hadoop2.x 默认没有支持snappy压缩，需要我们自己编译才能支持snappy的压缩。查看hadoop2.x 的BUILDING文件， Snappy build options: Snappy is a compression library that can be utilized by the native code. It is currently an optional component, meaning that Hadoop can be built with or without this dependency. * U ...

2015-07-05 00:33
浏览 3882
评论(0)
分类:互联网

[置顶] flume环境搭建&案例

博客分类：

flume

flume环境搭建 flume导入文件到hdfs

1.下载 wget -c http://archive.cloudera.com/cdh5/cdh/5/flume-ng-1.5.0-cdh5.3.3.tar.gz 2.解压 tar -zxvf flume-ng-1.5.0-cdh5.3.3.tar.gz -C /opt/modules/ 3.配置 cd /opt/modules/flume-ng-1.5.0-cdh5.3.3/conf mv flume-env.sh.template flume-env.sh vi flume-env.sh export JAVA_HOME=/opt/modules/jdk1.7.0 ...

2015-07-04 13:18
浏览 959
评论(0)
分类:互联网

[置顶] hadoop 2.x伪分布式环境搭建

博客分类：

Hadoop

1.linux环境准备 (1).设置静态IP (2).设置主机名操作： hostname www.hyman.com vi /etc/sysconfig/network 验证： hostname (3).绑定主机名操作： vi /etc/hosts 验证： ping www.hyman.com (4).关闭防火墙操作： service iptables stop 验证： service iptables status (5).关闭防火墙自启动操作： chkconfig iptables off 验证： chkconfig --list | ...

2015-03-01 22:51
浏览 486
评论(0)
分类:互联网

scala java 集合转换

博客分类：

scala

1.java集合转scala 方法一：自动隐式转换 import scala.collection.JavaConversions._ 方法二： Wrappers.JListWrapper.apply(javaList) 2.scala集合转Java 自动隐式转换 import scala.collection.JavaConversions._

2016-10-18 12:41
浏览 717
评论(0)
分类:编程语言

shell 读取msyql

博客分类：

other

#!/bin/bash HOST_IP='hyman' USER='root' PASSWD='123456' DBNAME='zhenai_etl' sql="SELECT t.data_id,t.databaseType,t.keep_day,s.host_ip,s.host_port,s.user_name,s.user_pwd FROM t_src_interface_config t,t_server s WHERE t.server_tag = s.server_tag AND t.syn_to_db = 1;" echo $sql ...

2016-10-13 15:22
浏览 418
评论(0)
分类:编程语言

解决eclipse 创建项目默认JRE 是1.5的问题

博客分类：

maven

解决eclipse 创建项目默认JRE 是1.5的问题修改settings.xml <profile> <id>jdk-1.7</id> <activation> <activeByDefault>true</activeByDefault> <jdk>1.7</jdk> </activation> <properties> <maven.compiler.source>1.7</maven.compiler.so ...

2016-10-13 14:38
浏览 737
评论(0)
分类:编程语言

导出maven 依赖jar

博客分类：

other

输入以下命令：mvn dependency:copy-dependencies -DoutputDirectory=lib 更简单的 mvn dependency:copy-dependencies 会导出到targetdependency 下面　　mvn clean dependency:copy-dependencies package 复制依赖的jar 非常有用　　mvn dependency:copy-dependencies -DoutputDirectory=C:/lib -DincludeScope=compile 这个试过了可以。这样j ...

2016-09-30 11:54
浏览 457
评论(0)
分类:编程语言

MySQL数据库中文字符在Linux终端显示乱码解决方案

博客分类：

DataBase

MySQL中文字符乱码

用Mysql终端进入Mysql数据库一看乱码了第一感觉就是latin1字符。执行sq脚本查看Mysql字符集相关属性： SHOW VARIABLES LIKE 'character_set_%'; 果然是latin1字符集首先想到的就是把latin1改成utf8 执行命令： set names utf8; SHOW VARIABLES LIKE 'character_set_%'; 似乎问题已经解决，再次查询一看 fuck 傻眼了,有种想死的感觉，真想骂人，麻痹的安装mysql 的人脑残不选utf8作为默认字符集. 别捉急看下终端 ...

2016-02-03 02:43
浏览 981
评论(0)
分类:编程语言

mysql 创建用户、授权

博客分类：

DataBase

mysql

//创建用户 create user 'hive'@'%' identified by 'hive'; //授权 grant all privileges on *.* to 'hive'@'%' with grant option; flush privileges;

2015-08-27 15:19
浏览 536
评论(0)
分类:数据库

Hadoop数据迁移 distcp 工具

博客分类：

Hadoop

hadoop distcp 备份HDFS文件，并行复制大量数据。 1.同版本集群之间复制： hadoop distcp hdfs://namenode1/src hdfs://namenode2/dist 这将从第一个集群中复制/src目录下的内容复制到第二个集群中的/dist目录下默认情况下，distcp会跳过目标路径已经有的文件，但可以通过提供的-overwrite选项进行覆盖，也可以用-update选项来选择只更新那些修改过的文件。第一个集群的子树/src下的一个文件与第二个集群的改变进行同步。 hadoop distcp -upda ...

2015-08-23 19:05
浏览 3059
评论(0)
分类:互联网

MapReduce生成HFile文件、加载HFile到HBase

博客分类：

HBase

MapReduce生成HFile文件、加载HFile到HBase 1、程序代码 public class TransformHFile extends Configured implements Tool{ public static final String COLUMN_FAMILY = "info"; public static final String[] COLUMNS = new String[]{"rowkey","name","deptname","leader ...

2015-08-23 17:44
浏览 1061
评论(0)
分类:互联网

Mapreduce导入数据到HBase中

博客分类：

HBase

MapReuce导入数据文件到HBASE表中1. 代码编写 /** * 参考 org.apache.hadoop.hbase.mapreduce.ImportTsv * org.apache.hadoop.hbase.mapreduce.TsvImporterMapper * @author Hyman */ public class ImportEmp extends Configured implements Tool{ public static final String COLUMN_FAMILY = "info"; pub ...

2015-08-23 14:04
浏览 603
评论(0)
分类:互联网

HBASE bulkload 加载TSV数据

博客分类：

HBase

生成HFile文件 HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase mapredcp`:${HBASE_HOME}/conf \ ${HBASE_HOME}/bin/hbase org.apache.hadoop.hbase.mapreduce.ImportTsv \ -Dimporttsv.columns=HBASE_ROW_KEY,\ info:name,info:deptname,info:leader,info:joindate,info:sal,info:exp,info:deptno \ -Dimporttsv.bulk.o ...

2015-08-22 12:19
浏览 578
评论(0)
分类:互联网

hadoop 提交 mapreduce假死的问题

博客分类：

Hadoop

hadoop版本是CDH5.3.3的，安装了伪分布模式，一直以来程序运行好好的，突然间运行mapreduce程序卡在running job上，mapreduce已经提交到yarn上去了一直卡着没动，纠结了N天，总算搞定了，之前还以为是我的内存不够，我把内存设置成6G了，没跑别的应用，查看内存使用情况 [ehp@hadoop-ehp hadoop-2.5.0-cdh5.3.3]$ free -m total used free shared buffers cached Mem: ...

2015-08-19 22:52
浏览 1627
评论(0)
分类:互联网

Hive UDF编程

博客分类：

Hive

编写一个类继承 org.apache.hadoop.hive.ql.exec.UDF 在该类中加入 evaluate 方法 "evaluate" should never be a void method. However it can return "null" if * needed. public class UDFLastDay extends UDF{ private final SimpleDateFormat inputFormatter = new SimpleDateFormat("yyyy- ...

2015-08-16 17:25
浏览 762
评论(0)
分类:互联网

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

[置顶] hadoop2.x的编译 & hadoop-snappy编译 & hadoop2.x 配置 snappy压缩

[置顶] flume环境搭建&案例

[置顶] hadoop 2.x伪分布式环境搭建

scala java 集合转换

shell 读取msyql

解决eclipse 创建项目默认JRE 是1.5的问题

导出maven 依赖jar

MySQL数据库中文字符在Linux终端显示乱码解决方案

mysql 创建用户、授权

Hadoop数据迁移 distcp 工具

MapReduce生成HFile文件、加载HFile到HBase

Mapreduce导入数据到HBase中

HBASE bulkload 加载TSV数据

hadoop 提交 mapreduce假死的问题

Hive UDF编程

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>