创建hive自定义函数

conkeyn

浏览: 1535687 次
性别:
来自: 厦门

最近访客更多访客>>

fuyun10036

yl4257891

ja_1991

chenzehe

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

1、引用包：

（1）、引用$HIVE_HOME/lib下的所有jar包；

（2）、引用$HADOOP_HOME/hadoop-core-xx.xx.jar包

2、源码

（1）示例1

package org.robby.hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;

public class RobLower extends UDF {

	public Text evalute(final Text s) {
		if (s == null)
			return null;
		return new Text(s.toString().toLowerCase());
	}
}

（2）示例2

package org.robby.hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;
import org.w3c.dom.Text;

public class RobBigger3 extends UDF {
	
	public Boolean evaluate(Text s){
		if(s==null){
			return null;
		}
		int t= Integer.parseInt(s.toString());
		if(t>3){
			return true;
		}else{
			return false;
		}
	}
}

3、打包输出成jar文件

/home/conkeyn/jar/rob_lower.jar

/home/conkeyn/jar/rob_bigger3.jar

4、在hive命令行中添加jar包和创建自定义函数

hive>add jar /home/conkeyn/jar/rob_lower.jar;
hive>create temporary function my_lower as 'org.robby.hive.udf.RobLower';
hive>add jar /home/conkeyn/jar/rob_bigger3.jar;
hive>create temporary function my_lower as 'org.robby.hive.udf.RobBigger3';

5、准备测试数据：

BOB     1
AMY     2
ROBBY   3
STEVEN  4

6、创建表：

drop table if exists tab_test;
create table tab_test(a string,b int) row format delimited fields terminated by '\t';
load data local inpath '/home/conkeyn/jar/tab_test1.txt' overwrite into table tab_test;

7、测试自定义函数：

select * from tab_test where my_bigger3(b);
select my_lower(a) from tab_test;

8、注意，如果出现创建函数异常、或者查询时出现字段类型对应不上时，需要退出hive环境，再重新进入hive环境。重新进入时使用debug进入

[conkeyn@hadoop bin]$ hive -hiveconf hive.root.logger=DEBUG,console

分享到：

深入学习《Programing Hive》：Tuning | 安装hadoop-lzo压缩库

2014-02-05 10:35
浏览 1083
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

创建hive自定义函数

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

创建hive自定义函数

评论

发表评论

相关推荐

zookeeper 启动错误问题

使用MRUnit测试hadoop的MapReduce

hadoop命令操作记录

Hadoop 2.x安装配置LZO

Hadoop Could not load native gpl library异常解决

深入学习《Programing Hive》：Tuning

安装hadoop-lzo压缩库

hive的SQL操作记录

Hive 问题处理记录

第一节：编译自定义的Hadoop核心包，去除用户权限检查

第二节：win 7下编译eclispe hadoop plugin

Hadoop应用中的异常记录

最近访客更多访客>>