`
ruishen
  • 浏览: 52043 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论
文章列表
指定行分割符和列分隔符 由于默认的是能指定列分隔符,但是不可以指定行分隔符,所以这个时候,我们存在hdfs上的数据有的可能是\001是列分隔符,和\002是分隔符这个时候就得重写一下inputformat来使用了。(当然还有其他的方式,比如书上说serDe 来做) package com.hcr.hadoop.hive; import java.io.IOException; import java.io.UnsupportedEncodingException; import org.apache.hadoop.io.LongWritable; import org.apa ...
自定义函数 在hive中,有时候一些内置的函数,和普通的查询操作已经满足不了我们要查询的要求,这时候可以自己写一些自定义函数来处理。自定义函数(user defined function =UDF) 由于hive本身是用java语言开发,所以udf必须用java来写才可以。 Hive中有三种UDF 1.普通udf(UDF) 操作单个数据行,且产生一个数据作为输出。例如(数学函数,字符串函数) 2.聚合udf (UDAF) 接受多个数据行,并产生一个数据行作为输出。例如(COUNT,MAX函数等) 3.表生成UDF(UDTF) 接受一个数据行,然后返回产生多个数据行(一个表作为输 ...
排序和聚集 正常在数据少的情况下 直接使用order by来操作即可,因为是全排序所以要在一个reduce中完成 from records select year,temperature order by year asc,temperature desc; 如果数据量大,并且不需要全排序,只是需要每个reduce中的数据排序即可。如下根据year来指定(distribute by)到相同的reduce中,然后根据sort by来排序 from records select year,temperature distribute by year sort ...
Hive服务 Hive外壳环境是可以使用hive命令来运行的一项服务。可以在运行时使用- service选项指明要使用哪种服务。键入hive-servicehelp可以获得可用服务 列表。下面介绍最有用的一些服务。 cli Hive的命令行接口(外壳环境)。这是默认的服务。 hiveserver 让Hive以提供Trift服务的服务器形式运行,允许用不同语言编写的客户端进 行访问。使用Thrift, JDBC和ODBC连接器的客户端需要运行Hive服务器来 和Hive进行通信。通过设置HIVE_ PORT环境变量来指明服务器所监听的端口 号(默认为10 000). ...
本来在虚拟机上安装的centos6.0(Final)版本系统,安装的后,由于每次登陆用crt 登,但默认开机不在虚拟机上登陆,crt连不上(网卡没启动)。 接下来 就修改一下 查看一下使用的网卡 。[hcr@slave2 ~]$ ifconfig eth1 Link encap:Ethernet HWaddr 00:0C:29:8C:BF:DF inet addr:192.168.1.13 Bcast:192.168.1.255 Mask:255.255.255.0 inet6 addr: fe80::20c:29ff:fe8c ...
可以从Apache官方网站自带的例子中查找,位置\velocity-tools-1.4-src\examples\showcase。 Apache官方网站自带的例子有下面一些: 使用Velocity Tools的时候,一定要在toolbox.xml中指定,然后在应用的web.xml中配置。 这里,关于jar包的引用,很可能出现一种Velocity运行时异常,例如: 信息: Velocity [warn] org.apache.velocity.runtime.exception.ReferenceException: reference : template = /templates/ ...
org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.lang.ClassCastException: org.apache.hadoop.hdfs.server.namenode.INodeFileUnderConstruction cannot be cast to org.apache.hadoop.hdfs.server.namenode.INodeDirectoryat org.apache.hadoop.hdfs.server.namenode.FSDirectory.addChild(FSDirectory ...
整理文档下载地址:http://download.csdn.net/detail/ruishenh/6638309 1.虚拟机安装系统(个人安装系统是centos 6.x final版) 1.在虚拟机安装了三个系统(centos 6.x final版的)目前两个都是安装的,一个是在文件复制的。 2. 安装完系统后开始安装rz命令包(由于系统在window系统用crt操作linux系统了,所以依赖上了rz命令) 联网情况下: yum install lrzsz 接下来输入两个yes 等到出现complete的英文就是ok了。 3.卸载原装openJDK 网上查的资料就是这 ...
首先用root用户进入 然后 执行visudo 在文件中增加一行 对hcr用户的赋权限 , (加上nopasswd的时候是可以不用输入密码,不建议,对删除更改操作的时候可能会有风险) hcr ALL=(ALL) ALL 或者 hcr ALL=(ALL) NOPASSWD:ALL 我本人是测试环境无所谓了。 修改完成后 ZZ退出或者wq就ok了 当然也可以用vim去编辑,不过保存的时候得强制保存 (wq!)。而且这样不会预检查语法错误。visudo就会检查。
editplus删除空行快捷键 alt+s+e 或者 ctrl+H 出来替换窗口 然后 替换内容输入 ^[ \t]*\n 选中正则表达式选项 点击 全部替换 就ok了。 或者更简单的一种
文件下载地址 :http://download.csdn.net/detail/ruishenh/6561061  项目中需要用到精确到秒的日期控件,到网上搜了一下,发现有一个JQuery控件可以实现该功能---TimerPicker。但是官网上没有提供该控件的完整Demo,而且没有提供汉化包,所以自己汉化了一下,以供需要的朋友参考。   效果图如下:图一 关键代码: $(".ui_timepicker").datetimepicker({ showSecond:true,
mysql MySQL Workbench update 语句不能加条件 看资料说是 MySQL Workbench的安全设置 Error Code: 1175. You are using safe update mode and you tried to update a table without a WHERE that uses a KEY column To disable safe mode, toggle the option in Preferences -> SQL Editor -> Query Editor and reconnect. 当然有的说在 ...
Failing Oozie Launcher, Output data size [2,070] exceeds maximum [2,048] 在读取了属性信息放到oozie节点中的时候因为数据太大了。 File file = new File(System.getProperty("oozie.action.output.properties")); Properties props = new Properties();for (String key : prop.keySet()) {//....props.setProperty(key, value);} ...
java.lang.ClassCastException: java.lang.Integer cannot be cast to java.lang.Longat org.springframework.data.mongodb.core.mapreduce.MapReduceResults.parseTiming(MapReduceResults.java:80)at org.springframework.data.mongodb.core.mapreduce.MapReduceResults.<init>(MapReduceResults.java:49)at org.spr ...
Oozie 安装笔记 版本 3.0.0 1.下载 oozie 3.0.0版本文件。 http://oozie.apache.org/ 或者 oozie下载文件:http://download.csdn.net/detail/ruishenh/6561255 ext-2.2.zip文件:http://download.csdn.net/detail/ruishenh/6562161 2.安装 & 配置 bin/oozie-setup.sh -hadoop 0.20.2/usr/local/hadoop/ -extjs ext-2.2.zip A.修改 hado ...
Global site tag (gtag.js) - Google Analytics