`
dacoolbaby
  • 浏览: 1267309 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论
文章列表
直接上代码: package org.apache.hadoop.mapreduce.lib.input; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hadoop.fs.Seekable; ...
在进行页面测试的时候,需要清楚一定的cookie,但是又不希望影响其他域名下的信息。 所以可以通过一下的方式进行单独清理。   选择“设置”->“高级设置”->“隐私设置”->“内容设置”             
  Log4j MDC使用案例   import java.io.IOException; import java.util.Map; import java.util.UUID; import javax.servlet.Filter; import javax.servlet.FilterChain; import javax.servlet.ServletException; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; i ...
在Oozie的workflow上面调用jar包,可以有两种方式, 一种是使用shell来调用: <action name="user_action_info_q_node"> <shell xmlns="uri:oozie:shell-action:0.2"> <job-tracker>${jobtracker_address}</job-tracker> <name-node>${namenode_address}&l ...
ref:http://www.cnblogs.com/dkblog/archive/2011/08/26/2155018.html   1.简单的将日志打印到屏幕:   import logging logging.debug('This is debug message') logging.info('This is info message') logging.warning('This is warning message')   运行结果只有一条:     WARNING:root:This is warning message   默认情况下,loggin ...
简单的并发控制可以通过synchronized关键字来完成。 synchronized通过锁定对象,从而实现并发的控制。   但是遇到一下一种情况,就会出现意想之外的结果。   一般来说,我们要实现写入和写入互斥,读取和写入互斥,读取和读取互斥, 在set和get方法加入sychronized修饰符:   public synchronized void set(int data) {...} public synchronized void get() {...}   但是我们发现,虽然写入和写入互斥了,读取和写入也互斥了,但是读取和读取之间也互斥了, ...
在hadoop底层代码中,会看到有BlockingQueue的使用。 作为了解配置调优的作用,我也来了解一下BlockingQueue的使用。   BlockingQueue的核心方法:放入数据:  offer(anObject):表示如果可能的话,将anObject加到BlockingQueue里,即如果BlockingQueue可以容纳,    则返回true,否则返回false.(本方法不阻塞当前执行方法的线程)  offer(E o, long timeout, TimeUnit unit),可以设定等待的时间,如果在指定的时间内,还不能往队列中    加入BlockingQue ...
非常简单,请看图~~  
今天在网上看到别人的Eclipse皮肤很漂亮,所以也就查了一下如何更改。       其实很简单,现在一起来:     Help -> Install New Software -> add  -> name( 随便输入什么,我输入的是 Color Theme) Location:http://eclipse-color-theme.github.com/update      点击ok之后,出现这样的画面   目前只能用在Eclipse4上面,3.7.2版本的,我找不到了。。     好,这样就可以用了。。。
希望使用索引工具制作日志分析工具。 但是国内的关于搜索引擎的使用者和稳档都太缺少了。 目前就先留着这些吧   这篇文章是讲elasticsearch用于他们的日志分析 http://architects.dzone.com/articles/our-experience-creating-large   这个也是使用elasticsearch来解析日志 http://puppetlabs.com/blog/use-rsyslog-and-elasticsearch-powerful-log-aggregation
RandomAccessFile RandomAccessFile是用来访问那些保存数据记录的文件的,你就可以用seek( )方法来访问记录,并进行读写了。这些记录的大小不必相同;但是其大小和位置必须是可知的。但是该类仅限于操作文件。RandomAccessFile不属于InputStream和OutputStream类系的。实际上,除了实现DataInput和DataOutput接口之外(DataInputStream和DataOutputStream也实现了这两个接口),它和这两个类系毫不相干,甚至不使用InputStream和OutputStream类中已经存在的任何功能;它是一个完全 ...
读文本文件 input = open('data', 'r') #第二个参数默认为r input = open('data')   读二进制文件 input = open('data', 'rb')   读固定字节 file_object = open('abinfile', 'rb')   3.写文件 写文本文件 output = open('data', 'w')   写二进制文件 output = open('data', 'wb')   追加写文件 output = open('data', 'w+')   写数据 file_object ...
在使用一个编程语言的时候,有些功能必不可少。 其中就有日期的计算。   import datetime #日期初始化: d1 = datetime.datetime(2005, 2, 16) d2 = datetime.datetime(2004, 12, 31) #日期相减: print (d1 - d2).days starttime = datetime.datetime.now() endtime = datetime.datetime.now() print (endtime - starttime).seconds starttime = dat ...
需求需要将Hadoop的数据插入到MongoDB。   数据类型是将字符串转换成一个类似Map的对象,插入到数据库中。以替换原有的单线程接口。   import java.io.IOException; import java.util.*; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapred.JobConf; import o ...
受到这个blog的启发:http://wangzijian777.iteye.com/blog/1141763   和原文遇到的问题不同,我这里是远程数据同步到MongoDB中。 遇到删表后产生大量碎片文件,挤占系统空间。   Mongo m = new Mongo(); db = m.getDb("admin"); db.eval("db.shutdownServer"); // 或者是如下的代码: db.command("shutdown");    上面的命令中,eval已经不能使用了。最新的JDBC ...
Global site tag (gtag.js) - Google Analytics