- 浏览: 286773 次
- 性别:
- 来自: 北京
最新评论
-
86614009:
如何在service层,如何获取绑定到当前线程的entitna ...
使用spring的OpenEntityManagerInView -
yajunyajun2011:
好帖子 怎么没人顶呢
Java 正则表达式最大,最小匹配问题 -
xtuali:
能说明一下,你的nutch是哪个版本的吗?谢谢!
搜索引擎Nutch源代码研究之一 网页抓取(1) -
dongmusic:
需要学习这么多的东西,吐血中...
如何提高Java开发能力 -
jiminsc:
cool
LDAP 验证、添加、修改、删除(转)
文章列表
转载的,试用过了,很好!
/**
* 对List对象按照某个成员变量进行排序
* @param list List对象
* @param sortField 排序的属性名称
* @param sortMode 排序方式:ASC,DESC 任选其一
*/
public static <T> void sortList(List<T> list, final String sortField, final String sortMode) {
Collect ...
1.查看当前Python版本
[plain] view plaincopy
# python -V
Python 2.6.6
2.下载Python2.7.5源码
[html] view plaincopy
# wget http://python.org/ftp/python/2.7.5/Python-2.7.5.tgz
3.解压源代码包
[html] view plaincopy
# tar xvf Python-2.7.5.tgz
4.进入解压目录并安装
[html] view plaincopy
# cd ...
Servlet
Servlet 没有 main 方法,不能够独立的运行,它的运行需要容器的支持,Tomcat 是最常用的 JSP/Servlet 容器。
Servlet 运行在 Servlet 容器中,并由容器管理从创建到销毁的整个过程。
Servlet 的生命周期
(1) 加载和实例化
Servlet 容器 ...
在hadoop中使用lzo的压缩算法可以减小数据 的大小和数据的磁盘读写时间,不仅如此,lzo是基于block分块的,这样他就允许数据被分解成chunk,并行的被hadoop处理。这样的特点,就可以让lzo在hadoop上成为一种非常好用的压缩格式。
lzo本身不是splitable的,所以当数据为text格式时,用lzo压缩出来的数据当做job的输入是一个文件作为一个map。但是sequence file本身是分块的,所以sequence file格式的文件,再配上lzo的压缩格式,就可实现lzo文件方式的splitable。
由于压缩的数据通常只有原始数据的1/4 ...
在这篇文章中,我们默认认为Hadoop环境已经由运维人员配置好直接可以使用。
假设Hadoop的安装目录HADOOP_HOME为/home/admin/hadoop。
启动与关闭
启动Hadoop
1. 进入HADOOP_HOME目录。
2. 执行sh bin/start-all.sh
关闭Hadoop
1. 进入HADOOP_HOME目录。
2. 执行sh bin/stop-all.sh
文件操作
Hadoop使用的是HDFS,能够实现的功能和我们使用的磁盘系统类似。并且支持通配符,如*。 ...
Hadoop官方的中文文档
http://hadoop.apache.org/common/docs/r0.18.2/cn/index.html
Hadoop学习资料 -- 这里面总结了很多的东西,值得一一细看
http://cloud21.javaeye.com/blog/607175
关于Hadoop的两本书 -- 有电子书下载
http://caibinbupt.javaeye.com/blog/418846
JavaEye Hadoop圈子 -- 圈子中的Hadoop资源篇很不错
http://hadoop.group.javaeye.com/
豆瓣hadoop小组 ...
玩过Linux的人都会知道,Linux中的命令的确是非常多,但是玩过Linux的人也从来不会因为Linux的命令如此之多而烦恼,因为我们只需要掌握我们最常用的命令就可以了。当然你也可以在使用时去找一下man,他会帮你解决不少的问题 ...
private static void CreateTree(TreeView treeView, String xmlfile)
{
xmlDoc = new XmlDocument();
xmlDoc.Load(xmlfile);
try
{
numofChild = 0;
treeView.Nodes.Clear();
XmlElement rootXml = xm ...
算法的力量
2006年5月
算法是计算机科学领域最重要的基石之一,但却受到了国内一些程序员的冷落。许多学生看到一些公司在招聘时要求的编程语言五花八门,就产生了一种误解,认为学计算机就是学各种编程语言,或者认 ...
刚毕业学生,想找一份Hadoop相关的 海量数据处理工作(在实验室做类似海量数据处理的项目),好找么?
迷途的小孩,想请前辈们请指点下! 需要知道Hadoop的那些知识或是其它的知识。。。。谢谢了!!
为了搭建Hadoop集群环境,配置SSH
SSH全称Secure SHell,具体介绍参考http://blog.lizhigang.net/archives/249
准备工作:
我的主机是一台Win7系统上的虚拟机( Red Hat Enterprise Linux 5.4 (RHEL5.4)镜像下载地址 server版本 32位DVD安装镜像 http://rhel.ieesee.net/uingei/rhel-server-5.4-i386-dvd.iso),IP为 192.168.1.132
另一台是Ubuntu 12.0.24 ,IP为192.168.1.107
...
1、下载jdk,修改权限 chmod a+x jdk.... .bin
2、选择安装到 /usr/java目录下
# ./jdkxxxxxx.bin
3、设置环境变量:
/home/username/.bashrc 文件 和 /etc/profile文件中,均添加:
#------------jdk environment---------------
JAVA_HOME=/usr/java/jdk1.6.0_29
JRE_HOME=/usr/java/jdk1.6.0_29/jre
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
CL ...
一个类可以(继承)实现多个接口,但只能继承一个类。接口中只能定义方法名,方法参数和返回值,以及静态变量。而抽象类中可以有方法的实现,也可以定义非静态的类变量。
所以,当你需要多继承特性时,那你只能使用 ...
java开发,由于其很多应用都是发布在Linux操作系统上,因此了解、掌握一些常用的Linux命令对与提高Java开发人员的工作效率是很有必要的。本文着重介绍Java开发相关的一些常用命令,其中以Tomcat应用相关作为重点。
1、 如何登陆到Linux机器上
习惯使用命令操作的开发人员可以使用Telnet等登录到Linux机器上进行相关操作,建议大家将Linux机器的SSH服务开启,使用SSH客户端软件登录到Linux机器上,可以很方便的进行文件编辑、权限更改、上传、下载文件等处理。
2、 如何查找文件
在实际工作当中,大家经常会碰到如何某个文件在哪个目录下面,系统有没 ...
1.PorterStemming算法(词干抽取)
http://tartarus.org/~martin/PorterStemmer/
里面有各个版本的词干抽取算法的实现。
2.Lawrence Philips' Metaphone Algorithm
http://aspell.net/metaphone/
里面有各个版本此算法的实现!
附一篇简要介绍此算法相关背景的文章
An Introduction to Double Metaphone and the principles behind Soundex
链接:http://www.datamanag ...