- 浏览: 69998 次
- 性别:
- 来自: 深圳
最新评论
-
yucang52555:
yeyefengiswo 写道我手动添加了词库且有与defau ...
ansj_seg源码分析之用户自定义词性覆盖系统原有词性 -
yeyefengiswo:
大神,你出现下了,其他的词也可以吗?比如"教授&qu ...
ansj_seg源码分析之用户自定义词性覆盖系统原有词性 -
yeyefengiswo:
我手动添加了词库且有与default.dic重合的部分,但是还 ...
ansj_seg源码分析之用户自定义词性覆盖系统原有词性 -
yucang52555:
qindongliang1922 写道词性,是自己定义的词库, ...
ansj_seg源码分析之用户自定义词性覆盖系统原有词性 -
qindongliang1922:
词性,是自己定义的词库,ansj原本不带这种功能么
ansj_seg源码分析之用户自定义词性覆盖系统原有词性
文章列表
业务需要,做一下按日期生成日志文档,log4j配置如下:
log4j.rootCategory=info,stdout,logfile
log4j.appender.logfile=org.apache.log4j.DailyRollingFileAppender
log4j.appender.logfile.File= ./log/log_
log4j.appender.logfile.DatePattern=yyyy-MM-dd'.log'
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.a ...
要把分词器集成到elasticSearch里面,肯定先要弄到ik分词器的源码。链接如下:http://code.google.com/p/ik-analyzer/downloads/list,可以检查到项目源码结构如图刚好集成到elasticSearch中:
集成进去之后,添加测试用例:
@Test
public void testIKAnalyzer(){
List<String> text = new ArrayList<String>();
text.add("冷眼向洋看世界" ...
对于源码分析,我们先还是从最外层域用户交互这一块开始,看到源码里面有一个client(客户端)的包:
点开查看详细类文件结构:
首先我们可以看到AdminClient接口,里面提供两个方法:
1) cluster(),产生一个允许从集群中执行action或操作的client;
2) indices(),产生一个允许从索引中执行action或操作的client。
查看树结构关联:
可以看出,AdminClient接口有两个实现类,分别为org.elasticsearch.client.AdminClient.NodeAdminClient和org.elasticsea ...
今天开始查阅es源码,然后就有问题引导了,首先整个系统包含多少个模块?这些模块有事怎么组织管理的呢?
elasticsearch使用的是google开源的依赖注入框架guice,这个项目号称比spring快100倍,具体性能没有测试过,不过由于其代码比较简洁,比spring快很有可能,是不是快那么多就不知道了。
public static void main(String[] args) {
Injector injector = Guice.createInjector(new BillingModule());
BillingSer ...
前一阵有一个调研需求,考虑做一下程序监控,联想到tomcat的web部署,我就在想是不是可以用tomcat源码,改一下实现对服务应用程序的监控。记录一下。
不可避免,第一步,先把源码部署起来:
1:先到tomcat官网http://tomcat.apache.org/下载源码包(就是指压缩包命名后缀为src),我下载的是apache-tomcat-6.0.41-src.zip。
2:解压上一步下载的压缩包放到指定目录,通过eclipse导入已存在项目。需要注意一点,就是eclipse需要安装ant插件。
3:得到如下图所示项目结构:
程序猿行业技术生活交流群:181287753(指 ...
老早就想接触elastic Search,由于懒惰一直拖到现在。今天第一个步骤,先把源码弄到eclipse里面再说。
1:直接去github下载源码:https://github.com/elasticsearch/elasticsearch;
2:解压放到工作区,由eclipse导入已存在的maven工程选择下载的elasticsearch目录,此时会有错误略过先(错误一般是缺少jar,maven-pluging的jar或者工程依赖的jar),这个过程是假稍微有点长哦。
3:导入完成你会发现maven配置文件报错,逐个将jar包导入。需要耐心点呢,这跟网络有关系的。
4:在jar包导完 ...
struts2和struts1之间的区别,一直没有系统的想过两者的区别,今天发现了,果断保存。
来源:struts2开发组 翻译:tianxinet(胖猴)
Action 类:
• Struts1要求Action类继承一个抽象基类。Struts1的一个普遍问题是使用抽象类编程而不 ...
1、web.xml配置文件:
<?xml version="1.0" encoding="gb2312"?>
<web-app version="2.4"
xmlns="http://java.sun.com/xml/ns/j2ee"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://java.sun.com/xml/ns/j2 ...
第一:不要认为停留在心灵的舒适区域内是可以原谅的。
每个人都有一个舒适区域,在这个区域内是很自我的,不愿意被打扰,不愿意被push,不愿意和陌生的面孔交谈,不愿意被人指责,不愿意按照规定的时限做事,不愿意主动的去关心别人,不愿意去思考别人还有什么没有想到。这在学生时代是很容易被理解的,有时候这样的同学还跟“冷酷”“个性”这些字眼沾边,算作是褒义。
然而相反,在工作之后,你要极力改变这一现状。否则,你会很快变成鸡尾酒会上唯一没有人理睬的对象,或是很快因为压力而内分泌失调。但是,如果你能很快打破之前学生期所处的舒适区域,比别人更快的处理好业务、人际、舆论之间的关 ...
正如”打工皇帝”唐骏说:“我觉得有两种人不要跟别人争利益和价值回报。第一种人就是刚刚进入企业的人,头5年千万不要说你能不能多给我一点儿工资,最重要的是能在企业里学到什么,对发展是不是有利……”人总是从平 ...
本文主要是跟同学讨论到数据结构里面线性表的头指针里面存储了什么东西。那么在链表里面头指针到底存了恩什么呢?
首先,对于头结点的理解,我们需要结合头指针来了解,所谓的头指针就是用来指示链表的第一个结点的存储位置,也就是说存储的是第一个节点对象的位置。这里补充一下,由于最后一个元素没有直接后继,所以线性表的最后一个元素的指针域为null。
其实坑爹点来说,头结点是可以不要的,但是头指针却不能不要。
有的时候在单链表的第一个结点之前附设一个结点,称之为头结点。头结点的数据域可以不存储任何信息,也可以存储如线性表长度等类的附加信息,头结点的指针域存储指向第一个结点的指针(即第一个元素结点的存储位置 ...
昨天晚上像往常一样打开myeclipse,随便运行一个类(run as java application),居然弹出Could not find the main class.Program will exit.报错如下:
Caused by: java.lang.ClassNotFoundException: localhostjdk
at java.net.URLClassLoader$1.run(URLClassLoader.java:200)
at java.sec ...
假设来自客户的HTTP请求为:http://localhost:8080/yourContext/yourJSPPage.jsp
1:请求被发送到本机端口8080,被在那里侦听的Coyote HTTP/1.1 Connector获得
2:Connector把该请求交给它所在的Service的Engine来处理,并等待来自Engine的回应
3:Engine获得请求localhost/yourContext/yourJSPPage.jsp,匹配它所拥有的所有虚拟主机Host
4:Engine匹配到名为localhost的Host(即使匹配不到也把请求交给该Host处理,因为该Host被定义为该E ...
记得第一次了解中文分词算法是在 Google 黑板报 上看到的,当初看到那个算法时我彻底被震撼住了,想不到一个看似不可能完成的任务竟然有如此神奇巧妙的算法。最近在詹卫东老师的《中文信息处理导论》课上再次学到中文分 ...
编者按:原文作者乔纳森·丹尼可(Jonathan Danylko)是一位自由职业的web架构师和程序员,编程经验已超过20年,涉足领域有电子商务、生物技术、房地产、医疗、保险和公用事业。正如乔纳 森在文中所言,本文适合刚毕业的大学生和刚入门的程序员。如果你已是高级开发人员,或许你在本文中看到自己的身影。
从11岁时,我就一直在编程,并且一直都很喜欢技术和编程。这些年来,我积累了一些艰难又容易的经验。作为一名程序员,你或许还没这些经验,但我会把它们献给那些想从中学到更多的朋友。
我会持续更新这些经验,我可能还会有更多的感想,但就我这20年来看,我想下面这个列表中基本不需要增添额外的东西 ...