- 浏览: 10113 次
- 性别:
- 来自: 北京
最新评论
-
zyslovely:
lz能给个例程么?
zyslovely@163.com
庖丁解牛(paoding) 如何定制自己的字典 (摘自官方配置文件) -
qipei:
yang7229693 写道楼主您好,我是直接下载google ...
庖丁解牛(paoding) 如何定制自己的字典 (摘自官方配置文件) -
yang7229693:
楼主您好,我是直接下载google上的beta版,培植了环境变 ...
庖丁解牛(paoding) 如何定制自己的字典 (摘自官方配置文件) -
qipei:
配置文件是这样的:(wwwmmmbird 写道
qipei 写 ...
庖丁解牛(paoding) 如何定制自己的字典 (摘自官方配置文件) -
qipei:
文件夹才wwwmmmbird 写道
每次词典修改后,要删掉di ...
庖丁解牛(paoding) 如何定制自己的字典 (摘自官方配置文件)
文章列表
本人用(Solr + paoding)
庖丁中文分词需要一套词典,这些词典需要统一存储在某个目录下,这个目录称为词典安装目录。词典安装目录可以是文件系统的任何目录,它不依赖于应用程序的运行目录。将词典拷贝到词典安装目录的过程称为安装词典。增加、删除、修改词典目录下的词典的过程称为自定制词典。
在linux下,我们可以考虑将词典安装在一个专门存储数据的分区下某目录,以笔者为例,笔者将/data作为系统的一个独立分区,笔者便是将词典保存在/data/paoding/dic下。
在windows下,我们可以考虑将词典安装在非系统盘的另外分区下的某个目录,以笔者为例,笔者可能将词典保存在E:/ ...
- 2009-04-10 17:37
- 浏览 7510
- 评论(8)
最近项目中用到htmlparser(1.6)
htmlparser的基本用法网上有 不再罗嗦
这里介绍一篇写htmlparser自定义标签的文章:
http://www.ibm.com/developerworks/cn/opensource/os-htmlparser/
下面说下如何注册自己定义的标签:(其实很简单, 只是不熟悉API.....@_@)
HTML:
在我的页面中有<Strong>.....</Strong>等htmlparser没有实现的Tag
自定义StrongTag:
import org.htmlparser.tags.Com ...