阅读更多

word 分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词性标注、同义标注、反义标注、拼音标注等功能。同时还无缝和Lucene、Solr、ElasticSearch、Luke集成。

 

word 1.3.1这个版本是从代码分支ForElasticsearch1.7.2中编译出来的,主要目的是支持与

lucene4.10.4、solr4.10.4和elasticsearch1.7.2兼容的版本。

 

word 分词的分词效果怎么样?请看:Java开源项目cws_evaluation:中文分词器分词效果评估

 

 

来自: github
1
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • doom启示录.pdf

    一本值得一看的游戏自传,全本大小为1兆左右,游戏开发者可以看看

  • 【免费好书】Doom启示录(个人翻译版),豆瓣评分9.2的好书

    简介:本书一个关于游戏界中两位巨星 John Carmack 和 John Romero 的真实故事,他们联手打造了商业帝国,统治着价值几十亿的游戏工业,其后他们的分崩离析在全美国引起了广泛讨论。他们为了实现梦想,从各自破碎的家庭中出逃,共同开发了史上最具创新性、最声名远扬的游戏:《毁灭战士》 和 《雷神之锤》,直到游戏让他们分道扬镳。

  • 《DOOM启示录》

    《DOOM启示录》 这本书在我读大学时看的,是 卡马克、罗梅罗 这两位被我誉为神的程序员的自传。 真的希望现在的工作能像大学时那样,可以像书里那样,通宵达旦地做自己喜欢的事情,以前大学时一个星期不上床睡觉写程序,就是受了他们的影响。 电视机9号 2007-11-09 14:45 发表评论[小组]  [博问]  [闪存]...

  • DOOM启示录

    由David Kushner 撰写之著作 《Master of DOOM》在 Amazon 和 eBook上的销售喜人。本书的中文版权由我公司拿到,将在2004年4月出版。本书忠实详尽地讲述了两个玩家是如何走上游戏之路,如何制作出迄今为止影响力最大的游戏作品--DOOM和Quake,以及他们为何在最辉煌的时候分道扬镳。本书是国内第一部游戏领域的传记。与所有传记一样,不同的读者能从中得到不同的体验:或是那游戏制作的背景内幕、光环之中的趣闻轶事、年少创业的梦想豪情、奋斗途上的汗水艰辛,亦或是那成名之后的势易情迁,独辟蹊径的商业模式、天下为公的黑客精神、众说纷纭的暴力问题…

  • 写在午夜之时 ——《doom启示录》读后感(一)

                               写在午夜之时                       ——《doom启示录》读后感     这两天有点感冒,躺在宿舍养病的同时我作了一件事情——读完了《doom启示录》。从清爽的早晨,到星光点点的午夜,我一口气读完了这本书。我的心里久久不能平静,一种不吐不快的感觉促使我在午夜之时来到了实验室,写下这些话。     我是游戏迷,喜欢很多游戏,

  • DOOM启示录 - 中文版

    你若想要理解一个沉迷游戏的孩子,那你首先的了解这个游戏.

  • DOOM启示录 DOOM启示录

    DOOM启示录 DOOM启示录 DOOM启示录 DOOM启示录 DOOM启示录 DOOM启示录 DOOM启示录 DOOM启示录 DOOM启示录 DOOM启示录 DOOM启示录

  • doom启示录txt版

    约翰卡马克和id的故事,大师级程序员 txt版

  • doom启示录(中文版)

    游戏分两种,一种是在生活中玩的,另一种是生活在其中的。这两个世界相互矛盾,而两位约翰就分别属于这不同的世界。

  • DOOM启世录的启示

      “游戏分两种,一种是生活中玩的,另一种是生活在其中的”这是DOOM启世录的第一句话。   “约翰。罗梅洛,王牌程序员”罗梅洛的第一个称号,虽然是他自封的,但绝不过誉。当然,在他遇上卡马克后他也会变得谦虚起来。  卡马克,一个进过少管所,也呆过天才班的神奇小子兼只上过两个学期大学的火箭科学家。 天才程序员:  罗梅洛在他还是孩子时,就给自己的公司取好了名字:顶级思想软

  • Doom启示录(一)---李乃峰所崇拜之 两个约翰!

    两位约翰 游戏分两种,一种是在生活中玩的,另一种是生活在其中的。这两个世界相互矛盾,而两位约翰就分别属于这不同的世界。 2000年4月的一个下午,达拉斯市中心,电子竞技职业联盟(CPL: Cyber-athlete Professional League)正在举办一届总奖金为十万美元的锦标赛。这个组织希望能成为电子游戏界的NBA,当然,比赛的项目不是篮球,而是一个计算机游戏:《雷神竞技场》(Qua

  • 《启示录》读书笔记系列--笔记十一

    市场调研                                                                                                                                市场调研的作用 存在争议:市场部门与产品部门在市场调研工具和市场调研方法在探索产品中的作用, 产生原因:双方不清楚市场调研的作

  • 启示——来自《DOOM启世录》

    上周,博文视点的编辑们送了我一本《DOOM启世录》。周日下午坐在麦当劳里等人,就着午后的斜阳和粉红色的草莓奶昔读完了整本书(也没有等到要等的人),多少还是有一些感想,在这里罗列一下吧(按照原书页码的倒序排列): P314. “译者后记”中有这样一段话:“为了忠实于原著,本书正文没有对Quake3过多着墨……”我可是读完全书才看到这段话的。什么叫“忠实于原著”?这难道不是译者的天职吗?这个所谓的“译...

  • 《DOOM启世录(纪念版) 》此书出了纪念版,好像内容没变

    DOOM启世录(纪念版)  喜欢游戏编程历史的朋友可以一读。读过的就不要买了。再去读一遍就好了。 我的这本书没有借出,一直收藏着。 有趣的书。

  • 配置adhoc

    今天用cisco的网卡配置两台adhoc的机器, 使用cisco自带的配置软件,结果一切换成adhoc方式就 死机。搞了无数年以后,发现使用windows自己的网络管理器 居然可以。。。代价如果要连接access point没有办法用÷ leap的安全方式了,nus指定安全方式。。。 只好说。。。cisco太搞了。。。

  • 莫名其妙

    要玩ns,下载版本2.27,利用vc编译,报错改makefile 报错 改makefile 报错:不认识std... 开始改源文件报错源文件。。。。。。。。。(改了1个小时以上) 最后几个文件夹了,报错:无法nmake .tcl文件??!! 装cygwin install 成功!!! 开始做试验,发现问题,调试!报错:找不到source file 看configure, 然后 ./co

  • 两个约翰的故事--读DOOM启示录

    两个约翰的故事--读DOOM启示录 这是一个精彩的故事: 两个约翰(卡马克和罗梅洛)才华横溢,相得益彰,组建了id Software游戏开发公司。在这里,技术、设计和艺术一起产生了核聚变,从《德军总部3D》到《毁灭战士》(DOOM)到《雷神之锤》(Quake),每款游戏都呈现出革命性的、前所未有的畅快淋漓。 约翰·卡马克(John Carmack)是入列“互动科学艺术协会名人堂”的天才极客,凭借《德军总部》、《DOOM》被誉为“FPS之父”,他在计算机图像引擎以及游戏研发方面的贡献使其无愧殊荣。 约翰

Global site tag (gtag.js) - Google Analytics