阅读更多

word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch、Luke插件。

 

自1.0之后,在1.1和1.2中,word分词有了重大改进,优化了分词算法、利用多线程提升分词速度、支持分布式、支持资源变化自动检测、新增了全切分算法、支持三元模型、支持Luke插件、增加gradle支持等等,同时,word1.2支持最新的ElasticSearch1.5.1、Lucene4.10.4、Solr4.10.4以及Luke4.0。

 

更多细节请查看:word分词主页

 

word分词的分词效果怎么样?请看:Java开源项目cws_evaluation:中文分词器分词效果评估

 

 

来自: github
2
1
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 浅谈继承优缺点以及特点

    一、什么是继承? 继承是面向对象三大特征之一,可以让类和类之间产生父子类的关系。可以使得子类具有父类的属性和方法,还可以在子类中重新定义,或者添加新的属性和方法。 public class Fu { public void show() { System.out.println("Fu类show方法被调用"); } } public class Zi extends Fu { public void method() { Syste...

  • 为什么说JAVA中要慎重使用继承

    这篇文章的主题并非鼓励不使用继承,而是仅从使用继承带来的问题出发,讨论继承机制不太好的地方,从而在使用时慎重选择,避开可能遇到的坑。 JAVA中使用到继承就会有两个无法回避的缺点: 打破了封装性,子类依赖于超类的实现细节,和超类耦合。 超类更新后可能会导致错误。 继承打破了封装性 关于这一点,下面是一个详细的例子(来源于Effective Java第16条) public class My...

  • 为什么说Java中要慎重使用继承

    JAVA中使用到继承就会有两个无法回避的缺点:打破了封装性,迫使开发者去了解超类的实现细节,子类和超类耦合。超类更新后可能会导致错误。继承打破了封装性关于这一点,下面是一个详细的例子(来源于Effective Java第16条)这里自定义了一个HashSet,重写了两个方法,它和超类唯一的区别是加入了一个计数器,用来统计添加过多少个元素。写一个测试来测试这个新增的功能是否工作:运行后会发现,加入了...

  • 为什么extends是有害的(二)

    [/接上一篇]有一天,有人也许运行这个代码并且注意到Stack没有运行的如想象的那么快,并且能够在重负荷下使用。你能够重写Stack,以至于它不用ArrayList并且继续提高Stack的效率。这是新的倾向的和有意义的版本:[/代码]class Stack {     private int stack_pointer = -1;     private Object[] stack = new 

  • 全面理解Java中继承关系

    Java面向对象(三) 继承和final实例 继承 概述 继承是面向对象思想的三大特性之一,使类与类之间产生特殊 - 一般的关系,即is-a关系。 继承是从已有类中派生出新的类,新的类能吸收已有类的属性和方法,并且能拓展新的属性和行为。 在Java中使用extends关键字表示继承,语法表示为: class 子类 extends 父类{} 子类被称为派生类,父类又被称为超类。 子类...

  • 对于初学者学习Java语言的建议(转载)

    初学者的任务是掌握Java的语言规则和养成良好的编程习惯,其次才谈到对类库使用的熟练程度,再其次是OO思想的掌握与应用,再其次就是Design Pattern的问题了。      在这里我只想介绍几个对成功完成第一个阶段很有用的资料。      以下按照循序渐进的顺序进行:      1.The Java Tutorial和它的examples:          ftp://ftp.javaso

  • 转:为什么extends是有害的

    概述  大多数好的设计者象躲避瘟疫一样来避免使用实现继承(extends 关系)。%80的代码应该完全用interfaces写,不用具体的基类。事实上,四人帮的设计模式的书大量的关于怎样用interface继承代替实现继承。这个文章描述设计者为什么有这样的怪癖的想法。    Extends是有害的;也许对于Charles Manson这个级别的不是,但是足够糟糕的它应该在任何的可能的时候被避开。四...

  • 为什么说要慎重使用继承

    这篇文章的主题并非鼓励不使用继承,而是仅从使用继承带来的问题出发,讨论继承机制不太好的地方,从而在使用时慎重选择,避开可能遇到的坑。 JAVA中使用到继承就会有两个无法回避的缺点: 打破了封装性,子类依赖于超类的实现细节,和超类耦合。 超类更新后可能会导致错误。 继承打破了封装性 关于这一点,下面是一个详细的例子(来源于Effective Java第16条) public cl...

  • 3.java继承的底层本质

    实际我们new子类的过程是,先new一个父类,再new一个子类,只是我们不需要这么做,java内部这么操作。 就以上知识点,我们用一个例子来理解: class Father{ Father(){ System.out.println("父类"); } void Fat(){ System.out.println("!"); } } class Son extends Father{ Son(){ ...

  • 大佬救救--Tomcat 加载dubbo-admin 出现的异常

    Tomcat 加载dubbo-admin 出现的异常 29-Apr-2021 17:40:52.103 信息 [localhost-startStop-1] org.apache.catalina.startup.HostConfig.deployWAR Deploying web application archive [G:\Developer\apache-tomcat-8.5.31\apache-tomcat-8.5.31\webapps\dubbo-admin-2.6.0.war] 29-Apr-

  • Fun和Do(继承和多态

    Fun和Do(继承和多态 描述 程序填空输出指定结果 #include <iostream> using namespace std; class A { private: int nVal; public: void Fun() { cout << "A::Fun" << endl; }; void Do() { cout &lt...

  • 业务层勿用继承,不要为了方便舍弃了性能。TʌT不好意思我错了

    很多人喜欢在action 或service或dao层继承一些公共的东西 比如jdbc或一些其他的东西 我看过一些小源码也经常这样 废话不多说 直入正题 直入正题前先科普一下TheardLocal类 懂的人直接跳 线程不安全指的是一个带有类成员变量(状态)的类的单列被多个线程访问时才会造成线程不安全,TheardLocal简单来说就是一个map (线程ID,对象),具体就不多说了...

  • 02Java面向对象进阶-2. 继承的好处和弊端

    02Java面向对象进阶-2. 继承的好处和弊端*

  • 求助,运行tomcat报错,实在不会了

    INFO context.ContextLoader - Root WebApplicationContext: initialization started INFO context.WebxComponentsContext - Refreshing Root WebApplicationContext: startup date [Tue Mar 03 14:45:22 CST 2020];...

  • iOS架构师之路:慎用继承

    最近在看大神Casa的文章《跳出面向对象思想(一) 继承》,脑洞大开。文章给我们展示了一个随着产品需求不断变化的例子,该例子中通过继承实现不同页面的搜索视图和搜索逻辑的代码复用,随着产品需求的演变,最后导致继承的搜索功能层级越来越深,相互依赖越来越严重,最后导致拔出萝卜带出泥,又随着个性化需求的发展,最后代码变得越来越混乱。相信有经验的开发人员都经历过这方面的痛苦。继承对代码复用来说非常好用,但同

  • 为什么Java中继承是有害的

    本文转载自:http://www.javajia.com概述   大多数好的设计者象躲避瘟疫一样来避免使用实现继承(extends 关系)。实际上80%的代码应该完全用interfaces写,而不是通过extends。“JAVA设计模式”一书详细阐述了怎样用接口继承代替实现继承。这篇文章描述设计者为什么会这么作。   Extends是有害的;也许对于Charles Manson这个级别的不是,但是

  • Java中继承的好处和坏处

    好处:1、子类能自动继承父类的对象 2、创建子类的对象时,无须创建父类的对象 坏处:1、破坏封装,子类与父类之间紧密耦合,子类依赖于父类的实现,子类缺乏独立性。 2、支持扩展,但是往往以增强系统结构的复杂度为代价 3、不支持动态继承。在运行时,子类无法选择不同的父类 4、子类不能改变父类的接口 ...

Global site tag (gtag.js) - Google Analytics