阅读更多

word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch、Luke插件。

 

自1.0之后,在1.1和1.2中,word分词有了重大改进,优化了分词算法、利用多线程提升分词速度、支持分布式、支持资源变化自动检测、新增了全切分算法、支持三元模型、支持Luke插件、增加gradle支持等等,同时,word1.2支持最新的ElasticSearch1.5.1、Lucene4.10.4、Solr4.10.4以及Luke4.0。

 

更多细节请查看:word分词主页

 

word分词的分词效果怎么样?请看:Java开源项目cws_evaluation:中文分词器分词效果评估

 

 

来自: github
2
1
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 浅谈继承优缺点以及特点

    一、什么是继承? 继承是面向对象三大特征之一,可以让类和类之间产生父子类的关系。可以使得子类具有父类的属性和方法,还可以在子类中重新定义,或者添加新的属性和方法。 public class Fu { public void show() { System.out.println("Fu类show方法被调用"); } } public class Zi extends Fu { public void method() { Syste...

  • 为什么说Java中要慎重使用继承

    JAVA中使用到继承就会有两个无法回避的缺点:打破了封装性,迫使开发者去了解超类的实现细节,子类和超类耦合。超类更新后可能会导致错误。继承打破了封装性关于这一点,下面是一个详细的例子(来源于Effective Java第16条)这里自定义了一个HashSet,重写了两个方法,它和超类唯一的区别是加入了一个计数器,用来统计添加过多少个元素。写一个测试来测试这个新增的功能是否工作:运行后会发现,加入了...

  • 为什么继承有害?

    http://dev.csdn.net/article/37/37089.shtm

  • 在设计类时,慎用继承,或尽量少用继承

     模式设计告诉我们在设计类时,尽量用以下原则:1)、对接口编程,而不对实现编程2)、对类的功能扩展,要多用组合,少用继承。为什么要多用组合,少用继承呢?因为子类可能继承了对子类没用的或者有害的方法。请看下例:要求:我们在输入以下键和值时,输出也保持值的顺序  map.put("a","111");  map.put("v","190");  map.put("d","132");1、采用继承的方式

  • 全面理解Java中继承关系

    Java面向对象(三) 继承和final实例 继承 概述 继承是面向对象思想的三大特性之一,使类与类之间产生特殊 - 一般的关系,即is-a关系。 继承是从已有类中派生出新的类,新的类能吸收已有类的属性和方法,并且能拓展新的属性和行为。 在Java中使用extends关键字表示继承,语法表示为: class 子类 extends 父类{} 子类被称为派生类,父类又被称为超类。 子类...

  • 对于初学者学习Java语言的建议(转载)

    初学者的任务是掌握Java的语言规则和养成良好的编程习惯,其次才谈到对类库使用的熟练程度,再其次是OO思想的掌握与应用,再其次就是Design Pattern的问题了。      在这里我只想介绍几个对成功完成第一个阶段很有用的资料。      以下按照循序渐进的顺序进行:      1.The Java Tutorial和它的examples:          ftp://ftp.javaso

  • 为什么说要慎重使用继承

    这篇文章的主题并非鼓励不使用继承,而是仅从使用继承带来的问题出发,讨论继承机制不太好的地方,从而在使用时慎重选择,避开可能遇到的坑。 JAVA中使用到继承就会有两个无法回避的缺点: 打破了封装性,子类依赖于超类的实现细节,和超类耦合。 超类更新后可能会导致错误。 继承打破了封装性 关于这一点,下面是一个详细的例子(来源于Effective Java第16条) public cl...

  • 为什么说JAVA中要慎重使用继承

    这篇文章的主题并非鼓励不使用继承,而是仅从使用继承带来的问题出发,讨论继承机制不太好的地方,从而在使用时慎重选择,避开可能遇到的坑。 JAVA中使用到继承就会有两个无法回避的缺点: 打破了封装性,子类依赖于超类的实现细节,和超类耦合。 超类更新后可能会导致错误。 继承打破了封装性 关于这一点,下面是一个详细的例子(来源于Effective Java第16条) public class My...

  • 3.java继承的底层本质

    实际我们new子类的过程是,先new一个父类,再new一个子类,只是我们不需要这么做,java内部这么操作。 就以上知识点,我们用一个例子来理解: class Father{ Father(){ System.out.println("父类"); } void Fat(){ System.out.println("!"); } } class Son extends Father{ Son(){ ...

  • 大佬救救--Tomcat 加载dubbo-admin 出现的异常

    Tomcat 加载dubbo-admin 出现的异常 29-Apr-2021 17:40:52.103 信息 [localhost-startStop-1] org.apache.catalina.startup.HostConfig.deployWAR Deploying web application archive [G:\Developer\apache-tomcat-8.5.31\apache-tomcat-8.5.31\webapps\dubbo-admin-2.6.0.war] 29-Apr-

  • java继承的缺陷_java继承的一些问题

    如果在父类中,你声明了一个静态变量。然后你有两个子类继承了这个父类。我们想看看这两个子类调用继承的父类的类变量a是不是同一个值。这时候注意,我们在子类的时候不能重写static int a = a+2; 因为你一旦 这样重写了,那么这个子类的a肯定就不是父类的那个a了,那么这时候你想得写成a=a+2;但是这时候就有个问题了。你不能在子类中直接写a=a+2,只能在子类的初始化块中写a=a+2或者在方...

  • Fun和Do(继承和多态

    Fun和Do(继承和多态 描述 程序填空输出指定结果 #include <iostream> using namespace std; class A { private: int nVal; public: void Fun() { cout << "A::Fun" << endl; }; void Do() { cout &lt...

  • 业务层勿用继承,不要为了方便舍弃了性能。TʌT不好意思我错了

    很多人喜欢在action 或service或dao层继承一些公共的东西 比如jdbc或一些其他的东西 我看过一些小源码也经常这样 废话不多说 直入正题 直入正题前先科普一下TheardLocal类 懂的人直接跳 线程不安全指的是一个带有类成员变量(状态)的类的单列被多个线程访问时才会造成线程不安全,TheardLocal简单来说就是一个map (线程ID,对象),具体就不多说了...

  • 02Java面向对象进阶-2. 继承的好处和弊端

    02Java面向对象进阶-2. 继承的好处和弊端*

  • 求助,运行tomcat报错,实在不会了

    INFO context.ContextLoader - Root WebApplicationContext: initialization started INFO context.WebxComponentsContext - Refreshing Root WebApplicationContext: startup date [Tue Mar 03 14:45:22 CST 2020];...

  • iOS架构师之路:慎用继承

    最近在看大神Casa的文章《跳出面向对象思想(一) 继承》,脑洞大开。文章给我们展示了一个随着产品需求不断变化的例子,该例子中通过继承实现不同页面的搜索视图和搜索逻辑的代码复用,随着产品需求的演变,最后导致继承的搜索功能层级越来越深,相互依赖越来越严重,最后导致拔出萝卜带出泥,又随着个性化需求的发展,最后代码变得越来越混乱。相信有经验的开发人员都经历过这方面的痛苦。继承对代码复用来说非常好用,但同

  • 为什么Java中继承是有害的

    本文转载自:http://www.javajia.com概述   大多数好的设计者象躲避瘟疫一样来避免使用实现继承(extends 关系)。实际上80%的代码应该完全用interfaces写,而不是通过extends。“JAVA设计模式”一书详细阐述了怎样用接口继承代替实现继承。这篇文章描述设计者为什么会这么作。   Extends是有害的;也许对于Charles Manson这个级别的不是,但是

Global site tag (gtag.js) - Google Analytics