阅读更多

word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。同时提供了Lucene、Solr、ElasticSearch、Luke插件。

 

自1.0之后,在1.1和1.2中,word分词有了重大改进,优化了分词算法、利用多线程提升分词速度、支持分布式、支持资源变化自动检测、新增了全切分算法、支持三元模型、支持Luke插件、增加gradle支持等等,同时,word1.2支持最新的ElasticSearch1.5.1、Lucene4.10.4、Solr4.10.4以及Luke4.0。

 

更多细节请查看:word分词主页

 

word分词的分词效果怎么样?请看:Java开源项目cws_evaluation:中文分词器分词效果评估

 

 

来自: github
2
1
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 为什么Java要求多用组合,少用继承?

    最近有一个要好的朋友去阿里大厂面试Java高级工程师,在第二轮面试的过程中,面试官提了一个问题:“解释下Java项目中为什么要求多用组合,少用继承?朋友觉得这个题目既熟悉,又陌生,毕竟继承与组合在一开始学习Java时就要求掌握的,但是教学过程中只是说了它们的概念及基本理论知识,没有介绍它们之间孰优孰弱的问题,实际开发中也没有刻意去将它们进行比较。一时间竟然答不上来。那么面试官为什么要问这个问题呢?

  • 浅谈继承优缺点以及特点

    一、什么是继承? 继承是面向对象三大特征之一,可以让类和类之间产生父子类的关系。可以使得子类具有父类的属性和方法,还可以在子类中重新定义,或者添加新的属性和方法。 public class Fu { public void show() { System.out.println("Fu类show方法被调用"); } } public class Zi extends Fu { public void method() { Syste...

  • 为什么说Java中要慎重使用继承

    JAVA中使用到继承就会有两个无法回避的缺点:打破了封装性,迫使开发者去了解超类的实现细节,子类和超类耦合。超类更新后可能会导致错误。继承打破了封装性关于这一点,下面是一个详细的例子(来源于Effective Java第16条)这里自定义了一个HashSet,重写了两个方法,它和超类唯一的区别是加入了一个计数器,用来统计添加过多少个元素。写一个测试来测试这个新增的功能是否工作:运行后会发现,加入了...

  • 在设计类时,慎用继承,或尽量少用继承

     模式设计告诉我们在设计类时,尽量用以下原则:1)、对接口编程,而不对实现编程2)、对类的功能扩展,要多用组合,少用继承。为什么要多用组合,少用继承呢?因为子类可能继承了对子类没用的或者有害的方法。请看下例:要求:我们在输入以下键和值时,输出也保持值的顺序  map.put("a","111");  map.put("v","190");  map.put("d","132");1、采用继承的方式

  • 转:为什么extends是有害的

    概述  大多数好的设计者象躲避瘟疫一样来避免使用实现继承(extends 关系)。%80的代码应该完全用interfaces写,不用具体的基类。事实上,四人帮的设计模式的书大量的关于怎样用interface继承代替实现继承。这个文章描述设计者为什么有这样的怪癖的想法。    Extends是有害的;也许对于Charles Manson这个级别的不是,但是足够糟糕的它应该在任何的可能的时候被避开。四...

  • 对于初学者学习Java语言的建议(转载)

    初学者的任务是掌握Java的语言规则和养成良好的编程习惯,其次才谈到对类库使用的熟练程度,再其次是OO思想的掌握与应用,再其次就是Design Pattern的问题了。      在这里我只想介绍几个对成功完成第一个阶段很有用的资料。      以下按照循序渐进的顺序进行:      1.The Java Tutorial和它的examples:          ftp://ftp.javaso

  • 为什么说要慎重使用继承

    这篇文章的主题并非鼓励不使用继承,而是仅从使用继承带来的问题出发,讨论继承机制不太好的地方,从而在使用时慎重选择,避开可能遇到的坑。 JAVA中使用到继承就会有两个无法回避的缺点: 打破了封装性,子类依赖于超类的实现细节,和超类耦合。 超类更新后可能会导致错误。 继承打破了封装性 关于这一点,下面是一个详细的例子(来源于Effective Java第16条) public cl...

  • Java:继承的目的及缺陷

    在java中继承好像占用很重要的位置,很多地方多次强调,但这并不意味着必须使用它。我们要慎用这门技术。 那么到底什么时候使用继承?一个最清晰的判断方法就是问问自己是否需要从子类向父类进行向上转型,如果必须向上转型,则继承是必须的。 继承的缺陷 image.png image.png ...

  • 为什么说JAVA中要慎重使用继承

    这篇文章的主题并非鼓励不使用继承,而是仅从使用继承带来的问题出发,讨论继承机制不太好的地方,从而在使用时慎重选择,避开可能遇到的坑。 JAVA中使用到继承就会有两个无法回避的缺点: 打破了封装性,子类依赖于超类的实现细节,和超类耦合。 超类更新后可能会导致错误。 继承打破了封装性 关于这一点,下面是一个详细的例子(来源于Effective Java第16条) public class My...

  • 大佬救救--Tomcat 加载dubbo-admin 出现的异常

    Tomcat 加载dubbo-admin 出现的异常 29-Apr-2021 17:40:52.103 信息 [localhost-startStop-1] org.apache.catalina.startup.HostConfig.deployWAR Deploying web application archive [G:\Developer\apache-tomcat-8.5.31\apache-tomcat-8.5.31\webapps\dubbo-admin-2.6.0.war] 29-Apr-

  • java继承的缺陷_java继承的一些问题

    如果在父类中,你声明了一个静态变量。然后你有两个子类继承了这个父类。我们想看看这两个子类调用继承的父类的类变量a是不是同一个值。这时候注意,我们在子类的时候不能重写static int a = a+2; 因为你一旦 这样重写了,那么这个子类的a肯定就不是父类的那个a了,那么这时候你想得写成a=a+2;但是这时候就有个问题了。你不能在子类中直接写a=a+2,只能在子类的初始化块中写a=a+2或者在方...

  • 业务层勿用继承,不要为了方便舍弃了性能。TʌT不好意思我错了

    很多人喜欢在action 或service或dao层继承一些公共的东西 比如jdbc或一些其他的东西 我看过一些小源码也经常这样 废话不多说 直入正题 直入正题前先科普一下TheardLocal类 懂的人直接跳 线程不安全指的是一个带有类成员变量(状态)的类的单列被多个线程访问时才会造成线程不安全,TheardLocal简单来说就是一个map (线程ID,对象),具体就不多说了...

  • 02Java面向对象进阶-2. 继承的好处和弊端

    02Java面向对象进阶-2. 继承的好处和弊端*

  • 求助,运行tomcat报错,实在不会了

    INFO context.ContextLoader - Root WebApplicationContext: initialization started INFO context.WebxComponentsContext - Refreshing Root WebApplicationContext: startup date [Tue Mar 03 14:45:22 CST 2020];...

  • 「转」Java继承机制的弊端

    原文链接:http://www.sunxin.org/forum/thread/20672.html# 为什么Java中继承多数是有害的 大多数好的设计者象躲避瘟疫一样来避免使用实现继承(extends 关系)。实际上80%的代码应该完全用interface写,而不是通过extends。Java设计模式一书详细阐述了怎样用接口继承代替实现继承。这篇文章描述设计者为什么会这么作。 Ext...

  • Java中继承的好处和坏处

    好处:1、子类能自动继承父类的对象 2、创建子类的对象时,无须创建父类的对象 坏处:1、破坏封装,子类与父类之间紧密耦合,子类依赖于父类的实现,子类缺乏独立性。 2、支持扩展,但是往往以增强系统结构的复杂度为代价 3、不支持动态继承。在运行时,子类无法选择不同的父类 4、子类不能改变父类的接口 ...

  • [转载] 送给常给MM修电脑的GG们

    给MM修电脑的三个步骤表演篇1、一定要打预防针!在修之前,向MM反复声明,这电脑鼓掌是有硬件和软件之分的,如果是硬件故障,例如显卡风扇不转了,显示器连线老化,显示器分辨率超出显示器指标,等等都会导致黑屏啊,这个我不回家用专门的工具是修不好的!这样一旦真的没修好,就立刻耸肩膀作无奈装:真的是硬件问题,还是送去保修吧。而MM当作硬件问题去保修,JS大人即使发现是软件问题,也会毫不犹豫作为硬件问题处理,

Global site tag (gtag.js) - Google Analytics