`
m635674608
  • 浏览: 5052912 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

mmseg 分词器 同义词总结

 
阅读更多

mmseg 分词器 最多大分词是2个词

这意味着 使用mmseg分词器,同义词分词,最大匹配只能匹配2个词的同义词。

 

 

如果使用mmesg分词器,需要把一些大于3个的词,加入扩展词库。

 

 

 

 

分享到:
评论

相关推荐

    es 同义词 热更新 1.1版本

    4. `MMsegAnalysisBinderProcessor.java` - 这个类可能是与MMSEG分析器绑定的处理器,它可能在Elasticsearch的分析流程中起作用,确保同义词过滤器与MMSEG分词器协同工作,以提供完整的同义词支持。 综合以上信息,...

    魂动罗java源码-jcseg:一个开源的分词器,增加同义词优化

    jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene-4.x和最高版本solr-4.x的分词接口. 1。目前最高版本:jcseg-1.9.2。兼容最高版本lucene-4.x和最高版本solr-4.x 2...

    Jcseg+Java中文分词器

    Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: 中文分词:mmseg算法 + Jcseg ...

    jcseg,Jcseg 是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr, elasticsearch 的分词接口!.zip

    Jcseg是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新...

    mmseg4j-all-1.8.5-with-dic

    lucene中文分词工具包,自己用ant编译成功的。可以进行定制的分词器,同义词开发。作为工具包使用。官网没有提供,组要自己编译,方便用传上来

    word源码java-jcseg:Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章

    jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: 中文分词:mmseg算法 + Jcseg 独创的优化算法,四...

    jcseg-1.9.7.zip

    Jcseg是基于mmseg算法的一个轻量级开源中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了最新版本的lucene, solr, elasticsearch的分词接口, Jcseg自带了一个 jcseg....

    Friso中文分词器-其他

    Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5,php7,ocaml,lua的插件实现。源码...

    Jcseg开发帮助文档

    此外,Jcseg允许用户通过配置文件jcseg.properties来管理分词器的行为,例如添加拼音和同义词匹配,以及自定义保留标点等。 Jcseg还支持对特定内容的识别,包括中文数字、中文分数、中英文混合词、英文大小写转换、...

    Jcseg中文分词器-其他

    Jcseg自带了一个jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: 1、中文分词:mmseg算法 + Jcseg ...

    Android代码-jcseg

    Jcseg自带了一个 jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: > 中文分词:mmseg算法 Jcseg ...

    solr技术方案.pdf

    除了分词,Solr还支持词库与同义词管理。这在处理股票代码等特殊需求时非常有用,因为它们可以被视为同义词。Solr允许我们创建和管理词典,从而提供更智能的搜索体验。 数据导入是Solr的另一个重要功能,它提供了...

    Jcseg文档下载

    - 可以通过配置`jcseg.properties`文件,在分词过程中包含拼音和同义词信息。 4. **数字与混合词识别**: - 支持中文数字和分数的识别,并能自动将其转换为阿拉伯数字形式。 - 能够识别中英文混合词和英中混合词...

    Friso-开发帮助文档1

    11. **同义词匹配**:启用后,Friso 可自动追加中文和英文的同义词。 12. **停止词过滤**:自动过滤中英文的常用停用词,提高分析效率。 13. **多配置支持**:适应多进程/多线程环境,确保安全运行。 14. **friso....

    coreseek3.1.14

    6. **查询处理**:CoreSeek支持布尔运算符、短语搜索、同义词扩展等多种查询语法,使得用户能够灵活地构造复杂的搜索请求。 7. **接口集成**:CoreSeek提供了丰富的API接口,允许开发者将搜索引擎集成到各种Web应用...

    婚姻八字测算java源码-jcseg:赛格

    jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: 中文分词:mmseg算法 + Jcseg 独创的优化算法。 ...

    婚姻八字测算java源码-jcseg:Jcseg的源代码

    jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: 中文分词:mmseg算法 + Jcseg 独创的优化算法,四...

    Jcseg-开发帮助文档.pdf

    6. **同义词匹配**: 整合了《现代汉语词典》和cc-cedict辞典中的词条,支持中英文同义词追加和匹配,并可实现简繁体之间的相互检索。 7. **数字和分数识别**: 能够识别中文数字和分数,并自动转换为阿拉伯数字形式。...

    coreseek-3.2.13.tar.gz

    2. **中文分词支持**:Coreseek特别针对中文环境进行了优化,内置了MMSEG分词算法,能有效地对中文文本进行分词处理,提高搜索的准确性和召回率。 3. **多数据源支持**:Coreseek能够连接多种数据库系统,如MySQL、...

    婚姻八字测算java源码-maintenance:学习用

    jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加同义词等! Jcseg核心功能: 中文分词:mmseg算法 + Jcseg 独创的优化算法,四...

Global site tag (gtag.js) - Google Analytics