IkAnalyzer3.1.6 分词（兼容lucene2.4 和2.9） - wmj2003 - ITeye博客

`

wmj2003

浏览: 101259 次
来自: ...

最近访客更多访客>>

黑化的稻草人

uczy121

未知萌

loveTingTing

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

全部博客 (72)

社区版块

存档分类

最新评论

basnio123：你好，同行想了解这个Liferay的开发应用，能否提供相关的开 ...
portal开源项目的选择-个人见解
yys2020：谢谢了!哈哈我顺利通过了... 但是有一道题改了
javaeye的论坛小测验——答案
wmj2003： 14.interests=newString[]{" ...
struts2的checkbox和checkboxlist两个标签的使用
emilyHong：如果修改的时候用checkboxList标签我应该怎么获取我 ...
struts2的checkbox和checkboxlist两个标签的使用
wmj2003：抱歉刚看到。不会吧，我都测试过了，而且还在正式的项目中使用了。 ...
序列号生成器

IkAnalyzer3.1.6 分词（兼容lucene2.4 和2.9）

阅读更多

package com.ourdms.util;

import java.io.IOException;
import java.io.StringReader;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
import org.wltea.analyzer.lucene.IKAnalyzer;

public class SegDemo {

    public static void main(String[] args) throws IOException {
        String text = "中华人民共和国 ";
        Analyzer analyzer = new IKAnalyzer();
        StringReader reader = new StringReader(text);

        long startTime = System.currentTimeMillis(); // 开始时间
        TokenStream ts = analyzer.tokenStream("", reader);
        Token token = new Token();
        token = ts.next(token);
        while(token!=null){
            System.out.println(token.term());
            token = ts.next(token);
        }
        //System.out.println(ts.next(token).term());

        long endTime = System.currentTimeMillis(); // 结束时间
        System.out.println("IK分词耗时" + new Float((endTime - startTime)) / 1000
                + "秒!");
    }
}

分享到：

fireflow1.0最新版本的下载地址

2011-11-01 15:50
浏览 1467
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

ikanalyzer中文分词支持lucene7.1.0: ikanalyzer中文分词支持lucene7.1.0是为了解决旧版ikanalyzer与新Lucene版本的兼容性问题而推出的，它使得开发者能够充分利用Lucene的最新特性，同时保持ikanalyzer的优秀分词性能，对于处理中文内容的搜索引擎和...

IKAnalyzer中文分词支持lucene6.5.0版本: 由于林良益先生在2012之后未对IKAnalyzer进行更新，后续lucene分词接口发生变化，导致不可使用，所以此jar包支持lucene6.0以上版本

IKAnalyzer3.1.6GA完整包: Luence 为应用主体的，结合词典分词和文法分析算法的中文分词组件。新版本的IK Analyzer 3.0 则发展为面向Java 的公用分词组件，独立于Lucene 项目，同时提供了对 Lucene 的默认优化实现。该资源包涵用户手册，API...

IKAnalyzer3.1.6GA.jar下载: IKAnalyzer3.1.6GA.jar IKAnalyzer3.1.6GA.jar

IKAnalyzer中文分词器支持Lucene6.0以上: 提示：IKAnalyzer中文分词器支持Lucene6.0以上，IKAnalyzer中文分词器支持Lucene6.0以上。

IKAnalyzer 支持高版本最新Lucene 5.x、6.x、7.x: 在给定的标题和描述中，我们看到IKAnalyzer已经更新以支持Lucene的高版本，包括5.x、6.x以及最新的7.3.1版本，这表明它持续跟进了Lucene的发展，确保与主流搜索引擎框架的兼容性。 1. **IKAnalyzer详解**： - IK...

IKanalyzer2012修复与Lucene3.6.2Jar及IK使用示例: 标题中的“IKanalyzer2012修复与Lucene3.6.2Jar及IK使用示例”指的是一项关于优化IKAnalyzer2012版本的活动，这是一款流行的中文分词器，常用于Java环境下的信息检索和文本分析。Lucene3.6.2Jar则是Apache Lucene的...

IKAnalyzer中文分词器V2012使用手册_20190806.pdf: 这个分词器最初是基于开源项目Lucene的词典分词和文法分析算法开发的，但到了3.0版本之后，IKAnalyzer发展成为了一个独立于Lucene的通用分词组件，并提供了对Lucene的默认优化实现。 IKAnalyzer2012的结构设计采用...

IKAnalyzer中文分词器: ### IKAnalyzer中文分词器V3.1.6：深入解析与使用指南 #### 一、IKAnalyzer3.0概述 IKAnalyzer是一个基于Java语言开发的高性能中文分词工具包，自2006年发布以来，已历经多次迭代升级。起初作为开源项目Lucene的一...

IKAnalyzer 中文分词完整java项目demo: IKAnalyzer非常易用的java分词工具。可以自定义扩展词汇。这个是一个完整的java项目demo。直接可以用，不用再去google下载了。添加了几个自定义词汇，测试好用。运行ika.java里的main方法即可

IKAnalyzer中文分词器v2012使用手册.pdf: 作为一个文本分析组件，它最初是作为开源项目Lucene的一部分，综合运用了词典分词和文法分析算法。IKAnalyzer从3.0版本开始独立于Lucene项目，成为了一个面向Java的通用分词组件，并提供了对Lucene的优化实现。到了...

IKAnalyzer 支持高版本Lucene 6.x及以上: 来自牛人修改的IKAnalyzer，https://github.com/sea-boat/IKAnalyzer-Mirror，亲测Lucene7.2可用

Lucene4.7+IK Analyzer中文分词入门教程: 请注意，选择与Lucene兼容的IK Analyzer源码包，因为不是所有版本都支持4.7。在Eclipse中，创建一个新的Java项目，例如名为“lucenetest”。然后，将Lucene的所需jar包（例如核心库、查询解析库等）从解压后的...

IK Analyzer 中文分词器下载: 自那时起，IK Analyzer已经发展成为一个广泛使用的中文分词工具，被许多企业和个人开发者应用于搜索引擎、内容管理系统、日志分析等领域。中文分词是自然语言处理中的关键步骤，因为中文句子不像英文那样有明显的...

IKAnalyzer中文分词器V3.2使用: 在Lucene索引构建过程中，你可以将IKAnalyzer作为Analyzer，这样分词器会自动处理文本的分词工作，提升搜索精度。总之，IKAnalyzer中文分词器以其高效、易用和可扩展性在Java领域的中文处理中占有一席之地。通过...

IKAnalyzer中文分词.rar: IKAnalyzer继承Lucene的Analyzer抽象类，使用IKAnalyzer和Lucene自带的分析器方法一样，将Analyzer测试代码改为IKAnalyzer测试中文分词效果。如果使用中文分词器ik-analyzer，就需要在索引和搜索程序中使用一致的...

c# 中文分词 LUCENE IKAnalyzer: 标题中的"C# 中文分词 LUCENE IKAnalyzer"是指使用C#语言实现的一个中文分词工具，它基于开源全文检索引擎Lucene，并且采用了IKAnalyzer（智能汉字分词系统）的Java版本进行移植。Lucene是一个强大的、高性能的信息...

使用IK Analyzer实现中文分词之Java实现: 最初，它是以开源项目Luence 为应用主体的，结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始，IK 发展为面向 Java 的公用分词组件，独立于 Lucene 项目，同时提供了对 Lucene 的默认优化实现。在 2012...

IKAnalyzer 中文分词demo: 7. **与其他框架的集成**：IKAnalyzer可以方便地与Lucene、Solr、Elasticsearch等全文检索框架集成，为这些系统提供强大的中文分词能力。通过这个"IKAnalyzer中文分词demo"，开发者不仅可以了解IKAnalyzer的基本...

Global site tag (gtag.js) - Google Analytics