使用lucene PrefixQuery 根据拼音前缀查询 -

itfafa

浏览: 202410 次

最近访客更多访客>>

my404694047

五音谷

欲穷三千界

maomaohou

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

使用lucene PrefixQuery 根据拼音前缀查询

博客分类：

搜索引擎
java

PrefixQuery类似于数据库中的 like 'a%'查询
以下是测试代码，这种方式的缺陷是人为的分出了更多的term，目前还在找有没有更优的方法。
测试代码：
public static String index_path3="D:\\ix3";
        public static void main(String[]args) throws Exception{


            //createPrefixIndex();
                    //前缀查询
            Query trquery = new PrefixQuery(new Term("pinyin","ghai" ));

            IndexReader indexReader = IndexReader.open(FSDirectory.open(new File(index_path3)));

            Searcher searcher = new IndexSearcher(indexReader);

            TopDocs topDocs = searcher.search(trquery,100);

            for (ScoreDoc hits:topDocs.scoreDocs){
                Document doc = searcher.doc(hits.doc);
                System.out.println("doc = "+doc.get("hotelName"));
            }

        }
        /**
         * 创建pinyin索引
         */
        public static void createPrefixIndex(){
            Analyzer analyzer = new IKAnalyzer();
            PerFieldAnalyzerWrapper perFieldAnalyzerWrapper = new PerFieldAnalyzerWrapper(analyzer);
            try {

                //perFieldAnalyzerWrapper.addAnalyzer("price", new WhitespaceAnalyzer());
                IndexWriter writer = new IndexWriter(FSDirectory.open(new File(index_path3)), perFieldAnalyzerWrapper, true,IndexWriter.MaxFieldLength.LIMITED);
                Document doc = new Document();
                String pinyin="shanghai";

                             int len = pinyin.length();
                //将拼音截取保存
                            for(int i=0;i<len;i++){
                    String value = pinyin.substring(i,len);
                    doc.add(new Field("pinyin", value, Field.Store.YES, Field.Index.NOT_ANALYZED));
                }
                doc.add(new Field("hotelName", "test2", Field.Store.YES, Field.Index.ANALYZED));

                writer.addDocument(doc);

                doc = new Document();
                doc.add(new Field("hotelName", "test3", Field.Store.YES, Field.Index.ANALYZED));
                pinyin="beijing";
                len = pinyin.length();
                for(int i=0;i<len;i++){
                    String value = pinyin.substring(i,len);
                    doc.add(new Field("pinyin", value, Field.Store.YES, Field.Index.NOT_ANALYZED));
                }
                writer.addDocument(doc);

                doc = new Document();
                doc.add(new Field("hotelName", "test6", Field.Store.YES, Field.Index.ANALYZED));
                pinyin="zhongguo_benxi";
                len = pinyin.length();
                for(int i=0;i<len;i++){
                    String value = pinyin.substring(i,len);
                    doc.add(new Field("pinyin", value, Field.Store.YES, Field.Index.NOT_ANALYZED));
                }
                writer.addDocument(doc);

                doc = new Document();
                doc.add(new Field("hotelName", "test1", Field.Store.YES, Field.Index.ANALYZED));
                pinyin="tianjin";
                len = pinyin.length();
                for(int i=0;i<len;i++){
                    String value = pinyin.substring(i,len);
                    doc.add(new Field("pinyin", value, Field.Store.YES, Field.Index.NOT_ANALYZED));
                }
                writer.addDocument(doc);



                writer.close();

            } catch (Exception e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }

        }

分享到：

java 加密 | lucene 中一个Filed中包含多值的范围查询

2012-07-17 10:52
浏览 1402
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

使用lucene PrefixQuery 根据拼音前缀查询

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

使用lucene PrefixQuery 根据拼音前缀查询

评论

发表评论

相关推荐

java实现动态切换上网IP (ADSL拨号上网) java开发

JAVA字符串处理函数

(转)Lucene打分规则与Similarity模块详解

Compass将lucene、Spring、Hibernate三者结合

Lucene3.0详解

Java Web 用户登陆示例代码

Java对数函数及Java对数运算

Lucene为不同字段指定不同分词器(转)

域名管理与解析原理 — 《Java邮件开发详解》读书笔记

优秀的Java工程师需要掌握的10项技能

Web开发入门不得不看

MVC框架的映射和解耦

JAVA发送EMAIL的例子

SSH + Lucene + 分页 + 排序 + 高亮 模拟简单新闻网站搜索引擎

Lucene多字段搜索

lucene之sort

Nginx负载均衡

Lucene相关度排序的调整

HashSet重复元素判断

JAVA提高教程(2)-认识Set集合之HashSet

最近访客更多访客>>

SSH + Lucene + 分页 + 排序 + 高亮模拟简单新闻网站搜索引擎