在使用lucene4.3的试试中文不能搜索求帮助！

0 0

在使用lucene4.3的试试中文不能搜索求帮助！5

1 这个是 createIndex类：
public class CreateIndex {

public void index(){
IndexWriter writer = null;
try {
//索引保存的地方
Directory directoey = FSDirectory.open(new File("F:/lucene/index01"));
//修改索引
IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_43, new StandardAnalyzer(Version.LUCENE_43));
iwc.setOpenMode(OpenMode.CREATE);
writer = new IndexWriter(directoey, iwc);
//为Document 添加field
File file = new File("F:/lucene/example");
indexDirectory(writer, file);
writer.commit();
writer.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}

public void indexDirectory(IndexWriter writer, File file){
for (File f : file.listFiles()) {
if (f.isDirectory()) {
indexDirectory(writer, f);
} else {
createDoc(writer, f);
}
}
}

public void createDoc(IndexWriter writer, File file){
Document doc = new Document();
try {
doc.add(new Field("content", new FileReader(file)));
doc.add(new Field("fileName", file.getName(), Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("path", file.getAbsolutePath(), Field.Store.YES, Field.Index.NOT_ANALYZED));
//通过IndexWriter添加文档到索引中
writer.addDocument(doc);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}

这个是createSearcher类：
public void searcher(String keyword){
try {
//创建Directory：去哪里搜索
Directory directory = FSDirectory.open(new File("F:/lucene/index01"));

//创建IndexReader
IndexReader reader = IndexReader.open(directory);
// 根据indexReader 创建indexSearcher
IndexSearcher searcher = new IndexSearcher(reader);
//StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_43);
SmartChineseAnalyzer analyzer = new SmartChineseAnalyzer(Version.LUCENE_43);
//Analyzer analyzer = new IKAnalyzer();

//创建搜索的Query
//创建parser来确定要搜索文件的内容，第二个参数表示搜索的域
QueryParser parser = new QueryParser(Version.LUCENE_43, "content", analyzer);

//创建Query，表示搜索域为content中包含java的文档
Query query = parser.parse(keyword);

// Term term = new Term("content", keyword);
// TermQuery query = new TermQuery(term);

//关键词高亮显示
// SimpleHTMLFormatter formatter = new SimpleHTMLFormatter("<read>","</read>");
// Highlighter highlighter = new Highlighter(formatter, new QueryScorer(query));
// highlighter.setTextFragmenter(new SimpleFragmenter(100));

//根据searcher搜索并且返回TopDocs 并取出前2条
TopDocs tds = searcher.search(query, 5);
System.out.println("总共有【" + tds.totalHits + "】条匹配结果");
ScoreDoc[] sds = tds.scoreDocs;
for (ScoreDoc sd : sds) {
Document d = searcher.doc(sd.doc);
System.out.println(d.get("fileName") + "["+d.get("path")+"]");
}

} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (ParseException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}

}

最后是main:

public static void main(String[] args) {
CreateIndex index = new CreateIndex();
index.index();
Searcher searcher = new Searcher();
searcher.searcher("书");
}

中文搜索不到！英文可以！

Lucene

2013年5月23日 14:09

liangling627
25
0 0 3

4个答案按时间排序按投票排序

0 0

支持1楼
0 0 在使用lucene4.3的试试中文不能搜索求帮助！5
1 这个是 createIndex类：
public class CreateIndex {

public void index(){
IndexWriter writer = null;
try {
//索引保存的地方
Directory directoey = FSDirectory.open(new File("F:/lucene/index01"));
//修改索引
IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_43, new StandardAnalyzer(Version.LUCENE_43));
改为
SmartChineseAnalyzer analyzer = new SmartChineseAnalyzer(Version.LUCENE_43);
因为分词器不一样。所以分出来的结果会不一样。这样就匹配不到了。

2013年8月05日 11:59

xchd
4
0 1 24

添加评论

0 0

引用

//修改索引
IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_43, new StandardAnalyzer(Version.LUCENE_43));

你在建立索引的时候，不能用StandardAnalyzer了呀，改为中文分词器对应的Analyzer吧

2013年5月29日 14:55

henghanan
494
0 0 32

2条评论

0 0

doc.add(new Field("content", new FileReader(file))); 改为：
FileInputStream fis = new FileInputStream(curFile);
doc.add(new Field("content", new BufferedReader(new InputStreamReader(fis, "UTF-8"))));

2013年5月23日 16:33