`
shirdrn
  • 浏览: 2668 次
  • 性别: Icon_minigender_1
  • 来自: 火星
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论
  • shirdrn: 有这样一种想法:在建立索引的时候,统计每个Term在对应的Do ...
    1111111111
  • SeanHe: 给你一段Lucene Highlight的代码 QueryPa ...
    1111111111
  • imjl: 你留意下baidu怎么做得,,,我是在其他地方看到的,,蛮好的 ...
    1111111111
  • lwowen: Lucene的sandbox中有一个叫highlighter的 ...
    1111111111
  • javaeyes: 做和索引时一样的分词,在分词后的结果中找到匹配的项,然后高亮, ...
    1111111111
阅读更多
111111111111
分享到:
评论
7 楼 shirdrn 2008-06-18  
有这样一种想法:
在建立索引的时候,统计每个Term在对应的Document中出现的频率,然后取得出现频率最高的那一段(比如取得200个字符),存储这个段的起始位置,在检索的时候,直接定位到这个位置,从而生成摘要。
这和Google的动态摘要有什么不同呢?
这种想法是否会使得索引的维护更加复杂呢?
6 楼 SeanHe 2008-06-07  
给你一段Lucene Highlight的代码
QueryParser queryParser = new QueryParser(FIELD_NAME,
                    new MMAnalyzer());
            Query query = queryParser.parse(queryStr);

            SimpleHTMLFormatter formatter = new SimpleHTMLFormatter(PRE_TAG,
                    POST_TAG);
            QueryScorer scorer = new QueryScorer(query);
            Highlighter highlighter = new Highlighter(formatter, scorer);
            Fragmenter fragmenter = new SimpleFragmenter(40);
            highlighter.setTextFragmenter(fragmenter);
            TokenStream tokenStream = new MMAnalyzer().tokenStream(FIELD_NAME,
                    new StringReader(content));
            result = highlighter.getBestFragment(tokenStream, content);
5 楼 imjl 2008-06-06  
你留意下baidu怎么做得,,,我是在其他地方看到的,,蛮好的
4 楼 lwowen 2008-06-05  
Lucene的sandbox中有一个叫highlighter的子项目,可以设置Fragment等信息来做高亮显示.
3 楼 javaeyes 2008-06-05  
做和索引时一样的分词,在分词后的结果中找到匹配的项,然后高亮,然后合并周围的词成句子, 呵呵
2 楼 laiseeme 2008-06-03  
问个问题 怎么处理这个高亮显示的丫?
1 楼 masterkey 2008-05-27  
好像没有机器能自动生成你所指的“摘要”。

google也是进行全文检索,匹配到结果的。

相关推荐

Global site tag (gtag.js) - Google Analytics