`
shirdrn
  • 浏览: 2700 次
  • 性别: Icon_minigender_1
  • 来自: 火星
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论
  • shirdrn: 有这样一种想法:在建立索引的时候,统计每个Term在对应的Do ...
    1111111111
  • SeanHe: 给你一段Lucene Highlight的代码 QueryPa ...
    1111111111
  • imjl: 你留意下baidu怎么做得,,,我是在其他地方看到的,,蛮好的 ...
    1111111111
  • lwowen: Lucene的sandbox中有一个叫highlighter的 ...
    1111111111
  • javaeyes: 做和索引时一样的分词,在分词后的结果中找到匹配的项,然后高亮, ...
    1111111111
阅读更多
111111111111
分享到:
评论
7 楼 shirdrn 2008-06-18  
有这样一种想法:
在建立索引的时候,统计每个Term在对应的Document中出现的频率,然后取得出现频率最高的那一段(比如取得200个字符),存储这个段的起始位置,在检索的时候,直接定位到这个位置,从而生成摘要。
这和Google的动态摘要有什么不同呢?
这种想法是否会使得索引的维护更加复杂呢?
6 楼 SeanHe 2008-06-07  
给你一段Lucene Highlight的代码
QueryParser queryParser = new QueryParser(FIELD_NAME,
                    new MMAnalyzer());
            Query query = queryParser.parse(queryStr);

            SimpleHTMLFormatter formatter = new SimpleHTMLFormatter(PRE_TAG,
                    POST_TAG);
            QueryScorer scorer = new QueryScorer(query);
            Highlighter highlighter = new Highlighter(formatter, scorer);
            Fragmenter fragmenter = new SimpleFragmenter(40);
            highlighter.setTextFragmenter(fragmenter);
            TokenStream tokenStream = new MMAnalyzer().tokenStream(FIELD_NAME,
                    new StringReader(content));
            result = highlighter.getBestFragment(tokenStream, content);
5 楼 imjl 2008-06-06  
你留意下baidu怎么做得,,,我是在其他地方看到的,,蛮好的
4 楼 lwowen 2008-06-05  
Lucene的sandbox中有一个叫highlighter的子项目,可以设置Fragment等信息来做高亮显示.
3 楼 javaeyes 2008-06-05  
做和索引时一样的分词,在分词后的结果中找到匹配的项,然后高亮,然后合并周围的词成句子, 呵呵
2 楼 laiseeme 2008-06-03  
问个问题 怎么处理这个高亮显示的丫?
1 楼 masterkey 2008-05-27  
好像没有机器能自动生成你所指的“摘要”。

google也是进行全文检索,匹配到结果的。

相关推荐

    泰乐自研脚手架1111111111

    泰乐自研脚手架1111111111是一款由泰乐公司自主研发的脚手架工具,该工具的开发语言为Java。脚手架工具在软件开发中有着重要的作用,它可以自动化生成项目的基础代码结构,从而提高开发效率,减少重复性工作。泰乐自...

    我的名片1111111111

    考虑到所给信息的简洁性,并结合专业内容处理的要求,以下是关于“我的名片1111111111”的可能知识点: 1. 名片的定义与用途:名片是一种个人身份的介绍载体,通常用于商务交流、社交场合等,以便于交换联系信息。 ...

    AviFile1_AviFile1111111111_

    标题 "AviFile1_AviFile1111111111_" 暗示我们关注的是一个与AVI文件处理相关的组件或库,可能是用于读取、编辑或创建AVI视频文件的工具。描述中提到的 "AviFiles是用于AVi合成图片图片合成为视频文件进行一些相关...

    PFD9.py1111111111

    PFD9.py1111111111

    PFD4.py1111111111

    PFD4.py1111111111

    pd24.py1111111111

    pd24.py1111111111

    甘特图模板1111111111

    "甘特图模板1111111111"可能是为了方便用户快速创建和定制符合自己需求的甘特图而设计的一款模板。 甘特图的基本元素包括任务条、时间轴和进度线。任务条表示项目中的各个任务,其长度对应任务所需的时间;时间轴...

    手机音乐识别的软件1111111111

    手机 识别歌曲 三班系统 或破解证书 1111111111111111111111111111

    恒温温控程序1111111111.rar

    这个"恒温温控程序1111111111.rar"文件很可能包含了一个完整的PLC(可编程逻辑控制器)编程项目,用于控制与温控相关的设备。PLC是一种专为工业环境设计的数字运算操作电子系统,它通过数字或模拟输入/输出来控制...

    宿舍管理系统.rar1111111111

    在【描述】中提到的"宿舍管理系统.rar1111111111",我们可以推测这是一个压缩包文件,可能包含了系统的源代码、文档、数据库配置、运行环境等资源。通常,这种类型的文件是为了方便用户下载、安装和部署。由于未提供...

    数据集资源1111111111

    数据集资源1111111111

    pd30.py1111111111

    pd30.py1111111111

    我的vim1111111111

    我的vim1111111111

    面向对象进阶1111111111

    面向对象进阶1111111111

    软件工程绘图实验1111111111

    软件工程绘图实验1111111111

    无标题罗技驱动1111111111

    无标题罗技驱动1111111111

    k8s日志1111111111

    k8s日志1111111111

    PFD11.py1111111111

    PFD11.py1111111111

    PFD8.py1111111111

    PFD8.py1111111111

    PFD7.py1111111111

    PFD7.py1111111111

Global site tag (gtag.js) - Google Analytics