最新文章列表

lucene支持内存索引

lucene支持内存索引:这样的搜索比基于文件的I/O有数量级的速度提升。 http://www.onjava.com/lpt/a/3273,而尽可能减少IndexSearcher的创建和对搜索结果的前台的 ...
ttitfly 评论(0) 有3102人浏览 2007-06-28 11:24

关于lucene2.0的创建、检索和删除功能的完整实现

转载: http://blog.csdn.net/xiaodaoxiaodao/archive/2006/09/10/1203959.aspx<o:p></o:p> <o:p></o:p> 关于lucene2.0的创建、检索和删除功能的完整实现<o:p></o:p> <o:p> </o:p> 最近要 ...
ttitfly 评论(0) 有1501人浏览 2007-06-28 11:07

JavaEye3.0网站需求的概述-请大家多提建议

JavaEye3.0需求简述 一、总体概述 JavaEye3.0网站将有如下频道和内容: 1、网站首页 网站首页要体现各个频道的精华内容,提高首页的信息更新速度和质量,呈现一个高质量软件开发综合性网站的风貌。 2、新闻频道 3.0新增加的频道,发布和评论最新的IT新闻,突出新闻的数量,质量和评论的一定深度。 3、论坛频道 论坛频道功能进行完善,投票和积分规则进行修订,增强搜索和文章关联度。 ...
ITeye管理员 评论(47) 有20859人浏览 2007-06-26 15:26

海量DESE推动企业级中文搜索引擎走向成熟

全文检索逸事   10G、20G、40G、80G……,近年,企业网络系统内,服务器的硬盘在以N次方的速度频繁升级,而职员却永远在抱怨机器如同老牛拖货车,“慢”得令人无法忍受。   有关调查结果显示,当前,对“基于内容搜索的文件系统”成为用户的迫切要求。在几乎所有企业所构建的网络系统中,“全文检索”功能已成客户开发应用平台的重要部分。   另外,互联网有关资深专家也声称:“中国企业信息化热情 ...
wind_bell 评论(0) 有1462人浏览 2007-06-15 16:31

DESE:一步到位的企业级搜索引擎解决方案

嵌入式数据库搜索引擎(DESE德思,Database-based Embedded Search Engine)融合了数据库完善的数据管理功能和搜索引擎高效的信息查找功能,实现了结构化数据和 ...
wind_bell 评论(0) 有1771人浏览 2007-06-15 16:21

微软和海量科技合作 推企业搜索引擎新方案

天极网 消息 记者近日获悉,微软中国公司与天津海量科技发展有限公司(海量科技)达成合作意向,微软中国公司协助海量科技在中国大陆地区推广企 ...
wind_bell 评论(0) 有1922人浏览 2007-06-15 16:17

数据库查询优化原则,欢迎指正补充

    1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。     2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:     select id from t where num is null     可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: ...
baoqf 评论(0) 有2129人浏览 2007-06-15 14:49

强大的lucene中文分词器

package com.wellhope.lucene; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.Token; import org.apache.lucene.analysis.TokenStream; import org ...
leoyang3033 评论(10) 有5919人浏览 2007-06-07 21:49

关于搜索,我的一些看法

目前的搜索大体分通用搜索和垂直搜索。 两者差别在于信息来源,通用的范围很广,所以数据量一般都是海量。垂直的信息来源比较单一,所以数据量相对而言就小。 技术角度而言,通用主要关注数据量,偏重架构设计,而垂直着重搜索的UI。 如何设计好一个架构,我觉得自己还在摸索,所以不多说,感兴趣的可以看看google的paper。 垂直搜索的面向是特定用户群,他们需要的是准确快速方便的找到自己想要的信息。 ...
imjl 评论(25) 有13984人浏览 2007-06-06 21:42

LotusDomino环境下编写Web浏览器多数据库检索程序

随着计算机技术的日益普及,Internet/Intranet技术得到了更加广泛的应用,在世 界范围的大量Web网点上以及公司内部的Web服务器上,都存放着大量的信息。为使这些信 息得到的合理使用,Web服务器管理员应该为用户提供方便的信息检索方法。作为群件代 表的Lotus Domino 4.5集成了邮件处理、群件应用和Internet出版等功能,是Notes技术向Internet/ In ...
wind_bell 评论(0) 有1516人浏览 2007-05-29 17:50

Heritrix使用的初步总结

一、框架介绍   公司最近项目要用到全文检索,检索对象是一些网站的网页内容,要使用到网络爬虫工具。         目前技术选型对象主要有两个:He ...
jason823 评论(6) 有28757人浏览 2007-05-29 14:01

分析/解析Html页面:HTML Parser的试用

转载自: http://www.jscud.com/srun/news/viewhtml/2_2005_8/71.htm   最近在研究lucene的全文检索,在很多地方需要解析或者说分析Html内容或者Html页面,Lucene本身的演示程序中也提供了一个Html Parser,但是不是纯Java的解决方案.于是到处搜索,在网上找到了一个"HTMLParser". 网址是: h ...
junjie314 评论(0) 有4099人浏览 2007-05-27 00:07

javascript...

事件源对象 event.srcElement.tagName event.srcElement.type 捕获释放 event.srcElement.setCapture();  event.srcElement.releaseCapture();  事件按键 event.keyCode event.shiftKey event.altKey event.ctrlKey 事件返 ...
zgqynx 评论(0) 有1305人浏览 2007-05-24 14:57

[原创]Nutch_0.8实践(1)

  Nutch_<st1:chmetcnv hasspace="True" numbertype="1" negative="False" sourcevalue=".8" unitname="in" w:st="on" tcsc="0">0.8实践 ...
X.D.Hua 评论(2) 有3181人浏览 2007-05-21 22:03

搜索引擎资料收集(转)

搜索引擎学习资源收集 一、搜索引擎技术/动态资源 <一>、综合类 1、卢亮的搜索引擎研究 http://www.wespoke.com/ 卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。 ...
wind_bell 评论(1) 有10940人浏览 2007-05-21 10:42

搜索概念

1 互联网搜索 其实搜索的这个核心就是分词与PageRank算法,择日和大家讨论具体的实现,依靠PR算法,sogou 3.0的搜索结果相当不错,如果融入人工智能、 ...
wind_bell 评论(0) 有1997人浏览 2007-05-17 12:59

AltaVista

     AltaVista是功能全面的搜索引擎,曾经名噪一时,但现在其地位已被Google取代。即便如此,它仍被认为是功能最完善,搜索精度较高的全文搜索引 ...
Anny 评论(0) 有683人浏览 2007-05-15 07:36

转载:关于 lucene2.0 的创建、检索和删除功能的完整实现

  最近要做一个站内的全文检索功能,主要是针对 clob 字段的,于是去网上找了点 lucene 的资料,现在新版本的是  2.0.0  ,网上的例子多是 1.4.3 的,有些方法已经废弃了,搞了 n 久终于把 2.0.0 的功能实现了,呵呵,下面把实现的代码贴出来,实现了索引的创建、检索和删除功能,并可以从检索结果去查询数据库 ~ ...
ljm3256748 评论(0) 有1626人浏览 2007-05-14 21:22

好久没来,来发发牢骚!

  工作快两个月了,找到点程序员的感觉,就不喜欢每天重复旧的东西,想每天都能学些新的知识,这样感觉不错!   现在任务是用开源的lucene全文检索引擎,大家可以一起讨论讨论!   呵呵:)
ljm3256748 评论(0) 有1096人浏览 2007-05-14 20:58

Lucene 基础指南

Lucene 基础指南 作者:lighter, 江南白衣     Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。 ...
fly.net.cn 评论(1) 有1413人浏览 2007-05-07 21:35

最近博客热门TAG

应用服务器(43285) Spring(40811) Hibernate(33329) Tomcat(28344) 框架(27200) 设计模式(24055) Servlet(23313) Struts(22804) Bean(22194) 企业应用(18268) thread(15825) 多线程(14800) SUN(11436) 虚拟机(11382) Cache(11314) Security(8001) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics