最新文章列表

盘点Java技术开源搜索引擎

Egothor Egothor是一个用Java编写的开源 而高效的全文本搜索引擎。借助Java的跨平台 特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。 Nutch Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 Lucene     Apache Luc ...
ranfow 评论(0) 有1156人浏览 2008-06-28 18:58

Java开源搜索引擎(转载)

Egothor Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能 ...
gao_20022002 评论(0) 有1248人浏览 2008-06-27 08:22

solr 术语

    Solr 涉及的术语,简单介绍下: Auto-warming(自动预热) 当打开一个新的缓存时,它把在旧缓存里命中较高的键/值添加到新的缓存里。 Constraint(限制) 限制对象集的方法。 Facet(层面) 对象集的一个方面或特定的一部分,这可以用来资源分类。 Filter(过虑器) 它由上下方决定,可能是:1. Constraint(限制)的那称呼。2. 限制查询结果的" ...
chenlb 评论(0) 有2006人浏览 2008-06-26 11:52

Java技术开源搜索引擎

Egothor Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。     Nutch Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。     Lucene     Apache Luc ...
panjun 评论(2) 有2023人浏览 2008-06-24 22:26

对solr服务的基本操作

前提是您已经能在Tomcat中部署Solr   1.PostTool.Java import java.io.BufferedReader; import java.io.ByteArrayInputStream; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; i ...
迎风化雨 评论(0) 有1609人浏览 2008-06-05 15:47

在Tomcat中部署Solr

在 Tomcat 中部署 solr 1. 下载并安装 tomcat, 假设安装目录为 D:\Lucene\my\tomcat 2. 检查 tomcat 是否安装正确 ,http://localhost:8080 3. 修改 D:\Lucene\my\tomcat\conf\server.xml, 增加 URIEncoding=”UTF-8” <Connec ...
迎风化雨 评论(1) 有1942人浏览 2008-06-05 15:29

Solr with Apache Tomcat

Solr with Apache Tomcat Solr runs fine with [WWW] Tomcat, see the instructions in the generic Solr installation page for general info before consulting this page.    1. Solr with Apache Tomcat        ...
迎风化雨 评论(2) 有3354人浏览 2008-06-03 14:15

RailsConf 08 流水帐(第四天)

第四天,先去听了CRUD Doesn't Have an 'S' in It: Managing Complex Searching in Rails.这个session和mod_rails的在同一个时间了,只好放弃了后者。我本来期待的是free text search的内容,比如solr,sphinx之类,结果完全不是。讲得是构造SQL的复杂的search.由于作者是介绍的自己的一个travel ...
yawl 评论(0) 有1332人浏览 2008-06-03 14:11

求教:怎样修改Solr返回的xslt数据

(已解决) 现况: 我利用result.xsl文件来显示solr返回的数据,页面显示基本正常,高亮等问题都已解决. 需求: 不过我还想取出一些其他数据, 比如在搜索结果最上面显示一些购买此关键的广告连接,这些广告不是solr中的数据, 问题: 现在我想在solr返回数据时将这些广告加入其中,不知道应该怎样改写solr返回格式???    
fraser5 评论(1) 有1325人浏览 2008-05-20 16:01

为什么说Lucene不好

引言 在Lingway公司,我们使用了Lucene至进今已有好几年时间。对那些刚接触Lucene的人来说,这里是使用它的关键:Apache Lucene是一个由java编写的高性能,全方位的单词搜索引擎库。   在批评它之前,我必须承认Lucene是一个高性能的划词搜索引擎。几年来,Lucene已经被看作是用java编写的嵌入式搜索引擎中的一等公民。它的声誉每日剧增,并且仍然是开源java搜索引擎中 ...
wangdei 评论(0) 有1441人浏览 2008-05-13 18:49

关于SolrRequestHandler

SolrRequestHandler SolrRequestHandler 是 一个solr插件,它控制着处理request的逻辑。     配置 多个handlers (包括是相同的类的实例,却拥有不同的配置) 能够在solrconfig.xml 中配置 <requestHandler name="foo" default="true" cla ...
mxsfengg 评论(0) 有1495人浏览 2008-04-25 16:35

Java开源搜索引擎[收藏]

 Egothor  Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。 更多Egothor信息  Nutch  Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 更多Nutch信息 ...
fuliang 评论(0) 有2907人浏览 2008-04-24 00:09

智能型爬虫还在research

根据当前测试,目前算法预计将能成功65-70%,中间无需任何人工参与。 测试完成后将视结果是否立项?立项标准是90%,难度不小,要保持准确和速度。 测试语言:php,但是实际开发语言可能会用c#。 数据规模每天增量大约50万,数据保存至少半年,那么数据至少9000万,这将是个很庞大的规模。 虽说爬虫将独立运作,但是我觉得还是需要建立爬虫监控系统,并且参考MapReduce部分设计将性能拉到最 ...
imjl 评论(2) 有3100人浏览 2008-04-21 20:55

一种繁琐的SSH设计(三)

说他繁琐是因为每增加一个小功能,就必须书写很多代码,数据层书写service 接口与实现。dao 接口与实现。 action层要写strus-config.xml Define.xml validation.xml等 方法配置里面必须在ApplicationResources.properties LookupMethods.properties 还有spirng bean定义。太多了,繁琐。 还有 ...
tovegar 评论(0) 有1494人浏览 2008-04-10 10:12

solr json ajax

    用ajax去请求solr服务。返回json,然后解释。让solr返回json的参数是wt=json。然后javascript用evel()解释成对象。 我的solr会返回:auother,title,introduce这几个域。先创建一个jsp或html,如:json.jsp 1.json.jsp关键的html内容   <form action="select/" ...
chenlb 评论(0) 有3238人浏览 2008-03-28 17:33

solr on tomcat

    在Tomcat下部署solr自带的例子下载:apache-solr-1.2.0.zip http://apache.mirror.phpchina.com/lucene/solr/1.2/apache-solr-1.2.0.zipapache-tomcat-5.5.26.zip  http://apache.mirror.phpchina.com/tomcat/tomcat-5/v5.5.2 ...
chenlb 评论(0) 有4109人浏览 2008-03-25 12:40

Windows下acts_as_solr的rake solr:start起不来的问题解决办法

http://webonrails.com/2007/09/13/acts_as_solr-starting-solr-server-on-windows/
hideto 评论(0) 有1891人浏览 2008-03-13 17:48

30分钟搭建一个百万全文搜索

公司重心转移,不再是搜索。所以比较有空写写博。   solr是lucene的企业级扩展,很好很强大。solr的性能 http://wiki.apache.org/solr/SolrPerformanceData, 现在使用solr的网站 http://wiki.apache.org/solr/PublicServers  我习惯使用tomcat,安装参考:http://wiki.apache.or ...
imjl 评论(8) 有5078人浏览 2008-03-10 23:14

solr系统和网站查询的对接...

ruby支持的很强劲...格式化的xml数据处理起来方便....其他语言搞半天,ruby查书查资料半小时一个简化版的全文搜索功能就全套调试好上线了, 代码也很短...不过可能理解起来相对费力点... text = open('http://localhost:8080/solr/select/?q='+key+'&version=2.2&start=0&rows=20&am ...
chenjinlai 评论(0) 有854人浏览 2008-03-08 02:16

赞美开源,赞美luence贡献的廉价全文搜索解决方案

由于技术大佬的分享和开源社区的贡献,让咱们小企业也能拥有廉价的搜索引擎...成本可能只是几天,就能有海量数据的快速搜索解决方案...虽然目前还没推广开,很多disscuz论坛还不能开放全文搜索...不过可以想见这一天会很快到来的luence是目前最强劲的搜索引擎之一....而且更新快,apache的重点项目,本来是java的,php等其他语言用java不方便...于是有了solr,这是把luence ...
chenjinlai 评论(1) 有2014人浏览 2008-03-07 12:42

最近博客热门TAG

应用服务器(43288) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23313) Struts(22805) Bean(22194) 企业应用(18268) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics