最新文章列表

solr搜索引擎特性

英语原文(官方)翻译 Solr 简介 Solr 是一个带有web界面的企业级搜索服务器。它通过http协议将xml格式的文件进行索引,通过http协议进行查询,返回结果为xml格式。 * 先进的全文搜索能力 * 优化的web流量 * 基于开放接口(xml&http)的标准 * 集成的HTML管理界面 * 可扩展性
damoqingquan 评论(2) 有3057人浏览 2008-10-09 13:22

搜索引擎名人堂之Doug Cutting

Doug Cutting是一个开源搜索技术的提倡者和创造者。他和Mike Cafarella发起Lucene和Nutch开源搜索项目,这些项目现在被Apache软件基金会管理。早期开发Luncene,Doug研究搜索技术还在Excite,apple公司和Xerox PARC。Lucene是一个搜索索引索器,Nutch有一个蜘蛛或爬虫,是一个普通开源搜索平台的两个关键组件,首先爬取网络内容,然后将其构 ...
banditjava 评论(0) 有2646人浏览 2008-09-27 11:41

网站全文检索的实现(基于lucene 2.0)

辛辛苦苦做好了一个网站,接下来就必须为用户提供全文检索的功能,本程序为您的网站提供全文检索的功能,你只需要修改一下配置文件即可,供大家学习参考,程序只有一个JSP页面,你可以把他放在任何J2EE容器下(如Tomcat等),系统采用全Ajax实现,请在c:\下建立索引目录,把index.rar解压后的文件拷贝到那,由于用到的jar较大,所以这里运行的包中省去了包,请自行到官方网站下载
kongshanxuelin 评论(10) 有2092人浏览 2008-09-18 13:46

Solr中SimplePostTool的修改

将源代码修改为传递字符串,去掉files以及stdin模式。 package com; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.io.OutputStream; import java.io.OutputStreamWriter; im ...
Clayz 评论(0) 有3004人浏览 2008-09-15 22:38

How to integrate Solr and Jboss

本文转自 http://www.mail-archive.com/solr-user@lucene.apache.org/msg05645.html   Hi, The method works, but has the drawback that you need to configure your solr home inside the war of the web application. ...
Clayz 评论(0) 有1857人浏览 2008-09-11 22:50

完成了paoding与lucene的集成

---------------------------------------------------20080729--------------------------------------------------- 理解疱丁分词的基本原理,编译原码,用ANT编译 E:\workspace\searchengine\paoding-analysis-2.0.4-beta 完成了中文分词的 ...
banditjava 评论(1) 有5032人浏览 2008-09-11 15:53

研究一下solr

--------------------20080725------------------------------ apache-solr-1.2.0\example\exampledocs下面执行 java -Durl=http://localhost:8080/solr/update -jar post.jar cybertron.xml jetty java -Durl=http://l ...
banditjava 评论(0) 有2025人浏览 2008-09-11 15:51

我的开源搜索引擎之路

    老板要求在一个月内搭建出一个搜索引擎出来,先期要求做一个站内搜索就可以了。于是我只有苦笑了,搜索引擎谈何容易,而之前没有这方面的 ...
banditjava 评论(39) 有25872人浏览 2008-09-11 15:41

企业级搜索引擎Solr使用入门指南

本文转自 http://chuanliang2007.spaces.live.com/blog/cns!E5B7AB2851A4C9D2!499.entry?wa=wsignin1.0   由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及 ...
Clayz 评论(6) 有16696人浏览 2008-09-10 22:43

Lucene / Solr 开发经验

转自 Lucene/Solr开发经验[原] 作者 张驰有道   注意:该文章所属Blog中的日记遵循Creative Commons(创作共用)授权 ,您可以任意转载,转载时请务必以超链接形式标明文章原始出处 和作者信息 及本声明 。   [开篇语 ]按照惯例应该写一篇技术文章了,这次结合Lucene/Solr来分享一下开发经验。 Lucene是一个使用Java语言写的全文检索开发包(API) ...
Clayz 评论(2) 有20064人浏览 2008-09-10 22:12

solr 的分析器,分词器和分词过滤器(2)

5.  solr.HTMLStripWhitespaceTokenizerFactory 从结果中出去HTML标签,将结果交给WhitespaceTokenizer处理。 例子: my <a href="www.foo.bar">link</a> my link <?xml?><br>hello<!-- ...
damoqingquan 评论(0) 有5362人浏览 2008-08-21 18:08

solr 的分析器,分词器和分词过滤器(1)

【本文基于对此英文网页的理解http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters】    概览     当对一个文档(document是一系列field的集合)进行索引时,其中的每个field(document和file都是lucene中的概念)中的数据都会经历分析,分词和多步的分词过滤等操作。这一系列的动作是什么呢?直观的理解是, ...
damoqingquan 评论(0) 有6902人浏览 2008-08-21 16:06

solr资料收集

http://chuanliang2007.spaces.live.com/Blog/cns!E5B7AB2851A4C9D2!499.entry http://chenlb.iteye.com/blog/212625 http://www.uyun.com/?cat=8 http://www.cnblogs.com/liushouzhao/archive/2008/01/22/1049147 ...
redhacker 评论(0) 有1321人浏览 2008-08-21 14:53

solr 的 Distributed Searching 试用

一直想了解分布搜索与索引。Lucene有MultiSearcher,solr1.2的只能有单个索引,现在1.3可以有Distributed Searching这玩意。可以从多个索引里搜索出并合并结果返回给你。这些索引不是replication的,是分割的。可以先%num方式索引在num台机器上,然后用solr的shards参数。 如: shards=localhost:8080/use-solr1 ...
chenlb 评论(0) 有2077人浏览 2008-08-07 18:31

在Tomcat中部署Solr

在 Tomcat 中部署 solr 1. 下载并安装 tomcat, 假设安装目录为 D:\Lucene\my\tomcat 2. 检查 tomcat 是否安装正确 ,http://localhost:8080 3. 修改 D:\Lucene\my\tomcat\conf\server.xml, 增加 URIEncoding=”UTF-8” <Conne ...
tangbo645 评论(0) 有885人浏览 2008-07-24 09:42

gem.config的一个小问题

config.gem是rails 2.1里很喜欢的一个功能,方便了gem的管理。 但是最近在用solr-ruby的时候发现一个问题:尽管这个gem被安装了,'gem.config "solr-ruby"'却报找不到。 后来发现,solr-ruby的gem名字是‘solr-ruby’,但里面没有'solr-ruby.rb'这个文件,只有'solr.rb'. 这样就和config ...
yawl 评论(2) 有1251人浏览 2008-07-18 01:04

盘点Java技术开源搜索引擎 作者:panjun 2008-06-26

 【IT168技术分析】    Egothor Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。 Nutch Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 Lucene     Apac ...
hengcai001 评论(0) 有673人浏览 2008-07-16 13:08

盘点Java技术开源搜索引擎 作者:panjun 2008-06-26

 【IT168技术分析】    Egothor Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。 Nutch Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 Lucene     Apac ...
hengcai001 评论(0) 有516人浏览 2008-07-16 13:08

solr1.3 的新功能

solr 1.3 还没有正式发布,在这里记录下从solr 1.2的主要改动: solrj     solr的java客户端,可以嵌入搜索(不是http/xml交互) multi-core     多核心——1个web应用可以用多种的搜索服务,即可以多个schema.xml search components    搜索组件。 distributed search    分布式搜索。 a ...
chenlb 评论(5) 有2600人浏览 2008-07-08 10:20

solr 分布式(复制)配置

    solr 分布式其实是分发,这概念像Mysql的复制。所有的索引的改变都在主服务器里,所有的查询都在从服务里。从服务器不断地(定时)从主服务器拉内容,以保持数据一致。先描述下我的环境:solr-master(192.168.1.181), solr-slave(192.168.1.155), jdke1.6.0_06, tomcat-5.5.26, solr-1.2 tomcat_home在 ...
chenlb 评论(7) 有4287人浏览 2008-07-04 16:49

最近博客热门TAG

应用服务器(43288) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23313) Struts(22805) Bean(22194) 企业应用(18268) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics