- 浏览: 175669 次
- 性别:
- 来自: 杭州
最新评论
-
allstar2012:
很详细,顶一个!
java中四种操作(DOM、SAX、JDOM、DOM4J)xml方式详解与比较 -
gongxihai:
项目中正好要用到,以前没接触过,good
搜索引擎--Lucene简介 -
leiwuluan:
哥们,挺有心的!
搜索引擎--Lucene简介 -
bertLee:
我给你加引文:参考自:<a href="htt ...
Lucene 索引文件结构分析 -
weidewei:
benni82 写道应用代码依赖了楼上的还有啥好办法呢?
NGINX+TOMCAT架构下获取真实IP的办法
文章列表
引用本文来自:http://news.csdn.net/n/20080423/115378.html
4月23日消息,不到20人的团队,不到一年的时间,刘阳将它的我玩网估值带到了1亿元水平。2008年这家致力于代理和研发网页游戏的公司终于迎来盈利,但这仅仅才是开始,刘阳的 ...
- 2008-05-02 14:53
- 浏览 1514
- 评论(0)
Lucene的文件格式的规范,其规定了Lucene的文件格式采取的存储单位、组织结构、命名规范等等内容.
在Lucene的文件格式中,以字节为基础,并且定义了自身的数据类型.由于它们都以字节为基础定义而来,因此保证了是平台无关, ...
- 2008-04-30 23:04
- 浏览 6280
- 评论(0)
引用来自http://news.csdn.net/n/20080428/115508.html
4月27日消息,据国外媒体报道称,关键字垃圾指的是与站点内容无关的关键字,目的仅仅是使网站从搜索引擎获得更高的流量。这些网页的目的或是为了骗取广告点击,或是为了传播病毒。通常情况下,这些站点包含有数百个拼写错误的单词,吸引那些在搜索引擎中快速输入关键字的用户。
马特表示,关键字垃圾不一定是“能够看得见的”。文本和网页背景的颜色可以是一致的,使用户在浏览器上看不到任何内容,但能够被计算机和搜索引擎发现。但是,从技术上来说,这只是一种搜索引擎优化技术,而非“垃圾”。
Google的PageR ...
- 2008-04-28 22:48
- 浏览 1371
- 评论(0)
首先理解反向索引(Inverted index)这个概念,反向索引是一种以索引项为中心来组织文档的方式,每个索引项指向一个文档序列,这个序列中的文档都包含该索引项。相反,在正向索引中,文档占据了中心的位置,每个文档指向 ...
8 分析器
在前面的概念介绍中我们已经知道了分析器的作用,就是把句子按照语义切分成一个个词语。英文切分已经有了很成熟的分析器: StandardAnalyzer,很多情况下StandardAnalyzer是个不错的选择。甚至你会发现StandardA ...
7 如何搜索
lucene的搜索相当强大,它提供了很多辅助查询类,每个类都继承自Query类,各自完成一种特殊的查询,你可以像搭积木一样将它们任意组合使用,完成一些复杂操作;另外lucene还提供了Sort类对结果进行排序,提供了Filter类对查询条件进行限制。你或许会不自觉地拿它跟SQL语句进行比较:“lucene能执行and、or、order by、where、like ‘%xx%’操作吗?”回答是:“当然没问题!”
7.1 各种各样的Query
下面我们看看lucene到底允许我们进行哪些查询操作:
7.1.1 Ter ...
5 如何建索引
5.1 最简单的能完成索引的代码片断
IndexWriter writer = new IndexWriter(“/data/index/”, new StandardAnalyzer(), true);
Document doc = new Document();
doc.add(new Field("title", "lucen ...
4 lucene的结构
lucene包括core和sandbox两部分,其中core是lucene稳定的核心部分,sandbox包含了一些附加功能,例如highlighter、各种分析器。
Lucene core有七个包:analysis,document,index,queryParser,search,store,util。
4.1 analysis
Analysis包含一些内建的分析器,例如按空白字符分词的WhitespaceAnalyzer,添加了stopwrod过滤的StopAnalyzer,最常用的是Standa ...
3lucene的几个重要概念
lucene用到一些概念,了解它们的含义,有利于下面的讲解。
3.1 analyzer
Analyzer是分析器,它的作用是把一个字符串按某种规则划分成一个个词语,并去除其中的无效词语, ...
1 lucene简介
1.1 什么是lucene
Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。
Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索 ...
Apache Lucene is a high-performance, full-featured text search engine library.
1.Here's a simple example how to use Lucene for indexing and searching (using JUnit to check if the results are what we expect):
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard. ...
- 2008-04-16 13:09
- 浏览 2343
- 评论(0)
引用本文转载自:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/#N1004B
关于作者
周登朋,软件工程师,上海交通大学研究生,对 Java 技术以及信息检索技术很感兴趣。您可以通过 zhoudengpeng@yahoo.com.cn 与他联系。
本文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。
Lucene 简介
Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和 ...
搜索引擎--Lucene学习资料
1、实战 Lucene,第 1 部分: 初识 Lucene
http://wishlife.iteye.com/blog/182832
2、Lucene:基于Java的全文检索引擎简介
[url] http://www.chedong.com/tech/lucene.html#intro[/url]
3、Lucene与hibernate集成 -- Hibernate Search
http://www.hibernate.org/hib_docs/search/reference/en/html_single/官方文档
Apache Lucene is a high-performance, full-featured text search engine library written entirely in Java. It is a technology suitable for nearly any application that requires full-text search, especially cross-platform.
Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。
Lucene 是一 ...
1.详解
1)DOM(JAXP Crimson解析器)
DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。分析该结构通 ...