`
文章列表
引用本文来自:http://news.csdn.net/n/20080423/115378.html 4月23日消息,不到20人的团队,不到一年的时间,刘阳将它的我玩网估值带到了1亿元水平。2008年这家致力于代理和研发网页游戏的公司终于迎来盈利,但这仅仅才是开始,刘阳的 ...
Lucene的文件格式的规范,其规定了Lucene的文件格式采取的存储单位、组织结构、命名规范等等内容. 在Lucene的文件格式中,以字节为基础,并且定义了自身的数据类型.由于它们都以字节为基础定义而来,因此保证了是平台无关, ...
引用来自http://news.csdn.net/n/20080428/115508.html 4月27日消息,据国外媒体报道称,关键字垃圾指的是与站点内容无关的关键字,目的仅仅是使网站从搜索引擎获得更高的流量。这些网页的目的或是为了骗取广告点击,或是为了传播病毒。通常情况下,这些站点包含有数百个拼写错误的单词,吸引那些在搜索引擎中快速输入关键字的用户。   马特表示,关键字垃圾不一定是“能够看得见的”。文本和网页背景的颜色可以是一致的,使用户在浏览器上看不到任何内容,但能够被计算机和搜索引擎发现。但是,从技术上来说,这只是一种搜索引擎优化技术,而非“垃圾”。   Google的PageR ...
首先理解反向索引(Inverted index)这个概念,反向索引是一种以索引项为中心来组织文档的方式,每个索引项指向一个文档序列,这个序列中的文档都包含该索引项。相反,在正向索引中,文档占据了中心的位置,每个文档指向 ...
8 分析器         在前面的概念介绍中我们已经知道了分析器的作用,就是把句子按照语义切分成一个个词语。英文切分已经有了很成熟的分析器: StandardAnalyzer,很多情况下StandardAnalyzer是个不错的选择。甚至你会发现StandardA ...
7 如何搜索         lucene的搜索相当强大,它提供了很多辅助查询类,每个类都继承自Query类,各自完成一种特殊的查询,你可以像搭积木一样将它们任意组合使用,完成一些复杂操作;另外lucene还提供了Sort类对结果进行排序,提供了Filter类对查询条件进行限制。你或许会不自觉地拿它跟SQL语句进行比较:“lucene能执行and、or、order by、where、like ‘%xx%’操作吗?”回答是:“当然没问题!”         7.1 各种各样的Query         下面我们看看lucene到底允许我们进行哪些查询操作:         7.1.1 Ter ...
5 如何建索引         5.1 最简单的能完成索引的代码片断 IndexWriter writer = new IndexWriter(“/data/index/”, new StandardAnalyzer(), true); Document doc = new Document(); doc.add(new Field("title", "lucen ...
4 lucene的结构         lucene包括core和sandbox两部分,其中core是lucene稳定的核心部分,sandbox包含了一些附加功能,例如highlighter、各种分析器。         Lucene core有七个包:analysis,document,index,queryParser,search,store,util。         4.1 analysis         Analysis包含一些内建的分析器,例如按空白字符分词的WhitespaceAnalyzer,添加了stopwrod过滤的StopAnalyzer,最常用的是Standa ...
3lucene的几个重要概念         lucene用到一些概念,了解它们的含义,有利于下面的讲解。         3.1 analyzer         Analyzer是分析器,它的作用是把一个字符串按某种规则划分成一个个词语,并去除其中的无效词语, ...
1 lucene简介         1.1 什么是lucene         Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。             Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索 ...
Apache Lucene is a high-performance, full-featured text search engine library. 1.Here's a simple example how to use Lucene for indexing and searching (using JUnit to check if the results are what we expect): import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard. ...
引用本文转载自:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/#N1004B 关于作者     周登朋,软件工程师,上海交通大学研究生,对 Java 技术以及信息检索技术很感兴趣。您可以通过 zhoudengpeng@yahoo.com.cn 与他联系。     本文首先介绍了Lucene的一些基本概念,然后开发了一个应用程序演示了利用Lucene建立索引并在该索引上进行搜索的过程。 Lucene 简介     Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和 ...
搜索引擎--Lucene学习资料 1、实战 Lucene,第 1 部分: 初识 Lucene      http://wishlife.iteye.com/blog/182832 2、Lucene:基于Java的全文检索引擎简介     [url] http://www.chedong.com/tech/lucene.html#intro[/url] 3、Lucene与hibernate集成 -- Hibernate Search     http://www.hibernate.org/hib_docs/search/reference/en/html_single/官方文档
    Apache Lucene is a high-performance, full-featured text search engine library written entirely in Java. It is a technology suitable for nearly any application that requires full-text search, especially cross-platform.     Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。         Lucene 是一 ...
        1.详解     1)DOM(JAXP Crimson解析器)     DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。分析该结构通 ...
  • 2008-04-11 17:21
  • 浏览 11374
  • 评论(3)
  • 论坛回复 / 浏览 (1 / 17910)
Global site tag (gtag.js) - Google Analytics