最新文章列表

ImproveIndexingSpeed(加快索引速度) 转载

原文地址 :http://wiki.apache.org/lucene-java/ImproveIndexingSpeed  How to make indexing faster Here are some things to try to speed up the indexing speed of your Lucene application. Please see ImproveSe ...
roki 评论(0) 有1534人浏览 2007-07-21 16:26

妙用Commons良药<四>

妙用Commons良药<四> 谈一谈Math包的一点内容,和怎样对属性文件,xml文件进行访问 1、关于org.apache.commons.lang.math的应用 可使用Commons Lang的NumberUtils.max()和NumberUtils.min()方法来从基本类型数组(如double[],float[],long[],int[],short[],byte[])中检 ...
lighter 评论(2) 有4155人浏览 2007-07-19 13:59

搜索篇:lucene简单实例(转)

引自:http://tech.it168.com/j/e/2006-12-24/200612242354435.shtml 【IT168技术文档】      Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索      来看 ...
VerRan 评论(0) 有1752人浏览 2007-07-18 14:26

关于BDB-Directory 的问答

问: Is it possible to turn off directory locking with BDB?  How is the performance compared to regular FSDirectory for queries? 答: If you're thinking of using Berkeley DB as a the store behind the Luc ...
roki 评论(0) 有1944人浏览 2007-07-17 19:52

lucene 学习笔记(1)

    从最简单的开始,show me the code,,,(在lucene自带的文档中).    java 代码   Analyzer analyzer = new StandardAnalyzer();          // Store the index in memory:       Directory directory = new RAMDir ...
shrek 评论(0) 有922人浏览 2007-07-14 22:57

Re: 初次使用lucene2.0的心得和疑问

1. 没有太明白你的问题,但是感觉你好象理解不对。建立索引和搜索是两个分离的过程,只有在文章增删改的时候才会涉及到索引的操作。搜索操作基于索引操作生成的索引文件。 2. 这个不用担心,如果搜索结果很多,Lucene不是一次性把所有结果都加载到内存中的,而是只把前100条读入内存,当你请求后续数据的时候再继续加载。 3. IndexWriter的第三个参数仅仅表明是否创建索引文件,如果传入的目录中已经 ...
archangel 评论(0) 有1144人浏览 2007-07-13 17:12

初尝Lucene

package lucene.test; import java.io.BufferedReader; import java.io.File; import java.io.FileReader; import java.io.IOException; import java.io.Reader; import org.apache.lucene.analysis.standard.Standa ...
Ping 评论(0) 有406人浏览 2007-07-11 16:35

JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法

OFFICE文档使用POI控件,PDF可以使用PDFBOX0.7.3控件,完全支持中文,用XPDF也行,不过感觉PDFBOX比较好,而且作者也在更新。水平有限,万望各位指正   WORD: import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.p ...
fangjing 评论(5) 有6995人浏览 2007-07-10 11:13

Lucene入门

Lucene 基础指南 作者:lighter, 江南白衣     Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。 1. 建立索引时最重要的几个术语 Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。 ...
yizhang88 评论(0) 有1062人浏览 2007-07-05 15:33

数据挖掘关于分类方面

1.提供自动学习数据,对这些数据进行索引 2。从索引里提取一个2维矩阵列表,写入一个文本文件里。关键性代码如下: java 代码   import java.io.File;   import java.util.HashMap;      import org.apache.log4j.Logger;   import org.apache.lucen ...
ttitfly 评论(1) 有1851人浏览 2007-07-05 14:36

学习目录 2007-7-8

2007-07-03   java字符集   关注点:客户端字符集与服务器端字符集的协调问题及影响和各字符集的比较   示例:用ajax提交表单,客户端如何对数据进行编码 用urlencode或页面默认字符集    在传输中的字符集的影响和container容器的影响(如apache的rewriter模块就具有 对内容有自动url解码功能),服务器端的代码转换和代码运行环境的默认字符集的影响 参考文 ...
zhangljerry 评论(0) 有1039人浏览 2007-07-04 09:31

构建基于词典的Lucene分析器(转)

构建基于词典的Lucene分析器 solo L 发布日期:2006年09月03日,更新日期:2006年10月03日 Lucene 是Apache的一个基于Java的开放源代码的搜索软件包,也是目前最为流行的搜索软件包。但是对于绝大多数中文用户来说其提供的两个中文分析器 (ChineseAnalyzer和CJKAnalyzer)的能力又太弱了,因此我们有必要开发适合自己的中文分析器。这篇文章中给出 ...
javafan_303 评论(0) 有1765人浏览 2007-07-02 07:33

Lucene 索引数据库(转)

Lucene,作为一种全文搜索的辅助工具,为我们进行条件搜索,无论是像Google,Baidu之类的搜索引擎, 还是论坛中的搜索功能,还是其它C/S架构的搜索,都 ...
javafan_303 评论(4) 有10183人浏览 2007-07-02 06:36

Jakarta Commons使用总结

浏览了一下《Jakarta Commons Cookbook》(Timothy M. O'Brien)。里面介绍了commons各子项目提供的各种实用类,大致浏览了一遍,做个总结,以后遇到相同的问题可以到commons里去寻找答案。 以下列出一些我认为比较有价值的功能,方便以后参考: lang: 1)反射地生成hashcode、equals、toString方法。 2)反转数组 3)在数组中搜索指定 ...
pf_miles 评论(0) 有1734人浏览 2007-07-01 15:03

Analysis包分析

Analysis包分析 算法和数据结构分析: 由于Analysis包比较简单,不详述了! 算法:基于机械分词 1-gram,2-gram,HMM(如果使用ICTCLAS接口的话) 数据结构:部分源码用到了Set ,HashTable,HashMap 认真理解TokenLucene中的Analysis包专门用于完成对于索引文件的分词.Lucene中的Token是一个非常重要的概念
fuyangchang 评论(1) 有1495人浏览 2007-06-21 16:41

Lucene 建立索引数据库 实现搜索网页

     摘要: lucene实现搜索引擎的建立索引数据库,处理搜索结果.一,创建索引,二 ,添加 Document,三 ,显示结果.  阅读全文jwebee 2007-05-28 15:32 发表评论
zhouxing 评论(0) 有1286人浏览 2007-05-28 07:32

Lucene+Heritrix 开发搜索引擎

     摘要: 根据搜索引擎原理,Heritrix从互联网上抓取网页,Lucene建立索引数据库,在索引数据库中搜索排序.  阅读全文jwebee 2007-05-24 20:09 发表评论
zhouxing 评论(0) 有1594人浏览 2007-05-24 12:09

Lucene深入

Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住的是,Lu ...
javafenger 评论(0) 有972人浏览 2006-09-17 23:58

在 Web 应用程序中集成 Lucene

在 Web 应用程序中集成 Lucene接下来我们开发一个 Web 应用程序利用 Lucene 来检索存放在文件服务器上的 HTML 文档。在开始之前,需要准备如下环境: Eclipse 集成开发环境 Tomcat 5.0 Lucene Library JDK 1.5 这个例子使用 Eclipse 进行 Web 应用程序的开发,最终这个 Web 应用程序跑在 Tomca ...
javafenger 评论(0) 有3058人浏览 2006-09-17 23:30

Lucene开源检索架构预览

在本篇文章中,你会学习到如何利用 Lucene 实现高级搜索功能以及如何利用 Lucene 来创建 Web 搜索应用程序。通过这些学习,你就可以利用 Lucene 来创建自己的搜索应用程序。架构概览通常一个 Web 搜索引擎的架构分为前端和后端两部分,就像图一中所示。在前端流程中,用户在搜索引擎提供的界面中输入要搜索的关键词,这里提到的用户界面一般是一个带有输入框的 Web 页面,然后应用程序将搜索 ...
javafenger 评论(0) 有2720人浏览 2006-09-17 23:20

最近博客热门TAG

Apache(33929) Lucene(5053) Hadoop(5049) nginx(3449) vim(3262) GCC(2954) memcached(2625) jfreechart(1688) Django(1602) Zend(1413) ActiveMQ(1398) Grails(1374) ActiveRecord(1349) OpenSource(1236) Emacs(870) Glassfish(858) lighttpd(810) rubygems(716) GAE(631) Blend(516)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics