`
wuhua
  • 浏览: 2110313 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论
阅读更多
最近要用到全文检索技术。
这个Lucene是个在java界有着很高声誉的全文检索包。
通过学习,自己对它算是有个初步了解。所以写下心得与经验跟朋友们分享。
对于整个网站的结构我说下我的看法
数据库+前端技术+后台处理技术。
上面的这些我就不说了。用来用去就是那几个,你觉得那个用的顺手就行了。

搜索引擎技术呢,我觉得要点是:
1。把我们分散的数据资源整合起来-----对应于Lucene的Index也就是索引的意思。
我们把数据库的数据,按照自己的方式进行索引,关于索引的技术可以上网查看。这些索引的数据结构是可以自己定义的,这样方便查询。
2。 搜索技术,因为我们的资源太分散了,就拿数据里面的资源来说吧,每个表都不同,里面的字段都不同,如果单纯采用数据库来做的话,你可能要写很多个api进 行搜索。并对搜索结果进行出里,这样我们就要自己做很多事情。这么麻烦的话,我们何不把这些数据库里面的数据进行索呢,把我们需要的数据,归类,整理,然 后保存到索引中,虽然这样会增加磁盘的容量,但我觉得这应该就不是问题。
对于搜索技术,我们这里又要涉及到关于分词的技术,因为我们中文不同洋文,对分词技术的要求比较高。在这里,我也只是略微看了下Lucene的理论,具体实现,我也很模糊。如果分词分的好,对于搜索精度是有很大帮助的。

3。说实话索引就是一个数据库。他可以更新,删除,修改等。
先记录下这么多,以后在项目中实践的时候,继续说说我的理解
理解可能偏差比较大。大家不要被我误导啊。

不错的关于lucene英文书 点此下载
分享到:
评论
12 楼 wuhua 2007-04-28  
艾。
看来,
看来有时间我要把。我对他学习后写的全文检索系统
帖出来才行。
最近都比较忙。也没什么时间上来看看了。
11 楼 wuhua 2007-04-28  
艾。
看来,
看来有时间我要把。我对他学习后写的全文检索系统
帖出来才行。
最近都比较忙。也没什么时间上来看看了。
10 楼 wuhua 2007-04-28  
艾。
看来,
看来有时间我要把。我对他学习后写的全文检索系统
帖出来才行。
最近都比较忙。也没什么时间上来看看了。
9 楼 wuhua 2007-04-28  
艾。
看来,
看来有时间我要把。我对他学习后写的全文检索系统
帖出来才行。
最近都比较忙。也没什么时间上来看看了。
8 楼 sg552 2007-04-28  
顶楼上的大哥。

LZ以后不要弄哗众取宠的标题了。

不如把LUCENE 的DOCS 翻译成中文的好点。
7 楼 rbible 2007-04-27  
刚听说
研究学习
6 楼 YuLimin 2007-04-26  
junjie314 写道
请教个问题
File fileDir = new File("E:\\luceneweb\\s"); // 指明要索引文件夹的位置
像这里一定写索引文件的真实路径,如果写虚拟路径就找不到了.但是真正应用的时候不可能E:\\luceneweb\\s这样写吧!~而且如果换台电脑的话那不是还要改代码啊,,,wuhua大哥,吧!


File fileDir = new File("../../luceneweb/s");
采用这样形式的相对路径即可以。
5 楼 junjie314 2007-04-26  
为什么help的中文显示不出郁闷!~
4 楼 junjie314 2007-04-26  
wuhua大哥吧
3 楼 junjie314 2007-04-26  
请教个问题
File fileDir = new File("E:\\luceneweb\\s"); // 指明要索引文件夹的位置
像这里一定写索引文件的真实路径,如果写虚拟路径就找不到了.但是真正应用的时候不可能E:\\luceneweb\\s这样写吧!~而且如果换台电脑的话那不是还要改代码啊,,,wuhua大哥,吧!
2 楼 wuhua 2007-04-21  
我写的是前言,我的肤浅见解。
1 楼 sg552 2007-04-18  
...............

sigh, 这标题。。。。这内容。。。

相关推荐

    lucene学习资料收集

    【标题】:“Lucene学习资料收集” 【描述】:Lucene是一个开源的全文搜索引擎库,由Apache软件基金会开发。这个资料集可能包含了关于如何理解和使用Lucene的各种资源,特别是通过博主huanglz19871030在iteye上的...

    Lucene的的学习资料及案例

    **Lucene学习指南** Lucene是一个高性能、全文检索库,由Apache软件基金会开发并维护,是Java编程语言中广泛使用的搜索引擎库。它提供了一个简单的API,使得开发者能够方便地在应用中实现全文检索功能。本篇文章将...

    lucene学习lucene学习

    2. 创建索引:清单 1 展示了一个简单的 Java 示例,演示如何使用 Lucene 对一个目录中的 .txt 文件创建索引。在这个例子中,`fileDir` 指定包含待索引文本文件的目录,`indexDir` 是存储 Lucene 索引文件的位置。`...

    lucene学习pdf2

    "lucene学习pdf2" 提供的文档,无疑是对Lucene深入理解的一把钥匙,它涵盖了Lucene的核心概念、操作流程以及高级特性。 首先,Lucene的基础知识是必不可少的。Lucene的核心在于索引和搜索,它将非结构化的文本数据...

    Lucene学习源码.rar

    本文将主要围绕Java Lucene进行深入探讨,并基于提供的“Lucene学习源码.rar”文件中的“Lucene视频教程_讲解部分源码”展开讨论。 一、Lucene核心概念 1. 文档(Document):Lucene中的基本单位,用于存储待检索...

    lucene学习资料

    《Lucene学习资料》 Lucene是一个开源的全文搜索引擎库,由Apache软件基金会维护。它提供了高级的文本分析和索引功能,使得开发者能够轻松地在应用程序中集成强大的搜索功能。这个资料包中的《Lucene in Action_2nd...

    Lucene-2.0学习文档

    本篇文章将围绕"Lucene-2.0学习文档"的主题,结合Indexer.java、MyScoreDocComparator.java和MySortComparatorSource.java这三个关键文件,深入探讨Lucene的核心概念和实际应用。 首先,我们来看`Indexer.java`。这...

    lucene学习-02

    在深入探讨“Lucene学习-02”这一主题之前,我们先来理解一下Lucene的核心概念。Lucene是一个高性能、全文本搜索库,由Apache软件基金会开发,广泛应用于各种搜索引擎和信息检索系统。它提供了文本分析、索引构建、...

    Lucene3.3.0学习Demo

    1. **分词**:Lucene通过Analyzer处理输入的文本,将其分解为一系列的关键词(Token)。默认的StandardAnalyzer会处理英文文本,但可以自定义Analyzer来适应其他语言或特定需求。 2. **索引创建**:将分词后的...

    【大搜集:lucene学习资料】---<下载不扣分,回帖加1分,欢迎下载,童叟无欺>

    lucene学习笔记 1 .txt lucene学习笔记 2.txt lucene学习笔记 3 .txt lucene入门实战.txt Lucene 的学习 .txt Lucene-2.0学习文档 .txt Lucene入门与使用 .txt lucene性能.txt 大富翁全文索引和查询的例子...

    Lucene.net学习帮助文档

    总之,Lucene.net是一个强大的全文搜索引擎工具,通过深入学习其源码和相关文档,开发者可以构建出满足各种需求的搜索解决方案。无论你是.NET开发者还是对全文检索技术感兴趣,Lucene.net都是一个值得投入时间和精力...

    Lucene 3.6 学习笔记

    【Lucene 3.6 学习笔记】 Lucene 是一个高性能、全文本搜索库,广泛应用于各种搜索引擎的开发。本文将深入探讨Lucene 3.6版本中的关键概念、功能以及实现方法。 ### 第一章 Lucene 基础 #### 1.1 索引部分的核心...

    lucene4.8学习资料和案例

    本文将深入探讨Lucene 4.8的核心特性、使用方法以及相关的学习资料和案例,旨在帮助读者更好地理解和应用这一技术。 一、Lucene 4.8基础概念 1. 文档(Document):Lucene中的基本单位,用于存储信息,可以理解为...

    Lucene学习工具包.zip

    通过"Lucene学习工具包.zip",你可以系统地学习和实践,逐步成为一名熟练的全文搜索引擎开发者。不断深入,你会发现Lucene不仅在搜索引擎领域有广泛的应用,还能在日志分析、推荐系统等多个场景中发挥重要作用。

    lucene学习总结

    **Lucene学习总结** 在深入理解Lucene之前,我们首先需要了解什么是全文检索。全文检索是一种从大量文本数据中快速查找所需信息的技术。它通过建立索引来实现高效的搜索,而Lucene正是Java环境下最著名的全文搜索...

    Lucene 3.0 原理与代码分析PDF

    Lucene学习总结之一:全文检索的基本原理 Lucene学习总结之二:Lucene的总体架构 Lucene学习总结之三:Lucene的索引文件格式(1) Lucene学习总结之三:Lucene的索引文件格式(2) Lucene学习总结之三:Lucene的...

Global site tag (gtag.js) - Google Analytics