- 浏览: 419426 次
- 性别:
- 来自: 北京
最新评论
-
springdata_spring:
apache lucene开源框架demo使用实例教程源代码下 ...
有关Lucene的问题(6):Lucene的事务性 -
jaychang:
必须要感谢作者的分享,对理解Lucene的工作原理帮助很大
Lucene学习总结之一:全文检索的基本原理 -
yin_kaihua:
...
Lucene学习总结之三:Lucene的索引文件格式 (1) -
djh122:
...
Lucene 原理与代码分析完整版 -
wayne0830:
多谢楼主分享!
Lucene 原理与代码分析完整版
Lucene应用开发揭秘 华章培训网地址:http://www.hztraining.com/bbs/showtopic-1954.aspx ChinaPub地址:http://product.china-pub.com/3502099&ref=xiliegoumai 注意事项: 课程描述: 本课程不局限于如何使用Lucene,而是以Lucene为实例,通过对各模块的深入解析介绍搜索引擎各个模块的设计原理与实现,进而能够跳出Lucene看到搜索引擎系统的架构全貌以及设计思想。 课程目录: 1.1.搜索引擎系统的历史 1.2.搜索引擎系统的行业状态 1.3.搜索引擎系统的总体架构 1.4.初识Lucene 详细信息:ppt 12页, 视频65分钟,不附代码 2.1.什么是全文检索 2.2.索引里面存了些什么 2.3.如何创建索引 2.4.如何找到相关的文章 2.5.自己动手写一个简单的Lucene 详细信息:ppt 17页,视频46分钟,不附代码 3.1.回顾全文检索的重要过程 3.2.设计你的索引 3.3.如何创建索引 3.4.如何找到相关的文章 详细信息:ppt 17页,视频67分钟,附代码 4.第四讲 进入搜索引擎的世界-设计你的索引格式 4.1.词典的存储方式 顺序列表 指针列表 前端编码 哈希表及最小完美哈希 Trie树及双数组Trie树 M路搜索树 4.2.倒排表的存储方式 定长编码 差值编码 无参数及有参数变长编码 跳跃表 详细信息:ppt 39页,视频分上下两集,上集54分钟,下集28分钟,不附代码(不好意思上下集内容配置的不够平均) 5.1.基本概念 5.2.基本数据类型 5.3.一些基本规则 前缀编码规则 差值规则 或然跟随规则 跳跃表规则 5.4.重要的正向信息 5.5.重要的反向信息 5.6.其他信息 详细信息:ppt 29页,视频分上下两集,上集57分钟,下集42分钟,不附代码 6.1.索引创建的主要过程 6.2.基于内存的索引创建 6.3.基于硬盘的索引创建 6.4.动态索引的创建 6.5.索引的合并 详细信息:ppt 12页,视频22分钟,不附代码 7.1.索引过程的总体架构 7.2.Lucene的多线程索引 7.3.Lucene的多域索引 7.4.索引创建的关键步骤 7.5.Lucene的文档删除 7.6.Lucene的缓存管理 详细信息:ppt 40页,视频分上下两集,上集39分钟,下集45分钟,不附代码 8.1.Lucene段的合并综述 8.2.段的合并策略 8.3.反向信息的合并 8.4.段合并的关键步骤 详细信息:ppt 28页,视频29分钟,不附代码 9.1.搜索的主要过程 9.2.查询预处理 Stemming 拼写检查 同义词 查询扩展 9.3.信息检索模型 基于集合论:布尔模型 基于代数论:向量空间模型 基于概率论:语言模型 详细信息:ppt 23页,视频41分钟,不附代码 10.第十讲 进入搜索引擎的世界-Lucene的搜索过程 10.1.搜索过程的总体架构 10.2.Lucene的查询语法 10.3.Lucene的评分机制 10.4.Lucene搜索的关键步骤 详细信息:ppt 51页,视频分上下两集,上集45分钟,下集35分钟,不附代码 11.1.查询对象的层次结构 11.2.几种高级的查询对象 RangeQuery, SpanQuery, FilterQuery 详细信息:ppt 20页,视频36分钟,附代码 12.第十二讲 进入搜索引擎的世界-分词 12.1.常用的分词方法 基于词典的机械切分算法:最大匹配方法,最短路径方法 基于统计的切分算法:N元语法 12.2.Lucene中的分词器 12.3.定制自己的分词器 对中科院分词进行封装 详细信息:ppt 22页,视频60分钟,附代码 13.第十三讲 Lucene的高级特性之一 13.1.Payload的原理与应用 13.2.区间查询及使用Payload实现区间查询 13.3.按照域Field进行排序及使用Payload实现按字段排序 13.4.Lucene的事务性 详细信息:ppt 26页,视频30分钟,附代码 14.第十四讲 Lucene的高级特性之二 14.1.Lucene的性能瓶颈 14.2.影响Lucene的评分过程的四种方式 详细信息:ppt 20页,视频51分钟,附代码 15.第十五讲 基于Lucene的实时搜索的原理与实现 15.1.实时搜索的原理 15.2.实时搜索的实现及代码 详细信息:ppt 12页,视频33分钟,附代码 16.第十六讲 基于Lucene的实时搜索中文档更新问题 16.1.实时搜索中文档更新原理 16.2.实时搜索中文档更新实现及代码 详细信息:ppt 17页,视频38分钟,附代码 17.第十七讲 实时搜索系统框架Zoie 17.1.总体架构 17.2.配置一个Zoie 17.3.Zoie实现实时搜索的原理 17.4.Zoie的索引过程 17.5.Zoie的搜索过程 详细信息:ppt 26页,视频40分钟,不附代码 18.第十八讲 基于Zoie创建实时搜索系统 18.1.运行Zoie的一个Demo 18.2.总体架构 18.3.实现自己的各个组件 索引组件代码实现 搜索组件代码实现 实时搜索系统Demo 详细信息:ppt 6页,视频41分钟,附代码 19.第十九讲 分布式搜索框架Sensei 19.1.总体架构 19.2.详细架构 19.3.配置Sensei服务器端 19.4.配置Sensei客户端 19.5.Sensei的重要过程 客户端启动过程 服务器端启动过程 客户端搜索过程 服务器端搜索过程 详细信息:ppt 13页,视频44分钟,不附代码 20.第二十讲 基于sensei创建分布式搜索系统 20.1.总体架构 20.2.实现自己的各个组件 服务器端代码实现 客户端代码实现 分布式搜索系统Demo 详细信息:ppt 6页,视频57分钟,附代码
1.第一讲 搜索引擎全貌
2.第二讲 全文检索的基本原理
3.第三讲 自己动手实现一个简单的Lucene
5.第五讲 进入搜索引擎的世界-Lucene的索引格式
6.第六讲 进入搜索引擎的世界-索引的创建
7.第七讲 进入搜索引擎的世界-Lucene的索引的创建
8.第八讲 进入搜索引擎的世界-Lucene的索引合并
9.第九讲 进入搜索引擎的世界-搜索的过程
11.第十一讲 进入搜索引擎的世界-Lucene的几种重要查询
评论
是有100万的 分词
还是有100万的 索引文档
还是索引容量有 100万 = 1G?
在测自己的1G索引的,不知是算什么级...
原谅小菜
lucene3.4的好像没有什么db建的directory,而hibernate search就以 orm 索引为自豪, 到底是以FSDirectory来建好还是以 数据库建好? 性能那个好?
你推荐哪个
关于 FS IO 性能与 DB 的性能谁好,在网上一直热论,我看了好多篇,一半一半,而我的结论是:“并发用 DB, 管理用DB, 如:查一个字段多的用DB,而不是打开文件,其他用FS” 请指正!
有些网友说:“看需求” 但就没有写,什么就什么,那逻辑没有写出来
收费是应该的啊,这是博主的辛苦劳动啊
不过那视频的价格是模仿罗刚的吧?太贵了。二十集要花两百多啊
不是啊,这个是华章培训网定的价格,我没有定价权啊
不过那视频的价格是模仿罗刚的吧?太贵了。二十集要花两百多啊
也想起了我以前去面试一个教学工作时,也是相当的紧张!后来就悲剧了。
发表评论
-
Lucene应用开发揭秘上线了
2011-09-09 23:54 114Lucene应用开发揭秘 华章培训网地址:http:/ ... -
LinkedIn公司实现的实时搜索引擎Zoie
2010-11-29 21:19 8676一、总体架构 Zoie是linkedin公司基于Luce ... -
Lucene 原理与代码分析完整版
2010-06-13 01:30 35273Lucene 原理与代码分析系列文章已经基本告一段落, ... -
Lucene学习总结之十:Lucene的分词器Analyzer
2010-06-06 22:13 73721、抽象类Analyzer 其主要包含两个接口,用于生 ... -
Lucene学习总结之九:Lucene的查询对象
2010-05-19 02:39 2903Lucene学习总结之九:Lucene的查询对象(1) ... -
Lucene学习总结之九:Lucene的查询对象(3)
2010-05-19 02:37 30196、FilteredQuery FilteredQu ... -
Lucene学习总结之九:Lucene的查询对象(2)
2010-05-19 02:36 26585、SpanQuery 所谓SpanQ ... -
Lucene学习总结之九:Lucene的查询对象(1)
2010-05-19 02:34 6447Lucene除了支持查询语法以外,还可以自己构造查询对象 ... -
Lucene学习总结之八:Lucene的查询语法,JavaCC及QueryParser
2010-05-08 13:41 2430Lucene学习总结之八:Lucene的查询语法,Java ... -
Lucene学习总结之八:Lucene的查询语法,JavaCC及QueryParser(2)
2010-05-08 00:25 5644三、解析QueryParser.jj 3.1、声明Qu ... -
Lucene学习总结之八:Lucene的查询语法,JavaCC及QueryParser(1)
2010-05-08 00:20 8458一、Lucene的查询语法 Lucene所支持的查询语 ... -
Lucene学习总结之七:Lucene搜索过程解析
2010-04-05 14:52 2996本系列文章将详细描述几乎最新版本的Lucene的基本原理 ... -
Lucene学习总结之七:Lucene搜索过程解析
2010-04-04 22:54 2684本系列文章将详细描述几乎最新版本的Lucene的基本原理 ... -
Lucene学习总结之七:Lucene搜索过程解析(8)
2010-04-04 22:43 77602.4、搜索查询对象 2.4.4、收集文档结果集 ... -
Lucene学习总结之七:Lucene搜索过程解析(7)
2010-04-04 22:39 44802.4、搜索查询对象 2.4.3.2、并集Di ... -
Lucene学习总结之七:Lucene搜索过程解析(6)
2010-04-04 22:20 37102.4、搜索查询对象 2.4.3、进行倒排表合并 在 ... -
Lucene学习总结之七:Lucene搜索过程解析(5)
2010-04-04 21:26 44492.4、搜索查询对象 2.4.2、创建Score ... -
Lucene学习总结之七:Lucene搜索过程解析(4)
2010-04-04 20:46 45432.4、搜索查询对象 2.4.1.2、创建Weight ... -
Lucene学习总结之七:Lucene搜索过程解析(3)
2010-04-04 20:19 43792.3、QueryParser解析查询语句生成查询对象 代码 ... -
Lucene学习总结之七:Lucene搜索过程解析(2)
2010-04-04 20:10 4927二、Lucene搜索详细过程 为了解析Lucene对索引文件 ...
相关推荐
### Lucene应用开发揭秘第四讲知识点详解 #### 一、概览 《Lucene应用开发揭秘第四讲》是由觉先华老师主讲的一次技术分享,主要围绕如何设计高效的索引格式来进行讲解。本讲中重点介绍了词典的存储方式以及倒排表...
在信息技术领域,搜索引擎已经成为不可或缺的一部分,而Lucene作为开源全文搜索引擎库,以其高效、灵活的特点被广泛应用于各种JavaEE项目中。本项目将深入探讨如何利用Lucene进行JavaEE项目的开发,旨在帮助开发者...
Lucene3.4开发入门.pdf
**Lucene.net 开发完全...通过深入学习 Lucene.net 开发文档,开发者可以熟练地运用这个强大的搜索引擎库,为各种应用场景构建高性能的搜索功能。无论是简单的项目还是复杂的系统,Lucene.net 都能提供强大的技术支持。
《Lucene2.9开发指南》是一份专为初级开发者准备的资料,旨在详细介绍如何使用开源全文搜索工具包Lucene2.9.1。Lucene作为一个强大的文本搜索库,其核心功能包括建立索引和执行搜索。以下是关于Lucene2.9开发的一些...
《基于Lucene.Net开发的个人知识库》 在信息技术领域,高效的信息检索和管理是至关重要的。Lucene.Net,作为Apache Lucene项目的一个.NET版本,为开发者提供了强大的全文搜索引擎库,使得开发者能够轻松构建自己的...
【Lucene开发手册】 Lucene是一个开源的全文检索库,由Apache软件基金会开发,主要用Java编写。作为一套API,Lucene提供了构建高效、可扩展的搜索引擎所需的核心工具。它并非一个完整的搜索引擎产品,而是一个搜索...
Lucene学习笔记(一)可能涵盖了Lucene的安装与环境配置,以及如何创建第一个Lucene应用。这通常包括导入必要的库,设置索引目录,以及创建和添加文档到索引。 Lucene学习笔记(二)可能涉及索引构建过程,讲解了如何...
### Lucene开发详解 #### 一、Lucene简介 Lucene是一个高性能、全功能的文本搜索引擎库,由Doug Cutting创建并捐赠给Apache Software Foundation。它主要用于构建全文搜索应用程序,能够帮助开发者快速地在其应用...
"用 Lucene 加速 Web 搜索应用程序的开发" 这个标题指出,我们将探讨如何利用 Apache Lucene 这个全文搜索引擎库来提升 Web 应用程序的搜索性能。Lucene 是一个开源的Java库,专门用于文本搜索,它提供了高效的索引...
《Lucene搜索引擎开发权威经典》是由于天恩编著的一本深入探讨Lucene搜索引擎开发的专业书籍,这本书结合源码分析,旨在帮助读者掌握Lucene的核心技术和应用实践。Lucene是Apache软件基金会的一个开放源代码项目,它...
在 ASP.NET 开发环境中,Lucene.NET 是 Lucene 的 .NET 版本,它允许 .NET 开发人员利用 Lucene 的强大搜索功能,为他们的应用程序添加搜索引擎。 标题中的“lucene的应用程序扩展”指的是将 Lucene.NET 集成到 ASP...
Lucene 是一个高性能、全文本搜索库,广泛应用于开发全文检索系统。要理解Lucene的开发流程,我们首先需要了解其基本概念和步骤。以下是对Lucene开发流程的详细说明: 1. **数据获取**: 开发流程的第一步是从各种...
《Apache Lucene 6.6 开发详解》 Apache Lucene 是一个开源全文搜索引擎库,由Java编写,设计为高性能、可扩展的信息检索应用程序。它提供了丰富的搜索功能,包括索引、查询、排序等,被广泛应用于各种信息管理和...
最后,"桌面搜索引擎开发实例"可能涉及到将Lucene应用到桌面环境,比如文件系统的全文搜索。这需要掌握如何将文件内容导入Lucene索引,以及如何快速定位和检索文件。 总的来说,通过这个压缩包中的例子,开发者可以...
解密搜索引擎技术实战Lucene&Java精华版(第3版)源码 书名:解密搜索引擎技术实战Lucene&Java精华版(第3版) 作者:罗刚 等编著 出版社:电子工业出版社 关键词:Lucene solr 搜索引擎 Lucene实战 随书源码 本书随...
总的来说,Lucene 是一个强大的搜索库,无论是对于开发搜索引擎,还是为应用程序添加搜索功能,都是不可或缺的工具。通过学习 lucene-1.4.3 和 lucene-1.4.1,你可以深入了解 Lucene 的工作原理,掌握全文检索的核心...
Lucene是一个高性能、全文本搜索库,由Apache软件基金会开发,它提供了完整的搜索解决方案,包括索引构建、搜索功能以及分词处理。在Java Web项目中,Lucene能够帮助开发者实现高效、精确的站内搜索功能,提升用户...
《Lucene 4.7 开发简单实例详解》 Lucene 是一款强大的全文搜索引擎库,广泛应用于各种信息检索系统中。在本实例中,我们将深入探讨Lucene 4.7版本,涵盖索引的创建、修改、删除,以及查询时的排序、分页、优化和...
【使用Lucene进行简单的开发】 Lucene是一个高性能、全文本搜索库,由Apache软件基金会开发。它提供了完整的搜索功能,包括分析、索引和搜索文本。在这个教程中,我们将了解如何利用Lucene进行简单的开发。 ### 一...