最新文章列表

配置compass的索引位置为相对路径

配置compass的索引位置为相对路径: Compass是对lucene进行封装的java项目,使得在spring,hibernate这种环境下非常容易的实现全文检索,也极大的提高了效率。所以在myblog里面我也使用了compass作为全文索引。 从Compass的samples里面的petclinic里面可以找到Compass的配置。 classpath:org/compass/sample/ ...
a52071453 评论(0) 有1380人浏览 2012-09-01 10:49

lucene3.6.1学习

1.最近研究了一下lucene全文检索,做了一个小demo,检索txt文件,项目使用maven,首先引入<dependency>    <groupId>org.apache.lucene</groupId>    <artifactId>lucene-analyzers</artifactId>    <version>3.6 ...
lijunlong 评论(0) 有2804人浏览 2012-08-29 17:33

Oracle B-tree、位图、全文索引三大索引性能比较及优缺点汇总

原文:http://www.itpub.net/thread-1700144-1-1.html 引言: 大家都知道“效率”是数据库中非常重要的一个指标,如何提高效率大家可能都会想起索引,但索引又这么多种,什么场合应该使用什么索引呢?哪种索引可以提高我们的效率,哪种索引可以让我们的效率大大降低(有时还不如全表扫描性能好)下面要讲的“索引”如何成为我们的利器而不是灾难!多说一点,由于不同索引的存储结构 ...
zpball 评论(0) 有1406人浏览 2012-08-23 13:19

lucene 简介

需要一个搜索引擎: 1需要在大量文本中搜索信息 2在数据库中使用“like”搜索文本让我抓狂 3能像Baidu一样搜索就好了 lucene是: apache软件基金会一个子项目,是一个开放源代码全文检索引擎工具包,Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。 lucene不是: 文件搜索程序,Web爬 ...
wangmored 评论(0) 有983人浏览 2012-08-14 09:41

Oracle B-tree、位图、全文索引三大索引性能比较及优缺点汇总

引言:大家都知道“效率”是数据库中非常重要的一个指标,如何提高效率大家可能都会想起索引,但索引又这么多种,什么场合应该使用什么索引呢?哪种索引可以提高我们的效率,哪种索引可以让我们的效率大大降低(有时还不如全表扫描性能好)下面要讲的“索引”如何成为我们的利器而不是灾难!多说一点,由于不同索引的存储结构不同,所以应用在不同组织结构的数据上,本篇文章重点就是:理解不同的技术都适合在什么地方应用! B- ...
yjingzeming 评论(0) 有1652人浏览 2012-08-06 17:24

mg4j的理解

mg4j是个类似于lucene的全文检索包,发现网上的资料很少,稍微总结下心得。 1、DocumentSequence:A sequence of documents 主要包含方法 DocumentFactory    factory() Do ...
jianzong2000 评论(0) 有1269人浏览 2012-07-28 21:03

对某点评网 搜索策略 的一些理解

1. 查询串为 纯汉字,查询出被拆分为单个字,然后使用全文检索,尽可能找出包含所有查询串的 POI,查找范围为POI拥有的所有文本信息。 例如搜索 “顺轩”,返回结果为: http://www.dianping.com/search/keyword/1/0_%E9%A1%BA%E8%BD%A9, 而搜索“轩顺”,返回结果为: http://www.dianping.com/sear ...
seabay 评论(0) 有1059人浏览 2012-07-11 17:13

elasticsearch的基本用法

开始学习使用 elasticsearch, 把步骤记录在这里: 最大的特点: 1. 数据库的 database, 就是  index 2. 数据库的 table,  就是 tag 3. 不要使用browser, 使用curl来进行客户端操作.  否则会出现 java heap ooxx... curl:  -X 后面跟 RESTful :  GET, POST ... -d 后面跟数据。 (d ...
sg552 评论(2) 有63264人浏览 2012-06-25 09:41

lucene 小知识

     以前对全文检索望而却步,认为很难玩,最近玩了下Lucene ,发现挺容易上手的。废话不多说,记下小体会。      luncen索引用的是倒排索引技术 ...
单眼皮大娘 评论(0) 有1678人浏览 2012-06-01 14:26

Xunsearch一个新的PHP可用的全文检索工具

Xunsearch一个新的PHP可用的全文检索工具, 帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。 高性能:后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非 ...
jackyrong 评论(0) 有2558人浏览 2012-03-09 09:13

Sphinx基于SQL的全文检索引擎简介

Sphinx中文入门指南 wuhuiming<blvming在gmail.com>,转载请注明来源和作者 最后修改:2010年1月23日 1、简介 1.1.Sphinx是什么 1.2.Sphinx ...
ygsilence 评论(0) 有5840人浏览 2012-02-17 10:28

www.8brl.cn网站上线了,请大家多多指教

http://www.8brl.cn经过一段时间的研发终于上线了, 采用了Java的SSH架构, 请大家多给意见。。全文检索采用的是IKAnalyzer 数据库: MySQL 自己二次开发的WEBIM, 在产品详细页用户后台-我的收藏采用的Apache mahout框架开发的推荐系统商品详细页、大类页面采用计划生成静态页面 + ajax 前台页面在 IE6/7/8 FF下正常浏览, 其中商品详细和大 ...
fengfan2008 评论(2) 有1494人浏览 2012-02-02 13:12

Lucene01---几个概念理解

  在http://xdwangiflytek.iteye.com/blog/1386439里我简单的介绍了一下SEO,下面来学习一下Lucene技术,这部分先来理解几个概念。 信息检索概念:        信 ...
xdwangiflytek 评论(0) 有1823人浏览 2012-02-01 22:50

深入Lucene的索引文件

  Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文检索的基本过程,将倒排表写成此文件格式的过程。 Lucene的搜索过程,就是按照此文件格式将索引进去的信息读出来,然后计算每篇文档打分(score)的过程。   本文详细 ...
eimhee 评论(0) 有6883人浏览 2012-02-01 16:50

lucene增量索引的简单实现

用lucene来建立搜索程序,在检索的时候效率大大的提高了,但是却以建立索引为代价,建立索引本身就是个耗内存大、时间长的过程(数据量比较大,数据少何必用lucene来建立全文检索,个人拙见),从而索引的建立就是个瓶颈,如果我们建立好索引,然后每次更新数据后重新建立索引,无疑是不合理的,为什么不能在原先索引文件的基础上再把新更新的加在上面呢?增量索引就是在建完索引的后,将数据库的最后一条记录的ID存储 ...
dongisland 评论(1) 有1207人浏览 2012-01-30 11:06

基于源码搭建solr搜索服务器

基于源码搭建的好处的就是,我们在开发过程中可以方便地进行调试跟踪,这样也能够便于更深入地了解Solr框架的执行机制。Solr是基于Lucene这个开源搜索引擎库开发的框架,通过了解Solr的源代码,你可以更深入地熟悉如何在Lucene之上构建适合自己的搜索应用,甚至你完全可以将Solr改造成自己需要的应用程序。一般来说,我们使用Solr搭建搜索服务器的时候,完全可以不需要熟悉Lucene是怎么样实现 ...
wanglihu 评论(0) 有2983人浏览 2011-12-28 18:56

倒排索引的实现

倒排索引技术主要应用与全文检索,通过对非主关键字的分析,建立内容与PK之间的关键。通过索引文件 存储后提供给应用高效的检索。 如果需要自己定制倒排索引器,算法应该实现如下的步骤: 1.信息分析,对输入的数据项或者记录(P,K)中的K做一个过滤的词法和语法分析。 主要对数据中非主关键字内容K进行分词,过滤,分析等获得一个内容关键字(k1,k2,k3....)集合 2.建立倒排关系,倒排所有和一般索引 ...
黎明lm 评论(0) 有1429人浏览 2011-12-22 14:44

Lucene学习入门1

一、概述 搜索的方式:     1、只处理文本(不处理多媒体,多媒体是另外一个领域)     2、不处理语义,而是按词查询     3、对于英文,不区分大小写 Lucene(全文检索):     指以文本作为检索对象,找出含有指定词汇的文本     全面、准确和快速是衡量全文检索系统的关键指标 全文检索与数据库搜索     1、全文检索的搜索效果更加准确     2、相关排序,数 ...
yingruochen 评论(0) 有1680人浏览 2011-12-21 18:55

Lucene入门示例

主要参考了Lucene的官方示例 环境:Win7 + JDK1.6 + Eclipse37 Lucene版本:3.5 官方:http://www.apache.org/dyn/closer.cgi 检索的基本概念 一 信息检索:从信息集合中打找 ...
liuzidong 评论(7) 有7164人浏览 2011-12-19 16:37

织梦DedeCMS v5.7全文检索使用说明(sphinx)

官方网站:http://www.sphinxsearch.com/官方文档:http://www.sphinxsearch.com/docs/中文支持:http://www.coreseek.cn/中文使用手册下载:http://www.coreseek.cn/uploads/pdf/sphinx_doc_zhcn_0.9.pdf中文在线手册:http://www.coreseek.cn/d ...
binyan17 评论(0) 有2419人浏览 2011-12-19 00:20

最近博客热门TAG

应用服务器(43288) Spring(40812) Hibernate(33330) Tomcat(28344) 框架(27200) 设计模式(24056) Servlet(23313) Struts(22805) Bean(22194) 企业应用(18268) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics