`
m635674608
  • 浏览: 5028775 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

Hibernate search

 
阅读更多

搜索引擎

全文搜索引擎

全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。

  根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的网页抓取、索引、检索系统(Indexer),有独立的“蜘蛛”(Spider)程序、或爬虫(Crawler)、或“机器人”(Robot)程序(这三种称法意义相同),能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
目录索引

  目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类目录搜索。

元搜索引擎

元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
全文搜索引擎的基本原理

具体再详细的概念参照baidu吧 搜索引擎

lucenne

java领域的全文搜索的工具包lucene不仅可以对文本数据进行搜索,还可以对html,excel和pdf等格式的文件建立索引并且进行搜索。

Hibernate search底层使用的就是 lucene。

http://lucene.apache.org

--------------------------------------------------------------------------------------------------------------------------------

上述都属于概念

Hibernate Search特点

支持索引数据的自动更新

支持众多的搜索方式,使用关键词进行搜索,也可以使用通配符进行搜索,还可以使用近似或者同义词进行搜索

支持搜索集群

支持对Lucene API直接的调用

Hibernate Search的类库
hibernate-search.jar
lucene-core.jar
hibernate-commons-annotations.jar

需要修改Hibernate.cfg.xml配置使用Hibernate Search

Xml代码  收藏代码
  1. <property name="hibernate.search.default.directory_provider">  
  2.             org.hibernate.search.store.FSDirectoryProvider      
  3.         </property>  
  4.         <property name="hibernate.search.default.indexBase">  
  5.             D:/temp/index      
  6.          </property>  
  7.         <mapping resource="com/rbh/examples/Guestbook.hbm.xml" />  
  8.         <event type="post-update">  
  9.             <listener class="org.hibernate.search.event.FullTextIndexEventListener" />  
  10.         </event>  
  11.         <event type="post-insert">  
  12.             <listener class="org.hibernate.search.event.FullTextIndexEventListener" />  
  13.         </event>  
  14.         <event type="post-delete">  
  15.             <listener class="org.hibernate.search.event.FullTextIndexEventListener" />  
  16.         </event>  
  17.         <event type="post-collection-recreate">  
  18.             <listener class="org.hibernate.search.event.FullTextIndexEventListener" />  
  19.         </event>  
  20.         <event type="post-collection-remove">  
  21.             <listener class="org.hibernate.search.event.FullTextIndexEventListener" />  
  22.         </event>  
  23.         <event type="post-collection-update">  
  24.             <listener class="org.hibernate.search.event.FullTextIndexEventListener" />  
  25.         </event>  

 修改持久化类,使用注解配置全文索引

Java代码  收藏代码
  1. @Indexed  
  2. public class Guestbook implements java.io.Serializable {  
  3. .............  
  4.     @DocumentId  //表示这个对象的主键  
  5.     public Integer getId() {  
  6.         return this.id;  
  7.     }  
  8.   
  9.     @Field(store = Store.YES)  
  10.     public String getName() {  
  11.         return this.name;  
  12.     }  
  13. ...............  
  14. }  

对持久化对象建立索引

Java代码  收藏代码
  1. Session session = HibernateSessionFactoryUtil.getSessionFactory().getCurrentSession();  
  2. session.getTransaction().begin();  
  3. FullTextSession ftSession = org.hibernate.search.Search.getFullTextSession(session);  
  4. List<Guestbook> guestbooks = session.createQuery("from Guestbook").list();  
  5. for (Guestbook gb : guestbooks) {  
  6.    ftSession.index(gb);  
  7. }  
  8. ftSession.getTransaction().commit();  

 搜索全文索引后的持久化对象

Java代码  收藏代码
  1. QueryParser parser = new QueryParser("title"new StandardAnalyzer());  
  2. org.apache.lucene.search.Query luceneQuery = null;  
  3. try {  
  4.     luceneQuery = parser.parse("title:test"); // build Lucene query  
  5. catch (ParseException e) {  
  6.     e.printStackTrace();  
  7. }  
  8.   
  9. Session session = HibernateSessionFactoryUtil.getSessionFactory().getCurrentSession();  
  10. session.getTransaction().begin();  
  11. FullTextSession ftSession = org.hibernate.search.Search.getFullTextSession(session);  
  12. org.hibernate.Query query = ftSession.createFullTextQuery(luceneQuery, Guestbook.class);  
  13. query.setMaxResults(20);  
  14. query.setFirstResult(0);  
  15. List<Guestbook> guestbooks = query.list();  
  16. for (Guestbook gb : guestbooks) {  
  17.     printGuestbook(gb);  
  18. }  
  19.   
  20. ftSession.getTransaction().commit();  

 

使用luke工具,查看索引数据

Luke是一款显示Lucene索引数据、修改Lucene索引数据和进行模拟搜索的开源工具

注意:现在版本为luke-src-0.9.9,下载后也为lukeall0.9.9.jar cmd下无法运行lukeall0.9.9.jar 改名为lukeall.jar,运行java -jar lukeall.jar 即可

中文分词

把中文的句子切分成有意义的词,这就是中文分词

 

中文分词的基本机制

一种使用词库匹配
另一种使用自动切分算法

 

词库切分与自动切分的比较

Hibernate Search 使用第三方的中文分词组件

"庖丁解牛"分词组件-------下载地址http://code.google.com/p/paoding/

配置"庖丁解牛"分词组件

新建paoding-dic-home.properties,文件添加

Xml代码  收藏代码
  1. paoding.dic.home=D:/hibernate_test/paoding-analysis-2.0.4-beta/dic  

修改持久化类中注解

Java代码  收藏代码
  1. ......  
  2. @Indexed  
  3. @Analyzer(impl = net.paoding.analysis.analyzer.PaodingAnalyzer.class)  
  4. public class Guestbook implements java.io.Serializable {  
  5. .......  
  6. }  

http://fehly.iteye.com/blog/650523

分享到:
评论

相关推荐

    hibernate search全文索引的创建及查询

    Hibernate Search是Hibernate ORM框架的一个扩展,它允许开发者在Java应用中实现全文搜索功能。这个工具结合了ORM的强大和Lucene搜索引擎的高效,使得数据库中的数据可以被快速、精准地检索。本文将深入探讨如何创建...

    Hibernate Search In Action

    Hibernate Search是一个强大的库,它为Hibernate框架提供了全文搜索的功能。全文搜索是一种强大的信息检索方式,可以让用户通过关键词快速定位到存储在大量数据中的相关内容。Hibernate Search库将全文搜索与...

    hibernateSearch+demo

    这个“hibernateSearch+demo”项目提供了一个实战示例,帮助开发者理解并应用 Hibernate Search 的核心概念和功能。 在 Hibernate Search 中,主要涉及以下关键知识点: 1. **全文索引**:Hibernate Search 使用 ...

    hibernate Search in action

    《Hibernate Search in Action》这本书深入探讨了Hibernate Search这一强大的全文搜索引擎集成框架,它将全文搜索功能无缝地融入到Java持久层框架Hibernate之中。通过利用Lucene库的强大功能,Hibernate Search为...

    Hibernate Search配置及简单应用

    **Hibernate Search配置及简单应用** Hibernate Search是Hibernate框架的一个扩展,它允许我们在应用程序中实现全文检索功能,使得数据库中的数据可以被快速、高效地搜索。这个功能尤其在处理大量文本数据时非常...

    基于Spring的Hibernate Search全文检索功能示例

    3. **Hibernate Search**:作为Hibernate的一个扩展,Hibernate Search提供了基于Lucene的全文检索功能,使得在数据库中的数据可以被快速、精确地搜索。 **二、集成Hibernate Search** 1. **配置依赖**:首先,你...

    Hibernate Search in action (pdf && code)

    《Hibernate Search in Action》是一本深入探讨Hibernate Search技术的专业书籍,配合源代码一同学习,能够帮助读者更好地理解和应用这项强大的全文检索和分析框架。Hibernate Search是Hibernate ORM的一个扩展,它...

    使用hibernate search实现全文检索和文档管理的例子

    使用hibernate search实现全文检索和文档管理功能: 1 全文检索 2 手动生成索引 3 文档上传(自动建立索引) 4 文档更新(自动建立索引) 5 文档删除 使用说明: 1 需要先恢复数据库 searchDB_2008sqlserver.bak 2 ...

    基于hibernate search的全文搜索引擎实现完整代码和配置文件,支持中英文

    本资源提供了基于Hibernate Search实现的全文搜索引擎的完整代码和配置文件,适用于处理中英文数据,具备拼音搜索、错误纠正和搜索建议等高级功能。 Hibernate Search是Hibernate ORM的一个扩展,它允许开发者在...

    hibernate-search, Hibernate Search.zip

    hibernate-search, Hibernate Search Hibernate 搜索版本:5.8.0. Final - 13-09-2017描述针对Java对象的全文搜索这个项目提供 Hibernate ORM和全文索引服务( 如 Apache Lucene和 Elasticsearch

    Hibernate Search 4.4.0.Final API

    Hibernate Search 4.4.0.Final API 帮助文档

    Hibernate搜索框架HibernateSearch.zip

    Hibernate Search的作用是对数据库中的数据进行检索的。它是hibernate对著名的全文检索系统Lucene的一个集成方案,作用在于对数据表中某些内容庞大的字段(如声明为text的字段)建立全文索引,这样通过hibernate ...

    HibernateSearch--maven集成了SSH

    压缩包包括项目完整代码,详细说明和项目结构图,效果图 项目实现了分页和高亮显示 MAVEN项目:HibernateSearchDemo IDE :MyEclipse jdk :1.6 数据库 :MySql ...hibernate search 版本 4.4.1.Final

    Hibernate Search in Action

    《Hibernate Search in Action》这本书是关于Java开发中利用Hibernate Search框架进行全文检索的权威指南。Hibernate Search是一个在Hibernate ORM之上构建的搜索引擎,它允许开发者在Java应用中实现强大的、数据库...

    hibernate search-3.4.0.Final-dist

    《Hibernate Search 3.4.0.Final:深入探索企业级数据检索的利器》 Hibernate Search,作为Hibernate ORM框架的一个强大扩展,为Java开发者提供了一种在持久化数据上进行全文搜索的能力。这个3.4.0.Final版本是...

    Getting Started with Hibernate search

    标题与描述:“Getting Started with Hibernate Search” 在深入探讨前,我们先来理解“Hibernate Search”这一概念。Hibernate Search是Hibernate框架的一个扩展,它为持久化的领域模型提供了全文搜索查询的能力,...

Global site tag (gtag.js) - Google Analytics