`
javasogo
  • 浏览: 1837735 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

搜索引擎技术网站

 
阅读更多

Lucene:

IBM入门教程:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/

Lucene中国网站:http://www.lucene.com.cn/

lucene.net:http://lucene.apache.org/lucene.net/

Heritrix:

官网:http://crawler.archive.org/


Heritrix从互联网上抓取网页,Lucene建立索引数据库,在索引数据库中搜索排序

爬虫:

http://blog.csdn.net/wangkun9999/archive/2007/05/02/1594496.aspx

http://www.codeproject.com/cs/internet/Crawler.asp

HTML解析器:

http://www.codeproject.com/KB/cs/html2xhtmlcleaner.aspx

http://www.cnblogs.com/dragon/archive/2006/12/06/174946.html

http://www.codeproject.com/dotnet/xpath_visualizer.asp

Keywor: lucene heritrix 爬虫 全文搜索 搜索引擎网站 搜索引擎技术

分享到:
评论

相关推荐

    搜索引擎技术基础

    搜索引擎技术基础

    什么是搜索引擎?搜索引擎技术与原理详解

    搜索引擎技术与原理详解; 搜索引擎:什么是搜索引擎?搜索引擎技术与原理详解; 搜索引擎:什么是搜索引擎?搜索引擎技术与原理详解; 搜索引擎:什么是搜索引擎?搜索引擎技术与原理详解; 搜索引擎:什么是搜索...

    搜索引擎技术搜索引擎技术基础 课件 CSDN 下载频道基础 课件 CSDN 下载频道.zip

    《搜索引擎技术基础》课件是CSDN下载频道提供的一份关于搜索引擎技术的详细学习资料。这份资源包含了一个PPT文件,旨在帮助学习者深入理解搜索引擎的工作原理和技术应用。以下是对该课件内容的详细概述: 一、搜索...

    搜索引擎技术浅析 毕业设计

    搜索引擎技术是互联网时代的核心技术之一,它使得用户能够高效、快速地从海量信息中找到所需内容。本设计将深入探讨搜索引擎技术,包括其历史发展、体系结构以及关键组件的实现。 1. 搜索引擎技术的发展史 搜索引擎...

    搜索引擎技术基础 课件

    【搜索引擎技术基础】 搜索引擎技术是信息技术领域中的一个重要分支,它主要负责从互联网上抓取海量信息,对这些信息进行处理,然后为用户提供快速且相关的搜索结果。本课件将深入探讨搜索引擎技术的基础知识,包括...

    基于物联网技术的搜索引擎技术研究.pdf

    物联网技术的搜索引擎技术研究涉及到了搜索引擎技术、物联网、信息技术、软件模块设计等多个技术领域。以下从这些领域的角度,详细阐述了知识点。 一、搜索引擎技术在物联网中的应用前景 随着物联网技术的广泛应用...

    java搜索引擎技术

    Java搜索引擎技术是构建高效、可扩展的信息检索系统的关键工具,主要涵盖了如何索引大量数据、如何执行快速查询以及如何提供相关的搜索结果。其中,Lucene是一个核心的库,被广泛用于实现这一目标。 Lucene是一个由...

    解密搜索引擎技术实战Lucene&Java精华版(2)

    解密搜索引擎技术实战Lucene&Java精华版(第3版)源码 书名:解密搜索引擎技术实战Lucene&Java精华版(第3版) 作者:罗刚 等编著 出版社:电子工业出版社 关键词:Lucene solr 搜索引擎 Lucene实战 随书源码 本书随...

    解密搜索引擎技术实战 LUCENE & JAVA(第3版)PDF

    《解密搜索引擎技术实战 LUCENE & JAVA(第3版)》是一本深入探讨搜索引擎技术的专业书籍,由罗刚撰写。这本书主要聚焦于LUCENE和JAVA这两种技术在搜索引擎开发中的应用,为读者揭示了搜索引擎背后的复杂机制和实现...

    搜索引擎到底是怎么工作的?搜索引擎技术原理分析

    搜索引擎技术原理分析; 搜索引擎到底是怎么工作的?搜索引擎技术原理分析; 搜索引擎到底是怎么工作的?搜索引擎技术原理分析; 搜索引擎到底是怎么工作的?搜索引擎技术原理分析; 搜索引擎到底是怎么工作的?搜索...

    网页库级垂直搜索引擎技术

    垂直搜索引擎的选型;网页库级垂直搜索引擎技术(二)如何做好一个垂直搜索引擎;信息抽取的资料文档

    搜索引擎基本工作原理.pdf

    全文搜索引擎通过自动检索技术广泛收集信息,而目录索引则依赖人工审核和分类。目录索引通常对网站质量有较高要求,且需手动提交信息。两者之间的界限日益模糊,许多搜索引擎结合了两者的特点,既提供关键词搜索,也...

    搜索引擎技术资源下载

    【搜索引擎技术资源下载】 搜索引擎技术是互联网领域中的关键组成部分,它...通过深入学习和实践,我们可以更好地理解和应用搜索引擎技术,提升信息检索的效率,同时也能够为网站优化和互联网产品开发提供理论支持。

    全文搜索引擎技术介绍入门

    - **企业级搜索引擎**:大型企业网站通常拥有数以万计的页面,为了帮助用户更好地浏览这些页面,一些主要的搜索引擎公司会将自己的搜索引擎技术授权给这些企业使用,或者直接销售搜索引擎给企业客户。 通过上述分类...

    搜索引擎技术详细概述

    搜索引擎技术是互联网时代的核心...搜索引擎技术的不断发展,使得信息检索更加便捷,同时也对网站所有者提出了更高的优化要求。理解并掌握搜索引擎的工作原理和优化技巧,对于提升网站可见性和用户体验具有重要意义。

    搜索引擎技术介绍 核心技术引擎比较

    搜索引擎技术是信息技术领域中的核心组成部分,它通过抓取、处理和索引互联网上的海量信息,为用户提供快速准确的查询服务。本文将详细探讨搜索引擎的主要技术和关键组件。 首先,搜索引擎的定义包含了“搜”、“索...

    搜索引擎技术课件!!!

    **搜索引擎技术概述** 搜索引擎是互联网信息检索的核心工具,它通过自动化程序(网络爬虫)从海量网页中收集信息,经过处理、索引和排序,为用户提供高效、准确的查询服务。哈工大的这门课程深入讲解了搜索引擎的...

    搜索引擎技术介绍.ppt

    搜索引擎技术介绍.ppt

Global site tag (gtag.js) - Google Analytics