`
banditjava
  • 浏览: 159857 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

搜索引擎名人堂之Doug Cutting

阅读更多
Doug Cutting是一个开源搜索技术的提倡者和创造者。他和Mike Cafarella发起Lucene和Nutch开源搜索项目,这些项目现在被Apache软件基金会管理。早期开发Luncene,Doug研究搜索技术还在Excite,apple公司和Xerox PARC。Lucene是一个搜索索引索器,Nutch有一个蜘蛛或爬虫,是一个普通开源搜索平台的两个关键组件,首先爬取网络内容,然后将其构建到一个可查询的索引里。Cutting的这两个项目的领导能力延伸到普通开源软件项目的概念和处理能力,就像Linux和MYSQL在搜索垂直领域的重要性。很难跟踪这些平台的从业者的数量,公共报道称,运用lucene和它的直接子项目solr多个风险投资启动,预示着它已经到了一个应用重要级别。也许最重要的lucene开发在是wikipedia,它一个完全站点的强大搜索。

在2004年11月,Google实验室发布了一个MapReduce算法的报告,它通过大量集群服务器进行的大型平行计算。Cutting意识到这份报告的重要性,要扩展lucene到极端巨大的搜索领域,创建了开源项目Hadoop框架,它是让基于MapReduce的范例运行在大集群普通硬件上。他当前是Yahoo的一个正式雇员,全职领导 Hadoop项目。
  • 描述: 正面
  • 大小: 5.8 KB
  • 描述: 侧面
  • 大小: 16.1 KB
分享到:
评论

相关推荐

    Hadoop之父Doug Cutting.pdf

    【标题】: "Hadoop之父Doug Cutting" 【描述】: "Doug Cutting是Hadoop的创始人,他的工作对大数据处理产生了深远影响。本文源于博客园,探讨了Cutting的成长历程和他在Hadoop项目中的贡献。" 【标签】: "计算机" ...

    Doug Cutting:Apache Hadoop和大数据平台

    Doug Cutting是Hadoop的创始人之一,他将Hadoop定义为大数据分布式操作系统的“内核”,这是一个已经成为事实标准的技术。本文主要围绕Hadoop生态系统展开,探讨其重要性、组成、优势、以及未来的发展方向。 首先,...

    开源的搜索引擎工具包和web搜索引擎系统 - austin lius fashion - 博客园.docx

    Lucene是由Apache基金会维护的全文搜索引擎工具包,由Doug Cutting创建。它不是一个完整的搜索应用,而是专注于文本索引和搜索的库,允许开发者在自己的应用程序中集成搜索功能。由于其开源性质和跨平台的Java实现,...

    分布式搜索引擎 ppt 说明资料

    Elasticsearch的前身是Lucene,一个Java语言的搜索引擎类库,由Doug Cutting于1999年研发。Shay Banon于2004年基于Lucene开发了Compass,2010年重写了Compass,取名为Elasticsearch。 3. Elasticsearch的优点 • ...

    Hadoop入门

    Hadoop的源起——Lucene ,Doug Cutting开创的开源软件,用java书写代码,实现与Google类似的全文搜索功能,提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎 。

    搜索引擎技术分析

    **Lucene** 是由Doug Cutting开发的一款Java全文搜索引擎库,最初发布在其个人网站lucene.com上,随后迁移到SourceForge,并最终成为Apache基金会Jakarta项目的一部分。Lucene因其高效、灵活和易于集成的特点,在...

    开源的搜索引擎工具包和web搜索引擎系统 - austin lius fashion - 博客园.pdf

    1. Lucene:由Doug Cutting创建的Lucene是Apache软件基金会的一个项目,是一个高度优化的全文搜索引擎工具包。Lucene专注于文本索引和搜索,不包含完整的搜索应用程序特性,而是提供了一个可扩展的基础架构。由于其...

    Nutch公开课从搜索引擎到网络爬虫

    Doug Cutting是Lucene和Hadoop的创始者之一,这使得Nutch与大数据处理和搜索引擎技术有着深厚的历史渊源。Nutch最初的目标是成为一款搜索引擎,但随着时间的推移,它已经发展成为一个功能强大的网络爬虫工具。 ...

    lucene搜索引擎简介

    Lucene的创建者Doug Cutting是一位经验丰富的全文索引/检索专家,他曾在V-Twin搜索引擎和Excite公司担任重要职务,目前专注于互联网底层架构的研究。 Lucene最初由Doug Cutting在SourceForge上发布,随后在2001年9...

    nutch+lucene开发自己的搜索引擎ch3.pdf

    - **背景**: Lucene是由Doug Cutting创建的全文检索系统,最初发布在其个人主页上,后迁移到SourceForge,并于2001年成为Apache基金会Jakarta项目的一部分。 - **特点**: - 开放源码,便于定制和扩展。 - 纯Java...

    基于Hadoop的分布式搜索引擎的研究.pdf

    2. **Hadoop介绍**:Hadoop是基于Doug Cutting和Yahoo的研究成果发展起来的,它提供了一个分布式文件系统(Hadoop Distributed File System, HDFS)和MapReduce编程模型,使得开发者无需深入理解分布式系统的复杂...

    基于LUCENE的网络搜索引擎系统研究及实现.pdf

    Lucene是一个高性能、全功能的文本搜索库,由Doug Cutting创建,现为Apache软件基金会的一个顶级项目。它提供了构建全文检索应用程序所需的所有基本功能,包括索引文档、存储索引、搜索索引以及执行高级查询等。...

    MapReduce在分布式搜索引擎中的应用.pdf

    Hadoop是由Doug Cutting开发的开源项目,它实现并普及了MapReduce编程模型,并且提供了HDFS(Hadoop分布式文件系统),这使得更多的公司能够利用MapReduce来处理大型分布式数据集。Hadoop的MapReduce机制与HDFS结合...

    Nutch技术的主题搜索引擎实现_李东海

    Nutch最初是由Doug Cutting创建,作为Hadoop项目的一部分,其目标是提供一个可扩展、分布式、开源的搜索引擎。Nutch不仅支持网页抓取,还包含了网页分析、索引和搜索功能,可以处理大规模的数据集。 2. **抓取机制...

    基于dotnet实现的lucene算法的简单搜索引擎

    Lucene是一个流行的开源搜索库,最初由Doug Cutting开发,现在是Apache软件基金会的一部分。它提供了强大的文本分析、索引和搜索功能。本项目是基于.NET框架(通常称为DotNet)实现的Lucene算法简单搜索引擎,为...

    搜索引擎 Lucene PPT 教程

    Lucene最初由Doug Cutting创建,它不是一个完整的搜索引擎,而是一个库,需要开发者自行构建索引和查询处理逻辑。Lucene提供了文本分析、索引创建、搜索查询解析和执行等功能,为构建高性能搜索引擎提供了基础工具。...

    搜索引擎解密Lucene与Solr的前世今生.ppt

    首先,Lucene是一个强大的全文索引库,由Doug Cutting于1999年开发,最初是一个Java程序。2001年,Lucene被捐赠给Apache软件基金会,并在此后不断演进,经历了多个版本迭代,包括2004年的1.4.3版本、2008年的2.4.0...

Global site tag (gtag.js) - Google Analytics