生活中,可能所有人都间接用过他的作品,他是Lucene、Nutch 、Hadoop等项目的发起人。是他,把高深莫测的搜索技术形成产品,贡献给普罗大众;还是他,打造了目前在云计算和大数据领域里如日中天的Hadoop。他是某种意义上的盗火者,他就是Doug Cutting。
从实习生做起
1985年,Cutting毕业于美国斯坦福大学。他并不是一开始就决心投身IT行业的,在大学时代的头两年,Cutting学习了诸如物理、地理等常规课程。因为学费的压力,Cutting开始意识到,自己必须学习一些更加实用、有趣的技能。这样,一方面可以帮助自己还清贷款,另一方面,也是为自己未来的生活做打算。因为斯坦福大学座落在IT行业的“圣地”硅谷,所以学习软件对年轻人来说是再自然不过的事情了。
Cutting的第一份工作是在Xerox做实习生,Xerox当时的激光扫描仪上运行着三个不同的操作系统,其中的一个操作系统还没有屏幕保护程序。因此,Cutting就开始为这套系统开发屏幕保护程序。由于这套程序是基于系统底层开发的,所以 其他同事可以给这个程序添加不同的主题。这份工作给了Cutting一定的满足感,也是他最早的“平台”级的作品。
可以说,Xerox对 Cutting后来研究搜索技术起到了决定性的影响,除了短暂的在苏格兰工作的经历外,Cutting事业的起步阶段大部分都是在Xerox度过的,这段 时间让他在搜索技术的知识上有了很大提高。他花了四年的时间搞研发,这四年中,他阅读了大量的论文,同时,自己也发表了很多论文,用Cutting自己的 话说——“我的研究生是在Xerox读的。”
尽管Xerox让Cutting积累了不少技术知识,但他却认为,自己当时搞的这些研究只是纸 上谈兵,没有人试验过这些理论的可实践性。于是,他决定勇敢地迈出这一步,让搜索技术可以为更多人所用。1997年底,Cutting开始以每周两天的时间投入,在家里试着用Java把这个想法变成现实,不久之后,Lucene诞生了。作为第一个提供全文文本搜索的开源函数库,Lucene的伟大自不必多言。
http://www.programmer.com.cn/15929/
相关推荐
【标题】: "Hadoop之父Doug Cutting" 【描述】: "Doug Cutting是Hadoop的创始人,他的工作对大数据处理产生了深远影响。本文源于博客园,探讨了Cutting的成长历程和他在Hadoop项目中的贡献。" 【标签】: "计算机" ...
Doug Cutting是Hadoop的创始人之一,他将Hadoop定义为大数据分布式操作系统的“内核”,这是一个已经成为事实标准的技术。本文主要围绕Hadoop生态系统展开,探讨其重要性、组成、优势、以及未来的发展方向。 首先,...
Hadoop的源起——Lucene ,Doug Cutting开创的开源软件,用java书写代码,实现与Google类似的全文搜索功能,提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎 。
最初由 Yahoo 的工程师 Doug Cutting 和 Mike Cafarella Hadoop 是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由 Yahoo 的工程师 Doug Cutting 和 Mike Cafarella 在 2005 年合作开发。后来,...
Hadoop是一个开源的分布式存储和计算框架,最初由Doug Cutting和他的团队基于Google的三篇关于大数据处理的核心论文(GFS、MapReduce、Bigtable)开发而成。它允许用户在分布式系统中存储大量数据并运行大规模的并行...
Hadoop是由Doug Cutting和Mike Cafarella共同创建,最初是为了支持Google的MapReduce计算模型和Google File System (GFS)。随着时间的发展,Hadoop已成为大数据处理的核心工具,广泛应用于数据存储、分析和挖掘。 ...
Hadoop是前雅虎开发者Doug Cutting开发的分布式计算平台,名字源于玩具象,至今已被数千家公司用于分析大容量数据。Hadoop 1.0.0主要是修正了bug,改进了性能和兼容性。它的上一个版本是0.20.205.0,新版的版本号原...
Hadoop是由Doug Cutting和Mike Cafarella于2005年基于Nutch搜索引擎项目发展起来的,其核心设计灵感来源于Google的GFS(Google File System)和MapReduce。Hadoop是一个分布式文件系统(HDFS)和并行计算框架...
1. **Hadoop的起源与理念**:Hadoop最初由Doug Cutting开发,灵感来源于Google的MapReduce和GFS(Google File System)论文。它的主要目标是实现大规模数据的分布式存储和计算,确保数据的高可用性和容错性。 2. **...
**Hadoop** 是一个能够对大量数据进行分布式处理的软件框架,它最初由Nutch和Lucene之父Doug Cutting于2006年创建。有趣的是,“Hadoop”这个名字来源于Doug Cutting的儿子对他玩具大象的一种叫法,类似于“Google”...
Hadoop是由Doug Cutting开发的一个开源框架,起源于Nutch和Lucene项目。这个名字来源于Cutting的儿子对小象玩具的称呼,类似Google的由来。自2006年诞生以来,经过五年的不断开发和完善,Hadoop在云计算领域占据了...
Hadoop是由Doug Cutting和Mike Cafarella在2005年基于Google的MapReduce和GFS(Google文件系统)论文开发的。它的核心组件包括Hadoop Distributed File System (HDFS) 和 MapReduce,这两个组件共同构建了一个能够...
Hadoop 的发展历史:Hadoop 的创始人 Doug Cutting,为了实现与 Google 类似的全文搜索功能,他在 Lucene 框架基础上进行优化升级,查询引擎和索引引擎。2001 年年底 Lucene 成为 Apache 基金会的一个子项目。对于...
Hadoop是由Doug Cutting和Mike Cafarella于2005年基于Nutch搜索引擎项目发展起来的。它主要由两个关键组件构成:Hadoop Distributed File System (HDFS) 和 MapReduce。HDFS为海量数据提供了分布式存储,而MapReduce...
Hadoop是由Doug Cutting和Mike Cafarella共同创建,旨在处理和存储海量数据,尤其适合大规模数据分析。这本书是理解Hadoop及其生态系统的关键资源。 1. **Hadoop概述**:Hadoop的核心由两个主要组件构成——HDFS...
Hadoop是由Doug Cutting和Mike Cafarella共同创建,旨在处理和存储海量数据,尤其适合大规模数据分析任务。这本书的中文版使得更多中国读者能够无障碍地学习Hadoop技术,提升大数据处理能力。 Hadoop的核心由两个...
Hadoop的发展历史可以追溯到2001年,Doug Cutting等人开发了Lucene,并将其作为Apache基金会的一个子项目。后来,Doug Cutting等人又开发了Nutch,学习和模仿Google解决大规模数据处理问题的办法。2005年,Hadoop...
Hadoop是由Doug Cutting和Mike Cafarella共同创建,最初是为了支持Google的MapReduce和GFS(Google文件系统)的开源实现。本书以中文版的形式,为国内的读者提供了学习Hadoop的便利。 1. **Hadoop简介** Hadoop是...