1、Doug Cutting [daug 'kʌtiŋ]
简介:
Doug Cutting是Nutch, Lucene, Hadoop开源项目的作者,搜索引擎方面的专家。
Lucene是一个提供全文文本搜索的函数库,它不是一个应用软件。它提供很多API函数让你可以运用到各种实际应用程序中。
Nutch是一个建立在Lucene核心之上的Web搜索的实现,它是一个真正的应用程序。
Hadoop是Google的分布式编程模式MapReduce的实现。MapReduce让程序自动分布到一个由普通机器组成的超大集群上并发执行。
观点:
1) 搜索引擎的反垃圾信息机制,被反向工程破解,只是时间问题。 好的机制是,破解了之后也能继续工作那一种。
2)类似GFS的文件系统,是巨型搜索引擎不可缺少的基石:你不能让一个小组件的错误导致一个大的瘫痪。你应该很容易的让系统扩展,只需往硬件池里加更多硬件而不需繁缛的重新配置。还有,你不需要一大坨的操作人员完成,所有的一切将大都自己搞定。
3)创新只有在刚发展的时候比较容易,越到后来越成熟,越不容易创新。
4)速度是搜索引擎好坏的重要因素。分布式搜索是一件很有趣的事,但我不能肯定它能否实现并保持速度足够的快。
分享到:
相关推荐
《开源软件文集:开源革命之声》是一本集结了多位开源运动领袖和软件界大牛们观点的书籍。本书不仅回顾了开源软件的发展历程,还深入探讨了开源革命成功的原因以及未来的发展趋势。在这个过程中,书中涉及了多个重要...
还有简单的密码验证 开发软件:Android StudioAndroid 开源在线音乐播放器Android 开源在线音乐播放器Android 开源在线音乐播放器Android 开源在线音乐播放器Android 开源在线音乐播放器Android 开源在线音乐播放器...
标题中的“开源双接受5.8G图传接收资料”意味着该项目不仅提供了硬件设计,还开放了软件源代码,使得爱好者们可以自由地研究、修改和分享。开源文化鼓励社区合作,这种开放性使得技术得以快速迭代和优化,同时也降低...
【优惠券开源系统】是一种专为站长设计的软件解决方案,旨在快速搭建具备优惠券功能的购物网站。这个系统的核心特点是其开源性质,意味着用户可以自由查看、修改和分发源代码,根据自身需求定制功能,适应不同的商业...
标题:“开源的opc服务器” 描述:“开源的opc服务器的程序,是俄罗斯人写的在vc下开发的轻量级的opc服务器!” 在这个主题中,我们将深入探讨开源的OPC(OLE for Process Control)服务器,特别是由俄罗斯开发者...
标题中的“SimpleBGC32- 开源三轴无刷云台算法完全解说”表明了这是一个关于三轴无刷电机云台控制系统的详细介绍,重点在于其开源算法。这个系统基于STM32F103RC微控制器,结合了MPU6050六轴传感器,用于实现飞行器...
户外爱好者可以获取离线地图在没有网络的区域导航;教育工作者则能将其用作教学资源,让学生了解地理信息。同时,由于该软件是开源的,也鼓励了社区间的合作与交流,不断推动软件的改进和完善。 压缩包中的...
【标题】"ihalcon开源窗体控件.rar"是一个压缩包,其中包含了ihalcon开源窗体控件的相关文件。这个框架主要用于计算机视觉领域,特别是基于Halcon机器视觉算法的开发。 【描述】提到,该框架具有很好的功能,能够...
开源飞控平台比较 开源飞控平台是无人机系统的核心组件之一,负责飞行控制、导航和数据处理等功能。当前市场上有多种开源飞控平台,包括APM、Px4/Pixhawk、Autopilot、PPZ、MWC等。这些平台各有其优缺,今天我们将...
看过awesome-go项目, 汇总了很多go开源项目。 但是awesome-go收集了太全了, 而且每个项目没有详细描述。 因此我自己根据go语言中文社区提供的资料,还有互联网企业架构设计中的常见组件分类, 共精心挑选了100多个...
开源3DMap Flex 3D地图是一款基于Adobe Flex技术的开源项目,旨在提供高质量的三维地图服务,其性能和功能可以媲美甚至超越商业产品如E都市地图。Flex是一种基于ActionScript 3.0的开源框架,用于构建富互联网应用...
28个开源RTOS载点、适用平台、性能介绍 在嵌入式系统开发中,实时操作系统(RTOS)扮演着非常重要的角色。作为一种小型的操作系统,RTOS能够提供实时性、可靠性和高效性等特点,满足了嵌入式系统的需求。今天,我们...
本集合提及的开源代码与项目涉及机器视觉的多个关键领域,包括但不限于特征提取、图像分割、目标检测和跟踪等,下面将详细说明这些领域中涉及的关键技术和所列举的部分开源项目。 1. 特征提取(Feature Extraction...
kiftd是一款专门面向个人、团队和小型组织的Java开源网盘系统。使用简单,解压即用。适合家庭、团队或小型组织在局域网&公网中搭建私有云盘实现文件共享。支持Windows/Linux/Mac OS,只需3分钟即可完成部署,同时还...
【标题】:“java开源版企业门户网站_功能齐全,带后台” 这个标题暗示了这是一个基于Java编程语言的开源项目,特别设计用于构建企业级门户网站。开源意味着源代码是公开的,允许用户自由查看、使用、修改和分发。...
《Mail Web开源版:构建B/S邮件系统客户端的探索与实践》 在信息化时代,电子邮件作为重要的通信工具,其便捷性和高效性不言而喻。本文将深入探讨一款名为"Mail Web开源版"的基于B/S(Browser/Server,浏览器/...
路德软件 兼承 “ 开放 分享 进步 ” 的原则,对 RoadFlow 工作流引擎开源,希望与广大工作流开发者共同进步! 平台基于 .Net 的 B/S 架构开发,需要 .Net Framework 4.0 以上版本和 IIS6.0 以上运行环境。数据库...
开源项目网站 SourceForge 在 1999 年还只有数百个开源项目,到 2008 年初,其开源项目数已经超 过 17万个,几乎覆盖软件应用的所有领域。大部分产品和技术基于开源平台的 Google已成为世界上 最成功的高科技公司。...
开源六位半万用表是一种基于开放源代码的高级电子测量设备,主要用于精确测量电压、电流、电阻等电气参数。这种万用表的设计理念是为了提供与商业级的34401A数字多用表(DMM)类似的性能,但同时允许用户自由访问其...