`
liuxinglanyue
  • 浏览: 565347 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

数学之美 系列十一 - Google 阿卡 47 的制造者阿米特.辛格博士

阅读更多

枪迷或者看过尼古拉斯.凯奇(Nicolas Cage)主演的电影“战争之王”(Lord of
War)的人也许还记得影片开头的一段话:(在所有轻武器中,)最有名的是阿卡 47( AK47)冲锋枪(也就是中国的五六式冲锋枪的原型),因为它从不卡壳、从不损坏、可在任何环境下使用、可靠性好、杀伤力大并且操作简单。

我认为,在计算机中一个好的算法,应该向阿卡 47 冲锋枪那样简单、有效、可靠性好而且容易读懂(或者说易操作),而不应该是故弄玄虚。Google 的杰出工程师阿米特.辛格博士 (Amit Singhal) 就是为 Google 设计阿卡 47 冲锋枪的人,在公司内部,Google 的排序算法便是以他的名字命名的。

从加入 Google 的第一天,我就开始了和辛格长期而愉快的合作,而他一直是我的一个良师益友。辛格、Matt Cutts(中国一些用户误认为他是联邦调查局特工,当然他不是)、马丁和我四个人当时一同研究和解决网络搜索中的作-弊问题(Spam)。我们需要建一个分类器,我以前一直在学术界工作和学习,比较倾向找一个很漂亮的解决方案。我设计了一个很完美的分类器,大约要花三个月到半年时间来实现和训练,而辛格认为找个简单有效的办法就行了。我们于是尽可能简化问题,一、两个月就把作-弊的数量减少了一半。当时我们和公司工程副总裁罗森打了个赌,如果我们能减少 40% 的作-弊,他就送我们四个家庭去夏威夷度假,后来罗森真的履约了。这个分类器设计得非常小巧(只用很小的内存),而且非常快速(几台服务器就能处理全球搜索的分类),至今运行得很好。

后来我和辛格一起又完成了许多项目,包括对中、日、韩文排名算法的改进。每一次,辛格总是坚持找简单有效的解决方案。这种做法在 Google 这个人才济济的公司常常招人反对,因为很多资深的工程师怀疑这些简单方法的有效性。不少人试图用精确而复杂的办法对辛格的设计的各种“阿卡47” 进行改进,后来发现几乎所有时候,辛格的简单方法都接近最优化的解决方案,而且还快得多。另一条选择简单方案的原因是这样设计的系统很容易查错(debug)。

当然,辛格之所以总是能找到那些简单有效的方法,不是靠直觉,更不是撞大运,而是靠他丰富的研究经验。辛格早年从师于搜索大师萨尔顿(Salton)教授,毕业后就职于 AT&T 实验室。在那里,他和两个同事半年就搭起了一个中等规模的搜索引擎,这个引擎索引的网页数量虽然无法和商用的引擎相比,但是准确性却非常好。在 AT&T,他对搜索问题的各个细节进行了仔细的研究,他的那些简单而有效的解决方案,常常是深思熟虑去伪存真的结果。

辛格非常鼓励年轻人不怕失败,大胆尝试。一次一位刚毕业不久的工程师因为把带有错误的程序推出到 Google 的服务器上而惶惶不可终日。辛格安慰她讲,你知道,我在 Google 犯的最大一次错误是曾经将所有网页的相关性得分全部变成了零,于是所有搜索的结果全部是随机的了。这位工程师后来为 Google 开发了很多好的产品。

辛格在 AT&T 时确立了他在学术界的地位,但是,他不是一个满足于做实验写论文的人,于是他离开了实验室来到了当时只有百、十人的 Google。在这里,他得以施展才智,重写了 Google 的排名算法,并且一直在负责改进它。辛格因为舍不得放下两个孩子,很少参加各种会议,但是他仍然被学术界公认为是当今最权威的网络搜索专家。2005年,辛格作为杰出校友被请回母校康乃尔大学计算机系在 40 年系庆上作报告,获得这一殊荣的还有大名鼎鼎的美国工程院院士,计算机独立磁盘冗余阵列(RAID)的发明人凯茨(Randy Katz) 教授。

分享到:
评论

相关推荐

    logactaesque-akka-experimental:阿卡实验..

    《Logactaesque Akka实验:借助Akka演员系统探索Java编程的新境界》 在IT行业中,Akka框架因其高效、可靠以及并发处理能力而备受赞誉。尤其在Java开发领域,Akka提供了一种强大的工具,使开发者能够构建高度可扩展...

    C#开发实战1200例-第1卷-王小科.王军 .rar

    这本书主要面向初学者和有一定基础的程序员,旨在通过大量的实例来帮助读者深入理解和掌握C#编程语言的核心特性和实际应用。 在C#这门强大的编程语言中,本书覆盖了以下几个主要的知识点: 1. **C#基础语法**:...

    C#开发实战1200例-第2卷-王小科.王军 .rar

    该书分为两卷,旨在为学习者提供丰富的实例,帮助他们从实践中掌握C#语言的核心特性和高级应用。 在C#这门强大的面向对象编程语言中,开发者可以构建各种类型的应用程序,包括桌面应用、Web应用、移动应用以及游戏...

    微型计算机原理--阿卡嵌入式技术开放实验室系列普及讲座

    阿卡嵌入式技术开放实验室的普及讲座深入浅出地介绍了这些概念。 首先,微计算机(MC)是微型计算机系统(MCS)的核心,主要由微处理器(CPU)、系统软件、外设、主存储器和输入输出接口电路构成。系统软件包括操作...

    listen-on-ipv4-and-ipv6-interfaces.py

    Receive SNMP TRAP messages with the following options: SNMPv1/SNMPv2c with SNMP community “public” over IPv4/UDP, listening at 127.0.0.1:162 over IPv6/UDP, listening at [::1]:162 ...

    德国ARCA910系列温度控制器(英文).pdf

    但是,我们依然可以利用标题和描述中提及的内容,例如“德国ARCA910系列温度控制器”和“综合资料”以及文档中出现的关键技术术语,比如“WinCC”、“S7-300 PLC”和“工业以太网”等,来构建一套关于工业自动化控制...

    akka-camel-kafka-example:阿卡+骆驼+卡夫卡!

    Play 中的 Camel + Kafka + Akka 示例 创建 docker 镜像 sbt docker:publishLocal 或者,将图像发布到 docker.io: # will need to do docker login first docker:publish 运行容器 docker run -d --name ...

    谷歌黑板报

    #### 知识点十一:Google阿卡47的制造者阿米特·辛格博士 阿米特·辛格博士是Google内部的重要人物,他在机器学习和人工智能领域做出了显著贡献,尤其在Google的搜索技术和广告系统中发挥了关键作用。通过研究...

    20191223-中金公司-百济神州~B-6160.HK-维持跑赢行业评级,目标价138.4港元.pdf

    中金公司在报告中上调了百济神州港股和美股的目标价,港股目标价为138.40港元,美股目标价为230.67美元。这两者相比当前市场价分别有11%和16%的上涨空间,这个数据反映出中金公司对于百济神州股票的积极预期,认为其...

    德国阿卡 Series 200 Three-Way Valves产品手册(英文).pdf

    德国阿卡 Series 200 Three-Way Valves产品手册(英文)pdf,德国阿卡 Series 200 Three-Way Valves产品手册(英文)

    Acappella阿卡贝拉课堂安利PPT教学课件.pptx

    Acappella阿卡贝拉课堂安利PPT教学课件.pptx

    徐州阿卡产品目录.pdf

    徐州阿卡产品目录pdf,徐州阿卡调节阀及阀门定位器介绍

    德国阿卡 Series 8C-6N-6H Single-Seat Control Valves ECOTROL产品手册(英文).pdf

    德国阿卡 Series 8C-6N-6H Single-Seat Control Valves ECOTROL产品手册(英文)pdf,德国阿卡 Series 8C-6N-6H Single-Seat Control Valves ECOTROL产品手册(英文)

    C++ Qt5 范例开发大全 by it-ebooks (z-lib.org).rar

    总的来说,《C++ Qt5 范例开发大全》涵盖了从基础的Qt5组件使用到高级特性的全面教程,通过实例讲解,有助于读者快速掌握Qt5开发技能,无论你是初学者还是有经验的开发者,都能从中受益。书中结合C++语言特性和Qt5库...

    现代数字图像处理技术提高及应用案例详解(Matlab版)----源码.rar

    6. Matlab在图像处理中的优势:Matlab拥有完整的图像处理工具箱,提供了一系列高效且直观的函数,使得研究人员和工程师能够快速实现复杂的图像处理算法,同时其可视化功能可以帮助理解和验证处理结果。 7. 应用案例...

    akka-chat:使用 Akka 和 Scala 的简单聊天服务器

    阿卡聊天使用 Akka 和 Scala 的简单聊天服务器。1. 第一个版本演员 ChatServer:加入和离开聊天组,向所有当前聊天成员广播传入消息演员 ChatClient:加入聊天组,广播第一条介绍信息ChatApp:首先运行具有三个 ...

    hscc:Haskell C编译器

    hscc,全称为Haskell C编译器,是一款专门用于将Haskell编程语言编写的代码转换为C语言源代码的工具。这个独特的编译器旨在提高Haskell程序的执行效率,尤其是在那些对性能有严格要求的场景下。...

    swagger-ui-akka-http.g8:使用Akka Http API生成Swagger UI

    您可以阅读更多关于扬鞭UI和阿卡HTTP从。如何设置?克隆应用程序sbt new knoldus / swagger-ui-akka-http.g8 cd swagger-ui-akka-http /编译应用程序sbt clean编译运行应用程序sbt运行击中URI:localhost:8080 / ...

    ILC_INVERTER.rar

    使用迭代控制方式来控制逆变器,效果非常好,可以实现无静差跟踪参考电压。

Global site tag (gtag.js) - Google Analytics