`

谷歌发布全新搜索索引系统Caffeine

阅读更多

6月9日下午消息,据国外媒体报道,美国时间6月8日,谷歌公司发布了新的搜索索引系统,并取了可爱的名字Caffeine(咖啡因)。谷歌称,为了应对快速变化、互相连通并且越来越实时性的网络内容,公司才推出这款整合能力更强,更快的索引系统。

新系统能够整合比以前多得多的页面,而索引信息的时间却比老系统要少一半,这意味着它能为用户提供更新更及时的数据内容。公司甚至还新创了一个Caffeine的图标,用来表示老系统所不再能处理的飓风般迅猛的信息流。

新索引系统Caffeine颠覆了原来的层级索引

除了更新速度变快之外,网络内容流的量也迅速膨胀,图片、视频、新文章、短信息和社交网络状态更新都在增加。谷歌希望能将它们分别整理开,使用户能方便地搜索这些内容。这需要解决多面向技术难题。

谷歌的老索引系统采用的是层级结构,最顶层的内容比更底层的内容更新要快,但是每一层的更新都需要谷歌扫描所有网络内容,然后再发现并排列新网页。费时又费力。

Caffeine颠覆这种结构。它把更新任务分解成很多小块,不再需要对整个互联网信息链进行扫描,只需要持续不断关注每个小块,随时对其内容索引即可。

这个新检索系统是全球搜索方法四年以来最大的变化。它现在每秒可以往谷歌索引库中添加成千的网页。

原址:http://tech.ifeng.com/internet/detail_2010_06/09/1603257_0.shtml

分享到:
评论
1 楼 poson 2010-07-24  
增量更新的索引,不错。

相关推荐

    谷歌发布新算法:以提高搜索结果的时效性.docx

    “Caffeine”是一个全新的搜索引擎架构,其特点是能够加快搜索速度,提高索引的质量和全面性。 2. **“Caffeine”的特性**:“Caffeine”能够每秒并行处理十万页内容,全天候更新索引,这为新算法提供了强大的技术...

    搜索引擎中的数据存储问题研究.rar

    这种方式称为In-Memory Indexing,如Google的咖啡因(Caffeine)更新系统。但内存有限,所以需要智能地管理内存资源,比如使用LRU(Least Recently Used)策略。 六、冷热数据分离 对于非实时查询需求的冷数据,...

    Google大数据发展与应用.docx

    例如,Caffeine是一种用于处理个体修改的系统,它提高了搜索引擎索引更新的速度和效率。Pregel是一个可扩展的图计算框架,用于处理大规模图数据,如社交网络分析。Dremel则是一种在线可视化工具,它能快速分析和呈现...

    英文SEO_GoogleSEO须知算法.pdf

    “咖啡因更新”(Caffeine Update)是Google对搜索引擎后端架构的升级;“梅德威克更新”(Mayday Update)专注于提高长尾关键词的搜索精确度。 对于打击垃圾信息和低质量内容,“负评算法”(Negative Review ...

    北航云计算公开课05a Google storage_architecture_and_challenges

    随着时间的发展,Google现在面临着全球范围内的流量压力,需要支持连续的爬取和索引过程,如Caffeine项目,以及对延迟敏感的应用程序,例如Gmail中的“文档片段”服务。此外,个人之间的文档共享也变得越来越普遍。 ...

    汇报1大数据研究现状探讨42.pptx

    Caffeine优化了网络搜索引擎,将索引置于分布式数据库BigTable,提高搜索速度。Pregel则用于处理图形数据,描绘大量信息间的关系。 除了Hadoop生态,还有其他系统致力于提升大数据处理效率和性能。例如,基于列的自...

    大数据研究现状探讨.pptx

    随着技术的演进,Google后Hadoop时代的新兴技术,如Dremel、Caffeine和Pregel,提供了更快的交互式数据分析、更高效的搜索引擎和更强大的图形数据库功能。Dremel采用列存储和多层次查询树,实现了毫秒级的海量数据...

    汇报1-大数据研究现状探讨42.pptx

    - **Caffeine**:为Google搜索引擎提供支持,采用BigTable作为后端存储,提高了索引更新的速度。 - **Pregel**:用于处理图数据的分布式计算系统,能够高效处理大规模图数据。 #### 五、高级数据分析方法 - **...

Global site tag (gtag.js) - Google Analytics