6月9日下午消息,据国外媒体报道,美国时间6月8日,谷歌公司发布了新的搜索索引系统,并取了可爱的名字Caffeine(咖啡因)。谷歌称,为了应对快速变化、互相连通并且越来越实时性的网络内容,公司才推出这款整合能力更强,更快的索引系统。
新系统能够整合比以前多得多的页面,而索引信息的时间却比老系统要少一半,这意味着它能为用户提供更新更及时的数据内容。公司甚至还新创了一个Caffeine的图标,用来表示老系统所不再能处理的飓风般迅猛的信息流。
新索引系统Caffeine颠覆了原来的层级索引
除了更新速度变快之外,网络内容流的量也迅速膨胀,图片、视频、新文章、短信息和社交网络状态更新都在增加。谷歌希望能将它们分别整理开,使用户能方便地搜索这些内容。这需要解决多面向技术难题。
谷歌的老索引系统采用的是层级结构,最顶层的内容比更底层的内容更新要快,但是每一层的更新都需要谷歌扫描所有网络内容,然后再发现并排列新网页。费时又费力。
Caffeine颠覆这种结构。它把更新任务分解成很多小块,不再需要对整个互联网信息链进行扫描,只需要持续不断关注每个小块,随时对其内容索引即可。
这个新检索系统是全球搜索方法四年以来最大的变化。它现在每秒可以往谷歌索引库中添加成千的网页。
原址:http://tech.ifeng.com/internet/detail_2010_06/09/1603257_0.shtml
分享到:
相关推荐
“Caffeine”是一个全新的搜索引擎架构,其特点是能够加快搜索速度,提高索引的质量和全面性。 2. **“Caffeine”的特性**:“Caffeine”能够每秒并行处理十万页内容,全天候更新索引,这为新算法提供了强大的技术...
这种方式称为In-Memory Indexing,如Google的咖啡因(Caffeine)更新系统。但内存有限,所以需要智能地管理内存资源,比如使用LRU(Least Recently Used)策略。 六、冷热数据分离 对于非实时查询需求的冷数据,...
例如,Caffeine是一种用于处理个体修改的系统,它提高了搜索引擎索引更新的速度和效率。Pregel是一个可扩展的图计算框架,用于处理大规模图数据,如社交网络分析。Dremel则是一种在线可视化工具,它能快速分析和呈现...
“咖啡因更新”(Caffeine Update)是Google对搜索引擎后端架构的升级;“梅德威克更新”(Mayday Update)专注于提高长尾关键词的搜索精确度。 对于打击垃圾信息和低质量内容,“负评算法”(Negative Review ...
随着时间的发展,Google现在面临着全球范围内的流量压力,需要支持连续的爬取和索引过程,如Caffeine项目,以及对延迟敏感的应用程序,例如Gmail中的“文档片段”服务。此外,个人之间的文档共享也变得越来越普遍。 ...
Caffeine优化了网络搜索引擎,将索引置于分布式数据库BigTable,提高搜索速度。Pregel则用于处理图形数据,描绘大量信息间的关系。 除了Hadoop生态,还有其他系统致力于提升大数据处理效率和性能。例如,基于列的自...
随着技术的演进,Google后Hadoop时代的新兴技术,如Dremel、Caffeine和Pregel,提供了更快的交互式数据分析、更高效的搜索引擎和更强大的图形数据库功能。Dremel采用列存储和多层次查询树,实现了毫秒级的海量数据...
- **Caffeine**:为Google搜索引擎提供支持,采用BigTable作为后端存储,提高了索引更新的速度。 - **Pregel**:用于处理图数据的分布式计算系统,能够高效处理大规模图数据。 #### 五、高级数据分析方法 - **...