`
wbj0110
  • 浏览: 1610089 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

百度推荐引擎及其背后的大数据架构揭秘

阅读更多

在互联网世界中,什么技术代表着人工智能被广泛应用的未来?2012年12月22日,在以“推荐系统实战”为主题的百度技术沙龙上,百度推荐与个性化部高级工程师们与来自亚马逊、豆瓣网、清华大学等单位的技术专家们齐聚一堂,热烈探讨了个性化推荐领域的技术创新和实战案例。

  内容推荐系统:互联网人工智能的潮流代表

  目前主流的搜索引擎技术已经能够较好地满足用户的主动表达的精确需求,而在挖掘并满足用户的潜在需求方面,则需要通过构建“推荐系统”来实现。实际上,随着亚马逊商品推荐、last.fm、Netflix、Pandora、百度推荐产品家族(百度视频随心看、百度音乐随心听、百度新闻新版客户端等)、豆瓣电台、优酷视频猜你喜欢等内容推荐系统的兴起,在全球互联网市场,推荐系统已经成为炙手可热的潮流新应用,代表着互联网智能化的发展方向。

  然而,建立大型内容推荐系统并不是一件轻松的事情。在系统的服务能力、算法的更新周期、交互和反馈的实时性方面,大型推荐系统都遭遇到一些独特而有趣的挑战。

  当“大数据”遭遇“实时性”

  鉴于推荐系统对提高用户体验的显著作用,各家主要互联网公司都投入巨资进行研究开发。伴随着推荐系统的“军备竞赛”,一些几年之前难以想象的怪兽级大型推荐系统被开发出来。这些系统具有庞大的规模,通常需要服务上千万的活跃用户、积累了PB级别海量用户数据。如何将海量的用户数据应用到实时的用户交互中去以提高用户体验,成为了一个技术难题。

  百度的工程师们分享了自身在Vortex流式计算系统和LISA实时索引架构上进行推荐系统开发的经验。通过工程上的努力,推荐系统的更新周期从20小时缩短到5秒钟,提速14400倍,由此用户的转化率提高了3倍。

  思路创新:从推荐“系统”到可复用的推荐“引擎”

  许多主流互联网公司的推荐算法的更新周期从1个月到3个月不等,相对于搜索技术稳定的算法框架,推荐系统具有明显的算法寿命缩短的迹象。其根本的原因在于推荐系统并不是基于相对静态的内容数据,而是依赖动态的用户内容互动来进行算法预测。不断变化的用户状态和统计分布,导致不存在一种一统天下的推荐算法“银弹”。这种动态的特性将对推荐系统的灵活性和成本控制的要求提高到了前所未有的高度。

  针对这个问题,百度给出了自己的答案:那就是建立跨领域多媒体推荐引擎,同时支持多种内容推荐系统和推荐产品应用的构建,以大幅度节约成本、提升推荐效果。不同的推荐产品和子系统能够复用同一套推荐引擎平台,在用户模型和内容模型上也可以泛化复用。每个推荐的产品都站在“巨人的肩膀”上,最大限度复用数据、算法、系统资源,避免重复发明轮子,同时也一定程度上解决了系统冷启动问题。

  由推荐系统向推荐引擎的变革,不仅可以摊低推荐系统工程成本,还可保障算法快速更新。此外,不同推荐应用共享数据,克服数据稀疏问题;推荐产品功能横向打通,多领域立体满足用户需求。百度基于自身的推荐引擎平台,在很短的时间内实现了电影推荐、资讯推荐、音乐推荐、视频推荐、应用推荐、好友推荐等众多功能,并在运营过程中不断协同升级。

  百度自身应用的典型案例如百度视频随心看。它通过推荐引擎实现了个性化电影推荐,采用了Item项目关联和Ontology本体关联复合技术,点击率高于传统列表页数倍。

分享到:
评论

相关推荐

    5-4度小满金融大数据架构解决方案与实践.pdf

    该解决方案主要针对金融行业的挑战问题,提出基于百度云产品的大数据架构解决方案,涵盖数据湖管理与分析平台、模型训练监控评估体系等多个方面。 一、大数据架构挑战问题 在金融行业中,大数据架构面临着多个挑战...

    深入大数据架构师之路,问鼎40万年薪教学视频

    在探讨《深入大数据架构师之路,问鼎40万年薪教学视频》这一资源时,我们可以从中提炼出几个关键的知识点,这些知识点对于想要进入或深耕大数据领域的技术人员来说至关重要。 ### 大数据概述 大数据是指无法用传统...

    56.com 视频推荐与大数据架构介绍

    ### 56.com 视频推荐与大数据架构详解 #### 一、视频推荐与用户行为分析 在56.com的视频推荐系统中,一个核心环节是用户数据挖掘与视频推荐。这一过程涉及到对用户行为数据的收集、分析及利用,以此来提升用户的...

    美团点评技术团队-餐饮生态大数据架构实践.pdf

    《美团点评技术团队-餐饮生态大数据架构实践》的文件揭示了美团在餐饮行业中如何利用大数据技术来提升业务效率和决策质量。在这个过程中,美团构建了一套高效、灵活的大数据架构,旨在解决业务问题,最大化数据的...

    35套选择题目:大数据架构、高性能、数据治理题目.docx

    ### 大数据架构、高性能与数据治理知识点梳理 #### 大数据高级处理技术 - **关键技术辨析**:题目指出虚拟化技术和云计算平台技术不属于大数据的关键技术,这主要是因为这两项技术虽然对于支撑大数据处理环境至关...

    常用的大数据架构图分享.pptx

    我们将讨论大数据架构图分享的知识点,包括数据采集层、数据计算层、分布式协调服务、数据服务层、数据应用层、数据存储关系模型、面向主题组织数据处理、清洗标准化重构、数据仓库架构、数据可视化、个性化推荐、防...

    [详细完整版]大数据架构.doc

    大数据架构是针对海量数据处理的一种体系结构,旨在解决传统单机系统无法应对的大量数据存储和分析需求。在这个领域,Hadoop生态圈起着至关重要的作用,它提供了多种工具和技术,如HDFS、MapReduce、Tez和Spark,...

    大数据平台架构设计方案.docx

    大数据平台架构设计方案是现代企业信息化建设的关键组成部分,旨在处理、分析并利用海量数据,为企业决策提供有力支持。本文将深入探讨大数据采集平台、大数据清洗平台、大数据挖掘与分析平台以及大数据治理平台的...

    大数据平台架构.pdf

    大数据平台架构 大数据平台架构是指利用大数据技术构建的一种平台架构,旨在帮助企业和组织更好地管理和分析大量数据,提高业务能力和决策效率。该平台架构通常包括数据源层、数据接口层、平台架构层、分析工具层和...

    大数据整体架构.pptx

    【大数据整体架构】 大数据整体架构是现代信息技术领域的一个核心组成部分,主要涵盖了数据的采集、存储、处理、分析和应用等多个层面。以下是该架构的主要组件和相关知识点: 1. **数据采集**:数据采集涉及从...

    北京游戏产业行业大数据架构师岗位介绍JD模板.docx

    根据给定的文件信息,以下是对“北京游戏产业行业大数据架构师岗位介绍JD模板”中的关键知识点进行的详细解析。 ### 一、岗位名称及关键词 #### 岗位名称: - **大数据架构师** #### 关键词: - **Hadoop**:...

    大数据架构规划PPT优质课件.pptx

    本课件详细介绍了大数据架构规划的关键组成部分及其演进路线。 首先,【产品需求理解和整体规划】是大数据架构的基础。在这个阶段,需要深入理解业务需求,识别关键的数据指标,以及规划数据服务的蓝图。整体规划...

    阿里大数据架构.rar

    10. **机器学习与人工智能**:阿里大数据架构还包括深度学习和机器学习平台,如TensorFlow、MxNet等,支持模型训练和预测,推动智能推荐、风险控制等业务的发展。 通过这些组件的协同工作,阿里大数据架构实现了...

    大数据平台架构.doc

    SequoiaDB的独特功能包括:灵活的数据类型支持,能够统一管理结构化数据和海量小文件,采用双存储引擎简化系统架构,提供统一数据视图实现冷热数据分离,支持读写分离以提升业务处理能力,深度整合大数据生态组件,...

    基于云平台的大数据架构.pdf

    实时搜索和稳定快速的搜索引擎是大数据应用不可或缺的组成部分,尤其在PaaS层面上,以提供支持实时搜索的稳定内存计算。 总体来说,基于云平台的大数据架构是一个涵盖数据采集、存储、分析、治理、安全和应用等多个...

    菜鸟物流大数据技术架构.pptx

    菜鸟物流作为物流行业的佼佼者,其大数据技术架构的创新和演进是值得深入研究的案例。本文将对菜鸟物流大数据技术架构进行详细探讨,从技术创新、案例分析到应对策略,全面展现菜鸟如何利用大数据技术重塑物流行业。...

    大数据架构师的工作职责描述.docx

    大数据架构师是IT行业中至关重要的角色,特别是在互联网...具备这些技能和职责的大数据架构师,能够在快速变化的互联网环境中,为企业构建起强大的数据驱动引擎,帮助企业从海量数据中挖掘价值,驱动业务决策和创新。

    大数据架构规划.pptx

    【大数据架构规划】 大数据架构规划是企业为了满足日益增长的数据处理和分析需求,设计和实施的一种框架。这个框架涵盖了从理解产品需求、设定演进路线到构建开发和运营能力,以及确保产品运行能力的全过程。大数据...

    大数据架构规划PPT课件.pptx

    【大数据架构规划】是IT领域中的一个重要主题,它涉及到如何设计和实施能够处理大量数据的系统。本课件主要探讨了大数据架构规划的关键方面,包括产品需求理解、整体规划、演进路线、开发及运营能力以及产品运行能力...

Global site tag (gtag.js) - Google Analytics