`
thd52java
  • 浏览: 72115 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

推荐系统概述

阅读更多

在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。

一、基于内容推荐

基于内容的推荐(Content-basedRecommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见,更多地需要用机器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。在基于内容的推荐系统中,项目或对象是通过相关的特征的属性来定义,系统基于用户评价对象的特征,学习用户的兴趣,考察用户资料与待预测项目的相匹配程度。用户的资料模型取决于所用学习方法,常用的有决策树、神经网络和基于向量的表示方法等。基于内容的用户资料是需要有用户的历史数据,用户资料模型可能随着用户的偏好改变而发生变化。

基于内容推荐方法的优点是:
1)不需要其它用户的数据,没有冷开始问题和稀疏问题。
 2)能为具有特殊兴趣爱好的用户进行推荐。
3)能推荐新的或不是很流行的项目,没有新项目问题。
4)通过列出推荐项目的内容特征,可以解释为什么推荐那些项目。
 5)已有比较好的技术,如关于分类学习方面的技术已相当成熟。

缺点是要求内容能容易抽取成有意义的特征,要求特征内容有良好的结构性,并且用户的口味必须能够用内容特征形式来表达,不能显式地得到其它用户的判断情况。

二、协同过滤推荐

协同过滤推荐(Collaborative FilteringRecommendation)技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影。

协同过滤是基于这样的假设:为一用户找到他真正感兴趣的内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。其基本思想非常易于理解,在日常生活中,我们往往会利用好朋友的推荐来进行一些选择。协同过滤正是把这一思想运用到电子商务推荐系统中来,基于其他用户对某一内容的评价来向目标用户进行推荐。

基于协同过滤的推荐系统可以说是从用户的角度来进行相应推荐的,而且是自动的,即用户获得的推荐是系统从购买模式或浏览行为等隐式获得的,不需要用户努力地找到适合自己兴趣的推荐信息,如填写一些调查表格等。

和基于内容的过滤方法相比,协同过滤具有如下的优点:
1) 能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等。
2)共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、个人品味)进行过滤。
3)有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的。这也是协同过滤和基于内容的过滤一个较大的差别,基于内容的过滤推荐很多都是用户本来就熟悉的内容,而协同过滤可以发现用户潜在的但自己尚未发现的兴趣偏好。
4) 能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个性化学习的速度。

虽然协同过滤作为一种典型的推荐技术有其相当的应用,但协同过滤仍有许多的问题需要解决。最典型的问题有稀疏问题(Sparsity)和可扩展问题(Scalability)。

三、基于关联规则推荐

基于关联规则的推荐(Association Rule-basedRecommendation)是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零售业中已经得到了成功的应用。管理规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y,其直观的意义就是用户在购买某些商品的时候有多大倾向去购买另外一些商品。比如购买牛奶的同时很多人会同时购买面包。

算法的第一步关联规则的发现最为关键且最耗时,是算法的瓶颈,但可以离线进行。其次,商品名称的同义性问题也是关联规则的一个难点。

四、基于效用推荐

基于效用的推荐(Utility-basedRecommendation)是建立在对用户使用项目的效用情况上计算的,其核心问题是怎么样为每一个用户去创建一个效用函数,因此,用户资料模型很大程度上是由系统所采用的效用函数决定的。基于效用推荐的好处是它能把非产品的属性,如提供商的可靠性(VendorReliability)和产品的可得性(Product Availability)等考虑到效用计算中。

五、基于知识推荐

基于知识的推荐(Knowledge-basedRecommendation)在某种程度是可以看成是一种推理(Inference)技术,它不是建立在用户需要和偏好基础上推荐的。基于知识的方法因它们所用的功能知识不同而有明显区别。效用知识(FunctionalKnowledge)是一种关于一个项目如何满足某一特定用户的知识,因此能解释需要和推荐的关系,所以用户资料可以是任何能支持推理的知识结构,它可以是用户已经规范化的查询,也可以是一个更详细的用户需要的表示。

六、组合推荐

由于各种推荐方法都有优缺点,所以在实际中,组合推荐(HybridRecommendation)经常被采用。研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个推荐预测结果,然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐一个最重要原则就是通过组合后要能避免或弥补各自推荐技术的弱点。

在组合方式上,有研究人员提出了七种组合思路:
1)加权(Weight):加权多种推荐技术结果。
2)变换(Switch):根据问题背景和实际情况或要求决定变换采用不同的推荐技术。
3)混合(Mixed):同时采用多种推荐技术给出多种推荐结果为用户提供参考。
4)特征组合(Feature combination):组合来自不同推荐数据源的特征被另一种推荐算法所采用。
5)层叠(Cascade):先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步作出更精确的推荐。
6)特征扩充(Feature augmentation):一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中。
7)元级别(Meta-level):用一种推荐方法产生的模型作为另一种推荐方法的输入。
七、主要推荐方法的对比

各种推荐方法都有其各自的优点和缺点,见表1。

表1 主要推荐方法对比

推荐方法 优点 缺点
基于内容推荐 推荐结果直观,容易解释;

不需要领域知识

新用户问题;

复杂属性不好处理;

要有足够数据构造分类器

协同过滤推荐 新异兴趣发现、不需要领域知识;

随着时间推移性能提高;

推荐个性化、自动化程度高;

能处理复杂的非结构化对象

稀疏问题;

可扩展性问题;

新用户问题;

质量取决于历史数据集;

系统开始时推荐质量差;

基于规则推荐 能发现新兴趣点;

不要领域知识

规则抽取难、耗时;

产品名同义性问题;

个性化程度低;

基于效用推荐 无冷开始和稀疏问题;

对用户偏好变化敏感;

能考虑非产品特性

用户必须输入效用函数;

推荐是静态的,灵活性差;

属性重叠问题;

基于知识推荐 能把用户需求映射到产品上;

能考虑非产品属性

知识难获得;

推荐是静态的

分享到:
评论

相关推荐

    大数据技术系列课程 推荐系统及应用教程 第1章 推荐系统概述 共28页.pptx

    【课程大纲】第1章 推荐系统概述 共28页第2章 推荐系统中的CTR过程 共57页第3章 推荐系统基础算法 共23页第4章 基于物品相似度的个性化推荐算法 共109页第5章 基于隐反馈的协同过滤推荐模型 共40页第6章 推荐系统...

    操作系统概论02323 电子书

    #### 一、计算机系统概述 计算机系统,作为20世纪人类的重大发明,深刻地改变了现代社会的运作方式。它不仅在科学计算、过程控制、信息传递和数据处理等领域发挥着重要作用,还深入到了办公、教育、家庭等多个生活...

    电力系统概论.pdf

    电力系电力系统概论.pdf统概论.pdf电力系统概论.pdf电力系统概论.pdf

    萨师煊、王珊著数据库系统概论电子教案

    《萨师煊、王珊著数据库系统概论》是一本在数据库领域极具影响力的教材,它深入浅出地讲解了数据库的基础理论和实际应用。电子教案包含从第一章到第十章的完整内容,为学习者提供了丰富的学习资源。接下来,我们将...

    系统工程概论 杨家本

    ### 一、系统工程概述 #### 1.1 系统工程定义 系统工程是一种跨学科的方法,用于实现和使用复杂系统。它通过结构化的方法来识别需求、设计解决方案、评估替代方案、管理变更,并确保系统在整个生命周期内满足用户的...

    操作系统概论历年真题及答案

    《操作系统概论历年真题及答案》这个压缩包文件集合了多年的自学考试题目和答案,旨在帮助备考者系统性地复习和理解操作系统的基本概念、原理和应用。 在这些文件中,我们可以看到不同年份的考试题目,如2006年、...

    (完整版)数据库系统概论第五版课后习题答案王珊

    在《数据库系统概论》第五版中,王珊教授深入浅出地介绍了数据库的基本概念,让我们来详细探讨其中的重点知识。 首先,我们要理解数据(Data)的本质。数据是描述客观事物的符号记录,它可以是数字、文字、图像等多种...

    数据库系统概论(电子版)

    数据库系统概论是一门深入研究数据管理、存储和检索的核心课程,主要涵盖了关系数据库理论、数据库设计、数据库管理系统实现以及数据库应用开发等多个方面。电子版的《数据库系统概论》通常以PDF格式提供,便于读者...

    自考之操作系统概论.zip

    "自考之操作系统概论.zip"这个压缩包文件显然是为了帮助自考人群准备操作系统概论的考试而精心编排的资料集合。下面我们将详细探讨操作系统的一些关键知识点。 1. **操作系统定义**:操作系统是管理计算机硬件与...

    数据库系统概论往年试题共三套

    数据库系统概论基础知识点 本资源摘要信息旨在为数据库系统概论第四版提供相关知识点,涵盖数据库管理系统、数据模型、关系数据库、SQL 语言、数据库设计、数据独立性、并发控制、安全控制、完整性控制等方面。 一...

    数据库系统概论(第5版)王珊&萨师煊

    《数据库系统概论》是数据库领域的一本经典教材,由王珊和萨师煊两位知名学者共同编写,已经更新到了第五版。这本书深入浅出地介绍了数据库系统的基础理论、设计方法以及实际应用,是计算机科学与技术专业学生必读的...

    自考02323操作系统概论-串讲

    #### 一、操作系统概述 **操作系统定义:** 操作系统是一种复杂的系统软件,是不同程序代码、数据结构、初始化文件的集合,具备可执行特性。它是连接计算机硬件与用户的桥梁,负责管理计算机硬件和软件资源,并简化...

    地理信息系统概论

    地理信息系统概论-黄杏元,电子书,pdf格式

    基于Python开发带差分隐私采用协同过滤的推荐系统 毕业设计.gz

    • 推荐系统概述。介绍推荐系统的主要分类方法和对于协同过滤推荐算法的研究;介绍了协同过滤算法的主要步骤:收集用户偏好、找到相似的用户或者物品、计算并推荐。 • 差分隐私概述。分析了差分隐私的概念和该模型...

    20年10月操作系统概论02323真题.doc

    操作系统概论真题解析 本文档将对操作系统概论真题进行详细的解析和知识点总结,涵盖了操作系统的基本概念、进程管理、内存管理、文件系统、输入/输出系统等方面的知识点。 一、操作系统基本概念 操作系统是...

    数据库系统概论习题解析与实验指导实验报告.rar

    本资源为数据库系统概论习题解析与实验指导(王珊第5版)的实验部分实现,包含实验指导,以及实验数据及代码实现,前面教学部份的实验内容都已经通过MySQL语言实现(包括实验指导书中使用的数据库语言在MySQL中语法...

    数据库系统概论_王 珊_课后习题答案(全)

    《数据库系统概论》是一本广泛使用的教材,由王珊教授编著,旨在深入浅出地介绍数据库的基本概念、设计原理和技术实现。这份课后习题答案集全面解析了教材中的各章节习题,对于学习者来说是巩固理论知识、提升实践...

    数据库系统概述PPT-王珊老师.zip

    数据库系统概述PPT----最新版(王珊老师),适合用于期末考试复习,还有考研考试和考研复试,考研复试参考的都是这个老师的教材 --------------------------------------------------------------------------------...

    毕业设计:基于差分隐私保护技术的协同过滤推荐系统设计与实现.zip

    (2)推荐系统概述。介绍推荐系统的主要分类方法和对于协同过滤推荐算法的研究;介绍了协同过滤算法的主要步骤:收集用户偏好、找到相似的用户或者物品、计算并推荐。 (3)差分隐私概述。分析了差分隐私的概念和该...

Global site tag (gtag.js) - Google Analytics