作者:吴健
现在在京东、易迅、亚马逊等看到的主流推荐算法,一般都是基于物品自身相似性(不依赖于用户数据,没有冷启动问题)、基于用户浏览、喜欢、购买等数据的协同过滤推荐(用户纬度和商品纬度)。
其实这些推荐算法的核心思路,是很朴素的。
一、基于物品自身相似度:例如衣服A和衣服B,对于它们在分类、价格段、属性、风格、品牌定位等等其他属性纬度的表现,来计算它们之间的相似度,如果相似度高,那么在有用户浏览A的时候,就可以推荐B(实际当然没这么简单)。因为衣服的这些属性是不依赖于用户的,所以解决了系统的冷启动问题,正是不依赖与用户的行为数据,因此比较死板,完全没有个性化的推荐。这个算法的思路很多人都清楚,但是越是简单的算法,要达到好的效果就越是难,特别是推荐这种转化率非常低的算法。商品有几十个属性,对不同分类的商品,并不是所有的属性都是有必要纳入相似度计算的,已经纳入的属性但是重要性也是有区别的,这样一来,光光给不同类别商品筛选必要属性以及设置这些属性在相似度计算中的权重值,就是一项非常浩大的工程了。亚马逊的推荐系统在全球行业中也是最早的,相信他们在这个问题上肯定有自己一套迅速有效的方法。当然要我来说具体是怎么样的,我怎么可能知道呢^_^,知道了也不告诉你。
二、基于用户纬度的协同过滤:采集用户的购买(浏览、收藏都行)商品数据,把用户购买的商品列出来,当作用户的属性纬度。例如用户A购买了商品1、2、3、4、5,用户B购买了商品1、2、5、6,那么可以简单的将12345和1256分别作为A和B的属性特征字符串,计算A和B的相似度,经过简单的聚类将用户聚成几个类别(邻居)。假设A和B同属于一个聚类,那么可以称A和B有比较相似的偏好,继而可以将A买过而B没买过的其他商品推荐给B。在这一个流程里,可以发挥的地方有很多:1、用户的行为数据需要去噪音(买了多少商品以下的用户不考虑,有代购的不考虑,如何精准的判断代购,商品时效性的考虑,数据的时间跨度等等);2、计算相似度的时候跟第一点中提到的一样,并不是所有商品对用户的描述度都是一样的。可能价格低的重要程度就没有昂贵的商品重要。3、通过聚类计算邻居的时候,聚类算法又是另一门学科了,或者选择分类算法。然后聚类的门槛选择都是需要很长时间的测试、观察、修改的,需要时间的积累。4、浏览、购买、收藏等历史数据是不是可以协同过滤。现在很多网站给出的推荐,都不是单一推荐算法的,一个算法的输出可以作为另一个算法的输入,可以是多个算法的输出综合筛选,这也是一个需要长时间积累的地方。
三、基于物品纬度的协同过滤:其实我觉得是和第二点很相似,就是将用户作为商品的属性纬度来看。例如商品A被用户1,2,3,4,5,6购买过,商品B被用户1,3,4,5,7购买过,那么将123456作为商品A的特征属性数据,13457作为商品B的特征数据,然后计算商品A和B的相似度(这里的相似度却别于第一点提到的相似度,似乎叫“相似度”不是很合适)。因为我们有理由认为同一个人群买了A,又买了B,那么A和B一定有某种关联。在这个流程里面可以发挥的地方基本和第二点中提到的差不多。
四、强关联规则的应用:重点是同一次购买记录(当然也不是必然的,看自己的选择)。首先收集数据就需要把一单购买一种商品的过滤掉。然后一次对每一条记录中进行成对提取统计,简单的就是两两统计次数,这种提取出来的都是两个商品被同时购买的次数,适用于一对一推荐。还有一种是通过FPTree算法(似乎是这个名字吧,因为我们公司是一对一的需求,所以这个算法我没怎么研究,是我自己写的两两统计),不光是一对一推荐,可以一对二,二对一。在这个流程里面,关联规则(关联规则_百度百科)挖掘算法非常重要,其中置信度和支持度也是需要不断调整的地方。
五、所有推荐系统之间的数据共享、数据的定时自动更新、自动学习。
总的来说,推荐算法大部分都是很朴素的,但是需要运用的好,没有长时间的积累是做不到的。仅仅是聘请一些算法工程师,运用一些算法框架,想取得好的推荐效果,基本是不可能的。只有算法与具体业务相结合才能产生化学反应。
相关推荐
可供参考的流程图-电商推荐算法架构图,在此模版下各位按照自己的情况进行修改,设计出自己或公司所需要的流程图。
这将有助于电商平台更好地理解用户需求,优化商品推荐策略,增强用户体验,同时也为数据分析人员提供了强大的工具来挖掘电商数据中的商业洞察。 在关键词部分提到了多标签文本分类、特征提取、模型构建、双向编码器...
"电商推荐系统推荐算法应用" 推荐系统在电子商务中应用是指在电商平台上使用推荐算法来提高用户体验和销售额的一种技术。该技术通过分析用户行为、物品特征和上下文信息,向用户推荐相关的商品或服务,以提高用户的...
在电商大数据推荐系统的应用研究中,逻辑回归算法和关联规则推荐算法是比较重要的两种推荐算法。下面将从多个角度详细阐述这两种算法在电商推荐系统中的应用,以及各自的优势和局限性。 首先,逻辑回归算法是一种...
阿里巴巴B2B电商算法主要关注的是电子商务领域中的技术演进,特别是如何通过算法优化提升电商平台的效率和用户体验。从给出的部分内容来看,我们可以提炼出以下几个关键知识点: 1. **电商平台演进**: - 2003年至...
本文将深入探讨“基于BERT的社交电商文本分类算法”,旨在理解如何利用先进的自然语言处理技术来解决社交电商场景下的文本分析问题。 BERT(Bidirectional Encoder Representations from Transformers)是由Google...
7. 电商平台数据的应用:在研究中,利用了上海某电商平台的销售数据集进行算法测试,说明了电商平台积累的大量用户数据是研究和优化推荐系统的重要资源。 8. 文献标识和分类:文档中提供了中图分类号和文献标识码,...
电子商务之价格优化算法:强化学习:电商价格优化算法的实证研究.docx
“阿里灵杰”问天引擎电商搜索算法赛 simcse setenceetransformer “阿里灵杰”问天引擎电商搜索算法赛 simcse setenceetransformer “阿里灵杰”问天引擎电商搜索算法赛 simcse setenceetransformer “阿里灵杰...
电商中的算法和“信息茧房”
- **推荐方法模块**:这是推荐系统的核心部分,负责处理用户数据,运用算法生成推荐列表。该模块的目标是为特定用户挑选出最适合他们的商品或服务。 - **输出模块**:将推荐结果以友好的方式展示给用户,可以是...
在“阿里灵杰”问天引擎电商搜索算法赛中获得第二名的方案,主要涉及到的是电商领域的两阶段文本匹配算法。这种算法对于提升电商平台的搜索效率和用户购物体验至关重要。下面将详细介绍这一算法的核心概念、步骤以及...
尚硅谷大数据技术之电商推荐系统 本文档总结了尚硅谷大数据技术之电商推荐系统的架构设计和实现细节,该系统是一个基于大数据技术的电商推荐系统,旨在为电商网站提供个性化的商品推荐服务。 系统架构 该系统的...
标题中的“某电商平台产品推荐算法内含数据集.zip”表明这是一个关于电商领域的产品推荐系统相关的数据集,可能包含了用户购买历史、产品信息等数据,用于训练和测试推荐算法。这样的数据集通常会帮助初学者了解如何...
这是一套全面的精心制作的抖音电商互联网资源课程,它涵盖了从新手入门到精通的全方位知识。 课程内容丰富多样,包括抖音平台的算法机制解析,帮助您了解如何让您的商品和内容获得更多曝光; 深入的市场调研方法,助...
《基于遗传模糊聚类的电商个性化推荐算法研究》是一篇深入探讨如何利用先进的数据挖掘技术提升电子商务平台用户体验的学术文章。在当前竞争激烈的电商环境中,个性化推荐系统已成为提高用户满意度、促进销售的关键...
基于强化学习的电商搜索排序算法及在京东的实践 强化学习(Reinforcement Learning)是一种机器学习方法,通过在环境中进行试验和错误来学习如何做出最好的决策。电商搜索排序算法是电商平台中非常重要的一部分,...
基于遗传模糊聚类的化工产品电商个性化推荐算法研究