`
春暖花開
  • 浏览: 20869 次
社区版块
存档分类
最新评论

深度构建用户画像|数据标签,关联分析,RFM,用户体系

阅读更多

无论是提供商品还是服务,用户画像都是数据挖掘工作的重要一环。一个准确和完整的用户画像甚至可以说是许多互联网公司赖以生存的宝贵财富。我们也已经听过了无数用户画像的神奇功能和成功案例,比如亚马逊,淘宝的机器学习团队使用用户的浏览行为,购物车状态和购买记录开发关联推荐系统,使点击率和销量大幅提升;比如应用市场根据过往APP安装记录记对每个使用者进行精准推荐;再比如音乐,图书和新闻网站通过协同过滤的方式为用户呈现个性化的定制内容。

对于消费品公司而言,虽说用户行为数据的丰富程度和互联网产品相比稍显逊色,但也拥有庞大的用户信息和交易数据沉淀散落在各个IT系统中,而且更真实,噪音更少。只不过在传统消费品公司里会编程,会处理数据的人要比互联网公司少太多太多。在我们深入了解了这些用户信息和交易数据,并对它们进行了清洗,汇总,打通之后,发现数据质量要比我们想象的好很多,可以支撑许多有意思的用户画像的建立。在这里我会分享一些画像的流程和思路,供大家参考。

1、数据标签化

用户画像的底层是机器学习,那么无论是要做客户分群还是精准营销,都先要将用户数据进行规整处理,转化为相同维度的特征向量,诸多华丽的算法才可以有用武之地,像是聚类,回归,关联,各种分类器等等。对于结构化数据而言,特征提取工作往往都是从给数据打标签开始的,比如购买渠道,消费频率,年龄性别,家庭状况等等。好的特征标签的选择可以使对用户刻画变得更丰富,也能提升机器学习算法的效果(准确度,收敛速度等)。

我们在项目中根据不同维度提取了数十个多个标签,图7展示了其中的一部分。这些标签主要有三个来源:

一个类是在IT系统中可以取得的信息,比如办会员卡时留下的信息(性别,年龄,生日),购买渠道,积分情况等;

第二类是可以通过计算或是统计所获得的,比如用户对某类促销活动的参与程度,对某种颜色/款式商品的偏好程度,是否进行过跨品牌的购买等;

第三类则是通过推测所得,比如送货地址中出现“宿舍”,“学校”,“大学”等字样,则用户身份可以推测为学生,出现“腾讯大厦”,“科技园”等信息时,则可判断是上班族,并有很大概率是技术从业者。

在标签的设计上也带有较强的行业性,比如是否偏好购买当季爆款或是新品多于经典款(时尚度);是否更倾向购买低价或打折商品(价格敏感度);是否喜欢购买高价商品或限量版(反向价格敏感度)。

深度构建用户画像|数据标签,关联分析,RFM,用户体系

对于已经打好的标签,根据不同的分析场景进行离散化,或将分类类型的标签拆成多个0/1标签,就可以进行一些机器学习的建模了,比如聚类,分类,预测,或者关联性分析,最终生成的向量维度在数千个。

2、关联性分析

关联性分析(Association rule learning)是在零售行业中应用最广泛的一种机器学习方法,营销学里经典的“啤酒/尿布”(超市里购买尿布的消费者往往同时购买啤酒)案例也已经是家喻户晓。虽然后来被证实这是一个为了教学目的而虚构出来的案例,但从其上镜率也可以看得出关联性分析在零售领域的重要程度,或许这个例子在国内改成“泡面/火腿肠”会更亲切。

关联性分析的相关文章有非常多,支持度(Support),置信度(Confidence)和增益(Lift)这些基本概念的介绍在这里就不赘述了,各位如果有兴趣可以参见Wikipedia的 Association rule learning 页面。

和购物篮关联规则不同,我们数据挖掘过程中的基本单位是用户,而特征向量则是基于提取出的用户标签而构建的,下表是一个简单的示例。

第一个例子

深度构建用户画像|数据标签,关联分析,RFM,用户体系

我们获得了一个NxM的特征矩阵,N为用户数,量级在百万级,M为特征维度,约数千个的二元标签。基于这个特征矩阵我们使用了最基础的Apriori算法计算相关度,并在支持度,置信度和增益三个层面设置threshold,输出符合要求的关联规则。

由于输出的关联规则可能涉及到客户隐私,在这里仅做一个示例。下表中的前项(antecedent)为用户的所在地,后项(consequent)为最高的活动敏感度, 结果如下:

深度构建用户画像|数据标签,关联分析,RFM,用户体系

可见上以及江浙地区对于促销活动的敏感度和参与度是最高的,增益均高于两倍,而上海则是达到了3.3倍之多。

第二个例子

另一个例子是颜色的关联规则,下表展示了用户对于不同颜色的产品以及SKU之间的偏好特征,可见某些用户是有较强的颜色偏向的,比如金色和银色之间,咖啡色和绿色之间等等。如果运用到商业实践,因为在买过紫色和杏色的用户中,接下来会比较会买金色;把这些数据给到地面团队或者线上团队,这时候推荐颜色以及配货就比较轻松一些。

深度构建用户画像|数据标签,关联分析,RFM,用户体系

值得注意的是,做关联分析时要确保前后项以及的独立性(independence)。由于在提取特征时有些维度本身就是从相同或相关的字段提取出来的,比如用户的星座以及出生月份,如果不做控制的话就会得出“11月出生的天蝎座特别多”这样让人啼笑皆非的规则。

3、RFM Model

RFM模型是用户价值研究中的经典模型,基于近度(Recency),频度(Frequency)和额度(Monetory)这3个指标对用户进行聚类, 找出具有潜在价值的用户, 从而辅助商业决策,提高营销效率。如果对RFM模型的细节感兴趣可以参见Wikipedia中有关 RFM模型的页面。

RFM建模所需要的数据源是相对简单的,只用到了购买记录中的时间和金额这两个字段。我们基于交易数据中用户的最后一次的购买时间,购买的次数以和频率,以及平均/总消费额对每个用户计算了三个维度的标准分。然后我们对于三个维度赋予了不同的权重,再基于加权后的分值应用K-Means进行聚类,根据每种人群三个维度与平均值之间的高低关系,确定哪些是需要保持用户,哪些是需要挽留的用户,哪些是需要发展的用户等。

在将这些客户圈出之后,便可以对不同客户群使用不同针对性地营销策略(引导,唤醒等),提高复购率与转化率。值得注意的是,三个维度的权重制定并没有统一的标准,比较通用的方法是用层次分析法(AHP),再结合行业以及具体公司的特点进行优化。

图8是通过RFM模型进行用户聚类后的结果,可以清楚看到几个人群用户的数量以及比例。同时这些分群也会作为标签重新输入至用户画像以及CRM当中,作为圈定特定用户群以及营销的入口。

深度构建用户画像|数据标签,关联分析,RFM,用户体系

图9展示了用户群之间在各个维度上的分布。消费,金额,频率这些模型直接相关的标签上自然有非常显著的差异,同时在一些垂直(orthogonal)的特征维度上也有很大的不同。

深度构建用户画像|数据标签,关联分析,RFM,用户体系

4、用户体系

最后,对消费品公司而言,所有在数据挖掘和用户画像方面的投入,根本目的还是要提升业务表现,所以如何将数据挖掘的结果进行落地就变成了尤为关键的一环。对于用户画像所输出的所有标签和关联规则,都需要通过某种渠道抵达用户群。

这种渠道可以是一个强大的CRM系统,可以通过不同的标签圈定用户群,定向发布营销方案;也可以是一个会员客户端,推送个性化的打折券或新品推荐;甚至是自营电商,实现像天猫京东一样的数据自生产和自消费的循环。

分享到:
评论

相关推荐

    Python实现电子产品销售数据分析及RFM用户价值分析.rar

    Python中的Pandas库是处理这类数据的利器,它提供了高效的数据结构DataFrame,可以方便地读取、清洗、操作和分析数据。 在数据预处理阶段,我们需要对数据进行清洗,例如处理缺失值、异常值,统一数据格式,可能还...

    【代码分享】手把手教你:基于RFM的用户画像可视化系统

    在本项目中,我们将深入探讨如何使用Python技术栈构建一个基于RFM(Recency, Frequency, Monetary)模型的用户画像可视化系统。RFM模型是一种在市场营销中广泛使用的工具,用于评估客户价值和行为频率,帮助我们更好...

    人工智能-项目实践-用户画像-百货商场用户画像与会员价值分析.zip

    在本项目实践中,我们聚焦于“人工智能”在“百货商场”的应用,具体是通过构建“用户画像”来实现“会员价值分析”。用户画像是一种数据驱动的用户行为模型,旨在更深入地理解消费者,从而为商场的运营决策提供有力...

    RFM分析数据集.rar

    在"RFM分析数据集.rar"中,包含两个文件:"rfm.csv"和"RFM分析数据_readme.md"。"rfm.csv"很可能是一个包含客户交易记录的数据表,而"RFM分析数据_readme.md"则可能是对数据集的详细说明,包括数据来源、字段含义、...

    1-CSSCI 北大核心-基于改进RFM聚类的高校图书馆用户画像研究.pdf

    在用户画像构建过程中,文章使用高校图书馆的实际读者数据,通过对RFM指标的分析和两步聚类,描绘出不同读者群体的特征。这些用户画像不仅包含基本的用户信息,还可能包括阅读习惯、学科偏好、借阅偏好等,为图书馆...

    标签口径及数据调研分析——RFM用户价值(流失与活跃).xlsx

    标签口径及数据调研分析——RFM用户价值(流失与活跃).xlsx

    用户画像及其应用项目规划说明书.pdf

    标签体系是构建用户画像的基础,它由一系列描述用户特性的标签组成,如人口属性、行为属性、消费习惯、兴趣偏好等。通过对这些标签的分析和配置,企业可以深入了解用户,制定更有效的运营策略。例如,人口属性标签...

    RFM模型分析及原模型

    在提供的"RFM模型(原始数据聚类).xml"文件中,很可能包含了原始的RFM数据,通过导入到SPSS中,我们可以进行数据的清洗、转换、聚类分析等一系列操作,最终得出有价值的客户群体划分。 通过RFM模型分析,企业不仅...

    数据分析-RFM模型用户分析.pdf

    RFM模型是数据分析领域中一个经典的用户细分工具,主要用于客户关系管理(CRM)和市场营销策略。该模型由三个关键指标组成:最近一次消费(Recency)、消费频率(Frequency)和消费金额(Monetary),这三个英文首...

    美团外卖的用户画像实践

    美团外卖作为中国领先的在线外卖订餐平台,通过其丰富的用户数据构建了详细的用户画像,为营销策略提供了数据支持。 在大数据环境下,用户画像的构建和应用面临新的挑战。大数据的四个V特征——Volume(大量)、...

    Python库 | adafruit-circuitpython-rfm9x-1.1.1.tar.gz

    **Python库adafruit-circuitpython-rfm9x详解** 标题中的"adafruit-circuitpython-rfm9x-1.1.1.tar.gz"是一个针对Python的开源库,用于与RFM9x系列无线射频模块进行通信。这个库是CircuitPython的一个扩展,...

    PyPI 官网下载 | adafruit-circuitpython-rfm9x-2.1.4.tar.gz

    通过adafruit-circuitpython-rfm9x库,开发者可以轻松地控制这些芯片,实现数据的发送和接收,构建无线传感器网络或远程控制系统。 库的版本号2.1.4表示这是该库的第2.1次大版本更新后的第4个小版本迭代,通常意味...

    基于Spark+Hive实现用户画像分析系统(含价值度、忠诚度、流失预警、活跃度等分析模型).zip

    总结,Spark+Hive构建的用户画像分析系统,结合强大的数据处理能力和高效的分析模型,为企业提供深度洞察用户行为的能力,从而实现精准营销和优化决策。通过实际项目的学习和实践,不仅能加深对大数据技术的理解,也...

    用户画像的原理、模型和应用.pdf

    用户画像的原理包括数据收集、数据清洗和整理、特征提取、数据分析和建模、用户分群和画像构建、用户画像的可视化和应用等几个步骤。 用户画像的方法论和模型有多种,包括RFM模型、聚类分析、关联规则挖掘、预测...

    SPSS-RFM分析建模操作手册与数据

    做RFM分析的时候要知道RFM分析的数据格式有两种:  一种是交易数据,也就是每次交易占用一行,关键变量是客户ID、交易日期和交易金额;  另一种是客户数据,就是每个客户占用一行,关键变量是客户ID、交易金额、...

    数据挖掘应用案例:RFM模型分析与客户细分

    最近正好刚帮某电信行业完成一个数据挖掘工作,其中的RFM模型还是有一定代表性,就再把数据挖掘RFM模型的建模思路细节与大家分享一下吧!手机充值业务是一项主要电信业务形式,客户的充值行为记录正好满足RFM模型的...

    数据分析—用户行为分析.pdf

    用户行为分析的核心是对用户在网站上的活动进行深度追踪和解析,包括他们的来源、他们在网站上的行为路径、他们在不同页面的停留时间、购买转化率等。 首先,用户行为分析定义了对用户购物路径日志信息的统计和分析...

    基于K-Means聚类与RFM模型分析顾客消费情况【500010102】

    实现基于Python K-Means聚类与RFM模型分析顾客消费情况 1、数据处理 1.1、Python库导入 ...2.5、基于聚类分析构建用户画像 2.5.1、数据处理 2.5.2、确定聚类数 2.5.3、五类消费者对比 2.6、RFM模型

    数据集《使用机器学习进行客户终身价值和RFM模型分析》

    数据集《使用机器学习进行客户终身价值和RFM模型分析》是针对企业客户管理与用户运营的一个重要资源,它结合了数据分析和机器学习技术,帮助企业和分析师更好地理解并预测客户的消费行为,从而优化营销策略,提升...

    用户数据分析方法与应用案例.pdf

    文档提到了一些用于分析数据维度的方法,比如RFM模型(最近一次购买时间(Recency)、购买频率(Frequency)、购买金额(Monetary))和对应分析(分析用户的属性与行为之间的对应关系)。这些方法可以帮助企业对...

Global site tag (gtag.js) - Google Analytics