`

用户行为日志

阅读更多
1、用户行为日志
     起点R3电子商务搜索引擎演示系统中记录的用户行为数据主要包括四大类
 搜索历史
搜索历史的记录主要包括用户信息、时间、地址、检索的关键词,检索关键词拼音及缩写,用户年纪等,其中,记录的时间包括检索发生时的小时、当天是周几、当天的日期信息;地址信息包括了省市区县信息。
 点击历史
点击历史记录了当前点击记录的用户信息、时间、地址、检索词、点击记录的序号、点击记录的ID,其中,记录的时间包括检索发生时的小时、当天是周几、当天的日期信息;记录了该产品是在搜索结果中点击的还是推荐结果中点击的;地址信息包括了省市区县信息。
 购买历史
购买历史分类已付款和未付款,并记录的有付款时间和订单时间。统计还记录了用户信息、时间、地址、检索词、点击记录的序号、购买记录的ID,并且统计了在查看了该记录多少次以后购买的,也记录了该产品是在搜索结果中点击的还是推荐结果中点击的,其中,记录的时间包括检索发生时的小时、当天是周几、当天的日期信息;地址信息包括了省市区县信息。
 浏览数据历史
浏览数据是用户在查看产品信息的浏览记录,一次点击查看的页面会记录多条浏览数据,该记录是采样数据,采集的频率是10秒一次,记录了用户信息、时间、地址、检索词、产品ID、当前鼠标浏览位置、当前页面焦点位置、当前页面滚动次数、距离上一次滚动时间等信息。
2、推荐引擎
起点R3电子商务搜索智能推荐引擎是基于以上历史记录的数据分析与挖掘。主要推荐类型分为四种:
 直接推荐
     直接推荐是最简单的一种推荐方式,比如,根据用户的检索词向推荐用户与该检索词高度相关的产品信息,推荐列表的排序方式可以是按照销售量排序、浏览量或其他方式排序。
 交叉推荐
    交叉推荐是稍复杂一些的一种推荐方式,比如:购买该商品的用户还购买了那些商品、浏览该商品的用户还浏览了那些商品,推荐列表的排序方式可以是按照销售量排序、浏览量或其他方式排序。
 区域性和时间段推荐
    区域性推荐是在以上两种推荐的基础之上扩展的一种推荐,比如,上海地区的购买了该商品的用户还购买了那些商品;上海地区在周六日购买了该商品的用户还购买了那些商品;上海地区的用户在下午5点-8点间购买了该商品的用户还购买了那些商品。
 商品属性相关推荐
    商品属性相关推荐是针对用户购买记录或浏览记录进行分析以后的一种推荐方式,是一种简单计算,比如,对用户购买或浏览记录进行Facet统计以后得出该用户主要注意力在B罩杯的内衣,那么对用户推荐的列表中只包含B罩杯的商品;另一类:比如用户浏览的内衣70%以上都是性感类型的,推荐引擎在对该用户进行推荐的时候,则只推荐性感类型的内衣、内裤。
起点R3还可以根据用户的购买行为来分析用户的社会化属性,比如区分喜好性感类型的用户群和喜好文静型的用户群,并可以针对不同的用户群计算不同的推荐列表用于发送邮件列表。
3、用户访问数据分析
    用户访问数据分析主要是对用户操作历史记录的数据进行数据挖掘和分析,主要包括四类:
 社会化属性
    社会化属性分析主要包括分析用户类型、用户的使用偏好、用户的购买习惯、消费习惯、消费能力以及评论或商品的销售数据对用户的影响等数据的分析。
 区域性分析
    区域性分析是对地区数据进行分析,以确定该地区的用户购买习惯、消费能力、消费习惯、以及用户年龄分布等。
 时间周期特性分析
    时间周期分布主要是和以上两类综合统计,比如用于计算周六周日以及特殊节假日的推荐列表等。
 商品和商品组合分析
    该分析主要是统计商品的购买特点,比如,通常用户浏览了多少次以后会购买该商品,那些商品会在短期内(2小时)同时购买,以及商品和地区区域、时间周期的组合分析等。
4、用户行为对搜索结果的影响
    用户行为对搜索结果的影响主要体现在排序和推荐列表中,在对搜索结果的排序中,购买量是一个排序参数,可以直接使用商品购买数量对搜索结果排序。此外,可用的排序参数还包括商品购买浏览量、商品点击量、商品浏览时长等指标。用户行为对推荐列表的影响就更为直接了,交叉推荐、区域性和时间段推荐以及商品属性相关推荐都是以用户购买数据和浏览数据为基础进行的。

表 1 用户行为和用户偏好
用户行为 类型 特征 作用
评分 显式
整数量化的偏好,可能的取值是 [0, n];n 一般取值为 5 或者是 10 通过用户对物品的评分,可以精确的得到用户的偏好
投票 显式 布尔量化的偏好,取值是 0 或 1 通过用户对物品的投票,可以较精确的得到用户的偏好
转发 显式 布尔量化的偏好,取值是 0 或 1 通过用户对物品的投票,可以精确的得到用户的偏好。
如果是站内,同时可以推理得到被转发人的偏好(不精确)
保存书签 显示 布尔量化的偏好,取值是 0 或 1 通过用户对物品的投票,可以精确的得到用户的偏好。
标记标签
(Tag) 显示 一些单词,需要对单词进行分析,得到偏好 通过分析用户的标签,可以得到用户对项目的理解,同时可以分析出用户的情感:喜欢还是讨厌
评论 显示 一段文字,需要进行文本分析,得到偏好 通过分析用户的评论,可以得到用户的情感:喜欢还是讨厌
点击流
( 查看 ) 隐式 一组用户的点击,用户对物品感兴趣,需要进行分析,得到偏好 用户的点击一定程度上反映了用户的注意力,所以它也可以从一定程度上反映用户的喜好。
页面停留时间 隐式 一组时间信息,噪音大,需要进行去噪,分析,得到偏好 用户的页面停留时间一定程度上反映了用户的注意力和喜好,但噪音偏大,不好利用。
购买 隐式 布尔量化的偏好,取值是 0 或 1 用户的购买是很明确的说明这个项目它感兴趣。
分享到:
评论
1 楼 poson 2012-03-12  
写的挺全面

相关推荐

    互联网用户行为日志数据集.rar

    标题中的“互联网用户行为日志数据集.rar”表明这是一个关于互联网用户行为的大型数据集,以RAR压缩格式存储。RAR是一种流行的压缩格式,用于减少文件大小以便于存储和传输。通常,这种数据集包含了大量用户的在线...

    SparkSQL日志分析用户行为日志

    以慕课网日志分析为例 进入大数据 Spark SQL 的世界用户行为日志加浏览器用户行为日志

    基于标签的用户行为日志大数据分析系统完整python源码+数据库SQL+数据+文档说明.zip

    基于标签的用户日志分析系统 架构 实时etl: mock Kafka uploader -> Kafka -> Flink -> Kudu。实时处理日志数据流,生成事件和用户属性 event: 用户事件 profile: 用户属性 离线标签: (Parquet, Kudu) -> Spark -> ...

    基于标签的用户行为日志大数据分析系统源码+项目说明.zip

    基于标签的用户行为日志大数据分析系统源码+项目说明.zip基于标签的用户行为日志大数据分析系统源码+项目说明.zip基于标签的用户行为日志大数据分析系统源码+项目说明.zip基于标签的用户行为日志大数据分析系统源码+...

    (源码)基于Flink和Kafka的实时用户行为日志分析系统.zip

    # 基于Flink和Kafka的实时用户行为日志分析系统 ## 项目简介 本项目是一个基于Apache Flink和Kafka的实时用户行为日志分析系统。系统主要用于分析论坛平台产生的用户点击日志,通过Flume收集日志并推送到Kafka,...

    大数据的电信用户行为日志数据

    在大数据领域,电信用户行为日志数据是一种非常关键的数据源,它可以帮助我们深入了解用户的通信习惯、消费模式以及网络使用偏好。这份"大数据的电信用户行为日志数据"资源提供了宝贵的洞察力,尤其对于进行大数据...

    基于标签的用户行为日志大数据分析系统

    【作品名称】:基于标签的用户行为日志大数据分析系统 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【项目介绍】: 实时etl: mock...

    基于hadoop的离线用户行为分析(日志处理).zip

    综上所述,基于Hadoop的离线用户行为分析首先需要收集用户行为日志,这些日志可能包含用户的点击流、浏览时间、购买行为等信息。然后,通过Hadoop的HDFS将日志数据分布式存储,利用MapReduce或更现代的处理引擎如...

    IPTV集成播控平台用户行为日志规范文件.pdf

    《IPTV集成播控平台用户行为日志规范文件》是针对IPTV省市级播控平台用户行为记录的一种详细规范,旨在规范日志数据的生成、存储和传输,以便于与第三方BOSS系统或数据分析系统进行有效对接。文档内容涵盖了日志文件...

    基于Scala的标签的用户行为日志大数据分析系统源码+全部资料齐全.zip

    基于Scala的标签的用户行为日志大数据分析系统源码+全部资料齐全.zip基于Scala的标签的用户行为日志大数据分析系统源码+全部资料齐全.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分...

    基于标签的用户行为日志大数据分析系统完整源码+sql数据库+数据+项目说明.zip

    基于标签的用户行为日志大数据分析系统完整源码+sql数据库+数据+项目说明.zip 【项目部署】 首先修改src/main/resources/application.conf里的配置 以下脚本可以在开发机上使用 script/deploy.py: 部署工程到集群...

    模拟行为日志数据的生成

    7. **应用场景**:模拟行为日志数据广泛应用于广告推荐系统、用户行为分析、网络安全分析、系统性能测试等多个领域。 综上所述,模拟行为日志数据的生成是一项复杂且重要的任务,涉及多个领域的知识,包括概率统计...

    兼容神策SDK埋点的用户行为分析日志采集源码

    1. **Nginx**:作为一个高性能的反向代理服务器,Nginx用于接收前端应用发送的用户行为日志。通过配置Nginx,可以设置合适的路由规则,将日志数据转发到Flume,同时确保系统的高并发处理能力和稳定性。 2. **Flume*...

    行为日志采集kafka接入数据格式(终端、web,手机端)(1)(1).docx

    行为日志采集 Kafka 接入数据格式 _behavior 日志采集是指在客户端或服务器端采集用户行为数据,以便进行数据分析和应用优化。Kafka 是一个流行的分布式流媒体平台,常用于构建实时数据处理系统。在本文中,我们将...

    基于大数据技术的用户日志数据分析及可视化平台搭建项目代码及数据集

    在当前的数字化时代,大数据技术已经成为了各行各业的重要工具,尤其在用户行为分析、市场洞察以及业务决策支持等方面发挥着至关重要的作用。本项目名为“基于大数据技术的用户日志数据分析及可视化平台搭建”,旨在...

    基于UEBA的用户上网异常行为分析的数据集

    它结合了大数据、机器学习以及人工智能,对网络环境中的用户行为进行深入理解和监控,以此来识别不寻常的、可能具有恶意的活动。 在“基于UEBA的用户上网异常行为分析的数据集”中,我们可以深入探讨以下几个关键...

    基于spark及用户行为标签的日志大数据分析系统.zip

    本项目聚焦于构建一个基于Spark的用户行为日志大数据分析系统,旨在通过处理海量的用户行为数据,提取有价值的用户标签,从而支持业务决策和优化。以下将详细介绍该系统的构建原理、技术栈以及实现过程。 一、系统...

    用户行为分析

    在技术层面,用户行为分析通常需要收集大量的用户行为日志数据,然后利用数据挖掘、大数据分析技术等方法,对数据进行清洗、整理、分析,从中挖掘出有价值的信息。例如,通过分析用户在网站上点击、浏览、停留时间等...

    计算机课程毕设:基于spark及用户行为标签的日志大数据分析系统.zip

    该项目是针对计算机科学与技术专业学生的毕业设计或课程设计,主要目标是构建一个基于Spark的大数据分析系统,用于处理用户行为日志。Spark作为一个强大的分布式计算框架,被广泛应用于大数据处理领域,尤其在实时...

Global site tag (gtag.js) - Google Analytics