如何了解用户需求?根据用户是否主动参与分为显式与隐式两种挖掘模式,因为显式的动静比较大,有很大局限性,所以为了保证结果准确性以及提高用户接受度,一般都采用隐式。
用户的日常交互行为会产生四类关键数据:鼠标移动轨迹、链接点击分布、页面浏览流、页面停留时间。通过用户的行为能反映用户的观点,同时利用访问的网页次序可以找出网页之间的隐性关系。
收集数据
- Web服务器的日志(用户会话记录)
-
Web trends或类似的第三方共享软件(客户端分析,流量分析,可用性分析)
- 自己开发的第三方软件/插件(需求自定义)
大型网站通常会把以上三种方法组合应用,大致原理就是给进入网站的用户赋予身份识别,每次产生交互动作就向服务器发回请求,通过时间和页面判断连接各个请求点并且记录下来。(算法不讨论)
过滤数据
- 明确目标,定义核心数据。
- 界定用户行为,利用多数人的行为来消除个人行为的主观性。
- 对用户进行归类,确定数据类别。
大型网站每天所产生的数据量是惊人的,所以常规需求一般都是定时或定量的分析。另外,额外的数据处理会减慢网站的速度,搜集的数据越多,潜在的负面影响越大。
习惯分析
- 对用户浏览过的页面进行内容分析,根据信息主题对页面进行聚类。
- 聚类过程中除了考虑页面内容相近程度,还应该考虑页面路径。
- 把用户浏览行为对其兴趣的作用列入聚类结果,得到综合评估模型。
用户兴趣分偶然和稳定两种情况,其中偶然可以认为是随机变化的,稳定的挖掘又有基于内容和行为两种方式,在内容上表现有重复度、相似度等,在行为上表现有停留时长、点此次数、拉动滚动条次数等。
实际案例
类似系统、浏览器、分辨率的客户端分析,常见而且简单,略过。
关于鼠标轨迹、点击分布的可用性例子:
- 跟踪用户在进行检索时的鼠标移动轨迹,可以获取用户操作的先后顺序、热点功能、动作曲线等一手数据,这些都是改善或简化表单的重要参考。
- 在重要的页面进行详细的点击分布监控统计,主要检查信息呈现的易用性,看看有没有偏离设计初衷,经常更新,找到规律。
处理特定用户行为、用户群、用户来路的任务流例子:
- 监控分布式注册流程,能够看到有多少用户填了表单、填完了表单,或者在某个步骤有异常流失。
- 监控不同模块入口过来的注册用户,能够统计出各模块导入的有效注册量、百分比、成功率,以便合理调配资源。
- 监控投放广告过来的注册量、注册成功率、转换付费用户成功率,以便明确广告的投入产出比。
- 监控用户的纵深浏览行为,是测试导航可用性很好的办法,也就是说用户会不会在你的网站内迷路?
结束
再次强调,这里的讨论仅限于后期研究的隐式挖掘,就是不去惊动用户,不让用户察觉的方法,完全通过技术手段拿到我们想知道的数据,再通过理论分析来改进产品。
之前在某上市公司全程参与了类似系统的开发,最艰难的部
来源:http://ucdchina.com/blog/?p=12
分享到:
相关推荐
校园中隐式用户行为数据挖掘研究 校园中隐式用户行为数据挖掘研究是指在校园环境中,通过数据挖掘技术挖掘和分析学生的隐式行为数据,以了解学生的需求和行为习惯,并为教育管理者和研究者提供决策支持和数据分析...
##### 隐式挖掘网站用户行为 这一段落讨论了如何通过数据分析等手段来挖掘用户的行为模式。通过对用户数据的分析,设计师可以发现用户行为背后的规律,从而改进产品设计,提高用户体验。 ##### 角色设定——了解...
隐式反馈指的是用户被动的行为,如点击了哪些结果,这些反馈虽然间接,但数量庞大,对于分析用户行为具有重要作用。 用户行为的载体包括查询与点击日志、互联网访问日志。这些日志记录了用户提交的查询、点击结果...
- **重要性**:隐式评价对象的存在使得意见挖掘更加复杂,但同时也更加真实地反映了用户的实际感受。 #### 4. 国内外研究现状 - **评论数据的增长**:随着电子商务的快速发展,用户产生的评论数据量日益庞大。 - *...
数据挖掘技术在推荐系统中的应用是一个关键领域,它旨在通过分析大量用户行为和关系数据,为用户提供个性化且精准的信息推荐。陈运文博士指出,数据挖掘不仅局限于传统的报表和数据分析,而是更注重在实际应用中创造...
通过对比实际用户行为和推荐结果,我们可以评估推荐系统的精确度、召回率、F1分数等指标,不断迭代和优化算法。同时,通过对评分数据的深入挖掘,还可以发现用户对不同类型书籍的评价趋势,帮助构建更加多元化的推荐...
协同过滤算法基于用户的历史行为数据,通过用户行为模式间的相似性来预测用户偏好,进而生成推荐。用户行为数据分为显式反馈(如评分、评论)和隐式反馈(如购买、点击)两种类型。 显式反馈数据通常用于评分预测和...
4. 用户兴趣建模:利用机器学习算法(如协同过滤、深度学习等)分析用户行为,挖掘其兴趣偏好。 5. 推荐策略:结合时间上下文模型和用户兴趣模型,生成个性化的节目推荐列表。 6. 反馈循环:根据用户对推荐结果的...
推荐系统是数据挖掘中的一个重要应用,书中介绍了“你喜欢的东西我也喜欢”的概念,这是基于用户行为的历史数据,通过计算相似性来预测用户可能感兴趣的新内容。书中提到了使用Python代码来表示和处理数据,特别是...
隐式 HTML 数据挖掘关注的是从用户行为中提取有用信息,如浏览历史、点击流等,这对于个性化推荐和广告定位非常重要。 #### 4.2 技术要点 - **用户行为分析**:通过分析用户的浏览习惯,了解其兴趣偏好。 - **个性...
Web数据挖掘是随着互联网技术发展而产生的一个重要领域,它结合了数据挖掘技术与Web技术,以发现用户访问...Web数据挖掘技术的掌握和应用对于处理大规模的网络数据、分析用户行为、提升网站服务质量都具有重要的意义。
在高校图书馆的应用场景中,传统的推荐算法存在数据稀疏和冷启动问题,即在用户行为数据不足或新用户注册时无法准确推荐。为了解决这些问题,并提高推荐服务的准确性,本文提出了基于数据挖掘技术的图书推荐算法。 ...
实验结果显示,所提出的推荐模型相对于其他面向隐式反馈的模型,表现出更优的推荐效果,并且在处理用户行为特征时具有良好的泛化能力。 【深度学习在推荐系统中的应用】 深度学习在推荐系统中的应用日益广泛,它...
例如,通过用户行为分析,找出不同媒体资源之间的潜在关联。 3. **数据挖掘技术**:数据挖掘是提取有价值信息的过程,可能包括聚类、分类、关联规则学习等方法。在这里,可能是为了找出多媒体资源的共性特征或模式...