文章列表
最近想在数据挖掘领域做一些事情,以下为整理的相关应用模型,作为下一步工作的参考。
模型名称
模型类型
采用方法
应用方面
客户分群模型
描述性
聚类分析
客户分级
定向营销模型
预测性
分类回归分析
市场开拓
定向服务模型
描述性
关联分析
客户维护
客户流失模型
预测性
时间序列分析/神经元网络/决策树
客户维护
客户评分模型
描述性/预测性
关联分析/神经元网络
客户维护/市场开拓
欺诈检测模型
描述性
基于概率分布的检测方法
客户维护
利润分析模型
预测性
神经元网络
聚类分析 ...
搭建网络游戏企业数据平台(三)
- 博客分类:
- 数据中心
本章主要说下搭建网络游戏企业数据平台所存在的技术难点。总的来说,网络游戏的数据相较于银行/电信的数据,主要难点在于采集困难,变数大的问题。
数据采集难点
l 数据分散
网络游戏存在一个特定,存在大量的区组,各个区组可能部署在不同的机房;同时,现代网游都是分布式架构,即使同一个区组,也许数据也分布在不同的服务器中;更有一些特殊的内测服之类,也许架构和其他区组还不太一样。这种情况下,需要针对不同的数据采用不同的策略进行数据采集,采集系统及其复杂。
l 数据源模式复杂
由于网游开发不可能按照数据采集需求进行,所以采集程序必须适应游戏服务器数据访问模式。有些数据也许在数据库中,有些数据采
搭建网络游戏企业数据平台(二)
- 博客分类:
- 数据中心
本节谈下指标体系的搭建,即更详细说下要做什么。在有了人,有了机器后,就要开始考虑搭建一套针对网络游戏企业的指标体系了。指标体系的搭建是一个渐进的过程,不断在实践中完善。
指标体系分类
指标分类采用复合的模式,每个指标可能对应不同指标体系。根据每种指标体系的不同,可能直接影响到数据存储,ETL开发等技术层面事务,所以将这个部分提到前面来说。
依照指标反映内容分类
l 运营类指标
运营类指标指游戏在运营过程中产出的基本数值,主要用于监控游戏的营运状态是否符合预期,此类指标一般都为硬指标,即考核游戏是否运营正常的基本标杆。例如:保有率,流失率,实时在线等。
搭建网络游戏企业数据平台(一)
- 博客分类:
- 数据中心
接手就职公司数据平台事务已有数年,期间经历了多个游戏的开服拓展,看着平台一天一天的长大并趋向稳定。在这里对之前的工作进行一次总结回顾,期望能给有同样需求的同仁一些参考。
数据平台职责
对于一个软件 ...