现在需要做一个关于推荐算法的效果统计报表。产品希望知道算法在每个相关指标的效果如何,比如点击率,注册率。另外,算法工程师想知道算法的预估的效果和最终效果的差异有多大,比如预估的点击率和实际点击率的差异。
来看看我们的思路:首先,延续我们做业务统计的经验,投放效果的公式很容易得到;另外,算法工程师在日志里给出了每次算法的预估效果。
产品经理 | 算法工程师 | |
需求 | 算法的效果 | 算法预估效果与算法真实效果的差异 |
计划 |
使用业务统计的效果公式计算算法效果。
|
1.使用业务统计的效果公式计算算法效果 2.利用日志中的算法预估效果 |
我们的第一版统计很快就出来了:点击率=总点击量/总展现量;预估点击率=总的预估点击量/总展现量。注册率=总注册量/总点击量;预估注册率=总的预估注册量/总的预估点击量=(点击后的预估注册量+展现后的预估注册量)/总的预估点击量。产品经理和算法工程师也很快的反馈了意见。
产品经理 | 算法工程师 | |
反馈 | 并非所有的展现都被算法处理过。 | 展示出来的结果不符合预期 |
修改方案 |
调整公式为算法处理过的点击和展示。 SUM(IF(e_ctr>0,click_num,0))/SUM(IF(e_ctr>0,show_num,0))
*e_ctr是算法预估的点击率。有这个值代表算法处理过。 |
1.点击率的预估公式调整为 SUM(IF(e_ctr>0,show_num*e_ctr,0))/SUM(IF(e_ctr>0,show_num,0)) 2.预估注册量修改定义为算法干预过,且点击过的注册量 SUM(IF(e_ctr>0 AND CtoR>0,click_num*CtoR,0)) 3.实际注册量修改为算法干预过,且点击过的注册量 SUM(IF(e_ctr>0 AND CtoR>0 AND click_num>0,reg_num,0))
*CtoR表示算法预估的点击导致注册的预估率 |
如此修改的目的:
- 简化公式,让使用者可以看到最终一环的效果。
- 明确的文案定义,防止歧义解释。
- 算法预估的结果连续使用,将导致预估值非常小,失去意义,应该避免。
- 统计逻辑简单化,方便核对
统计报表不应该有太复杂的逻辑,查找问题的链条会变得非常长。文案的解释应当明确,尤其是作为描述较复杂的业务的报表。 业务逻辑复杂的情况下,应该层层环节用独立的报表来描述,避免数据使用者的疑惑和降低数据问题查找的困难度。
相关推荐
《成绩统计程序——算法与数据结构设计报告》 在信息技术领域,程序设计是核心技能之一,而算法与数据结构的设计则是程序设计的基础。本报告针对一个C++编写的“成绩统计程序”,深入探讨了其中涉及的算法和数据...
案例库中的每个案例都包含了特定领域应用的数据挖掘算法和相关信息,通过面向对象的方法对案例进行表示。 模糊商空间(Fuzzy Quotient Space Model)被用来描述案例库的组织结构,从而为案例检索提供了一种有效的...
它主要面向那些希望通过具体实例学习和提升MATLAB算法运用能力的学生和专业人士。书中的每个案例都结合了学校的实际教学场景,也就是"学校算法"(SBO),涵盖了MATLAB软件的各种功能和插件的使用。 MATLAB,全称...
5. 数据挖掘中分类模型的构造方法包括多种,例如:决策树方法、统计方法、机器学习方法、神经网络方法、类比学习方法、遗传算法、粗糙集方法、模糊集方法、基于案例的推理方法等。 6. 文中特别提到了三种主流数据...
学生不仅需要学习数据的基本统计、相似性度量、数据预处理、分类、关联分析、聚类、离群点检测等基础知识,还需要具备应用各种数据挖掘经典算法的实际能力。先修课程通常包括数据库原理、程序设计和数据结构等。 在...
R语言是一种开源的、面向统计编程语言,它提供了丰富的数据挖掘和分析功能,适用于各种统计计算和数据可视化。R语言在数据挖掘领域受到青睐,原因在于其免费、开放源代码和算法更新速度快等优点。此外,R语言的社区...
本案例集着重探讨了如何利用MATLAB的图像处理工具箱和统计功能进行图像数据的分析和处理,旨在帮助用户理解并掌握相关技术。 首先,MATLAB是一个面向数值计算、符号计算和数据可视化的高级编程环境。它的图像处理...
综上所述,这份“机器学习算法课件”是一套结合了Python语言的实用机器学习工具和理论的综合教程,它面向希望学习Python数据分析和机器学习实战的学生和从业者。学习者通过掌握Numpy、Pandas、Matplotlib和Scikit-...
本书《面向数据科学的并行计算:R、C++和CUDA》通过大量的实例,展示了如何利用R进行高效的数据处理和统计分析工作。R语言的优势在于其丰富的统计方法库、易于使用的语法以及活跃的社区支持,这些特点使其成为数据...
数据挖掘介绍及数据挖掘项目案例举例 数据挖掘是指通过采用自动或半自动的手段,在海量数据中发现有意义的行为和规则的探测和分析活动。数据挖掘是一门科学,有科学的方法和模型作为基础,但同时数据挖掘又是一门...
**MIT 6.006** 是麻省理工学院(MIT)开设的一门面向计算机科学领域的本科生课程,主要介绍了算法设计与分析的基础知识。本课程通过一系列实用的案例研究和经典算法来探讨如何解决大规模输入问题,如处理整套莎士比亚...
文章通过引言、分级数据处理方法、统计数据分级算法模块三个部分详细介绍了统计专题地图分级数据处理模型的设计和实现,为专题地图的科学分级提供了新的思路和方法。模型的应用不仅提高了统计专题地图的制作效率和...
在Java中实现优化算法,我们可以利用其强大的数据结构和算法库,如Apache Commons Math,这是一个提供了各种数学和统计功能的开源库,其中包括优化模块。 在“jpop”代码中,开发者可能已经实现了常见的优化算法,...
2. **数组处理能力强**:Fortran支持多维数组,对于矩阵运算和大规模数据处理有天然优势。 3. **向量处理**:Fortran支持向量化操作,能够有效利用现代处理器的并行计算能力。 4. **编译型语言**:Fortran是编译型...
本竞赛面向全国高校学生,通过一系列实际案例分析,帮助参赛者掌握数据分析的基本方法和技术。 #### 二、核心知识点详解 ##### (一)PU-Bagging与Gini决策树在用户行为预测中的应用 **1. PU-Bagging简介** - **...
4. **统计与概率算法**:包括随机数生成、统计分布(如正态分布、泊松分布)的模拟、假设检验等,对于数据科学和机器学习非常重要。 5. **数值逼近与插值**:如线性插值、多项式插值(如拉格朗日插值、牛顿插值)、...
本文探讨了Matlab在《概率论与数理统计》这门课程中的应用,具体案例为高尔顿钉板实验。 首先,要明确《概率论与数理统计》是理工科本科生的一门重要基础数学课程。通过这门课程,学生能够理解概率论与数理统计的...