`

面向算法效果的数据统计案例

 
阅读更多

        现在需要做一个关于推荐算法的效果统计报表。产品希望知道算法在每个相关指标的效果如何,比如点击率,注册率。另外,算法工程师想知道算法的预估的效果和最终效果的差异有多大,比如预估的点击率和实际点击率的差异。

        来看看我们的思路:首先,延续我们做业务统计的经验,投放效果的公式很容易得到;另外,算法工程师在日志里给出了每次算法的预估效果。

 
  产品经理 算法工程师
需求 算法的效果 算法预估效果与算法真实效果的差异
计划

使用业务统计的效果公式计算算法效果。

 

1.使用业务统计的效果公式计算算法效果

2.利用日志中的算法预估效果

 

        我们的第一版统计很快就出来了:点击率=总点击量/总展现量;预估点击率=总的预估点击量/总展现量。注册率=总注册量/总点击量;预估注册率=总的预估注册量/总的预估点击量=(点击后的预估注册量+展现后的预估注册量)/总的预估点击量。产品经理和算法工程师也很快的反馈了意见。

 
  产品经理 算法工程师
反馈 并非所有的展现都被算法处理过。 展示出来的结果不符合预期
修改方案

调整公式为算法处理过的点击和展示。

SUM(IF(e_ctr>0,click_num,0))/SUM(IF(e_ctr>0,show_num,0))

 

*e_ctr是算法预估的点击率。有这个值代表算法处理过。

1.点击率的预估公式调整为

 SUM(IF(e_ctr>0,show_num*e_ctr,0))/SUM(IF(e_ctr>0,show_num,0))

2.预估注册量修改定义为算法干预过,且点击过的注册量

SUM(IF(e_ctr>0 AND CtoR>0,click_num*CtoR,0))

3.实际注册量修改为算法干预过,且点击过的注册量

SUM(IF(e_ctr>0 AND CtoR>0 AND click_num>0,reg_num,0))

 

*CtoR表示算法预估的点击导致注册的预估率

 

         如此修改的目的:

  1. 简化公式,让使用者可以看到最终一环的效果。
  2. 明确的文案定义,防止歧义解释。
  3. 算法预估的结果连续使用,将导致预估值非常小,失去意义,应该避免
  4. 统计逻辑简单化,方便核对

         统计报表不应该有太复杂的逻辑,查找问题的链条会变得非常长。文案的解释应当明确,尤其是作为描述较复杂的业务的报表。 业务逻辑复杂的情况下,应该层层环节用独立的报表来描述,避免数据使用者的疑惑和降低数据问题查找的困难度。  

 

分享到:
评论

相关推荐

    成绩统计程序(算法与数据结构设计报告)

    《成绩统计程序——算法与数据结构设计报告》 在信息技术领域,程序设计是核心技能之一,而算法与数据结构的设计则是程序设计的基础。本报告针对一个C++编写的“成绩统计程序”,深入探讨了其中涉及的算法和数据...

    基于案例推理的数据挖掘算法搜索策略的研究.pdf

    案例库中的每个案例都包含了特定领域应用的数据挖掘算法和相关信息,通过面向对象的方法对案例进行表示。 模糊商空间(Fuzzy Quotient Space Model)被用来描述案例库的组织结构,从而为案例检索提供了一种有效的...

    MATLAB算法实战应用案例精讲-学校算法 (SBO)-MATLAB实现源代码

    它主要面向那些希望通过具体实例学习和提升MATLAB算法运用能力的学生和专业人士。书中的每个案例都结合了学校的实际教学场景,也就是"学校算法"(SBO),涵盖了MATLAB软件的各种功能和插件的使用。 MATLAB,全称...

    面向烟草企业的数据挖掘中分类算法分析与量化研究.pdf

    5. 数据挖掘中分类模型的构造方法包括多种,例如:决策树方法、统计方法、机器学习方法、神经网络方法、类比学习方法、遗传算法、粗糙集方法、模糊集方法、基于案例的推理方法等。 6. 文中特别提到了三种主流数据...

    面向新工科的数据挖掘实验课程教学案例设计.pdf

    学生不仅需要学习数据的基本统计、相似性度量、数据预处理、分类、关联分析、聚类、离群点检测等基础知识,还需要具备应用各种数据挖掘经典算法的实际能力。先修课程通常包括数据库原理、程序设计和数据结构等。 在...

    matlab图像处理中的统计应用案例

    本案例集着重探讨了如何利用MATLAB的图像处理工具箱和统计功能进行图像数据的分析和处理,旨在帮助用户理解并掌握相关技术。 首先,MATLAB是一个面向数值计算、符号计算和数据可视化的高级编程环境。它的图像处理...

    机器学习算法课件

    综上所述,这份“机器学习算法课件”是一套结合了Python语言的实用机器学习工具和理论的综合教程,它面向希望学习Python数据分析和机器学习实战的学生和从业者。学习者通过掌握Numpy、Pandas、Matplotlib和Scikit-...

    面向数据学科的带R,C++和CUDA-CRC案例的平行计算

    本书《面向数据科学的并行计算:R、C++和CUDA》通过大量的实例,展示了如何利用R进行高效的数据处理和统计分析工作。R语言的优势在于其丰富的统计方法库、易于使用的语法以及活跃的社区支持,这些特点使其成为数据...

    数据挖掘介绍及数据挖掘项目案例举例

    数据挖掘介绍及数据挖掘项目案例举例 数据挖掘是指通过采用自动或半自动的手段,在海量数据中发现有意义的行为和规则的探测和分析活动。数据挖掘是一门科学,有科学的方法和模型作为基础,但同时数据挖掘又是一门...

    MIT 6.006 算法导论讲义

    **MIT 6.006** 是麻省理工学院(MIT)开设的一门面向计算机科学领域的本科生课程,主要介绍了算法设计与分析的基础知识。本课程通过一系列实用的案例研究和经典算法来探讨如何解决大规模输入问题,如处理整套莎士比亚...

    统计专题地图分级数据处理模型设计.pdf

    文章通过引言、分级数据处理方法、统计数据分级算法模块三个部分详细介绍了统计专题地图分级数据处理模型的设计和实现,为专题地图的科学分级提供了新的思路和方法。模型的应用不仅提高了统计专题地图的制作效率和...

    jpop.rar_优化算法

    在Java中实现优化算法,我们可以利用其强大的数据结构和算法库,如Apache Commons Math,这是一个提供了各种数学和统计功能的开源库,其中包括优化模块。 在“jpop”代码中,开发者可能已经实现了常见的优化算法,...

    全国大学生数据统计与分析竞赛21年B题本科生组(6).pdf

    本竞赛面向全国高校学生,通过一系列实际案例分析,帮助参赛者掌握数据分析的基本方法和技术。 #### 二、核心知识点详解 ##### (一)PU-Bagging与Gini决策树在用户行为预测中的应用 **1. PU-Bagging简介** - **...

    Visual C++ 常用数值算法集

    4. **统计与概率算法**:包括随机数生成、统计分布(如正态分布、泊松分布)的模拟、假设检验等,对于数据科学和机器学习非常重要。 5. **数值逼近与插值**:如线性插值、多项式插值(如拉格朗日插值、牛顿插值)、...

    基于数据挖掘的分类和聚类算法研究及R语言实现

    R语言是一种开源的、面向统计编程语言,它提供了丰富的数据挖掘和分析功能,适用于各种统计计算和数据可视化。R语言在数据挖掘领域受到青睐,原因在于其免费、开放源代码和算法更新速度快等优点。此外,R语言的社区...

    Matlab在《概率论与数理统计》教学中的应用.pdf

    本文探讨了Matlab在《概率论与数理统计》这门课程中的应用,具体案例为高尔顿钉板实验。 首先,要明确《概率论与数理统计》是理工科本科生的一门重要基础数学课程。通过这门课程,学生能够理解概率论与数理统计的...

    C_test.rar_分析 c test_数据挖掘案例

    在数据挖掘项目中,这样的库文件可能包含了一些特定的算法实现,比如统计函数、图形绘制工具或优化算法。例如,它可能是用于加速计算的数学库,如BLAS(基础线性代数子程序)或LAPACK(线性代数包)。 3. **磁盘...

Global site tag (gtag.js) - Google Analytics