转自:https://mp.weixin.qq.com/s/Nmz5LiHFFZTW0GyuSuKHoA?spm=ata.13261165.0.0.360a6093wXKkhs
阿里妹导读:随着最近几年数据计算力与机器智能算法的兴起,基于大数据 AI 算法的应用愈来愈热,大数据应用在各个行业也不断涌现。测试技术作为工程技术的一部分,也随着时代的不断变化在同步演进,在当下 DT 时代,如何测试和保障一个基于大数据的应用的软件质量,成为测试界的一个难题。
本文通过系统性地介绍阿里巴巴 AI 中台的技术质量体系——搜索推荐广告应用的质量是如何测试的,来尝试回答一下这个问题,希望能给大家带来一些借鉴,欢迎斧正,以便改进。
一 前言
最近十年来,随着移动互联网和智能设备的兴起,越来越多的数据被沉淀到各大公司的应用平台之上,这些包含大量用户特征和行为日志的数据被海量地存储起来,先经过统计分析与特征样本提取,然后再经过训练就会产出相应的业务算法模型,这些模型就像智能的机器人,它可以精准地识别和预测用户的行为和意图。
如果把数据作为一种资源的话,互联网公司与传统公司有着本质的不同,它不是资源的消耗者,而是资源的生产者,在平台运营的过程中不停地在创造新的数据资源,并且随着平台的使用时长和频率的增加,这些资源也在指数级地增长。平台通过使用这些数据和模型,又反过来带来更好的用户体验和商业价值。2016 年,AlphaGo,一个基于深度神经网络的围棋人工智能程序,第一次战胜围棋世界冠军李世石。这个由谷歌(Google)旗下 DeepMind 公司开发的算法模型,背后使用的数据正是人类棋手所有的历史棋谱数据。
阿里的搜索、推荐和广告也是非常典型的大数据应用的场景(高维稀疏业务场景),在谈如何测试之前我们需要先了解一下平台处理数据的工程技术背景。搜索、推荐、广告系统在工程架构和数据处理流程上比较相近,一般分为离线系统和在线系统两部分,见下图 1(在线广告系统一般性架构,刘鹏《计算广告》)。离线系统负责数据处理与算法模型的建模与训练,而在线系统主要用以处理用户的实时请求。在线系统会使用离线系统训练产出的模型,用以实时的在线预测,例如预估点击率。
分享到:
相关推荐
樊宇作为京东物流资深测试开发工程师,在其分享的《如何让配送地址更准确——带你走进京东物流大数据算法测试探索之路》中,详细介绍了如何通过大数据和算法提升配送地址的准确性。 首先,技术背景部分涉及到了京东...
分类算法是大数据应用基础中的核心技术之一。 大数据的核心是非结构化数据,例如物联网、智能手机、可穿戴、智能硬件等技术设备生成的数据。对非结构化数据的处理是大数据应用基础的难点之一。分类算法是对非结构化...
《大数据算法》章节测试题与答案涵盖了大数据领域的多个知识点,主要涉及大数据的特点、应用、计算问题的求解、资源约束、大数据算法的类型以及在线算法和近似算法等多个方面。 1. 大数据的特点:大数据的特点包括...
《大数据算法》是一本深入探讨大数据处理及其应用的书籍,其中包含了丰富的理论知识和实践案例。通过对章节测试题的分析,我们可以提炼出以下几个关键知识点: 1. 大数据的四个基本特征是:高速(Velocity)、多样...
本文将从阿里大数据算法平台架构的角度,讲解大数据计算服务、算法平台架构、算法应用等方面的知识点。 一、大数据计算服务 阿里云大数据计算服务是阿里集团内部的大数据计算服务平台,提供了统一的数据仓库、机器...
### 大数据算法与结构 #### 一、大数据处理背景 随着互联网技术的发展以及信息化水平的提高,数据量呈现出爆炸式增长的趋势,如何有效地管理和利用这些海量的数据成为了一个亟待解决的问题。在此背景下,大数据...
大数据应用测试通常分为三个步骤: 1. 数据预处理验证:在此阶段,要验证数据源的准确性,确保数据能正确加载到系统,如关系数据库、日志系统或社交网络的数据。同时,验证加载数据与源数据的一致性,以及正确地提取...
接着,报告探讨了如何将大数据算法应用到数学课程的发展性评价中,从数学课程评价的角度出发,以课程理念为指导,系统分析了发展性评价的基本特征。具体包括:课程内容评价、学习表现评价、数学论文、作业评价、自我...
大数据算法可以分析学生的学习数据,例如作业完成情况、测试成绩、在线学习行为等,以识别每个学生的最近发展区。这些信息有助于教师制定适应学生个体差异的教学策略。例如,通过分析错误模式,教师可以设计针对性的...
大数据测试主要包括对数据全链路、数据应用、UDF(用户自定义函数)、实时数据、MapReduce以及深度学习算法等方面的测试。测试过程中,关注的重点包括: 1. 数据全链路测试:确保数据从产生、传输到处理的完整性。 ...
大数据智能算法作为大数据系统的一个重要组成部分,其测试也是必不可少的。常见的智能算法包括推荐系统、分类算法、聚类算法、精准预测、深度学习等。 综上所述,大数据系统测试不仅要求测试人员具备深厚的技术背景...
特别是将大数据技术应用于无线通信系统中,有助于推动信号检测算法的创新发展。 在无线通信系统中,当前主要形式为正交频分复用(OFDM)系统,信号检测算法的应用不仅可以反映信号从调制到恢复的过程,还能保护信号...
- **大数据应用测试的支撑数据设计** - 探讨了如何根据大数据的特点来设计合理的测试数据集,以提高测试效率和准确性。 - **大数据应用性能测评模型** - 提出了基于负载测试的大数据应用性能评估模型。 - **工具...
### UIUC CS598CSC 大数据算法讲义知识点总结 #### 一、课程概述与目标 **课程名称**:CS 598CSC 大数据算法 **讲座日期**:2014年8月26日 **讲师**:Chandra Chekuri **记录员**:Chandra Chekuri - **课程...
在大数据背景下,数据挖掘技术算法的研究和应用成为了挖掘数据价值的有力工具。文章中提到了两种聚类算法:K-means聚类算法和层次聚类算法,并通过介绍和对比这两种算法,指出了数据挖掘技术算法的具体实施流程。 K...
程序均是实战案例,经过测试可直接运行。 全国大学生电子设计竞赛(National Undergraduate Electronics Design Contest),试题,解决方案及源码。计划或参加电赛的同学可以用来学习提升和参考。程序均是实战案例...
### 大数据功能性测试与非功能性测试分析 #### 一、引言 随着信息技术的快速发展,特别是物联网、云计算和移动互联网等技术的进步,数据量正在以前所未有的速度增长,形成了所谓的“大数据”。大数据通常指的是...
聚类算法的关键在于如何确定合适的族数,这是算法优化的重点之一。在分布式环境下,聚类算法的优化需要考虑数据的并行处理以及预测强度的计算方式,使算法能够自动地按照数据的特定属性进行分类,从而提高聚类的准确...