2.DSP骨架
2.1 名词说明
demand-side platform (DSP)-就是需求方平台,如果你有丰富的广告来源,例如4A广告公司就有可能需要这种平台.定义可以参看http//.wikipedia.org/wiki/Demand-side_platform.
supply-side platform或者sell-side platform (SSP)-就是拥有媒体展示的平台,国内这种平台业务有很多变体,定义可以参看https://en.wikipedia.org/wiki/Supply-side_platform.
data management platform(DMP)-有自己业务模式能积累大量数据的公司适合做这个业务,在线广告行业就需要这样的平台,具体的定义就不细说了.
IAB-美国互动广告局,英文全称是Interactive Advertising Bureau,可以视为广告行业的标准机构,管理和发布在线广告标准,其中就有OpenRTB标准v2.2,v2.3,v2.4等等.
Real-time bidding (RTB)-实时竞价机制,从系统设计的角度来理解就是广告交易的两方(需求方和提供方)建立一种保障实时竞价机制.
2.2 DSP平台关键性难点
a .tmax问题,我们当时使用的OpenRTB v2.2是这么解释的” Maximum amount of time in milliseconds to submit a bid (e.g.,120 means the bidder has 120ms to submit a bid before the auction is complete). If this value never changes across an exchange, then the exchange can supply this information offline”.这个需求就定义DSP系统重要的高性能指标, lowest latency response或者lowest response time(最少响应时间),也就是从auction server的角度从发出请求开始计时,通过网络传送到bidder,bidder内部有一个计算过程得到结果,再通过网络传回给auction server,所有的时间小于tmax指定的值.那么tmax在实践中指定的值是多少呢?从我后来对接过的系统要求来看,tmax值范围大概是100毫秒200毫秒之间。
b . high-volume of request问题,系统需要支持多大的请求量(QPS)。移动广告行业有自己的特点,一天24小时的流量(请求量)不是均匀的,大部分正常流量都产生于晚上7点到11点之间,可能的每小时流量是多少呢?这样来计算,一个号称每天有2亿请求的流量平台,一天平均每小时为2亿请求/24小时=833万请求/小时,那么在高峰时段会是可能是3000-4000万请求/小时.如果业务要求接入10个这样的栏位拍卖平台,系统要能支持4亿/小时请求能力,如果是要求接入100个这样平台,对系统要求也是相当恐怖的。
c . high-volume of data,很显然,前面巨大的请求量必然产生海量的数据这些数据需要被存储,被分析(有可能实时计算,也有可能是异步计算),然后产生业务价值.例如,客户的impression和click事件肯定用于计算广告的费用等等.
所以,如果要构建这样的DSP骨架就需要面对这三个最大难关, lowest latency response, high-volume of request和high-volume of data(在内部,我们称为LHH问题).
2.3 DSP构建DSP骨架
2.3.1 DSP运行原理
图2.3.1.1 运行原理
通过结合OpenRTB规范,我们抽象设计了DSP运行基本过程
[1.request an ad],广告栏位拍卖方(RTB auction server可以视为SSP平台方)发出广告栏位请求要求填充广告。当然这里有一个前提,拍卖方一定是向多个DSP发出请求。
[2.request an ad],RTB bidder是我方的广告栏位请求接收系统,它把外部广告请求转换为内部广告请求后传给decision supporter.
[3.if matched audience],decision supporter会首先会尝试判断用户是否有偏好,这个有一个背后的过程就是例如某个用户被计算为对化妆器有兴趣的客户,在这里就会被选择出来.当然,第一次访问的用户就无法有这种偏好数据.
[4.select optimum campaign && bidding price],这一步就根据请求的栏位数据,如果有用户偏好,加上最佳的广告活动和出价确定广告栏位的填充广告结果.
[5.resp bidded ad],内部填充广告.
[6.resp bidded ad],转换为外部可以接受填充广告格式.
2.3.2 描述DSP decision supporter核心逻辑
图2.3.2.1 DSP decision supporter说明
DSP decision-maker是入口部分,它带有4大主要功能:
根据定向条件选择合适的多个广告活动.
删除选择的广告活动中没有headroom的广告活动,例如,某广告活动针对客户每天的impression最多3次,如果某个客户已经产生的3次impression,这个广告活动就不适合了要从匹配广告活动中删除.
如果还有多个广告活动就进行排序,选择排序级别最高的广告活动作为填充广告.
根据广告栏位价格的设置,对填充广告进行定价,最终这个价就是RTB的栏位出价.
2.3.3 打包广告活动的受众用户
这里需要解释广告活动是指什么.通常广告主会设置(自己或者通过平台代理人)广告素材,大家在广告栏位看到flv或者jpg广告资源,广告活动的起始和结束时间,广告预算等等。在我们系统里,有一类选择的元素就是涉众用户。具体业务操作如:广告主根据我们内部计算的分类选择用户特征是身高在1.8米以上,20-30这个年龄段,或者年收入在40w以上的高富帅投广告.我们把这部分的受众用户ID会打包在广告活动中,这个过程就下图所示:
图2.3.3.1 广告活动的受众用户产生
这里dmp plumbing负责接入外部和内部dmp系统来获取分类涉众用户。proprietary dmp指的是公司专有的DMP系统.
2.3.4 DSP主要部署方式和关键组件协作
图2.3.4.1 部署方式
在部署中,我们考虑三个Auction(这个系统不是DSP组件,是对方系统)分别位于Shanghai,Beijing,India三个地区,对应每个地区,也就是理论上我在Shanghai,Beijing,India三个地区分别部署三套RTB bidder,Auction和bidder之间使用OpenRTB或者它的扩展。
ad content management system(ACMS)是一个广告主或者广告主代理操作的平台,打包所有的广告活动异步传给不同地区的RTB bidder.
ad performance collector负责把业务需要的一些实时计算数据收集过来,而ad dashboard负责友好的方式展示这些实时业务数据。到了后面ad dashboard会并入ACMS,因为它是服务广告主或者广告主代理的业务平台。
这种部署方式避开了集中在一个点架构bidder的问题,通过与auction的one on one近地协同工作,减少了网络传送时间,我们最后实际只需要在Hong kong和Shanghai两地建立Bidder平台,加上异步机制成功的解决了tmax问题。
2.3.5 开发使用到的设计
下面的部分主要用来指导开发人员和对于DSP实现进行路线图设计,就不多解释了,仅提供参考。
DSP底层运行机制
2.3.5.1 运行机制图
DSP的开发模块分解
2.3.5.2 模块
相关推荐
以格力电器为案例来探讨突破性技术与市场的共生演化,可以看到格力电器是如何通过技术革新满足市场需求,并通过市场反馈进一步优化技术。在这个过程中,企业需要有效捕捉并管理突破性技术创新成长期的关键要素,这...
遗传算法(Genetic Algorithm, GA)和演化策略(Evolutionary Strategy, ES)作为演化计算的两大分支,在解决复杂优化问题方面展现出强大能力。然而,这两种算法也存在着一些共同的问题,比如过早收敛和局部最优解等...
- Winterberry Group在2021年发布了一份关于协作数据解决方案的报告。 - 报告聚焦于2021年1月,专注于数据和身份在授权时代的应用。 - 报告旨在通过数据分析,提高人们对当前快速变化市场的理解,这个市场正由...
总的来说,这篇研究工作展示了差异演化-粒子群混合算法在解决复杂优化问题,如含水层参数估计时的高效性和鲁棒性,对于水资源管理和地质工程领域具有重要的实践意义。通过这种混合算法,可以提高参数估计的精度,...
从ChatGPT看大模型的演化 - 20230109精简版 .rar
经过二十多年的研究和工程开发,以及与数百家DSP客户的密切合作,赛灵思的FPGA产品已经演化为高价值的DSP解决方案平台,在性能、灵活性、上市时间以及产品寿命方面都提升到了极高的水平,同时还大大降低了总体系统...
从ChatGPT看大模型的演化 - 20230109精简版 本文档从ChatGPT的发展历程、技术创新和OpenAI的使命任务与机制创新三个方面,探索了大模型的演化历程和未来发展趋势。 一、OpenAI的使命任务与机制创新 OpenAI是一家...
### 范斌-计算和存储分离架构下大数据栈的演化 #### 计算与存储分离:背景与发展趋势 在过去的几十年里,信息技术的发展经历了从大型机时代到现代分布式计算的巨大转变。随着数据量的急剧增加和技术的进步,计算与...
锦州银行的案例被视为这一新模式的典型代表,其可能的解决方案是资产管理公司(AMC)参与定向增发,购买银行的高风险资产。这一过程中,定增价格和不良资产价格将基于银行真实的资产状况及市场化的定价机制来确定。 ...
新型城镇化水平与生态环境质量耦合时空演化研究--以长江经济带为例,刘玲,智慧,新型城镇化与生态环境协调发展是推动长江经济带绿色可持续发展的重要举措。以长江经济带为研究对象,构建新型城镇化和生态环境的
深入讲解复杂与创新安全解决方案的设计逻辑与构思,指导如何开发出专家级的高品质安全解决方案并高品质的呈现给客户,是安全咨询顾问及安全专家提升专业价值必备的知识与技能: 讲解安全解决方案的本质 安全思想演化...
榴辉岩研究是变质岩石学领域研究的热点与前沿,在解决高压和超高压变质作用、大洋和大陆地壳俯冲作用、碰撞造山作用等地质学问题和地球动力学研究中具有十分重要的意义。对榴辉岩研究的重要内容之一就是确定其变质P-T...
我们对平台整体架构进行了优化演变,包括机房建设,基础设施,编排系统,容器服务,镜像仓库,管理服务等,同时也面临更多高难度的技术及工程复杂度的挑战,本分享主要介绍蜂巢云服务构架的演化过程及工程实践经验...
1. **编码方式**:演化算法首先需要将问题的解决方案表示为个体,通常用二进制或浮点数编码。在这个例子中,个体可能是方程的未知数的可能值。 2. **种群初始化**:算法开始时,随机生成一个初始种群,每个个体代表...
演化博弈是一种将生物学、经济学和社会科学中的竞争与合作现象模型化的数学工具,它结合了博弈论和演化理论。...通过学习和实践,你可以掌握这一工具,从而在自己的研究领域中运用演化博弈理论解决实际问题。