摘要: 本届世界杯互联网直播的顺利进行,离不开各大云计算厂商的支持。在这其中,阿里云是当之无愧的“C位“,除了优酷外,阿里云还支撑了CNTV、CCTV5客户端,为全网70%的世界杯直播流量保驾护航。 对于世界杯这种超大观看量级、超强影响力的重要体育赛事,阿里云一直致力研究的AI技术一定不会缺席。
本届世界杯互联网直播的顺利进行,离不开各大云计算厂商的支持。在这其中,阿里云是当之无愧的“C位“,除了优酷外,阿里云还支撑了CNTV、CCTV5客户端,为全网70%的世界杯直播流量保驾护航。
对于世界杯这种超大观看量级、超强影响力的重要体育赛事,阿里云一直致力研究的AI技术一定不会缺席。
如何用AI替代传统的内容加工模式,高效地产出比赛集锦并将精彩内容快速呈现给观众呢?世界杯期间,阿里云联合阿里巴巴机器智能技术实验室,利用“视频AI+云剪辑+媒资管理”的技术,实时产生精彩集锦和球星集锦,满足球迷们的重温赛事和追星的需求,本文将揭晓技术实现过程。
从整场赛事维度产生精彩集锦
首先,要做的事情是让机器比人更懂视频。通过对过去多届世界杯的多场赛事,以及上万篇足球或世界杯相关文稿的学习,阿里云视频AI对球场、球员、比赛机制、特定行为等都有了全面的理解,所以它具备像观众一样去客观地认知和感受每一场世界杯球赛的能力。
其次,大量的标注工作也是必不可少的,包括对帧图景深、位置、事件、红黄牌、不同角色行为、禁区危险画面及球星人脸的标注,也包含对音频中关键词、音频事件等的标注。
最后,便是准确地提取“精彩”的内容。在这个环节,算法和工程上进行了多处创新。包括:
- 将视频进行多模态分析,从视频画面、音频、文字等多个维度提取关键信息,再通过融合或者相互校验,大幅度提高锁定精彩内容的准确性。
- 将音频的信息分析和视频行为分析结果取权重融合判断,将视频时域、空域网络权重与音频事件、ASR网络自适应累加,从而对射门、进球、犯规、精妙传球等精彩镜头准确捕获;同时,结合实时事件信息分析结果进行合理回溯或预测,完成事件提取,比如受伤、换人、过人等事件相关的回放、特写、裁判行为抓取等。
- 利用多维数据进行相互校验,结合事件回溯和预测技术,进行进一步的信息平滑处理,在直播过程中逐渐累积精彩集锦或球星集锦。
从球星的维度产生球星集锦
赛事精彩集锦是以比赛本身为核心,对精彩信息进行定义、提取、汇聚与展示;而球星集锦是以特定球员为核心,获取直播赛事中与球星相关的关键画面或关键事件。这一技术不仅能为视频生产方实时提供素材,也能快速呈现球星爱豆的精华镜头,让球迷们过足眼瘾。
简单来说,球星集锦的实现通过对世界杯场景进行深入理解和分析,从比赛视频、解说词音频、球星库及人物场记等各个维度进行识别与分析,并利用多模态融合技术,从而实现复杂场景下的集锦效果。
在视频AI处理中,通过识别视频中已注册的球星并进行人物追踪,同时做了一定程度的容错处理和补偿优化,并针对不同位置的球星微调追踪模型,最终对球星在视频中出现的时间线、幅面坐标及置信度进行综合的动态分析。
在解说词AI处理中, 则使用了世界杯场景的语音识别模型,该模型对球员名称、足球术语、解说员的语速/语气/语调等进行了额外的训练和优化,尤其是在声学模型上针对足球场景下的球场及观众噪声进行了适应性训练,使得其最终对世界杯解说词的识别准确率提升了超过10个百分点。
云剪辑是生成球星集锦的最后一步,它能够接收视频AI输出的最终时间线,对原始素材进行剪切合并。云剪辑可根据需要来开启并行剪辑模式,这种模式下,原始素材片段越多,剪辑倍速越高。另外,云剪辑还可接收高级剪辑参数,如在不同剪辑片段之间增加转场,在球星首次特写帧增加贴纸,增加背景音乐、片头片尾等,丰富集锦的娱乐效果。
如何瞬时产出视频集锦
对于直播体育赛事,集锦视频产出的高效性非常重要。这也是视频AI真正可以替代人力发挥其价值的依据之一。而这对于视频云的流传输、音视频编解码、直转点以及云剪辑等技术能力都是极大的挑战。
在保证实时性上,阿里视频云利用直转点技术,先碎片化进行实时多模态分析,再结合事件回溯与预估,对精彩集锦进行累积和快速调整,最终合理聚合产出优质集锦。
依靠强大的流媒体处理能力,可以保证每场比赛的精彩集锦以及所有球星集锦,在3-5分钟内生成,再由平台快速发布出去。技术经历过无数次大“舞台”的洗练,本次世界杯中,再一次完美地解决了这一问题。
可预见的未来
激情赛事已经过半,阿里云视频AI技术在本次世界杯中也成功落地,而这并不是结局,这是将视频AI应用于体育行业以及更多其他行业的开端。经历了对世界杯如此大型赛事的稳定保障,阿里视频云将更成熟、稳定地去应对赛事场景下的视频分析与处理。AI技术也将渗透到各个行业中,帮助用户有效提高视频的生产效率,让内容更快、更准、更优。
除了视频AI之外,阿里云在本次世界杯中用到的窄带高清、50帧极清、CDN智能调度等技术,也为2018年的世界杯的广大体育迷提供了更好的观看体验。阿里云目前已经是国内视频服务体量最大的云计算公司,客户涵盖社交、教育、电商、游戏等,未来也将不断致力释放技术红利,帮助越来越多的客户实现业务飞速增长,站领行业“C位”。
相关推荐
(整理)平压印刷机运动方案和主要机构设计课程设计说明书.doc
裂缝检测数据集,支持yolo v12格式的标注,1673张原始训练集图片,正确识别率99.4% 图片详情可查看博文:https://backend.blog.csdn.net/article/details/147232357
苯 正丁醇化工原理课程设计说明书.pdf
内容概要:本文档《MySQL-进阶篇.pdf》深入探讨了MySQL数据库的高级特性,涵盖了存储引擎、索引、SQL性能优化、视图、存储过程、触发器、锁机制、InnoDB引擎内部原理以及MySQL管理工具等多个方面。首先,文档详细介绍了MySQL的存储引擎体系结构,特别是InnoDB、MyISAM和Memory存储引擎的特点与应用场景。其次,围绕索引展开了详细的讨论,包括B+Tree、Hash索引结构,索引创建、使用原则及优化技巧。接着,文档阐述了SQL语句的性能分析方法,如使用`EXPLAIN`、慢查询日志和`profile`工具。此外,还讲解了视图、存储过程、触发器等高级功能,以及不同类型的锁机制对并发控制的重要性。最后,文档深入分析了InnoDB引擎的事务处理机制,包括redo log、undo log和MVCC的实现原理,并介绍了常用的MySQL管理工具及其使用方法。 适用人群:具备一定数据库基础知识,尤其是MySQL使用经验的研发人员和技术爱好者。 使用场景及目标: 1. 深入理解MySQL存储引擎的工作原理及其选择依据。 2. 掌握索引的设计与优化技巧,提升查询性能。 3. 学习如何通过各种工具和方法进行SQL性能分析与优化。 4.
高二英语优秀作文Myidealjob.docx
变电站设计说明书和计算说明.docx
菠萝水果饮料生产线设计说明书.doc
毕业设计说明书A江坝后式厂房双曲拱坝设计.pdf
1万吨自来水厂详细设计说明书.doc
内容概要:本文详细介绍了基于三菱FX3U PLC的智能交通灯控制系统的设计与实现。该系统通过车流传感器检测车流量,并根据车流量动态调整红绿灯的时间,确保交通流畅。硬件方面,使用了四个车流传感器和六个灯组进行连接;软件方面,利用定时器、计数器和比较指令实现了60秒的大循环控制逻辑,同时加入了滤波机制防止误触发。文中还提供了具体的梯形图代码片段,展示了如何处理绿灯闪烁、黄灯过渡以及红灯同步等问题。此外,作者分享了一些调试经验和优化技巧,如加入硬件互锁避免灯色抖动,增加临时测试界面方便调试等。 适合人群:从事PLC编程、自动化控制领域的工程师和技术人员,尤其是对交通控制系统感兴趣的读者。 使用场景及目标:适用于城市中小规模路口的交通管理,特别是在车流波动较大但不适合部署高级智能交通系统的场合。主要目标是提高路口的通行效率,减少等待时间,提升驾驶体验。 其他说明:文中提到的实际应用案例表明,该系统可以将通行效率提升约15%-18%,并且能够有效应对突发情况,如车流突变等。
内容概要:本文详细介绍了基于TI公司DSP2803x系列芯片的3kW车载充电器(OBC)的设计与实现。硬件方面,重点讨论了四层PCB板设计、功率电路与控制电路的物理隔离、MOS管散热处理以及LLC谐振拓扑的应用。软件部分涵盖了ADC初始化、PWM波生成、状态机设计、PID调节等关键技术点。文中还分享了许多实际开发过程中遇到的问题及其解决方案,如EMI抑制、地线处理、变压器参数调整等。最终产品达到了94.7%的峰值效率,并成功量产。 适合人群:从事电力电子、嵌入式系统开发的技术人员,尤其是对车载充电器设计感兴趣的工程师。 使用场景及目标:适用于希望深入了解OBC设计原理和技术细节的专业人士,旨在帮助他们掌握从硬件选型到软件调试的完整流程,提高实际项目的成功率。 其他说明:文中提供了大量实用的经验技巧和注意事项,对于初学者来说是非常宝贵的参考资料。同时,作者还展望了未来使用GaN器件进一步提升性能的可能性。
内容概要:本文详细介绍了采用西门子S7-200 SMART PLC、ABB ACS550变频器和组态王6.55上位机构建的水蓄冷中央空调系统。主要内容涵盖系统架构设计、梯形图编程逻辑、变频器参数设置、组态王画面设计以及调试过程中遇到的问题及其解决方法。文中特别强调了系统的节能特性,如通过PID控制实现水泵转速调节,以及针对实际应用中的常见问题提供了具体的解决方案,如抗干扰措施、水位开关误动作修正等。 适合人群:从事工业自动化领域的工程师和技术人员,尤其是对PLC编程、变频器控制及组态软件有一定基础的人群。 使用场景及目标:适用于需要构建高效节能的水蓄冷中央空调系统的工程项目。主要目标是提高系统的可靠性和稳定性,降低能耗,确保系统能够长期稳定运行。 其他说明:文章不仅提供了详细的硬件连接和编程指导,还分享了许多宝贵的调试经验和实用技巧,对于实际工程应用具有很高的参考价值。
【Python】学习系列,笔记 & 源码,https://blog.csdn.net/fu_lin_13/category_12949338.html
内容概要:本文详细介绍了一个专门为低压电气控制系统设计的EPLAN P8部件库。该部件库包含了多个主流品牌的PLC、传感器、控制设备、动力与保护设备、变频器及电气附件等。文中不仅介绍了各个设备的具体型号及其应用场景,还提供了许多实用的功能和技巧,如宏命令、智能关联、参数预设等,旨在提高设计效率和准确性。此外,作者还分享了一些个人经验和优化建议,使用户能够更好地利用这一工具进行电气设计。 适合人群:从事电气控制系统设计的专业人士,尤其是使用EPLAN P8软件的工程师。 使用场景及目标:适用于需要快速调用标准化元件的设计场景,帮助设计师节省时间并提高工作效率。无论是新手还是资深工程师,都可以从中受益。 其他说明:随部件库附赠2.7版本的P8软件下载链接,方便用户获取最新工具。同时,文中提到的一些高级功能和技术细节有助于提升用户的技能水平。
《弯曲板冲压工艺与模具设计毕业设计说明书》.doc
毕业设计(论文) 滚筒输送机设计说明书.docx
asr1903s仿中兴微后台
内容概要:本文详细介绍了利用MATLAB代码实现电热综合能源系统的动态定价与能量管理策略。通过主从博弈模型,上层能源公司制定电价和热价,下层用户根据价格调整用能策略,双方在互动中找到平衡点。上层使用粒子群算法优化定价策略,考虑电力交易和热能供给的利润最大化;下层用户模型使用CPLEX解混合整数规划,追求用能成本最小化和舒适度最大化。文中还讨论了实时天气数据对接、热功率平衡、约束条件处理以及并行计算的应用。通过多次迭代,系统能够实现更加灵活的价格机制,提高能源公司收益和用户满意度。 适合人群:从事能源管理系统研究的技术人员、熟悉MATLAB编程的研究人员、对博弈论及其应用感兴趣的学者。 使用场景及目标:适用于电热综合能源系统的优化管理和动态定价策略的设计。主要目标是通过主从博弈模型,使能源公司在最大化收益的同时,确保用户体验和满意度不受损害。 其他说明:调试过程中需要注意粒子群算法的参数设置,如种群规模、惯性权重等,以避免陷入局部最优解。此外,用户需求弹性和热能平衡约束的处理也是关键因素。
电梯导航栏实现(HTML+CSS+JS)
内容概要:本文详细介绍了一套基于国产MCU的无感FOC风机控制系统。该系统涵盖了从龙伯格观测器的角度估算、顺逆风启动策略、SVPWM调制方式的选择,以及硬件抽象层的设计等多个方面。文中展示了具体的代码实现,包括观测器增益调节、启动时的高频脉冲注入、SVPWM的五段式和七段式调制选择及其动态调整机制。此外,还讨论了移植到不同国产MCU平台时需要注意的问题,如PWM死区时间和ADC采样的对齐。最后提到了一些实用的功能,如风机保护机制和模块化的代码设计。 适合人群:从事电机控制、风机设计及相关领域的工程师和技术人员。 使用场景及目标:适用于希望深入了解无感FOC风机控制系统的开发者,尤其是那些需要将现有方案迁移到国产MCU平台的人群。主要目标是提供一个完整的、经过验证的解决方案,帮助用户快速实现高性能的风机控制系统。 其他说明:本文提供的代码和设计方案来源于实际量产项目,具有较高的实用性和可靠性。对于有兴趣进一步探索和改进无感FOC控制技术的研究人员来说,也是一个很好的参考资料。