`
猫耳呀
  • 浏览: 167273 次
社区版块
存档分类
最新评论

阿里云黄海宇:窄带高清2.0——让直播更惊艳的魔术

阅读更多
摘要: 2018年4月11-12日,2018亚太CDN峰会在北京隆重召开,大会由亚太CDN领袖论坛、电视云论坛、短视频论坛、视频云论坛、新技术论坛、运营商论坛、国际云论坛等7大部分组成。在视频云论坛上,阿里云视频云高级算法专家黄海宇作了题为《窄带高清2.0——让直播更惊艳的魔术》的主题致辞。
 
2018年4月11-12日,2018亚太CDN峰会在北京隆重召开,大会由亚太CDN领袖论坛、电视云论坛、短视频论坛、视频云论坛、新技术论坛、运营商论坛、国际云论坛等7大部分组成。在视频云论坛上,阿里云视频云高级算法专家黄海宇作了题为《窄带高清2.0——让直播更惊艳的魔术》的主题致辞。下面为演讲内容:
 
我是来自阿里云视频云的黄海宇,我目前从事的工作主要是阿里云视频直播相关技术。随着直播的发展,CDN的带宽、CDN的成本以及视频的清晰度已经成为一个非常重要的问题,我的演讲题目是“窄带高清2.0——让直播更惊艳的魔术”。
 
其实,阿里云早在2015年就已经提出了窄带高清的概念。这个概念提出来以后,很多友商开始引用这个概念,并且也推出了类似服务。
 
那么,我们当初提出窄带高清的原因是什么?在近两年来,在此基础上又做了哪些发展呢?今天我将给大家分享一下。
 
大家观看视频时,都希望画质清晰,但实际上,在看互联网直播是,我们更多看到的是比较模糊的视频。那么,我们是否现在没有办法制作高清视频呢?答案是否定的。
 
上个月,阿里云在深圳云栖大会现场第一次进行了8k直播,舞台的屏幕上显示了从1300公里以外的阿里巴巴杭州园区传输回来的直播图像视频,现场观众清晰地看到了景泰蓝淘公仔的精致画面。但实际的直播业务场景中,用户在做互联网直播的时候,由于网络传输原因,并不能让每位观众都能看到非常清晰的视频,高清晰度的直播的限制主要在网络的带宽上。
 
构建在阿里云上的一个直播平台调研数据显示,只有16%的用户能够看到超清的视频,54%的用户能够看到高清的视频,30%的用户看不到高清视频。
 
如果,能把超清码率往高清靠一下的话,是不是更多人就能够看到超清的视频了呢?
 
实际上,我们也正在向这个方向努力,但这样会带来一个问题,把超清码率往高清靠的时候,对清晰度会有多大影响呢?做视频编解码朋友都会熟悉PSNR的公式,被广泛应用在衡量各种不同编码器的编码质量上,实际上这个公式确实非常客观地描述了一个视频经过视频编码以后信息量的损耗,站在信息论的角度来进行分析的。但实际视频是人眼来看的,人眼对视频的敏感度和视频在编码过程中损失的信息量并不是直接对应的。
 
窄带高清——人眼主观感受最优为基准的视频编码技术
 
基于以上讨论,可以引出窄带高清的概念。窄带高清实际上是一套以人眼的主观感受最优为基准的视频编码技术,研究的是在带宽受限情况下,如何追求最佳的视觉感受。
 
把范围缩小到人眼主观感受,以及带宽受限两个条件时,会发现很多有意思的事情。
 
首先和现在的编码标准发展趋势是相同的,效果能够叠加。编码器发展时间,差不多每十年,编码器都会发展一代,编码质量会大约节约30%-50%的码率,这个码率的节约是按照PSNR评价标准来做的。但利用窄带高清的技术,把焦点集中在人眼的感受,可以把业界普遍浪费的带宽节省下来,让我们的带宽更多放在人眼感兴趣的地方,可以轻松达到30%的带宽节约,几乎可以平等地媲美一代编码器的进步。因为技术关注点在人眼上,我们可以把业界普遍处理不好的复杂场景做得漂亮,非专业观众一眼就可以看出优势。
 
窄带高清1.0——两套人眼视觉模型
 
窄带高清1.0是阿里巴巴在2016年推出的一个版本。在窄带高清1.0的背后隐藏着两个人眼视觉模型:
第一个模型称之为保真度与主观评分值之间的世界模型,横坐标是视频保真度,代表编码出来的制品与原始视频之间信息量差别,纵坐标是人眼对视频的评分,总共是5分。随着编码后视频越来越接近原始视频,人眼对视频的要求是越来越高的,但并不是一条线性的形状,是分成三段曲线,这使得阿里云知道中间这段非常陡峭的区域正是设置比较好码率的地方,在两端比较平坦的地方,加大视频码率,提高视频客观清晰度,实际上并不能带给人眼很好的清晰度。中间稍微把码率提高一点,视频对人眼的感受就完全不一样,每一比特码率都会非常有所值。所以阿里云在设置视频码率时会尽可能选择视频档位在中间的区域。
 
第二个模型是分辨率与码率的模型。在这个模型中,关注的是同样的码率到底应该设置多少清晰度,或对一个给定的清晰度,应该设定一个怎样的码率。传统视频网站中,通常设置方法,比如480p会设600k,720p设1.2m,超清1080p设2.5m,类似这样一个比较固定的码率设置。实际上每个视频所需要的码率不一样,表达的清晰度也不一样。例如,对于一个运动场景不复杂的教育视频来说, 1080p在的码率也会有非常好的效果。在实践中,我们会根据视频的类型和清晰度,预期选择码率和分辨率,同时根据视频内容做合理的码率分配。
 
通过传统方法,通常会设一个720p分辨率,码率大概是1m。实际上这个视频表现非常糟糕,鸟叔衬衫上全是马赛克,而且雪花点全部变得模糊。原因是这个视频运动非常复杂,只有1m码率,这种情况下,需要用1m码率去表达1280×720象素,对每一个象素的表现都会非常差,会损失很多象素细节,导致整体效果。
我们做过以后的效果,只用了887k码率,比之前码率节省15%-20%,用的是432p的分辨率,在窄带高清时经常会设置这样的分辨率,追求达到最好的人眼主观感受的效果。
 
窄带高清2.0——深入微观世界 分析视频细节
 
窄带高清2.0是阿里云在2017年杭州云栖大会发布的。窄带高清2.0深入到微观层面,分析视频每一个细节,发现这些视频细节对人眼敏感度是怎么样的。引入人眼敏感度模型概念,关注人眼到底会关注哪些细节、忽视哪些细节。对人眼关注的地方会给予更高的码率,甚至会对原始视频进行一些修复,使其更适合人眼观看的体验。对于忽视的地方可以降低一些码率。
 
从我们主观评测可以发现,基于H.264的窄带高清2.0已经完全超越了x264 veryslow的效果,与x265的veryslow效果相当,通过窄带高清2.0,使得我们可以超越当前编码器,提前进入到下一代编码器。
 
下面我们看下窄带高清2.0的实战。下图的直播画面中,在聚焦区域,主播的脸、头发,窄带高清2.0的效果会显得更加柔顺。在一些脱焦的区域,窄带高清2.0分配了比较少的码率,完全不会影响人眼对它的主观感觉。
另一个实战场景是游戏直播。枪战类型的游戏直播非常消耗码率,1080p设置2.9m的游戏直播,整体来看会有非常多的马赛克,因为这个视频在2.9m,完全无法表达1080p的象素,窄带高清2.0使用了720p的分辨率,同样2.9m,效果会好得多,另外,窄带高清2.0将人眼比较敏感的文字,纹理做了增强,整个视频看起来更加舒服。
窄带高清2.0可以节约大量的带宽成本,同时也能够提高视频观看流畅度,在高码率时能节省差不多1倍的码率,在低码率时能节省20%-30%,综合可以得到30%以上成本的节约。另外,窄带高清2.0还可以提高清晰度,如果追求的是视频清晰度,可以设置相同的码率。
 
在通常情况下,视频画质越好带宽费用肯定越高,带宽又是视频服务中占比很高的一项成本,很多开发者都在寻求效果与成本的平衡点。阿里云的窄带高清技术,就可以完美的解决这一难题,这就是云计算技术带来的实际价值体现。
 
阅读更多干货好文,请关注扫描以下二维码:
 
分享到:
评论

相关推荐

    藏经阁-飞天技术汇—超大规模直播码率控制 黄海宇.pdf

    例如,阿里云的“窄带高清”技术,能够在低带宽下实现高画质传输,同时还有高速通道、秒开、智能剪辑等特色功能,以提升服务质量和用户体验。 此外,全链路监控、图像增强、流合并、异地容灾、防盗链、时移直播、云...

    飞天技术汇超大规模直播码率控制黄海宇

    2018重庆云栖大会与重庆智博会强强联合,继续以“驱动数字中国”为主题,聚焦IoT、...在重庆云栖大会期间,嘉宾黄海宇做了《超大规模直播码率控制》的主题分享,对为什么要关注码率控制、宏观码率控制等内容展开了讨论

    【java毕业设计】智慧社区教育服务门户.zip

    有java环境就可以运行起来 ,zip里包含源码+论文+PPT, 系统设计与功能: 文档详细描述了系统的后台管理功能,包括系统管理模块、新闻资讯管理模块、公告管理模块、社区影院管理模块、会员上传下载管理模块以及留言管理模块。 系统管理模块:允许管理员重新设置密码,记录登录日志,确保系统安全。 新闻资讯管理模块:实现新闻资讯的添加、删除、修改,确保主页新闻部分始终显示最新的文章。 公告管理模块:类似于新闻资讯管理,但专注于主页公告的后台管理。 社区影院管理模块:管理所有视频的添加、删除、修改,包括影片名、导演、主演、片长等信息。 会员上传下载管理模块:审核与删除会员上传的文件。 留言管理模块:回复与删除所有留言,确保系统内的留言得到及时处理。 环境说明: 开发语言:Java 框架:ssm,mybatis JDK版本:JDK1.8 数据库:mysql 5.7及以上 数据库工具:Navicat11及以上 开发软件:eclipse/idea Maven包:Maven3.3及以上

    基于selenium的携程机票爬虫资料齐全+详细文档+高分项目+源码.zip

    【资源说明】 基于selenium的携程机票爬虫资料齐全+详细文档+高分项目+源码.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!

    【java毕业设计】智慧社区宠物管理系统(源代码+论文+PPT模板).zip

    zip里包含源码+论文+PPT,有java环境就可以运行起来 ,功能说明: 文档开篇阐述了随着计算机技术、通信技术和网络技术的快速发展,智慧社区门户网站的建设成为了可能,并被视为21世纪信息产业的主要发展方向之一 强调了网络信息管理技术、数字化处理技术和数字式信息资源建设在国际竞争中的重要性。 指出了智慧社区门户网站系统的编程语言为Java,数据库为MYSQL,并实现了新闻资讯、社区共享、在线影院等功能。 系统设计与功能: 文档详细描述了系统的后台管理功能,包括系统管理模块、新闻资讯管理模块、公告管理模块、社区影院管理模块、会员上传下载管理模块以及留言管理模块。 系统管理模块:允许管理员重新设置密码,记录登录日志,确保系统安全。 新闻资讯管理模块:实现新闻资讯的添加、删除、修改,确保主页新闻部分始终显示最新的文章。 公告管理模块:类似于新闻资讯管理,但专注于主页公告的后台管理。 社区影院管理模块:管理所有视频的添加、删除、修改,包括影片名、导演、主演、片长等信息。 会员上传下载管理模块:审核与删除会员上传的文件。 留言管理模块:回复与删除所有留言,确保系统内的留言得到及时处理。

    免费下载:Civil War (Stuart Moore)_xVBgd.zip

    免费下载:Civil War (Stuart Moore)_xVBgd.zip

    JSP基于WEB的图书馆借阅系统的设计与实现(源代码+论文)(2024pw).7z

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于计算机科学与技术等相关专业,更为适合;

    免费下载:Spider-Man (Stefan Petrucha)_2pBuA.zip

    免费下载:Spider-Man (Stefan Petrucha)_2pBuA.zip

    jj视频合并程序代码QZQ.txt

    jj视频合并程序代码QZQ

    【java毕业设计】智慧社区会员等级提升系统(源代码+论文+PPT模板).zip

    zip里包含源码+论文+PPT,有java环境就可以运行起来 ,功能说明: 文档开篇阐述了随着计算机技术、通信技术和网络技术的快速发展,智慧社区门户网站的建设成为了可能,并被视为21世纪信息产业的主要发展方向之一 强调了网络信息管理技术、数字化处理技术和数字式信息资源建设在国际竞争中的重要性。 指出了智慧社区门户网站系统的编程语言为Java,数据库为MYSQL,并实现了新闻资讯、社区共享、在线影院等功能。 系统设计与功能: 文档详细描述了系统的后台管理功能,包括系统管理模块、新闻资讯管理模块、公告管理模块、社区影院管理模块、会员上传下载管理模块以及留言管理模块。 系统管理模块:允许管理员重新设置密码,记录登录日志,确保系统安全。 新闻资讯管理模块:实现新闻资讯的添加、删除、修改,确保主页新闻部分始终显示最新的文章。 公告管理模块:类似于新闻资讯管理,但专注于主页公告的后台管理。 社区影院管理模块:管理所有视频的添加、删除、修改,包括影片名、导演、主演、片长等信息。 会员上传下载管理模块:审核与删除会员上传的文件。 留言管理模块:回复与删除所有留言,确保系统内的留言得到及时处理。

    jsp医院病区管理系统(论文+中期检查表+任务书+综合材料)(20242g).7z

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于计算机科学与技术等相关专业,更为适合;

    基于卷积神经网络的通信调制方式识别详细文档+全部资料+优秀项目+源码.zip

    【资源说明】 基于卷积神经网络的通信调制方式识别详细文档+全部资料+优秀项目+源码.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!

    计算机网络学习之旅.pptx

    理层、数据链路层、网络层、传输层和应用层的功能、技术和协议。同时,对网络安全、无线网络、网络管理和网络新技术进行了深入剖析。通过案例分析帮助学习者更好地理解实际应用,推荐学习资源助力深入学习。最后总结要点并展望未来网络发展趋势,为计算机网络学习者提供了丰富的知识和实用的指导。

    51单片机控制的智能小车.7z

    51单片机控制的智能小车.7z

    计算结构体变量的内存大小1.cpp

    计算结构体变量的内存大小1.cpp

    基于多智能体深度强化学习的车联网通信资源分配优化详细文档+全部资料+源码.zip

    【资源说明】 基于多智能体深度强化学习的车联网通信资源分配优化详细文档+全部资料+源码.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!

    空中俯视物体检测11-YOLO(v5至v9)、COCO、CreateML、Paligemma数据集合集.rar

    空中俯视物体检测11-YOLO(v5至v9)、COCO、CreateML、Paligemma数据集合集.rarDOTA V2开发训练-V1 2023-12-28 10:02 PM ============================= *与您的团队在计算机视觉项目上合作 *收集和组织图像 *了解和搜索非结构化图像数据 *注释,创建数据集 *导出,训练和部署计算机视觉模型 *使用主动学习随着时间的推移改善数据集 对于最先进的计算机视觉培训笔记本,您可以与此数据集一起使用 该数据集包括8388张图像。 以可可格式注释了飞机船舶存储 - 基准桶。 将以下预处理应用于每个图像: 没有应用图像增强技术。

    jsp网上购书系统设计(源代码+论文)(202490).7z

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于计算机科学与技术等相关专业,更为适合;

Global site tag (gtag.js) - Google Analytics