阅读更多

5顶
0踩

互联网

原创新闻 视频直播技术详解之处理

2016-09-05 09:06 by 副主编 mengyidan1988 评论(2) 有15712人浏览
引用

声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。
作者:七牛云
责编:钱曙光,关注架构和算法领域,寻求报道或者投稿请发邮件qianshg@csdn.net,另有「CSDN 高级架构师群」,内有诸多知名互联网公司的大牛架构师,欢迎架构师加微信qshuguang2008申请入群,备注姓名+公司+职位。

七牛云于6月底发布了一个针对视频直播的实时流网络LiveNet和完整的直播云解决方案,很多开发者对这个网络和解决方案的细节和使用场景非常感兴趣。

结合该实时流网络LiveNet和直播云解决方案的实践,我们将用七篇文章,更系统化地介绍当下大热的视频直播各环节的关键技术,帮助视频直播创业者们更全面、深入地了解视频直播技术,更好地技术选型。

本系列文章大纲如下:

(一)采集
(二)处理
(三)编码和封装
(四)推流和传输
(五)现代播放器原理
(六)延迟优化
(七)SDK性能测试模型

在上期采集中,我们介绍了视频采集针对音频采集和图像采集以及它们分别对应两种完全不同的输入源和数据格式。本篇是《解密视频直播技术》系列之二:处理。我们将讲解常见视频处理功能如美颜、视频水印、滤镜、连麦等。

视频或者音频完成采集之后得到原始数据,为了增强一些现场效果或者加上一些额外的效果,我们一般会在将其编码压缩前进行处理,比如打上时间戳或者公司Logo的水印,祛斑美颜和声音混淆等处理。在主播和观众连麦场景中,主播需要和某个或者多个观众进行对话,并将对话结果实时分享给其他所有观众,连麦的处理也有部分工作在推流端完成。

一、开放式设计



如上图所示,处理环节中分为音频和视频处理,音频处理中具体包含混音、降噪和声音特效等处理,视频处理中包含美颜、水印、以及各种自定义滤镜等处理。对于七牛这样的直播云服务来说,为了满足所有客户的需求,除了要提供这些「标准」处理功能之外,我们还需要将该模块设计成可自由接入自定义处理功能的方式。

二、常见视频处理功能
1. 美颜
都说「80%的主播没有美颜根本没法看」,美颜是直播产品中最常见的功能之一。最近准备在香港上市的美图公司的主打产品就是美颜相机和美拍,有媒体戏称其会冲击化妆品行业,其实就是美颜的效果的功劳,让美女主播们不化妆也可以自信的直播,而美颜相机的用户则可以拍出「更好的自己」。

美颜的主要原理是通过「磨皮+美白」来达到整体美颜的效果。磨皮的技术术语是「去噪」,也即对图像中的噪点进行去除或者模糊化处理,常见的去噪算法有均值模糊、高斯模糊和中值滤波等。当然,由于脸部的每个部位不尽相同,脸上的雀斑可能呈现出眼睛黑点的样子,对整张图像进行「去噪」处理的时候不需要将眼睛也去掉,因此这个环节中也涉及到人脸和皮肤检测技术。

七牛直播云提供的iOS和Android推流SDK中内置了美颜功能,你可以根据自己的需要选择开关美颜功能,并且能够自由调节包括美颜,美白,红润等在内的参数。其中iOS端SDK PLCameraStreamingKit的参数设置如下:

1)按照默认参数开启或关闭美颜:
-(void)setBeautifyModeOn:(BOOL)beautifyModeOn;

2)设置美颜程度,范围为0~1:
-(void)setBeautify:(CGFloat)beautify;

3)设置美白程度,范围为0~1:
-(void)setWhiten:(CGFloat)whiten;

4)设置红润程度,范围为0~1:
-(void)setRedden:(CGFloat)redden;

2. 视频水印
水印是图片和视频内容中常见的功能之一,它可用于简单是版权保护,或者进行广告设置。处于监管的需求,国家相关部门也规定视频直播过程中必须打上水印,同时直播的视频必须录制存储下来保存一定的时间,并在录制的视频上打上水印。

视频水印包括播放器水印和视频内嵌水印两种方式可供选择,对于播放器水印来说,如果没有有效的防盗措施,对于没有播放鉴权的推流,客户端拿到直播流之后可以在任何一个不带水印的播放器里面播放,因此也就失去了视频保护的能力。综合考虑云端录制对于水印的需求,我们一般会选择「视频内嵌水印」的方式打水印。

七牛直播云提供的iOS和Android推流SDK中也内置了水印功能,你可以根据自己的需要添加水印或移除水印,并且能够自由设置水印的大小和位置。其中iOS端SDK PLCameraStreamingKit的参数设置如下:
1)添加水印

-(void)setWaterMarkWithImage:(UIImage *)wateMarkImage position:(CGPoint)position;

该方法将为直播流添加一个水印,水印的大小由wateMarkImage的大小决定,位置由position决定,需要注意的是这些值都是以采集数据的像素点为单位的。例如我们使用AVCaptureSessionPreset1280x720进行采集,同时wateMarkImage.size为(100, 100)对应的origin为(200, 300),那么水印的位置将在大小为1280x720的采集画幅中位于(200, 300)的位置,大小为(100, 100)。

2)移除水印

-(void)clearWaterMark;

3. 滤镜
除了上面提到的美颜和水印之外,视频中还有很多其它的处理效果也在这个环节完成。七牛直播云提供的SDK在开放性设计基础之上,通过数据源回调接口,可以支持各种自定义滤镜的接入。

为了实现丰富的滤镜效果,在iOS端可以考虑使用GPUImage这个库,这是一个开源的基于GPU的图片或视频的处理框架,内置了多达120多种常见的滤镜效果。有了它,添加实时的滤镜只需要简单地添加几行代码,还可以基于这个库自己写算法实现更丰富端效果。GPUImage地址:https://github.com/BradLarson/GPUImage

除了iOS端之外,Android也有GPUImage这个库的移植:https://github.com/CyberAgent/android-gpuimage

同时,Google官方也开源了一个伟大的库,覆盖了Android上面很多多媒体和图形图像相关的处理:https://github.com/google/grafika

4. 连麦



连麦是互动直播中常见的需求,其流程如上图所示。主播和部分观众之间可以进行实时互动,然后将互动结果实时播放给其他观众观看。基于以上业务需求,我们很容易想到基于单向直播原理,在主播端和连麦观众端进行双向推流和双向播流的方式互动,然后在服务端将两路推流合成一路推送给其他观众。但RTMP带来的延迟决定了这种方式无法做到用户可接受的互动直播。实际上,互动直播的主要技术难点在于:

1)低延迟互动:保证主播和互动观众之间能够实时互动,两者之间就像电话沟通,因此必须保证两者能在秒级以内听到对方的声音,看到对方的视频;

2)音画同步:互动直播中对音画同步的需求和单向直播中类似,只不过互动直播中的延迟要求更高,必须保证在音视频秒级传输情况下的秒级同步。

3)音视频实时合成:其他观众需要实时观看到对话结果,因此需要在客户端或者服务端将画面和声音实时合成,然后以低成本高品质的方式传输观众端。

在视频和电话会议领域,目前比较成熟的方案是使用思科或者WebEx的方案,但这些商用的方案一不开源,二比较封闭,三成本比较高。对于互动人数比较少的互动直播,目前市场上比较成熟的方案是使用基于WebRTC的实时通讯方案。



上图是一个基于WebRTC协议实现多方实时通讯的示意图,本地用户(主播)和远程用户(连麦观众)之间的连接通过RTCPeerConnection API管理,这个API包装了底层流管理和信令控制相关的细节。基于该方案可以轻松实现多人(14人以下)的多方实时通信,如下图所示:



当然,在通信人数少的情况下,其复杂度相对简单,如2人情况下。但人数增多至4人之后,其可选的网络结构就增多了,如上图所示,可以每个点之间形成自组织网络的方式通信,也可以以1人为中心形成星型通信网络,还可以让大家都通过一个集中式的服务端进行通信。



作为一个高性能、可伸缩的直播基础服务提供商,七牛直播云经过评估选择了以主播为中心形成星形通信网络,支持主播和多个观众之间的互动质量。同时,为了保证合成后的音视频实时传输到其他观众端,这里采用经过改造的UDP协议传输:
  • 通过UDP降低传输延迟;
  • 在UDP之上进行传输控制,保证用户互动体验QoS。

在下一篇连载中,我们将介绍现代播放器原理,敬请期待!

有关直播技术的更多内容,大家也可以访问直播技术知识库


  • 大小: 161.1 KB
  • 大小: 80 KB
  • 大小: 47.4 KB
  • 大小: 44 KB
  • 大小: 39.5 KB
  • 大小: 103.7 KB
5
0
评论 共 2 条 请登录后发表评论
2 楼 mayufenga1 2016-10-09 08:14
介绍的不详细
1 楼 开心的笔记 2016-09-08 15:24

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • MATLAB图像处理实例详解视频 ——想学废基于MATLAB图像处理技术的来

    详解数字图像的基本处理方法:运算、增强、复原和分割 详解高级图像处理技术:压缩编码、特征分析、形态学处理和小波变换 非常详细,共36.8小时的视频,足够学废基于MATLAB的图像处理技术

  • 视频直播技术详解之推流和传输

    声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。 作者:七牛云 责编:钱曙光,关注架构和算法领域,寻求报道或者投稿请发邮件...七牛云于6月底发布了一个针对视频直播的实时流网络LiveNet和完...

  • 视频直播技术详解之延迟优化

    声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。 作者:七牛云 责编:钱曙光,关注架构和算法领域,寻求报道或者投稿请发邮件...七牛云于6月底发布了一个针对视频直播的实时流网络LiveNet和完...

  • 基于FPGA的无线视频技术应用解决方案详解

    数字视频技术是当今消费市场上令人激动的一个亮点,而无线技术能够确保数据的加密并逐渐支持更高的数据率,因而成为不同设备之间传输视频信息的理想媒介。然而这个领域标准众多,这就使得提高产品的灵活性并缩短上市...

  • 移动端实时音视频直播技术详解(一):开篇

    移动端实时音视频直播技术详解(一):开篇 1、引言 随着互联网用户消费内容和交互方式的升级,支撑这些内容和交互方式的基础设施也正在悄悄发生变革。手机设备拍摄视频能力和网络的升级催生了大家对视频直播领域...

  • 视频直播技术详解之采集

    结合该实时流网络LiveNet和直播云解决方案的实践,我们将用七篇文章,更系统化地介绍当下大热的视频直播各环节的关键技术,帮助视频直播创业者们更全面、深入地了解视频直播技术,更好地技术选型。 本系列文章大纲...

  • 视频直播技术详解之直播云SDK性能测试模型

    声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。 作者:七牛云 责编:钱曙光,关注架构和算法领域,寻求报道或者投稿请发邮件...七牛云于6月底发布了一个针对视频直播的实时流网络LiveNet和完...

  • 视频直播技术详解之现代播放器原理

    声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。 作者:七牛云 责编:钱曙光,关注架构和算法领域,寻求报道或者投稿请发邮件...七牛云于6月底发布了一个针对视频直播的实时流网络LiveNet和完...

  • FFmpeg入门详解之83:流媒体与直播技术

    流媒体又叫,它是这个过程的一系列相关的包称为“流”。流媒体实际指的是一种新的...流媒体技术发端于美国,在美国目前流媒体的应用已很普遍,比如惠普公司的产品发布和销售人员培训都用网络视频进行。所谓流媒体是指。

  • Android视频直播原理详解

    最近一段时间,视频直播可谓大火。在视频直播领域,有不同的商家提供各种的商业解决方案,包括软硬件设备,摄像机,编码器,流媒体服务器等。本文要讲解的是如何使用一系列免费工具,打造一套视频直播方案。 视频...

  • 视频直播技术详解之编码和封装

    结合该实时流网络LiveNet和直播云解决方案的实践,我们将用七篇文章,更系统化地介绍当下大热的视频直播各环节的关键技术,帮助视频直播创业者们更全面、深入地了解视频直播技术,更好地技术选型。 本系列文章...

  • 「视频直播技术详解」系列之一:采集

    关于直播的技术文章不少,成体系的不多。我们将用七篇文章,更系统化地介绍当下大热的视频直播各环节的关键技术,帮助视频直播创业者们更全面、深入地了解视频直播技术,更好地技术选型。

  • 视频直播技术详解(0)开篇

    (原标题:《视频直播技术详解》系列之一:开篇)  文|何李石 随着互联网用户消费内容和交互方式的升级,支撑这些内容和交互方式的基础设施也正在悄悄发生变革。手机设备拍摄视频能力和网络的升级催生了大家对...

  • 视频编码技术详解

     而这一切,离不开视频拍摄技术的不断升级,还有视频制作产业的日益强大。    此外,也离不开通信技术的飞速进步。试想一下,如果还是当年的56K Modem拨号,或者是2G手机,你还能享受到现在动辄10...

  • 《视频直播技术详解》系列之一:视频采集和处理

    直播中的各个环节:1.采集采集是播放环节中的第一环,iOS 系统因为软硬件种类不多,硬件适配性较好,所以比较简单。...」不光是美颜,很多其它的视频处理如模糊效果、水印等也都是在这个环节做。目前

  • 《视频直播技术详解》系列:(0)汇总

    《视频直播技术详解》系列:(0)汇总

  • 视频直播技术详解

    《视频直播技术详解》系列之一:开篇 原创 2016-08-11 何李石 七牛云 随着互联网用户消费内容和交互方式的升级,支撑这些内容和交互方式的基础设施也正在悄悄发生变革。手机设备拍摄视频能力和网络的升级...

  • 《视频直播技术详解》系列之五:推流和传输

    结合七牛实时流网络 LiveNet 和直播云解决方案的实践,我们用八篇文章,更系统化地介绍当下大热的视频直播各环节的关键技术,帮助视频直播创业者们更全面、深入地了解视频直播技术,更好地技术选型。 本系列文章...

  • 视频直播技术大全、直播架构、技术原理和实现思路方案整理

    直播难:个人认为要想把直播从零开始做出来,绝对是牛逼中的牛逼,大牛中的大牛,因为直播中运用到的技术难点非常之多,视频/音频处理,图形处理,视频/音频压缩,CDN分发,即时通讯等技术,每一个技术都够你学几年...

Global site tag (gtag.js) - Google Analytics