`
yuun
  • 浏览: 58367 次
文章分类
社区版块
存档分类
最新评论

阿里云首推免费人脸识别SDK 让每个APP轻松拥有短视频AR特效

 
阅读更多

摘要: 早在今年五月,阿里云已经推出了短视频解决方案。近日,阿里云再次率先颠覆行业,在业内首推免费的人脸识别SDK,结合其原有的短视频能力,大大降低了人脸识别+AR特效+短视频的入行门槛。

你所知道的人脸识别行业

提到人脸识别,大家会联想到商业支付、身份识别、广告投放、人机交互、系统公安等等众多生活场景。虽然这项技术的研究始于20世纪60年代,但是在近年这个课题才愈发活跃。以日常生活中比较常见的场景——社交互动为例,通过人脸识别、AR特效、动图元素的支持,可以帮助用户打破社交壁垒,更立体化、个性化、趣味化的表达自我和分享生活点滴。

市面上已经有的人脸识别SDK多数费用高昂,动辄几十万,而某些厂商号称免费,其实也是基于网络API的调用,并不适合在移动端录制短视频时使用,也就无法应用在社交场景之中。这让很多想在APP中添加短视频AR特效的团队望尘莫及。

阿里云联合手淘 推出人脸识别免费SDK

阿里云通过整合集团资源,将手淘团队自研的人脸识别SDK和阿里云短视频SDK深度融合,真正做到了不依赖于网络API的实时检测、识别、跟踪。

目前,官网上的专业版短视频SDK已经拥有了手淘自研的人脸识别功能,实现了人脸识别+AR动态贴纸的完整体验,结合原有的短视频采集、导入裁剪、编辑、合成、极速上传、媒资管理、视频转码、分发加速、播放等全链路能力,阿里云可以为创业者们提供一站式解决方案,让每个APP轻松实现短视频AR新玩法。

_2017_09_26_12_46_12

关键技术介绍及算法性能测速

我们来看看具体的应用场景和技术是怎样的,用户在客户端进入拍摄画面后,可以自行选择搭配动态贴纸等个性化素材,实现AR特效,使短视频打造出科幻、卖萌、恶搞等不同的效果。其中主要涉及到的是人脸检测、关键点定位、追踪等核心技术。

第一, 人脸的检测是用于定位视频中的人脸,同时检测多张人脸和处理多角度、部分遮挡人脸等复杂情况也在这一步妥善处理,从而快速、准确的找到人脸。

第二, 人脸的关键点定位,则是用于已知人脸所在位置的基础上,自动标注人脸的轮廓、五官位置,比如眼睛、鼻子、嘴巴、眉毛、耳朵等关键位置。阿里云提供人脸识别关键点个数多达68个,可以更准确的追踪五官,保证用户的体验。

第三, AR特效美化,根据已知的关键点位置,搭配上用户所选的动态贴纸,并根据捕捉不同的面部动作来变换AR特效,达到真实互动。

第四, 人脸追踪,视频是动态而非静止的,当用户脸部移动、转动时,阿里云SDK可以实现对关键点的追踪,可识别姿态范围为yaw±60°,pitch±45°,roll±45°,精准的捕捉动作,持续追踪动态贴纸和AR特效。

阿里云人脸识别SDK具有准确度高的特性,通过68个关键点检测和以上技术,实现平均错误率低于 5%,出现“对不上”这种尴尬场面的概率极低。据悉,阿里云未来也会推出商业版人脸识别的高级功能,满足更高级客户的需求。

在性能方面,阿里云人脸识别算法和其它厂商算法在测速上的区别如下:
_
注:以上测试480p的最小人脸尺寸为48*48(px);720p的最小人脸尺寸为72*72

从上表可以看出,本人脸识别算法在同样机型、同等测试对象的条件下,测速表现大幅优于业内友商。经过阿里云集团手淘亿级日活跃用户产品的考验,性能方面毋庸置疑。由于该算法也应用于手淘相关业务之中,所以后续的迭代、维护都会有强有力的保障。

阿里云人脸识别SDK的免费开放,给短视频行业带来了无限的可能性。基于阿里云,创业者和用户们都有了更多新鲜的玩法,创新机遇随之而来,希望整个行业能产生更多元、更深入的探索。

原文链接:https://yq.aliyun.com/articles/216752?spm=5176.100244.teamhomeleft.1.dLHtjZ

分享到:
评论

相关推荐

    opencv-4.5.0源码

    9. 高级视觉任务:如手势识别、人脸识别、表情识别等,这些通常需要结合机器学习和深度学习技术。 在深入OpenCV-4.5.0源码时,开发者可以关注以下几个方面: 1. **模块化设计**:OpenCV采用模块化设计,包括core...

    android studio opencv环境搭建小案例

    在Android开发中,OpenCV可以用于实时图像分析、识别、跟踪等功能,广泛应用于人脸识别、二维码扫描、AR增强现实等领域。 **环境配置步骤:** 1. **安装OpenCV SDK**:访问OpenCV官网...

    扫码支付服务端

    随着5G、AI等技术的发展,未来的扫码支付可能会更加智能化,比如结合人脸识别、AR等技术提供更丰富的支付体验。 7. 法规与合规: 在开发和运营扫码支付服务端时,需要遵守国家相关的金融法规,例如《非金融机构...

    java开源包10

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包101

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    Java资源包01

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包1

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包11

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包2

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包3

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包6

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包5

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包4

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包8

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包7

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    java开源包9

    GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列的数字图像。使用简便和直截了当,用户只需要加载的图片和调整帧您想要的,如位置,时间显示和处理方法前帧。 Java的...

    JAVA上百实例源码以及开源项目源代码

    Calendar万年历 1个目标文件 EJB 模拟银行ATM流程及操作源代码 6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB...

Global site tag (gtag.js) - Google Analytics