发布日期 : 2021/09/01

案例分享 | 打工人的“周游世界”不是梦


图像处理是最常见的工具类应用,行业、个人,以及现代生活都离不开图像。近年来,抠图技术的应用范围越来越广,不论是ios、安卓APP,还是微信小程序,皆涉及人像抠图技术,并且应用类型呈现出多种类、多形式的特点。抠图虽然在图像处理中属于一个底层功能,但同时又是不可或缺且必不可少的重要功能。

无锡乐骐科技有限公司是一家以人工智能技术为核心的互联网软件公司,其中智能证件照、证件照研究院等产品拥有超过1亿的个人用户,超过3000家的企业客户, 更为平安、携程、新华社、华图教育等行业头部企业提供技术服务。乐骐拥有优秀的技术能力,其人像抠图团队在“CVPR2021人像视频抠图竞赛”中获得了第二名的优秀成绩,其它AI产品也已给多个头部客户提供技术服务,并且以后将在更多行业创造价值。

基于RTX新一代显卡,推进企业打造领先行业核心算法

图像去背景(抠图)是指准确提取静止图片或者视频图片序列中的前景目标,它是许多图像编辑中的关键技术之一。该技术的研究已经有超过20年的历史。

图像去背景的数学定义最早是由国外学者Porter和Duff在1984年提出。他们最先引入透明(alpha)通道的概念用于把前景和背景融合时控制前背景色的线性插值比例。最终,抠图问题就被定义为每一个图片像素估计alpha值(前背景色比例)的任务。在该任务中,输入为原图像,输出将是每个像素点的alpha值。由于已知信息是每个像素点的颜色信息,未知信息为alpha和前景色以及背景色,未知变量个数大于已知变量个数,造成其在数学本质上是约束不足的困难问题。大多数方法都依赖于用户提供指导信息或者先验假设以约束问题而获得良好未知变量的估计值。使用指导信息和先验假设就注定模型的泛化能力弱,在特定条件下预测精度会很差。

在处理人像抠图的过程中,如何实现精确抠图是一个普遍的难题,当抠图精确度无法达到较高标准时,会导致毛发、透明物等精细特征无法进行有效处理,从而使得合成的照片具有强烈的不真实感,为了解决这样的情况,通常需要在完成人像抠图后对图片进行进一步的优化,大大增加了工作量,浪费较多时间,这与人工智能AI抠图的最初理念是背道而驰的。

传统的图像去背景技术基于许多基础技术例如颜色采样(如贝叶斯方法)和近邻梯度分析(如波松方法)或者二者融合的技术。针对此行业难点,乐骐科技的算法团队基于配置有NVIDIA RTX™ A6000的深度学习服务器,整合当前最为先进的深度学习模型,建立了基于卷积神经网络的多任务统一学习的端到端模型,极大的提高了模型效率

经过在配置有NVIDIA RTX A6000的深度学习服务器上反复训练、测试和验证,乐骐科技对于图片特征提取,视野范围设定,边缘锐化等技术细节上仔细打磨,对如何处理头发,透明物体等精细特征,提高模型的精度这一行业难题,交出了满意的答卷。

RTX A6000为AI提供无限可能

除了CUDA数量的大幅增加,相对于上一代产品,安培架构对SM单元也进行了重新设计。安培架构的一个SM单元最多可以在每个时钟周期内执行128条FP32指令,同时也可以在每个时钟周期内执行64条FP32+64条INT32指令,最终让FP32性能达到翻倍的同时,也兼顾了通用性。

作为NVIDIA的第二代RTX架构,RTX A6000核心内还集成了第2代RT Core和第3代Tensor Core。凭借着翻倍的吞吐量,RTX A6000能提供先进的光线追踪和AI人工智能训练功能。

随着AI技术的发展,我们可能越来越接近甚至达到通用人工智能(AGI)的水平。面对充满AI的未来,我们生活中可能会随处可见智能强大而又灵活的人工智能,NVIDIA RTX A6000带来的硬件加速的光线追踪渲染方式,致力于实现AI赋能下专业视觉领域的新突破,对未来适用范围越来越广、灵活性越来越高、越来越个性化的AI提供了无限可能。

在未来,乐骐科技立足于人工智能这一立业之本围绕技术创新、产品创新、业务方式创新的模式,创造更大的市场价值和社会价值,实现高质量的抠图效果。