龙空技术网

简单聊聊:“让照片动起来”背后的AI算法

黄浩在观察 170

前言:

当前同学们对“图片卡通化算法”大概比较注重,我们都需要了解一些“图片卡通化算法”的相关内容。那么小编在网络上搜集了一些有关“图片卡通化算法””的相关资讯,希望看官们能喜欢,咱们一起来学习一下吧!

你是不是也曾经在短视频平台看到过老照片的修复视频?甚至可能花钱请别人帮忙修复过珍贵的老照片?但这些可能你以为是专业的照片修复人员做的事情,其实只用一个软件进行 AI 计算后就能获得。今天就简单聊一聊“让照片动起来”背后的 AI 算法。

为什么目前 AI 技术带火的视频都是基于人像照片的内容?这就要从这项技术的原理“生成对抗网络”说起了。生成对抗网络,业内简称“GAN”( Generative Adversarial Networks )。

拟人化的GAN

Generative 在英语里面是“有生殖性的”意思,Adversarial 是“对抗的”,Networks 是 “网络”,所以简单来说“GAN”就是一种可以自我繁殖进化的网络模型。

那么“GAN”主要做的是什么呢?以它最常用的图像识别领域为例,比如看图识狗,网络模型会有一组算法专门搜集狗的图片,并根据这些图片生成一只“不存在”的新狗,而它的对抗算法则是要识别出这只“不存在”的狗。

然后通过它们不断地对抗训练,最终这套算法一方面“造”狗能力超强,一方面“识”狗能力也超强。

目前,我发现在图片领域做得比较深入的是国内飞桨 AI 工作室做的“PaddleGAN”,基本上我们看到比较火的照片动态视频技术他们都有涉猎:

照片动漫化

人像卡通化

唇形同步

脸部动作迁移

老视频修复

图像变换

超分辨率

老照片修复曾经是抖音上风靡一时的收费项目,后来小火了一阵的“蚂蚁呀嘿”也让不少人为之付费,现在它们则是加成在一起,让老照片活过来唱歌说话成了更新的玩法。而这些技术,只要会一点 Python 语言,就可以找到开源的代码让 AI 来完成。

目前看到的新项目有老人变年轻、大人变小孩,可以克隆声音的“柯南变声器”等等,未来你可能真的无法判断屏幕后面的那个 TA 到底是男是女,是老是小。这是科技带给我们的神奇,也是科技带给我们的困扰,要科技向善,终究还是要看使用它的人。

这里是「 黄浩在观察 」,观察世间动向,剖析深度思考,为你分享科技生活新认知,说说我的所闻所想,也欢迎在留言区 po 出你的观点或者问题,我会精选出有价值的观点和问题,为你解读和解答 ~

标签: #图片卡通化算法 #图片卡通化算法怎么做