简单聊聊：“让照片动起来”背后的AI算法

黄浩在观察 06-16 180

前言：

当前同学们对“图片卡通化算法”大概比较注重，我们都需要了解一些“图片卡通化算法”的相关内容。那么小编在网络上搜集了一些有关“图片卡通化算法””的相关资讯，希望看官们能喜欢，咱们一起来学习一下吧！

你是不是也曾经在短视频平台看到过老照片的修复视频？甚至可能花钱请别人帮忙修复过珍贵的老照片？但这些可能你以为是专业的照片修复人员做的事情，其实只用一个软件进行 AI 计算后就能获得。今天就简单聊一聊“让照片动起来”背后的 AI 算法。

为什么目前 AI 技术带火的视频都是基于人像照片的内容？这就要从这项技术的原理“生成对抗网络”说起了。生成对抗网络，业内简称“GAN”（ Generative Adversarial Networks ）。

拟人化的GAN

Generative 在英语里面是“有生殖性的”意思，Adversarial 是“对抗的”，Networks 是 “网络”，所以简单来说“GAN”就是一种可以自我繁殖进化的网络模型。

那么“GAN”主要做的是什么呢？以它最常用的图像识别领域为例，比如看图识狗，网络模型会有一组算法专门搜集狗的图片，并根据这些图片生成一只“不存在”的新狗，而它的对抗算法则是要识别出这只“不存在”的狗。

然后通过它们不断地对抗训练，最终这套算法一方面“造”狗能力超强，一方面“识”狗能力也超强。

目前，我发现在图片领域做得比较深入的是国内飞桨 AI 工作室做的“PaddleGAN”，基本上我们看到比较火的照片动态视频技术他们都有涉猎：

照片动漫化

人像卡通化

唇形同步

脸部动作迁移

老视频修复

图像变换

超分辨率

老照片修复曾经是抖音上风靡一时的收费项目，后来小火了一阵的“蚂蚁呀嘿”也让不少人为之付费，现在它们则是加成在一起，让老照片活过来唱歌说话成了更新的玩法。而这些技术，只要会一点 Python 语言，就可以找到开源的代码让 AI 来完成。

目前看到的新项目有老人变年轻、大人变小孩，可以克隆声音的“柯南变声器”等等，未来你可能真的无法判断屏幕后面的那个 TA 到底是男是女，是老是小。这是科技带给我们的神奇，也是科技带给我们的困扰，要科技向善，终究还是要看使用它的人。

这里是「黄浩在观察」，观察世间动向，剖析深度思考，为你分享科技生活新认知，说说我的所闻所想，也欢迎在留言区 po 出你的观点或者问题，我会精选出有价值的观点和问题，为你解读和解答 ~

个人照一秒变漫画风，原来这么简单就能做到？