进入哈利波特的国际会说话的蒙娜丽莎什么样

时间:2019-12-24 06:45:07 阅读：6922+ 作者：责任编辑。王凤仪0768

年尾将至，从各类盘点榜单看来，2019也是收成颇丰的一年，人工智能、疫苗、气候危机等是本年几大热词。“Altmetric百篇论文榜单”日前发布，该榜单包括了本年热议度高、评论规模广的100篇研讨，本文旨在介绍榜单中最受注重的一种AI视频组成体系，一起也是榜单中的Top 1，从发布指数来看其Altmetric指数达13557。

蒙娜丽莎，或许只在人头攒动的卢浮宫曾与她远远对望，相视一笑，抑或是在网上看一睹其“奥秘”笑脸，转发了几个恶搞表情包。可曾想过，奥秘的蒙娜丽莎从传世名作中“复生”，并动起来了？这样的场景只在电影中见过，《哈利·波特》中格兰芬多休息室的胖夫人画像照进了实际。这项引起广泛注重的研讨便要从“会动”的蒙娜丽莎说起。

开口说话的蒙娜丽莎、焦虑的蒙娜丽莎，好像没那么高冷了丨Egor Zakharov, Aliaksandra Shysheya

这是实在头部说话神经模型的少样本对立学习，没有3D建模，仅以一张静态图画就能练习制作出视频的技能，令人称奇。

本年5月，三星（Samsung）AI实验室以及俄罗斯斯科尔科沃立异中心（Skolkovo Innovation Center）的研讨人员发篇题为 “Few-Shot Adversarial Learning of Realistic Neural Talking Head Models” 的论文，概述了这种技能。该技能依据卷积神经网络（CNN），模型经过取得一个输入图画，然后可以模拟输出视频中方针方针的运动状况，也便是咱们在上图所看到的。该研讨5月预印宣布，6月正式被计算机视觉范畴尖端会议CVPR 2019录入。

其实此类主意和技能在此之前也不少见，已经有不少研讨人员从事该类研讨。2018年，华盛顿大学研讨人员共享了他们创立的“真假奥巴马”——ObamaNet，该技能运用神经网络分析了数百万帧的视频，来确认奥巴马的面部表情怎么改变。以及加州大学伯克利分校（University of California, Berkeley）研讨团队运用YouTube视频练习AI，从而生成可以做后空翻等杂技动作的模型。大大小小研讨不在少数，可为何独独这篇论文能招引外界注重呢？

该研讨的特别之处便在于，其AI体系不需求经过很多数据集的练习进程，它只需看一次需求输出方针方针动作的静态图片就可以运转。研讨人员将这种学习办法称为few-shot learning。在few-shot learning的基础上，研讨人员选用元学习对VoxCeleb2（包括许多名人头像的数据库）数据集进行元练习（meta learning）。经过元练习，AI则学习到了怎样快速生成图画的才能，而不是详细生成某一特定类别图画的才能。

图丨Pixabay

接着，研讨人员运用对立学习（adversarial learning），创立了对立神经网络，可以像“仿制粘贴”的进程那样，将静态图中的面部信息“仿制”到动图或视频中。它们别离是：

（1）嵌入式网络：可以将输入的静态图画中人像的眼耳口鼻等概括信息，转换为相关向量从而传给生成神经网络；

（2）生成神经网络：经过仿制人像的面部标志（landmark），终究组成人在动态视频中的面部表情；

（3）区分神经网络：别离搜集生成神经网络组成的面部图画、landmark和实在的动态视频的面部表情信息，经过对立的办法提高生成神经网络的生成才能以及本身的区分才能。

形象来说，生成神经网络是“造假方”，区分神经网络则是“打假方”，而嵌入式网络则像“爪牙”。一旦前两者才能到达平衡，依据对立学习的AI模型的才能也就过关了。

3种神经网络的“对立”示意图丨参考资料[1]

经过上述对立学习的进程，加之元学习的办法，终究的AI模型可以在视频数据集上经过学习小量的样本，到达较强的学习才能，并可以使用此学习才能快速找到处理其他同类问题的办法。因而，终究的AI模型可以灵敏的依据静态图片生成林林总总灵动的图画，并将这些图片装帧从而生成动态图画。

除了蒙娜丽莎之外，这项研讨中，还有不少名人的静态头像也被研讨人员用来进行相关研讨。有穿越时空，与你进行科学对话的爱因斯坦。

图丨Egor Zakharov, Aliaksandra Shysheya

还有风情万千的玛丽莲·梦露重现魅力与光荣。

图丨Egor Zakharov, Aliaksandra Shysheya

从研讨和技能层面来看，这是AI视频组成体系的一次打破开展。从社会性视点来看，相同引发不少热议，有人担忧若是依据可观的转换率，视频通话是否因而会被造假？以假乱真会不会到达新高度？还有人表明未来流量艺人会否因而仅靠一张张美图便闯练影视圈？也有人在担忧人脸付出的安全性。更有脑洞大开着期望凭借此技能，与从前的中外智者进行平行时空的对话……

技能的更新迭代旨在便当造福人类，若是技能反而成为部分人的担负，并影响了社会秩序，那么技能合规有必要被注重。Deepfake技能引发了广泛谈论，让人“又爱又恨”，或许最近国家网信办出台的新规则，对AI技能换脸进行了清晰束缚，比如这样的行动或许可以大大削减部分人的担忧吧。

参考资料（可上下滑动检查）

[1] Few-Shot Adversarial Learning of Realistic Neural Talking Head Models Retrieved Dec 18, 2019 from https://arxiv.org/pdf/1905.08233v1.pdf

[2] Mona Lisa guest on TV? Researchers work out talking heads from photos, art Retrieved Dec 18, 2019 from https://techxplore.com/news/2019-05-mona-lisa-guest-tv-photos.html

[3] Samsung deepfake AI could fabricate a video of you from a single profile pic Retrieved Dec 18, 2019 from https:///news/samsung-ai-deepfake-can-fabricate-a-video-of-you-from-a-single-photo-mona-lisa-cheapfake-dumbfake/

[4] http:///a/315959168_129720

本文经授权转载自药明康德AI（ID：Smart-AI），如需二次转载请联络原作者

上一篇：红楼梦中薛蟠打死了冯

下一篇：外星人比地球人聪明吗

“如果发现本网站发布的资讯影响到您的版权，可以联系本站！同时欢迎来本站投稿！