一夜之间,一个名叫Zao的应用火遍社交网络。

这款主打视频换脸功能的App似乎有着非凡魔力,8月31日凌晨突然蹿红,到当天早上9点,Zao AI 换脸话题已快速登上微博热搜榜第10位,20分钟后就已攀升至第7位,iOS商店内的App下载量也超越爱奇艺、腾讯视频两大国民级应用,攀升至娱乐类第二位,仅次于榜首的西瓜视频——此前以令人瞠目结舌之势在社交网络走红的App,还是音乐K歌社交应用“音遇”、知识抢答应用“冲顶大会”,再往前追溯,是另一个图片换脸应用Faceu(原名脸萌)。
7cae
Zao并非生而能红,App Store更新记录显示,该应用在三个月前上架了第一版0.2版本,目前的1.1版本已是第三次更新。
Zao的玩法并无甚特别,甚至说很单一——用户可通过上传照片(通常是自己的照片),用AI换脸功能,将短视频中的演员换成自己的脸,然后分享朋友圈,号称“可以和自己的偶像同框”。
行业人士迅速跟进,扒出了部分底细,你可以把Zao这款App理解为是陌陌的“孙公司”开发的产品。不过,直到虎嗅发稿为止,陌陌官方也没有回复“陌陌与Zao的关系”的问题。
陌陌在周五美股市场表现优秀,收盘股价上涨2.79%,盘后还涨了0.27%,看起来爆红产品的冲击波多少带动了一些市场情绪。

Zao一点也不新鲜

除了上架时间,Zao的功能也不新鲜。这款App功能极简、难度极低、口碑发酵速度极快,堪称典型的现象级应用。

AI换脸,不是新鲜事。

2017年底,国外一位ID为“deepfakes”的网友,利用业余时间创造了一个AI换脸算法。后来这个算法也被广泛称为deepfakes。
这个机器学习算法,首先在小圈子炸开。在国外的Reddit论坛上,有一个deepfakes社区,一个月内聚集了1.5订阅者,并产生了大量的AI换脸视频。
随后,这个社区逐渐变成了生产假冒爱情动作片的“黑窝点”——不少人用AI技术将色情作品中的主角换成明星的脸。有文化,真可怕。小电影,可造假。
也正是因为这样,这个社区引发了大量的争议,最后被彻底关掉。
但这个AI换脸这个技术,却一直进化至今。比如今年初,B站UP主“换脸哥”,使用者个技术将94版《射雕》里朱茵扮演的黄蓉,换成杨幂的脸。
效果是真的好。(详见:朱茵变杨幂,流量一个亿)

eb0d324b0e1144fcaf582548d7db4789

e648233f560d42128cc74264193be348

还有徐锦江对战灭霸、洪世贤换脸艾莉等等。(详见:B站名场面全被AI换脸调戏了一遍)

7e3fa9f91bce48e0862b6afeb026b8d5

495719e9e6844dceb589f678e28db1e1

但,为什么ZAO大火特火了?
原因很简单。因为ZAO最简单。
最初的deepfakes只是一套算法,是基于Keras等多个开源库完成的。后来有位高手添加了一些工具,封装成引用FakeApp。这是一个桌面应用,可以运行deepfakes算法,无需安装Python、TensorFlow等,仅需要“支持CUDA的高性能GPU”。
这听起来简单,但对于普通用户来说,下载、安装、训练都是费时费力的大工程。所以通常都是一些爱好者制作发布,大家欣赏换脸后的成片。
而这次ZAO把门槛一下拉低到近乎没有。
用户想要体验AI换脸,不再需要电脑、高性能GPU、数据集、编程和AI知识,只需要一部手机,一张自拍,就可以把多种影视场景中主角的脸,换成自己的脸。
这是一种前所未有的体验,而且效果虽然不能说特别好,但通常情况下,都是相当不错的,至少可以让用户有动力发到朋友圈去显摆一下。
烧自己的钱,让用户爽,从这一点来说,ZAO当然有火的理由。当然ZAO应该也不缺钱,毕竟背后是著名的公司:陌陌。
 

商业模式问题。

到目前为止,Zao没有任何付费功能, 在一夜之间爆火之后,其服务器一度瘫痪。一家公司做一款不赚钱且很难留住用户的产品,是不是另有所图?
监管风险。目前,Zao依然是UGC模式自行上传或“造”视频,但应用开发方是否有能力阻止用户上传“不合适”的照片替换视频,是两难——如果用户上传了不该上传的照片并替换了视频,通过社交网络传播,而Zao并没有阻止,那么它将面临极大的监管风险。毕竟有覆辙在先:Zao的技术原理与deepfakes相似,2019年1月,曾有人利用该技术伪造了一段奥巴马的讲话视频,从视频来看几可以假乱真。
但如果用户上传的每一张照片都要被Zao检测是否“合格”,那么它将面临另一个风险——
用户隐私难以保证。用户通过Zao在平台使用并替换新头像,其图像信息是否留存在服务器中?大概率是要留下来的——做什么呢?AI人脸识别是个好生意。一家大公司通过马甲公司来收集信息,用数据把AI喂熟,很顺理成章。毕竟有大佬曾经说过:“中国人愿意用隐私换取便利。”有的人是嘴上说,有的人则是默默地做了。
刷脸支付、视频解锁又要被破解?
8月初,有人利用3D人头模型破解刷脸支付的消息传出后,一度引发用户担忧。不过当时3D人头模型制作成本太高,而今,一键换脸技术如此成熟,我们是不是也要再次担心一下钱包安全和智能设备解锁问题?
另外,ZAO也让很多用户有强烈的隐私担心。
毕竟这是一个需要上传人脸数据的应用,而人脸作为生物识别信息,很多时候已经成为我们的重要资产的密码。
比方韭菜教育专家李笑来就在微博上说:“ZAO可能很危险的… 别看你今天玩得开心,过段时间就有可能你的支付宝被盗刷脸了?不过这事儿很难怪ZAO,谁让你认知浅薄了呢?”

048ccbf7e6bc4890b660f7be7136d8b6

还有ZAO用户、隐私协议里的一些话,也被很多人拿出来质疑。

20e16d5767c543489ba42fdf5b34ec6b

比如上面这句,就被集火抨击。
当然还有人替ZAO着急,毕竟之前大火过的各种换脸应用。基本上都难逃一阵风的宿命,亲爱的用户们新鲜劲很快就过去了,保质期可能都不到一个礼拜。
换脸背后的技术
ZAO没有公布背后的技术细节,但AI换脸本质上都是大同小异。
前几天,有个国外的团队制作出毫无破绽的换脸视频,同时也披露了背后的技术细节。那就是开源项目:DeepFaceLab。
DeepFaceLab是Deepfakes换脸术的一个软件工具包,安装简单,使用方便,更新及时。在GitHub上已有5000多星。
代码公开是一方面。另一方面,从项目描述看,不需要太多算力就能跑 (详见下文) 。总体说来门槛很低。
软件包里有多种模型,各有特点:
H64 (2GB+显存)?,64像素模式。这是经典模型,DeepFakes最初扬名就是靠它。DeepFaceLab对它做了些改进,让这个模型在低显存情况下也能用低配置参数运行。

197f15c9ebdd4f49ac1e55183cb7ede9

H128 (3GB+显存)?,128像素模型,比H64像素更高,细节更丰富。能应对大部分远景和中景镜头,适合亚洲脸型。

1de830cb73e844f180eea1bbc571b1b3

DF (5GB+显存)?,H128的全脸模型。它换出来的脸通常比H128更像,但兼容性更差,边缘问题突出。

d96be630b76e4c61af46f12ea5af6a01

LIAEF128 (5GB+显存)?,结合了DF,IAE的改进型128全脸模型。这个模型存在闭眼识别问题。

269f97b3824047d6b49602de0861fd39

SAE (最低配置2GB+,推荐配置11GB+)?,风格化的编码器,基于风格损失的新型超级模型。可以有效重建被遮挡的脸。可玩性高,参数可调,调优空间大。

86866128e81c43cbafd793f018f36e80

DeepFaceLab唯一的安装要求就是对应版本的显卡驱动,甚至不需要CUDA和CuDNN。
软件的中文官网提供了下载通道?(有无需魔法的百度网盘版本)?,以及详细的安装教程。
同时还自带许多人脸图片数据。
官网说,DeepFaceLab虽然没有可视化界面,但步骤非常清晰,操作并不复杂。

16d43780b6a74f66802cde6c51566216

换脸主要分为五个阶段:
视频转图片、提取脸部、训练模型、人脸替换、合成视频。
每个步骤只需点击BAT文件即可执行。

e24ab3ac947241528dae381e314144b0

想要入门AI换脸的小伙伴,也可以在DeepFaceLab中文官网找到丰富的教程:
https://www.deepfakescn.com/
虽然,DeepFaceLab描述的硬件要求不高,但ctrl shift face能做到今天的效果,背后很可能有贵贵的GPU在燃烧 (尽管没披露技术细节,不知道有没有改进算法) 。
自学换脸配置指南
最后,贴一个量子位之前就发过的指南。如何才能自己动手搞AI换脸。
目前网上已经有fakeapp、faceswap、deepfacelab等一大批现成换脸软件,只要有够强的硬件,你也能自制一段换脸视频。
这些软件都一个基本要求,就是必须支持英伟达的CUDA。
通俗地说,如果你最近几年为了玩吃鸡这类游戏配置了一台PC,而且安装的是英伟达的独立显卡,那么运行Deepfakes应该是没问题的。
根据国外网友的实测效果,要运行fakeapp且电脑不崩溃,至少需要以下配置:

  • 至少有2GB显存的英伟达GPU
  • 英特尔i3或者AMD 9处理器
  • 8GB内存
  • 20GB剩余硬盘空间

以上只是最低的配置,制作一个换脸视频可能需要几天才行,是不是感到电费在燃烧?如果为了省事中途截断,效果会惨不忍睹。
去年科技媒体The Verge的记者还真试了一把,她的电脑给人换脸大概需要一天的时间,如果只训练几个小时,结果根本没法看:

ab1b1bde58c745489bf561e929ecada6

从电脑屏幕上来看,训练过程是这样的:

240ea57cff894da4a470c679936e4d02

如果你不想每天早晨打开电脑都看到上面的画面,那么我们推荐以下配置,它能讲训练时间缩短到只有几个小时:

  • 至少4GB显存的英伟达GPU(GTX 9系或者更高,多数网友推荐GTX 1060 6GB显存,售价1699元)
  • 英特尔i5或AMD Ryzen处理器(以i5-8400为例,售价1599元)
    12GB内存(购买2条8GB内存,总价700元)
  • 100GB剩余硬盘空间(考虑到其他占用空间,购买250GB固态硬盘,价格大约300元)

以上只是主要部件的价格,再加上主板、电源、机箱,总的主机(不包括显示器)价格区间在5000~6000元之间。
需要注意的是,在这里,硬盘空间比硬盘读写速度更重要。
因为训练Deepfake过程中大约每分钟会产生1GB的图像文件,通常SSD的空间较小,如果被训练数据占满,将会导致SSD性能下降。而机械硬盘的性能几乎不受剩余空间影响,非常适合用在训练Deepfake中。
当然,除了软硬件条件,你还得准备相应的视频素材。
最后友情提示,你自己准备好软硬件,也需要面临最开始提到的,钱的问题。根据Deepfake软件要求的硬件配置和训练时间,换一次脸就需要烧掉至少一度电以上。

发表评论