从灵魂摄影术到换脸App:谈技术的普及与滥用

从灵魂摄影术到换脸App:谈技术的普及与滥用

发表于界面时评:“从灵魂摄影术到换脸App:人类与PS技术的对抗史

 

一款叫做ZAO的换脸APP一夜爆红,引起了广泛争论。很多人对于换脸技术的普遍化感到担忧。

利用AI技术给视频换脸,其实并不新奇。在2017年,一个名为deepfakes的网友开始分享把主演换脸成影视明星的色情影片,引起广泛关注。后来,相关的程序代码被开源共享,相关技术加速发展,一些衍生应用早已是普通人容易上手的了。

换脸技术当然也有一些正经的用途,例如在一些影视剧拍摄中使得在露正脸的情节中也可以完全使用替身。但是它的大部分用途,似乎都颇为恶劣或者说至少看起来很危险。

例如,传播伪造的色情视频来诋毁某人声誉,传播政治人物的虚假宣言,用伪造的借钱视频来骗取财货等等。

因此,我们当然有必要警惕这一新技术的传播。但我们应当做什么呢?

有人认为,这类技术就好比核武器那样,应当被严密封存,不允许在民间推广。

但是,首先我们注意到,封印这门技术已经不太可能了,它不像核武器那样需要宏大的工程和特定的原材料才能制作,甚至不像枪支那样需要精密的铸造工艺,它只需要一台电脑,最普通的能打游戏的家用电脑,用开源的程序,就可以做到换脸。难以封杀,也难以监控。

其次,这门技术与杀伤性武器毕竟不同,它并不总是能产生威胁,它的危险性并不是直接针对肉体的,而是首先在观念层面上起作用的,它带来的伤害与人们对它的认知有关。

我们回溯历史,很容易注意到,这种“危机”并非第一次出现。

在视频换脸技术之前,图片换脸技术早已成熟了,那就是我们熟悉的“PS”技术。它也可以把影视明星或你梦中情人的脸换到色情图片上面,也可以提供让任何人出现在任何地方的伪证。

那么我们是如何应对PS技术的呢?很简单,那就是不再轻信静态图片,人们看到一张数码照片的时候往往不会轻易下结论,至少要进行视频通话或者依据一段完整的监控视频,才能增加可信度。而现在,继照片之后,视频的真实性也要大打折扣了。

但照片也好视频也罢,它们本身也是科技的产物,并不是古已有之的或所谓“自然”的东西。人类并不是从一开始就理所当然地相信它们的。

摄影术在19世纪上半夜发明出来,最初传播过程中经常遭到误会,认为是一种巫术,会摄取人的灵魂,让人折寿。进入中国的洋人摄影家在上层社会的接受度还不错,但在底层却经常受到攻击。

另一方面,利用照相伪造真相的行为几乎从一开始就出现了。在1839年,达盖尔摄影法首次公开发表,第二年,另一位摄影术的研究者巴耶尔就拍摄了一张自拍照,宣称照片中的人比达盖尔更早发明摄影却未被承认,因而已经自杀身亡,希望博得公众关注。

在1860年代,美国摄影师威廉·穆勒(William H. Mumler)开始推销他的“灵魂摄影术”,宣称能够拍出已故亲人的影像。他找来林肯的遗孀,让她在拍照时默默怀想林肯,结果在拍出来的照片中浮现出貌似林肯的影像,让他名噪一时。当然,其实他是利用了二次曝光的技巧,虽然唬住了普通人,但遭到摄影师们拆穿,在业内声名狼藉。但是,灵魂摄影术在穆勒之后仍然被继续发展,甚至让柯南·道尔深信不疑,还远渡重洋来中国忽悠了一大群人。

那么,在这些骗术中,哪些人容易被骗,哪些人又能揭穿骗局呢?

显然,越是懂得摄影相关的知识与技术的人,越是不容易被骗。

在当时,有人控诉穆勒的灵魂摄影术欺诈,但他们无法拿出穆勒如何对照片作假的直接证据,于是他们提供的证据是:“我也能做到”。一位控告者雇了一个摄影师,也为自己拍摄了一张灵异照片,效果和穆勒的差不多,证明他也是这么干的。

平心而论,某种效果能够通过作假达成,并不能证明达成该效果就一定需要作假。因此,法官最终作出了无罪宣判。但是“能够作假”确实有助于识破作假,至少能够让人在面对所谓证据时多一些谨慎。

因此,随手就能拍出“灵魂照片”的摄影师,就很难被“灵魂照片”忽悠。

类似地,当你我随手就能对照片进行PS时,也就更难被PS的照片忽悠。

同理,当人们越来越容易进行视频换脸时,换脸视频的欺骗性或许也将减弱。

这些情形与那些“唯物主义”的武器完全不同,了解原子弹的制造知识,并不能帮助你抵抗原子弹;了解手枪的伤人原理,并不能帮助你躲子弹。但是在上述技术中,知识的普及有可能减轻它的危害。

如果100个人中只有1个人懂得双重曝光,那么其余99人都可能成为骗术的受害者。当知晓者从1人扩张到3人时,潜在的骗子与潜在的受骗者就变成3:97。

3个人骗97个人,产生犯罪的可能性就很可能比1个人骗99人多得多。但由此认定技术知识的扩散加剧犯罪,是不够准确的。因为当技术广泛传播到了一定地步,例如97个人都懂得相关知识,而只剩3个人容易被骗时,实际产生的犯罪率反而会大大缩减了。更何况,这97人之间还会互相监督、互相揭穿。

因此,与其说是新技术促进了欺骗,不如说是技术传播过程中的不平衡促进了欺骗。率先掌握新科技的人总是能够抢占先机。例如欧洲航海家可以拿着廉价的玻璃珠从非洲人那里换来黄金,而如果非洲人“也能做到”,那么玻璃珠的暴利就不复存在了。

我并不是说我们该无动于衷,放任新技术随意扩散,更没有为某款APP背书的意思。我想说的关键在于,对于新技术带来的危险,不能一味只考虑禁止和控制,特别是在难以控制的情况下,反而要去考虑以何种方式引导和促进它的传播。

在新技术应接不暇的同时,社会大众的相关知识、文化、伦理和法律的滞后性成为严峻的社会问题,而随着我们迈进日新月异的技术时代,这种滞后性成为了常态。研究者和立法者们除了要对不断出现的新技术本身的原理与功能进行评估之外,更需要关注技术及其相关知识的传播与交流过程。

6 Comments

  1. 说个此博客的bug,看了一下有密码保护的文章,通过摘要页的源代码可以看出其 img 标签指向的图片地址(300×180的缩略图),进而猜到了原图的文件名,然后就看到了本应该避免被看到的加密内容= =

    可以试着给文件名生成一些随机乱码~

    1. 谢谢。不过你是看到了图片还是看到了加密的文章内容?本来加密就是针对文章内容,图片倒是无所谓。另外,之所以加密不是因为我不想公开内容,而是为了避免内容过度传播,能破解也无所谓吧……

  2. sssss

    这种东西只能靠政府约束,靠个人学习完全没可行性。
    一个人又不是无限寿命 + 无限记忆力,可能从出生到死亡,都无法遍历现有骗术种类的万分之一。

    1. 我谈的不是如何打击骗子的问题,打击骗子当然是政府的责任,我又不是说不需要政府约束了。

      但你说的所谓可行性是什么意思呢?普及一下知识就能杜绝犯罪?当然不可能啊,谁会怎么想呢?

      我们讨论的就是对某种技术及其相关知识的“约束”问题。是看到这一技术有促进诈骗的可能性就一味禁止,还是说除了禁止传播之外还有更多的办法?

      一个人的知识当然是有限的,但我们讨论的本来就是社会问题。比如说,一个警官的知识有限,穷其一生也见识不到所有犯罪类型的万分之一,但为什么某一个警官还是有可能去扼制犯罪,或者侦破案件呢?

      道理很简单,第一,虽然知识无限,但多学一点总是好一点,在某时某地最流行的骗术其实没那么多样;第二,警官有同事,普通人有亲朋好友,合作和交流是常态。比如说我虽然不懂摄影,但我知道我熟悉的几十个亲朋好友之间有一位摄影专家,那么当有人拿着伪造相片忽悠我时,我虽然自己不懂,但顺口找人讨教一下,也许就避免了被骗。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据