您当前的位置 :首页 > 新闻 >  正文
自从有了AI,我已经开始分不清真假了
2021-02-18 19:07:08来源:

你能想象到你在论坛看到的高赞跟帖或者回答,其实并不是真人写的吗?

这可不是一本正经的胡说八道,而是切实发生在我们身边的事情。在国内,已经有人自己训练出来的NLP模型在知乎随机回答问题,并且做到了被点赞的答案的top3。

2020年9月,reddit增加了一名新注册用户thegentlemetre,这名用户每几分钟就会在网站的随机几个版块发表一条评论,例如讨论Radiohead或者甲壳虫乐队,直到这名用户在“你最主要的健身方式”问题下给出了一个莫名其妙的答案:


后续,这名用户相继给出了很多奇怪的回答,至此,不少人怀疑thegentlemetre到底是不是真人,有人还通过整理回答内容发现,这名用户几乎每个回答都是6段话,很符合GPT-3的生成模式。

至此,真相大白,thegentlemetre就是一个AI。

想象一下,如果知道在虚拟空间和你聊天的那个人可能甚至不是真实存在的真人,是不是已经觉得脊背发凉了?

但是AI的本事不仅如此,OpenAI今年又给人送上了一份惊喜大礼:他们在1月初连发了DALL?E和CLIP这两个连接文本与图像的神经网络。在这两个神经网络的帮助下,可以通过自然语言操纵视觉概念,比如输入“一把牛油果造型的扶手椅”,他们就可以通过图像合成,生成一系列的目标图像。


顺带一提,DALL?E只是使用了120亿个参数的GPT-3的小版本,它生成的图像,你觉得是人类设计师设计出来的吗?


是不是很恐怖?其实知乎并不是AI被用于回帖的第一阵地。最早有人用AI回帖,其实发生在美国的reddit论坛,事件源于OpenAI开发的最强语言模型GPT-3,通俗地说,这个AI最擅长的就是生成文字,甚至包括生成一篇像模像样的小说。

DeepFake的发展源于生成对抗网络(GAN)的出现和发展。该算法可以看做是一个基于数据库自动生成模拟数据库中数据的样本,之后通过识别器评估生成数据的真伪,通过生成器和识别器之间的互相博弈与不断学习,进而产生大量高精度的数据。

因为太过以假乱真,于是有人担心会有人用到歪门邪道上,事实这些担心并不是空穴来风,要知道Deepfake第一次亮相就是将《神奇女侠》盖尔?加朵的脸,嫁接到了一部成人电影女主角身上,此外由Deepfake制作的假视频已引发多起刑事案件,甚至卷入政治纷争。

同样在在图像处理领域,Deepfake这个知名的AI软件作的妖就更多了,它可以将图片或视频中A的脸换到B的头上。其名字由深度机器学习(Deepmachine Learning)和假照片(fakephoto)组合而成。这项技术不需要操作者具备深厚的专业知识,只要收集到足够素材,AI就可以完成。Deepfake换脸效果逼真,让人难以分辨真假,堪称现代“易容术”。

不光是Deepfake,NVIDIA在2018年年底推出过GauGAN用以生成本来并不存在的人脸图像,而在前年年底,NVIDIA则公开了StyleGAN的2.0改进版,解决了生成图像伪阴影的同时得到细节更好的高质量图像。现在我们可以用NVIDIA开源的代码生成各种汽车、人脸等等图像,也足够以假乱真。

但GPT-3的可怕之处在于其强大的可扩展性,甚至可以用在无代码开发领域,无代码就是就是不用敲代码也可以直接生成程序,GPT-3就是一个强大的无代码开发平台,只要对它输入你想要什么样的网页或者app,它就能帮你直接生成。外行人甚至无法分辨生成的网页是不是程序员写的。

种种的种种,都在预示着AI正在朝着越来越像人类的方向演进,上文中提到的灌水机器人是在回答时露出了马脚,那像Deepfake这种做“假视频、假照片”的凶手,人类又该如何识破其真身呢?

首先要明白,Deepfake的主要技术分为自动编码器和生成对抗网络两大块,自动编码器就是通过神经网络把一个人的照片特征抓取出来,然后用数字代表,同时将没有的表情用数字模拟的方式展现出来。通过训练,就可以找出一个最好的用数学方式来呈现照片特征的编码器。但自动编码器做出的照片是否自然真实还需要去判别把关,这就需要生成对抗网络技术,包括两个机器学习模型,分别为生成网络和辨别网络。生成网络做出假影片,在模型训练后产生伪造影片;而辨别网络则不断地检视假影片,直至它再辨别不了结果是假的。数据越多,效果越理想,假影片越真实。


本质上讲,DALL?E是基于GPT-3开发的的AI,而GPT-3则是一个自然语言处理模型,机器通过NLP理解了我们的自然语言,在1750亿参数量基础上的GPT-3,现如今已经可以做到更多事情了。

[产品售价]899元

想要辨别假影片的真伪,一个重要的思路就是“用魔法打败魔法”。Google前年就与科技孵化器JigSaw合作整合了“Face Forenesics Benchmark”项目用来帮助研究人员设计更好的检测方法;而Facebook则与Microsoft、MIT、Amazon等公司合作共同打击DeepFake,该项目被称为“DFDC”,旨在创建能用于“打假”模型训练的开源工具;12月,Facebook的人工智能研究部门宣布已经开发出一套反识别系统以辨别实时影像的真伪。

除此之外,也有通过眨眼率、语音和嘴唇运动的同步状况、情绪来判断的方法,但本质上讲,随着Deepfake技术的进步,加强对样本的学习之后,这几招就失灵了。

科技的发展为人们带来了很多便利,AI也是如此,我们在享受新兴科技带给我们的便利的同时,也要留心技术滥用可能带来的潜在风险,目前几乎没有任何工具可以帮助读者确信其在网上看到的信息来源可靠,且没有被篡改,下次在网上看到一张图片或者影像时,不妨思考一下:这是不是AI生成的?

[经销商]京东商城

看浙江新闻,关注今日浙江微信

分享到:
版权和免责申明

凡注有"今日浙江"或电头为"今日浙江"的稿件,均为今日浙江独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"今日浙江",并保留"今日浙江"的电头。

©2016  今日浙江网  版权所有