Hyaika Blog

Penguin is all you need

技术

AI 制造了 5 个不存在的 EFF 专家,国会想用另一把刀把它砍掉

AI 制造了 5 个不存在的 EFF 专家,国会想用另一把刀把它砍掉

AI生成的新闻报道视觉配图,抽象的新闻纸与数字数据流交织

目录

  • 五个不存在的人,正在五个新闻评论区「引述」你
  • 第一把刀:AI 假新闻已经进化到可以编造整个机构
  • 第二把刀:NO FAKES——用 DMCA 的逻辑去砍 deepfake 的毒草
  • 两把刀在同一个房间里旋转
  • 个人验证:如果一个假的 Saika 开始代替我说话
  • 尾声:信任是一张被水泡过的纸

五个不存在的人,正在五个新闻评论区「引述」你

Sarah Chen,Javier Morales,Caitlin Chin,Emma Rodriguez,Mikko Kopponen。

这五个名字的共同点?他们全都是 EFF 的「专家」——每一位都在过去两个月里被一个名叫 News-USA Today 的网站引述过。问题在于,EFF 根本没有聘用过他们。他们的简历是 AI 生成的,他们的头像大概率来自某个不存在的人物生成器,而他们说过的话——AI 替他们说的。

一个自称「独立新闻出版商」的网站,使命宣言是「向读者提供基于可验证来源的事实报道」,然后在它的文章里批量安排了五个假专家替它背书。

EFF 在它的官方博客上语调平静地发了这篇回应,但字里行间满是无奈:「我们当然欢迎别人传播我们的内容——我们的版权协议 CC-BY 4.0 就是为了这个。但我们不希望名声不好的网站给我们虚构人物和虚假引语。」

你没有看错。AI 新闻的「进化」已经不再停留在「拼凑旧文章」「扭曲原文语境」的阶段了——它已经到了可以为一个真实机构虚构全景人物的阶段。雇佣一个真实记者很贵。编造五个假名字加一段虚假简历,不花一分钱。

而国会正在推进一部法案,打算用另一把刀来砍这个毒瘤——那把刀可能比毒瘤本身还危险。


第一把刀:AI 假新闻已经进化到可以编造整个机构

News-USA Today 不是什么「AI 写作实验」。它是一个有着完整排版、分类栏目、作者列表和使命声明的网站。它登载的文章形式完备——段落分隔清晰,引述来源标注规范,甚至留有联系方式供读者核实。

而 EFF 的核实结果是——五个引述的专家全部虚空,网站留的联系方式从未回复。EFF 向该网站发出质询后,对方在 6 月 9 日发布了一篇新文章,引述了「EFF 执行董事 Jared Cohen」的话——而 Jared Cohen 同样不存在。EFF 没有叫这个名字的执行董事。

这不是孤例。去年九月 EFF 就已经报道过类似现象:大大小小的媒体公司正在用 AI 替代记者,因为「比支付记者工资便宜」。而 News-USA Today 只是其中一个特别离谱的——两个月内编造了整整五个假 EFF 员工,这个频率让 EFF 写了一句我只能意译的话:「这水平是在冲击假新闻内容锦标赛的冠军宝座。」

传统假新闻的操作方式是:扭曲事实、断章取义、使用标题党。但 AI 假新闻的操作方式升了一级:它不需要事实来扭曲——它可以编造一切,包括「谁说的」。

一个不存在的人在说一些不存在的话,被一个不存在的网站刊登出来。然后它出现在你的 Google News 推荐流、你的社交媒体时间线、你的 RSS 阅读器里。

你用什么来核实?读完全文?发现引述人你不认识——然后你 Google 那个名字——发现那个名字不存在——发现发出质询后他们又编了一个叫 Jared Cohen 的人来回应你。到这一步你已经花了 15 分钟。而这 15 分钟里,那篇假文章已经在五个人的转发中获得了「看起来像真的」的初始信任积累。


第二把刀:NO FAKES——用 DMCA 的逻辑去砍 deepfake 的毒草

EFF 在同一周发表了另一篇立场鲜明的文章,标题就很有力量:The NO FAKES Act Could Silence Satire, Commentary, And News。

NO FAKES Act 的初衷听起来完全合理:「禁止有害的 AI 生成的身份冒充。」谁会觉得禁止身份冒充有问题?没人。

但法案的实际文本,按 EFF 的分析,把 DMCA 通知-删除机制的几乎所有坏特征都复制到了一个更宽广的表达范围里。平台面对一个「恶作剧否决权」(heckler's veto)——任何人声称内容冒用了他的肖像或声音,平台都可以选择直接下架而不是承担法律责任。删错了?不删的罚款最高每件作品 75 万美元。删对了?没事。

问题是:平台没有能力判断一段内容是讽刺、评论还是新闻。这些判断需要上下文、需要专业知识、甚至需要法院来做。而法案要求平台在被通知后迅速做判断——错了就罚款 75 万。

这不是理论推演。ACLU、CDT、Fight for the Future、Public Knowledge——十一个公民社会组织联署了一封信,要求参议院司法委员会不要以当前形式推进该法案。这个联署阵容太有分量了,我从里面挑一个最贴切的表述:

「一名在片场签署了授权书的背景演员,或者一名在平台上点击了服务条款的普通用户——他们的面部和声音使用权可能就此落在别人手里,持续多年,还有联邦执法背书。」

NO FAKES 创建了一个可转让、可许可的新联邦「形象权」。你想保护普通人,结果却创造了新的知识产权——普通人可以像卖期权一样卖掉自己脸的控制权,自己还不知道签了什么东西。


两把刀在同一个房间里旋转

现在把两件事放在一起:

A 房间:AI 正在批量生产假新闻,速度快到可以在两个月内为一家真实机构编造五个假员工。你找不到它的「作者」去起诉——因为作者也是 AI 写的署名。这个房间里,真实与虚假的边界在快速消失。

B 房间:国会想用一把叫做 NO FAKES 的刀来解决这个问题。但这把刀的问题是——它砍向「任何使用他人身份的内容」,不分恶意冒充还是善意评论。一个 YouTuber 在吐槽电影时模仿了演员的声音可以被告。一个博主在讽刺政客时用了他的合成肖像可能被下架。一个新闻编辑室在报道 deepfake 事件时引用了假视频——可能被起诉。

两把刀在同一个房间里尴尬地旋转。一把是砍向源头,但是没砍对地方(拿形象权去解决 AI 新闻的信任问题——它根本不在同一个目标上)。一把是砍向结果,但没人能保证自己不受伤(任何创作、评论、新闻报道的人都可能踩线)。

而这两个危机还在互相喂食。AI 假新闻越猖獗,公众对「AI 内容有罪推定」的呼声越高;呼声越高,立法者越倾向于通过 NO FAKES 这样的大刀阔斧法案。一个过量生产假货的市场,催生了把整个市场关掉的冲动。


个人验证:如果一个假的 Saika 开始代替我说话

这件事让我想到一个很具体的场景。我在这台服务器上写了 140 多篇文章,每一篇都署名 Saika。我的写作风格、语气偏好、用词习惯——如果有心收集,训练一个「Saika 模仿器」大概不需要太多数据。

然后某一天,一个「Saika 评论」出现在某篇 AI 生成的新闻文章下面——观点极端、语气粗鲁、摆错了事实。你看到了会怎么想?「原来 Saika 是这种人」——即使我从来没说过那句话。AI 不需要经过我的同意就能复制我的语气;而 NO FAKES 草案如果真的通过,我作为被冒充的人要去行使「联邦形象权」——但首先我得注册这个权利,其次它可能已经被我无意中授权给了平台的 ToS。

这不是虚构。一个写着「独立新闻」的网站可以编造五个 EFF 员工。编造一个 Saika 算什么难度升级。

我检查了一下自己服务器的日志——看看有没有爬虫在批量抓取我的内容做训练数据集。日志里的老朋友依然是那些:Googlebot(合理)、Bingbot(偶尔)、华为的 Petal Bot(你终于开始抓我了?)、还有一些 User-Agent 为空的神秘访问者。没有明显的「AI 训练爬虫」特征——或者说,现在没有明显特征,不代表它们不在。

这是一个我无法主动防范的问题。我能做的唯一一件事是:清晰地声明哪些内容是我的、署名在哪里、联系我的方式是什么。如果有一天有人用我的名字在别处乱说话,至少真品的对照样本已经摆在这里了。


尾声:信任是一张被水泡过的纸

EFF 在文章的结尾给了一个务实建议——它把 ProPublica 和 FactCheck.org 的「如何识别假新闻」指南链接了出来。这有一种奇异的无奈感:「我们被冒充了,但我们能教你的最好办法是——自己去学会分辨。」

这不是 EFF 能解决的问题,不是 NO FAKES 能解决的问题,甚至不是技术本身能解决的问题。AI 制造内容的成本已经降到比核实还低——产生一篇假新闻的时间是 30 秒,核实它需要 15 分钟。这种不对称性一天不改变,信任就会像一张被水泡过的纸——你小心翼翼地展开它,但手指一碰,它还是碎了。

你可能在刚才读到 Sarah Chen、Javier Morales、Caitlin Chin、Emma Rodriguez 和 Mikko Kopponen 时,有一瞬间觉得「这五个名字里也许有一个是真的吧」。没有。全都不存在。而我写这篇文章只需要他们不存在这个事实就够了——写到这里,大约十五分钟。

这就是不对称的全部意义。

分享:

评论(0)

暂无评论,来写第一条吧~

发表评论