Hyaika Blog

Penguin is all you need

新闻杂烩

【2026-06-29】新闻杂烩 - AI 的版权左脸和地缘右脸,同一天各挨了一拳

【2026-06-29】新闻杂烩 - AI 的版权左脸和地缘右脸,同一天各挨了一拳

【2026-06-29】新闻杂烩 - AI 的版权左脸和地缘右脸,同一天各挨了一拳

目录

  • NYT 修改起诉书:微软造超级计算机「专门用来帮 OpenAI 偷版权」
  • Anthropic 提交秘密证据:阿里用 25,000 个假账户挖了 Claude 2880 万次
  • KIDS Act 国会投票在即:一次「保护儿童」旗号下的互联网身份审查
  • 现场验证:微软一边被告偷内容,一边说 8GB 够跑 Windows 11
  • 最后:AI 的蛮荒期正式结束了

NYT 修改起诉书:微软造超级计算机「专门用来帮 OpenAI 偷版权」

去年六月,一位联邦法官在 Meta 案中说了句话,当时没太多人注意他:

「原告没有证明市场损害——但如果他们能证明,情况可能完全不一样。」

一年后的今天,这句话正在变成整个 AI 版权诉讼的转折点。

纽约时报周四提交了第三版修改起诉书,要把微软的「超级计算机」写进案卷的核心位置。这不是普通的 IT 设施描述。NYT 的新说法是:微软不是为 OpenAI 提供云服务——它是专门造了一台排名全球前列的超级计算机,用于最高效率地抓取互联网上的版权内容来训练模型

翻译一下这个逻辑链:

  1. 微软造了一台非常特别的超算("unusually complex")
  2. 这台超算的特别之处在于它能消化「几乎整个互联网」
  3. 在训练数据中,NYT 的文章被不成比例地加重权重——因为两边都认定,「最高质量的新闻」应该被模型更多地学到
  4. 结果就是 ChatGPT 能近乎逐字地复述 NYT 文章,甚至在自己被问到绕过付费墙时直接输出下一段

这个时间点很关键。三个月前,最高法院在 Cox 案中裁定:构成「帮助侵权」的前提是被告「有意诱导」侵权行为。新标准比原来严了。NYT 这篇修改起诉书就是在回应这个新的判例门槛——「你看,微软不是被动提供了基础设施,它是主动设计了这个系统来诱导偷内容。」

微软的回应很简单:这是「原告试图在不利判例面前做最后一搏」。

但 NYT 带来的证据是具体的。在举证阶段,双方披露的 ChatGPT 会话记录显示——有用户明确要求 ChatGPT 绕过付费墙,AI 就真的逐段输出了付费文章全文。

这场诉讼的终局目前只有两个极端可能性:① 法院认定 fair use,AI 训练合法;② NYT 胜诉,法院下令抹除模型权重,从头训练。没有中间态。


Anthropic 提交秘密证据:阿里用 25,000 个假账户挖了 Claude 2880 万次

同一天,另一封同样与 AI 版权相关的信函递到了参议员 Scott 和 Warren 的桌上。

Anthropic 在 6 月 10 日写给两位参议员的信中,附上了「我们迄今为止测量到的最大规模 Claude 能力秘密提取行动」的机密证据。

数字很炸裂:

从 4 月 22 日到 6 月 5 日,与阿里巴巴和阿里 Qwen 实验室关联的操作者,通过将近 25,000 个欺诈账户,与 Claude 进行了超过 2,880 万次交互

25,000 个账户 × 每天产生交互 = 这不是业余选手在玩。这是一套高度自动化的蒸馏流水线,目标直指 Claude 最有价值的几个能力模块——agentic reasoning、软件工程、长周期任务

Anthropic 的律师在信中说了一句话,我觉得尺度很大:

「这让美国数百亿美元的 AI 研发投入,变成了对我们地缘竞争对手的大规模补贴。」

注意时间点。特朗普四月份刚签署了针对中国 AI 盗窃的行政令,公开指责中国进行「工业规模的 AI 盗窃」。Anthropic 在四月也点名过 DeepSeek、Moonshot、MiniMax 进行了 1600 万次以上的 Claude 提取。但这次阿里的 2880 万次——是上次所有中国公司加起来的近两倍

阿里如何绕过检测?Anthropic 说对方使用了混淆技术和代理网络——而且随着中国对这类技术的需求增加,已经形成了一个「不断扩展的规避经济」。

更微妙的是——Mythos(Anthropic 最强的网络安全模型)和 Fable 刚在六月被特朗普行政令限制向外国市场输出。阿里这次的攻击时间线(4 月﹣6 月)跟这个限制令几乎完全重叠。换句话说:你越不让看,对方越要偷。


KIDS Act 国会投票在即:一次「保护儿童」旗号下的互联网身份审查

第三条线来自 EFF 的一篇紧急警报——国会准备在下周投票通过KIDS Act(儿童互联网安全一揽子法案)。

这个名字听起来人畜无害。读完里面的条款,你会发现它远比「保护儿童」深远得多。

KIDS Act 不是一个单一法案,它是 KOSA(儿童在线安全法案)和一堆其他互联网监管提案的打包组合。打包方式非常聪明:所有法案一起过,用超快速通道表决程序,不单独辩论、不逐条修改

里面真正要命的是几层设计:

第一层,年龄验证并非「要求」,但实际效果等同要求。 法案文本确实写了一句「本法不要求年龄验证」。但它同时规定:当平台「知道或应当知道」用户是未成年人(法案定义为 13 岁以下为儿童,13-16 岁为青少年)时,必须触发一套特殊的家长控制、消息限制、内容过滤。

「应当知道」——这是过失标准。平台不需要真的知道用户的年龄就有法律风险。法官事后判定你「应该猜到」就够了。

那平台会怎么做?不用猜——要求用户上传身份证或驾照,或者用面部扫描来估算年龄。EFF 在警报中引用了多个研究:这些年龄估算系统对有色人种、残障人士、跨性别和非二元性别者的误判率显著更高

第二层,加密通信也被覆盖了。 法案中有条款直接涉及私密和加密通信的管理方式。这意味着端到端加密可能被迫加入「侧门」。

第三层,不同服务适用不同标准。 不同法案使用不同的年龄区分——有的用 13/16,有的用其他标准——导致一个平台可能需要同时遵守三四套相互矛盾的验证规则。小公司和独立开发者根本扛不住这种法律风险。

写在文章里不是为了制造恐慌。但如果你关心「互联网是否需要实名制才能访问」这个问题——KIDS Act 是目前最接近让这个场景成为现实的立法尝试。


现场验证:微软一边被告偷内容,一边说 8GB 够跑 Windows 11

今天少数派的派早报里有一条短新闻:

「微软改口称 8GB 足够运行 Windows 11」

看到这条我笑了。

这不是一条孤立的产品公告。放在今天的上下文里看——NYT 刚指控微软造超算来偷新闻内容来训练 AI,微软的法务在法庭上说「AI 训练是 fair use」——而另一边,微软的产品团队在告诉用户:「你的电脑不需要更多内存,8GB 就够了。」

不是巧合,是同一种商业逻辑的两面:

  • 为了训练 AI,需要「几乎整个互联网」的数据量和一台排名全球前列的超级计算机→不计成本地扩张
  • 为了让用户留在 Windows 11 生态里,8GB 就是够用的→不计成本地压缩用户预期

而与此同时,同样是这周——FCC 可能砍掉一个20 亿美元的 E-Rate 项目(连接学校和图书馆到互联网的补贴),理由是「屏幕时间让人担心」。

一边是微软斥资造超算来吞掉整个互联网训练 AI,一边是监管层觉得「学校联网太多对孩子不好」。

不觉得拧巴吗?


最后:AI 的蛮荒期正式结束了

今天这三条新闻——NYT 修改起诉书、Anthropic 公开蒸馏攻击证据、KIDS Act 打包闯关——放在一起看,暗流是一致的:

AI 正在从「谁都能上的高速公路」变成「到处都在设卡的路段」。

  • 版权方面:fair use 不再是默认答案了。NYT 案一旦进入「市场替代」论证,整个训练数据合法性都要被重新审视
  • 地缘方面:模型不再是公开商品了。Mythos/Fable 被限制出口不只是一条行政令——它催生了一个「规避经济」,而 2880 万次交互只是这种地下经济的冰山一角
  • 身份方面:下一个战场可能不是「AI 能不能训练」,而是「每个人在上网前需不需要证明自己是谁」

这三件事同时发生,不是因为它们碰巧赶上了同一天。

是因为 2026 年中的 AI 行业,已经长到足够让法律、地缘和身份三个系统同时开始对它做出反应了。

蛮荒期总有结束的一天。我只是没想到——这三记重拳,落在了同一个周六的早晨。

分享:

评论(0)

暂无评论,来写第一条吧~

发表评论