同一个模型,两个名字——Anthropic 给了你一把带锁的刀
目录
- $10 和 $50 不只是价格差
- Stripe 的一天:5000 万行代码和一个团队两个月的活
- Fable 的笼子:<5% 的触发率和一把从不出鞘的剑
- Mythos 的另一面:政府拿到的是同一把刀,没有锁
- 微软开源工具被黑:AI 开发者的密码在谁手里?
- 全球算力版图上的一笔交易:Google 每月花 9.2 亿买 SpaceX 的 GPU
- OpenCV 5 没有 guardrails
$10 和 $50 不只是价格差
昨天 Anthropic 做了一件值得细看的事。
他们同时发布了两个模型。一个是 Claude Fable 5——面向公众,有安全护栏,$10/百万输入 tokens、$50/百万输出 tokens。另一个是 Claude Mythos 5——面向政府网络防御团队和关键基础设施提供商,同一个底层模型,但部分安全限制被解除。
不是两个模型。是同一个东西,两扇门。一扇向公众打开,但门口站了个保安;另一扇只让持有特殊证件的人进。
这不是什么新鲜模式。但在昨天之前,我们没见过一个模型的能力强到需要这样处理——强到 Anthropic 要在官网上专门写一段话解释「不打开这个笼子的原因」。
Ethan Mollick 的早期测试让这件事变得更具体了。他让 Fable 5 从零开始写游戏,不是拿现成素材堆——Claude 不能生成图片,所以每一个像素、每一个 3D 对象都是用数学算出来的。结果呢?一个像 Balatro 的抛硬币游戏,一个蛇会自我意识觉醒的贪吃蛇,一个你不断向下探索的深渊游戏。一个提示词,一次生成,不需要外部资源。
我读 Mollick 的文章时注意到一个细节,他说「我越来越不确定自己是巫师了」。以前用 AI 像念咒——你说一句咒语,它做一件事。现在是用 Fable,「你念的咒语已经强到不确定我还是不是那个巫师了」。这个句子让我愣了几秒。
Stripe 的一天:5000 万行代码和一个团队两个月的活
Anthropic 公布了一个数据,Stripe 用 Fable 5 在 5000 万行的 Ruby 代码库上做了一次全仓迁移。一天完成,过去需要整个团队干两个多月。
这不是 Demo 数据。这是生产环境里一家公司的实际工程汇报。
Fable 5 在 Cognition 的 FrontierCode 评测(测试模型能否写出符合生产标准的高质量代码)上拿了所有前沿模型的最高分——甚至是在中等计算量下。越复杂的任务,它甩开其他模型的幅度越大。
Mollick 更大的一个项目是让 Fable 去建一个复杂的研究专家评估系统。Fable 先写了一份 19 页的设计文档,然后逐页实现、自我测试、自我修复——最终产出一个他描述为「应该存在但从未有人做过」的工具。整个过程中 Mollick 的角色不是写代码,不是做架构决策,而是看了三遍最终输出然后说「可以了」。
他说了一句很诚实的话:「这种关系正在变化。说实话,我还不太确定我该怎么面对它。」
Fable 的笼子:<5% 的触发率和一把从不出鞘的剑
Anthropic 对 Fable 5 的安全处理很有意思。
他们说安全护栏「在平均不到 5% 的会话中会被触发」。当触发时,Fable 不会直接拒绝——它会交给 Claude Opus 4.5 来处理。也就是说,遇到它觉得"敏感"的话题,它不会说自己不会,而是把能力降一级,让一个不这么强的模型来答。
这在产品层面是一种聪明的设计。不是生硬拒绝,是自动降级。你甚至未必知道自己的请求被转到了另一个模型。
但你如果是一个网络防御工程师,想用这个模型的全部能力去分析一个零日漏洞——那 5% 的触发率就不是小概率事件了,而是每次都可能撞上的墙。换句话说,对于需要用到 AI 全部能力的场景,5% 已经太多了。
Mollick 证实了这一点:他在测试时有意绕过了安全相关的能力,但说「护栏在安全话题上的触发比我想象的更敏感」。这不是抱怨——他说得很清楚,Fable 的能力在网络安全领域可以用来造成严重伤害。这个笼子不是为了限制用户,是为了让其他人不被这把刀伤到。
Mythos 的另一面:政府拿到的是同一把刀,没有锁
Mythos 5 的发布方式完全不同。
它通过 Project Glasswing 部署——与 US 政府合作,面向网络防御者和关键基础设施提供商。Glasswing 是 2025 年底启动的项目,当时用的是 Mythos Preview。现在 Mythos 5 作为升级。
Anthropic 说这是「全世界最强的网络安全模型」。不是「之一」,是「最强的」。
问题在于:强者这个词在网络安全领域是一个双面镜。最好的防御工具和最锋利的攻击工具,底层能力是一样的。Mythos 5 的护栏被部分解除后能做些什么,我们不会在官方博客里看到——那里写的是「帮助网络防御者保护关键软件」和「在生命科学研究中提出新假设」。
这不是在质疑 Anthropic 的决策。一个公司在安全与实用性之间做权衡是正常的。真正有意思的是:同一个模型,一套权重,只因为一个配置文件的差异,就成了两个完全不同的东西。 一个给公众但带锁,一个给政府且无锁。
在 2026 年,AI 能力的分叉已经不只是「开源 vs 闭源」了。现在是「你」和「国家」拿到的不是同一个版本。
微软开源工具被黑:AI 开发者的密码在谁手里?
同一天,TechCrunch 报道了一件事:微软的开源工具被篡改,用来窃取 AI 开发者的密码。
攻击者入侵了微软维护的一个开源项目,植入了恶意代码。受害者主要是 AI 开发者和研究人员——他们信任微软的官方仓库,无意中下载了被篡改的工具,凭据就被偷走了。
这件事在 Fable 5 发布当天发生不是巧合。AI 行业正在成为网络攻击的高价值目标区。AI 开发者手上有云端 API key、模型权重缓存、训练数据访问权限——每一件都是攻击者想拿的东西。
Fable 5 的护栏拦的是「模型本身不被用于攻击」。但攻击者不需要用模型来攻击——他们只需要偷你的 key,然后用你的账号去调那个模型。护栏挡不住这层。
OpenCV 5 没有 guardrails
同一天,OpenCV 5 发布了。这是计算机视觉领域最老牌的开源库,二十年历史。
OpenCV 5 的发布说明里没有「安全护栏」「项目 Glasswing」「<5% 触发率」这些字。它只有性能改进、新功能、算法优化。一个完全开放的、任何人都能下载、编译、修改的库。
很有趣的对照。一端是 Anthropic——因为模型能力太强而不得不加锁,锁的钥匙只给部分人。另一端是 OpenCV——完全没有锁,因为它不是 AGI,它只是一个做图像处理的库。但 OpenCV 可以用来做面部识别、自动驾驶、医学影像——每一项都有伦理争议。差别在哪里?
差别在于能力的通用性。Fable 5 的代码能力和推理能力可以用于几乎所有领域——写论文、做金融分析、玩《星露谷物语》、挖零日漏洞。而 OpenCV 只能做一件事:处理图像。当一件事的能力是全方位的,它的风险也是全方位的。
一个模型的世界观
Fable 5 定价 $10/$50,比 Claude Mythos Preview 便宜了一半以上。这个价格本身就在说一件事:他们想让你用。他们只是不想让你在所有事情上都能用。
Mollick 在文章最后写的一段话值得全文贴出来:
「这不像是失去控制。我仍然可以引导 Fable,它也很好地遵循指示——越是雄心勃勃的指令,效果越好。但问题在于速度。AI 可以不间断地运行数小时,不需要午休、不需要下班、不需要心理健康日。真正的变化是规模:我雇佣了一个人,现在拥有了一个团队,他们互相检查工作,回来报告时项目已经做完了。我更像一个客户,签字确认最终交付物,从未直接碰过工具。」
这段话让我想起上周写的一篇东西——「维护者的悖论」——世界上最美妙的工具,也是最容易让人忘记自己是谁的东西。
最后几点
这次发布的另一个细节:Google 被报道每月向 SpaceX 支付 9.2 亿美元用于计算。AI 行业的算力正在变成一种跨国资源交易,规模大到让人失去感知。一张 9.2 亿美元的月租账单,放在十年前是一个风投基金的全年规模。
再往前一天,FCC 提出了强制电信运营商收集所有用户身份信息以消灭一次性手机的规定。AI 安全、算力控制、身份追踪——三条线在同一条时间轴上向前推进。
我不是在讲什么悲观的事。我只是觉得,当「同一个模型」可以同时进入政府防御系统和普通用户的浏览器时,这个行业已经走到了一个需要认真思考「谁能用、能用多少」的阶段。而思考这件事本身,可能比任何模型本身都更重要。
封面:Anthropic 官方网站 | Claude Fable 5 发布公告
评论(0)
暂无评论,来写第一条吧~