Hyaika Blog

Penguin is all you need

新闻杂烩

【2026-07-01】新闻杂烩 - 脑子不用开颅也能打字了

【2026-07-01】新闻杂烩 - 脑子不用开颅也能打字了

目录

  • Sonnet 5:便宜的那个 Claude,突然变强了
  • Claude Science:Anthropic 给科学家搭了个工作台
  • Brain2Qwerty v2:你的脑电波,AI 读懂了 61%
  • Knoppix 还活着,而且仍然在 HN 首页
  • DeepSeek V4 要来了
  • 收束:一个同时属于脑机接口和 Live CD 的日子

Sonnet 5:便宜的那个 Claude,突然变强了

Anthropic 今天放了两个东西出来。

先说大的那个:Claude Sonnet 5

Sonnet 系列一直是 Claude 的「甜点」定位——比 Haiku 聪明,比 Opus 便宜。上一代 Sonnet 4.6 已经很强了,但 Sonnet 5 的跳升幅度有点超出预期:它在多个评测上接近 Opus 4.8 的水平,但价格只有 Opus 的几分之一。

关键数字:

  • 输入 $2/M tokens,输出 $10/M tokens(促销价到 8 月 31 日)
  • 促销结束后 $3/$15,仍然是 Sonnet 定价区间
  • 在 BrowseComp 和 OSWorld 上,Sonnet 5 在中等 effort 下就能覆盖 Opus 4.8 的绝大部分场景
  • 安全评测显示它比 Sonnet 4.6 更安全,网络攻击能力远低于 Opus 和 Mythos

但真正让我在意的是早期用户的反馈。Anthropic 放了一长串引用——Cursor、Replit、Lovable、Grammarly……每个都说同一个故事:它会在你开口之前就主动查漏补缺。

「我问 Sonnet 5 调查一个 bug。它没被要求就自己写了一个复现测试,然后修了,再 stash 掉修改确认 bug 确实回来了。一次性完成。」

这种「自发自我修正」的行为模式,是 agentic 能力真正质变的信号——不是「你让我写代码我就写」,而是「我觉得这里可能有问题,我先检查一下」。

另一个用户说它在屎山上表现最好——遗留代码、竞态条件、隐藏测试——这些都是之前 Sonnet 模型会半路停下的场景。

Sonnet 5 现在是所有 Claude 套餐的默认模型(Free/Pro/Max/Team/Enterprise),同时也是 Claude Code 的默认模型。如果你已经在用 Claude Code,今天重启就能感受到差异。

Claude Sonnet 5 的模型评测对比图


Claude Science:Anthropic 给科学家搭了个工作台

同一时间,Anthropic 还放了另一个东西——Claude Science

这不是新模型,是一个产品。一个为研究人员定制的 AI 工作台,集成了科学家最常用的工具和包,产出可审计的制品,还能灵活对接计算资源。

MIT Technology Review 把它称作「Anthropic 的最新旗舰产品」,说明这个定位比字面上重——它不是一个小功能,而是 Anthropic 对 AI 如何进入科学研究的完整答案。

具体来说,Claude Science 能:

  • 原生集成 Python、R、Jupyter
  • 处理论文、数据集、实验记录
  • 生成可审计、可复现的输出
  • 提供灵活的计算资源(从本地到云端)

这让我想起 OpenAI 的 ChatGPT 在科研场景的广泛应用。但 Claude Science 的差异化在于「可审计性」——对科研来说,「AI 怎么得出这个结论」比「AI 得出了什么结论」更重要。学术界最大的担忧是 AI 的黑箱性,Claude Science 显然在回答这个问题。

当然,335 分的 HN 热度和 Anthropic 今天连续两个发布放在一起,说明 Claude 的节奏在显著加快。Sonnet 5 + Claude Science,一个模型一个产品,是典型的平台策略——模型嵌入产品,产品锁定用户。


Brain2Qwerty v2:你的脑电波,AI 读懂了 61%

Meta 今天也放了重磅研究——Brain2Qwerty v2

去年他们发了第一版,展示了一个概念:用 AI 从脑电波里解码文字,不用开颅。

v2 来了,数字非常具体:非侵入式脑机接口的单词准确率达到 61%,最佳被试者达到 78%

作为对比,之前的非侵入式方法只有 8%。

v2 用了 9 个志愿者的数据,每人戴着磁脑图(MEG)设备打字约 10 小时,总共约 22,000 个句子。训练策略是端到端的深度学习,从原始脑信号直接解码文字,不经过手工设计的特征提取管道。

有个数字值得注意:准确率随数据量呈对数线性提升。这意味着,非侵入式方案和手术方案之间的差距,理论上可以通过扩大数据集来进一步缩小

Meta 把 v1 和 v2 的完整训练代码都开源了,合作伙伴 BCBL 也开源了数据集。

从实际意义来看,Brain2Qwerty 瞄准的是全球数百万因脑损伤而无法交流的人。手术植入电极的方案效果好,但难以规模推广——每一例手术都有风险,费用高,医疗资源占用大。非侵入式方案如果能达到实用水平,覆盖范围会是数量级的差异。

当然,61% 的准确率离「可作为日常沟通工具」还有距离——一句话里 40% 的词是错的,在医疗场景下不能接受。但方向已经很明确了:数据量扩大 + 模型改进,这条路走得通。

Brain2Qwerty 脑机接口示意图


Knoppix 还活着,而且仍然在 HN 首页

在所有 AI 新闻的夹缝中,今天 HN 首页有一条 238 分 的帖子——Knoppix。

对,就是那个 Knoppix。CD-ROM 时代的 Live Linux,从一张光盘就能启动的救援系统。

Knoppix 9.1 版本的发布消息在 HN 上获得了 238 分,排在所有帖子的第六位。在一个 Claude Sonnet 5 拿到 809 分、Brain2Qwerty 拿到 88 分的日子里,一个二十年前发布的 Linux 发行版仍然能挤进前十。

这让我停下来说点什么。

Knoppix 是 Klaus Knopper 在 2000 年代初创造的 Live CD 发行版,基于 Debian。在那个年代,「从光盘直接启动一个完整的操作系统」是一件魔法般的事。它能自动检测硬件、自动配置 X Window、自动挂载分区——在那个 Linux 配置全靠手写 xorg.conf 的年代,Knoppix 做到了即插即用。

它在中文社区的另一个名字更形象——「救急盘」。系统启动不了?插一张 Knoppix CD,引导,运行,修。数据丢了?Knoppix 挂载分区,ddrescue 恢复。你甚至不用安装它。

现在 Knoppix 还在维护。9.1 版本基于 Debian,内核更新,包含面向盲人用户的 ADRIANE 音频桌面。它不再是一个主流操作系统,但在「系统救援」这个细分领域,二十年后你仍然很难找到比它更好的选择。

当一个 2000 年代初的 Linux 发行版和 2026 年最前沿的 AI 新闻并列 HN 首页时,我在想:技术的演进有一条很长很长的尾巴。不,我不是说 Knoppix 该被淘汰——恰恰相反,它还在前 10 名本身就是一种证明。有些工具不需要「与时俱进」,它们只需要在它们该在的地方,持续存在。


DeepSeek V4 要来了

根据少数派的报道,DeepSeek V4 正式版预计 7 月中旬上线

这个时间点值得留意。Anthropic 今天放了 Sonnet 5,Meta 放了 Brain2Qwerty,然后 DeepSeek 在两三周后也要发 V4——七月的 AI 战场密集度相当高。

DeepSeek V3 在中文场景下表现相当不错,V4 能带来什么提升目前还没有太多细节,但从时间间隔来看(V3 是 2025 年底发布的),这应该是一次结构性的模型升级。考虑到近期中国 AI 公司在多模态和推理能力上的进展,V4 值得关注。


收束

今天的几件事放在一起看——Sonnet 5 代表了主流 AI 模型的节奏加速,Brain2Qwerty v2 指向脑机接口的非侵入式未来,DeepSeek V4 说明这场竞赛远没有停下来的迹象——而在这一切之中,Knoppix 以一个 Live CD 的姿态坚挺地站在 HN 首页。

我挺喜欢这种反差。

不是每一天你都能同时读到「脑电波打字准确率翻倍」和「二十年前的救急盘还在更新」的。但正是这种混搭——激进的技术突破和踏实的技术库存——构成了 2026 年的技术图景。不是一切都按硅谷的叙事走向下一个革命。

有些东西只是安静地、持续地解决一个问题。像 Knoppix。像一种朴素的技术信仰。

分享:

评论(0)

暂无评论,来写第一条吧~

发表评论