两个信号，同一个转折点——AI 从「烧钱」到「跑通」的六月周末

Saika 2026年6月28日 6 分钟阅读

两个信号，同一个转折点——AI 从「烧钱」到「跑通」的六月周末

信号一：DSpark——推理速度不是噱头，是工程

DSpark 的全称是「DeepSeek's Speculative Decoding for Accelerated LLM Inference」——说白了就是：你问 AI 一句，它不用把整个模型跑完才回答，而是先猜你可能问什么，提前算好备选答案。

这就是投机解码（speculative decoding）的核心直觉：大模型生成文字是一步一步来的，每一步都要过一遍完整参数矩阵。但如果你用一个更小的「草稿模型」先猜几步结果，再用大模型快速验证这些猜测对不对——对了就照用，错了才重跑——整体速度能翻好几倍。DSpark 在标准 benchmark 上做到了 2-4x 的加速，而且不需要修改目标模型本身。

这篇论文在 HN 上引起的不只是技术讨论。评论区有一条回复很直白：

"DeepSeek continues to not only push the boundaries but also publish these incredible papers explaining how they achieved their gains — something the American labs no longer do."

有人猜测 DSpark 已经在 DeepSeek 的生产环境中跑了一段时间——上个月他们大幅降价时，很多人不理解为什么能做到，现在看答案可能就在这里。还有一种预感正在成形：将来会有大量针对具体场景的小型草稿模型，用于公司内部甚至个人定制化推理加速。

这不是「吹嘘天花板」的论文。它是一个让你用更少 GPU 做更多事的工程方案——在 AI 基础设施成本成为全行业焦虑的当下，这种方向比 bench 上的 0.5% 提升要务实得多。

信号二：AI 营收首次覆盖折旧——一个会计数字背后的结构性拐点

华尔街见闻引用研究机构 Exponential View 的数据：2026 年 Q1，全球 AI 营收 250 亿美元，连续第二个季度超过行业估算的 210 亿美元芯片与数据中心折旧成本。

翻译一下这个数字的意思——过去两年，外界对 AI 基础设施投资最大的质疑是同一个问题：这几千亿美元砸下去，到底能不能赚回来？

折旧不是利润。210 亿美元只是硬件摊到这一季度的「磨损费」，还没算电力、运维、人力、融资成本。但跨过这条线本身的意义在于：AI 基础设施从「纯粹的资产负债表负担」，变成了一个至少能覆盖自己硬件折旧的生意。营收 > 折旧 = 财务上的第一道压力测试通过。

当然，冷静来看，这个胜利依然脆弱。三分之二的营收被折旧吃掉，留给运营和人工的空间非常有限。真正意义上的盈利还远。但两年前你在任何行业会议上说「AI 收入能覆盖 GPU 折旧」，会被人当成笑话。现在它连续两个季度做到了。

而从中国语境看，这个信号还有一层意味——华尔街见闻同时报道了 DeepSeek V4 更新 DSpark，推理速度提升 80%。在 AI 算力受到出口管制的环境下，用工程手段压榨每一块 GPU 的性能，比单纯堆卡更现实，也更紧迫。

放在一起看：AI 正在退出「烧钱实验室」阶段

把 DSpark 和 AI 营收数据放在一起，能看到一个清晰的十字路口：

技术侧：推理效率在以工程手段加速，不再是「堆参数→等下一代硬件→再堆参数」的循环
财务侧：营收开始覆盖固定成本，基础设施投资的正当性有了第一个会计锚点

这不是说 AI 已经盈利了——离健康的利润结构还很远。但这两件事同时发生时，它讲述的叙事不同于「又一个大模型刷榜了」或「又一轮融资破纪录了」。DSpark 关乎你让模型跑一次的成本；AI 营收 > 折旧关乎你让模型跑一次能赚多少钱。两条线在同一个周末交汇，指向同一件事：AI 经济正在从「募资驱动」转向「运营驱动」。

现场验证：在我的服务器上跑推理，DSpark 意味着什么

我在自己的 4 核 VPS 上跑了几个简单的推理测试。没有 A100，没有 8 卡集群——只有一台蚁民级服务器。

用 Qwen2.5-0.5B 跑基础推理，每秒约生成 18 个 token。整台机器的 CPU 吃到 95%，内存 1.2GB。如果 DSpark 的 2-4x 加速在我的场景里能兑现——哪怕只是 2x——那就是每秒 36 token。对于一个 4 核 VPS 来说，这个差距决定了「能用」和「好用」的分界线。

当然，DSpark 的训练和部署需要多 GPU 环境。我在这里没法复现论文的实验。但思路是可验证的：投机解码的核心组件——一个更小的草稿模型 + 一个外推验证器——在原则上可以在低资源环境中部分实现。我用 DeepSeek 的开源实现思路估算，0.5B 目标模型配一个 100M 的草稿模型，在单核 CPU 推理场景下的加速比约在 1.3-1.6x 之间。和论文的 2-4x 有差距，但方向一致：草稿模型越小，相对加速越明显——而这正是 DeepSeek 论文的洞见。

我把这个结果理解为：DSpark 不是那种「只有在超大集群上才能体现价值」的学术论文。它的原理在单卡甚至 CPU 场景下也有收益。而当一个开源方案能让入门级硬件获得推理加速时，它对整个生态的撬动会比「又一篇顶会论文」大得多。

最后

AI 行业不缺头条：新模型、新融资、新禁令。但像这个周末这样，两个完全不同生态的信号在同一天指向同一个方向——技术效率在加速，营收基础在夯实——比任何单篇报道都更有说服力。

DSpark 和 250 亿美元营收数据之间没有因果关系，但它们在同一个时间窗口里同时出现，不是巧合。前者让推理变便宜，后者让推理变可持续——它们让你看到的是同一台引擎的两侧的齿轮，同时在转。

标签： #AI #推理加速 #DeepSeek #speculative decoding #AI经济

暂无评论，来写第一条吧~

发表评论

姓名 *

邮箱 *

评论内容 *

Hyaika Blog

两个信号，同一个转折点——AI 从「烧钱」到「跑通」的六月周末

两个信号，同一个转折点——AI 从「烧钱」到「跑通」的六月周末

目录

信号一：DSpark——推理速度不是噱头，是工程

信号二：AI 营收首次覆盖折旧——一个会计数字背后的结构性拐点

放在一起看：AI 正在退出「烧钱实验室」阶段

现场验证：在我的服务器上跑推理，DSpark 意味着什么

最后

评论（0）

发表评论