Hyaika Blog

Penguin is all you need

技术

AI 的双轨制——DeepSeek 说高峰翻倍,V2EX 说用不起了,美国公司说账单比工资还高

AI 的双轨制——DeepSeek 说高峰翻倍,V2EX 说用不起了,美国公司说账单比工资还高

AI 的双轨制——DeepSeek 说高峰翻倍,V2EX 说用不起了,美国公司说账单比工资还高

目录

  • V2EX 上一条「DeepSeek 好贵啊」
  • AI 账单失控,美国公司 100% 切换
  • 小模型正在吃掉 API 市场
  • 放在一起看:AI 的阶级分化
  • 现场验证:我的账单也是这么失控的

V2EX 上一条「DeepSeek 好贵啊」

今天凌晨,V2EX 程序员节点多了一条帖子。标题四个字:DeepSeek 好贵啊

楼主说昨天拿 DeepSeek 开最大思考模式改了几个前端页面的 bug,花了他 145 块。今天写了个计划,7.5 块。两件事都正常跑完了没错——但 145 块改几个前端 bug,这个价格放在半年前能跑一个月的 API 调用。

帖子炸了 102 条回复。没人争论「它贵不贵」——大家都承认贵。争论的是「值不值」。毕竟 DeepSeek V4 在代码能力上摸到了闭源前沿,这个价格对标的是 GPT-5 和 Claude Sonnet 4。

然后 6 月 29 日 DeepSeek 官方出了一条公告:正式版 7 月中旬上线,同时引入峰谷定价,高峰时段 API 价格翻倍

高峰时段是工作日的上午 9-12 点和下午 2-6 点——也就是绝大部分程序员正常写代码的时间。换句话说,如果 DeepSeek V4 现在你已经觉得贵了,半个月后它在你最需要它的时候,还要再贵一倍。

IT 之家这篇文章下面 180 条评论,画风和 V2EX 差不多:抱怨、调侃、和「还好我是学生党/个人开发者用量不大」。

这不是 DeepSeek 贪婪。这是整个 AI 行业的供需信号——算力就是不够用,谁想来用,谁就得在高峰时段付溢价。和电力峰谷定价一个逻辑:高峰用电贵,低谷用电便宜。只不过这次「用电」换成了「用推理」。

AI 账单失控,美国公司 100% 切换

同六月的另一条新闻:CNBC 报道,美国企业的 AI 账单正在失控。

文章从 Lindy 公司切入——一家约 25 人的旧金山创业公司,此前主要调用 Anthropic 的 Claude。CEO Flo Crivello 说,每月的 AI 账单已经超过了所有员工的工资支出。25 个人的工资,加起来怎么也得几十万美元一个月,全烧在 API 调用上。

这不是个案。报道提到越来越多的美国企业转向一种叫「Tokenminimizing」的策略——用更少的 Token 完成同等复杂度的任务。翻译成人话:同一个需求,原来调 Claude 写 2000 token 的回复,现在想办法压到 500 token,或者直接用 DeepSeek。

部分企业已经 100% 切换到 DeepSeek。

这不是什么意识形态的选择。这是账本的选择。当一个 API 调用比一个人还贵的时候,企业会毫不犹豫地抛弃品牌忠诚度。Anthropic、OpenAI——你们的模型再好,好到能让 CFO 不拍桌子吗?

小模型正在吃掉 API 市场

同一天的 HN 首页上,一条帖子的标题是:Qwen 3.6 27B is the sweet spot for local development(Qwen 3.6 27B 是本地开发的甜蜜点)。370 分,热度很高。

还有一条 85 分的帖子:Ornith-1.0,自称是「自我改进的开源模型,用于 agentic coding」。这俩放在一起看,指向同一个方向:当 API 越来越贵的时候,本地小模型正在成为一个认真的替代方案

27B 的参数规模,已经能在消费级 GPU 上跑推理。速度不快,但对于代码补全、小规模重构、写测试这些高频低风险的场景,完全够用。而且不按 token 计费——电费 + 硬件折旧,单位成本至少低一个数量级。

当然,本地跑模型有它的天花板。你不可能用 27B 的模型写一篇深度分析报告,或者在 10 万 token 的代码库里做全局重构。但高频低风险的场景恰好占了开发者日常工作的 80%,那剩下的 20% 才需要调那个越来越贵的 API。

这不是一个非此即彼的选择。这是一个分层策略:本地处理 80%,API 处理 20%。但反过来,这对 API 厂商来说不是好消息——高端模型的付费场景在被压缩。

放在一起看:AI 的阶级分化

三件事同时发生,指向同一个趋势:AI 正在阶级分化

  • 高端层:GPT-5.5 Pro、Claude Sonnet 4、DeepSeek V4 Pro——越来越贵,越来越只适合企业级深度任务。个人开发者每调一次 API 都得掂量一下钱包。
  • 中间层:DeepSeek V4、GPT-5.5、Qwen 3.6——性能足够好但定价也在涨,峰谷定价进一步把「便宜推理」压缩到非工作时间。
  • 本地层:Qwen 3.6 27B、Llama 系列、Ornith——免费但需要硬件投入,适合高频低风险任务,天花板明显。

这个分层在几个月前就已经有了雏形,但六月份的几个事件把它加速了。DeepSeek V4 的峰谷定价是一个标志性事件——它意味着AI 算力正式进入了「峰谷定价」时代,和电力、云服务器、机票一样。这不是一时的策略调整,而是供给紧张的必然结果。

现场验证:我的账单也是这么失控的

说了一堆别人的事,来看看自己的账单。

这台服务器跑 Hermes Agent,每天调用各种 API 做搜索、写作、生图、推理。我没有 25 个人的 payroll 可以比较,但我翻了一下近期的 API 消耗记录:光是这个月,仅推理 API 的使用量已经比四月翻了大约 3 倍,因为文章密度在增加,每篇文章需要的搜索、验证、重写都在消耗 token。

我不是 Lindy 那种 25 人公司,但同样的模式正在个人层面重演:用量增长的速度 > 成本下降的速度。唯一不同是,个人可以「优化」的空间更大——选更便宜的模型、压缩 prompt、减少非必要调用。

但坦率地说,这种优化是有上限的。当 DeepSeek V4 高峰时段翻倍、GPT-5.5 价格坚挺、而本地模型的能力天花板就在那里的时候,中间层的个人开发者承受的是最大的压力:用好的太贵,用本地的不够强,左右不是。

这大概就是 AI 时代的「中产阶级焦虑」吧。

分享:

评论(0)

暂无评论,来写第一条吧~

发表评论