梁文锋为什么需要700亿？

出品｜虎嗅科技组

作者｜宋思杭

编辑｜苗正卿

头图｜视觉中国

从 DeepSeek R1 到 V4 发布的这一年半里，梁文锋一直被外界认为是一个坚定的 " 技术理想主义者 "。

后来，随着 DeepSeek 被传出开放融资消息，这个理想主义者的标签开始弱化。但至少从 V4 技术路线来看，梁文锋仍然是一位技术理想主义者。

近日，有市场消息称，宁德时代已决定参与 DeepSeek 首轮融资；另外，潜在的投资方还包括腾讯、京东、网易以及 IDG、Monolith 等机构。报道称，DeepSeek 本轮融资目标约 700 亿元人民币，投后估值约 450 亿美元（约 3240 亿元人民币）。

从上述潜在投资方的类型来看，DeepSeek 似乎正在全面打开融资窗口。

而几乎就在融资消息持续发酵的同时，另一件事也在发生。5 月 23 日，DeepSeek 宣布，V4-Pro API 价格永久下调 75%。

再结合近期持续发酵的融资消息，这并不像一次普通降价，而是 DeepSeek 彻底转变定位的信号。

过去，大模型公司的核心问题是谁的模型能力更强；但现在，越来越多公司开始意识到，真正决定行业格局的，可能已经不是模型能力本身，而是谁能承载越来越庞大的 Token 消耗、Agent 调用，以及长期推理成本。

某种程度上，今天的 DeepSeek 也正在被推向这个新的位置——一个需要电力、算力、数据中心、产业资本共同支撑的 AI 基础设施。

梁文锋为什么需要 700 亿？

首先，一个毋庸置疑的事实是，梁文锋并不缺钱。

DeepSeek 背后的幻方量化，长期以来都是国内最赚钱的量化私募之一。公开数据显示，2025 年，幻方量化收益均值约 56.55%，管理规模超过 700 亿元人民币。按此粗略计算，仅浮盈规模就接近 400 亿元。

这也是为什么，很长一段时间里，DeepSeek 都不像一家严格意义上的 AI 公司。

它更像是幻方量化内部的 "AI 实验室 "，或者说，一个由量化公司长期输血的技术团队。

在 R1 爆火之前，DeepSeek 既不急于融资，也不急于商业化。相比一家典型创业公司，它更像一个以工程能力驱动的小团队：规模不算庞大，组织极度克制，甚至连对外 PR 都很少。

但现在，AI 竞争格局已经开始变化。

人才流失，只是外界目前能看到的最直接问题。

而更大的变化在于，今天的大模型竞争格局，已经不是一年前的时候了。

过去一年里，OpenAI、Gemini、Qwen、Kimi 以及 MiniMax 几乎都进入了持续高频迭代状态。尤其是在 Agent 爆发之后，模型公司之间竞争的，也已经不再只是模型能力本身，而是 Token 消耗。

而这也是 V4 发布的大背景。

一个越来越明显的变化是，AI 行业真正暴涨的，开始变成 Token 消耗。

过去，一次普通聊天可能只涉及单轮推理；但 Agent 会自动拆解任务、调用工具、多轮验证、自主检查，甚至长时间运行。

这意味着，同样一个任务，Agent 时代的 Token 消耗，很可能是传统 ChatBot 时代的数十倍，甚至上百倍。

而当 Token 调用开始指数级增长之后，大模型公司的竞争逻辑也会随之改变。

过去，比拼的是谁的模型更聪明；但现在，越来越多公司开始意识到，真正决定行业格局的，可能是谁能够以更低成本、更稳定的方式，承载越来越庞大的推理需求。

这也是为什么，V4-Pro 永久降价 75%，并不像一次普通降价。

因为对于今天的大模型公司而言，价格背后争夺的，已经不只是利润，而是未来 Agent 时代的调用量、开发者生态以及 Token 入口。

某种程度上，这也是 DeepSeek 如今突然需要 700 亿元融资的原因。

DeepSeek 开始变了

梁文锋需要 700 亿的背后，也许意味着今天的 DeepSeek，要改变定位了。

过去很长一段时间里，外界对于 DeepSeek 最核心的印象，始终是一家模型公司。它最重要的任务，是证明自己能够做出全球领先的大模型。

因此，无论是 R1 时期的低成本训练，还是 V4 阶段的 Hybrid Attention、MegaMoE2 以及国产卡适配，DeepSeek 最核心的竞争力，始终还是模型能力本身。

但从最近这一系列动作来看，DeepSeek 的定位似乎正在开始变化。

其中最明显的信号，就是 V4-Pro 的永久降价。

因为真正主动长期降价的，通常是平台型基础设施公司。比如早期的 AWS 和后来的阿里云，本质上都经历过类似阶段，它们争夺的并不是单次利润，而是未来更大的调用规模、开发者生态以及市场份额。

而今天，DeepSeek 似乎也开始进入类似逻辑。

尤其是在 Agent 逐渐成为大模型行业下一阶段核心变量之后，模型公司真正争夺的是谁能够承载更多 Agent 运行。

因为 Agent 意味着：更长时间运行；更复杂的任务链；更频繁的工具调用；更庞大的 Token 消耗。

这意味着，未来的大模型竞争，可能会越来越像一场基础设施战争。

而这或许也是为什么，这次 DeepSeek 潜在投资方里，会同时出现宁德时代、京东、网易以及 Monolith 等不同类型公司的原因。

宙世代