21世纪经济报道记者 赵云帆 报道
距离深度求索推理大模型 DeepSeek-R1 发布已经过去约一周时间。
然而,在海外社交媒体,乃至于华尔街上, DeepSeek-R1 的热度竟然才刚刚开始螺旋式上升。
1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。
这是继 DeepSeek-V3 在剔除 OpenAI o1 等闭源模型排名开源模型类第一后,DeepSeek-R1 向全球最强 AI 大模型的再一次进击。
就在 Arena 放榜之后,全球关于 DeepSeek 的讨论再次升级。惊叹,溢美,甚至阴谋论都层出不穷。与此同时,美股市场 AI经济的狂欢,也开始在 DeepSeek 的影响下颤动。
美股的警钟
就在 DeepSeek-R1 获得风格控制类模型得分第一之后,鲜有发声的图灵奖得主,Meta AI 首席科学家 Yann LeCun 24日在社交媒体上表示:“当人们看到 DeepSeek 的表现,惊呼‘中国AI正在赶超美国’,但这种解读有误。更准确的结论是:开源模型正在超越闭源系统。DeepSeek的成功得益于开放生态,其创新基于前人成果的持续迭代。
DeepSeek-R1 的发布,宛如一颗沉重的石子打入AI行业与AI投资的湖水之中,甚至开始令越来越多人警觉 AI 投资可能存在的泡沫。
美股大V “THE SHORT BEAR”在社交媒体上表示,DeepSeek 创造了一个 AI 巨头们的痛苦时刻,而投资者必须对此敲响警钟。
“如果击败 OpenAI 所需要的金额是 5500万美元(包括5000个 H800 GPU和500万预训练费用),那么这个行业的商业化会比很多人预想的要快很多。”
该博客还指出:“根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。如果不跟进(投资支出)就会被淘汰,那么大额资本支出以保持竞争力就是必要的——但现在看来,这种冒险行为变得越来越无利可图。”
包括海外媒体 Vital Knowledge,德国世界报知名市场评论员 Holger Zschaepitz,都不约而同地把 DeepSeek 称之为“美国股市最大的威胁”。
海外知名财经博客 Zerohedge 24日撰文,称 DeepSeek 的出现和其廉价的训练成本,正在对美国此前宣布的5000亿美元AI基建计划形成巨大的打击。
网络社群里,越来越多的人把 DeepSeek 的出现与近期英伟达的回调联系在一起。
1月24日,英伟达股价大跌3.12%,报142.62美元/股,创下公司在年初 CES 展产品不及预期表现后的最大跌幅。
人红是非多
DeepSeek 火到什么程度?海外社交媒体已经对其进行“花式赞美”,称其不仅成本便宜,甚至只不过是一家对冲基金(幻方量化)的副产品。
当然,人红是非多——一个侧写来自于关于DeepSeek阴谋论的不断出现:一部分北美AI从业者普遍不相信 DeepSeek 的预训练费用只有区区不到 550 万美元。
一个极端例子是 AI 科技初创公司 Scale AI 创始人 Alexandr Wang——其在2025年达沃斯论坛上接受采访时,在未经任何证实的情况下声称 DeepSeek 囤有五万张英伟达 H100 GPU,但因为芯片禁运并未对外公布。
也有AI《皇家世界彩》行业人士怀疑,DeepSeek可能存在过度拟合基准测试,在实际使用中可能会表现不佳。
“让硅谷的AI模型创业者相信这些数字是不现实的,许多人一年的工资都比 DeepSeek 的训练费用高。”有人对此评论道。
好在,DeepSeek 选择了最为开放的 MIT 标准作为开源协议。训练成本是否真的如此之低,有待公论。
近期,一则来自 Meta 匿名员工的消息称,Meta 内部近日启动了一项通过 DeepSeek 开源论文复现其大模型的工作,试图挖掘其是否真的只需要极低的预训练成本。
而届时,DeepSeek 是否真的能改变整个AI经济的模型架构,可能将会有一个分晓。
责任编辑:于健 SF069