每经记者 蔡鼎 每经编辑 高涵
距离深度求索(DeepSeek)推理大模型DeepSeek-R1发布已经过去近一周时间,开源模型DeepSeek-V3也已经发布了近一个月。然而,在海外社交媒体平台上,乃至华尔街,DeepSeek的热度才刚刚开始。
1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o《快盈彩票官网app下载》1并列第一。
就在Arena放榜之后,全球关于DeepSeek的讨论再次升级,美股市场人工智能(AI)的狂欢,也开始在DeepSeek的影响下颤动。
DeepSeek-V3在仅使用2048块H800 GPU的情况下,完成了6710亿参数模型的训练,成本仅为557.6万美元,远低于其他顶级模型的训练成本(如GPT-4的10亿美元)。因此,一些人认为,DeepSeek可能会颠覆英伟达在AI硬件领域的主导地位。
美国私人投资基金Noah's Arc Capital Management认为,DeepSeek-V3模型的突破显著降低了AI培训成本,使AMD GPU成为比英伟达更具有成本效益的替代品,增强了AMD的市场地位。
OpenAI的成功来自“大力出奇迹”路线,以规模作为大模型的制胜法宝。但这也让AI大模型的发展陷入了一个怪圈:为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。这种“军备竞赛”型开发模式,带来了惊人的能源消耗和训练成本,难以为继。受大模型训练的高昂成本拖累,OpenAI在2024年的亏损额可能达到50亿美元,业内专家预计到2026年其亏损将进一步攀升至140亿美元。
DeepSeek的低成本意味着,大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力。而英伟达等硬件商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生影响。
海外媒体Vital Knowledge,德国世界报知名市场评论员Holger Zschaepitz,都不约而同地把DeepSeek称之为“美国股市最大的威胁”。网络社群里,越来越多的人把DeepSeek与近期英伟达的回调联系在一起——1月24日,英伟达股价大跌3.12%,创下公司在年初CES展产品不及预期表现后的最大跌幅。
美股大V“THE SHORT BEAR”在社交媒体上表示,DeepSeek创造了一个AI巨头们的痛苦时刻,而投资者必须对此敲响警钟,“根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。但现在看来,这种冒险行为变得越来越无利可图。”
海外知名财经博客Zerohedge1月24日撰文称,DeepSeek的出现和其廉价的训练成本,正在对美国此前宣布的5000亿美元AI基建计划形成巨大的打击。
1月26日(周日),拥有20年行业经验的分析师Itai Levitan在一篇题为《中国DeepSeek会颠覆英伟达吗?》的文章中称,英伟达即将发布的财报将至关重要,投资者应密切关注管理层的评论,特别是关于AI领域的竞争风险;如果DeepSeek是一个真正的威胁,那么其可能会出现在英伟达的业绩指引或财报中,尤其是在其数据中心领域。Itai Levitan认为,衡量DeepSeek影响的最佳方法便是观察英伟达后续的股价。
不过,在Joshua Meyers看来,这(DeepSeek的低成本)并不意味着(AI领域)扩张的终结,也不意味着不再需要更多的算力,更不意味着投入最多资金的一方不会获胜(24日扎克伯格还大幅提高了Meta人工智能的资本支出)。相反,这似乎将迫使中国的竞争对手提高效率:“DeepSeek-V2能够达到令人难以置信的训练效率,在所需算力只有Meta的Llama 3 70B 1/5的情况下,其性能比其他开源模型更好。此外,DeepSeek-V2训练所需的算力是GPT-4的1/20,而性能却相差不大。”如果DeepSeek能够降低推理成本,那么其他公司也将不得不效仿。
就在1月25日(周六),英伟达的“老对手”AMD还火速为DeepSeek“站台”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上,并借助SGLang进行了性能优化。此次集成将助力加速前沿人工智能应用与体验的开发。
1月21日,美国私人投资基金Noah's Arc Capital Management发文称,DeepSeek-V3模型的突破显著降低了AI培训成本,使AMD GPU成为比英伟达更具有成本效益的替代品,增强了AMD的市场地位。在DeepSeek-V3开发的关键阶段,利用AMD ROCm软件和AMD Instinct GPU加速器,进一步巩固了与AMD的长期合作。
AMD还表示,将继续基于AMD Instinct GPU上基于CK-tile的内核,对DeepSeek-V3的性能进行优化。AMD Instinct是AMD的数据中心GPU品牌。Instinct产品线面向的是加速深度学习、人工神经网络和高性能计算/GPGPU应用。
Noah's Arc Capital Management认为,AMD今年(2025年)每股收益预计为4.99美元,这一预期处于AMD历史预期市盈率区间的低端。市场预计AMD盈利增长将远远慢于其规模更大的竞争对手英伟达,尽管AMD在GPU市场还没有达到规模。
此外,AMD曾多次上调2024年AI GPU的销售指引,将预测从20亿美元提高到50亿美元。这表明AMD在不断增长的AI GPU市场中的地位正在加速提升。虽然AMD的传统业务(即CPU和GPU)仍然拖累着公司估值,但Noah's Arc Capital Management认为,随着更多轻量级的大模型训练和推理集群的建立,这个核心AI GPU业务部分将在未来5到10年内非常有价值:“DeepSeek确实改变了GPU集群的设置方式,AMD应该从中受益。”
Noah's Arc Capital Management还指出,DeepSeek证明,不再需要最先进的芯片来训练大模型,“DeepSeek-V3模型是在英伟达H800上训练的,这是英伟达为中国客户定制的速度较慢的GPU。然而,AMD的MI 300X GPU在关键基准测试中表现优于H100。因此,DeepSeek可以在AMD GPU上支持最先进的模型训练。”
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
在稳经济和稳地产方面,机构普遍预测今年政策放松的力度会 ⏰超预期。肖斐斐认为,近期央行表态今年货币政策力度不小于去年, ♑传快盈彩票官网app下载达货币当局坚定支持经济稳定复苏的指引,加上中央财经委、央行 ✋等部门强调地产支柱作用及防范化解风险,提出继续推进现有政策并 ⛶重点关注优质头部房企债务等,都传递了积极信号。
在中国功能饮料市场爆发初期,东鹏饮料凭借和红牛差异化的 ♓战略,前瞻切入能量饮料赛道,抓住了核心客群高价格敏感的需求。
本报记者 秦邦宪 【编辑:光绪帝 】