1月27日,由中国初创公司DeepSeek引发的对美国AI巨资投入的广泛担忧震动华尔街。美国科技公司当天市值蒸发超过1万亿美元,出现了史诗级的“崩盘”。
当天,英伟达股价暴跌17%,市值蒸发近6000亿美元。博通公司股价也下跌超17%,市值蒸发近2000亿美元。美国费城半导体指数跌幅超9%,创下2020年3月以来的最大跌幅。
此外,台积电美股跌幅也达到13%,总市值回落至万亿美元以下。
据悉,目前硅谷AI巨头已经开始认真地研究DeepSeek的技术,以搞明白它是否为一项独立的研究突破,以及在多大程度上依赖了西方现有的基础模型。
另一方面,美国为遏制中国人工智能发展而采取的先进芯片出口管制措施是否产生足够的约束力,也引发业内关注。
特朗普也大力称赞“超省钱”
DeepSeek当晚“乘胜追击”,在凌晨发布了最新视觉模型Janus-Pro。Janus Pro是基于之前的Janus开发的高级版,在多模态理解和文生图指令遵从能力都收获了显著提升,并在多个基准上超越了DALL-E 3与Stable Diffusion。
DeepSeek的“现象级崛起”也惊动了美国总统特朗普。特朗普周一称赞该模型是一种“积极的发展”,可以让人工智能全面进步的成本更低。他还表示:“R1的发布应该给我们的行业敲响警钟,我们需要全神贯注于竞争才能取胜。”
自2023年底OpenAI推出生成式AI应用ChatGPT以来,掀起了全球的一轮AI投资狂潮。美国科技巨头对AI的投入越大,越能吸引资本市场追捧。这也令硅谷的AI企业“躺在金矿上”——OpenAI估值已超1500亿美元,科技富豪马斯克的xAI最新一轮融资的估值也达到500亿美元。但这些企业仍在持续烧钱,看不到明显的盈利途径。
在去年的一次硅谷私人晚宴上,一家美国人工智能头部公司的创始人被问及他的公司与其他构建“基础模型”的公司相比有何不同、是否有“护城河”时,在场的另一家人工智能企业的创始人开玩笑说:“他有’护城河’,没有人像他一样筹集了数十亿美元。这就是他的’护城河’。”
DeepSeek的出现之所以震慑了市场,因为它正在试图打破硅谷信奉的“用金钱堆砌出来的护城河”,给了“大力出奇迹”的巨头们当头一棒。这种认为仅靠巨额资金就能遏制竞争的经营方式正在经受考验。
业界此前一直认为,通往更好人工智能的道路在很大程度上取决于大量投资购买英伟达等公司更先进的芯片,以及大量建设用于容纳这些芯片的规模庞大的数据中心。
但DeepSeek上周发布的R1推理模型仅靠不到600万美元的原始算力以及快被市场淘汰的上一代AI芯片构建而成。600万美元甚至不够支付美国科技巨头公司一个高管一年的薪酬。
AI“权力游戏”再平衡
“AI的权力游戏正在重新平衡,巨头公司未必就是人工智能的必胜者。”一位投资人对第一财经记者这样说道。
资本市场的崩溃也暴露了美国AI领域对于中国技术存在“盲区”,很少有人关注到DeepSeek这家公司。过去一年多来,硅谷的巨头过于沉迷于自我为导向的“bigger than bigger”(我比你大)的大模型竞赛中,而没有投入太多精力将这些创新转化为真正能为企业和消费者所用的精《大喜彩票快三》心设计的产品。DeepSeek的脱颖而出可能成为AI行业竞争格局更替的转折
“直到R1的发布才真正开始引起硅谷的重视,它不仅在备受关注的AI模型能力排名中与ChatGPT并列,而且可以执行思维链推理,在公众中也大受欢迎。”一位美国投资人对第一财经记者说道。
现在在硅谷,AI行业的高管和技术人员正在紧急分析DeepSeek的论文和技术,以试图弄清楚DeepSeek究竟是如何发布这种模型的。目前,他们聚焦的核心在于DeepSeek的研究成果是否代表了一项独立的技术新突破,以及该公司在多大程度上依赖了美国大公司的基础模型。
据业内人士称,OpenAI、Meta等AI巨头正系统性地研究DeepSeek,他们感觉需要非常认真地对待中国公司的发展,因为这同样能给美国公司创新和改进现有模型提供机会。
谷歌DeepMind首席执行官Demis Hassabis上周在达沃斯论坛上称,DeepSeek模型有些“出人意料”,但他表示,对DeepSeek模型的工作原理并不确定,包括它在多大程度上依赖其他美国公司模型的结果。
在市场担忧的同时,业内对于DeepSeek的创新大部分仍持认可态度。因为它的成功为“卷尺定律”的继续发展带来了新的契机。就在几个月前,所谓的“卷尺定律”遭遇挫折,科技行业担心人工智能的能力即将达到瓶颈。但DeepSeek的经验已经表明,它有办法解决这些限制。
英特尔前CEO帕特·基辛格(PatGelsinger)就认为,美国的芯片出口法案限制了可用资源,因此中国工程师需要发挥创造力。“他们也确实做到了。”基辛格说道,“工程的问题会是一种制约。”
这也意味着,未来的人工智能的赢家既需要原始算力,也需要在有限的资源下,对提升效率的创新方式进行开发。这也是硅谷的巨头们未引起重视的。目前,美国包括谷歌、Meta在内的科技巨头仍在斥巨资购买英伟达最先进的人工智能芯片。
“大模型的未来属于那些专注于更高效技术而不是更多算力的人。”人工智能初创公司Cohere创始人CEO艾丹·戈麦斯(Aidan Gomez)表示,“我们一直坚信这一点,DeepSeek成为了导火索,终于在整个行业引起了巨大反响。”
芯片行业影响几何?
DeepSeek成功打破了“算力枷锁”,是否能说明它可以真正绕开美国对中国的芯片出口限制,实现“算力自由”?这也引发了美国业内的高度关注。
美国当地时间周一,美国议员呼吁特朗普新政府实施更严格的出口限制,以阻止中国在人工智能领域取得进一步进展。美国密歇根州共和党众议员约翰·莫勒纳尔(John Moolenaar)在一份声明中表示:“我们必须努力迅速对DeepSeek人工智能基础设施的关键技术实施更严格的出口管制。”
DeepSeek使用了不太先进的符合美国出口管制的英伟达H800芯片构建R1模型,这些芯片在2023年10月之前仍被允许出口至中国。
英伟达则回应称,DeepSeek的这项工作代表了“卓越的AI进展”。
英伟达对第一财经记者表示:“DeepSeek的研究展示了如何运用该技术,借助广泛可用的模型以及完全符合出口管制规定的算力,创建新模型。”
英伟达认为,推理过程需要大量的英伟达GPU和高性能网络。“如今我们有三条扩展定律:持续适用的预训练和后训练定律,以及新的测试时扩展定律。”英伟达方面称。
美国战略与国际研究中心瓦德瓦尼人工智能中心主任格雷格·艾伦(Greg Allen)表示,DeepSeek突破了所谓的芯片“互连速度障碍”,构建了其模型,这是“第一轮出口管制失败的滞后影响”。他认为,在2023年10月出台的一轮更严厉的芯片出口管制后,将会对DeepSeek扩展和继续开发模型需要大规模计算能力形成更大的限制。
DeepSeek创始人CEO梁文峰去年在接受采访时也强调:“钱从来都不是我们的问题。美国对先进芯片的限制才是问题所在。”
(本文来自第一财经)
责任编辑:江钰涵