“DeepSeek以极低成本和少量芯片实现了与OpenAI等巨头可以媲美的性能,引发国际AI界关注。如果算力不再决定AI性能,那么之前无脑买英伟达芯片的投资逻辑很可能发生变化,其它业态也将改变。”周日(1月26日),一位首席经济学家在微博上写道。
周一,“东方神秘力量”DeepSeek带来的冲击率先在亚洲市场显现。早盘,A股DeepSeek概念暴涨超11%,同时算力概念暴跌,AI算力、GPU、液冷服务器和ASIC芯片等板块均大跌超3%,光芯片、高速铜互联、光通信和光模块等板块均暴跌5%以上;日本半导体ETF也大跌超3%。
1月27日,A股算力相关板块数据
但实际上,DeepSeek带来的焦虑甚至恐慌更多是在大洋彼岸,周一纳指期货跌近3%;要为美国AI投资千亿美元的软银暴跌6%。悬念是,DeepSeek会刺破美股七巨头的泡沫吗?
美国市场担心的,不只是被中国AI追平甚至超越,他们更对DeepSeek的训练效率感到惊愕。由此产生的关键质疑是,美国科技巨头们花重金囤GPU的意义何在,英伟达3.5万亿美元市值的真正价值何在,美国政府处心积虑管制先进AI芯片对华出口的作用又何在。
没人会想到,在中国获取先进AI芯片被严密管制的情况下,一家刚成立一年半、去年才推出首款大模型的年轻公司,会给全球市场带来如此震撼。这是因为他们并没有迷信“大力出奇迹”的尺度定律(Scaling law),而是专注训练方法的创新,减少对计算资源的需求。
去年12月,DeepSeek发布新一代开源大模型DeepSeek-v3,能力与闭源的GPT-4o相近,但训练仅需要2048张英伟达H800 AI芯片,训练成本仅为557.6万美元。OpenAI创始团队成员Andrej Karpathy在社交媒体上发文对比称,类似DeepSeek-v3能力的模型在业界一般需要1.6万张GPU的集群训练,例如Meta发布的Llama-3-405B在类似的集群上花费了3080万GPU小时,而DeepSeek仅使用了280万左右的GPU小时。
中国企业购买英伟达H800需要许可证
这种训练效率的巨大提升,直接改变了AI对先进芯片和算力需求的逻辑。行业分析认为,DeepSeek开源让一些对OpenAI转向封闭不满的科研工作者欣喜,更重要的是,DeepSeek代表着中国在先进算力受限的情况下研发先进模型的能力,这让令人震撼。
众所周知,为确保技术霸权、遏制中国AI发展,美国在芯片领域的对华制裁近乎疯狂。就在今年开年,还将中国列入“Tier 3级管控”,几乎切断高端AI芯片的供应链。可以说,国内AI产业上下游的公司面临供应链受阻、研发受限、发展成本增加等重重挑战。
在这样的环境下,DeepSeek还是蹚出了自己的路,并允许研究者和开发者在自己的项目中自由使用该模型,允许用户对模型进行任何形式的修改和衍生创作。这种开放姿态为全球AI行业带来了宝贵资源,也让那些把英伟达先进芯片当做制裁武器的人脸面无光。
封锁和制裁,还推动了中国企业之间的联合突围。国外媒体爆料,DeepSeek最新推出的推理模型DeepSeek-R1,支持华为的昇腾平台和MindIE推理引擎,通过“动态精度调节”技术,他们在同等任务下性能损失仅5%,但成本下降70%。这一发展标志着人工智能硬件选项多元化的重要一步,为英伟达以GPU为中心的生态系统提供了另一种选择。
外媒报道DeepSeek适配华为昇腾平台
当然,我们也要清楚意识到,DeepSeek仍然是新生力量,靠某一个模型或企业就改变中美AI科技力量的对比,并不现实,而且市场处在信息爆炸的时代,很多时候无法完整看到事情发展的全貌。
就比如在训练成本上,有国内大模型头部企业的技术负责人指出,DeepSeek-v3公布的557.6万美元仅是单次训练成本,而一次完整的训练包括预实验、数据生成和清洗等步骤,实际训练成本至少要翻倍;而训练同样能力的模型,在前人试错完成后,后来者训练成本一定更低。
事实上,在算力、资金等环境条件的严苛局限与挑战之下,国内大模型厂商均着力于软件、算法等优化,跟随OpenAI已经开拓好的技术路线,普遍实现了训练成本、推理成本较国外同行至少低一个数量级的能力。
零一万物创始人李开复去年底曾表示,零一万物训练成本只有OpenAI的3%,推理价格是OpenAI的四十分之一。
“最近被反复验证的是大模型非常怕被抄,第一个捅破天的人需要付出很大的成本,后面几名只需要付出甚至是1%的成本,就能换一个90%效果的模型,跟随战略长期有效。”有AI行业人士说道。
但中国AI产业想要迎头赶上甚至实现领跑,就不能只是做跟随,而是要实现更多从0到1的突破。
正如DeepSeek创始人梁文锋所言,中国AI不可能永远处在跟随的位置。“我们经常说中国AI和美国有一两年差距,但真实的差距是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。”
本文系观察者网独家稿件,未经授权,不得转载。
The deal set the record for the largest single order involving the Chinese shipbuilding industry, according to the China Shipbuilding Trading Co., Ltd. (CSTC) under the CSSC.金牛国际j6棋牌
后从吃播转向了短视频
本报记者 子高 【编辑:圣西门 】