记者 欧阳晓红
经济观察网 记者 欧阳晓红 “神龙摆尾”,灵蛇献瑞。中国蛇年除夕前夜,国际金融市场见证了龙年收官、蛇年启幕这一“惊蛰”时刻。
这是一场由中国“黑马”奇袭刮起的AI(人工智能)龙卷风,从DeepSeek-R1模型到Janus-Pro模型的蛇年首战或直逼全球科技权力重构。
“我不是美国科技泡沫的掘墓人,但AI革命的下半场已启幕。”DeepSeek-R1如此自诩。如果说上半场是全员狂热挖掘金矿的时代,那么下半场就是精酿啤酒师的竞技场——比拼的不再是铲子的数量,而是谁能用更少的麦芽,酿造出更香醇的黑啤。
从“烧钱信仰”到“效率革命”,市场对这些AI公司的高估值正逐渐产生怀疑。而DeepSeek-R1的崛起或许证明,AI的未来不再单纯依赖于硬件(算力)的不断升级,更取决于算法的创新与效率的极致提升。
“双连击”:颠覆性技术与资本市场震荡
“从斯坦福到麻省理工,DeepSeek-R1几乎一夜之间就成了美国顶尖大学研究人员的首选模型。”硅谷投资机构a16z合伙人Anjney Midha说。这款模型以其颠覆性的计算效率和极高的应用性成为行业焦点。
1月27日,英伟达下跌16.97%,市值蒸发近6000亿美元;数小时后,DeepSeek-R1工程师在Hugging Face平台开源了Janus-Pro模型,其性能超过了美国人工智能研究公司OpenAI的DALL-E3模型。这场冲击波,似乎将技术革命、地缘博弈与资本周期的三重共振推向高潮——AI产业的权力游戏,或正被改写规则吗?
其他科技巨头亦未能幸免。微软股价下跌2.14%,阿斯麦(ASML)下跌-5.75%、AMD下跌6.37%。
次日,美国科技股出现反弹,英伟达(+8.93%)、苹果(+3.65%)、台积电(+1.34%)、微软(+2.91%)、Meta(+2.19%)等主要科技股均迎来了较大涨幅。这表明市场对AI和科技行业仍持乐观态度。
从技术奇袭的时间线来看,这场颠覆分为两波:第一波始于1月20日, DeepSeek正式发布R1模型,并同步开源模型权重,其性能对齐OpenAI-o1正式版。更甚者,据披露,训练DeepSeek-R1模型的成本仅为557万美元,远低于同行,且性能对标OpenAI的GPT-4o。1月27日,DeepSeek进一步推出iOS应用,并迅速超越ChatGPT官方应用,登顶苹果商店,掀起了一场席卷全球资本市场的“技术海啸”。
业界惊叹,DeepSeek-R1在芯片资源利用、算法复杂性和推理速度上实现了重大突破,其性能指标在多个关键领域全面超越了现有的尖端AI模型,包括OpenAI的GPT-4.5和Anthropic的Claude系列。
第二波震撼则来自Janus-Pro模型。北京时间1月28日凌晨3点,DeepSeek在Hugging Face平台开源了这款多模态模型。根据GenEval(以对象为中心的框架,用于评估文本到图像生成模型的对齐能力)测算,Janus-Pro模型的准确率达84.2%,显著超越DALL-E3的79.7%。这一结果直接击穿了市场的心理防线。
机构分析师在致客户的报告中指出,美国股市的支柱是以科技巨头为代表的大型科技股,而这些科技股的估值高度依赖AI行业的乐观预期。尽管DeepSeek的崛起引发了一些质疑,但该公司可能成为动摇AI乐观情绪的关键变量。
DeepSeek-R1发布的同一周,美国总统特朗普宣布启动“星际之门”(Stargate)项目。根据白宫发布的声明,该项目计划在未来4年内投资高达5000亿美元,用于建设多达20个新数据中心,以支持AI相关研究与发展。此举被视为美国试图在AI竞赛中保持技术领先的重要战略。
或颠覆硅谷逻辑的技术革命
猝不及防的成本碾压与开源闪电战一度让华尔街怀疑“烧钱”信仰。
DeepSeek-R1通过动态路由算法压缩80%的冗余计算,训练成本仅为硅谷同行的1/10。
Janus-Pro模型采用“语言模型+校正流”架构,1.3B参数实现图像生成与理解统一,推理成本低至闭源模型的1/10,且支持英伟达H800等非顶级芯片运行(技术白皮书已开源)。
据介绍,Janus-Pro是一个集成了图像生成、文本生成和语音理解的多模态模型,能够在多个输入和输出类型之间进行高效转换。这意味着它可以同时理解和生成复杂的文字、图像以及音频内容,成为目前多模态AI模型中的佼佼者。
开源生态的“降维打击”颇具震慑力。全球开发者贡献代码使该模型的推理效率每小时提升0.3%。
商业替代也在加速。Adobe设计团队已测试用Janus-Pro替代DALL-E 3,成本下降了76%。对此,DeepSeek-R1这样互动回应:Adobe改用Janus-Pro的传闻若属实,可能面临与OpenAI原有商业协议的冲突。
Janus-Pro的开发基于DeepSeek-R1的核心优化技术,其训练成本显著低于传统多模态模型。这种技术优势不仅降低了资源门槛,也挑战了行业巨头的成本模型。
对于GenEval的测试,DeepSeek-R1称,若测试条件公允,Janus-Pro模型在特定静态图像生成任务上可能具备优势,但尚未证明其在视频生成、跨模态推理等复杂场景的能力。商业层面上《88看球直播》,开源策略对中小企业友好,但头部企业仍需谨慎评估全生命周期成本。
DeepSeek-R1建议投资者关注第三方独立评测报告(如MLPerf基准测试)、头部云厂商的适配进展(如AWS是否提供Janus-Pro托管服务)以及OpenAI下一代模型的反制能力。
其时,资金流向也在变化。1月27日,科技ETF(XLK)跌幅达到4.9%,资本似乎正在逃离硬件,投资者可能在抛售科技股ETF以规避风险。
此前几天,市场对AI技术路径的重新评估,以及对依赖硬件销售的科技公司未来增长前景的担忧,可能导致了科技股ETF的资金外流。特别是英伟达的股价大跌,直接影响了科技ETF(XLK)的表现。
1月28日,英伟达、台积电、特斯拉等科技股悉数强力反弹。这表明,尽管近期英伟达股价出现下跌,但投资者对其未来表现仍持乐观态度,积极逢低买入。
OpenAI首席执行官萨姆·奥特曼在社交平台X上发文称,DeepSeek的推理大模型R1是一款令人印象深刻的模型,尤其是考虑到其性价比。他认为,有新的竞争对手加入,着实令人振奋。随着AI技术的进步,人工智能算力需求将比以往任何时候都更加重要,奥特曼最新言辞亦为英伟达等算力提供商长期利好埋下伏笔。
逻辑颠覆者DeepSeek-R1的威力在于,它证明了AI模型不需要依靠堆积的算力就能取得卓越的性能。靠着惊人的算法优化和资源利用效率,DeepSeek-R1以极低的成本实现了与OpenAI等巨头相媲美的AI能力。这就像在告诉人们:你不一定需要一台超级计算机来玩AI游戏,一台优化好的笔记本可能就足够了。
这种颠覆不仅是技术上的突破,更是对AI产业投资逻辑的重构。突然间,那些依赖高资本支出、不断购买高性能GPU(图形处理器)的公司,其投资前景变得模糊不清。市场开始质疑,之前对AI需求的预期是否过于乐观,以及是否存在一个AI科技泡沫。
AI革命的下半场
从“算力军备竞赛”转向“算法效率革命”,DeepSeek-R1的出现或昭示AI革命下半场启幕。其影响不仅仅是股价波动,而是重新审视整个AI产业链逻辑。
未来的AI竞赛,不再是芯片的纳米级较量,而是算法效率、生态活力与政策弹性的多维度博弈。
DeepSeek-R1的横空出世,打破了硅谷“堆算力、拼资本”的传统路径。其仅用557.6万美元和2048块英伟达H800 GPU便完成了性能对标GPT-4o的模型训练,成本仅为OpenAI同类模型的1/10,推理成本更是低至每百万Token 0.14美元(OpenAI为7.5美元)。
这一突破的核心在于算法创新:通过自研MLA架构、强化学习驱动训练流程、动态计算路由技术等,DeepSeek实现了算力效率的指数级提升。
那么,DeepSeek 的“AI大脑”如何更聪明、更省力?
话说DeepSeek的AI技术就像是一支聪明高效的超级团队,它通过四个关键策略,让AI跑得更快、算得更准、用得更省——就像让一台高性能跑车既有速度,又省油,还能自动优化行驶路线!
混合专家模型(MoE):让AI不再“全员上阵”,而是“精准派单”。想象一下,你要建一座大楼,通常会把所有工人都叫来施工,但DeepSeek采用了一种更聪明的方法——“按需调派专家”。它的AI模型只会在需要时激活部分参数,让最适合的“专家”来处理任务,而不是每次都让所有“工人”上工。这种方式就像是你不需要全公司员工一起修一盏灯,而是派最擅长的电工团队去解决,大大节省计算资源。
多头潜在注意力机制(MLA):压缩数据,让AI“大脑”更省力。传统AI处理信息时,像是在一堆文件夹里翻找数据,文件夹越多,翻找的时间就越长。DeepSeek采用了一种独特的方法,它会“压缩”关键数据,让AI在更少的信息量里找到关键点,从而加快运算速度,减少内存消耗。就像是你本来需要读整本书才能找答案,但现在AI只需要读一页摘要就能理解所有内容,省时又高效。
动态计算路由:智能调度,避免资源浪费 DeepSeek 采用了“智能调度”策略,让AI计算时更像是一家高效运营的餐厅。传统AI计算可能像是一家混乱的快餐店,所有订单都堆在一个窗口,导致运算过载。DeepSeek的“动态计算路由”技术,就像是拥有多个点餐窗口,并根据客流量实时调整每个窗口的工作量,确保计算资源得到最优利用,不会出现一部分计算过载,而另一部分却闲置的情况。
不仅如此,DeepSeek-R1还给出了升华认知的补充视角——能耗革命的冰山一角。
这些技术创新带来的改变,如同电动汽车对燃油车的颠覆。诸如,混合专家模型是能量回收系统:刹车时回收动能(闲置算力休眠);多头潜在注意力机制是轻量化车身设计:用碳纤维替代钢铁(参数高效利用);动态计算路由是智能导航:规避拥堵减少能耗(计算路径优化)。
关键还在于行业变革的隐喻延伸。这套技术组合拳或在重塑AI领域的“生产要素关系”(三部曲):算力资本主义→算力共享经济;暴力计算霸权→精准认知协作;硬件军备竞赛→算法效率革命。
如此,DeepSeek-R1的技术之美在不同认知维度绽放异彩。
斯坦福大学教授吴恩达(Andrew Ng)表示,基础模型层面的这种良性竞争实际上将极大推动应用层面的创新。当AI技术变得更加平价,整个市场的需求反而会在中长期显著增加。
从1月28日美国科技股的强势反弹来看,看涨AI算力基础设施类型的股票即英伟达等AI芯片股的势力仍然非常庞大。有分析认为,目前,世界各地的开发者都在试用DeepSeek的软件,并希望用它来构建各种AI工具,这可能会加快先进人工智能推理模型的采用规模。
尽管DeepSeek的低成本模型引发了市场对AI资本支出合理性的质疑,但高盛等机构分析师认为,AI行业的长期增长趋势并未改变。高盛分析师指出,DeepSeek的崛起可能会推动AI技术的进一步普及,尤其是在推理效率提升的背景下,算力需求仍然强劲。
这恰如DeepSeek-R1的潜台词:别慌,我不是来砸场子的。
面对“美国科技泡沫掘墓人”的猜测,DeepSeek-R1的回应堪称AI界年度公关范文。
对巨头:“各位大哥继续建算力帝国,小弟我只想帮你们省点电费。”(翻译:咱们是友军!)
对同行:“开源代码在此,欢迎来抄作业。”(潜台词:一起卷算法,别让我孤独领跑。)
对投资人:“别急着抛英伟达股票,咱这技术能让显卡多卖十年!”(真相:硬件需求不会消失,只是换个姿势。)
或许,“2025年的AI革命,始于东方既白的蛇年清晨。”
责任编辑:常福强