DeepSeek的低成本高效训练方法可能导致训练需求下降,抑制算力需求,从而打破“人工智能革命将伴随计算和能源需求呈指数级增长”的假设。
近来,一场由DeepSeek引发的AI概念股大跌风暴席卷欧美股市,其中,“卖铲子”的芯片制造商以及为AI和数据中心供电的能源企业遭受重创。
在除夕夜前一天,能源供应商Constellation Energy股价下跌21%,电力企业Vistra下挫28%。
“DeepSeek重置了中美在人工智能领域的竞争环境,更重要的是,它从根本上颠覆了能源领域。”国际税务与投资中心能源、增长与安全项目助理主任何伟龙(Wesley Alexander Hill)在日前发表于《福布斯》杂志的署名文章中表示,全球许多国家制定能源政策所基于的基本假设,即人工智能必会带动需求不断增长,已经不复存在。
金融服务公司杰富瑞(Jefferies)分析师亦在报告中指出,DeepSeek的突破对“美国电力需求将随AI发展大幅增长”的预测提出质疑。
传统思维认为,扩大人工智能规模的方法是大量投资,即应用更多芯片、创建更庞大的数据中心,并消耗指数倍的能源。劳伦斯伯克利国家实验室2024年的一份报告显示,美国数据中心在2023年消耗了全国约4.4%的电力,但到2028年的用电量可能会增加一至三倍,占总用电量的12%。电力研究所预测,到2030年,数据中心可能消耗美国发电量的9%,是其当前用电量的两倍多,这相当于在本十年内骤增一个加州的电力需求。
这一背景下,能源巨头们显示出极大热情。2024年12月,埃克森美孚和雪佛龙高管分别公开表示,他们正在积极考虑进入电力市场,计划通过天然气发电和碳捕获技术,为人工智能数据中心提供动力。埃克森美孚表示,计划建造一座1.5吉瓦(GW)的天然气发电厂,专门用于为数据中心供电。
然而,DeepSeek的低成本训练模式让行业对大规模AI算力投资产生怀疑,也极大降低了能源需求预期。
DeepSeek的突破性在于,它仅用2048个英伟达H800芯片运行两个月,训练成本560万美元,就获得了媲美OpenAI最先进模型GPT-4的性能。相比之下,OpenAI和谷歌训练同等规模模型的成本高出十倍左右。克莱曼中心高级研究员约翰·奎格利(John Quigley)在研究报告中指出,“DeepSeek作为一家中国人工智能公司的突破,其开源人工智能模型仅使用一小部分(可能只有2%)的芯片、硬件和能源,就超越了当前的行业标准。”
尽管DeepSeek提高了能源使用效率,但行业对其能否打破电力需求瓶颈仍处于观望态度。哥本哈根大学计算机科学家Raghavendra Selvan表示,DeepSeek意味着我们可以在更大的数据集上开发更大的模型,并吸引更多人参与开发,这有利于技术民主化,但也会增加总能耗。他还指出,如果这些模型更加高效,人们将借此处理更多数据,能源消耗也会增加,“这就是杰文斯悖论(Jevons paradox)的经典案例。”
1865年,英国经济学家威廉·斯坦利·杰文斯首次提出,当某种资源的利用效率提高时,其总消耗量反而可《一分快三app推荐软件》能增加。例如,瓦特改良蒸汽机后,煤炭消耗量不降反升,因为更高效的蒸汽机被广泛应用于更多领域。
行业预期,DeepSeek的低成本模型可能引发类似效应。“长远看,降低人工智能成本肯定会刺激更广泛的应用,从而增加电力需求。”约翰·奎格利建议,电网规划者和政策制定者应该引导市场理性布局、建设有关人工智能用能的发电厂。同时,更应关注芯片改进、人工智能计算效率提升以及清洁能源和储能的潜力,“要重新关注清洁发电消纳问题的解决、部署电网增强技术,以此促进清洁能源加速增长,并降低能源成本。”
责任编辑:王若云