英伟达称DeepSeek R1是“一项出色的人工智能进步”,尽管这家人工初创公司的崛起导致英伟达股价周一暴跌17%。
英伟达发言人周一表示:“DeepSeek是一项出色的人工智能进步,也是测试时间缩放的完美例子。”“DeepSeek的工作说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算。”
在此之前,DeepSeek上周发布了R1,这是一个开源推理模型,据报道,它的表现超过了OpenAI等美国公司的最佳模型。R1自我报告的培训成本不到600万美元,与硅谷公司花费数十亿美元建立人工智能模型的成本相比,这只是一个零头。
英伟达的声明表明,它认为DeepSeek的突破将为这家美国芯片制造商的图形处理单元(GPU)创造更多的工作。
“推理需要大量的英伟达GPU和高性能网络,”发言人补充说。“我们现在有三个缩放定律:训练前定律和训练后定律,它们会继续,还有新的测试时间缩放定律。”
本月早些时候,微软表示,仅2025年就将在人工智能基础设施上投入800亿美元,而Meta首席执行官马克·扎克伯格上周表示,这家社交媒体公司计划在2025年投资600亿至650亿美元的资本支出,作为其人工智能战略的一部分。
英伟达的评论也反映了英伟达首席执行官黄仁勋、OpenAI首席执行官萨姆·奥特曼和微软首席执行官萨蒂亚·纳德拉最近几个月讨论的一个新主题。
人工智能的繁荣和对英伟达gpu的需求在很大程度上是由“缩放定律”驱动的,这是OpenAI研究人员在2020年提出的人工智能开发概念。这一概念表明,通过大幅增加构建新模型所需的计算量和数据量,可以开发出更好的人工智能系统,而这需要越来越多的芯片。
自去年11月以来,Huang和Altman一直在关注缩放定律的一个新问题,Huang称之为“测试时间缩放”。
这一概念认为,如果一个训练有素的人工智能模型在进行预测或生成文本或图像以进行“推理”时,花更多的时间使用额外的计算机能力,那么它将比运行更少的时间提供更好的答案。
测试时间缩放定律的形式被用于OpenAI的一些模型,如《幸运彩票》o1和DeepSeek的突破性R1模型
责任编辑:李桐
9点刚过幸运彩票
据了解,患者在急诊就诊时 ⛸,医务人员会先根据生命体征、主 ❦诉等情况进行四级分级 ♐,幸运彩票譬如血氧低于80%为一级,低于90%为 ❌二级。为了应对重症患者增加的现状,该院在原有ICU的基础上挖 ⛼掘各病区潜力,在病房内设置可随时转换为重症监护的床位,目前, ☽该院可救治重症患者的床位已较之前增加一倍;增配了监护仪、呼吸 ⏪机等医疗设备;并对医务人员开展相关培训,加强重症的诊治能力。 ♍此外,无论是发热门诊还是急诊接诊的各种疾病的重症患者,均由相 ⏬关学科的专家进行会诊、制定个性化的治疗方案。
本报记者 郭颖 【编辑:江胜 】