每经编辑 杜宇
当所有人还在惊叹DeepSeek的惊人实力时,OpenAI终于坐不住了。当地时间1月31日,OpenAI正式推出了全新推理模型o3-mini,并首次向免费用户开放推理模型。这是OpenAI推理系列中最新、成本效益最高的模型,现在已经在ChatGPT和API中上线。
OpenAI可能考虑开源、公开完整思维链。在o3mini正式推出之时,OpenAI的首席执行官Sam Altman(奥特曼)携一众高管在reddit回答网友问题,其间罕见承认OpenAI过去在开源方面一直站在“历史错误的一边”。Altman表示:“需要想出一个不同的开源策略”。
在谈及DeepSeek时,Altman表示它是“一个很好的模型”,并表示“我们将生产更好的模型,但与往年相比,领先优势更少”。
Altman还进一步表示,得益于DeepSeek,OpenAI可能更多地揭示其所谓的推理模型(如O《在哪可以买足球比分》3-Mini)如何展示其“思考过程”。目前,OpenAI的模型隐藏了它们的推理过程,防止竞争对手为自己的模型获取训练数据。相比之下,DeepSeek的R1模型则对用户开放思维链输出。
OpenAI首席产品官Kevin Weil也补充表示:
“我们正在努力展示比今天更多的内容,这将很快实现。待定,展示所有的思维链(CoT)的确会导致竞争性蒸馏,但我们也知道人们(至少是高级用户)想要它,所以我们会找到合适的方法来平衡它。”
在当地时间1月31日的新闻稿中,OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力下,o3-mini准确率能够提升到79.6%,与o1模型相当。在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。
横向对比,DeepSeek-R1模型在AIME 2024测试中的准确率为79.8%,而在GPQA Diamond测试中的准确率为71.5%。
有专家在社交媒体表示:受DeepSeek影响,OpenAl现在也显示推理模型的思维过程了。
此外,对于付费用户,o3-mini将在模型选择器中替代o1-mini。作为升级的一部分,每月花费20美元左右的ChatGPT Plus和Team用户,速率限制也从o1-mini的每天50条,提升到o3-mini的150条。每月支付200美元的ChatGPT Pro用户,能无限制地访问o3-mini。
责任编辑:韦子蓉
本届世界杯亚洲有六队参加,但整体水平不如欧 ☸美球队。在今天比赛开打之前,亚洲的卡塔尔和伊朗早已出局。而澳 ❌大利亚、日本和韩国都有出线希望 ♐,而出线希望最大的是澳大利亚队 ♊。澳大利亚队本场之前已握3分,今天只要战平都有很大的出线概率 ⚓。可喜的是他们1比0战胜了丹麦队, ⚡本场后澳大利亚6分,和法国同分因为净胜球劣势以小组第二出线。 ♊澳大利亚队也成了本届世界杯到目前为止,亚洲首支出线的球队。同 ⛶时也是澳大利亚队时隔16年再次晋级淘汰赛 ⌛,这对澳大利亚人来说 ♎太不容易了 ➦。在哪可以买足球比分
本场世界杯交手,日本队在大好形势下,上一场 ♓丢掉必拿的三分,可以说是自己给自己玩脱了 ⛵,目前球队虽有晋级机 ⏪会,但可以说是已经丧失了主动权 ➦,外加本场对手是实力强劲的西班 ➣牙队,想要在对手身上拿分恐怕太难。西班牙队此前仍保持着不败战 ❤绩,小组出线对西班牙队来说应该不是问题,本场相信球队也能摆正 ⛹态度认真对待。此役我们认为西班牙队取胜无忧。
本报记者 毛纪 【编辑:宝历 】