周五,在“OpenAI 12天活动”的第12天,OpenAI首席执行官萨姆·奥特曼宣布了其最新的人工智能“推理”模型o3和o3-mini,这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型,但今天将使这些模型可用于公共安全测试和研究。
这些模型使用OpenAI所称的“私人思维链”,模型会暂停检查其内部对话,并在响应之前提《771771威尼斯.Cm》前计划,你可以称之为“模拟推理”(SR),即一种超越基本大型语言模型(llm)的人工智能形式。
根据OpenAI的说法,o3模型在ARC-AGI基准上获得了破纪录的分数,ARC-AGI基准是一种视觉推理基准,自2019年创建以来一直保持不败。在低计算场景中,o3得分为75.7%,而在高计算测试中,它达到了87.5%,与人类在85%阈值下的表现相当。
OpenAI还报告说,o3在2024年美国数学邀请赛中得分为96.7%,只缺了一道题。该模型在包含研究生水平的生物、物理和化学问题的GPQA Diamond上也达到了87.7%。在EpochAI的前沿数学基准上,o3解决了25.2%的问题,而其他模型都没有超过2%。
同样在周五发布的o3-mini版本包括自适应思考时间功能,提供低、中、高处理速度。该公司表示,更高的计算设置可以产生更好的结果。OpenAI报告说,在Codeforces基准测试中,o3-mini的性能超过了它的前身o1。
模拟推理正在兴起
OpenAI将首先向安全研究人员提供新的SR模型进行测试。奥特曼说,公司计划在1月底推出o3-mini,随后不久推出o3。
责任编辑:李桐
新的一周 ⚾,投资者将重点关注的仍是美国的 ♎经771771威尼斯.Cm济数据,尤其是将于周二公布的2月CPI物价数据和周三公布的 ⚓美国2月零售销售数据♈,该数据素有“恐怖数据”之称。在不够强劲 ♉的2月非农数据公布后 ♑,当前市场对于美联储3月加息50个基点的 ➦预期有所降温,市场焦点转向CPI数据,如果CPI也不够强劲, ⛹那么将进一步增强美联储将加息25个基点的预期,反之市场对美联 ⛴储加息50个基点的预期可能会再度升温,并引发恐慌情绪。
美国时间3月10日上午也就是北京时间3月11日凌晨,在 ♿流动性危机漩涡中挣扎的美国硅谷银行再传噩耗:当日,美国联邦存 ♒款保险公司(FDIC)发布声明称,因硅谷银行资不抵债,美国加 ⌛州金融保护和创新部(DFPI)宣布将其关闭,并任命FDIC为 ➡破产管理人 ⚽。为保护投保的储户,美国联邦存款保险公司创建了存款 ♒保险国家银行(DINB),硅谷银行在关闭时,作为接管人的联邦 ➦存款保险公司需立即将硅谷银行所有受保存款转移到DINB。最晚 ♊于13日上午,所有受保储户都将可以完全使用其受保存款。
本报记者 项伯 【编辑:劳干 】