每经编辑 黄胜
据广州日报报道,“DeepSeek爆火的原因主要可以归结为两点:性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。
“DeepSeek以较低的成本实现了高性能的AI模型,这使得其在市场竞争中具备了显著的优势,这种成本效益比无疑会吸引大量企业和个人用户选择其产品和服务。”北京社科院副研究员王鹏表示。郑磊直言,DeepSeek对硬件市场产生了重大影响,因为它可能会降低人工智能模型的硬件成本,从而推动人工智能技术的发展。
有券商研报认为,DeepSeek-R1出圈,建议继续重视应用环节、字节链投资机会。DeepSeek-R1的最大亮点在于其训练方法,首次完全通过强化学习(RL)训练大型语言模型,无需依赖监督微调(SFT)或人工标注数据,这一突破验证了仅通过奖励信号,模型也能发展出强大的推理能力。
分析认为,DeepSeek的性能和定价策略,使得其直接成为OpenAI的有力竞争者,可能阶段性改变AI大模型的竞争格局。尤其是其完全开源的特点,以及显著低于竞品价格的特点,将有望加速国产应用开发及推广。应用层面,类似O系列模型,DeepSeek-R1能够高效解决复杂数学问题,适用于教育、科研等领域,值得关注。
DeepSeek集中代表了算法创新带来的模型优化是具有空间的,在底座模型当前并没有显著代际提升的背景下,算法创新将有望加速缩小国内模《pk彩票首页》型和海外模型的差距,但这一现象暂时也没有办法证明未来对于训练环节的算力需求将下降,近期可以看到海外头部大模型厂商的资本开支计划进一步加大,也是证明。
在此背景下,Agent及端侧可能是2025年应用的重要方向。伴随着OpenAI推出官方Agent,以及字节跳动投入加大,将有望推动AI应用的渗透普及,AI应用可能于2025年从逻辑走向落地。
每日经济新闻综合广州日报、公开信息
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
封面图片来源:每日经济新闻 资料图
今年3月初,短短3日时间 ♍,市场上已经盛传两则知名房企在 ♊上海的资产处置方案。有消息称旭辉集团计划以逾14亿元的价格, ⛵整栋出售上海恒基旭辉中心2栋商办物业。这2栋拟出售物业位于上 ⚓海虹桥商务区,整栋报价分别为5.5亿元及8.8亿元 ⛽。同期中骏 ♌集pk彩票首页团计划整栋出售位于上海虹桥商务区的虹桥中骏广场的多栋物业, ♊总报价约25亿元。第一财经记者联系了上述两家公司官网电话,截 ♏至发稿前暂无回复。
近年来,广大中小学在开展“双减”的同时,做好科学技术教 ♎育pk彩票首页的加法,努力激发青少年好奇心、想象力、探求欲,培育具备科学 ✌家潜质、愿意献身科学研究事业的青少年群体 ⛲。这是令人欣慰的事情 ➦。
本报记者 宋无 【编辑:柳宗元 】