国产成人av片在线观看,色AV综合AV无码AV网站,亚洲欧洲日产国码无码app

转自：金融界

周末疯狂刷屏，来自国内量化私募巨头幻方量化的DeepSeek大模型的震动全球AI圈！

近日，DeepSeek公司宣布正式发布最新人工智能模型DeepSeek-R1，并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。

DeepSeek-R1在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。数据显示，DeepSeek-R1在算法类代码场景（Codeforces）和知识类测试（GPQA、MMLU）中的得分略低于OpenAI o1，但在工程类代码场景（SWE-Bench Verified）、美国数学竞赛（AIME 2024, MATH）项目上，均超过了OpenAI o1 。

更重要的是，工作人员发现，在DeepSeek-R1-Zero自我学习的过程，随着时间的增加，该模型“涌现”出了复杂的行为，如自我反思、评估先前步骤、自发寻找替代方案的情况，还包括一次“尤里卡时刻”（“aha moment”）。“尤里卡时刻”指人类突然理解一个以前无法理解的问题或概念的某个时刻。

深度求索透露，这次“尤里卡”发生在DeepSeek-R1-Zero的的中间版本期间。当时工作人员惊奇地发现，在一道数学题中，该模型学会了使用拟人化的语气进行自我反思，并主动为问题分配了更多的时间进行重新思考。

震动全球AI圈

这一消息震动全球AI圈，美国AI公司研究人员对中国大模型技术感到吃惊。

一位Meta的工程师在美国科技公司员工社区Blind中这样写道，“Meta的生成式AI部门正处于恐慌中。这一切始于DeepSeek，它使得 Llama 4 在基准测试中已经落后。雪上加霜的是：那个不知名的中国公司，仅有550万美元的训练预算。工程师们正在疯狂地剖析DeepSeek，并试图从中复制一切可能的东西。”

”英伟达高级研究科学家Jim Fan表示，DeepSeek-R1可能是第一个展示了RL（强化学习）飞轮可发挥作用且能带来持续增长的OSS（开源软件）项目。加利福尼亚大学伯克利分校教授Alex Dimakis则称，DeepSeek似乎是奔赴OpenAI最初使命的“最佳人选”，其他公司需要迎头赶上。

硅谷风投A16Z创始人Marc Andreessen也发表评论称，DeepSeek-R1是他见过的最令人惊叹且令人印象深刻的一个突破，作为开源的模型，它的面世给世界带来了一份礼物。

不过，“深度学习”三巨头之一、图灵奖得主、Meta AI首席科学家杨立昆表示，DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司，不如说意味着开源大模型正在超越闭源。

训练成本大降，利空英伟达？

此外，值得注《天博体育app苹果下载》意的是DeepSeek-R1 API服务定价为每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens16元，输出API价格只有OpenAI o1的3%。低价背后，显然仍是秀肌肉，价格实力展现了技术实力——从AIInfra 层面降本的技术能力。

而训练成本一直是DeepSeek的一大优势。

前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示，DeepSeek-V3整个训练过程仅用了不到280万GPU小时，相比之下，Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。如果DeepSeekV3的优良表现能够得到广泛验证，那么这将是资源有限情况下对研究和工程的一次出色展示。若从成本上进行更直观的对比，假设H800的租金为每GPU小时2美元，DeepSeek-V3的总训练成本仅为600万美元不到，是Llama-3405B超6000万美元训练成本的十分之一不到。

DeepSeek不仅将模型训练成本大幅降低，而且发布的新模型R1也同步开源模型权重，公开了完整训练细节，挑战了闭源系统的优势。随着DeepSeek将AI大模型技术及使用门槛降低，有市场人士担忧，DeepSeekR1的崛起可能会削弱市场对英伟达AI芯片需求的预期，对英伟达的市场地位和战略布局产生影响。

有观点认为，DeepSeek-V3极低的训练成本预示着AI大模型对算力投入的需求将大幅下降，这无疑将利空全球AI算力的核心供应商英伟达。

网名调侃：中国股民做出贡献

DeepSeek是国内量化巨头幻方量化的子公司。依靠DeepSeek的出色表现，量化巨头幻方量化创始人梁文锋也迅速奠定了在AI圈地位。

梁文锋本硕均就读于浙江大学信息与电子工程学专业。2015年，梁文锋与校友共同创立幻方量化。2021年，幻方量化成为国内首家突破千亿规模的的量化私募大厂，被称为国内量化私募“四大天王”之一。早年，幻方量化开始大规模布局 AI 算力，搭建起“萤火一号”集群。2021年，“萤火二号”落成，这给了DeepSeek快速奔跑的底层支撑。

对此，有人调侃，中国股民给世界AI最大的的贡献就是让幻方量化赚了那么多钱。然后幻方量化创始人有钱买最好的GPU，收纳一批中国最牛的精英，做出了不错的Deepseek。

责任编辑：郭明煜

亚洲国产日韩不卡综合,内射在线Chinese,日韩综合一卡二卡三卡死四卡 ,国产精品久久午夜夜伦鲁鲁

给大家科普一下天博体育app苹果下载

IMF：债券市场动荡恐加剧风险，监管机构应加强对债券收益率上升威胁的审查

美联储理事Waller：坚定致力于把通胀带回目标水平

医药生物板块净流入46亿元居首龙虎榜机构抢筹多股

富瑞：维持携程集团-S“买入”评级目标价453港元

豪美新材(002988.SZ)：前三季度净利润预升363.79%-444.45%

杭州亚运会溢出效应显著多产业积极探索以体育赋能发展

金融监管部门提示：谨防“AI 换脸”等新型诈骗手段

美联储官员Logan：收益率上升可能意味着进一步加息的必要性降低

公司问答丨广州浪奇：公司子公司华糖食品的产品主要销售地区是华南和华东地区

“丝路电商”成为新亮点，商务部“三个携手”概括成果

光大期货：10月10日能源化工日报

贝莱德副董事长Hildebrand：全球央行的政策利率料不会很快下降