无码精品黑人一区二区三区,日韩精品无码一本二本三本色

　　来源：信息平权

　　幻方代表了开源相对闭源的胜利，其贡献将促进开源社区繁荣，并可能导致北美闭源模型API价值归零。幻方在降低推理成本方面表现突出，其架构能轻松支持各种类型的卡，推理成本的降低将促进应用繁荣，拉动更大算力需求。

　　其实具体逻辑，从12月deepseek v3到这周的r1，我们前前后后分析过很多次了，不妨总结梳理下

　　1．海外广泛引用的550万美金是v3，而不是r1的训练成本，且550万只是v3实际训练成本的零头。v3论文原话：上述成本仅包括DeepSeek-V3 的正式训练，不包括与架构、算法、数据相关的前期研究、消融实验的成本。社群内一位算法工程师就曾说“v3用了幻方自己的r1模型生成数据，这个部分的反复尝试要不要算在成本里呢？”一个意思。

　　2．前沿探索和后发追赶，所需要的算力本就不是一个量级。表现为训练同一代模型所需算力每隔N个月就是指数级降低。原因包括算法本身的进步（FP8、混合MoE）、算力的持续通缩、复现方法如蒸馏等对数据的浓缩。最关键的是，探索就意味着会有浪费，而后发追赶“站在巨人肩膀上”本就可以规避浪费。就比如o1的训练成本肯定远超GPT-4，幻方r1的训练成本肯定也超过v3。而从o3到o4/o5，从r1到r2/r3，训练算力只会更多。

　　3．单次训练降本了，不代表整体训练成本会下降。训练效率提高，实验室就减少投入吗？不会，真实逻辑是：基于更高效率，榨干算力，去攫取更大收益。就拿幻方来说，infra优化降本能力这么强、提前囤卡也挺多、没怎么扩张API服务专注于研究与训练的情况下，依然还在缺卡。横向对比之下，北美某些花了更多钱的实验室，的确显得很尴尬．．．但他们之后就降本增效吗？不会。消化吸收幻方开源的方法+比幻方多得多的算力=攫取智能的更大提升。训练算力最应该担心的是撞墙，算力使用效率提高，反而可能是提高了模型本身的天花板。

　　4．幻方代表的是整个开源相对闭源的一次胜利。对社区的贡献会快速转化为整个开源社区的繁荣。如果真的说利空的Loser，那可能是闭源模型。中国这一点已经提前经历了，被Llama支配的恐惧，跑不过Llama3的中国闭源模型公司被迫倒闭、转应用、转开源。而今天中国开源打到了北美闭源．．．如果现在还不如r1（以及即将到来的r2 r3），那这家公司的API价值基本归0。但说实话这个过程的确会让模型训练参与方快速缩减。

　　5．最关键的，以上讨论都是训练，而未来显然更大需求来自推理。有一点被大家忽略了，幻方对推理成本的消减，比训练来的更为震撼。今天大家都看到了AMD宣布支持幻方v3，用我们嘉宾Y博的话就是：DeepSeek架构的优雅之处就在于，和标准的transformer架构比较起来，并没有引入特殊的算子。理论上可以相对轻松支持各种类型卡．．．（这也是被GPU禁运逼出来的）大家体会下这句话的分量，以及对于CUDA的启示．．．幻方这帮人都是手撸算子的天才．．．

　　推理成本降低，对算力是利好还是利空？比训练更好理解。请对比：刚推出来贵到没人用的o1，以及掀起API价格战之后的豆包。推理成本的降低大概率会带来应用的繁荣，反而会拉动更大的算力需求。

　　这里再引用下星球Y博的评论，现在回头看非常前瞻：DeepSeek-V3将支持私有部署和自主微调，为下游应用提供远大于闭源模型时代的发展空间。未来一两年，大概率将见证更丰富的推理芯片产品、更繁荣的LLM应用生态。

　　6．如何平衡北美仍在疯狂的基建，和过去浪费的投资？美国的确CSP仍在疯狂抢电，都抢到2030年去了。其实各大CSP过去2年千亿美金砸下去，没有一家单纯是为了训练，基本都是自身业务需求+推理业务增长驱动。只有微软为OpenAI准备的算力credit、AWS算力租赁给了下游客户用于训练、Meta/xAI部分算力用于自身训练，但算力大头都是因为自身的推荐系统业务/自动驾驶业务本身需求。以及微软已经相当于拒绝了Sam Altman继续All in的诉求，转而聚焦回报更确定的推理（Satya亲口这么说）。

　　因此幻方这件事对北美CSP来说，客观来讲，过去某些训练投入的确是打水漂了。为冒险、探索新市场付出的必要成本。但看未来，开源的整体繁荣一定最终是利好这些“中间商”。之前我们阐述过，他们其实不是亲自冒险的矿工，他们只是铲子的搬运工，以及基于这些模型（无论开源or闭源）建立更具商业价值的应用生态。卡并不只是用于训练，越来越大比例会挪到推理。假如训练的高效让模型更快进步，应用生态更加繁荣，他们怎么可能不继续投呢？

　　最后，继续引用下《the bitter lesson》：长远来看，算力才是真正的决胜因素。历史的经验一次又一次地告诫我们，AI研究者常常试图将人类的知识灌输到AI算法中，这种做法在短期内通常有效，并且带来个人成就感和虚荣心。但长远来看，它会造成瓶颈，甚至阻碍进一步发展。最终的突破性进展往往源于一种截然不同的思路，即通过搜索和学习来扩展算力规模。而那些最终的成功往往伴随着苦涩，难以被下咽，因为算力的成功，意味着对我们以人类为中心的固有思维和虚荣心，是一记响亮的耳光。

　　本文作者：信息平权，来源：信息平权，原文标题：《DeepSeek利空算力？》

责任编辑：凌辰

　　建议各界和监管部门关注两个关键问题：火狐体育入口

　　自2020年5月起，粉笔开始大范围推出线下培训。截至2022年6月30日，粉笔已建立广泛的当地营运中心线下网络，覆 ♈盖火狐体育入口国内31个省（区、市）的220多个城市 ♋。但目前来看，公司的 ♏付费用户仍然集中在线上。

　　本报记者成廉【编辑:廷玉】

亚洲国产日韩不卡综合,内射在线Chinese,日韩综合一卡二卡三卡死四卡 ,国产精品久久午夜夜伦鲁鲁

给大家科普一下火狐体育入口

房地产：15个重点城市二手房周度成交年初至今基本运行在近5年区间内

华泰柏瑞沪深300ETF进入3000亿时代易方达沪深300ETF两千亿

今日视点：建“好房子”应围绕“三新”来思考

黄金涨不停银行“跟涨”上调积存金起投门槛

电商平台掘金产业带数字链路破解“卷价格”难题

挖机：国内2024年9月挖机销量预测约7300台，同比增速17%

海伦特洛伊家电盘中异动急速下跌5.04%报56.88美元

重磅利好提振，标普红利ETF（562060）飙涨2.83%，吴清：支持上市公司运用分红回购回报投资者

43只个股5日量比超过5倍

长江有色：26日镍价小幅反弹成本支撑及下游刚需采购

美光股价盘后飙升人工智能设备需求提振业绩展望

大摩：告别防御性股票，拥抱优质大型股！