每经编辑 张锦河
近日,国产大模型DeepSeek引发广泛关注。
据人工智能社区Hugging Face1月28日信息显示,DeepSeek发布了开源多模态人工智能(AI)模型Janus-Pro。其中Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。
此外,昨晚至今日凌晨,DeepSeek 通过官方服务状态发布声明称:近期 DeepSeek 线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。
据DeepSeek介绍,Janus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以《61888001彩民之家》往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。
Janus-Pro是一款统一理解与生成的多模态大语言模型(MLLM),通过对多模态理解与生成的视觉编码进行解耦来实现功能。Janus-Pro构建于 DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基础之上。
在多模态理解方面,它使用SigLIP-L作为视觉编码器,支持384x384的图像输入。在图像生成方面,Janus-Pro使用了来源于此的分词器(tokenizer),其下采样率为16。
北京时间1月28日,美股三大指数收盘涨跌不一,道指涨0.65%,标普500指数跌1.46%,纳指重挫超600点,跌幅3.07%。
大型科技股涨跌不一,英伟达下跌16.86%,创历史上最大单日个股蒸发规模,市值蒸发5888.62亿美元(约合人民币4.27万亿元);谷歌下跌4.03%;特斯拉下跌2.32%;微软下跌2,14%;亚马逊上涨0.30%;Meta上涨1.91%;苹果上涨3.25%,截至收盘市值为3.5万亿美元,再度成为全球市值最高上市公司。
美股半导体芯片板块全线暴跌,博通跌超17%,台积电跌超13%,美国科技跌超11%,Arm Holdings跌超10%,AMD跌超6%,阿斯麦跌超5%。
消息面上,近期火遍全球的DeepSeek推出新模型,该模型以极低的成本实现了与OpenAI o1相当的性能,引发市场对科技AI巨头估值的担忧。简而言之,DeepSeek新模型性能与OpenAI o1旗鼓相当,但成本连后者的零头都不到。有分析人士认为,DeepSeek在有限的硬件资源下实现顶尖的模型性能,减少了对高端GPU的依赖,低廉的训练成本预示着AI大模型对算力投入的需求将大幅下降。正因为此,美股芯片股首当其冲。1月27日,DeepSeek在苹果App Store美国区免费应用下载榜上超越ChatGPT,排名第一,在中国区排行榜上同样登顶。
每日经济新闻综合自界面新闻、公开信息
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
尹优平指出,当前不仅要关注供给端金融服务的覆盖面和可得 性61888001彩民之家,更要关注需求端每个金融消费者的获得感、幸福感和安全感,也 ⚓就是关注每一个个体的金融健康。进入新发展阶段,我国经济发展的 ♏引擎需要更加突出消费驱动,更加重视居民在经济“双循环”中的功 ❍能发挥。促进金融健康有利于夯实经济活动的微观基础,并以此助力 ♌维护金融稳定、完善宏观调控、实现共同富裕 ♓。
乔治将于本月从堪萨斯城联储银行退休 ⛺。去年,她在制定利率 ♒的61888001彩民之家联邦公开市场委员会(FOMC)拥有投票权。这位美联储资深人 ♍士——她1982年开始在美联储工作——常常是美联储最鹰派的政 ➤策制定者之一。
本报记者 严澄 【编辑:陈谟 】