来源:财联社
就在华尔街周一紧张评估“DeepSeek风暴”之际,这家中国公司再度甩出新品:在图像生成基准测试中超越OpenAI“文生图”模型DALL-E 3的多模态大模型Janus-Pro,同样也是开源的。
除夕凌晨钟声敲响前不久,DeepSeek工程师们在“抱抱脸”平台上传了Janus Pro 7B和1.5B模型。这俩模型是对去年10月发布的Janus模型的升级。
(Janus与Janus Pro 7B生成图像的对比,来源:技术报告)
15亿和70亿的参数量,意味着这两个模型具备在消费级电脑上本地运行的潜力。与R1一样,Janus Pro采用MIT许可证,在商用方面没有限制。
据DeepSeek介绍,Janus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。
从报告给出的“跑分”数据来看,在部分文生图基准测试中,Janus-Pro 70亿参《一号彩票网站》数模型表现好于OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。
虽然DALL-E 3是OpenAI在2023年发布的一款“老模型”,同时Janus Pro目前只能分析和生成规格较小的图像(384 x 384)。DeepSeek在如此紧凑的模型尺寸中依然展现了令人印象深刻的性能。
技术报告显示,在视觉生成方面,Janus-Pro通过添加7200万张高质量合成图像,使得在统一预训练阶段真实数据与合成数据的比例达到1:1,实现“更具视觉吸引力和稳定性的图像输出”。在多模态理解的训练数据方面,新模型参考了DeepSeek VL2并增加了大约9000万个样本。
作为一个多模态模型,Janus-Pro不仅可以“文生图”,同样也能对图片进行描述,识别地标景点(例如杭州的西湖),识别图像中的文字,并能对图片中的知识(例如下图中的“猫和老鼠”蛋糕)进行介绍。
公司也在报告中,给出了更多图像生成的案例。
(来源:技术报告)
(财联社 史正丞)
责任编辑:李桐
1、生物技术将会使疾病检测的技术产生巨大了变化,我们在SARS期间,我们认识SARS病毒花了一个月的时间 ⛄。现在我们 ♎从发现新冠是一个新的病毒,从拿到病毒到发现病毒,大概12个小 ➤时就能知道 ♍,这是检测的技术。特别是过去癌症只有形成了肿瘤,我 ⛵们才能够发现体内已经得了癌症,但是现在我们可以通过一些癌症因 ➢子,在癌组织没有形成之前就已经预测到他可能要得癌症 ⛵,进行定期 ♐的观察,早切除、早治疗,很多癌症病人五年的生存率现在在发达国 ✅家一号彩票网站已经达到了65%,在我们国家也达到45%左右。因此,诊断的 ♊技术产生了巨大的变化 ⏬。还有一个更大的变化是我们能够对一些遗传 ♉的疾病,通过检测人类的基因,就能发现你可能会有什么样的遗传病 ☾,这是第一个医学方面的重大作用 ❥,疾病的检测技术出现了大幅度提 ⏩高。
据卫健委相关负责人介绍,针对市民近期反映较突出的医院发 ⚾热门诊就医难问题,迅速部署全市发热门诊和诊室扩面增容,要求二 ⏱级以上医院和有条件的基层医疗机构均要开设发热门诊或诊室,增派 ♍人员力量。目前,全市医院发热门诊从94家增长至303家,全市 ♐全部二级以上医院均开设发热门诊或诊室,其中24小时开诊的235家,可接诊发热儿童的100家 ❢。全市349家正式运行的社区卫 ♊生服务中心全部设立发热诊区,为有发热等11类症状的患者提供诊 ⛺疗一号彩票网站服务(名单已由各区发布)。“为方便市民查询,卫健委委已通过 ☾官方网站、健康北京微信公众号等政务新媒体向社会公布了二级以上 ♓医院发热门诊(诊室)地址、电话及接诊发热儿童的相关信息。”该 ♎负责人表示 ♐,为避免集中至个别大医院就医导致排队拥挤 ♿,建议市民 ❢朋友就近就便优先选择社区卫生服务中心就医 ❍。
本报记者 中山美穗 【编辑:孙殿起 】