作为一家成立仅一年多的人工智能(AI)初创公司,DeepSeek凭借突破性的AI模型在硅谷收获了惊叹和错愕:该模型的性能不亚于全球最强的那些聊天机器人,而成本看起来只有它们的一个零头。
DeepSeek的异军突起,或对AI向前发展将需要越来越多电力和能源的普遍看法构成挑战。
随着DeepSeek创新引发的热度越来越高,投资者开始消化它对其美国竞争对手及它们的硬件供应商的影响,全球科技股在1月末大跌。
DeepSeek究竟是什么?
DeepSeek是一家于2023年成立的中国初创企业,创始人是AI驱动量化对冲基金幻方量化的掌门人梁文锋。该公司开发开源AI模型,这意味着广大的开发者社区可以检查和改进软件。其移动应用程序(app)于1月初发布,然后迅速登顶美国iPhone下载榜。
该app与OpenAI旗下ChatGPT等其他聊天机器人的区别是,它会在对提示做出回应之前阐明其推理过程。该公司声称,其R1版本的性能与OpenAI的最新版本相当,并且允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
DeepSeek R1与OpenAI或Meta AI比起来怎么样?
尽管该公司没有详细说明培训和开发DeepSeek模型的成本,但其似乎只是OpenAI或Meta最佳产品的一个零头。该模型的效率高出了这么多《best365官网登录入口》,使得人们怀疑斥巨资购买英伟达等公司最新、最强大AI加速器的必要性。
DeepSeek R1在几个主要基准测评中的表现接近或优于竞争对手模型,例如数学领域的2024年美国数学邀请赛、常识领域的大规模多任务语言理解(MMLU)和问答领域的AlpacaEval 2.0。在加州大学伯克利分校相关的排行榜Chatbot Arena上,该模型也名列前茅。
DeepSeek何时引发的全球关注?
自2023年发布最早一版模型以来,这家AI开发商就受到了密切关注。然后在11月,它向世界展示了一下旨在模仿人类思维模式的DeepSeek R1推理模型。该模式支撑起了其移动聊天机器人app,今年1月,作为一种比OpenAI便宜得多的替代品,其app及网页版在全球声名鹊起,投资人Marc Andreessen称其为“AI的人造卫星时刻”。
市场跟踪机构App Figures的数据显示,截至1月25日,DeepSeek移动app在澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone应用商店下载量达到160万次,排名第一。
DeepSeek的创始人是谁?
梁文锋1985年出生于广东,拥有浙江大学信息与电子工程系学士和硕士学位。天眼查数据显示,他创立DeepSeek的注册资本只有1000万元人民币。
梁文锋曾表示,主要员工大多是中国顶尖高校的应届毕业生,并强调英伟达的领先是整个西方技术社区和产业共同努力的结果,中国AI的发展需要类似的生态。
“更多的投入并不一定产生更多的创新,否则大厂可以把所有的创新包揽了,”他说。
DeepSeek在中国AI版图中处于什么位置?
由于DeepSeek的模型更便宜,它已经在帮助降低中国开发AI成本方面发挥了作用;大公司打起了价格战,在过去一年半时间里已经多轮降价。
对全球AI市场影响几何?
全球市场掀起风浪,阿斯麦、英伟达等之前受益于AI服务需求欣欣向荣的股票大跌。科大讯飞等与DeepSeek相关的中国股票上涨。
世界各地的开发人员已然在测试DeepSeek的软件,并考虑用它来构建工具。这可能会加速先进AI推理模型的采用 —— 同时也可能引发对是否需要限制使用的更多担忧。DeepSeek的进步可能会加紧旨在控制AI开发的监管。
DeepSeek有什么缺点?
DeepSeek的云基础设施可能会经受流量激增的考验。该公司曾在1月27日短暂大宕机,而随着新老用户向其聊天机器人发去更多问题,其将得管理甚至更大的流量。
责任编辑:刘明亮