(北京24日讯)中国初创公司深度求索(DeepSeek)周五发布其新型人工智能模型V4的预览版。一年多前,这家公司曾凭借一款低成本的推理模型震惊世界,该模型的性能足以媲美美国竞争对手。
据法新社等媒体报导,深度求索在社交媒体上发表声明称,备受期待的DeepSeek-V4,有能力处理长达百万字的超长上下文,在智能体能力、世界知识和推理性能方面均处于国内和开源领域的领先地位。
该公司表示,V4目前已推出开源模型的“预览版”,但并未透露最终版本的发布时间。
V4支持100万个“词元”(包括单词或标点符号在内的文本小单元)的上下文长度,使其与谷歌的Gemini模型不相上下。
上下文长度决定了模型能够吸收多少输入信息以完成任务。
新推出的V4模型分为Pro与Flash两个版本:DeepSeek-V4-Pro和DeepSeek-V4-Flash,将取代2024年12月推出的V3模型。其中,DeepSeek-V4-Flash参数更少,因此“效率更高,经济性也更强”。
声明还称,在世界知识基准测试中,DeepSeek-V4-Pro显著领先其他开源模型,仅略逊于顶级闭源模型、谷歌的Gemini-Pro-3.1。
中国科技巨头华为周五表示,其基于昇腾950人工智能晶片的昇腾超级节点(Ascend supernode),将全面支持Deepseek的V4版本。