(北京24日讯)中国初创公司深度求索(DeepSeek)周五发布其新型人工智能模型V4的预览版。一年多前,这家公司曾凭借一款低成本的推理模型震惊世界,该模型的性能足以媲美美国竞争对手。

据法新社等媒体报导,深度求索在社交媒体上发表声明称,备受期待的DeepSeek-V4,有能力处理长达百万字的超长上下文,在智能体能力、世界知识和推理性能方面均处于国内和开源领域的领先地位。

该公司表示,V4目前已推出开源模型的“预览版”,但并未透露最终版本的发布时间。

V4支持100万个“词元”(包括单词或标点符号在内的文本小单元)的上下文长度,使其与谷歌的Gemini模型不相上下。

上下文长度决定了模型能够吸收多少输入信息以完成任务。

新推出的V4模型分为Pro与Flash两个版本:DeepSeek-V4-Pro和DeepSeek-V4-Flash,将取代2024年12月推出的V3模型。其中,DeepSeek-V4-Flash参数更少,因此“效率更高,经济性也更强”。

声明还称,在世界知识基准测试中,DeepSeek-V4-Pro显著领先其他开源模型,仅略逊于顶级闭源模型、谷歌的Gemini-Pro-3.1。

中国科技巨头华为周五表示,其基于昇腾950人工智能晶片的昇腾超级节点(Ascend supernode),将全面支持Deepseek的V4版本。

甯义声

热门新闻

阅读全文

【新加坡大选】行动党蝉联执政 工人党政治版图扩大

阅读全文

烧烤摊违反行管令 老板顾客全被对付

阅读全文
档案照

哈萨克爆发不明肺炎 致死率远高于新冠病毒

阅读全文

CNN记者讲述北京防疫 女主播惊讶摇头