DeepSeek憾动了美国AI科技。(图取自法新社)

(杭州28日讯)近期爆红的中国人工智能(AI)新创公司深度求索(DeepSeek),除夕当天凌晨在GitHub平台发布了Janus-Pro多模态大模型,进军文字生成图像(文生图)领域。根据其发布的测试结果,该模型在基准测试中超越美国巨头OpenAI。

综合报导,这款开源多模态模型被设计为高效且多功能的模型,擅长生成逼真图像、执行复杂视觉推理等多种视觉任务。

深度求索称,Janus-Pro在使用文本提示生成图像的基准测试中,表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。

深度求索表示,该款大模型是2024年11月13日发布的JanusFlow大模型的进阶版本。相比前一代模型,Janus-Pro优化了训练策略、扩展了训练数据,模型也更大。

通过这些改进,Janus-Pro在多模态理解和文字到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文字到图像生成的稳定性。

Janus系列多模态模型的生成结果。(图取自DeepSeek官网)
Janus系列多模态模型的生成结果。(图取自DeepSeek官网)

根据深度求索发布的测试结果,Janus-Pro在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。

深度求索的展示图显示,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,高于包括OpenAI DALL-E 3在内的其他对比模型,Janus的准确率分别为61%和79.7%。

随著 Janus-Pro-7B 的推出,科技业界对于其可能带来的影响高度关注。许多市场观察人士认为,DeepSeek的突破性技术可能促使竞争对手加速研发,进一步推动人工智能领域的创新发展。然而,这也引发了市场的不安情绪。

深度求索1月20日发布开源大语言模型DeepSeek-R1,凭借低训练成本,却能比拟OpenAI的o1模型的高效能引发全球科技圈关注,更促使投资者抛售全球科技股。
 

甯义声

热门新闻

阅读全文

【新加坡大选】行动党蝉联执政 工人党政治版图扩大

阅读全文

烧烤摊违反行管令 老板顾客全被对付

阅读全文
档案照

哈萨克爆发不明肺炎 致死率远高于新冠病毒

阅读全文

CNN记者讲述北京防疫 女主播惊讶摇头