(纽约24日讯)美媒《CNN》报导,中国新创公司DeepSeek 上个月震撼科技界,AI平台Hugging Face资深研究员邓斯托(Lewis Tunstall)说,在不久的将来,我们可能会看到一波像 DeepSeek 一样进行推理的新模型,矽谷普遍认为AI代理是聊天机器人下一个发展方向;艾伦AI研究所前首席执行员埃齐奥尼(Oren Etzioni)预测,未来 12 个月内, DeepSeek将被其他东西取代。
报导指出,DeepSeek横空出世后,科技巨头对 DeepSeek 的崛起迅速做出反应。Google DeepMind 首席执行员哈萨比斯(Demis Hassabis) 称,DeepSeek 的炒作夸大其词 ,他也坦言其模型“可能是我见过来自中国最好的作品”。
半导体研究机构SemiAnalysis对DeepSeek声称训练成本仅有560万美元表示怀疑。
OpenAI也对《金融时报》表示,它发现证据证明DeepSeek使用该公司模型来训练自己的竞争对手。
艾伦人工智能研究所前首席执行员埃齐奥尼(Oren Etzioni)则认为,这绝对不是炒作,不过,这也是一个瞬息万变的世界。他认为,DeepSeek正是大型语言模型(LLM)的TikTok。
推理新模型将涌现
为开发人员提供工具的AI平台Hugging Face资深研究员邓斯托(Lewis Tunstall)指出,DeepSeek以技术报告的形式提供解决方案,却没有提供额外缺失部份。
邓斯托认为,在不久的将来,我们可能会看到一波能够像DeepSeek一样进行推理的新模型,因为科技巨头正竞相打造AI代理,矽谷普遍认为AI代理是聊天机器人下一个发展方向,也是消费者与装置互动的方式,只是这种转变还没有完全发生。
目前,AI社群将继续改进 DeepSeek 提供的功能,直到下一个突破出现。
埃齐奥尼说,“我预测,未来12个月内它将被其他东西取代,但确实有其先进之处”。