(上海28日讯)中国AI新创公司DeepSeek,因为推出新模型DeepSeek-V3及DeepSick-R1近期受到大量讨论,甚至美国AI重镇矽谷产业圈也开始紧张DeepSeek的发展。
随著DeepSeek爆红,其团队前成员罗福莉也声势看涨,小米(Xiaomi )创始人雷军去年以千万人民币年薪招揽罗福莉,领导小米AI大模型团队。
发表8篇论文一战成名
根据《极目新闻》报导,被封为“AI天才少女”的罗福莉来自四川,是名95后,罗福莉就读北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。2019年还在北大读硕士期间,便于人工智能领域顶级国际会议ACL上发表8篇论文,一战成名。
根据报导,毕业之后,罗福莉进入阿里达摩院,在阿里达摩院期间,罗福莉负责AliceMind开源项目,主导开发了多语言预训练模型VECO。
对于被外界称为“AI天才少女”,罗福莉说,“爆红之后突然之间千奇百怪的机会都来了,有找我出书的、有找我录公开课的,甚至有经纪公司找来的。”
2022年跳槽DeepSeek
2022年,罗福莉加入“幻方量化”从事深度学习相关策略建模和演算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
另外,根据红星资本局报导,2024年底,DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布开源。1月20日,DeepSeek发布新模型DeepSeek-R1并同步开源模型权重,再次引发全球AI科技圈关注。
另外,由于其极低的训练成本,DeepSeek-V3被称为“AI界拼多多”。