(北京28日讯)中国AI新创公司DeepSeek(深度求索)推出两款大模型,直接震撼矽谷科技巨头,其中创始人梁文峰的背景更被曝光。

据报导,梁文峰1985年出生于广东省湛江市,2002年以湛江吴川市第一中学“高考状元”成绩考入浙江大学电子信息工程专业,2010年获得信息与通信工程硕士学位。

在校期间,他对金融市场产生了浓厚的兴趣。在2008年全球金融危机之际,带领团队探索了机器学习技术在全自动量化交易中的应用潜力。

2013年,梁文峰与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2015年的市场波动中,幻方依靠先进的高频量化策略取得了令人瞩目的成绩。

2016年,幻方推出了首个基于深度学习的交易模型,并实现了所有量化策略的AI化转型。2018年,幻方正式确立了以AI为核心的发展战略。

2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。

2023年,梁文峰宣布将正式进军通用人工智能领域,并宣布将正式进军通用人工智能领域,并创办深度求索DeepSeek,专注于做真正人类级别的人工智能。

“来自东方的神秘力量”

2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2。同年12月,DeepSeek-V3问世,这款性能优越且性价比极高的大语言模型,被矽谷同行誉为“来自东方的神秘力量”。

DeepSeek之所以被科技圈关注,在于DeepSeek-V3的出现极大地降低了大模型训练和应用的成本,DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方成本差距至少10倍。

在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o,行业震惊于这一性价比,DeepSeek-V3开源给全世界的技术开发团队。

在团队配置上,DeepSeek团队只有139名研发人员,对比ChatGPT的OpenAI团队则有1200名研究人员,团队规模是DeepSeek的近乎9倍之多。

另外,近期热门话题“雷军千万年薪挖95后天才AI少女”,这位AI少女就是DeepSeek团队的研发人员,但小米和当事人并未就此回应。

 

成光军

热门新闻

阅读全文

【新加坡大选】行动党蝉联执政 工人党政治版图扩大

阅读全文

烧烤摊违反行管令 老板顾客全被对付

阅读全文
档案照

哈萨克爆发不明肺炎 致死率远高于新冠病毒

阅读全文

CNN记者讲述北京防疫 女主播惊讶摇头