今年农历蛇年来临前夕,人工智能领域爆发了一个震撼全球的消息,中国杭州“深度求索DeepSeek公司”,宣布成功研发了一个全新系列的首个版本-V3模型。该模型相比前代DeepSeek-V2.5提升了3倍的演算速度,其效率接近美国当前表现最好的模型Anthropic公司。

但最关键点是,该模型的研发成本不足600万美元,比起美国同类型公司的数亿美元或更昂贵的研发成本低得离谱,显示其超前的科技市场竞争力。此外,DeepSeek模型不但提供免费使用,还采用开源系统,即其源代码是公开的,任何人均可查看、使用或修改它的系统。公开源代码意味著DeepSeek通过参考其他美国最先进的人工智能模型,譬如OpenAI和英伟达等系统,通过蒸馏法,即筛选、调整和创新等措施,将其简化以建成一个新系列模型版本。

OpenAI的创始人之一的Andrej Karpathy称赞DeepSeek能达到这个级别能力在于,它比当前业界部署的Llama 3 405B需消耗3080万GPU小时,而它的DeepSeek-V3却只用了280万GPU小时,可见能节省的资源和时间具有突破性的超越。

开源与传统盈利为主公司的闭源措施形成鲜明对比。公司出于保密自己的源代码,除了高管和少数人能接触到,其他竞争者是无法知晓的。既然公司不公开自己的源代码,也就代表著被抄袭的公司无法证明他人侵权,提出法律控诉。再说,花巨额投资以盈利为主的西方大企业,有了新产品,必须利用市场的热潮促销盈大利。被美国政府列为受禁运的国家,也可以通过第三国代理人秘密购买,美国政府是难从监管的。

事实上,全球各先进国的高科技尖端技术,从来均是彼此抄袭甚至偷窃或是挖角取得相关技术,或是从取自外来的基本技术进而创新达成。2009年微软就因为侵犯了加拿大i4i科技公司的专利,被美国一个德州法院勒令停止出售该公司的相关软件,并支付原告诉讼费等共约2.9亿美元。说到更远一些,我们还可追朔约两千年前的东西方古文明,为何它们从青铜器时代进入较高生产力的铁器时代,时期都非常接近?这就离不开新科技传播的人为力量,不管这是商业利益,军事霸权还是提升农业或手工业发展的目的,其动机可说是同属人类的自然机制。

的确,人工智能软件的开源办法不但促进了知识的共享和传播,使其应用普及化,而且它允许任何人都可对源代码修改并完善,这就加速创新速度,让更符合实际用途的人工智能系统出现。以此类推,未来的医疗、交通和教育设计等领域,通过人工智能的数据综合处理和分析诊断,能提高各种系统和建设领域的安全性和可靠性,给人类社会带来莫大裨益。

在当前美国企业想在人工智能赛道上阻止中国超越美国已越来越艰难。美国政府想通过禁止售卖最新版本的人工智能晶片给中国,如上文所说,中国还是有通过代理人从第三国私下购买的渠道,真版本也行,经过转头换面的版本也行。只要中国国内有优秀的高科技人才和背后有资金支持作人工智能的深度探索,国内外市场需求给予创新动力,赶超是极为可能的。

说到最后,人工智能发展不得不说说它的两面性。一方面,人工智能作为人类的应用工具,可利用它的庞大数据库快速和有效的解决诸多人类面对的各种问题。譬如一个戴著人脸识别墨镜的警察可以在飞机场或火车站识别通缉犯或犯罪嫌疑人,大大降低了警方所需付出的汗水和资源。另一方面,如果一国政府为了维稳和保护政权,靠采纳人脸识别和人工智能等技术以无数摄像头监控人民的一举一动,我想这样的社会也是让人难于接受的。

黄大志

新纪元大学学院客卿教授

热门新闻

阅读全文

【新加坡大选】行动党蝉联执政 工人党政治版图扩大

阅读全文

烧烤摊违反行管令 老板顾客全被对付

阅读全文
档案照

哈萨克爆发不明肺炎 致死率远高于新冠病毒

阅读全文

CNN记者讲述北京防疫 女主播惊讶摇头