当大家谈主权人工智能(AI)时,很多人想到的是外国大厂的模型,其实在马来西亚,已经有三套很有代表性的本土大型语言模型(LLM)在发芽成长:Mesolitica的MaLLaM、杨忠礼集团下YTL AI Labs的ILMU,以及Agmo的Merdeka LLM。它们的共同点,是都主打马来西亚本地数据、本地部署、本地团队;不同的是,各自选择了完全不一样的赛道,所以更多是互补,而不是互相内卷。
第一,是Mesolitica背后的MaLLaM。Mesolitica 是本地专做语言模型的创业公司,MaLLaM 从一开始就不是要变成一个通用英文模型,而是专门为马来西亚语言环境训练的大脑,训练数据里大部分都是马来西亚语境,达到接近九十亿 tokens的规模。
根据多家媒体和AWS的报导,MaLLaM 能理解本地的马来文、马来西亚式英文(Manglish)、混杂语言(Bahasa Rojak),以及多种州属方言和区域语言,总共支援十六种区域语言和本地口音,用意就是让AI真正听得懂本地人的讲法。
更有意思的是,Mesolitica不只是做纯文本模型,还和马来西亚广播与电视台(RTM)合作,把自家的TTS和Voice Cloning 带进广播场景,在RTM场合展示即时变声、合成主播声音等技术,并签署项目协议,探索在公共广播体系里用本地AI语音。
所以Mesolitica的独特之处,在于它从语言和声音两端同时发力,目标是把柔佛、吉打、东马等地的口音和用语全部训练进模型,让AI的语感尽量贴近茶室聊天的真实状态,而不是标准书面语而已。
第二,是YTL AI Labs打造的 ILMU。ILMU的名字来自Intelek Luhur Malaysia Untukmu(为马来西亚人打造的马来西亚智能),是一套由YTL AI Labs主导、在本地开发和营运的多模态大模型,可以处理文字、语音和图像,官方强调百分之百由马来西亚团队打造、训练在本地数据与语料上,并且完整在本地掌控。
ILMU 很快就落地在两个非常接地气的场景。其一是Ryt Bank,也就是YTL集团与Sea合作推出的全AI数码银行。多篇报导都写明,Ryt Bank核心的对话助理Ryt AI,是建立在ILMU之上,为用户提供自然语言的转帐、查帐和理财教育等服务。
其二是车内娱乐和车载助手,YTL AI Labs在发布会上展示了和 ACOTech 合作的in car AI assistant,用ILMU做车机语音交互,帮司机查路线、控制娱乐、说明车况等。
从定位来看,ILMU更像一套AI基础设施:一方面是本地大模型本身,另一方面是背后算力、网络和合作伙伴生态,包括电讯、媒体、银行、汽车等行业一起接入,用统一的本地大模型做底层。
第三,是Agmo集团推出的Merdeka LLM。根据官方网站和公告,Merdeka LLM被定义为 AI Sovereignty as a Service,也就是主权AI即服务,由本地团队开发、托管在马来西亚的数据中心、使用本地数据训练,重点是让政府和企业在本地掌控数据、托管和模型所有权。
和前两者不同的是,Merdeka LLM 一开始就不是要变成一个全能聊天机器人,而是要帮各个行业训练自己的专家型模型。官方介绍里点名的重点领域包括法律、人力资源(HR)、金融等,强调利用马来西亚法律、人力资源和不同行业的数据,微调出专用模型,例如Malaysia Legal LLM、Malays HR LLM,用来做合约审阅、合规检查、政策文件整理等等。
在教育方面,Agmo已经和教育出版社Sasbadi结成联营,公司公告和多家媒体都指出,双方将共同开发马来西亚第一套专注教育领域的大型语言模型,由Sasbadi提供本地课程内容和教育专业,Agmo提供模型设计、训练和部署,模型会围绕国家课程纲要,为学生和老师提供本地化、双语和个性化的学习支持。
在 Agmo的年报和相关报导中,也已经把 Merdeka LLM 描述为以本地教育内容、配合国家课程而开发的马来西亚教育型 LLM,是集团在ESG与教育平等方面的重要布局之一。
各有特色
从这个角度看,Merdeka LLM 的最大特色,不在于它会不会写华丽的作文,而在于它可以在高度敏感的领域,吃进那些不能随便丢到境外云端的大马本地数据,在本地合规环境里训练出真正懂本地法规、制度和教学要求的专用模型。这类数据一般情况下,像ChatGPT、DeepSeek之类的全球通用模型是接触不到的,这就是主权AI的核心价值。
把三者放在一起看,就能看出它们并不是在做一模一样的事情。Mesolitica 更像语言和语音的实验室,专注把马来西亚各州口音、Bahasa Rojak、本地俚语甚至多种区域语言都训练进模型,为所有需要深度理解本地语言的应用打底。
YTL的ILMU则像一间AI电力公司,一边经营和国家主权相关的本地模型和计算基础设施,一边把模型接入银行、车机、媒体等行业,让大众透过银行应用、车载系统等真正用到本地大模型。
Agmo的Merdeka LLM 则是一个专做垂直专家的工厂,透过和法律、人力资源、教育、金融等领域的专家合作,以主权为前提,把行业内部的专业知识和数据转化成一个个领域专用模型,教育领域和Sasbadi的合作就是一个鲜明例子。
主权AI最后不是变成三家互相竞争的一堵墙,而是慢慢长成一个分工明确的生态:有懂本地语言和方言的大脑,有提供全国级基础设施的底座,也有扎进特定行业、吃进敏感数据的专家模型。
在这一点上,MaLLaM、ILMU和Merdeka LLM代表的是三条互相补位的路线,而不是三条互相挤压的战线。