曾志涛：AI为听障者开启无声世界的有声之门

听障者，尤其是依赖手语进行沟通的群体，在教育、职场与生活中长期被排除在日常交流之外。传统的辅助技术如助听器、字幕系统、甚至人类翻译虽有助益，但往往存在实时性差、成本高、适用性窄等问题。如今，我们可以透过AI驱动的语音识别、手语翻译与语音合成技术，为听障者提供一个真正无障碍的沟通环境。

AI正通过三种方式重塑听障者的沟通路径。首先，是实时语音转文字（STT）技术的成熟。

Google Live Transcribe与Otter.ai等应用程序，可以通过自动语音识别（ASR）技术，将现场语音内容即时转换成文字。

试想，一位听障者在看病时，只需打开手机便可阅读医生的讲话内容；在职场会议中，不再需要靠旁人转述，便能实时追踪对话流程。这类技术不仅增强了沟通效率，也可以重建听障者的自信心与参与感。

其次，是AI手语识别与翻译系统的崛起。像SLAIT.AI与SignBridge AI等平台正通过诠释手语，转译为语音或文字，实现双向沟通。必须强调，手语不只是手部动作，还包含丰富的面部表情与肢体语言，而AI正在借助深度学习与计算机视觉，一步步突破这些复杂的理解瓶颈。

第三，是语音合成器辅助发声的普及。许多非语言能力者，或因中风、失语症而不能言语者，透过像Spoken AAC、Voiceitt等工具，可以将文字输入转化为自然，具情感的语音输出。有些平台甚至允许用户复制自己的声音，使AI说出的话更具个人特色与认同感。

这些技术看似理所当然，但对于听障者来说，却是至关重要的。过去，听障者往往被动等待适配环境，如字幕电视、懂手语的职员或翻译人员。AI技术赋予了他们自发沟通的能力，意味著听障者无需预约翻译，无需旁人转述也可以主动参与社交、会议、求职、谈判甚至日常闲聊。

此外，在教育环境中，Otter.ai等转录工具能够让听障学生同步接收课堂内容。 AI系统也可结合学生反应自动调整语速，强调重点，让学习更具包容性。在职场，听障员工也可利用STT系统精准记录会议内容，提升效率与自我管理能力。

在公共场所，AI可以与可穿戴设备结合，创造出更无缝体验。例如，XRAI Glass等智能眼镜，能将他人讲话内容实时显示在镜片上；触觉反馈设备则能将警报、提示转化为震动、温度等身体感知，让听障者不用再全神贯注依赖视觉输入。

当然，我们也不能否认，AI仍存在一定的技术与伦理挑战。例如，手语识别系统对不同地区的手语方言识别能力仍有待提升，在嘈杂环境下语音识别的准确性依然不稳定。此外，若AI开发缺乏听障社群的参与，也容易出现技术脱节现实的情况。因此，“听障者主导设计”（Deaf-led design）应成为新共识，引导开发者与听障者共创AI赋能配备。

笔者认为，未来的AI无障碍系统趋势，必将朝著多模态集成与人机协作方向发展。我们将看到更多如SLAIT.AI那样的系统，实时整合语音转文字与手语识别于一个平台中，成为口译员与听障者之间的润滑剂。在需要情境理解、文化敏感度的高风险场合中，人类将是把关者，而AI则将是辅助者。

展望未来，AI可以让听障者不再被边缘化，建设一个即便没有声音，也能被理解、被尊重、被回应的世界。善用AI，让每一位听障者，都能听见属于他们的未来。

曾志涛

自由撰稿人。

Advertisement

Advertisement

Advertisement

Advertisement

热门新闻

【新加坡大选】行动党蝉联执政　工人党政治版图扩大

烧烤摊违反行管令　老板顾客全被对付

哈萨克爆发不明肺炎　致死率远高于新冠病毒

CNN记者讲述北京防疫　女主播惊讶摇头

Advertisement

曾志涛：AI为听障者开启无声世界的有声之门

Advertisement

Advertisement

热门新闻

【新加坡大选】行动党蝉联执政 工人党政治版图扩大

烧烤摊违反行管令 老板顾客全被对付

哈萨克爆发不明肺炎 致死率远高于新冠病毒

CNN记者讲述北京防疫 女主播惊讶摇头

【新加坡大选】行动党蝉联执政　工人党政治版图扩大

烧烤摊违反行管令　老板顾客全被对付

哈萨克爆发不明肺炎　致死率远高于新冠病毒

CNN记者讲述北京防疫　女主播惊讶摇头