浙江日报 数字报纸


00008版:亲历

记者与高校团队、民间人士为乡音存档

教AI学温州话

  ■ 本报记者 张源 项锐

  “天不怕,地不怕,就怕温州人说温州话。” 这句民间俗语,道尽了温州方言的独特与难懂。作为吴语区存古度高、语音复杂的代表方言,温州话素有“古汉语活化石”之称。如今随着普通话普及,温州不少年轻人都不太会说温州话,守护乡音迫在眉睫。

  今年春天,“温州方言系统化采集工程”启动。该工程由浙大城市学院承办,浙江大学文学院学术指导,阿里巴巴AI数据团队、国家语言文字推广基地(温州大学)联合支持,他们集结了1.5万名温州市民参与录制,累计采集有效语料超6400小时。团队不只为方言建“声音博物馆”,更要让AI听懂、说准地道温州话。

  近日,我们走进浙大城市学院和温州城乡巷弄,跟着高校技术团队与民间爱好者一起教AI学温州话。

  “和人学外语一样,不能只背单词”

  上午9时,浙大城市学院杭州语言服务协同创新研究中心里,温州话此起彼伏,这里是“温州方言系统化采集工程”的核心审核现场。推开门,项目首席专家、浙大城市学院外国语学院教授姜淑珍正紧盯电脑屏幕,点开一段段音频,耳朵敏锐地捕捉着每一个音节。

  我们刚要打招呼,她的手机先响了。电话那头是一位温州阿伯:“我讲了一辈子正宗温州话,能不能也给AI留一份?”

  姜淑珍用温州话感谢他,并耐心解释,目前采集入口已关闭,后续若有需求会主动联系他。挂断电话,她转头笑着对我们说:“这几天每天都有十几通这样的电话,七八十岁的老人、在外工作的温州人甚至新温州人都想加入。”

  她调出系统后台的问卷给我们看:温州家庭里,晚辈与长辈方言交流比例超六成,长辈对晚辈全程讲温州话的仅剩13%。她坦言,00后大多能听不能说、地道发音率偏低,不少俚语、古音连中年人都未必全掌握,“再不做抢救性采集,以后想听正宗温州话,只能找档案了”,这正是启动大规模采集的深层原因。

  过往方言保护,多由少数资深发音人在录音室录制固定词表与语句,成品封存档案馆,普通人接触不到,也无法活态传承。因语料形态单一、脱离真实场景,无法适配AI训练对鲜活语料的核心需求。本次采集彻底打破这一模式,核心收录带有人情味的“活语言”。题库中不只有固定文本,也有自由话题,其中不乏日常交流、就医购物等真实生活场景。既有专业人士参加,也向温州民众全面开放,并兼容周边区县。

  “AI学方言,和人学外语一样,不能只背单词。”姜淑珍打了个比方,“你得让它‘浸’在真实语境里,听不同年龄的人在不同的场景下怎么说话。只有放进生活,AI才能学到最鲜活的表达。”

  我们当场掏出手机试了试采集测试端:填写基本信息后,进入5句试音。屏幕上,每句都配齐方言汉字、普通话翻译,生僻字还有读音提示,瞥一眼音标就能想起。只要逐字朗读,口音大体地道即可通过,随后进入正式录制。全程手机操作,几分钟到几小时皆可。

  “原定采集2000小时语料,短短十几天我们就收得6400小时优质语料,大大超出预期。” 姜淑珍介绍,为兼顾语料标准与方言多样性,采集内容覆盖鹿城、瓯海、龙湾、永嘉、瑞安等核心片区口音。

  音文对齐率不低于95%,否则AI就会学偏

  采集工作圆满收官,真正的考验才刚开始。如何将上万人录制的口语素材,转化为AI可学的“标准教材”?带着这个疑问,午饭后,我们在姜淑珍的指导下,当起了临时“方言审核员”,亲历了三道严苛的审核关卡。

  第一道关,是人工初筛。作为语料入库的首道质控关口,审核员必须逐条细听、逐字核对。我们点开音频文件,仔细核对,耳边不时传来团队成员细致地判定:“这句说得很地道,通过”“末尾掺了普通话,不通过”。

  有两段听感相近的音频,判定结果却截然不同。为什么?“仔细听。”姜淑珍笑着回放音频并解释,“温州话里‘看’和‘吃’都读ci,但声调完全不同。‘吃’为先降后升的曲折调,而‘看’为降调。”她反复播放三遍逐字对比,我们才终于听出了其中的关键差异。

  温州话保留了中古汉语声调体系,有复杂的连读变调和轻重音规则,本地人凭语感能轻松分辨,但对AI而言却是难题。“同一个词语,只要轻重读法不同,意思就天差地别。”她说。

  初筛后,第二道关便是异常值算法智能校验。系统通过音长、波形、频率等特征类比,自动识别与基准样本偏差大的异常音频,规避人工主观偏差,提升入库精度。

  “这段鹿城林阿姨录制的文本是‘我冇听灵清’(我没听清楚),她顺口在最前面加了一个虚词‘匄’(ha)字,所以算法自动把这句标为不通过。”姜淑珍指着屏幕讲解。

  “日常这么说没问题啊?”我们问,她点头道,平时这样表达确实自然又地道。但方言AI训练的核心指标是音文对齐率不低于95%。若有偏差,AI会习得错误对应关系,导致模型识别、合成出现系统性偏差。

  我们审核了20多条音频,发现不合格的样本五花八门。有人漏读了虚词,有人掺杂了普通话,还有人脱离文本按日常口语习惯自行发挥……但凡音文没有严格对齐的样本,一律不入库。

  最后一道关,是双轨制复核,为前两关校准兜底。由技术合作方独立质检组抽检核验音义对齐精度,项目专家团队同步专业校准。截至目前,音频验收全部通过,字准率约98%。经过三关严苛的筛选,最终入库的语料既符合AI训练的标准化要求,又保留年龄、性别、语速、地域等自然语音差异。这种“斤斤计较”,为的是让AI学到的温州话,能和街头巷尾的真实乡音对上号。

  AI方言一旦落地,就能派上大用场

  实验室里的6400小时数据,最终会应用到哪里?200多公里外的温州方言学习班,正好解答了这个问题。

  晚上7时,温州瓯海区新桥街道党群服务中心的活动室里,十多位学员正齐声练基础发音。这里是温州话爱好者叶一戈的方言学习班,已经开办了2年,场场爆满。我们找到位置坐下,跟着大家一起学讲温州话。

  课堂上,叶一戈带着大家反复练习最基础也最难的发音。温州话没有翘舌音,也不分前后鼻音,完整保留着普通话早已消失的清浊音。我们跟着念“医”和“夜”,前者发音喉咙要收紧,后者声带有震动感。细微差别却对应完全不同的意思,跟读十来次我们才勉强摸到门道,周围学员也个个眉头紧锁。

  后排一位穿白T恤的男学员听得格外专注,笔记本上记得十分详细。他是温医大附二院关节骨病外科主治医师李振兴,河北人,虽然来温州七八年,但对温州话依然没有那么精通。“门诊七成以上老人只会说温州话。”他无奈地说,像膝盖、腰椎、关节等诊疗关键词,温州话说法和普通话差十万八千里,猜都没法猜。

  “腿弯这里酸”“腰骨落不起”……老人用方言描述,他常常只能靠手势猜部位和病情。“疼痛位置、受伤机制、发病时间,哪一句听岔了,都可能影响诊断。”为此他下定决心来学习温州话,想把关键表述啃下来。

  “如果AI真能学会温州话,诊室里老人说方言,医生实时看文字转写,普通话方言互译,能解决我现在遇到的大难题。”他感叹道。

  教室里的其他人同样需求明确。温州大学东北籍周老师要和华侨深度交流,不懂方言常卡壳;基层干部希望靠方言拉近与群众的距离;温州女婿、媳妇想融入家庭;还有本地年轻人因家里无人教,特意来补课。这些真实场景,无一不在印证,AI方言一旦落地,就能派上大用场。

  “AI要学的不只是发音,更是语言背后真实鲜活的表达与文化逻辑。”叶一戈上课时举过一个极具温州特色的细节:温州人不说 “鸭舌”,而称“鸭近”。因为“舌”与表亏本的“折”同音,而“近”等同于“赚”,寓意财源广进。一句方言,就是一套独有的生活逻辑与地域文化密码。

  方言数字化与AI应用探索还将持续进行。目前,杭州、温州试点已经完成采集,宁波正同步启动,西安、长沙等全国各地的试点也在稳步推进。

  AI学方言,终归在于“用”。要让老人能用方言叫外卖、挂号、打车,让新来的人不用再靠猜和比划。只有当技术落到这些实处,乡音才能真正“活”下去。


浙江日报 亲历 00008 教AI学温州话 2026-04-28 浙江日报2026-04-2800004 2 2026年04月28日 星期二