搜狗公司CEO王小川
机器同传
快于同声传译
钱江晚报记者 詹丽华
本报乌镇11月17日电 (钱江晚报记者 詹丽华) 跟差点被网友们“玩坏”的网红丁磊、周鸿祎、雷军相比,搜狗公司CEO王小川的画风有些不同。基本上,他不玩直播,很少为产品站台。在11月17日举行的第三届世界互联网大会“移动互联网论坛”现场,王小川展示了全场最精彩的“黑科技”——机器同传,首秀了实时机器语音识别并同步中英文翻译、显示,让全场一片惊呼,连杰瑞·卡普兰等人工智能领域的大咖都纷纷摘下同传耳机,感受这不同寻常的“同传”。
在王小川现场演讲时,他身后的屏幕上一直实时滚动出现中英文双语的文字显示,而且,随着他的话语逐渐完整,屏幕上显示的内容也自动修改。
讲了几句话之后,现场一个很明显的变化是,原本带着同传设备的外国专家们纷纷摘下了耳机,因为他们看屏幕上的英文字幕就能明白王小川在讲什么,翻译的速度比现场同声传译还要快一些。
“你看屏幕上的内容在变,是因为机器会随着我讲的内容逐渐完善,根据语义自动修改调整之前识别的内容,做更准确的传译。”王小川说,从现场演示效果来看,搜狗语音识别准确率已超过95%,机器翻译准确率在90%左右。“我们近期做人工评测时,搜狗机器翻译在演讲、旅游、闲聊、日常口语等领域,采用五分制人工评分能达到4.4分。”
4.4分听起来似乎不是那么完美,但搜狗的这次演示已经是目前公开进行的机器同声传译中第一个成功的了。此前,也有公司做过尝试,但都没有经受住现场语音识别同传的考验。
“我还有一个小玩意儿,但目前还不准备发布。”说得兴起,王小川拿起手机给记者看他独一份的DEMO程序,“这也是搜狗自主研发的,端到端神经机器翻译技术,比如你输入中文,一按发送,对方收到的内容其实是英文。或者你用中文说一句话,对方听到的却是英文。用循环神经网络生成翻译结果,比传统机器翻译更加流畅,也更准确。”
王小川说,做语音识别同声中英文传译,他们的团队大概花了两三个月时间。“那是因为在此之前我们已经积累了大量的数据资源。”搜狗从2011年开始研究语音识别技术,至今已有5年,目前的语音识别速度差不多能达到400字每分钟。