IWSLT (口语语言翻译国际会议) 是机器翻译领域最具影响力的国际会议之一,每年举办机器翻译相关赛事(Evaluation Campaign),近年来重点关注语音翻译等相关领域。7月9日-14日,IWSLT 2023在加拿大多伦多成功举办,本届盛会包含多个竞赛赛道,共吸引了全世界31支队伍参赛。
中国,华为翻译(HW-TSC)(以下简称:华为) 中国,西北工业大学音频语音与语言处理研究组&马上消费智能语音团队(NPU-MSXF)(以下简称:西工大&马上消费) 中国,小米AI实验室(XIAOMI)(以下简称:小米) 中国,中国科学技术大学&腾讯AI实验室(MINETRANS)(以下简称:中科大&腾讯) 日本,京都大学(KU)
西工大&马上消费实现了英文语音到中文语音的零样本说话人音色迁移,即在翻译结果的语音中保留原始语种说话人的音色,提供了更好的用户体验,是唯一实现此功能的队伍。 华为使用了扩散TTS(Text to Speech,文本-语音)模型。 中科大&腾讯使用对比式训练方法训练语音翻译模型。 只有中科大&腾讯使用端到端语音翻译系统参赛,其他团队均使用级联语音翻译系统。
参考链接:https://livejohnshopkins-my.sharepoint.com/personal/esalesk1_jh_edu/_layouts/15/onedrive.aspx?id=%2Fpersonal%2Fesalesk1%5Fjh%5Fedu%2FDocuments%2FIWSLT2023%2F05%20%2D%20Speech%2Dto%2DSpeech%2Epdf&parent=%2Fpersonal%2Fesalesk1%5Fjh%5Fedu%2FDocuments%2FIWSLT2023&ga=1
https://aclanthology.org/2023.iwslt-1.1.pdf