datasheet

QbitAI量子位

文章数:543 被阅读:5202382

账号入驻

中国AI军团称霸全球口语翻译大赛!搜狗夺冠,讯飞阿里二三

2018-11-01
    阅读数:
雷刚 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

中国AI,再次称雄全球机器翻译大赛。

在刚刚落幕的IWSLT(International Workshop on Spoken Language Translation)国际顶级口语机器翻译评测大赛上,中国公司搜狗,一举夺魁。

同场竞技的,还有科大讯飞、阿里巴巴、 APPTEK(美国应用科技公司)、AFRL(美国空军研究实验室)以及KIT(德国卡尔斯鲁厄理工学院)等众多国内外高手。

 IWSLT官方公布结果

这也是搜狗WMT2017机器翻译顶级评测大赛夺冠后,拿下的又一项机器翻译领域的技术冠军。

而且值得注意的是,这一次还是主流口语翻译领域的冠军,搜狗技术进展之快。

口语机器翻译“华山论剑”

IWSLT,全称:International Workshop on Spoken Language Translation,是全球最具影响力的口语机器翻译评测比赛。

从2004年开始已经举办了15届。每届比赛都吸引了世界各地机器翻译领域的知名企业和研究机构参与,也是口语机器翻译领域的“华山论剑”。

本届比赛比拼中,吸引了爱尔兰ADAPT中心、美国约翰霍普金斯大学、德国卡尔斯鲁厄理工学院、芬兰赫尔辛基大学、英国爱丁堡大学,美国AppTek公司等国际豪强,还有阿里巴巴、科大讯飞等中国大厂。

具体到本届,IWSLT 2018的口语机器翻译任务主要评测,基于指定数据集从英语到德语的语音翻译能力。

所以对于中英翻译场景为主的中国公司,更考验技术实力。

2大赛道比拼

本次比拼共分2大赛道:

一是Baseline Model(基线模型赛道),主要评测语音翻译的流水线方案,输入语音先通过语音识别系统得到语音识别结果,之后将结果送入机器翻译系统获得译文。

这也是业内最主流、效果最好的语音翻译解决方案,市场上商用机器同传、翻译机等语音翻译类产品几乎都采用了类似的方法。

另一赛道是End-to-End(端到端赛道),为本届尝试而新增设赛道,主要鼓励参赛方探索基于神经网络的端到端语音翻译解决方案,希望能够输入语音,基于深度神经网络模型直接输出译文。

这种方法目前仍处于早期研究阶段,受制于语音-文本平行语料难以大规模采集、算法研究不成熟等因素的限制,距离商用仍存在较大距离。

不过,两大赛道虽有主次轻重之分,但评测考核结果一样。

都是看BLEU——机器翻译质量评价指标,值越大代表翻译质量越好。

而本次评测中,在训练集、测试集相同的情况下:

Baseline Model赛道最好的系统取得了28.09的BLEU;

而End-to-End赛道最好的系统仅取得了19.4的BLEU。

较Baseline Model赛道相差8.69个BLEU,差距较为明显。

也证明了Baseline Model赛道评测的算法仍是目前最可行和实用的解决方案。

搜狗夺冠

而本次搜狗夺冠的,正是Baseline Model赛道的评测。

评测任务面向TED演讲和大会学术报告场景,测试集包括来自英国、欧洲、印度等各个国家的英语演讲者,存在噪声、口音、自由表达等复杂语音现象。

同时语言中存在大量领域专有名词和口语化的表达(如:大量语气词、错误语法表达等),具有极强的实战意义和挑战性。

最终,中国军团成为大赛最大赢家。

搜狗第一,讯飞第二,阿里巴巴第三。

其中,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU,领先第三名的阿里巴巴5.73个BLEU。

也算是对搜狗口语机器翻译实力的展示和奖励吧~

押注AI翻译的搜狗

搜狗的AI翻译,现已众所周知。

在搜狗的AI战略之中,语言是最核心的重头戏。

并以“自然交互+知识计算”为AI核心方向,并持续深耕技术,推动技术向产品的快速转化。

2016年,搜狗发布了自有人机交互解决方案——知音引擎。

而且因为拥有充足真实语料数据优势,搜狗将语音识别与机器翻译技术相结合,进而在2016年世界互联网大会上推出了全球首款商用AI同传系统-搜狗同传,带动了语音翻译技术的普及与应用。

其后通过数百场的国际会议“实战”,搜狗同传成为当下炙手可热的“AI字幕君”。

与此同时,搜狗也开始在AI智能硬件上施展拳脚,推出了一系列的智能硬件,将语音翻译技术应用到了更广阔的场景之中,让更多消费者用户可以直观使用,并解决跨国交流的问题。

2018年3月,搜狗推出了搜狗旅行翻译宝,具备离线翻译功能与拍照翻译功能,让马化腾都为之心动,在朋友圈里大打广告。

其时,作为首款智能翻译硬件,搜狗旅行翻译宝支持42种语言对话翻译,解决了旅游场景中用户听不懂、看不懂、不会说等真实痛点。

该项产品在京东平台首发当日即告售罄,首日销售额破千万。

一发击中后,搜狗还推出了录音翻译笔,提供录音转写、对话翻译、同声传译等功能,把AI同传落地到了消费级产品之中,打通语音翻译的新航道。

现在,IWSLT比赛夺魁,不仅是搜狗AI硬实力的展示,也是中国AI实力在国际竞技场中的输出。

希望搜狗依然能快速将最新技术商业化、场景化落地,让更多用户享受到AI福利。

传送门:

IWSTL 2018比赛结果

https://workshop2018.iwslt.org/downloads/Proceedings_IWSLT_2018.pdf

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

活动策划招聘

量子位正在招聘活动策划,将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入,并希望你能有一些活动策划或运营的相关经验。相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态



最新有关QbitAI的文章

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved