• >科技>>正文

    百度宣布AI同传最新突破!能预测,低延时,演示效果惊人,外媒称媲美人类翻译

    原标题:百度宣布AI同传最新突破!能预测,低延时,演示效果惊人,外媒称媲美人类翻译

    夏乙 栗子 乾明 一璞 发自 三区五地

    同传AI,刚刚在国内?#30772;?#36807;暴风骤雨。

    但现在,百度于硅谷宣布了最新重大突破——一个名为STACL的同传AI,论文结果优异,Demo效果惊人。

    MIT科技评论、IEEE Spectrum等一众外媒,还纷纷给出好评,这是2016年百度Deep Speech 2发布以来,又一项让技术外媒们如此激动的新进展。

    百度自?#21495;?#38706;:与现在大多数AI“实时”翻译?#20302;?#19981;同,STACL的特点是能预测延时可控,能够在演讲者?#19981;?#21518;几秒钟开始翻译,并在句子结束后几秒钟内完成。

    STACL不走“整句?#20302;?#20877;翻译”的路线,甚至还会预测发言者未来几秒的内容,于是延时更短,更接近人类同传。

    究竟能达到什么程度?IEEE Spectrum采访后给出类比:跟联合国会议里的人类同传相媲美。

    实际效果果真如此?那突破显然重大。

    Demo展示:翻译AI会预测

    看上去几乎同时了

    Demo可以看出,百度STACL的翻译工作延时非常短,与原句只差几个字。

    虽说这个AI目前只是同步翻译成文字,还没有合成译文的语音,但这不是重点。关键是,不知道你有没有注意到,这种“只差几个字”有多难得。

    还没等“美国总统布什在莫斯科与俄罗斯总?#31216;?#20140;在莫斯科会晤。”这句汉语说到莫斯科,自动翻译的英语已经出现了“meet?#20445;?#20063;就是汉语句末的“会晤”。

    这个“meet?#20445;?#26159;AI从前半句话里脑补出来?#27169;?#20381;据的是美国总统最可能与其他人发生怎样的活动。

    因此,百度这个同传AI,不用等一句话?#20302;?/strong>,就能开始翻译了。

    对于翻译AI来说,预测是一项很罕见的技能。不同语言的语序总有差异,所以,那些没有预测能力的翻译AI,通常需要等到人类讲完一句话,再开始翻译。

    再举一个栗子 (下图) ,从“百度在18年前”这半句里,AI预测出了百度创立的内容“started a business”。

    那么,科学地讲,百度AI的预测效果到?#33258;?#20040;样?

    衡量翻译质量,要看BLEU分。

    中译英延后5个字的情况下,比起传统的整句翻译AI,百度的BLEU分要低了3.4分。

    毕竟是预测,发生错误是自然的。而这个差距在百度看来是可?#36234;?#21463;的。

    比如,百度AI可能从前半句话里预测出会面顺利进行,而事实可能是会面并不顺利。翻译就容易出?#36136;?#35823;。

    面对这样的情况,AI目前并没有?#26469;?#30340;能力。

    不过,用小小的延时,就可以换取更高的准确度:如从延3个?#23454;?#24310;5个词。?#27809;?#21487;以根据需求随意调整。

    中英语序相似

    而当两种语言语序相差不多的时候,例如描述戴安娜王妃车祸事件的新闻,STACL和传统整句翻译的成绩相比,就没有明显差异了。

    这种预测能力,是哪来?#27169;?/p>

    答案是一个名叫wait-k的模型,它把预测和翻译无缝整合到了一起,百度把它和两个翻译模型结合起来做了实验,一个是比?#26174;?#26399;的RNN翻译模型,另一个是Google在2017年推出?#21019;?#28909;的Transformer。

    不过,wait-k不仅仅适用于这两个模型,而是可以用在任何序列?#25104;洌╯equence-to-sequence)模型上。也就是说,只要有个模型能搞定两种语言之间的翻译,加上这个wait-k做一点小?#33041;歟?#23601;能实现同传了。

    一个机器翻译?#20302;常?#31163;不开分析输入语言的编码器和输出目标语言的解码器,而wait-k对机器翻译模型所做的小改动,就在解码器上。它?#23186;?#30721;器在输出内容的同时,能预测编码器还没有输入的东西。

    百度用这样一个公式描述了这种解码策略:

    其中,x代表输入的内容,y代表输出,t代表时间步,而k表示的是解码器比编码器抢跑的词数。

    技术细节在论文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency中有详细的介绍。

    地址:https://arxiv.org/abs/1810.08398

    团队介绍

    By the way,?#35789;?#21517;次序,介绍一下9位论文作者。

    Mingbo Ma,百度硅谷AI实验室科学家,拥有三个学校的计算机博士学位,今年8月刚从俄勒冈州立大学博士毕业,另外两个学位在美国东北大学和纽约城市大学,本科毕业于吉林大学,此前曾在苹果和IBM实习。

    黄亮,俄勒冈州立大学助理教授,百度美研首席科学家,此前曾就职于IBM和谷歌,并在纽约城市大学、南加州大学担任过助理教授,博士毕业于宾夕法尼亚大学。

    Hao Xiong,爱丁堡大学计算机硕士,本科毕业于河海大学,2015年加入百度任软件工程师,负责大容量数据处理?#20302;?#21644;资源调度?#20302;場?/p>

    Kaibo Liu,俄勒冈州立大学助理研究员,今年6月刚到百度实习,本科毕业于北大。

    Chuanqiang Zhang,低调的百度技术员工,目前无更多资料。

    何中军,百度主任架构师,从事机器翻译研究与开发十余年,多篇论文发表在本领域权威国际会议ACL、EMNLP、COLING、AAAI等,参与项目曾获2015年度国家科学技术进步奖二等奖。

    Hairong Liu,百度硅谷AI实验室科学家,曾就职于三星和普渡大学,华中科大电子电气博士。

    Xing Li,中科院自然语言处理?#31361;?#22120;学习硕士,百度硅谷人工智能实验室的高级经理,曾任英特尔技术leader,在百度担任过技术工程经理,领导百度贴吧研发团队。

    王海峰,百度高级副总裁,e-Staff,百度AIG负责人、百度研究院院长,哈工大计算机博士。

    王海峰 第一波评价

    百度这次技术突破宣布后,首先在外媒引发报道。

    有好评。其中评价最高的是IEEE Spectrum,认为百度开发的这个新?#20302;常?#25581;示了一种通过预测未来而保持稳定的翻译工具,可以与联合国会议期间提供同传服务的口译人员相媲美,让人们离软件巴别鱼又近了一?#20581;?/p>

    有对比。比如将百度的这次突破与谷歌联系起来。南华早报评论:随着百度新的翻译?#20302;?#20142;相,百度向谷歌发起了挑?#20581;?/p>

    还有将百度和谷歌放一起当“耦合”的。Engadget观点:

    虽然这个?#20302;?#20173;旧有局限性,而且无法在必要的时候取代人类翻译。但是它在谷歌?#27605;?#20013;国的情况下,给出了一种新的选择。

    虽然这个?#20302;?#20173;旧有局限性,而且无法在必要的时候取代人类翻译。但是它在谷歌?#27605;?#20013;国的情况下,给出了一种新的选择。

    SiliconANGLE则援引分析师评论称:?#25226;?#27954;的语言翻译方面仍然存在一定的局限性,看到本地的玩家加入到这个游戏中来,的确是一件好事。”

    但目前最多的态度是观望。

    在技术宅密度比较高的Hacker News和Reddit上,百度的这条消息,并没有引发太多的讨论。

    截至早上7点40分,Reddit只有一条评论,Hacker News上有两条评论——虽然这个消息发布?#24310;?个多小时。

    Reddit上面的一条评论有点“水?#20445;?#21482;是说这个Demo很好。

    Hacker News的两条评论中,一条比较有技术含量,提出了如何翻译德语的问题,并给出了一些示例,另一条是说,这个Demo很好。

    比较有趣的是,两个说这个Demo很好的网友,昵称基本上是一样的。

    不过这个技术到底好不好,更多中外关注者马上都能给出判断。

    因为百度最快会在下周的年度技术大会上,进行公开展示。

    究竟是重大突破,?#21482;?#36824;只是完美Demo,到时一看便知。

    当然,有科研实力有技术复现的同学,现在就能去试试了。

    ?#38431;?#21453;馈你的测后评价~

    返回搜狐,查看更多

    责任编辑:

    声明:该文观点仅代表作者本人,搜狐号系信息发布?#25945;ǎ?#25628;狐仅提供信息存储空间服务。
    阅读 ()
    投诉
    今日搜狐热点
    云南十一选五、
  • 微信捕鱼明星技巧 重庆时时彩近500期走势图 吉林时时开奖 vr赛游戏 贵州11选5投注技巧 腾讯分分彩5码倍投方案 新时时二星选号工具 微信捕鱼苹果手机充值中心 北京pk历史记录 幸运飞艇属于正规开奖