datasheet

Qualcomm 高通

文章数:182 被阅读:412396

账号入驻

5G+AI,创造真正的“地球语”

2018-10-27
    阅读数:

语言,是人类通识学习项目中最为折磨、麻烦、高成本、难进步的一类。无论你是去问那些报课外班的中学生,还是被四六级卡得痛不欲生的大学生,或是在工作中看到小语种材料发晕的职场人,他们的脑海中绝对回响过那句顺口溜——“我是中国人,不爱学外语,外语不及格,说明我……”

 

因为早期处于孤立、分散状态,人类也因为自然环境、生产生活、思维习惯的不同,形成了各自的部落、民族,进而催生出了特定群体的文化形式,最典型的结晶,就是作为交际工具的语言,和社会意识形态的宗教。

 

根据公开资料,目前全球单是存在文字的语言就有约2000种。

 


这些本身为了人类沟通而存在的“工具”,在人类进入现代文明阶段使用起来还算方便。但随着信息技术的发展,世界各地之间的时间和距离维度,已经趋近于消失,这个时候文化隔阂的影响就凸显出来了。

 

我们再来看“世界语言”英语,目前已经被67个国家当做官方语言。即便是感觉人人都会说英语的美国,实际上也有25%的学生在家里会说英语以外的母语,而年龄放宽之后,大约有40%的美国人不会在家里说英语。这种同一个国家、不同民族、不同祖籍的人们所构成的多语种环境,已经十分普遍。

 

地球人,交流起来就是这么难。



一个人,能学会所有语言么?

 

既然英语还不够用,那么就多学几种语言呗?现实中的确存在这样的人,他们的特点就是能掌握很多种语言,他们甚至有一个专门的名字——“多语言使用者”(ployglot)。

 

以世界上最有名的多语言使用者的利比里亚籍黎巴嫩人,齐亚德·法扎赫(Ziad Youssef Fazah)为例,他对外宣称自己可以说和读58种语言(包括粤语),并且被记入了吉尼斯世界纪录。

 

但在一档电视节目中,数位不同语言的人分别用母语向他发问。其中以为中国人问他:“在月球上,能够看到唯一的地球上的人造工程是什么?”他转过头来复述了一次问题,但并没有给出答案,很明显是没有听懂。另外一位用俄语问他“今天是星期几?”,他同样没有回答。

 

“吉尼斯纪录拥有者”都做不到,那普通人就更加没希望了。

 


这也是因为语言并不是一个独立的东西,它实际上是架设于文化之上的表达,而想要把一种文化背景的表达“完美”翻译成另外一种文化,就意味着翻译的人必须同时极度熟悉两种文化,最好曾生活在两种文化其中。

 

按这个思路推理,你总不可能每个人把地球的文化全部熟悉一遍。

 


让所有语言都变成“地球语”

 

既然人不可能掌握所有语言,那么能不能换个思路,为啥一定要学外语呢?能不能不学呢?或者把这件事交给别的工具去做呢?

 

作为一项历史悠久的技术,人工智能在近年来取得了突飞猛进的发展,其中一个体现就是机器翻译的速度和准确度。英国17世纪的诗人兼翻译,约翰·德莱顿曾这样描述理想的翻译:


 翻译不一定需要每个字词对应,因为每种语言有着自己的特殊背景,翻译的人更重要的是选择一些不会破坏原意的表达。这就好比一个画家用自己的画笔记录下的真实场景,画家自己有权利改变画面的风格和特征。

 

这也是为什么人类翻译在学习语言之余,还需要通过工作积累大量的经验,进而形成自己对于语言理解和还原的能力和风格,人工智能也在逐渐实现这一点。

 

以国内某领先的人工智能翻译公司为例,他们半年前的随身翻译产品,已经可以支持33种语言的翻译。同时它也能够支持4种最常见的中国方言:东北话、四川话、河南话、粤语。而他们网上的服务,更可以在几分钟内将数十分钟的录音处理为文字,准确率还相当高。

 


在魔法般的外表之下,人工智能翻译的原理其实也很简单——计算机先通过大量数据学习如何将录音变为文字,如何将文字翻译过来,最后让计算机学习如何像人类一样发声。然后在用户需要翻译的时候,先把人类的录音从本地发到云端,云端进行识别、翻译等处理,然后再将数据回传到客户端,并且最终转变成用户听到的人声。

 

这一系列环节中,都是通过网络来联通的,同时也极度依赖云端的人工处理运算能力。即便是现在最先进的技术,整个反应时间仍然将达到秒级。这个速度对于人类来说实在是太慢了。

 

想象一下,你好不容易在国外的大马路上拦下一个好心人帮忙,结果掏出翻译器发了一句语音,你能看到的只有无尽的“Loading”,你只能继续请求好心人再等等,要多尴尬有多尴尬。

 


5G+AI,创造真正的“地球语”

 

没错,5G 将会是上面这种尴尬场景的最好解决方案,当然也少不了 AI 的帮忙。

 

按照Qualcomm的设想,未来的翻译设备完全能够在你说出自己母语的一瞬间,瞬间将其翻译、发声为另外一种母语。翻译设备甚至能在屏幕上模拟出你的脸,脸的动作跟翻译之后的新语言对应。

 

但完成这个设想需要一些必不可少的组件,首先就是芯片。Qualcomm打造的骁龙芯片将会是完成这个任务最好的选项。

 


在有了芯片之后,人们可以在骁龙之上开发软件,然后开发人员就能够将训练之后得到的人工智能算法放入到软件当中。在这个环节中,算法的地位就像燃料一样。通过把算法和引擎结合,无论是音乐还是打电话,我们都能够在终端设备本地进行翻译。

 

这就保证了整个交流和翻译都是实时进行的,就跟我们平时母语的交流一样。当然为了实现这种实时性,5G连接对于交流终端的作用也不可忽视。

 

当人工智能已经能比人类更高效地完成不同语种交流的任务,届时人类可以抽出更多精力,去做更加富有创造力的事业。

 


但这并不是对于人类的威胁,而是技术必然会带来的社会升级与变革,最终的结果只可能是人类的生活更加简便而愉悦。这种人力的“释放”,也是技术最大的价值所在。让工具回到工具,让人不再被当成工具。

 

比如在美国这个多语言国家,不少教育家和学者已经开始畅想:当语言不再是壁垒的时候,来自欧洲、南美、东亚等不同地区的学生,可以自由交换意见和想法,而不必再去了解对方独特的语言文字,这样的场景“令人感到兴奋”。5G,可以使教室成为真正的连接中心。

 

按照目前的时间表,5G 将在 2019 年商用,而 Qualcomm 正在引领5G商用的加速到来。届时人们跨语种的交流,也将因为5G的到来而发生翻天覆地的改变。

 

到那一天,地球人说的话,都是地球语。



点击阅读原文,了解 5G 最新进展。


About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved