异构智能吴韧:对标英伟达和 Google ,要做专用的 AI 芯片

2017-10-27 10:23:09编辑:冀凯 关键字:英伟达  Google

离开百度的两年里,吴韧创办了一家做 AI 芯片的公司——异构智能(NovuMind)。但在很长一段时间里,关于吴韧的去向和这家公司在媒体报道中几乎处于噤声状态。


按照吴韧一贯给人看似“低调”的性格,没有做出一定的成绩,或者足够满意的产品出来之前,他也应该不会急于向外界发声。不过,关于他们的报道在近期逐渐多了起来,异构智能这家公司也逐渐浮出水面。


10 月 24 日,异构智能创始人吴韧向包括雷锋网在内的十多家媒体整体介绍了异构智能这家公司和他们做的 AI 芯片。关于吴韧的介绍,以及异构智能的应用案例,已在此前吴韧接受雷锋网专访文中进行过详细描述,此番不再赘述。


本篇主要介绍异构智能的 AI 芯片跟其他公司有何不同?它瞄准了芯片市场的哪些应用场景?异构智能的芯片对标英伟达Google ,底气来自何处?


全栈式的 AI 解决方案


在这场人工智能浪潮中,其中获利最大的公司之一应该是 AI 芯片巨头英伟达,在不到两年的时间内,它的股价也因此翻了近 10 倍,变身为一家市值千亿美元的巨头公司。


相较而言,传统硬件巨头英特尔则处于一个追赶者的角色,但不甘落后使得它在今年 3 月以 153 亿美元收购 Mobileye,将赌注押在了汽车行业。另一巨头 Google 作为传统互联网公司,也紧跟步伐,积极部署人工智能芯片。


吴韧将英伟达的成就归咎于它为 AI 公司提供了训练模型最基础的计算力。


算力是决定人工智能发展重要的一环,异构智能也希望凭借芯片进入各行各业,不仅能为人工智能公司提供计算能力,还包括非人工智能公司,帮助它们进行人工智能落地。换句话说,也就是要对不同行业提供全栈式的 AI 解决方案。



异构智能的思路是既有芯片,又有模型、超级计算机,将模型脱离云端,带到本地和终端,让终端变得智能。“超级计算机可以训练模型,模型和芯片进行配合,让芯片最后可以做某一个模块的功能。”


这跟做平台的思路有很大不同。平台更多是做一个标准,要求大而全,这样做“会有额外的负担”,而异构智能要做的正是优化这些额外的负担,做出极端定制化的 AI 芯片。


按照这样的设想,异构智能就会有更多应用场景的想象空间。比如,他们已经与合资公司做了智能医疗,也会涉及智能安防、智能驾驶、智慧城市等领域。目前的合作者中有 HP、KUKA 这样的大公司,通过类似于 2B2C 这样的业务模式,把 AI 能力赋予给它们各自的用户。


高性能-低功耗的 AI 芯片


“芯片用电量与市场规模成反比”,异构智能在两年前成立的时候就发现了这一点,所以希望将人工智能的能力用最小功耗实现,他们觉得这是异构智能打开未来大门的机会。


机会与挑战共存,挑战的一面在于把 AI 放在终端上的芯片要高性能,因为人工智能的计算很复杂。其次是低功耗,因为要放在很小的一块地方上,需要付出巨大的努力。


那异构智能又如何去做这样一款 AI 芯片?吴韧介绍说,这款芯片不会用来上网,或者做一些其他计算。“它擅长的是在三维上做卷积张量的计算,把人工智能的计算加速。”


一般的 AI 芯片需要 10TOPs 的计算能力才能把应用实现,在吴韧看来, Google 等公司的芯片计算能力很强,但耗电能力同样也很高,这就难以满足人工智能在本地落地的条件。耗电相对较低的 Movitus、高通、寒武纪麒麟 970 等芯片,却在计算能力上比他们所想要的少了两个数量级。


而拿异构智能即将推出的 5W15TOPs 芯片来说,“5W 是 USB 可以提供的电量,使用这样电量的芯片会有很大的应用空间,从而实现从云端到终端的突破能力。”吴韧介绍道。


问题是,既然连英伟达、Google 这样的巨头都还没做能同时满足两种需求的芯片,异构智能作为一个创业公司却说自己的芯片做的比他们好,底气来源于哪里?


“专用性”是吴韧提及最多的特点。“在公平的世界,有得就有失,要扔掉一些东西才能得到一些东西。”显然,异构智能牺牲的是通用性,转而把目光放在了全栈和垂直优化上。他继续解释说,“当年 GPU 赢过 CPU 就是因为 GPU 比 CPU 专用。”如今,对专用性的追求,从某种意义上讲也自然被异构智能看做是与巨头抗衡甚至“打败”它们的重要特质。


而从计算方式比较,CEVA 和 Tensillica 的 DSP 芯片是在 1D 乘积累加运算(MAC)来完成操作的,而英伟达 TX 系列的 GPU 芯片运作的本质是使用了 2D 通用矩阵乘法(GEMM)。


但吴韧表示,人工智能的核心计算是三维张量的卷积计算,在小立方体和大立方体重合的部分做点乘。目前只有异构智能的芯片在三维层面做操作,并且他们已经有四项专利保护。


第一项专利是三维张量的卷积,这是人工智能最重要的操作,可以用硬件直接实现。其他三项专利是对数据的调度与分配、归并,处理器间的协作。


为了说明三维张量卷积计算的优势,他用吃冰激凌的方法做了个更形象比喻:冰激凌可以用手沾着吃,但没有效率;可以拿吸管吸,效率也不是很高;更厉害一点的是用一个小平面吃,但也不是最优;最好的方式是用一个三维的专用勺子吃冰激凌。


对标英伟达和 Google


除了核心计算方式不同外,在具体的应用场景上,吴韧也谈了谈跟巨头如何竞争。比如,自动驾驶也是英伟达所要发力的领域,他们的 30W30TOPs 的芯片是主推产品。但吴韧对英伟达在无人驾驶领域的芯片表示了质疑,认为后者的判断不够精确,“原来想 Centralized Process,但是所有人都低估了其中的难度。”他进一步强调说,30TOPs 的芯片使用在自动驾驶上可能并不够,也许需要分布式计算。


当然,无人驾驶汽车有雷达、毫米波雷达、摄像头等多处需要处理器的装置,需要把处理的结果进行计算。“当有很多芯片的时候,异构智能和英伟达的区别就体现出来了。”他说。


就在媒体沟通会当天,自喻为“中国版英伟达”的深鉴科技宣布完成 A+轮融资约 4000 万美元,吴韧表示对国内很多公司不便评价,但他说异构智能目前的芯片对标对象是 Google TPU 和英伟达 GPU。


从整个市场来看,根据智研咨询发布的《2017-2023 年中国人工智能芯片行业研究及未来发展趋势报告》,可以看到 AI 芯片市场规模增长迅速。据统计数字,2016 年人工智能芯片市场规模达到 6 亿美元,预计到 2021 年将达到 52 亿美元,年复合增长率达到 53%,增长迅猛,发展空间可期,但由此可以预见这个巨大市场在未来的竞争将会多么激烈。


人工智能的发展空前火热,物联网这个概念近几年却一直都是半温不火。吴韧则直接表示物联网是一个伪命题,难以实现。“物联网看起来可以魔术般的连起来,但实际上要通过很多的海底光缆或地下光缆连接起来,是从分支道路到主干道连接的。”而主干道是国家资源,需要国家投资才能持续扩大。


他认为最好的解决方案是将人工智能的能力从云端拿到终端,让“小东西”有思考能力,然后将它们思考的结果通过网络与世界连接。“I2OT(智能物联网)才是未来唯一的可能。”他笃定地说道。


基于此,异构智能的定位就很明确了:在万物互联向万物智能转变的过程中,将人工智能从云端延展到终端,从而为“智联网”赋能。

关键字:英伟达  Google

来源: 雷锋网 引用地址:http://www.eeworld.com.cn/qrs/article_2017102740132.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:工信部:预计今年中国集成电路市场规模1.3万亿
下一篇:第五届“英特尔杯”全国并行应用挑战赛PAC大赛圆满落幕

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

Mobileye 和英伟达:两巨头终将殊途同归?

做自动驾驶处理器不是一件容易事,它需要满足高算力、高稳定性、高安全性、低功耗等相互之间很难平衡的特性。在这个领域,目前业内知名的供应商就只有 Mobileye 和英伟达(NVIDIA)这两家。前者是绝对的老大,后者是后起之秀,意图弯道超车。身为老大,Mobileye 的技术自然稳稳领先,这也决定了这家公司的技术体系相当封闭——厂商想合作,只能整套购买他们的解决方案,而就算买了,他们的数据和技术细节也不开放给你。2017 年 8 月,英特尔通过用约 153 亿美元收购 Mobileye 的方式,直接打入自动驾驶领域。被收购后,Mobileye 就宣布了会在未来产品迭代过程中逐步开放其技术体系。去年底,他们开放了叫做 RSS 的模型
发表于 2018-07-10 17:12:33
Mobileye 和英伟达:两巨头终将殊途同归?

GPU滞销、AMD快一步、英特尔入局,英伟达真的危机了?

集微网消息(文/小北)2017年4月至2018年3月的虚拟货币热潮让GPU处于供不应求的状态。如今虚拟货币市场已退热。尽管英伟达对此早有准备,但仍有外媒消息称英伟达面临巨大的去库存压力,甚至出现GPU滞销。与此同时,英伟达或采取延迟发布下一代GPU芯片的策略缓解库存压力。虚拟货币市场退热,英伟达面临的或许不止是去库存的压力。AMD在不断获得更大GPU市场份额的同时,也在加快下一代GPU产品的研发脚步。同时,英特尔涉足GPU领域,并直言向英伟达、AMD发起挑战。对于GPU厂商而言,伴随着虚拟货币市场变化,本可以很轻松地退回其“大本营”——游戏市场。为何英伟达却面临去库存压力?据悉,英伟达过于高估游戏市场的需求,并低估了挖矿市场迅速
发表于 2018-06-20 20:32:56

英伟达布局机器人领域 推出专用芯片及平台

移动搬运机器人(AGV)及自动装箱机器人”和“自动化物流机器人成套系统整线集成”,项目成果在北京同仁堂健康药业股份有限公司智能工厂中得到应用。该项目研制成功了具有自主知识产权的复合导航移动搬运机器人(AGV)、自动装箱机器人,建成了集原材料、半成品自动搬运,成品自动装箱、发货产品拣选及分拣于一体的自动化物流机器人成套生产线,实现了生产工艺特殊需求的复合导航移动搬运机器人、自动化物流集成线,物流信息流与企业供应链体系、生产体系、销售体系融合,生产过程全程信息可追溯。英伟达布局机器人领域,推出专用芯片及平台近日,英伟达(Nvidia)推出旗下Nvidia Isaac机器人平台,用来为下一代自动驾驶机器提供动力支持,进而为制造业、物流业
发表于 2018-06-10 09:46:25
英伟达布局机器人领域 推出专用芯片及平台

英伟达推出新款机器人NVIDIA Isaac,多个行业都能支持?

英伟达宣布推出支持下一代自主机器的NVIDIA Isaac机器人平台,来为制造、物流、农业、建筑以及其他行业的机器人实现人工智能支持。 据了解,NVIDIA Isaac是以Jetson Xavier为核心的全球首款专为机器人设计的计算机系统。它拥有超过90亿个晶体管,每秒可进行30万亿次操作以上,这一处理性能远超工作站,而且能源消耗仅占照明灯泡的三分之一。 Jetson Xavier拥有6种高性能处理器,包括1个VoltaTensorCoreGPU、1个8核ARM64CPU、2个NVDLA深度学习加速器、1个图像处理器、1个视觉处理器和1个视频处理器。这些处理器使其能够同时、且实时地处理数十种算法,以用于
发表于 2018-06-07 19:48:59

英伟达新一代Volta架构,专为深度学习而生?

(AI)、HPC及绘图需求,宣称是面向深度学习(deep learning)与HPC最快速且最具生产力的绘图处理器(GPU)。 针对全新SM微架构,Koehler表示,Volta GV100 SM是为生产力所重新设计的产品,具备全新指令集架构(ISA)、简化发放逻辑单元(issue logic),并拥有大型更快速的L1快取、改善SIMT模型且支援Tensor加速,一大特色在于相较于前一代Pascal SM,Volta SM整合了关键技术,将L1$与共享记忆体整合达128KB,可创造更低延迟性及串流效果,如串流L1$拥有4倍更多频宽、5倍能力提升等,并可缩短与前一代Pascal的共享记忆体落差。 Koehler提到
发表于 2018-06-06 20:47:06

仍用台积电12nm制程?英伟达下一代GeForce最晚8月亮相

、华硕、华擎等多家台OEM、ODM业者全面展开合作,HGX-2为全球首款专为AI与高效能运算打造的单一整合运算平台,号称效能足以取代高达300颗CPU所组成的服务器。 新平台方面,黄仁勋则正式宣布全新平台Isaac,将为制造业、物流业、农业、建筑业等各产业所使用的机器人带来AI的能力; Isaac的核心是Jetson Xavier,为全球首款专为机器人设计的电脑,内建超过90亿个晶体管,每秒可进行超过 30兆次浮点运算(trillion operations per second; TOPS),较强大的工作站具有更高的数据处理能力,且功耗只有1颗灯泡的三分之一。 Jetson Xavier具有6种高效能处理器,包含
发表于 2018-06-06 17:41:30

小广播

何立民专栏

单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved