想象一下你正在开香槟:这个场面不但有庆祝的视觉画面,而且会有开香槟时候的独特气流声。
真实的世界中总是有各种类型的信息丰富并满足我们五种感官的需求——视觉,触觉,气味,声音和味道。其中,视觉、触觉和声音更是在人类用身体去感受世界的活动中起着至关重要的作用。
一个真正的、具有智能的机器也需要捕捉所有三种感官的相互作用,以建立对世界的感官理解。
近年来,研究人员开发了越来越多的计算技术,以使机器人具备人类一样的能力。
卡内基梅隆大学(CMU)的研究小组最近进行了一项研究,探讨了用声音+动作+视觉(sound-action-vision)来开发具有更先进传感功能的机器人的可能性。
关于这项研究的论文由机器人学顶级会议 Robotics: Science and Systems 接收,其中还介绍了迄今为止创建的最大的声音+动作+视觉数据集——Tilt-Bot 数据集,由名为 Tilt-Bot 的机器人平台与各种对象进行交互收集而来。
Tilt-Bot的诞生
研究员 Lerrel Pinto 表示:“在机器人学习中,我们通常只用视觉输入来进行感知,但是人类具有的感知方式不仅限于视觉。”
“声音是学习和理解我们的物理环境的关键组成部分。因此,我们提出了这样一个问题:在机器人技术的探索中,声音究竟可以起到什么作用呢? 为了回答这个问题,我们创造了机器平台 Tilt-Bot,它不仅可以与对象互动,而且可以收集大规模的交互式视听数据集。”
Tilt-Bot 数据的收集过程是:一种自动托盘可以倾斜物体直到它们碰到石膏托盘的薄壁,Pinto 和他的同事在自动托盘四周的薄壁上放置了接触式麦克风,以记录物体撞击薄壁时产生的声音,并使用高架摄像头直观地捕捉每个物体的运动。
研究人员收集了来自 60 个物体和托盘之间超过 15000 次碰撞的视觉和声音数据。这样一来,便可以采集到新的图像和音频数据集,从而有助于训练机器人在动作、图像和声音之间建立关联。
Pinto 和他的同事在论文中使用此数据集来探索机器人应用中声音和动作之间的关系,收集了许多有趣的发现。
首先,他们发现分析物体移动和撞击表面的声音记录可以让机器区分不同的物体,例如区分金属螺丝刀和金属扳手。
Pinto 解释到:“令人兴奋的是,我们的研究初步结果——仅凭声音就识别出物体类型的准确率接近 80%。”“我们还证明,机器可以学习基于声音的对象表示形式,有助于解决后续的机器人任务。例如,当识别空酒杯的声音时,机器人会明白操作空酒杯和操作满酒杯需要不同的动作。”
其次,Pinto 和他的同事还发现,在解决机器人的任务时,录音有时可以比视觉表现提供更多有价值的信息,因为它们也可以用来有效预测物体的未来运动。
在机器人的训练过程中,一系列的没有碰撞到物体的实验中可以得出以下结论,当机器人与这些物体互动时收集到的嵌入音频预测正向模型(例如,如何在未来最好的去操纵一个物体)的准确率要比被动的视觉嵌入好 24%。
一个方兴未艾的研究方向
事实上,CMU 此次的研究与近年新出现的一个小众但又充满前景的领域息息相关,那就是视觉和声音的联合学习(Audio-Visual Learning)。
视觉数据可以用于推断几何形状、目标跟踪、分类甚至直接控制。而触觉也越来越受到重视,被用于识别和反馈控制。
但是声音呢?从吱吱作响的门到沙子流动的沙沙声,声音往往能捕获视觉难以察觉的丰富对象信息。而且麦克风(声音传感器)既便宜又耐用,但是我们还没有看到声音数据被用于机器人学习上。迄今为止开发的大多数技术都只专注于人为地再现视觉和触觉,而忽略了诸如听觉感知之类的其他感官的作用。
为什么声音成为感知数据中的“二等公民”?
关键原因在于声音产生的核心。声音通过互动产生的,例如机器撞击物体,取决于击打的影响,对象,甚至麦克风的位置。这些错综复杂相互作用会产生非常丰富的数据,但也因此很难提取对机器有用的信息。
此前也有过类似的研究,例如“earning audio feedback for estimating amount and flow of granular material”,是一项通过声音来判断容器中的粒状物数量的探索。但这次的CMU团队认为,交互动作中的声音应该包含更多信息。
那么,具体可以从声音中提取什么样的信息?
通过构建 Tilt-Bot,这个团队提出了三个方向:声音表明粒状物信息。这意味着仅仅从物体发出的声音,经过学习的模型可以从不同的物体中识别出该对象。声音表明行动信息。这意味着从物体发出的声音,经过学习的模型可以知晓哪些操作被作用到该对象。声音表明视觉上“隐身”了的信息。这意味着从物体发出的声音,经过学习的模型可以推断物理上隐形的信息。
团队将公开发布 Tilt-Bot 的数据集,以此为机器人的开发工作助力,帮助机器人可以根据在周围环境中收集的音频录音和图像来选择自己的动作和对象操作策略。Pinto 和他的同事正计划进一步地研究,探索声音分析在创造具有更前沿功能的机器人方面的潜力。
Pinto 强调到:“这项工作只是将声效整体集成到机器人技术中的第一步。在未来的工作中,我们将研究基于声音和动作的更实际应用。”
上一篇:消防机器人:未来突破三大难题拥抱蓝海
下一篇:专访艾利特CEO曹宇男:协作机器人快速发展时机已至 好用是关键
推荐阅读
史海拾趣
近年来,中国市场对汽车电子产品的需求不断增长,为ELMOS提供了广阔的发展空间。为了抓住这一发展机遇,ELMOS不断加大在中国的投入力度,扩大其在中国市场的规模和影响力。通过与国内汽车制造商和合作伙伴的深入合作,ELMOS在中国市场取得了显著的成果,并为公司未来的持续发展奠定了坚实的基础。
以上五个故事分别从不同角度展示了ELMOS公司在电子行业中的发展历程和成就。这些故事不仅体现了ELMOS的技术实力和市场竞争力,也展示了公司在全球化和国际化方面的努力和成果。
面对数字化浪潮的冲击,Dymec公司积极拥抱变革,推动数字化转型。公司引入了先进的生产管理系统和智能制造技术,提高了生产效率和产品质量。同时,公司还加大了对大数据、云计算等新技术的研究和应用,为未来的发展提供了强有力的技术支撑。
这些故事共同见证了Dymec公司在电子行业中的成长与发展,展现了公司不断创新、追求卓越的精神风貌。
MACOM公司上市后,成功募得了充足的资金,使其财务能力得到了显著增强。这使得公司能够有更多的资源进行研发、生产和市场推广,进一步巩固其在电子行业的地位。同时,上市也为MACOM带来了更广泛的投资者关注和市场认可,为其未来的发展提供了有力支持。
为了进一步扩大市场份额,Advance Tapes公司开始积极参与国际展会和交流活动,向全球客户展示其优质的产品和技术实力。同时,公司还加大了对品牌建设的投入,通过广告宣传、赞助活动等方式提升品牌知名度和美誉度。这些努力使得Advance Tapes的胶带产品逐渐在国际市场上占据了一席之地。
随着市场竞争的加剧,Chip Supply Micro Devices意识到成本控制的重要性。公司开始着手优化供应链管理,通过引入先进的生产管理系统和自动化设备,提高了生产效率,降低了生产成本。同时,公司还与供应商建立了长期稳定的合作关系,确保了原材料的稳定供应和优质品质。这些措施使得Chip Supply Micro Devices在价格上具备了竞争优势,进一步提升了市场份额。
在微电子器件领域,Chip Supply Micro Devices凭借一项创新技术,成功打破了市场格局。公司研发出了一种新型低功耗芯片,不仅提高了电子设备的性能,还降低了能源消耗。这一技术突破使得Chip Supply Micro Devices迅速获得了市场的认可,产品销量激增。公司借此机会扩大生产规模,加大研发投入,进一步巩固了其在微电子器件市场的地位。
|
随着Altera推出65nm工艺的FPGA,全球两大FPGA巨头又开始在65nm节点开始了新一轮的竞争。不过,近日赛灵思公司亚太区市场营销总监郑馨南透露:赛灵思将会有新的举措-加强FPGA在传统的通信、消费领域以及新兴汽车电子、医疗电子等领域的渗透。 与ASI ...… 查看全部问答∨ |
|
|
大家好我想用W77E58有两组串口通讯口。其中一组我用4800波特率来和另一单片机通讯。一组用9600波特率来和另一设备通讯。这样可以实现吗。我在程序里来做通讯波特率的切换这样做通讯的时候会不会有什么问题?有没有同人这样做过… 查看全部问答∨ |
|
|
FileMapping读取size<=4096的文件后异常! 步骤: 1) FileMapping读取size 4096的文件2 3) FileMapping读取另一个文件3, MapViewOfFile()返回地址中的内容是文件2的. 不知道是不是driver层的问题?… 查看全部问答∨ |
|
|
随着可编程逻辑门阵列(FPGA,Field Programmanle Gate Array)应用的不断普及,便携式设备和无线设备的涌现,过去对于FPGA主要关心的速度、单片容量、费用以及可靠性等,现在对于低功耗FPGA的需 求,与速度、容量、费用等到了一样的高度,成为FPG ...… 查看全部问答∨ |
|
|
想请高手指点下 1)开发zigbee协议栈要掌握到什么程度? 2)z-stack2007中有个GenericAPP应用例子,关于绑定那里不太明白,希望能指点下,在处理函数里面主要 3)要开发一些应用,是不是还要了解开发板硬件方面的东西? … 查看全部问答∨ |


XC6406PP60DL






京公网安备 11010802033920号