datasheet

听懂声音—ADI公司人工智能如何大幅延长设备运行时间

2019-06-11来源: EEWORLD作者: Sebastien Christian关键字:ADI  人工智能

简介

 

任何深谙设备维护必要性的人都知道,设备发出的声音和振动有多重要。通过声音和振动进行适当的设备健康监测,可以将维护成本降低一半,使用寿命延长一倍。实现实时声学数据和分析是另一种重要的基于状态的系统监测 (CbM) 方法。

 

我们可以学着了解设备发出的正常声音是什么样的。当声音出现变化时,我们可以确认出现异常。然后我们可以了解是什么问题,通过这样的方式把声音和特定的问题联系在一起。识别异常可能需要进行几分钟的训练,但将声音、振动和原因结合起来实施诊断可能需要一辈子的时间。经验丰富的技工人员和工程师可能具备这种知识,但他们属于稀缺资源。单单通过声音本身识别问题可能相当困难,即使使用录音、描述性框架或接受专家亲自培训也是如此。

 

因此,ADI 公司团队在过去 20 年里一直致力于理解人类是如何解读声音和振动的。我们的目标是建立一个系统,能够学习来自设备的声音和振动,破译它们的含义,以检测异常行为,并进行诊断。本文详细介绍了 OtoSense 的体系结构,它是一种设备健康监测系统,支持我们所说的计算机听觉,让计算机能够理解设备行为的主要指标:声音和振动。

 

该系统适用于任何设备,可以实时工作,无需网络连接。它已被应用于工业应用,支持实现一个可扩展的高效设备健康监测系统。

 

本文探讨了引导 开发OtoSense 的原则,以及在设计 OtoSense 期间,人类听觉所发挥的作用。然后,本文讨论了声音或振动特性的是如何被设计出来的、如何从这些特性了解其代表的意义,以及在持续学习中如何不断改变和改进 OtoSense,用于执行愈加复杂的诊断,且结果更为精准。

 

指导原则

 

为了保证耐用、不可知且高效,OtoSense 设计理念秉持几个指导原则:

 

从人类神经学中获得灵感。人类可以以一种非常节能的方式学习和理解他们听到的任何声音。

能够学习静态声音和瞬态声音。这需要不断调整功能和持续实施监测。

在靠近传感器的终端进行识别。应该无需通过网络连接远程服务器来做出决策。

与专家互动,向他们学习,前提是尽可能避免干扰他们的日常工作,且过程要尽可能愉悦。

 

人类听觉系统和对 OtoSense 的解析


听觉是一种关乎生存的感觉。它是对遥远的、看不见的事件的整体感觉,在出生前就已成熟。

人类感知声音的过程可以用四个熟悉的步骤来描述:声音的模拟获取、数字转换、特征提取和解读。在每个步骤中,我们都会将人耳与 OtoSense 系统比较。

 

模拟获取和数字化。中耳中的膜和杠杆捕捉声音,然后调整阻抗,将振动传输到充液腔道中,在那里,另一层膜会根据信号中存在的光谱成分选择性地移位。这反过来弯曲了弹性单元,这些单元发出数字信号,反映出弯曲程度和强度。然后,这些单独的信号通过按频率排列的平行神经传递到初级听觉皮层。

 

在 OtoSense 中,这项工作由传感器、放大器和编解码器来完成。数字化过程使用固定的采样速率,可在 250 Hz 和 196 kHz 之间调节,波形在 16 位编码,然后存储到大小在128 到 4096 之间的缓冲区。

 

特性提取发生在初级皮层:频率域特性,如主频率、谐波和频谱形状,以及时间域特性,如脉冲、强度变化和在大约 3 秒时间窗内的主要频率成分。

 

OtoSense 使用一个时间窗,我们称之为“块”,它以固定的步长移动。这个块的大小和步长范围为 23 毫秒到 3 秒,具体由需要识别的事件和在终端提取特性的采样率决定。在下一节中,我们会就 OtoSense 提取的特性进行更详细地解释。

 

解析发生在联络皮层,它融合了所有的感知和记忆,并赋予声音以含义(比如通过语言),在塑造感知期间起着核心作用。解析过程会组织我们对事件的描述,远远不止是对它们进行命名这么简单。为一个项目、一个声音或一个事件命名可以让我们赋予它更大、更多层的含义。对于专家来说,名字和含义能让他们更好地理解周围的环境。

 

这就是为什么 OtoSense 与人的互动始于基于人类神经学的视觉、无监督的声音映射。OtoSense 利用图形表示所有听到的声音或振动,它们按相似性排列,但不尝试创建固定分类。这让专家们能够组织屏幕上显示的组,并为它们命名,而无需尝试人为创建有界线的类别。他们可以根据自身的知识、感知和对 OtoSense 最终输出的期望构建语义地图。对于同样的音景,汽车机械师、航空工程师,或者冷锻压力机专家,甚至是研究相同领域,但来自不同公司的人员,都可以按不同的方式进行划分、组织和标记。OtoSense 则与塑造语言意义一样,使用相同的自下而上的方法来给定意义。

 

从声音和振动到特性

 

经过一段时间(如之前所示,时间窗或块),我们会给某个特征分配一个单独的编号,用于描述该时间内声音或振动的给定属性/质量。OtoSense 平台选择特性的原则如下:

 

对于频率域和时域,特征都应该尽可能完整地描述环境,提供尽可能多的细节。它们必须描述静止的嗡嗡声,以及咔哒声、哗啦声、吱吱声和任何瞬间变化的声音。

特征应尽可能按正交方式构成一个集合。如果一个特征被定义为“块上的平均振幅”,那么就不应该有另一个特征与之高度相关,例如“块上的总光谱能量”。当然,正交性可能永远无法实现,但不应将任何一种表述为其他特征的组合,每种特征都必须包含单一信息。

特性应该最小化计算量。我们的大脑只知道加法、比较和重置为 0。大多数 OtoSense 特性都被设计成增量,这样每个新示例都可以通过简单的操作修改特性,而不需要在完整的缓冲区,或者更为糟糕的,在块上重新进行计算。最小化计算量还意味着可以忽略标准物理单元。例如,尝试用值(以 dBA 为单位)表示强度是没有意义的。如果需要输出 dBA 值,则可以在输出时完成(如果必要)。

 

在 OtoSense 平台的 2 到 1024 个特性中,有一部分描述了时域。它们要么是直接从波形中提取,要么是从块上任何其他特性的演化中提取。在这些特性中,有些包括平均振幅和最大振幅、由波形线性长度得到的复杂度、振幅变化、脉冲的存在与否和其特性、第一个和最后一个缓冲区之间相似性的稳定性、卷积的超小型自相关或主要频谱峰值的变化。

 

在频域上使用的特性提取自 FFT。FFT 在每个缓冲区上计算,产生从 128 到 2048 个单独频率的输出。然后,该过程创建一个具有所需维数的向量,该向量比 FFT 小得多,但仍能细致地描述环境。OtoSense 最初使用一种不可知的方法在对数频谱上创建大小相同的数据桶。然后,根据环境和要识别的事件,这些数据桶将重点放在信息密度高的频谱区域,要么是从能够熵最大化的无监督视角,要么是从使用标记事件作为指导的半监督视角来判断。这模拟了我们的内耳细胞结构,在语言信息密度最大的地方,语音细节更密集。

 

结构:支持终端和本地数据

 

OtoSense 在终端位置实施异常检测和事件识别,无需使用任何远程设备。这种结构确保系统不会受到网络故障的影响,且无需将所有原始数据块发送出去进行分析。运行 OtoSense 的终端设备是一种自包含系统,可以实时描述所鉴听设备的行为。

图1.OtoSense 系统。

 

运行 AI 和 HMI 的 OtoSense 服务器一般托管在本地。云架构可以将多个有意义的数据流聚合成为 OtoSense 设备的输出。对于一个专门处理大量数据并在一个站点上与数百台设备交互的 AI 来说,使用云托管的意义不大。

 

从特性到异常检测

 

正常/异常评估无需与专家进行太多交互。专家只需要帮忙确定表示设备声音和振动正常的基线。然后,在推送给设备之前,先将这个基线在 Otosense 服务器上转换为异常模型。

 

然后,我们使用两种不同的策略来评估传入的声音或振动是否正常:

 

第一种策略是我们所说的“常态性”,即检查任何进入特性空间的新声音的周围环境、它与基线点和集群的距离,以及这些集群的大小。距离越大,集群越小,新的声音就越不寻常,异常值也就越高。当这个异常值高于专家定义的阈值时,相应的块将被标记为不寻常,并发送到服务器供专家查看。

第二种策略非常简单:任何特性值高于或低于特性定义的基线的最大值或最小值的传入块都被标记为“极端”,并发送到服务器。

 

异常和极端策略的组合很好地涵盖了异常的声音或振动,这些策略在检测日渐磨损和残酷的意外事件方面也表现出色。

 

从特征到事件识别

 

特征属于物理领域,含义属于人类认知。要将特征与含义联系起来,需要 OtoSense AI 和人类专家之间展开互动。我们花了大量时间研究客户的反馈,开发出人机界面 (HMI),让工程师能够高效地与 OtoSense 交互,设计出事件识别模型。这个 HMI 允许探索数据、标记数据、创建异常模型和声音识别模型,并测试这些模型。

 

OtoSense Sound Platter(也称为 splatter)允许通过完整概述数据集来探索和标记声音。Splatter 在完整的数据集中选择最有趣和最具代表性的声音,并将它们显示为一个混合了标记和未标记声音的 2D 相似性地图。

 

 

图2.OtoSense Sound Platter 中的 2D splatter 声音地图。


任何声音或振动,包括其环境,都可以通过许多不同的方式进行可视化——例如,使用 Sound Widget(也称为 Swidget)。


图3.OtoSense sound widget (swidget)。

 

在任何时候,都可以创建异常模型或事件识别模型。事件识别模型是一个圆形的混淆矩阵,它允许 OtoSense 用户探索混淆事件。

 

图4.可以基于所需的事件创建事件识别模型。

 

异常可以通过一个显示所有异常和极端声音的界面进行考察和标记。

 

图5.在 OtoSense 异常可视化界面中,声音分析随时间的变化。

 

持续学习过程——从异常检测到日益复杂的诊断

 

OtoSense 的设计初衷是向多位专家学习,并且随着时间推移,进行越来越复杂的诊断。常见过程是 OtoSense 和专家之间的循环:

 

异常模型和事件识别模型都是在终端运行。这些模型为潜在事件发生的概率以及它们的异常值创建输出。

超出定义阈值的异常声音或振动会触发异常通知。使用 OtoSense 的技术人员和工程师可以检查该声音和其前后声音信息。

然后,这些专家会对这个异常事件进行标记。

对包含这些新信息的新识别模型和异常模型进行计算,并推送给终端设备。

 

结论


ADI 公司提供的 OtoSense 技术旨在使声音和振动专业知识在任何设备上都持续可用,且无需连接网络来执行异常检测和事件识别。在航空航天、汽车和工业监测应用中,该技术被越来越多地用于设备健康监测,这表示,在曾经需要专业知识,以及涉及嵌入式应用的场景中,尤其是对于复杂设备而言,该技术都表现出了不错的性能。


关键字:ADI  人工智能

编辑:muyan 引用地址:http://www.eeworld.com.cn/IoT/ic464016.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:安森美:智能感知推进机器视觉的发展
下一篇:最后一页

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

5G时代,ADI打造“更安全、更环保、更智能”汽车新生态

主角势不可挡。那么,5G技术的商用会给汽车本身及汽车产业带来哪些变革? 来自ADI的技术专家认为,汽车被广泛认为是5G落地的关键行业应用领域,5G网络速度的提升、更低的响应时延、更大容量的网络连接,使5G网络连接的飞跃将不单局限于互联网,更将推动汽车、医疗和工业自动化领域的革命性变化,车联网、自动驾驶正在激发汽车发展的美好未来愿景。  自动驾驶的愿景更来源于ICT技术的影响,例如环境感知技术,数字化道路交通,围绕车身的各种传感器,雷达、激光雷达、惯性导航、视觉传感器等给汽车赋予了丰富的功能创新。5G的落地,为这些传感器数据快速低延时通信提供了条件,云端与汽车之间信息交换的速度就会加快,大幅度允许汽车搭载更多
发表于 2019-05-31
5G时代,ADI打造“更安全、更环保、更智能”汽车新生态

ADI推出全新毫米波 (mmWave) 5G 基础设施的新型解决方案

面向 5G 基础设施的 RF 和微波技术及系统设计的行业领导者Analog Devices, Inc.(ADI) 今日宣布推出一款面向毫米波 (mmWave) 5G 基础设施的新型解决方案,该解决方案拥有目前最高的集成度,旨在降低下一代蜂窝网络基础设施的设计要求和复杂性。此解决方案整合了 ADI 的先进波束成形 IC、上/下变频 (UDC) 和其它混合信号电路。这种优化的“波束至比特”信号链展现了只有 ADI 可提供的一组独特能力。 “毫米波 5G 是一项蕴含巨大潜力的新兴技术。” ADI公司微波通信部总经理 Karim Hamed 表示,“从头开始设计这些系统会极其困难,需要平衡性能、标准和成本方面的系统级挑战。这款
发表于 2019-05-31
ADI推出全新毫米波 (mmWave) 5G 基础设施的新型解决方案

ADI 推出用于生物和化学感测新型阻抗和恒电位仪模拟前端

  Analog Devices, Inc. (ADI), 宣布推出一款新型电化学和阻抗测量前端,可实现下一代生命体征监测装置和智能电化学传感器。AD5940模拟前端在单个芯片内集成了恒电位仪和电化学阻抗谱 (EIS) 功能,从而可在时域和频域中实现传感器测量。该器件具有用于先进传感器诊断的集成化硬件加速器、用于完成准确传感器测量的同类最佳低噪声性能,并专为“始终保持开机”的可穿戴式应用而设计。与那些有局限性、并且需要使用多个 IC 方可实现相似性能的传统分立式解决方案相比,ADI 的单芯片解决方案在系统准确度和尺寸灵活性方面拥有优势,可测量 2 引脚、3 引脚和 4 引脚电化学传感器。对于那些将高精度生物
发表于 2019-05-29
ADI 推出用于生物和化学感测新型阻抗和恒电位仪模拟前端

一文看懂ADI在汽车电子领域的布局

%,到2030年占比将进一步提高到50%。这也使得越来越多的半导体芯片厂商,开始大举杀入汽车电子市场。2016年10月,手机芯片大厂高通正式宣布470亿美元收购车用芯片大厂恩智浦半导体(可惜失败了);2016年11月,手机芯片大厂联发科也宣布进军车用芯片市场;此前在汽车电子市场影响力有限的英特尔,2017年也宣布以153亿美元价格收购ADAS(辅助驾驶)技术大厂Mobileye,希望借此开拓汽车市场。类似的例子其实还有很多。作为业界知名的模拟信号、混合信号和数字信号处理芯片厂商,ADI也很早就切入了汽车电子市场,并且正凭借越来越丰富的产品组合,提供更加全面的解决方案。据ADI中国汽车电子事业部资深战略与业务发展经理陈晟介绍,早在上世纪90
发表于 2019-05-20
一文看懂ADI在汽车电子领域的布局

五步打造战略合作伙伴,ADI助力加速迈向工业4.0

当前面临工业4.0即将落地的趋势下企业普遍存在的困惑。”在第八届年度中国电子ICT媒体论坛暨2019产业和技术展望研讨会上,ADI中国区工业自动化行业市场部经理于常涛(Roger)在其“加速迈向工业4.0”的演讲中指出。 ADI中国区工业自动化行业市场部经理于常涛(Roger):ADI助力加速迈向工业4.0 跳出这些典型困惑,与ADI一起加入工业4.0的赛道 工业4.0落地面临的普遍“焦虑” 产生焦虑,是因为趋势明确而决策难定。然而,事实上部分领先企业已经走出初期的焦虑,投入到落地的大潮中了。普华永道的一项调查表明,72%的受访者预计其公司到2020年在整合和数字化方面将达到先进水平,超过85
发表于 2019-05-10
五步打造战略合作伙伴,ADI助力加速迈向工业4.0

科创板宣布开板,三家企业提交了上市注册申请

在科创板宣布开板的当天,诞生了第三批过会企业。科创板上市委第3次审议会议召开,澜起科技、天宜上佳、杭可科技3家企业的首发上市申请全部获得上市委审议通过。此前6月5日、6月11日的2次审议会议已经产生了6家过会企业,首批过会的3家企业于6月11日提交了上市注册申请。 第三批过会的3家企业分别来自上海、北京、浙江。从行业来看,澜起科技属于计算机、通信和其他电子设备制造业,天宜上佳属于铁路、船舶、航空航天和其他运输设备制造业,杭可科技属于专用设备制造业,均为目前科创板受理企业分布较为集中的行业。 从受理时间来看,三家企业均为4月获得受理,均经历了三轮问询。 澜起科技的主营业务是为云计算和人工智能领域提供
发表于 2019-06-15
科创板宣布开板,三家企业提交了上市注册申请

小广播

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved