利用深度学习和计算机视觉进行面部表情分析

2017-08-12 19:33:11编辑:鲁迪 关键字:深度学习  计算机视觉  面部表情

识别面部表情和情绪是人类社交初期阶段的一项基本且非常重要的技能。人类可以观察一个人的面部,并且快速识别常见的情绪:怒、喜、惊、厌、悲、恐。将这一技能传达给机器是一项复杂的任务。研究人员通过几十年的工程设计,试图编写出能够准确识别一个特征的计算机程序,但不得不反复重新开始,以识别出只有细微差别的特征。 如果不对机器进行编程,而是教会机器精确识别情绪,这样会如何呢?

深度学习技能对于降低计算机视觉识别和分类的错误率展现出了巨大的优势。在嵌入式系统中实施深度神经网络(见图1)有助于机器通过视觉解析面部表情,并达到类似人类的准确度。

 

图1. 深度神经网络的简单例子

 

神经网络可通过训练而识别出模式,而且如果它拥有输入输出层以及至少一个隐含的中间层,则被认为具有“深度”识别能力。每个节点从上一层中的多个节点的加权输入值而计算出来。这些加权值可经过调整而执行特别的图像识别任务。这称为神经网络训练过程。

例如,为了训练深入神经网络识别出面带开心的照片,我们向其展示开心的图片作为输入层上的原始数据(图像像素)。由于知道结果是开心,网络会识别图片中的模式,并调整节点权重,最大限度减少开心类别图片的错误。每个显示出开心表情并带有注释的新图片都有助于优化图片权重。凭借充足输入信息的训练,网络可以摄入不带标记的图片,并且准确地分析和识别与开心表情相对应的模式。

深度神经网络需要大量的计算能力,用于计算所有这些互连节点的权重值。此外,数据内存和高效的数据移动也很重要。卷积神经网络 (CNN)(见图2所示)是当前针对视觉的深度神经网络中实现效率最高的。CNN之所以效率更高,原因是这些网络能够重复使用图片间的大量权重数据。它们利用数据的二维输入结构减少重复计算。

 

图2. 用于面部分析的卷积神经网络架构(或示意图)举例

 

实施用于面部分析的CNN需要两个独特且互相独立的阶段。第一个是训练阶段。第二个是部署阶段。

训练阶段(见图3所示)需要一个深度学习框架 – 例如Caffe或TensorFlow – 它采用CPU和GPU进行训练计算,并提供框架使用知识。这些框架通常提供可用作起点的CNN图形范例。深度学习框架可对图形进行微调。要实现尽可能最佳的精确度,可以增加、移除或修改层次。

 

图3. CNN训练阶段

 

在训练阶段的一个最大挑战是寻找标记正确的数据集,以对网络进行训练。深度网络的精确度非常依赖训练数据的分布和质量。面部分析需考虑的多个选项是来自面部表情识别挑战赛 (FREC) 的情感标注数据集和来自VicarVision (VV) 的多标注私有数据集。

部署阶段(见图4所示)针对实时嵌入式设计,可在嵌入式视觉处理器上实施,例如带有可编程CNN引擎的Synopsys DesignWare® EV6x嵌入式视觉处理器。嵌入式视觉处理器是平衡性能和小面积及更低功耗关系的最佳选择。

 

图4. CNN部署阶段

 

标量单元和向量单元采用C和OpenCL C(用于实现向量化)进行编程,而CNN引擎不必手动编程。来自训练阶段的最终图形和权重(系数)可以传送到CNN映射工具中,而嵌入式视觉处理器的CNN引擎可以经过配置而随时用于执行面部分析。

从摄像头和图像传感器捕捉的图像或视频帧被送入嵌入式视觉处理器。在照明条件或者面部姿态有显著变化的识别场景中,CNN比较难以处理,因此,图像的预处理可以使面部更加统一。先进的嵌入式视觉处理器和CNN和异构架构允许CNN引擎对图像进行分类,向量单元会对下一个图像进行预处理 – 光线校正、图像缩放、平面旋转等,而标量单元则处理决策(即如何处理CNN检测结果)。

图像分辨率、帧率、图层数和预期精确度都要考虑所需的并行乘累加数量和性能要求。Synopsys带有CNN的EV6x嵌入式视觉处理器可采用28nm工艺技术以800MHz的速率运行,同时提供高达880 MAC的性能。

一旦CNN经过配置和训练而具备检测情感的能力,它就可以更轻松地进行重新配置,进而处理面部分析任务,例如确定年龄范围、识别性别或种族,并且识别发型或是否戴眼镜。

总结
嵌入式视觉处理器上运行的CNN开辟了视觉处理的新领域。很快,我们周围能够解析情感的电子设备将很常见,例如检测开心情绪的玩具,以及能够通过识别面部表情而确定学生理解情况的电子教师。深度学习、嵌入式视觉处理和高性能CNN的结合将很快将这一愿景变为现实。


关键字:深度学习  计算机视觉  面部表情

来源: 互联网 引用地址:http://www.eeworld.com.cn/afdz/article_2017081210954.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:一种多功能存储器芯片测试系统的设计与实现
下一篇:美媒:面部识别正在中国普及,这家创业企业火了

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

2018年安防技术发展趋势

作伙伴增加价值。  3、深度学习与机器学习  目前我们已开始实现深度学习和机器学习架构的所有优势:拥有海量的数据可供分析;拥有强大的处理能力,能够在合理的时间范围内完成分析;拥有先进的算法以及大量案例可供借鉴。当某些非凡的深度学习应用与图像解读、语音识别和决策支持互相关联时,安防领域的分析潜力便不言而喻。  在相对较基础的层面上,深度学习应用将可改善视频运动检测、人脸识别、个体追踪和误报控制,能有助于系统的设计、配置、优化和设备管理。此外,预测分析也将迎来前所未有的机遇,最终能够预防各种事件的发生,包括恐怖攻击、滑倒与坠落事故、交通问题和入店行窃等。  4、个性化与隐私  提供高度个性化的服务是深度学习的潜在应用之一。设想在某个零售
发表于 2018-07-05 20:34:37

百度释出新AI算法 可提升肿瘤辨识效率与正确性

百度硅谷AI Lab发表新的深度学习算法NCRF(Neural CondiTIonal Random Field),据称可改善目前活体组织切片检查WSI(Whole Slide Image)分析的结果,协助病理学家提升肿瘤辨识效率与正确性。百度并以开源方式,在GitHub释出该算法。据报导,WSI是数GB大的影像档,通常包含数十亿画素(pixel),病理学家必须仔细检视病理切片影像寻找肿瘤细胞,但微转移(micrometastases)的小群肿瘤细胞直径可小到1,000画素,因此要从巨大的病理切片影像中有效分析辨识犹如大海捞针。即使运用深度学习算法,也仅能检验WSI影像的一部分。目前许多WSI的深度学习算法,选择将影像
发表于 2018-07-05 19:03:49
百度释出新AI算法 可提升肿瘤辨识效率与正确性

闭眼变睁眼、白昼变夜间、识别假照片,随聊影响深远的图像算法

这两天,在一个根本不存在的社交平台FB上推出了一个新功能,可以让拍照时不小心闭上的眼睛,重新睁开,效果如下:  事实上Photoshop Elements 2018里也有一个后期睁眼的功能,下面是闭眼原图、PS睁眼和FB睁眼的对比:  非常明显,FB的睁眼方案真实度更高,一个社交平台居然干翻了几乎是最权威的摄影后期软件,这充分说明了一个问题:在图像处理端,我们已经进入到了算法为王的时代,迷信“权威”并不一定可取。  FB睁眼术的背后,是基于名为“Generative Adversarial Networks” ,简称GANs的深度学习模型,这套算法目前在NVIDIA的支持下,于图形处理相关领域已经有了相当多的应用,比如这张GIF
发表于 2018-06-28 18:13:31
闭眼变睁眼、白昼变夜间、识别假照片,随聊影响深远的图像算法

专访UIUC陈德铭教授:「万能芯片」FPGA与深度学习

机器之心原创作者:邱陆陆人工智能的风潮从技术一路蔓延到硬件,让「芯片」成为今年行业里盛极一时的主题。人们关注通用芯片领域里 CPU 和 GPU 不断刷新的基准(benchmark),更对专用芯片(ASIC)领域不同场景下不断问世的解决方案表示出了空前的热情。 而众所周知,在专用芯片与通用芯片中间,还有一个更为灵活,也更为神秘的领域:FPGA。无论是英特尔天价的收购还是微软与 IBM 雄心勃勃的计划,都让人对其更加好奇。而「万能芯片」的名称,以及多样化的职责范围:它可以是智能手机里不起眼的一个小组件,也可以是数千美金一块的开发板,也让人对其真面目更加疑惑。 FPGA 与深度学习的关系究竟是什么?它适合
发表于 2018-06-25 11:42:13
专访UIUC陈德铭教授:「万能芯片」FPGA与深度学习

图玛深维创始人钟昕:让深度学习进入智能医疗

合伙人孙琦、亿欧公司副总裁高昂、亿欧公司副总裁兼亿欧智库研究院院长由天宇等。大会上,图玛深维创始人兼CEO钟昕发表了《让深度学习进入智能医疗》的主题演讲。以下为现场演讲速记:大家好,我是图玛深维的钟昕,也是公司的创始人,今天能来到这里跟在座的大家分享我们公司对于人工智能医疗影像的一些体会,我非常荣幸。我今天的演讲主题是让深度学习进入智能医疗。Al和医疗的结合说一下智能医疗,智能医疗在哪几个应用比较多,我们说疾病的预防,这是一个非常重要的领域,辅助诊疗这也是非常大的方向。我们做的医疗影像的处理,这是一个非常热的,也是非常大的应用方向,包括我们的健康管理,包括我们的饮食,日常生活习惯,这些应该放在智能医疗大的方向来。AI跟这些方向结合
发表于 2018-06-22 19:15:03

深度学习完了?AI寒冬又要来了?

几天之前,国内科技媒体,尤其是AI媒体之间刷屏了一篇文章。其原作者是机器视觉专家Filip Piekniewski ,标题叫做《AI Winter is Well on its Way》。这篇文章在国内有各种翻译的版本,并配了很多标题。但主旨差不多是一样的:深度学习完了!AI寒冬又要来了! 无论是国内还是国外,在社交媒体上“看热闹就不嫌事大”属于一种基本操作。所以这篇文章还是短期内引发了大量关注。比如我们会看到国内一些媒体以这篇文章为依据,开始提出人工智能要完了;人工智慧脱下皇帝新衣等等观点。 可是这篇文章究竟是否靠谱呢?用大神Yann LeCun的评价,这篇文章的观点属于“非常无知very
发表于 2018-06-15 20:45:29
深度学习完了?AI寒冬又要来了?

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved