海康威视研究院院长浦世亮谈深度学习+安防

2017-03-28 18:00:58来源: EEWORLD 关键字:海康威视  深度学习

  备受关注的计算机视觉国际大赛——ImageNet 大规模图像识别挑战赛(ILSVRC2017)已经拉开帷幕,今年的比赛分为四个主要项目:定位、识别以及视频中物体识别和Tester Challenges。去年在比赛中拿下场景分类关键的海康威视首席专家浦世亮近日接受新智元专访,他谈到了去年参赛详情和技术细节。他也对深度学习与安防行业现状的10个问题进行了深入解读。下面就随安防电子小编一起来了解一下相关内容吧。

 根据 ImageNet官网的最新消息,今年的 ImageNet 大规模图像识别挑战赛(ILSVRC2017)已经拉开帷幕。

  今年的比赛项目分为4个:

  物体定位

  物体识别

  视频中物体识别

  Tester Challenges

  官网特别提示:已经使用了几种算法的参与者可以每个算法提交一个结果(最多5个算法)。算法参数的变化不构成不同的算法(遵循PASCAL VOC中使用的过程)。

  去年的 ImageNet上,来自中国的团队大放异彩:CUImage(商汤和港中文),Trimps-Soushen(公安部三所),CUvideo(商汤和港中文),HikVision(海康威视),SenseCUSceneParsing(商汤和港中文),NUIST(南京信息工程大学)分别拿下多个项目的冠军。

  

 

  其中,海康威视拿下了场景分类(Scene Classification)的冠军。具体赛果见下表:

 

  另外,在物体探测任务上,海康威视也有亮眼表现:

 

 

  

 

  海康威视这家做安防出身的企业目前在计算机视觉上已在国际上取得领先的地位,除了ImageNet 外,在PASCAL、KITTI和MOT等竞赛中都有亮眼表现。

  根据海康威视首席专家浦世亮介绍,在PASCAL VOC2012目标检测上,海康威视基于Faster R-CNN深度学习目标检测算法mAP性能达到87.9,排名第一,领先盘踞榜首近一年的第二名微软4.1个点,刷新纪录。

  新智元最新一期的AI领军人物专访采访到了海康威视首席专家、研究院院长浦世亮,他分享了海康威视夺冠 ImageNet 背后的技术,谈到 2017年,深度学习在复杂网络设计、模型压缩方向的研究依然是热点,深度学习和LSTM、增强学习的结合进一步加强。另外,针对当下安防行业的智能+现状,他也提出了独特的见解。

  

  浦世亮 海康威视研究院院长

  浦世亮,法国国家科学研究院(CNRS)博士,浙江大学理学博士,现任海康威视首席专家、研究院院长,负责公司在人工智能及大数据领域的技术研究。浦世亮带领研究院研发的Smart 265编码技术、目标结构化算法、车牌识别算法、人脸识别算法、视频检索引擎、多传感器融合等技术,被广泛应用于公共安全、金融、交通、司法、零售、智慧城市等多个领域。

  海康威视 ImageNet 2016 夺冠背后技术详解

  去年 ImageNet 大规模图像识别挑战赛(ILSVRC)中,海康威视(HikVision)拿下场景分类项目的冠军。你能具体介绍一下这一比赛项目吗?海康威视夺冠的技术核心是什么?

  浦世亮:ImageNet 场景分类任务采用MIT发布的 Place2 数据集,其目的是对图像中存在的场景进行识别。该数据集拥有365个类别的场景目标,800多万张已经标记的训练样本。相对于普通的ImageNet图像分类任务,场景分类任务的难点在于其数据分布非常不均衡,每个类别的数据从5000 到 30000不等,每张图像都可能在不同的场景描述和相对更模糊的场景标签。

  场景分类技术,对于视频产业及其应用领域有比较重要的应用价值,基于对场景的理解有助于我们的系统更好地对于视频中的信息进行理解和应用。

  海康威视从成立之初就专注于计算机视觉领域技术的研发,13年就开始深度学习的技术布局,实现了一整套的深度学习训练框架,并探索了深度神经网络的优化算法,包括对网络参数初始化、超参数搜索、正则项、损失函数、流形优化理论等的研究。

  另外,我们还从信号调制方向切入,围绕信号在网络前向反向传输中的保范性(norm-preserving),探索深层网络优化的可行性与新方向。

  浦世亮:深度学习+安防 10 问

海康威视研究院院长浦世亮谈深度学习+安防

  2016年10月24日,海康威视在北京召开“AI+:感知未来、融合发展”主题论坛,新智元受邀出席。

  10月24日,在北京召开的“AI+: 感知未来、融合发展”主题论坛暨海康威视新品发布会。海康威视总裁胡扬忠介绍,深度学习技术可谓安防行业的“颠覆性力量”,具体如何理解呢?

  浦世亮:在SDT安防大数据时代,面对井喷式增长的视频监控数据量,只停留在浅层次分析识别的传统智能算法,已无法满足深层次数据价值挖掘的需求。显而易见,我们需要有更深层次的智能,应用人工智能可以帮助我们做到这一点,而这其中的关键点便是深度学习算法的应用:

  准确率更高,应用深度学习算法的深度智能设备,可以自行提取更多更详细、更微小的特征,从而使得识别分类对象的准确率更高,也就是说:深度学习让智能有了质的飞跃;

  环境适应性更强,同样是环境特征的提炼,深度学习算法可以自行提取更丰富、更适合的特征参数,从而达到更强的抗环境干扰能力。这就意味着,深度学习的产品可以应用到更广泛的环境当中;

  识别种类更丰富,理论上只要有足够多的样本进行训练,深度学习能够实现比较精准的目标分类识别,自主特征识别的特点,又让深度学习特别适用于抽象、复杂的关于人的特征、行为的分析领域。

  视频分析是安防中一个非常重要的技术。那么深度学习是如何对视频进行分析的?其中的技术难点主要存在于什么地方?

  浦世亮:深度学习技术主要是利用深度神经网络,对视频关键帧信息进行逐层特征抽象,在此基础上,提取目标的结构化信息,并利用各关键帧的信息,进行前后有效关联,从而形成对视频中目标行为或事件发生的综合判断。其技术难点主要体现在海量数据应用、高性能训练、推理平台,以及适合安防领域的高效模型设计上。

  安防数据99%都是非结构化的,那么你们是如何利用这些数据?有没有比较便捷的办法,把这些数据变成结构化的?

  浦世亮:原始的安防数据几乎都是以非结构化的面目呈现,无法直接利用。针对这个业内普遍痛点,海康威视推出了基于深度学习技术的全系列智能安防产品家族,涵盖“深眸”系列智能摄像机、“神捕”系列智能交通产品、“超脑”系列智能NVR、“脸谱”系列人脸分析服务器等等。“‘深眸’系列专业智能摄像机依托强大的多引擎硬件平台,内嵌专为视频监控场景设计优化的深度学习算法,具备了精准的安防大数据归纳能力,实现了在各种复杂环境下人、车、物的多重特征信息提取和事件检测。将非结构化信息转为结构化信息,将打通大数据入口,从而为后续关键数据挖掘铺平了道路。

  目前实际应用中,视频人脸识别的准确率能做到多少?

  浦世亮:人脸识别的准确率与多个因素相关,与算法的先进性,产品形态,应用方式及场景架设相关。现有的人脸识别技术的准确率在多种应用场景下都已经达到了实用的阶段。海康威视打造了“深眸”系列智能摄像机、人证比对终端等,首先在产品形态应用方式,场景架设上保障了人脸识别的高精度应用。我们在应用中不断迭代我们的算法,使我们的算法准确率不断提升。

  在实际应用中,摄像头采集到的安防数据,有多少还需要人工的分析?我们离真正的全自动化还有多远。

  浦世亮:安防人工智能和应用需求相关,有一些应用已经达到了完全的自动化。有一些安全等级较高,准确率要求较高的应用,还需要人工参与。

  除了人脸,其他的生物特征,比如瞳孔识别,这些技术在安防领域的应用有多大?

  浦世亮:技术的发展和落地是有过程的,当前人脸识别比较火,主要是技术发展到了可以达到实际应用的水平。

  瞳孔识别的标准说法是虹膜识别,对于图像采集的要求是非常高的,需要利用红外补光,而且需要虹膜区域分辨率达到100像素左右,当前主要用在金库等安保等级较高的场景,需要人做一定的配合。

  当然我们也看到相应技术在进步,比如利用高分辨率的摄像头,结合一些自动调整策略,能够把虹膜识别在安检时用上,采集距离达到1米左右,1秒左右完成一个人的通关。

  所以说,虹膜识别等其他的生物特征识别技术当前只能在一些特定的场合应用,随着技术进步,这些技术的应用场合也会扩大,但是什么时候能够像人脸识别一样广泛应用,就需要看特定技术的未来发展情况。

  你如何看待 “开源”这一现象,海康威视有使用开源算法或者开源数据吗?

  浦世亮:在信息共享越来越发达,信息获取越来越便利的时代大背景下,开源是对信息共享的最好诠释。从更加具体的层面来看,人工智能正是由于各大研究机构,对于数据集、算法、论文、技术报告的不同程度的信息共享,间接地加速了这一领域的技术交流与技术的更新迭代。

  海康威视会研究跟踪开源技术,并且我们也会通过发表学术论文的方式对开源技术做出贡献。

在行业生态上,海康威视如何与

[1] [2]

关键字:海康威视  深度学习

编辑:李强 引用地址:http://www.eeworld.com.cn/afdz/article_2017032810395.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:人工智能+安防的五大应用场景和四大问题
下一篇:巨头逐鹿智能家居市场 人工智能扮演重要角色

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利
推荐阅读
全部
海康威视
深度学习

小广播

独家专题更多

东芝在线展会——芯科技智社会创未来
东芝在线展会——芯科技智社会创未来
2017东芝PCIM在线展会
2017东芝PCIM在线展会
TI车载信息娱乐系统的音视频解决方案
TI车载信息娱乐系统的音视频解决方案
汇总了TI汽车信息娱乐系统方案、优质音频解决方案、汽车娱乐系统和仪表盘参考设计相关的文档、视频等资源

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2017 EEWORLD.com.cn, Inc. All rights reserved