datasheet

唇语精准识别 密语传音成真

2017-12-11来源: 北京日报 关键字:唇语识别  机器视觉

唇语识别通过机器视觉技术,从图像中识别出人脸,并提取此人连续的口型变化特征,将连续变化的口型特征输入到唇语识别模型中识别出对应的发音,再计算出可能性最大的自然语言语句。

 

  只动动嘴巴,即使不出声,光看口型就知道你在说什么,这种存在于武侠剧中的桥段正在加速成为现实。日前,在乌镇第四届世界互联网大会上,基于人工智能与大数据可视分析能力的唇语识别系统能够实现“密语传音”,成为时下最吸睛、最炫酷的黑科技之一。

 

  当你说出“这首歌叫什么名字”时,机器不用收音、进行语音识别,通过识别你的唇部动作,就能准确识别语义的内容。这让不少体验后的网友感叹,“之前只知道有语音识别、面部识别,没想到还能唇语识别,有种武林高手的感觉!”

 

  据研发企业海云数据介绍,唇语识别的原理其实是使用机器视觉技术,从图像中识别出人脸,判断其中正在说话的人,并提取此人连续的口型变化特征。随后,将连续变化的口型特征输入到唇语识别模型中识别出对应的发音。最后,根据识别出的发音再计算出可能性最大的自然语言语句。

 

  那么,唇语识别的精准度如何?海云数据创始人冯一村表示,通过使用1万多小时的新闻素材对唇语识别系统进行训练,目前海云数据对英文的识别准确率在80%左右,中文准确率为71%,而国外所知的最高识别率仅为不到50%。未来,随着“语料”越来越多,唇语识别率还将获得稳步提升。

 

  相比于唇语识别的技术路径,人们更关心它将用于何处。据悉,唇语识别应用技术是目前国际研究的热门课题,可应用的领域包括场景教育、身份识别、公共安全、移动支付、军事情报等。比如,通过唇语识别,可以让无法开口说话的残障人士自由表达、让听力障碍者和不少老年人更清晰地听懂他人;通过口型支付密码,可以进行移动支付;而在军事情报领域,唇语识别则让远距离获取情报成为可能。

 

  “最初的想法是用于公安系统中,因为公安部门的视频数据占到其全部数据的95%以上,基本都是无声数据,激活视频的语义内容价值非常巨大。”冯一村说,可以预想,加入唇语识别技术后,公安人员可通过平台锁定视频中犯罪嫌疑人的语言记录,这将极大助力犯罪缉查工作的开展。

 

  值得一提的是,唇语识别背后并不是一个小众的市场。在噪音太大或只有摄像头等无法捕捉声音的场合中,唇语识别技术具备很强的实用性。比如,在公路、会议室、火车站等噪音嘈杂的场景中,唇语识别可以帮助规避音频噪声对用户说话内容获取的影响,确保交流顺畅进行。而在电梯、公路等监测场景,只有摄像头,没有麦克风,通过唇语识别技术,可以获取重要的用户讲话信息,为公共安全提供有效的支持。

 

  无独有偶,搜狗也在本届互联网大会上演示了其最新的唇语识别系统。该系统可提取人面部的三维图像信息,提取面部的动作序列,识别的效果相比以前更准确。据介绍,未来这项技术有望应用于车载系统,以及帮助听障人士“翻译”正常人语言,通过唇读技术把语音转换成文字,帮助他们更好地了解世界。

 

  业内人士预计,鉴于在公共安全、身份识别、残障教育、军事等领域的竞争力,唇语识别技术或将开启万亿级的大数据市场。但鉴于语言环境的复杂性,唇语识别真正投入实战还尚需时日,仍需进一步加强大数据、可视分析、人工智能技术等领域的融合研究。


关键字:唇语识别  机器视觉

编辑:鲁迪 引用地址:http://www.eeworld.com.cn/afdz/article_2017121111417.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:智慧医疗备受重视 安防系统满足场景需求
下一篇:以点带面 从三大热点应用市场看安防全局

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

搜狗推出“唇语识别”技术

从键盘打字到触控屏,再到现在的语音交互和手势交互,人工智能技术的发展正在促使人机交互方式向更加多元化方向变革。日前,搜狗又推出一种人机交互新技术——唇语识别,这也是业内首个公开演示的唇语识别系统。通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。与语音识别不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此在研发难度上比语音识别大得多。搜狗首创了复杂端到端深度神经网络技术进行中文唇语序列建模,通过数千小时的真实唇语数据训练而成。在非特定人开放口语测试集上,搜狗唇语识别系统已经达到60%以上的准确率,超过Google发布的英文唇语系统50%以上的准确率。在垂直场景如车载、智能家居等场景下
发表于 2017-12-18

机器视觉的产业化演进:半导体打开想象空间

  本报记者 骆轶琪 深圳报道  在人工智能技术大规模渗透到日常生活的同时,在工业领域,尤其是占据庞大市场的手机制造环节,正吸引越来越多机器视觉类公司的目光。  近日,在接受记者采访时,多位机器视觉公司创始人表示,安防领域的应用已经涌现诸多独角兽,工业场景尤其在质量检测环节,正成为下一个被瞄准的方向。尤其在粤港澳大湾区背景下,珠三角发达的制造业与集中在此的产学研能力正加快融合。  尤其国家近年对半导体行业的大力支持下,部分机器视觉类公司“瞄上”半导体封装等环节,正着手对此进行下一步的技术突破。  工业检测土壤  从计算机视觉领域来看,其产业化落地的步伐最先从与人相关开始。  10月25日,IDC中国高级研究经理卢言霞向记者分析道
发表于 2018-10-26

OmniVision推出高性价比、高分辨率全局快门图像传感器

行业领先的数字图像解决方案开发商豪威科技公司(OmniVision Technologies)25日发布旗下全局快门图像传感器家族的两款新型高分辨率产品——OG02B1B/OG02B10和OV9285。这两款新型传感器旨在提供具高性价比的解决方案,适用于各种消费类和工业机器视觉应用。尤其,致力于为高速增长的市场领域(如AR/VR耳机和配件、工业自动化、机器人、农业无人机和3D建模等)开发新产品的OEM厂商将受益于这两款具更高分辨率的全局快门图像传感器,它们可迅速捕捉快速移动或远距离目标的精确影像,同时消耗极低的功耗。“由于受工业自动化需求增长以及AR和VR等新型应用领域的推动,机器视觉领域增长强劲。与此同时,计算机成像算法变得
发表于 2018-09-25

海康机器人发布X86开放平台 打造一体化视觉系统

海康机器人发布X86开放平台,面向全球用户提供图像采集、数据处理、显示、通讯输出的一体化硬件方案。用户可基于此快速打造内嵌自有算法的智能相机。相机内置Intel E3845四核1.91GHz CPU,展现高效的处理能力,基于x86平台的组件化Windows Embedded Standard 7所具有的强大兼容性,可方便、简易地实现算法和软件移植。丰富的软件支持和API兼容性,让使用不同开发语言的集成和开发更加容易。系统设计方面,选用航空插头连接器来拓展IO、网络等功能,配以完全密封的防水防尘外壳,使整机防护等级达到IP67水平。X86开放平台可针对不同行业开辟多种应用,包括3C制造业的OCR识别、视觉行业的读码应用、汽车零部件
发表于 2018-09-10

机器视觉一路升温,安防企业吹响号角

最近几年,机器视觉作为人工智能的一个分支备受业内人士的高度关注,纵观机器视觉在工业自动化市场上的表现,其产品增速持续趋居高位,呈蓬勃发展的态势。国机器视觉联盟主席潘津接受采访时表示:“国内的机器视觉技术开始较晚,但是发展进程很快,国内的视觉产业发展十分迅速,短短十几年时间就追赶上国际水准。”据该联盟的统计数据显示:2015年机器视觉产业创造30多亿的产值,工业智能化的大趋势促使机器视觉产业在2017年创造了60多亿的产值,短短两年,产值翻了一番。机器视觉在安防领域的应用智能视觉分析技术是指计算机图像视觉分析技术,计算机图像视觉技术是人工智能(AI,Artificial Intelligent)研究的分支之一,它能够在图像及图像描述
发表于 2018-09-03

机器视觉对线缆市场有什么影响?

机器视觉技术是计算机学科的一个重要分支,自起步发展至今,机器视觉已经有30多年的历史。其功能以及应用范围随着工业自动化的发展逐渐完善和推广。随着应用需求空间扩大以及技术进步,受众多行业需求促进,“中国制造2025”国家政策推动,机器视觉在我国进入了一个快速发展时期。2017年机器视觉市场规模将近70亿元,同比增长了13.4%,约占全球市场15%的份额,预计到2021年市场规模可达115亿元。中国正在成长为继美国、日本之后的全球第三大机器视觉市场,其应用领域几乎涵盖了国民经济发展的各个行业,而工业领域是应用最大的领域。机器视觉除了不断扩大的市场规模,新标准和新技术正以前所未有的速度发布,也佐证了市场的一片红火。 机器视觉
发表于 2018-08-26

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved
pt type="text/javascript" src="//v3.jiathis.com/code/jia.js?uid=2113614" charset="utf-8">