历史上的今天

今天是:2025年06月21日(星期六)

2019年06月21日 | 新技术让虚拟主持人轻松上岗

发布者:CelestialMagic 来源: 中国科技网作者: Lemontree 手机看文章 扫描二维码
随时随地手机看文章

日前,2019北京世园会正在如火如荼的进行,园中游客涌动,线上观众也“络绎不绝”。而大部分线上观众应该也都认识了两位吉祥物——小萌芽和小萌花。

两位虚拟主播拥有憨态可掬的3D胖娃娃形象、逼真的动作表情,说话时连口型都与真人无异。据统计,自世园会开始后,由杭州相芯科技有限公司与北京电视台联合制作的“小萌花&小萌芽带你看世园”这一讲解世园会亮点的视频,在微博、秒拍等多个播放平台目前点击量已经接近1000万。虚拟主播技术乘着世园会的东风,再一次刷了一波存在感。

身兼多职 虚拟主播华丽变身

虚拟主播最早可以追溯到虚拟主持人的时代。

2001年,英国PA New Media公司推出了世界上第一个虚拟主持人阿娜诺娃。这个只有头部动画、表情也略显僵硬的2D虚拟人物,凭借着可快速制作视频、24小时持续播报的特点,在全球刮起了一阵打造“虚拟主持人”的飓风。

“美、韩、日纷纷跟进,我国央视在2004年也推出了国内首位虚拟电视节目主持人——小龙。它采用三维形象技术,拥有高挑的身材,集合了刘德华、梁朝伟和金城武的‘脸部精华’,并可单独主持栏目。”杭州相芯科技有限公司(以下简称相芯科技)产品经理马骁驰在接受科技日报记者采访时表示,但其制作成本其实远超聘请一位专业真人主持,因此这把星星之火还未燎原便悄然黯淡下来。

几年后,人工智能的兴起给各行各业带来了新的视角,虚拟主持人摇身一变,升级成了虚拟主播。

“除了强硬的主持功底,虚拟主播将人工智能与三维虚拟形象技术结合起来,可以极大简化策划、编辑、主持、制作等一系列工作,快速提升播报效率。”马骁驰告诉记者,编辑人员仅需输入文字,很快就能自动生成虚拟主播的视频,“一点不用操心”。且相比过去的虚拟主持人,虚拟主播无论是表情、神态,还是形象、动作,都更接近于真人状态。

降低门槛 语音动画合成让视频制作更简单

可以预见,虚拟主播在传统媒体、IP运营、自媒体视频内容制作等领域具有“通吃”的美好前景,小萌芽和小萌花掀起的热潮就是很好的佐证。

这两只萌物是如何制作出来的?“该虚拟主播的核心技术是语音动画合成技术,其融合了人工智能和计算机图形学两方面原理。”马骁驰表示。

在他看来,这样解决了打造虚拟主播的三大难点——采用深度学习算法精准理解语音中的文字信息;自主研发的人脸表情肌肉单元技术能够准确地驱动面部表情和口型动作,提升表达的生动性和真实性;通过人工智能算法展现出口型、表情的过渡性动画,保证了说话字和词之间的连续性和自然性,最终呈现出完整的虚拟主播效果。

在真人形象领域,传统的视频制作,通常需要专业摄影师、剪辑师、主持人等一大批专业制作人员,成本居高不下;在动画模型领域,传统动画制作都是原画师一帧一帧来绘制模型表情和口型动作,不仅成本很高,还难以做到语音和口型匹配,通常至少需要30张图片才可以制作1秒的动画内容;动捕技术则需要真人来实时扮演。

“如果采用语音动画合成技术,仅需具备文字编辑能力的运营人员就可以单独制作视频,且可以极大提高视频新闻制作的时效性,并能够自动实现动画模型的口型和表情驱动,降低了动画制作门槛。”马骁驰说。

多线挖掘 尖端服务落户寻常人家

在整个传媒行业向融媒体大踏步前进的背景下,各大媒体都在向移动端发力,各类短视频、H5、小程序等新的传播形态频出。

在马骁驰看来,虚拟主播技术加持后,各大媒体可实现24小时播报,且呈现方式都更具科技感、新颖性,更符合年轻受众的喜好。

作为新兴事物,这一技术还有更多的潜力有待挖掘。

现阶段的动画形象都是制作方事先设置好的固定形象,然而在这个人人都能当主播的时代,能否让用户根据自己的相貌生成虚拟形象呢?

“我们计划采用3D模型的技术,将生成与驱动打包成一整套解决方案。让用户和客户可以自主通过照片生成形象,并将该形象设置成虚拟主播,来实现更好的人机交互体验。并且打造一套SaaS服务工具平台,提供从前端编辑界面到后端视频制作的一站式服务,客户登录账号后,可通过输入文字、插入动作、插入视频等手段快速制作主播视频。届时,对于普通用户高不可及的虚拟主播技术也能‘飞入寻常百姓家’了。”马骁驰表示。

引用地址:新技术让虚拟主持人轻松上岗

上一篇:智能机器人产业园创新领先于京津冀地区
下一篇:机器人登台 盘点618电商大促背后的无名英雄

推荐阅读

8051单片机内部256字节RAM,低128字节既可直接寻址,又可间接寻址,高128字节RAM只能间接寻址(直接寻址方式下,高128字节被映射到SFR特殊功能寄存器)。内部RAM中包含16字节可位寻址区域,该区域起始地址为20H。内部RAM存储区被分为三种不同的存储区类型:data,idata,bdata。1)data指低128字节,以直接寻址方式访问存在该区域的变量。2)idata指全部25...
bsp_exti.h#ifndef __EXTI_H#define __EXTI_H#include "stm32f4xx.h"//引脚定义/*******************************************************/#define KEY1_INT_GPIO_PORT GPIOA#define KEY1_INT_GPIO_CLK RCC_AHB1Periph_GPIOA#define KEY1_INT_GPIO_PIN GPIO_Pin_0#define...
一、行字符分割线1、如下图所示,默认情况下红线的边距设置为80个字符,应该是为了代码的整洁美观最好代码每行都能控制在80个字符以内。但,若我就喜欢代码写的老长了,80个字符无法满足我,或者纯粹就是想把这根红线挪远一点,怎么办?好办,再看下下张图。2、选择任务栏的Tools -> Options3、主要是修改Right Margin的值,一般多数会修改为120。二、...
英特尔公司处理器的市场份额明年可能会降至新低,这在很大程度上是因为苹果公司决定自己的Mac电脑中不再使用英特尔处理器,而是使用自主研发的处理器Apple Silicon。 苹果去年曾宣布,它将开始为期两年的过渡期,将其所有的Mac电脑、台式电脑和笔记本电脑,转变成使用自己自主研发的处理器Apple Silicon。预计苹果将于明年完成这一转变。截至目前为止,苹...

史海拾趣

小广播
最新机器人文章
厂商技术中心

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关:

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2026 EEWORLD.com.cn, Inc. All rights reserved