吉利发布新一代语音合成大模型,具备声音克隆能力

发布者:科技创新实践者最新更新时间:2024-04-13 手机看文章 扫描二维码
随时随地手机看文章

近日,吉利官方宣布星睿AI大模型又取得一项突破性技术成果—“新一代HAM-TTS语音合成大模型”正式发布。据官方介绍,新一代HAM-TTS语音合成大模型创新性地引入了文本声音学信息预测模块,能根据给定的文本,合成出自然流畅、富有情感的语音。同时,它拥有强大的声音克隆能力,仅需几秒的参考语音样本,就能复刻出逼真的声音,给用户带来真实生动的语音交互体验。

据官方介绍,新一代HAM-TTS语音合成大模型率先突破数据收集难题,将训练数据量扩增至超65万小时,将参数量扩增至8亿。此外,吉利还采取了巧妙的数据增强策略。即通过拼接、替换等方式在训练数据中人为设置“噪音”,以此提升语音合成大模型对音色的辨识能力,让合成出来的音频音色更稳定、更连贯,更接近于人声。


同时,新一代HAM-TTS语音合成大模型也具备强大的跨语言切换能力。而且,新一代HAM-TTS语音合成大模型能够根据特定场景需求,智能调节语气、语调、停顿和情感等多维度参数。


2024年1月11日,吉利正式发布星睿AI大模型。吉利星睿AI大模型以强大的星睿智算中心为算力底座,将自研基础大模型与吉利的NPDS研发体系、巨量造车全链路场景数据库深度融合,将成为汽车行业应用场景丰富、算力强大、汽车专业知识体系完备、数据与模型安全可靠的大模型。


引用地址:吉利发布新一代语音合成大模型,具备声音克隆能力

上一篇:“疯狂”堆料,车载音响竞赛还很初级
下一篇:汽车高速音视频传输车载以太网解决方案

小广播
最新汽车电子文章
厂商技术中心

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 动力系统 底盘电子 车身电子 信息及娱乐系统 安全 总线与连接 车用传感器/MCU 检测与维修 其他技术 行业动态

索引文件: 1 

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2026 EEWORLD.com.cn, Inc. All rights reserved