历史上的今天

今天是:2026年03月10日(星期二)

正在发生

2023年03月10日 | 算法模型发展的燃料,AI基础数据服务市场规模快速增长!

发布者:alpha12 来源: 电子发烧友网作者: Lemontree 手机看文章 扫描二维码
随时随地手机看文章

在产业链中,、算力和数据共同构成技术发展的三大核心要素。在当前行业发展进程中,有监督的算法,是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是有监督的深度学习算法实现的基础,训练数据早已成为算法模型发展和演进的燃料。

AI基础数据服务市场快速增长

当前,全球基础数据服务行业正处于快速成长期,市场规模具有较大的增长空间。从AI产业链的发展情况和未来发展趋势来看,中国基础数据服务行业的市场规模也将不断扩大。

一方面,随着算法模型、技术理论和应用场景的优化和创新,AI产业对训练数据的拓展性需求和前瞻性需求均快速增长;另一方面,随着行业内对训练数据需求类型的增加以及对服务标准要求的提高,产业链的专业化分工将愈加清晰,专业化的训练数据服务提供商将扮演更加重要的角色。

根据IDC预测,2025年中国人工智能市场规模有望达到184.3亿美元(约1200亿人民币)。其中,关于基础数据部分,预计中国AI基础数据服务市场规模近5年来的复合年增长率达到47%,预期2025年将突破120亿元,达到中国人工智能市场支出总额的约10%。

在当前技术发展进程中,深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的训练支撑则是深度学习算法实现的基础。训练数据越多、越完整、质量越高,模型推断的结论越可靠。因此,要使算法模型实现从技术理论到应用实践的落地过程,就需要提供大量的训练数据,对算法模型加以训练。

2021年,全球人工智能和领域最权威的学者之一吴恩达教授提出二八定律:AI研究80%的工作应该放在数据准备上,确保数据质量是最重要的工作。

然而,从自然数据源简单收集取得的原料数据并不能直接用于有监督的深度学习算法训练, 必须经过专业化的采集、加工,形成相应的工程化训练数据集后才能供深度学习算法等训练使用。目前,应用有监督学习的算法对于训练数据的需求远大于现有的标注效率和投入预算,基础数据服务将持续释放其对于算法模型的基础支撑价值。

海天瑞声为全球企业提供数据服务

海天瑞声主要从事AI训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。

自2005年成立以来,该公司始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。经过多年发展,公司已成为人工智能基础数据服务领域具有较强国际竞争力的国内头部企业,并实现了标准化产品、定制化服务、相关应用服务全覆盖。

海天瑞声所提供的训练数据涵盖语音(、语音合成等)、、自然语言等多个核心领域,全面服务于人机交互、、智能驾驶、智慧金融、智能安防等多种创新应用场景。

其产品和服务已获得字节跳动、阿里巴巴、腾讯、百度、科大讯飞、、微软、 、、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、、语音导航、搜索服务、短、虚拟人、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。

目前公司客户累计数量 740 家,覆盖了科技互联网、社交、、智能驾驶、智慧金融等领域的主流企业,教育科研机构以及部分政企机构。

最近由OpenAI推出的ChatGPT大火,微软也宣布将ChatGPT功能集成到公司的产品中,包括必应。海天瑞声日前表示,微软是公司的重要客户之一,公司向微软提供智能语音-训练数据定制服务及训练数据产品、自然语言-训练数据定制服务及训练数据产品、计算机视觉-训练数据定制服务及训练数据产品、训练数据相关的应用服务。

可以看到海天瑞声的业务已经遍布国内外,除了国内字节跳动、阿里巴巴、腾讯、百度等之外,海天瑞声也与多家海外知名科技企业合作,包括Microsoft、Meta、Sung、Google等。

海天瑞声表示,相比于境内,海外市场空间更加广阔。根据IDC数据,全球AI投入约为中国AI投入的10倍以上,广阔的市场空间意味着更多的市场参与者与更加激烈的竞争环境,过往多年公司凭借在语音方面的深厚积累,尤其是多语种方面的积累和能力,获得众多境外客户认可,公司的多语种、以及OCR数据集帮助众多海外公司进行其全球化扩张。

截至目前,公司已覆盖超过190种语种/方言,不仅包括含英、法、德、意、西、日、韩等常见语种,还包括东南亚、一带一路等国家地区的罕见多语种,尤其在亚洲多语种的服务上具备独特的竞争优势。

小结

随着ChatGPT大火,预计大模型的训练和部署将会加速,而数据作为AI产业链中的一环,重要作用不可忽视。在这个领域,国内已经有一批早早入局的企业,在技术上已经具备深厚积累,这对于国内在发展大模型技术方面来说,无疑是很好的基础。

审核编辑 :李倩

引用地址:算法模型发展的燃料,AI基础数据服务市场规模快速增长!

上一篇:ChatGPT破圈之后的思考
下一篇:2023年工业AGV/AMR 4大应用趋势解读

推荐阅读

P1.0开关接5V时,右转弯灯闪亮,P1.1开关接5V时左转弯灯闪亮。    P1.0、P1.1 开关同时接5V或接地时,转弯灯均不闪亮。    程序框图 P1.0开关接5V时,右转弯灯闪亮,P1.1开关接5V时左转弯灯闪亮。    P1.0、P1.1 开关同时接5V或接地时,转弯灯均不闪亮。    程序框图 程序 ORG 0C30H0C30 7590EF ...
IT之家3月9日消息 外媒报道,目前我们的智能手机能够实现部分的钱包功能。以Apple Pay和Google Pay为例,智能手机可以存储登机牌、会员卡,甚至是借记卡或信用卡。但很快,我们可以将驾驶执照存入智能手机中。虽然已有第三方应用可以实现存储电子版的驾驶执照,但XDA开发人员发现谷歌正在为Android设备开发IdentityCredentilalAPI,以将其集成到系统中...
单片机数据传递类指令(3)以直接地址为目的操作数的指令MOV direct,A 例: MOV 20H,AMOV direct,Rn MOV 20H,R1MOV direct1,direct2 MOV 20H,30HMOV direct,@Ri MOV 20H,@R1MOV direct,#data MOV 20H,#34H(4)以间接地址为目的操作数的指令MOV @Ri,A 例:MOV @R0,AMOV @Ri,direct MOV @R1,20HMOV @Ri,#data MOV @R0,#34H(5)十六...
1 ARINC429串行总线ARINCA29总线是一种单向广播式数据总线,采用双角屏蔽线传输信息,可由两根独立总线实现双向传输,数据传输率为:高速传输的位速率为100 Kb/s±1%,低速传输的位速率为(12.0~14.5)Kb/s±1%。ARINC429规定数据传输采用双极性归零制的三态码方式,如图1所示,即调制信号由“高”、“零”和“低”状态组成的三电平状态。双极性归零码的...

史海拾趣

问答坊 | AI 解惑

国半推出8位超高速模拟/数字转换器以低功耗实现6GSPS取样率

      美国国家半导体公司(National Semiconductor Corporation)最新推出的一系列 8 位超高速模拟/数字转换器只需耗用 3.6W 的功率便能以 6GSPS 的速度捕捉数据,将取样率提升至前所未有的高水平。型号为 ADC083000 ...…

查看全部问答∨

安防“星人物”——高清像素摄像机

经过2009年的深圳安博会,相信大家都会看到今年的一个很具有争议性的话题---百万像素高清图像显示系统.     估计对HDTV这个词不会陌生吧?高清晰度电视.     而高清晰度在安防监控系统中又代表着占用大量的传输带宽及储存容量. ...…

查看全部问答∨

【藏书阁】山东医学院 医学电子仪器原理与技术

包含内容: 第0章 医学电子仪器原理与技术 35页 第1章 医学电子仪器与基础电子电路 182页 第2章 生理参数测量仪器 86页 第3章 医学超声仪器 38页 第4章 临床检测分析仪器 56页 第5章 生理功能辅助仪器 25页 第6章 医用光学技术与仪器 37页 ...…

查看全部问答∨

数字磁罗盘磁干扰补偿方法研究[1]

数字磁罗盘磁干扰补偿方法研究[1].pdf…

查看全部问答∨

开关电源电子公式

Pin(av):额定输入功率. fac(min):交流最小频率(40-75Hz) 输入电容:Cin=0.3Pin(av)/fac(min)*Vin(min)*V²ripple(p-p) 功率电阻:Rsc=Vsc(max)/Ipk 输出电容:Cout=Iout(max)*(1-Dmin)/f*Vripple(pk-pk) 库仑定律:I=V*C/△T=>V=I*△T/C 波行周期 ...…

查看全部问答∨

关于电信号的传输~

我现在要将一个微弱的电压或电流信号传入 单片机A/D模块,由于传输距离相对于电信号大小来说比较远,请问用什么方法可以保证电信号的精度呢?…

查看全部问答∨

wince烧写问题

我自己做了一块ARM S3C2410的板,基本上按照市面上的sbc2410-2的设计做的。做完后,烧写linux没有问题。烧写wince的过程中,LCD也能显示进到wince里面,可每次重启板子,wince就不见了。可能是没写到nand flash里面去。 我的烧写步骤: 1 jtag 烧 ...…

查看全部问答∨

香水:ST有没有cortex-m0系列的片子?

香水:ST有没有cortex-m0系列的片子?有没有配套的固件库? 只玩过你们的M3系列…

查看全部问答∨

什么是Haptics?

$(\'swf_y9D\').innerHTML=AC_FL_RunContent(\'width\', \'550\', \'height\', \'400\', \'allowNetworking\', \'internal\', \'allowScriptAccess\', \'never\', \'src\', encodeURI(\'http://player.youku.com/player.php/sid/XMjk4NTg2Mzgw/v.sw ...…

查看全部问答∨

L138板子在uboot模式下如何加载usb设置

我的开发板子是L138的,上面有两个usb端口是usb1.1和usb2.0 我想实现在uboot模式下可以从u盘传输文件到板子  我在/include/configs/da850evm.h 设置了#define CONFIG_USB_DA8XX /* Platform hookup to MUSB controller */#define CO ...…

查看全部问答∨
小广播
最新机器人文章
厂商技术中心

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关:

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2026 EEWORLD.com.cn, Inc. All rights reserved