芯原戴伟进:大模型已经来到了边缘

发布者:EEWorld资讯最新更新时间:2024-06-13 来源: EEWORLD作者: 付斌关键字:芯原  NPU  IP 手机看文章 扫描二维码
随时随地手机看文章

6月13日,在芯原AI专题技术研讨会上,芯原执行副总裁、IP事业部总经理戴伟进分享了大模型时代,边缘计算变革的机遇与挑战。



“大模型已经来到了边缘。”戴伟进表示,AGI大模型正在从AI Everywhere走到AI for Everyone。各行各业都在推广大模型,现在数据中心正在将大型人工智能模型引入嵌入式系统,首先落地的边缘设备包括手机、AI PC、汽车。



具体到芯原边缘端的产品,神经网络处理器 (NPU)方面, 已在全球累积出货超过1亿颗,已被72家客户用于其128款人工智能芯片中,拥有超过10个市场应用领域


图形处理器 (GPU) 方面,已在全球累积出货近20亿颗,经过近20年的嵌入式市场耕耘,目前芯原已经拥有70项国内外专利,近千万辆汽车搭载了芯原的IP。芯原GPU得到了各种广泛的应用,其核心技术在于图形运算及渲染、 3D 建模、2D或 3D图形加速等图形处理,适用于大型并行运算应用,以及云游戏、大型桌面游戏。


视频处理器 (VPU)方面,已经达到全球领先水平,该产品能够利用AI赋能智能视频处理,实现预测性视频质量优化,专用视频处理单元,可以实现高密度、超低时延流媒体,同时具备成本效益规模,帮助视频协作、云游戏以及交互式流媒体不断加速。


芯原AI-Computing IP 产品覆盖数据中心、边缘服务器、嵌入式设备三个场景,包括VIP9X00 NPU IP、CC8X00 GPGPU IP、GC9X00AI NPU+GPU IP、CCTC-MP Tensor Core GPU IP。



在软件框架上,芯原针对图形、通用GPU、AI三大方向优化,结合芯原的Acuity工具包,这款强大的IP支持含PyTorch、ONNX和TensorFlow在内的所有主流框架。



芯原的NPU IP拥有全球领先的性能,实际测试,可以在2秒以下处理20步Stable diffusion 1.5,LLaMA2 7B则达到了20 Tokens/s。



早在第十三届芯原CEO论坛上,芯原就对大模型的未来进行了五大预测:

  • 与无差异化的多模态大模型相比,以语言为基础的多模态大模型会成为主流;

  • 2028年,中国基础大模型的数量将少于10个;

  • 2028年,用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡;

  • 2026年,内置AIGC的手机将成为中高端手机的主流,是中高端手机换机的主驱动力;

  • 2026年,全球双目全彩AR眼镜出货量将突破1,000万台。


在Chiplet方面,针对AIGC应用,芯原设计开发所需的平台化的Chiplet方案及相关技术,并提供从Chiplet、Die-to-Die接口、封装到软件的整体解决方案。


回顾历史,2001年芯原在上海成立,成为落地张江的第一批芯片设计公司之一。2020年芯原股份在科创板上市。


截止至2023年12月底,公司员工总数为1,864人,其中89%为研发人员;张江716人,成都781人,南京229人。2022年35%销售收入来自境外;95%研发人员在国内。


目前,芯原的半导体IP授权业务销售收入达到全球第七,在中国则达到第一,知识产权授权使用费收入全球第五,IP种类全球第二。

具体从每种芯片来看,2023年全年,在芯原IP授权业务收入中 (包括知识产权授权使用费、特许权使用费) ,图形处理器GPU IP,神经网络处理器NPU IP和视频处理器VPU IP收入占比合计约72%。


芯原提供芯片设计平台即服务(Silicon Platform as a Service, SiPaaS),即从无制造 (Fabless) 到轻设计 (Design-lite)。从2016到2019,4年4代产品成功流片与量产,第一代从规格定义到流片16个月,后两代从规格确定到流片9个月,首次流片即量产。


此外,芯原还提供一站式设计服务。芯原拥有14nm/10nm/7nm/5nm FinFET和28nm/22nm FD-SOI工艺节点芯片的成功流片经验,同时已有5nm SoC一次流片成功,多个一站式服务项目正在执行,可提供包含软件支持的整体解决方案,设计能力获得全球知名企业客户的认可,且晶圆厂中立。

关键字:芯原  NPU  IP 引用地址:芯原戴伟进:大模型已经来到了边缘

上一篇:嵌入式技术正在大变革
下一篇:芯原查凯南:NPU如何推进嵌入式智能设备发展

推荐阅读最新更新时间:2026-02-25 18:13

超低能耗NPU可为移动端大语言模型推理提供超40 TOPS算力
具备高能效比的架构,广泛适用于智慧手机和AI PC等终端设备 2025年6月9日,中国上海—— 芯原股份 今日宣布其超低能耗且高性能的神经网络处理器(NPU)IP现已支持在移动端进行大语言模型(LLM)推理,AI算力可扩展至40 TOPS以上。 该高能效NPU架构专为满足移动平台日益增长的生成式AI需求而设计,不仅能够为AI PC等终端设备提供强劲算力支持,而且能够应对智慧手机等移动终端对低能耗更为严苛的挑战。 芯原的超低能耗NPU IP具备高度可配置、可扩展的架构,支持混合精度计算、稀疏化优化和并行处理。其设计融合了高效的内存管理与稀疏感知加速技术,显著降低计算负载与延迟,确保AI处理流畅、响应迅速。该NPU支持数百种A
[网络通信]
<font color='red'>芯</font><font color='red'>原</font>超低能耗<font color='red'>NPU</font>可为移动端大语言模型推理提供超40 TOPS算力
查凯南:NPU如何推进嵌入式智能设备发展
6月13日,在芯原AI专题技术研讨会上,芯原NPU IP研发副总裁查凯南表示:“大模型对于现在最大的颠覆性在于,端侧模型和云端模型可以通过自然语言进行交互,显著提升智能效果。” 不过,云端和边端的分工有所不同。云端大多使用的是超级大模型,通常在70B以上,可能需要几百甚至几千张卡进行计算,同时云端能够同时胜任大模型的推理和训练任务。边端在算力、容量限制下,基本是在2B~13B的规模,除了语言模型,端侧还需要许多其它模型,比如视觉模型、语音模式、通用模型、图像生成、美图、PPT生成。 因此,为了满足端侧和云端的不同需求,NPU设计要求有所不同。端侧更关注低功耗、PPA(性能、功耗、面积)优化以及更好的隐私性,主要用于推理,同
[嵌入式]
<font color='red'>芯</font><font color='red'>原</font>查凯南:<font color='red'>NPU</font>如何推进嵌入式智能设备发展
可扩展的高性能GPGPU-AI计算IP赋能汽车与边缘服务器AI解决方案
提供高算力密度的AI加速能力、多芯片扩展支持及3D堆叠内存集成能力 2025年6月9日,中国上海—— 芯原股份今日宣布其高性能、可扩展的GPGPU-AI计算IP的最新进展,这些IP现已为新一代汽车电子和边缘服务器应用提供强劲赋能 。通过将可编程并行计算能力与人工智能(AI)加速器相融合,这些IP在热和功耗受限的环境下,能够高效支持大语言模型(LLM)推理、多模态感知以及实时决策等复杂的AI工作负载。 芯原的GPGPU-AI计算IP基于高性能通用图形处理器(GPGPU)架构,并集成专用AI加速器,可为AI应用提供卓越的计算能力。其可编程AI加速器与稀疏感知计算引擎通过先进的调度技术,可加速Transformer等矩阵密集
[汽车电子]
<font color='red'>芯</font><font color='red'>原</font>可扩展的高性能GPGPU-AI计算<font color='red'>IP</font>赋能汽车与边缘服务器AI解决方案
杰发科技的智能座舱域控SoC采用了的多个IP 的高性能IP组合助力提升智能座舱体验
2024年8月14日,中国上海——芯原股份 今日宣布汽车电子芯片设计公司合肥杰发科技有限公司(简称“杰发科技”)在其新一代智能座舱域控SoC AC8025中采用了芯原的高性能IP组合,包括神经网络处理器(NPU)IP、视频处理器(VPU)IP,以及显示处理器(Display Processing)IP。 AC8025是杰发科技最新一代智能座舱域控SoC,采用八核Arm Cortex-A76+A55高性能CPU组合,符合AEC-Q100和ISO 26262 ASIL B(仪表显示)认证要求 。AC8025支持8路全高清摄像头输入和7路全高清异显,以及5760x756长条屏和高清超大屏显示,内置双核高性能HiFi数字信号
[汽车电子]
杰发科技的智能座舱域控SoC采用了<font color='red'>芯</font><font color='red'>原</font>的多个<font color='red'>IP</font>  <font color='red'>芯</font><font color='red'>原</font>的高性能<font color='red'>IP</font>组合助力提升智能座舱体验
携最新的高效能IP应用亮相2024年国际嵌入式展
芯原携最新的高效能IP应用亮相2024年国际嵌入式展 面向广泛应用场景,赋能下一代创新 2024年4月9日至11日,芯原展位号:德国纽伦堡会展中心,Hall 4A-518 2024年4月9日,德国纽伦堡—— 芯原股份 今日亮相于德国纽伦堡举办的2024年国际嵌入式展(Embedded World 2024),在Hall 4A-518号展位展示各种基于芯原最新技术和先进解决方案的领先的客户产品。 芯原的一站式芯片定制服务和半导体IP授权服务为客户提供智能、安全且高度可适应的解决方案,覆盖人工智能(AI)和机器学习、物联网(IoT)、消费电子和智能设备、数据中心和高性能计算、智慧医疗,以及汽车电子等关键领域。 展示
[嵌入式]
<font color='red'>芯</font><font color='red'>原</font>携最新的高效能<font color='red'>IP</font>应用亮相2024年国际嵌入式展
低功耗蓝牙整体IP解决方案已通过LE Audio全部功能认证
以更低的功耗和成本在各种应用中高效地实现更高质量的音频流 2024年3月28日,中国上海—— 芯原股份今日宣布其低功耗蓝牙整体IP解决方案已全面支持蓝牙技术联盟(Bluetooth SIG)发布的LE Audio规范,其中包括通过了LE Audio协议栈和LC3编解码器的认证 。该方案适用于手机、包括真无线立体声(TWS)耳机在内的蓝牙耳机、音箱及其他广泛的音频应用场景。认证详情可在蓝牙技术联盟的官方网站上搜索该解决方案的合格设计ID号(206187)获取。 LE Audio是蓝牙技术联盟基于蓝牙5.2及以上版本规范推出的新一代蓝牙音频技术标准,旨在提供更高质量的音频体验。 芯原的低功耗蓝牙整体IP解决方案包含射频I
[网络通信]
<font color='red'>芯</font><font color='red'>原</font>低功耗蓝牙整体<font color='red'>IP</font>解决方案已通过LE Audio全部功能认证
赛昉基于RISC-V的JH-7110智能视觉处理平台采用了的显示处理器IP
芯原可扩展且灵活的DC8200 IP可提供显示设备自适应能力和高质量显示效果,赋能沉浸式视觉体验 2024年3月21日,中国上海—— 芯原股份(芯原)今日宣布赛昉科技(简称“赛昉”)基于RISC-V架构的量产SoC昉·惊鸿-7110(JH-7110)采用了芯原的显示处理器IP DC8200。 该SoC具有高性能、低功耗和高安全性的特点,为云计算、工业控制、网络附加存储(NAS)、平板电脑、人机界面(HMI)等多种应用提供完整的智能视觉处理平台解决方案。 芯原的DC8200 IP支持高级的图像质量增强,可为用户提供卓越的视觉体验。 该IP还可通过配置来为目标应用提供最佳的解决方案。通过集成芯原自有的压缩技术,DC820
[嵌入式]
赛昉基于RISC-V的JH-7110智能视觉处理平台采用了<font color='red'>芯</font><font color='red'>原</font>的显示处理器<font color='red'>IP</font>
IP授权业务收入占比增加,股份去年净利润亏损收窄
2月24日晚间,芯原股份发布2020年年度业绩快报,2020年度芯原股份实现营业收入15.06亿元,同比增长12.40%;本年度归属于母公司所有者的净利润为-2,556.64万元,亏损进一步收窄,收窄幅度为37.90%;归属于母公司所有者的扣除非经常性损益的净利润为-10,658.51万元,扣非后亏损增加596.01万元。 对于业绩变动,芯原股份认为主要影响因素有以下几个方面: 即使在全球新冠疫情爆发的大背景下,芯原股份2020年度业绩仍然实现增长,营业收入较2019年度增长12.40%,主要由半导体IP授权业务及量产业务增长所驱动,两类业务收入同比增长率分别为46.94%及22.49%。 报告期内,芯原股份综合毛利率显著提升
[手机便携]
<font color='red'>IP</font>授权业务收入占比增加,<font color='red'>芯</font><font color='red'>原</font>股份去年净利润亏损收窄
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

厂商技术中心

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2026 EEWORLD.com.cn, Inc. All rights reserved