2024年边缘AI芯片出货量激增42%:端侧大模型落地五年拐点已至,设备端机器学习重构人机交互逻辑

AI资讯 · 0 阅读 · 2026-05-23 · 自动采集
2024年被业界视为“端侧AI元年”。根据IDC于2024年6月发布的最新追踪报告,全球边缘AI处理器(包括搭载NPU的SoC、MCU及专用AI加速器)全年出货量预计达到9.8亿颗,较2023年增长42%,其中智能手机、PC与物联网终端设备贡献了超过七成的增量。这股浪潮的核心驱动力不再是简单的图像降噪或语音唤醒,而是能够在设备本地独立运行数十亿甚至上百亿参数大语言模型(LLM)的“设备端机器学习”(On-Device Machine Learning)能力。高通公司产品管理高级副总裁Ziad Asghar在2024年世界移动通信大会(MWC)上明确提出,生成式AI正在从云端向边缘迁移,“设备上的推理将成为默认选项,云端仅用于训练或处理极端复杂的任务”。

这一变革在旗舰芯片的迭代轨迹上表现得尤为鲜明。2023年10月,高通发布的骁龙8 Gen 3移动平台首次支持在设备端运行高达100亿参数的大模型,其六边形AI引擎的性能较前代提升了98%。紧随其后,联发科于11月推出的天玑9300同样将端侧大模型能力作为核心卖点,率先成功在内存为16GB的安卓手机上运行70亿参数(7B)的LLM,每秒可生成20个token。苹果公司则在2024年6月的全球开发者大会(WWDC)上宣告Apple Intelligence战略落地,强调绝大部分AI请求通过A17 Pro及M系列芯片的16核神经引擎在终端完成,只有在本地算力不足时才通过私有云计算架构请求云端处理,且全程不保留用户数据。2024年7月,三星搭载骁龙8 Gen 3的新款折叠屏手机Galaxy Z Fold6与Z Flip6,已将通话实时翻译、笔记摘要以及图像生成式编辑等功能完全置于设备端运行,无需联网。

硬件军备竞赛之外,大模型压缩技术的成熟是端侧部署得以成真的另一支柱。量化(如INT4甚至INT3精度)、知识蒸馏、稀疏化以及低秩适配(LoRA)等手段,使得原本需要数十GB显存的模型体积迅速“瘦身”。2024年3月,清华大学与华为联合团队发布的开源端侧模型框架,成功将Llama 2-13B模型压缩至4GB以内,并在Mate 60 Pro的昇腾NPU上实现流畅对话。谷歌则通过MediaPipe与TensorFlow Lite工具链,让开发者能够直接在Android设备上部署Gemini Nano模型,该模型在2023年12月随Pixel 8 Pro首次亮相时,可支持录音摘要与智能回复功能,全程离线完成。2024年4月,微软更推出用于端侧AI的Phi-3-mini模型,参数仅38亿,却在多项基准测试中超越了规模大一倍的竞品,明确将目标场景锁定在“离线、低算力与隐私敏感”的设备。

分析机构对此给出了长期乐观预测。ABI Research在2024年5月发布的报告指出,到2028年具备设备端机器学习能力的终端年出货量将突破32亿个,覆盖从耳戴式设备、可穿戴健康监测仪到汽车座舱域控制器等广泛领域。这份预测的底层逻辑在于:延迟与隐私优势正在重构产品价值。在工业检测领域,将AI推理下沉至传感器意味着从“拍照上传云端、等待数秒返回结果”变为“0.2毫秒内直接触发风机停机”,全球工业自动化龙头西门子已在2024年汉诺威工博会上展示基于边缘AI的振动分析方案,响应速度比云端方案快40倍。医疗健康领域,2024年1月苹果获得的一项专利显示,AirPods可通过内置生物传感器与嵌入式神经网络在本地实时分析佩戴者的呼吸模式,用以初筛睡眠呼吸暂停,全程不将原始音频上传,避免了医疗数据泄露风险。

然而,设备端机器学习在2024年仍面临性能与功耗的尖锐平衡问题。尽管NPU能效比大幅提升,但当持续运行70亿参数模型时,手机SoC的功耗瞬时峰值仍可达4至5瓦,导致设备发热和电量快速下降。为解决这一痛点,芯片设计开始走向异构计算的精细化调度。英特尔于2024年6月发布的酷睿Ultra处理器在CPU、GPU之外集成了全新NPU,并可在运行Copilot+ PC的系统时动态分配负载,将视频背景替换等持续AI任务交给NPU,突发式大模型推理则触发GPU,理论上使能效比提升两倍以上。同时,2024年5月ARM推出的Cortex-X925核心以及Ethos-U85第三代微型NPU,分别瞄准从手机至智能水表的各级设备,表明端侧AI算力的下沉已成为从架构设计之初就确定的路线。

从供应链看,存储器厂商亦深受波及。为了支持10B级模型的本地驻留,2024年旗舰手机普遍搭载16GB甚至24GB LPDDR5X内存,并采用UFS4.0闪存以提升模型交换速度。三星半导体一位高管在2024年第二季度财报电话会上表示,由端侧AI驱动的手机内存容量升级将是“近五年来最强劲的换机推手”,预计2024年下半年LPDDR5X 16Gb颗粒的出货量将同比提升65%。换言之,设备端机器学习正在从芯片、软件、传感器到存储器全链条重塑产业,其影响力远远超出了单纯的AI算法范畴。

展望2025年,行业标准与互联协议将成为新的较量焦点。英特尔、三星、高通、Arm和台积电等45家企业于2024年3月联合宣布成立“边缘AI生态系统联盟”,试图统一跨设备、跨操作系统的AI推理工作负载接口,避免生态碎片化。市场观察者普遍认同,当端侧算力足够支撑稳定的离线数字人助理、实时环境重建以及无网即时翻译时,智能手机、PC乃至智能眼镜的角色都将从“云客户终端”彻底演变为自主智能体,这一转折点或许比外界想象的更快到来。正如IDC欧洲AI研究副总裁Andrea Minonne所总结:“我们正从‘将AI带给设备’走向‘从设备中生长出AI’,这对整个产业的语义重构将在今后24个月内集中显现。”

🔌 需要 AI API?

国内直连 Claude/GPT/DeepSeek,支付宝充值,5分钟接入

查看中转推荐 →