8月12日,华为将在2025金融AI推理应用落地与发展论坛上,发布一项在AI推理领域具有里程碑意义的突破性技术成果。
业内透露,这项技术很可能从根本上改变中国AI产业对 HBM(高带宽内存)技术的依赖情况,给国内AI大模型推理性能的提升加把劲,还能补上中国AI推理生态里关键的一块短板。
HBM是种基于3D堆叠技术的先进DRAM解决方案,把多层DRAM芯片垂直集成在一起,数据传输效率一下子提上去不少。它有着超高带宽、低延迟、高容量密度还有高能效比这些优点,在AI时代那可是块关键的 “拼图”。
现在HBM已经成了高端AI芯片的 “标配”,在训练侧的使用几乎达到100%,而且随着推理侧模型越来越复杂,HBM的普及也在加速。但问题是,HBM的产能一直很紧张,再加上美国的出口限制,咱国内AI产业发展空间被不断压缩,国产化率不足5%。
在此背景下,华为即将发布的这项AI推理突破性技术成果,无疑为国内AI产业突破技术封锁、构建自主可控的AI推理生态带来了新的希望。
其实华为云之前就发布过Cloud 384和昇腾AI云服务,早验证过这条路子靠谱,实测昇腾平台跑DeepSeek模型,单卡每秒能处理1920个Tokens;跟科大讯飞合作的MoE模型,推理效率直接提升3.2倍。
而现在,华为再发力,是要带中国AI杀出一条血路。若真成功,中国在AI算力自主可控之路上将迈出关键一步,全球AI芯片的竞争规则都得跟着变。为华为和中国点赞!(极果网)
