华为开源 SINQ AI 量化技术：显存占用最高削减 70%

IT之家 2025-10-06 07:29

华为苏黎世计算系统实验室于 9 月 26 日发布全新开源量化（Quantization）技术 SINQ（Sinkhorn 归一化量化），旨在大幅降低大语言模型（LLM）的显存需求与运行成本。SINQ 的核心优势在于其卓越的压缩性能。根据测试，该技术能将不同规模模型的显存占用普遍削减 60% 至 70%。这意味着，过去需要超过 60GB 显存才能运行的大型模型，现在仅需约 20GB 的环境即可部署。（IT之家）

扫码下载app 最新资讯实时掌握

上一篇国庆档电影总票房破12亿