模型量化的原理与应用 发布时间:2025年4月 模型量化是将浮点数模型参数转换为整数(如 int8)的过程,旨在减小模型体积和计算量。 常见的量化类型包括: 动态量化 静态量化 量化感知训练(QAT) 量化常配合硬件加速器(如 NPU)使用,可显著提升性能。 ← 返回首页