模型量化的原理与应用

发布时间:2025年4月

模型量化是将浮点数模型参数转换为整数(如 int8)的过程,旨在减小模型体积和计算量。

常见的量化类型包括:

量化常配合硬件加速器(如 NPU)使用,可显著提升性能。

← 返回首页