3. 模型压缩

《模型压缩》模型压缩跟轻量化网络模型不同,压缩主要是对轻量化或者非轻量化模型执行剪枝、蒸馏、量化等压缩算法和手段,使得模型更加小、更加轻便、更加利于执行。

希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!

内容大纲

PPT字幕需要到 Github 下载,网页课程版链接会失效哦~

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

大纲

小节

链接

模型压缩

01 基本介绍

PPT, 视频

模型压缩

02 低比特量化原理

`PPT

<./02.quant.pdf>`__,

视频

模型压缩

03 感知量化训练 QAT

P PT, 视频

模型压缩

04 训练后量化PTQ与部署

P PT, 视频

模型压缩

05 模型剪枝

`PPT < ./05.pruning.pdf>`__, 视频

模型压缩

06(上) 知识蒸馏原理

PPT, 视频

模型压缩

06(下) 知识蒸馏算法

PPT, 视频