5. Kernel优化

在上层应用或者 AI 网络模型中,看到的是算子;但是在推理引擎实际执行的是具体的 Kernel,而推理引擎中 CNN 占据了主要是得执行时间,因此其 Kernel 优化尤为重要。

希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!

内容大纲

PPT字幕需要到 Github 下载,网页课程版链接会失效哦~

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

大纲

小节

链接

Kernel优化

01 Kernel优化架构

slide, video

Kernel优化

02 卷积操作基础原理

`slide <./02.conv.pdf >`__,video

Kernel优化

03 Im2Col算法

`s lide <./03.im2col.pdf >`__,video

Kernel优化

04 Winograd算法

`sli de <./04.winograd.pdf >`__,video

Kernel优化

05 QNNPack算法

`sl ide <./05.qnnpack.pdf >`__,video

Kernel优化

06 推理内存布局

`s lide <./06.memory.pdf >`__,video

Kernel优化

07 nc4hw4内存排布

`slide

<./07.nc4hw4.pdf>`__

Kernel优化

08 汇编与循环优化

`slide

<./08.others.pdf>`__