.. raw:: html
Kernel优化
==========
在上层应用或者 AI
网络模型中,看到的是算子;但是在推理引擎实际执行的是具体的
Kernel,而推理引擎中 CNN 占据了主要是得执行时间,因此其 Kernel
优化尤为重要。
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!
**内容大纲**
``PPT``\ 和\ ``字幕``\ 需要到
`Github `__
下载,网页课程版链接会失效哦~
建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~
+-----------------------+-----------------------+-----------------------+
| 大纲 | 小节 | 链接 |
+=======================+=======================+=======================+
| Kernel优化 | 01 Kernel优化架构 | `slide <./01. |
| | | introduction.pdf>`__, |
| | | `video `__ |
+-----------------------+-----------------------+-----------------------+
| Kernel优化 | 02 卷积操作基础原理 | `slide <./02.conv.pdf |
| | | >`__,\ `video `__ |
+-----------------------+-----------------------+-----------------------+
| Kernel优化 | 03 Im2Col算法 | `s |
| | | lide <./03.im2col.pdf |
| | | >`__,\ `video `__ |
+-----------------------+-----------------------+-----------------------+
| Kernel优化 | 04 Winograd算法 | `sli |
| | | de <./04.winograd.pdf |
| | | >`__,\ `video `__ |
+-----------------------+-----------------------+-----------------------+
| Kernel优化 | 05 QNNPack算法 | `sl |
| | | ide <./05.qnnpack.pdf |
| | | >`__,\ `video `__ |
+-----------------------+-----------------------+-----------------------+
| Kernel优化 | 06 推理内存布局 | `s |
| | | lide <./06.memory.pdf |
| | | >`__,\ `video `__ |
+-----------------------+-----------------------+-----------------------+
| Kernel优化 | 07 nc4hw4内存排布 | `slide |
| | | <./07.nc4hw4.pdf>`__ |
+-----------------------+-----------------------+-----------------------+
| Kernel优化 | 08 汇编与循环优化 | `slide |
| | | <./08.others.pdf>`__ |
+-----------------------+-----------------------+-----------------------+
.. toctree::
:maxdepth: 2
01.introduction
02.conv
03.im2col
04.winograd
05.qnnpack
06.memory
07.nc4hw4
08.others