5. Kernel优化¶
在上层应用或者 AI 网络模型中,看到的是算子;但是在推理引擎实际执行的是具体的 Kernel,而推理引擎中 CNN 占据了主要是得执行时间,因此其 Kernel 优化尤为重要。
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!
内容大纲
PPT和字幕需要到 Github 下载,网页课程版链接会失效哦~建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~
大纲 |
小节 |
链接 |
|---|---|---|
Kernel优化 |
01 Kernel优化架构 |
|
Kernel优化 |
02 卷积操作基础原理 |
|
Kernel优化 |
03 Im2Col算法 |
|
Kernel优化 |
04 Winograd算法 |
|
Kernel优化 |
05 QNNPack算法 |
|
Kernel优化 |
06 推理内存布局 |
|
Kernel优化 |
07 nc4hw4内存排布 |
|
Kernel优化 |
08 汇编与循环优化 |
|