国外 AI 芯片架构 ================ - 《国外AI芯片》深入地剖析国外 Google TPU 和特斯拉 DOJO 相关 AI 芯片的架构,以TPU为主主要使用了数据流(Data FLow)的方式的脉动阵列来加速矩阵的运算,而特斯拉则使用了近存计算(Near Memory)两种不同的产品形态。 .. 希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈! **内容大纲** ``PPT``\ 和\ ``字幕``\ 需要到 `Github `__ 下载,网页课程版链接会失效哦~ 建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~ +-----------------------+-----------------------+-----------------------+ | 大纲 | 小节 | 链接 | +=======================+=======================+=======================+ | 国外AI芯片 | 01 特斯拉 DOJO 架构 | `slide <./ | | | | 01.DOJO_Arch.pdf>`__, | | | | `video `__ | +-----------------------+-----------------------+-----------------------+ | 国外AI芯片 | 02 特斯拉 DOJO 细节 | `slide <./02 | | | | .DOJO_Detail.pdf>`__, | | | | `video `__ | +-----------------------+-----------------------+-----------------------+ | 国外AI芯片 | 03 特斯拉 DOJO | `slide <./03 | | | 存算系统 | .DOJO_System.pdf>`__, | | | | `video `__ | +-----------------------+-----------------------+-----------------------+ | 国外AI芯片 | 04 谷歌 TPU 介绍 | `slide <./0 | | | | 4.TPU_Introl.pdf>`__, | | | | `video `__ | +-----------------------+-----------------------+-----------------------+ | 国外AI芯片 | 05 谷歌 TPU1 脉冲阵列 | `slid | | | | e <./05.TPU1.pdf>`__, | | | | `video `__ | +-----------------------+-----------------------+-----------------------+ | 国外AI芯片 | 06 谷歌 TPU2 | `slid | | | 推理到训练 | e <./06.TPU2.pdf>`__, | | | | `video `__ | +-----------------------+-----------------------+-----------------------+ | 国外AI芯片 | 07 谷歌 TPU3 POD集群 | `slid | | | | e <./07.TPU3.pdf>`__, | | | | `video <>`__ | +-----------------------+-----------------------+-----------------------+ | 国外AI芯片 | 08 谷歌 TPU4 光互联 | `slid | | | | e <./08.TPU4.pdf>`__, | | | | `video <>`__ | +-----------------------+-----------------------+-----------------------+ .. toctree:: :maxdepth: 2 01.DOJO_Arch 02.DOJO_Detail 03.DOJO_System 04.TPU_Introl 05.TPU1 06.TPU2 07.TPU3 08.TPU4