About Me
Blogs
Projects
100-PwC
Learning Notes
Stanford CS336 LLM From Scratch
Stanford CME296 Diffusion & Large Vision Models
MIT 6.S184 Flow Matching and Diffusion Models
Lecture 07 & 08: Parallelism Training
Lecture 07 & 08: Parallelism Training
Lecture 07与08介绍了深度学习中的并行训练方法,包括Data Parallelism, Model Parallelism,ZeRO,Pipleline Parallelism等技术。重点讲解了各类并行方法的原理、实现及其在大规模模型训练中的应用。个人认为这两节内容非常重要,理解这些并行训练技术对于处理大规模深度学习模型至关重要。
Author
Yuyang Zhang
Back to top