不要因为现实的平凡,就否定了那华丽的梦想!

10.2 CMU 15-418 并行计算机体系结构和编程

课程名称

Parallel Computer Architecture and Programming

课程概要
《CMU 15-418 并行计算机体系结构和编程》课程全面介绍了现代并行计算的基础与实践,涵盖了多核处理器、GPU与CUDA编程、任务调度、缓存一致性等核心主题。课程内容深入探讨了并行编程模型、性能调优技巧、同步机制等,并通过多个实验和应用案例帮助学生掌握并行系统设计与优化。

学生将学习如何利用OpenMP、MPI等工具实现高效的并行计算,掌握细粒度同步、事务内存等先进概念,并通过项目实践探索深度神经网络等领域特定编程语言的应用。课程适合对并行计算架构和高性能编程有深入兴趣的学生。
| 推荐系数 |

⭐⭐⭐

语音字幕
中文
英文

课程大纲
1. 为何需要并行-Why parallelism  
2. 现代多核处理器-Modern multicore processors  
3. 并行编程模型-Parallel programming models  
4. 并行编程基础-Parallel programming basics  
5. 任务分发与调度-Work distribution and scheduling  
6. 习题课1-指令级并行与SIMD指令-ILP, SIMD instructions  
7. 图形处理器与CUDA-Graphic processing units and CUDA  
8. 习题课2-CUDA编程1-CUDA programming 1  
9. 局部性、通信与竞争-Locality, communication, and contention  
10. 应用案例分析-Application case studies  
11. 习题课3-CUDA编程2-CUDA programming 2  
12. 工作负载驱动的性能评估-Workload-driven performance evaluation  
13. 基于监听的缓存一致性-Snooping-based cache coherence  
14. 习题课4-作业3解析-Understanding Assignment 3  
15. 基于目录的缓存一致性-Directory-based cache coherence  
16. 监听协议实现-Snooping implementation  
17. 习题课5-矩阵向量积-Matrix-vector Product  
18. 内存一致性模型-Memory consistency  
19. 习题课6-OpenMP与MPI-OMP & MPI  
20. 性能测量与调优-Performance Measurement and Tuning  
21. 互连网络-Interconnection networks  
22. 同步机制实现-Implementing synchronization  
23. 细粒度同步-Fine-grained synchronization  
24. 事务内存-Transactional memory  
25. 异构并行计算-Heterogenous parallelism  
26. 领域特定编程语言与课程项目-Domain-specific programming language, class project  
27. 领域特定框架-Domain-specific frameworks  
28. 深度神经网络-Deep neural networks  
29. MPI/OpenMP Cilk实现-MPI, OpenMP, Cilk implementation  
学习指南