不要因为现实的平凡,就否定了那华丽的梦想!
|
Parallel Computer Architecture and Programming
《CMU 15-418 并行计算机体系结构和编程》课程全面介绍了现代并行计算的基础与实践,涵盖了多核处理器、GPU与CUDA编程、任务调度、缓存一致性等核心主题。课程内容深入探讨了并行编程模型、性能调优技巧、同步机制等,并通过多个实验和应用案例帮助学生掌握并行系统设计与优化。
学生将学习如何利用OpenMP、MPI等工具实现高效的并行计算,掌握细粒度同步、事务内存等先进概念,并通过项目实践探索深度神经网络等领域特定编程语言的应用。课程适合对并行计算架构和高性能编程有深入兴趣的学生。
⭐⭐⭐
语音 | 字幕 | |
---|---|---|
中文 | ❌ | ✅ |
英文 | ✅ | ✅ |
无
1. 为何需要并行-Why parallelism
2. 现代多核处理器-Modern multicore processors
3. 并行编程模型-Parallel programming models
4. 并行编程基础-Parallel programming basics
5. 任务分发与调度-Work distribution and scheduling
6. 习题课1-指令级并行与SIMD指令-ILP, SIMD instructions
7. 图形处理器与CUDA-Graphic processing units and CUDA
8. 习题课2-CUDA编程1-CUDA programming 1
9. 局部性、通信与竞争-Locality, communication, and contention
10. 应用案例分析-Application case studies
11. 习题课3-CUDA编程2-CUDA programming 2
12. 工作负载驱动的性能评估-Workload-driven performance evaluation
13. 基于监听的缓存一致性-Snooping-based cache coherence
14. 习题课4-作业3解析-Understanding Assignment 3
15. 基于目录的缓存一致性-Directory-based cache coherence
16. 监听协议实现-Snooping implementation
17. 习题课5-矩阵向量积-Matrix-vector Product
18. 内存一致性模型-Memory consistency
19. 习题课6-OpenMP与MPI-OMP & MPI
20. 性能测量与调优-Performance Measurement and Tuning
21. 互连网络-Interconnection networks
22. 同步机制实现-Implementing synchronization
23. 细粒度同步-Fine-grained synchronization
24. 事务内存-Transactional memory
25. 异构并行计算-Heterogenous parallelism
26. 领域特定编程语言与课程项目-Domain-specific programming language, class project
27. 领域特定框架-Domain-specific frameworks
28. 深度神经网络-Deep neural networks
29. MPI/OpenMP Cilk实现-MPI, OpenMP, Cilk implementation