本章小结
- 大多数真实世界的应用程序都会遇到与内存相关的性能瓶颈。新兴的应用领域,如机器学习和大数据,对内存带宽和延迟的要求尤为苛刻。
- 内存子系统的性能提升速度不及 CPU 性能的提升速度。然而,内存访问仍然是许多应用程序性能问题的常见来源。加速此类程序需要重新审视其访问内存的方式。
- 在 [MemBound] 中,我们讨论了开发缓存友好数据结构的常用技巧,探索了数据重组技术,学习了如何利用巨内存页(huge memory pages)来改善 DTLB 性能,以及如何使用显式内存预取来减少缓存缺失次数。