13、内核级异步集体通信的设计与实现

最新推荐文章于 2025-07-07 00:28:00 发布

rock5

最新推荐文章于 2025-07-07 00:28:00 发布

阅读量8

点赞数

CC 4.0 BY-SA版权

分类专栏：并行计算新时代：多核处理器与Exascale系统的挑战文章标签： KACC设施非阻塞集体通信内核级异步通信

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rock5/article/details/149593918

并行计算新时代：多核处理器与Exascale系统的挑战专栏收录该内容

38 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

内核级异步集体通信的设计与实现

1. 非阻塞集体通信实现问题

非阻塞集体通信的实现并非易事，主要受限于通信推进（progression）。大多数集体通信实现由一系列点对点通信组成，这些通信通过数据依赖相互连接，而推进就是连接这些点对点通信的过程。MPI 库必须在所有依赖通信完成后才能继续集体通信。目前有两种实现方式：

线程实现 ：为通信创建一个线程，并在该线程中执行推进操作。例如 LibNBC 实现就采用了这种方法。其优点是通信可与运行在另一个线程上的计算异步执行，理论上通信线程独立于计算线程，推进操作能在合适的时间执行。然而，由于 CPU 核心数量的限制，实际情况并非如此。用户通常会创建与 CPU 核心数量相同的 MPI 进程，若 MPI 库再创建通信线程，活动线程数量会超过核心数量，导致频繁的上下文切换。若上下文切换由操作系统执行，且操作系统不了解线程间的依赖关系，切换时机可能并非最优，从而造成 CPU 时间的浪费和通信延迟。
显式推进 ：在 MPI 库中实现推进操作，即集体通信的推进仅在应用程序调用 MPI 函数（如 MPI Test 和 MPI Wait）时进行。这种方法不创建线程，因此不会出现上下文切换问题。但如果应用程序不调用任何 MPI 函数，推进操作就不会进行，导致计算和通信无法重叠。即使发布了非阻塞集体通信，在计算过程中通信也不会推进。只有当计算完成并调用 MPI Wait 等待非阻塞集体通信完成时，推进操作才会开始。若用户为避免错过推进时机而频繁调用推进操作，会导致 CPU 时间的损失。例如 Linpack 基准程序就采用了这种显式推进方法，在本地计算期间，使用 MP

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。