【NVIDIA-H100-nccl_test排错1】Test CUDA failure common.cu:1030 ‘system not yet initialized‘

报错代码:

test@h20:~/nccl-tests$ ./build/all_reduce_perf -b 8 -e 512M -f 2 -g 1
# nThread 1 nGpus 1 minBytes 8 maxBytes 536870912 step: 2(factor) warmup iters: 5 iters: 20 agg iters: 1 validation: 1 graph: 0
#
# Using devices
h20: Test CUDA failure common.cu:1030 'system not yet initialized'
 .. h20 pid 6238: Test failure common.cu:937

命令概述

这个命令用于运行 NCCL(NVIDIA Collective Communications Library)测试套件里的 all_reduce_perf 程序,其主要目的是评估 AllReduce 操作在 GPU 上的性能表现。AllReduce 操作是并行计算中一种关键的集体通信操作,它会对所有进程的数据进行归约,然后将结果广播给所有进程。

参数详解

  1. -b 8
    此参数代表测试所使用的最小消息大小,单位为字节(Byte)。这里设置为 8,意味着测试会从 8 字节的消息开始。
  2. -e 512M
    该参数指定了测试的最大消息大小,单位同样是字节。其中,M
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

清风 001

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值