自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 数据中心GPU芯片性能参数速查表(Nvidia+国产算力卡)

Nvidia的数据中心用GPU芯片,不断更新迭代新的架构。不同架构下的 GPU芯片,其性能参数大相径庭。在计算能力方面,从早期架构到如今的先进架构,CUDA 核心数量不断增加,如从 Kepler 架构开始,SM 单元中的 CUDA 核心数大幅提升,这使得通用计算能力得到极大增强。每代的架构,都会以一个著名科学家的名字命名,截止目前,已经有 11 款芯片架构代号取自科学家名字。如下所示:

2025-06-04 17:49:30 2035 2

原创 使用国内 huggingface 镜像下载模型数据集方法

Hugging Face作为全球知名的AI模型和数据集共享平台,拥有海量的资源可供开发者使用。然而,由于网络环境等因素的影响,国内开发者在直接访问Hugging Face官网下载模型和数据集时,往往会遇到速度慢甚至无法下载的问题。为了帮助国内AI开发者解决这一难题,Hugging Face的国内镜像站点应运而生。这些镜像站点通过在国内部署服务器,加速了模型和数据集的下载速度,极大地提高了开发效率。

2025-05-27 11:32:59 1064

原创 Infiniband写入带宽对RDMA网络的基准测试方法

通过RDMA网络读写速率测试,可以为应用开发者提供准确的网络性能数据,帮助他们更好地理解网络的瓶颈和优势,从而有针对性地优化应用的通信逻辑,提高应用的整体性能和效率。

2025-04-29 17:35:16 666

原创 GPU集群计算IB网卡命名不一致修改

在使用不同厂家的服务器做集群训练时,因为不同厂家的GPU服务器配置不同会影响计算网的通信,以下图为例:mlx5_6网卡在A机器上为25GE网卡,在B机器上为200G的IB网卡,在添加NCCL通信相关配置时,如果没有统一命名,会因为网卡名称导致通信报错。修改 KERNELS==“0000:” 的值,参考smt status -v中的 PCI值对应的NET网卡,保存后reboot。3.ibdev2netdev 查看命名,已经修改成功。下查看PCIE对应的NUMA关系。

2025-04-29 16:37:33 379

原创 A800 GPU服务器 麒麟V10操作系统安装CUDA

A800服务器使用麒麟v10安装 CUDA

2025-04-28 19:30:51 770

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除