DeepSeek 开源周第二天开源项目 DeepEP
-
- 最大亮点就是DeepEP是首个开源的 MoE 模型训练和推理的 EP 通信库
-
- 特点
✅ 高效优化的全对全通信
✅ 支持节点内和节点间通信,兼容 NVLink 和 RDMA
✅ 高吞吐量的内核,用于训练和推理前置填充
✅ 低延迟内核,用于推理解码
✅ 原生 FP8 调度支持
✅ 灵活的 GPU 资源控制,支持计算与通信的重叠
-
- 性能
- 性能
-
- Low-latency kernels with pure RDMA
太强了!!!deepseek !!!
参考
https://github.com/deepseek-ai/DeepEP