找回密码
 立即注册

QQ登录

只需一步,快速开始

广告载入中...
查看: 219|回复: 4

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

[复制链接]
发表于 2025-2-25 12:19 | 显示全部楼层 |阅读模式

马上注册,享用更多功能,让你轻松玩转本论坛。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。
发表于 2025-2-25 13:32 | 显示全部楼层
感谢提供信息分享。
回复

使用道具 举报

发表于 2025-2-25 14:00 | 显示全部楼层
好好学习天天向上
回复

使用道具 举报

发表于 2025-2-25 20:13 来自手机 | 显示全部楼层
谢谢分享,学习了。
回复

使用道具 举报

发表于 2025-2-26 11:19 | 显示全部楼层
DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表