打赏

相关文章

CANN hcomm 通信库——多机训练的集合通信

前言 多机多卡训练时,节点间通信往往成为性能瓶颈。hcomm 是昇腾 CANN 软件栈中负责集合通信的核心库,作为 HCCL 的底层通信原语,它直接管理 NPU 之间的数据传输与同步。本文深入剖析 hcomm 的工作原理、通信架构、原语实现与配置调优方法&am…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部