打赏

相关文章

cannbot-skills SuperKernel适配

【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills name: model-infer-superkernel description: 基于 PyTorch 框架的昇腾…

别把 SFT 里的 `packing` 当成白捡吞吐的开关:TRL 里 `bfd`、`bfd_split`、`wrapped` 真正卖掉的不是同一种东西

别把 SFT 里的 packing 当成白捡吞吐的开关:TRL 里 bfd、bfd_split、wrapped 真正卖掉的不是同一种东西 很多人做 SFT 时,一看到 packing=True 就会把它理解成“把 padding 浪费收回来,几乎没有副作用”。但我把 TRL 现在的实现、警告和一个最小模拟实验放在一起看后,结论…

CANN/catlass Gemm/Block类模板概述

Gemm/Block 类模板概述 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass API 清单 blockMmad清单 组件描述block_mmad基础模板,包含BlockMm…

DeepEP V2 为什么值得做 MoE 的团队现在就关注?真正先拖慢吞吐的,不是专家数,而是 EP 通信还在抢 SM

DeepEP V2 为什么值得做 MoE 的团队现在就关注?真正先拖慢吞吐的,不是专家数,而是 EP 通信还在抢 SM 很多团队一聊到 MoE,第一反应还是 router、负载均衡、FP8 或专家数怎么配。但 DeepSeek 在 2026 年 4 月底公开的 DeepEP V2,指向了一个更接近真实系统瓶颈的事实:当模…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部