打赏

相关文章

CANN/catlass Gemm/Block类模板概述

Gemm/Block 类模板概述 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass API 清单 blockMmad清单 组件描述block_mmad基础模板,包含BlockMm…

DeepEP V2 为什么值得做 MoE 的团队现在就关注?真正先拖慢吞吐的,不是专家数,而是 EP 通信还在抢 SM

DeepEP V2 为什么值得做 MoE 的团队现在就关注?真正先拖慢吞吐的,不是专家数,而是 EP 通信还在抢 SM 很多团队一聊到 MoE,第一反应还是 router、负载均衡、FP8 或专家数怎么配。但 DeepSeek 在 2026 年 4 月底公开的 DeepEP V2,指向了一个更接近真实系统瓶颈的事实:当模…

CANN/hcomm组调用结束接口

HcclGroupEnd 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 产品支持情况 Ascend 950PR/Ascend 950DT:不支持At…

多模态 RAG 不是把 embedding 换成 Qwen3-VL-Embedding 就行:从文本检索仓改到图文混合检索,真正先要改的是这 3 层

多模态 RAG 不是把 embedding 换成 Qwen3-VL-Embedding 就行:从文本检索仓改到图文混合检索,真正先要改的是这 3 层 很多团队做 RAG 升级时,第一反应还是“把文本 embedding 模型换成更新的多模态 embedding,就能把截图、表格、页面图片也一起搜起来”。这一步如果走快了,…

华为通信/CANN hcomm查询拓扑信息

查询拓扑信息 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 背景 为了应对复杂的网络拓扑结构,通信算子需要根据…

如何高效准确实现表面测温

作为长沙弗赛德的研发工程师,在工业现场,我每日思索:怎样让传感器感知的温度无限贴近设备表面真实温度?在电机轴承、工艺管道等位置实现精准可靠的表面测温,是个棘手难题,关键在于达成传感器与被测面的高效…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部