打赏

相关文章

CANN/cann-bench UnsortedSegmentSum 算子 API 描述

UnsortedSegmentSum 算子 API 描述 【免费下载链接】cann-bench 评测AI在处理CANN领域代码任务的能力,涵盖算子生成、算子优化等领域,支撑模型选型、训练效果评估,统一量化评估标准,识别Agent能力短板,构建CANN领域评测…

CANN/ge GE 图 Dump 格式说明

GE 图 Dump 格式说明 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、Tenso…

高通-大坑-高通晓龙npu推理 Qwen3-VL Step-1 ONNX 推理,模型乱回答

背景 多模态大模型正在逐步从云端推理走向端侧部署。端侧部署的核心挑战不是简单地把 PyTorch 模型转换为 ONNX,而是要让模型在移动 SoC 的 NPU / DSP 加速器上稳定运行,同时保持可接受的生成质量、延迟和功耗。 本文讨论的是一次 Qwen3-VL 类视觉语言模型的端侧部署调试过…

GE图引擎添加子图API

AddSubGraph 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部