相关文章
114、【Agent】【OpenCode】项目配置(package.json 和 bun.lock)
【声明】本博客所有内容均为个人业余时间创作,所述技术案例均来自公开开源项目(如Github,Apache基金会),不涉及任何企业机密或未公开技术,如有侵权请联系删除 背景
上篇 blog 【Agent】【OpenCode】项目配…
建站知识
2026/6/13 0:42:22
手把手实战CANN ascend-transformer-boost:Transformer推理在昇腾NPU上的极致优化
前言
大模型推理的性能优化是一个系统工程,尤其是昇腾NPU上的Transformer推理更需要系统性思考。算子库提供了单个算子的加速,图引擎做了子图融合,运行时管理了指令调度。但这些还不够——在大模型场景中,还有大量的跨层次优化机会需要考虑:如何管理KV Cache、如何处…
建站知识
2026/6/13 0:40:51
深度实践CANN HCCL集合通信库:多卡并行训练中的通信优化与问题排查
前言
单张昇腾NPU的算力已经够用了——910B的单卡算力是256 TFLOPS(FP16),足以跑多数模型的单卡推理。但训练就不一样了。训练大模型时单卡显存放不下整个模型,单卡算力也不够在一个合理的时间内跑完训练。分布式训练成了必须的选择,而分布式训练的核心是…
建站知识
2026/6/13 0:40:51
3步解锁原神帧率限制:免费提升游戏流畅度的完整指南
3步解锁原神帧率限制:免费提升游戏流畅度的完整指南 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock
厌倦了《原神》游戏中60帧的限制,想要在高端显示器上体验144H…
建站知识
2026/6/13 0:40:51
手把手实战CANN catlass算子模板库:从模板实例化到NPU性能调优
前言
搞AI芯片的人都知道一个矛盾:通用算力不够用,专用算子开发又太慢。PyTorch或者TensorFlow里跑得好的算子,到了昇腾NPU上想出一个高性能版本,通常需要折腾几周甚至几个月——你要学Ascend C,要理解NPU的Cube和Vect…
建站知识
2026/6/13 0:40:51
DRG Save Editor:如何轻松管理你的深岩银河游戏存档?
DRG Save Editor:如何轻松管理你的深岩银河游戏存档? 【免费下载链接】DRG-Save-Editor Rock and stone! 项目地址: https://gitcode.com/gh_mirrors/dr/DRG-Save-Editor
你是否曾经在深岩银河(Deep Rock Galactic)中为了收…
建站知识
2026/6/13 0:40:51
MATLAB实现GPS+IMU紧耦合导航:带反馈校正的EKF定位代码包
本文还有配套的精品资源,点击获取
简介:一套开箱即用的MATLAB导航算法实现,专注GPS与惯性测量单元(IMU)数据的紧耦合融合定位。核心采用扩展卡尔曼滤波(EKF),完整覆盖状态建模&am…
建站知识
2026/6/13 0:40:51
PCL RANSAC提取多个平面时,为什么你的代码效果差?聊聊有序点云与无序点云的坑
PCL RANSAC多平面提取:有序点云与无序点云的关键差异与优化策略当你在处理深度相机或激光雷达数据时,是否遇到过这样的困境:同样的RANSAC平面提取代码,在无序点云上表现良好,但在有序点云上却效果堪忧?这背…
建站知识
2026/6/13 0:40:51

