相关文章
CANN/ops-cv三点插值反向传播算子
aclnnThreeInterpolateBackward 【免费下载链接】ops-cv 本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-cv
产品支持情况
产品是否支持Ascend 950PR/Ascend 950DTAtlas A3 训练系列…
建站知识
2026/5/9 17:32:52
带有embeding 同时训练的Lora 权重合并,合并后的权重的模型,再训练数的Loss 突然增加
带有embeding 同时训练的Lora 权重合并
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizerbase_model_path "/root/private_data/models/deepseek-ai/6epoch-merged"
adapter_path "/root/private_data/output/share…
建站知识
2026/5/11 3:32:33
AI文献综述工具评估:性能、可用性与透明度三维度解析
1. 项目概述:当AI遇见文献综述,我们如何评估这场“效率革命”? 作为一名在学术信息处理领域摸爬滚打了十多年的研究者,我亲眼见证了文献综述工作从“体力活”到“脑力活”,再到如今“人机协作”的演变。核心痛点始终如…
建站知识
2026/5/9 17:32:52
初次使用taotoken模型广场进行模型选型与对比的直观体验
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 初次使用 Taotoken 模型广场进行模型选型与对比的直观体验
作为一名刚开始接触大模型应用开发的工程师,我面临的首要问…
建站知识
2026/5/9 17:32:52
非洲AI发展:从基础设施到人才战略的全面挑战与机遇
1. 非洲AI发展的底层逻辑与现实挑战人工智能,或者说AI,现在几乎成了一个“热词”,但它的核心其实并不神秘。简单来说,AI就是让机器模仿人类的智能行为,通过算法模型从海量数据中学习规律,从而做出预测、识别…
建站知识
2026/5/9 17:31:52
PyTorch 量化感知训练:QAT 与 PTQ 实践指南
PyTorch 量化感知训练:QAT 与 PTQ 实践指南
1. 技术分析
1.1 量化类型
量化类型描述训练要求精度损失PTQ (Post-Training Quantization)训练后量化无需重新训练中QAT (Quantization-Aware Training)训练中量化需要重新训练低Dynamic Quantization仅量化权重无需数据…
建站知识
2026/5/9 17:31:52
OpenClaw用户指南,通过Taotoken CLI一键完成配置写入
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 OpenClaw用户指南,通过Taotoken CLI一键完成配置写入
基础教程类,面向OpenClaw工具的用户,本教…
建站知识
2026/5/9 17:31:52
PyTorch JIT 编译优化:TorchScript 与 TorchInductor
PyTorch JIT 编译优化:TorchScript 与 TorchInductor
1. 技术分析
1.1 JIT 编译概述
JIT (Just-In-Time) 编译是在运行时将 Python 代码编译为高效机器码的技术:
编译方式描述适用场景TorchScript静态类型脚本部署到生产环境TorchInductor自动生成优化代…
建站知识
2026/5/9 17:31:51

