打赏

相关文章

模型训练为什么一做 LoRA 权重合并就开始离线指标正常却线上格式跑偏:从 Adapter Merge 到 Scale Fence 的工程实战

很多团队把 LoRA 微调的收尾定成一件事:指标过线后直接把 adapter 合回基座,再导出单独权重上线。⚠️ 这样部署更省事,也少了推理侧的额外挂载逻辑。麻烦常在发布后才出现。📌 固定验证集上的 loss 和抽样都正常,线上…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部