打赏

相关文章

GeoRA:几何感知低秩适配器在RLVR微调中的实践

1. 项目概述在大型语言模型(LLM)的微调领域,参数高效微调(PEFT)技术因其显著降低计算成本的优势而备受关注。其中,低秩适配(LoRA)作为代表性方法,通过冻结预训练模型的大…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部