打赏

相关文章

人工智能篇---SFT与DPO

SFT(Supervised Fine-Tuning,有监督微调),是在大语言模型(LLM)训练流程中,紧接在预训练(Pre-training)之后的关键一步。它的核心目的非常直接:让一个什么都懂…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部