打赏

相关文章

QLoRA量化技术在日语技术文档处理中的应用实践

1. 日本技术语料微调中的QLoRA量化实践在日语技术文档处理领域,大型语言模型(LLM)面临着独特的挑战:专业术语密集、句式结构复杂,且高质量标注数据稀缺。我们团队在建筑标准文档问答任务中,发现直接使用通用日语模型(Qwen2.5-7B)的…

CANN ops-math ConcatD算子

ConcatD 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品…

CANN/DeepSeek-R1 RL训练优化

DeepSeek-R1 RL训练优化实践样例 【免费下载链接】cann-recipes-train 本项目针对LLM与多模态模型训练业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-train 概述 本样例针对DeepSeek-R1模型&…

CANN/ops-linear-algebra贡献指南

贡献指南 【免费下载链接】community 本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息 项目地址: https://gitcode.com/cann/community 本项目欢迎广大开发者体验并参与贡献,在参与社区贡献…

CANN TensorFlow HCCL广播操作

broadcast 【免费下载链接】tensorflow Ascend TensorFlow Adapter 项目地址: https://gitcode.com/cann/tensorflow 功能说明 集合通信算子Broadcast的操作接口,将通信域内root节点的数据广播到其他rank。 函数原型 def broadcast(tensor, root_rank, fus…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部