相关文章
48.人工智能实战:大模型可观测性怎么做?从前期异常发现到 Trace、Metrics、Logs 三件套落地
人工智能实战:大模型可观测性怎么做?从前期异常发现到 Trace、Metrics、Logs 三件套落地 一、问题场景:用户说 AI 很慢,但你不知道慢在哪里
大模型系统上线后,最常见的问题不是“彻底挂了”,而是:
AI 有点慢
AI 偶尔答错
AI 有时没引用资料
AI 成本突然高
AI 某些用户…
建站知识
2026/5/9 17:05:14
CANN/amct 单算子量化配置说明
单算子模式量化配置参数说明 【免费下载链接】amct AMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。 项目地址: https://gitcode.com/cann/amct
表 1 retrain_enable参数说明 作用 该层是否进行量化感知训练。 类型 bool 取值范围 true或false 参数说明 true&#…
建站知识
2026/5/9 17:05:14
CANN/GE动态分档特性介绍
动态分档(Dynamic Gear)特性介绍 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内…
建站知识
2026/5/9 17:05:14
从GCN到注意力机制:深度学习如何革新交通预测
1. 项目概述:当城市交通遇上深度学习每天早晚高峰,看着地图上那一片片刺眼的红色,你是不是也想过,要是能提前知道哪条路会堵、哪个路口会慢,该多好?这不仅仅是普通人的烦恼,更是城市交通管理者、…
建站知识
2026/5/9 17:05:14
多模态大语言模型加速:代理级推测解码技术解析
1. 项目概述:突破多模态推理的序列化瓶颈在2023年ChatGPT引爆AI热潮后,多模态大语言模型(MLLM)正成为下一代人工智能的核心基础设施。这类模型通过融合视觉与语言理解能力,能够完成图像描述生成、视觉问答、复杂推理等…
建站知识
2026/5/9 17:05:14
49.人工智能实战:RAG 数据质量怎么治理?从前期发现“召回垃圾内容”到文档评分、入库拦截与质量看板
人工智能实战:RAG 数据质量怎么治理?从前期发现“召回垃圾内容”到文档评分、入库拦截与质量看板 一、问题场景:模型不差,但召回的资料全是垃圾
很多 RAG 系统效果不好,团队第一反应是:
换 embedding 模型
换 reranker
换更强大模型但前期排查时经常发现:
真正的问题…
建站知识
2026/5/9 17:05:14
AI人才分析实战:从数据清洗到人岗匹配的算法与应用
1. 项目概述:AI如何重塑人才管理的决策逻辑在人力资源这个传统上高度依赖“直觉”和“经验”的领域,一场静默的革命正在进行。过去,HR们筛选简历、评估候选人、预测员工去留,很大程度上依赖于个人判断,这个过程不仅耗时…
建站知识
2026/5/9 17:05:14
AI Agent技能库:团队共享与工程化实践指南
1. 项目概述:一个面向团队的AI Agent技能库如果你和我一样,每天都在和Cursor、Claude Code、Windsurf这些AI编程工具打交道,那你肯定也遇到过这样的困境:好不容易调教出一个能帮你高效写单元测试、或者能按公司规范审查代码的AI助…
建站知识
2026/5/9 17:05:14

