第8章:Agent 模式入门——让 AI 学会调用工具
1. 项目背景“帮我把这份 50 页的 PDF 翻译成英文,然后发邮件给 john@example.com。”——这是个典型的"Agent 任务"。如果要靠 Chat App 或简单的 Workflow 来做,你需要分三步手动操作:上传 PDF 翻译 → 复制翻译结果 → 打开发邮件界面 → 粘贴内容 → 发送。但 Agent 可以自动完成全过程——翻译是调用 LLM,提取 PDF 文本是调用文档工具,发送邮件是调用邮件工具——Agent 像一个小助理,根据任务自动决定需要用什么工具、按什么顺序执行。Dify 的 Agent 模式基于经典的 ReAct(Reasoning + Acting)范式——Thought(思考:我需要先做什么)→ Action(行动:调用某个工具)→ Observation(观察:工具返回了什么结果)→ 循环直到任务完成。这个机制让 Agent 不仅能"回答问题",还能"做事"。但 Agent 也有"翻车"的常见场景:调用工具后不知道下一步该怎么走(无限循环)、工具调用结果和预期不符(幻觉调用)、任务太简单却用了很贵的模型(杀鸡用牛刀)。本章将带你从 Agent 的基本配置出发,通过一个"智能行程规划 Agent"的完整实战,理解 Agent 的两种策略(FC 和 CoT)、工具选择与配置、以及如何写好 Agent 的系统提示词让它"听话"。2. 项目设计小胖:(兴奋地挥舞着手机)“大师!我昨天试了 Dify 的 Agent,让它帮我查’今天北京的天气’,它真的自己打开了搜索工具,搜到了天气,然后告诉我结果!这跟 ChatGPT 自动搜索完全不一

相关新闻