- Published on
《Agentic AI》模块一:智能体工作流程导论
- Authors

- Name
- Halfroll Windrain
《Agentic AI》课程模块一:智能体工作流程导论 内容的总结。
本模块的核心目的是破除对“智能体”概念的迷思,阐述智能体工作流的根本价值、工作原理及其巨大潜力。吴恩达强调,不要被市场上过度炒作的“智能体”标签所迷惑,真正重要的是掌握构建智能体工作流 的方法论,因为这能让你实现以往无法完成的复杂任务,是当前AI应用开发中最重要、最有价值的技能之一。
- 1. 什么是智能体工作流?—— 从“一次性输出”到“多步推理”
- 2. 智能体的自主性程度是一个光谱
- 3. 智能体工作流的三大核心优势
- 4. 关键技能:任务分解
- 5. 核心方法论:评估与错误分析
- 6. 四大核心设计模式(预览)
1. 什么是智能体工作流?—— 从“一次性输出”到“多步推理”
- 传统方式(非智能体):像让人(或AI)不假思索、不用退格键地一次性从头到尾写一篇文章。这种方式约束性强,难以产出高质量结果。
- 智能体工作流:模仿人类的复杂任务处理方式,将任务分解为多个步骤,如:
- 先写提纲
- 进行网络研究
- 撰写初稿
- 反思初稿,找出需要修改或深入研究的部分
- 修订草稿
- 本质:一个基于LLM的应用程序执行多个步骤来完成一项任务的过程。虽然耗时可能更长,但最终的工作成果(质量、准确性、深度)远胜于单次提示。
2. 智能体的自主性程度是一个光谱
吴恩达创造“Agentic”(智能体的)这个形容词,就是为了避免“是不是真智能体”的无谓争论。他提出智能体的自主性是一个连续光谱:
- 低自主性:所有步骤由程序员预先硬编码确定,线性执行。非常多有价值且已部署的应用属于此类。
- 高自主性:LLM可以自主决定执行步骤的序列、调用哪些工具等。更强大但也更不可预测,是前沿研究领域。
- 核心观点:不必一味追求高自主性。在光谱的低自主性一端,已经有大量极其有价值的商业应用。开发者应根据任务需求,在光谱上选择合适的位置进行构建。
3. 智能体工作流的三大核心优势
性能大幅提升(最主要优势):
- 举例:在代码基准测试中,为GPT-3.5配备智能体工作流(如反思)后,其性能提升幅度甚至超过了从GPT-3.5到GPT-4的模型代际飞跃。
- 即使使用最好的LLM,智能体工作流也能让其表现更上一层楼。
并行化能力:
- 智能体可以并行执行多个子任务(如同时下载多个网页),速度远超人类顺序处理的方式。
模块化设计:
- 工作流由多个模块(LLM、工具API等)组成,便于替换或升级单个组件(如换用不同的搜索引擎、新闻接口或LLM),从而优化整个系统。
4. 关键技能:任务分解
构建智能体工作流的首要技能是将复杂任务分解为离散的步骤。
- 方法:思考“人类会如何完成这个任务?”,将其分解为多个步骤。
- 检验标准:对每个分解出的步骤,问自己:“这一步能否由一个LLM、一个工具调用或一段代码实现?”
- 如果答案是否定的,就继续分解这一步,直到每个子步骤都能用现有技术实现。
- 迭代过程:任务分解不是一蹴而就的。通常是先构建一个初版工作流,根据输出结果的不满之处,再对特定步骤进行进一步分解和优化。
5. 核心方法论:评估与错误分析
吴恩达强调,能否进行严格的评估和错误分析,是区分优秀智能体构建者和普通者的关键。
- 流程:
- 先构建,后评估:先构建一个初版工作流,然后手动检查其输出,发现不足之处(例如:不希望AI在回复中提及竞争对手)。
- 建立评估指标:
- 客观指标:对于明确的问题(如“是否提到了竞争对手的名字”),可以编写代码自动检查。
- 主观指标:对于质量评估(如“研究报告写得有多好”),可以使用 “LLM即法官” 的方式,让另一个LLM来评分(但要注意其局限性,后续课程会讲更优方法)。
- 错误分析:仔细检查工作流的中间输出(追踪信息),定位问题具体出现在哪个步骤,从而有针对性地改进。
6. 四大核心设计模式(预览)
模块一最后预览了课程后续将深入讲解的四种关键设计模式,它们是构建复杂工作流的“积木”组合方式:
- 反思:让AI检查并批判自己的输出,然后根据批评进行改进。
- 工具使用:让AI调用外部工具(如搜索引擎、数据库、代码执行器)来获取信息和执行操作。
- 规划:让AI为复杂任务自主制定一个执行计划(一系列步骤)。
- 多智能体协作:模拟一个团队,创建多个具有不同角色(研究员、程序员、测试员等)的AI智能体,让他们通过协作完成任务。
智能体工作流是一种通过“任务分解”将复杂问题拆解为多个LLM或工具可以处理的步骤的方法论。这种方法能极大释放AI的潜力,实现质的性能飞跃。成功应用此法依赖于迭代式开发 和严格的评估分析。接下来课程将深入讲解实现这一切的具体技术(反思、工具使用等)。