《Agentic AI》模块一：智能体工作流程导论

《Agentic AI》课程模块一：智能体工作流程导论 内容的总结。

本模块的核心目的是破除对“智能体”概念的迷思，阐述智能体工作流的根本价值、工作原理及其巨大潜力。吴恩达强调，不要被市场上过度炒作的“智能体”标签所迷惑，真正重要的是掌握构建智能体工作流 的方法论，因为这能让你实现以往无法完成的复杂任务，是当前AI应用开发中最重要、最有价值的技能之一。

1. 什么是智能体工作流？—— 从“一次性输出”到“多步推理”
2. 智能体的自主性程度是一个光谱
3. 智能体工作流的三大核心优势
4. 关键技能：任务分解
5. 核心方法论：评估与错误分析
6. 四大核心设计模式（预览）

1. 什么是智能体工作流？—— 从“一次性输出”到“多步推理”

传统方式（非智能体）：像让人（或AI）不假思索、不用退格键地一次性从头到尾写一篇文章。这种方式约束性强，难以产出高质量结果。
智能体工作流：模仿人类的复杂任务处理方式，将任务分解为多个步骤，如：
- 先写提纲
- 进行网络研究
- 撰写初稿
- 反思初稿，找出需要修改或深入研究的部分
- 修订草稿
本质：一个基于LLM的应用程序执行多个步骤来完成一项任务的过程。虽然耗时可能更长，但最终的工作成果（质量、准确性、深度）远胜于单次提示。

2. 智能体的自主性程度是一个光谱

吴恩达创造“Agentic”（智能体的）这个形容词，就是为了避免“是不是真智能体”的无谓争论。他提出智能体的自主性是一个连续光谱：

低自主性：所有步骤由程序员预先硬编码确定，线性执行。非常多有价值且已部署的应用属于此类。
高自主性：LLM可以自主决定执行步骤的序列、调用哪些工具等。更强大但也更不可预测，是前沿研究领域。
核心观点：不必一味追求高自主性。在光谱的低自主性一端，已经有大量极其有价值的商业应用。开发者应根据任务需求，在光谱上选择合适的位置进行构建。

3. 智能体工作流的三大核心优势

性能大幅提升（最主要优势）：
- 举例：在代码基准测试中，为GPT-3.5配备智能体工作流（如反思）后，其性能提升幅度甚至超过了从GPT-3.5到GPT-4的模型代际飞跃。
- 即使使用最好的LLM，智能体工作流也能让其表现更上一层楼。
并行化能力：
- 智能体可以并行执行多个子任务（如同时下载多个网页），速度远超人类顺序处理的方式。
模块化设计：
- 工作流由多个模块（LLM、工具API等）组成，便于替换或升级单个组件（如换用不同的搜索引擎、新闻接口或LLM），从而优化整个系统。

4. 关键技能：任务分解

构建智能体工作流的首要技能是将复杂任务分解为离散的步骤。

方法：思考“人类会如何完成这个任务？”，将其分解为多个步骤。
检验标准：对每个分解出的步骤，问自己：“这一步能否由一个LLM、一个工具调用或一段代码实现？”
- 如果答案是否定的，就继续分解这一步，直到每个子步骤都能用现有技术实现。
迭代过程：任务分解不是一蹴而就的。通常是先构建一个初版工作流，根据输出结果的不满之处，再对特定步骤进行进一步分解和优化。

5. 核心方法论：评估与错误分析

吴恩达强调，能否进行严格的评估和错误分析，是区分优秀智能体构建者和普通者的关键。

流程：
1. 先构建，后评估：先构建一个初版工作流，然后手动检查其输出，发现不足之处（例如：不希望AI在回复中提及竞争对手）。
2. 建立评估指标：
  - 客观指标：对于明确的问题（如“是否提到了竞争对手的名字”），可以编写代码自动检查。
  - 主观指标：对于质量评估（如“研究报告写得有多好”），可以使用 “LLM即法官” 的方式，让另一个LLM来评分（但要注意其局限性，后续课程会讲更优方法）。
错误分析：仔细检查工作流的中间输出（追踪信息），定位问题具体出现在哪个步骤，从而有针对性地改进。

6. 四大核心设计模式（预览）

模块一最后预览了课程后续将深入讲解的四种关键设计模式，它们是构建复杂工作流的“积木”组合方式：

反思：让AI检查并批判自己的输出，然后根据批评进行改进。
工具使用：让AI调用外部工具（如搜索引擎、数据库、代码执行器）来获取信息和执行操作。
规划：让AI为复杂任务自主制定一个执行计划（一系列步骤）。
多智能体协作：模拟一个团队，创建多个具有不同角色（研究员、程序员、测试员等）的AI智能体，让他们通过协作完成任务。

智能体工作流是一种通过“任务分解”将复杂问题拆解为多个LLM或工具可以处理的步骤的方法论。这种方法能极大释放AI的潜力，实现质的性能飞跃。成功应用此法依赖于迭代式开发 和严格的评估分析。接下来课程将深入讲解实现这一切的具体技术（反思、工具使用等）。