AI 应用的两种形态：工作流 (Workflow) 与智能体 (Agent)

在第一章中，我们了解了 Transformer、扩散模型等底层技术。如果把大模型（LLM）比作一个拥有无穷智慧的“大脑”，那么它现在面临一个尴尬的处境：只有一个大脑悬浮在罐子里，什么也做不了。

为了让这个“大脑”真正产生价值，去处理发票、写代码、甚至管理公司，我们需要给它装上“四肢”和“躯干”。在当前的 AI 浪潮中，这种“组装”方式主要分化成了两个流派：

很多开发者和企业主在构建 AI 应用时都会陷入纠结：“我到底是在写一个复杂的自动化脚本，还是在构建一个真正的数字生命？”

一、工作流（Workflow）：精密的流水线

工作流的关键词是：确定性、规则、编排（Orchestration）。

它的本质是将人类的标准作业程序（SOP）代码化。这就好比你设计了一条全自动化的工厂流水线，每一个步骤、每一个分支、每一个判断条件，都是由开发者在设计阶段就预先定义好的。

路径固定： “如果 A 发生，则执行 B；否则执行 C。”
结果可控：只要输入确定，输出通常是可预测的。
LLM 的角色：在这里，大模型不再是“指挥官”，而是一名“高级流水线工人”。它只负责在某个具体的节点上干活（比如“总结这段文本”或“提取发票金额”），干完活就把结果传给下一站。

在工作流领域，目前有几类非常成熟的工具，它们让“搭建流水线”变得像搭积木一样简单：

Dify & Coze (扣子)：AI 应用编排平台
- 这两个是目前比较火的“低代码/无代码”平台。你可以在画布上拖拽一个个节点，用线连起来。
- 场景：你想做一个“企业客服机器人”，先查知识库，查不到再问大模型，最后记录日志。用 Dify 或 Coze，你半小时就能“画”出来。
n8n & Zapier：自动化集成工具
- 这些工具更侧重于连接不同的 APP。
- 场景： “每当我的 Gmail 收到发票邮件 -> 自动触发 n8n 流程 -> 调用 ChatGPT 提取金额 -> 自动填入 Google Sheets 表格 -> 发送 Slack 通知。” 这是一个典型的工作流，每一步都钉死了，极其稳定。

工作流就像一列火车。

它的动力很强，运载力很大，但它只能沿着铺设好的铁轨（代码逻辑）跑。如果铁轨前面有一块巨石，火车无法自己决定“绕路”，它只能停车或脱轨（报错）。

Workflow Diagram

智能体的关键词是：不确定性、推理、自主性、自我修正。

智能体不再是死板的流程，它是一个能够感知环境、进行决策并采取行动的系统。你给它一个目标（Goal），而不是具体的步骤。它会利用自己的逻辑推理能力，观察环境，思考该用什么工具，执行行动，如果失败了，它甚至会自己反思并换个方法。

智能体是目前 AI 领域最令人兴奋的“深水区”，代表了 AI 向通用人工智能（AGI）迈进的一大步：

Manus：全能型通用智能体
- Manus 是最近爆火的“接管电脑”型 Agent。你只需要告诉它：“帮我调研一下这五家竞品的定价策略，并生成图表。”
- Manus 会自己打开浏览器，自己搜索，自己点击网页，自己把数据复制到 Excel，自己画图。中间如果网页打不开，它会自己换一个链接试。它就像一个坐在你电脑前的隐形实习生。
Claude Code：专家级编程智能体
- 这是 Anthropic 推出的专门写代码的 Agent。不同于简单的代码补全，你给它一个模糊的需求：“帮我重构这个模块，把数据库换成 PostgreSQL。”
- 它会先阅读你整个项目的代码，理解架构，然后制定修改计划，执行修改，甚至自己运行测试代码来看看改对了没有。如果报错，它会自己修 bug。

智能体就像一位经验丰富的出租车司机。

你告诉他“去机场”（目标），他不需要你指挥每一个转弯。如果主路堵车，他会自动走小路；如果遇到封路，他会绕行。通过实时感知路况，他利用智慧自主决定如何抵达终点。

Agent Diagram

为了更直观地对比，我们将两者的核心差异总结如下：

搞清楚了技术区别，我们再从商业价值和组织变革的角度来看看：这两个东西到底怎么改变我们的公司？

在企业里，最贵的资源是“最佳实践”。

比如，你公司有一个王牌销售，他特别会回客户邮件，成单率极高。通过 Dify 或 Coze 搭建的工作流，你可以把这位王牌销售的思考逻辑拆解成一套数字化 SOP。

如果说工作流是“守成”，那智能体就是“进攻”。

面对未知的市场动态、复杂的竞品调研，死板的流程是不够用的。这时，你需要像 Manus 这样的 Agent。

未来的企业，不会是二选一，而是“人 + 智能体 + 工作流”的混合体。

因此，在接下来的章节中，我们将重点教你如何使用 Dify。因为它不仅能帮你构建稳固的工作流，也是目前搭建基础智能体的最佳练兵场。