AIアプリケーションの2つの形態:ワークフロー (Workflow) と エージェント (Agent)
第1章では、Transformerや拡散モデルなどの基盤技術について学びました。大規模言語モデル(LLM)を無限の知恵を持つ「脳」に例えるなら、現在のそれは厄介な状況に直面しています。瓶の中に浮かんでいるだけで、自分では何もできない「脳」のようなものです。
この「脳」に真の価値を生み出させ、請求書の処理やコードの記述、さらには会社の経営まで任せるためには、「手足」や「胴体」を取り付ける必要があります。現在のAIの潮流において、この「組み立て」方法は主に2つの流派に分かれています。
- ワークフロー (Workflow): 精密なスイス時計のように、一分の狂いもなく噛み合います。
- エージェント (Agent): 躍動する生物のように、自律的に適応します。
多くの開発者や企業経営者は、AIアプリケーションを構築する際に悩みます。「私は今、複雑な自動化スクリプトを書いているのか、それとも真のデジタル生命体を構築しているのか?」
一、 ワークフロー (Workflow):精密な組立ライン
1. 本質:SOPのデジタル的な「固定化」
ワークフローのキーワードは、**決定性、ルール、オーケストレーション(編成)**です。
その本質は、人間の標準作業手順(SOP)をコード化することにあります。これは、開発者が設計段階ですべてのステップ、すべての分岐、すべての判断条件を事前に定義した、全自動の工場組立ラインを設計するようなものです。
- 固定された経路:「もしAが起きたらBを実行し、そうでなければCを実行する。」
- 制御可能な結果:入力が決まっていれば、出力は通常予測可能です。
- LLMの役割:ここでは、大規模モデルはもはや「指揮官」ではなく、「熟練したライン工」です。特定のノードで作業(「このテキストを要約する」や「請求書の金額を抽出する」など)を行い、作業が終われば結果を次の工程に渡すだけです。
2. 代表的なツールとエコシステム
ワークフローの分野には、現在非常に成熟したツールがいくつかあり、「組立ラインの構築」を積み木遊びのように簡単にしてくれます。
- Dify & Coze (Dify & 扣子):AIアプリケーションオーケストレーションプラットフォーム
- これらは現在人気のある「ローコード/ノーコード」プラットフォームです。キャンバス上でノードをドラッグ&ドロップし、線でつなぐことができます。
- シナリオ:「企業のカスタマーサービスボット」を作りたい場合、まずナレッジベースを検索し、見つからなければ大規模モデルに尋ね、最後にログを記録します。DifyやCozeを使えば、これを30分で「描く」ことができます。
- n8n & Zapier:自動化統合ツール
- これらのツールは、異なるアプリ間の連携に重点を置いています。
- シナリオ:「Gmailで請求書メールを受信したら -> 自動的にn8nフローをトリガー -> ChatGPTを呼び出して金額を抽出 -> Google Sheetsに自動入力 -> Slack通知を送信。」 これは典型的なワークフローであり、すべてのステップが固定されており、極めて安定的です。
3. イメージ:列車
ワークフローは列車のようなものです。
動力は強く、積載能力も大きいですが、敷設されたレール(コードロジック)に沿って走ることしかできません。もしレールの前に巨石があっても、列車は自分で判断して「迂回」することはできず、停止するか脱線(エラー)するしかありません。

二、 エージェント (Agent):自律的な探検家
4. 本質:目標指向の「デジタル従業員」
エージェントのキーワードは、不確実性、推論、自律性、自己修正です。
エージェントはもはや固定されたプロセスではなく、環境を感知し、意思決定を行い、行動を起こすことができるシステムです。具体的な手順ではなく、**目標(Goal)**を与えます(例:「これら5つの競合他社の価格戦略を調査して」)。エージェントは論理的推論能力を使って環境を観察し、どのツールを使うべきか考え、行動を実行し、失敗した場合は反省して別の方法を試すことさえあります。
- コアサイクル (ReAct): 感知 (Thought) -> 意思決定 (Plan) -> 行動 (Action) -> 観察 (Observation)。
- LLMの役割: ここでは、大規模モデルは**「指揮官」**です。様々なツール(Web検索、コードインタプリタ、ファイル操作権限)を手にし、いつどのツールを使うかを自律的に決定します。
5. 代表的なツールと最前線の形態
エージェントは現在、AI分野で最もエキサイティングな「深層領域」であり、汎用人工知能(AGI)への大きな一歩を象徴しています。
- Manus:万能型汎用エージェント
- Manusは最近話題の「PC操作代行」型エージェントです。「これら5つの競合他社の価格戦略を調査してグラフを作成して」と伝えるだけです。
- Manusは自分でブラウザを開き、検索し、ウェブページをクリックし、データをExcelにコピーし、グラフを描画します。途中でウェブページが開かない場合は、自分で別のリンクを試します。まるでPCの前に座っている見えないインターンのようです。
- Claude Code:エキスパート級コーディングエージェント
- これはAnthropicが発表した、コード作成に特化したエージェントです。単純なコード補完とは異なり、「このモジュールをリファクタリングして、データベースをPostgreSQLに変更して」といった曖昧な要件を伝えます。
- まずプロジェクト全体のコードを読んでアーキテクチャを理解し、修正計画を立て、修正を実行し、さらにはテストコードを実行して修正が正しいかを確認します。エラーがあれば、自分でバグを修正します。
6. イメージ:タクシー運転手
エージェントは経験豊富なタクシー運転手のようなものです。
「空港に行ってくれ」(目標)と伝えれば、すべての曲がり角を指示する必要はありません。メインストリートが渋滞していれば自動的に脇道に入り、通行止めがあれば迂回します。リアルタイムの道路状況を感知し、知恵を使って目的地への到達方法を自律的に決定します。

三、 深層分析:表で見る違い
より直感的に比較するために、両者の核心的な違いを以下にまとめました。
| 次元 | ワークフロー (Workflow) | エージェント (Agent) |
|---|---|---|
| 本質 | SOPのデジタル的な「固定化」 | 目標指向の「デジタル従業員」 |
| キーワード | 決定性、ルール、編成 | 不確実性、推論、自律性 |
| 実行ロジック | 固定経路 (If/Else) | コアサイクル (ReAct: 感知-計画-行動) |
| LLMの役割 | 「ライン工」 (特定ノードの処理) | 「指揮官」 (ツールの自律利用) |
| イメージ | 列車 (レールの上を走る) | タクシー運転手 (自律的にルート計画) |
| 代表例 | Dify, Coze, n8n | Manus, Claude Code |
| 適用シナリオ | 確実性が高く、標準化された業務 (経費精算など) | 複雑な対話、探索的タスク (調査、データ分析など) |
四、 「コスト削減」から「効率向上」へ:企業視点の戦略的選択
技術的な違いが分かったところで、ビジネス価値と組織変革の観点から、これら2つが会社をどう変えるのかを見てみましょう。
7. ワークフロー:「専門家の経験」を複製し、企業のボトムラインを守る
企業において最も高価なリソースは「ベストプラクティス」です。
例えば、顧客へのメール返信が非常にうまく、成約率が極めて高いエース営業担当がいるとします。DifyやCozeで構築されたワークフローを通じて、このエース営業担当の思考ロジックをデジタルSOPに分解することができます。
- 役割:入社したばかりの新人でも、このワークフローを呼び出すことで、90点レベルの返信ができるようになります。
- 価値:重複労働を排除し、業務遂行の標準化とコンプライアンスを保証することです。
8. エージェント:「デジタル従業員」を雇用し、企業の限界を拡張する
ワークフローが「守り」なら、エージェントは「攻め」です。
未知の市場動向や複雑な競合調査に直面したとき、硬直したプロセスでは十分ではありません。その時、Manusのようなエージェントが必要になります。
- 役割:極めて低コストで、常時オンライン、フルスタックかつ万能なスーパーアシスタントを雇用するようなものです。分析、グラフ作成、コード記述が可能です。
- 価値:非定型な難題を解決し、1人の従業員にチーム並みの戦闘力を持たせることです。
9. 究極の形態:人間と機械が協働する新しい組織構造
未来の企業は、どちらかを選ぶのではなく、「人間 + エージェント + ワークフロー」の混合体になるでしょう。
- 下層(ワークフロー):確実性が高く、ミスの許容度が低いすべての基礎業務(請求書精算など)を担当し、企業の骨格となります。
- 中層(エージェント):複雑な対話や柔軟なタスク(初期対応のカスタマーサービス、データ分析など)を担当し、企業の筋肉となります。
- 上層(人間):目標の設定、エージェントの作業結果の評価、そしてAIには処理できない感情や倫理的な問題の処理を担当し、企業の脳となります。
したがって、続く章では、Difyの使い方を重点的に解説します。なぜなら、Difyは堅牢なワークフローを構築するのに役立つだけでなく、基礎的なエージェントを構築するための最適な演習場でもあるからです。