AIアプリケーションの2つの形態:ワークフロー (Workflow) と エージェント (Agent)

第1章では、Transformerや拡散モデルなどの基盤技術について学びました。大規模言語モデル(LLM)を無限の知恵を持つ「脳」に例えるなら、現在のそれは厄介な状況に直面しています。瓶の中に浮かんでいるだけで、自分では何もできない「脳」のようなものです。

この「脳」に真の価値を生み出させ、請求書の処理やコードの記述、さらには会社の経営まで任せるためには、「手足」や「胴体」を取り付ける必要があります。現在のAIの潮流において、この「組み立て」方法は主に2つの流派に分かれています。

  1. ワークフロー (Workflow): 精密なスイス時計のように、一分の狂いもなく噛み合います。
  2. エージェント (Agent): 躍動する生物のように、自律的に適応します。

多くの開発者や企業経営者は、AIアプリケーションを構築する際に悩みます。「私は今、複雑な自動化スクリプトを書いているのか、それとも真のデジタル生命体を構築しているのか?」


一、 ワークフロー (Workflow):精密な組立ライン

1. 本質:SOPのデジタル的な「固定化」

ワークフローのキーワードは、**決定性、ルール、オーケストレーション(編成)**です。

その本質は、人間の標準作業手順(SOP)をコード化することにあります。これは、開発者が設計段階ですべてのステップ、すべての分岐、すべての判断条件を事前に定義した、全自動の工場組立ラインを設計するようなものです。

  • 固定された経路:「もしAが起きたらBを実行し、そうでなければCを実行する。」
  • 制御可能な結果:入力が決まっていれば、出力は通常予測可能です。
  • LLMの役割:ここでは、大規模モデルはもはや「指揮官」ではなく、「熟練したライン工」です。特定のノードで作業(「このテキストを要約する」や「請求書の金額を抽出する」など)を行い、作業が終われば結果を次の工程に渡すだけです。

2. 代表的なツールとエコシステム

ワークフローの分野には、現在非常に成熟したツールがいくつかあり、「組立ラインの構築」を積み木遊びのように簡単にしてくれます。

  • Dify & Coze (Dify & 扣子):AIアプリケーションオーケストレーションプラットフォーム
    • これらは現在人気のある「ローコード/ノーコード」プラットフォームです。キャンバス上でノードをドラッグ&ドロップし、線でつなぐことができます。
    • シナリオ:「企業のカスタマーサービスボット」を作りたい場合、まずナレッジベースを検索し、見つからなければ大規模モデルに尋ね、最後にログを記録します。DifyやCozeを使えば、これを30分で「描く」ことができます。
  • n8n & Zapier:自動化統合ツール
    • これらのツールは、異なるアプリ間の連携に重点を置いています。
    • シナリオ:「Gmailで請求書メールを受信したら -> 自動的にn8nフローをトリガー -> ChatGPTを呼び出して金額を抽出 -> Google Sheetsに自動入力 -> Slack通知を送信。」 これは典型的なワークフローであり、すべてのステップが固定されており、極めて安定的です。

3. イメージ:列車

ワークフローは列車のようなものです。

動力は強く、積載能力も大きいですが、敷設されたレール(コードロジック)に沿って走ることしかできません。もしレールの前に巨石があっても、列車は自分で判断して「迂回」することはできず、停止するか脱線(エラー)するしかありません。

Workflow Diagram


二、 エージェント (Agent):自律的な探検家

4. 本質:目標指向の「デジタル従業員」

エージェントのキーワードは、不確実性、推論、自律性、自己修正です。

エージェントはもはや固定されたプロセスではなく、環境を感知し、意思決定を行い、行動を起こすことができるシステムです。具体的な手順ではなく、**目標(Goal)**を与えます(例:「これら5つの競合他社の価格戦略を調査して」)。エージェントは論理的推論能力を使って環境を観察し、どのツールを使うべきか考え、行動を実行し、失敗した場合は反省して別の方法を試すことさえあります。

  • コアサイクル (ReAct): 感知 (Thought) -> 意思決定 (Plan) -> 行動 (Action) -> 観察 (Observation)。
  • LLMの役割: ここでは、大規模モデルは**「指揮官」**です。様々なツール(Web検索、コードインタプリタ、ファイル操作権限)を手にし、いつどのツールを使うかを自律的に決定します。

5. 代表的なツールと最前線の形態

エージェントは現在、AI分野で最もエキサイティングな「深層領域」であり、汎用人工知能(AGI)への大きな一歩を象徴しています。

  • Manus:万能型汎用エージェント
    • Manusは最近話題の「PC操作代行」型エージェントです。「これら5つの競合他社の価格戦略を調査してグラフを作成して」と伝えるだけです。
    • Manusは自分でブラウザを開き、検索し、ウェブページをクリックし、データをExcelにコピーし、グラフを描画します。途中でウェブページが開かない場合は、自分で別のリンクを試します。まるでPCの前に座っている見えないインターンのようです。
  • Claude Code:エキスパート級コーディングエージェント
    • これはAnthropicが発表した、コード作成に特化したエージェントです。単純なコード補完とは異なり、「このモジュールをリファクタリングして、データベースをPostgreSQLに変更して」といった曖昧な要件を伝えます。
    • まずプロジェクト全体のコードを読んでアーキテクチャを理解し、修正計画を立て、修正を実行し、さらにはテストコードを実行して修正が正しいかを確認します。エラーがあれば、自分でバグを修正します。

6. イメージ:タクシー運転手

エージェントは経験豊富なタクシー運転手のようなものです。

「空港に行ってくれ」(目標)と伝えれば、すべての曲がり角を指示する必要はありません。メインストリートが渋滞していれば自動的に脇道に入り、通行止めがあれば迂回します。リアルタイムの道路状況を感知し、知恵を使って目的地への到達方法を自律的に決定します。

Agent Diagram


三、 深層分析:表で見る違い

より直感的に比較するために、両者の核心的な違いを以下にまとめました。

次元ワークフロー (Workflow)エージェント (Agent)
本質SOPのデジタル的な「固定化」目標指向の「デジタル従業員」
キーワード決定性、ルール、編成不確実性、推論、自律性
実行ロジック固定経路 (If/Else)コアサイクル (ReAct: 感知-計画-行動)
LLMの役割「ライン工」 (特定ノードの処理)「指揮官」 (ツールの自律利用)
イメージ列車 (レールの上を走る)タクシー運転手 (自律的にルート計画)
代表例Dify, Coze, n8nManus, Claude Code
適用シナリオ確実性が高く、標準化された業務 (経費精算など)複雑な対話、探索的タスク (調査、データ分析など)

四、 「コスト削減」から「効率向上」へ:企業視点の戦略的選択

技術的な違いが分かったところで、ビジネス価値と組織変革の観点から、これら2つが会社をどう変えるのかを見てみましょう。

7. ワークフロー:「専門家の経験」を複製し、企業のボトムラインを守る

企業において最も高価なリソースは「ベストプラクティス」です。

例えば、顧客へのメール返信が非常にうまく、成約率が極めて高いエース営業担当がいるとします。DifyやCozeで構築されたワークフローを通じて、このエース営業担当の思考ロジックをデジタルSOPに分解することができます。

  • 役割:入社したばかりの新人でも、このワークフローを呼び出すことで、90点レベルの返信ができるようになります。
  • 価値:重複労働を排除し、業務遂行の標準化とコンプライアンスを保証することです。

8. エージェント:「デジタル従業員」を雇用し、企業の限界を拡張する

ワークフローが「守り」なら、エージェントは「攻め」です。

未知の市場動向や複雑な競合調査に直面したとき、硬直したプロセスでは十分ではありません。その時、Manusのようなエージェントが必要になります。

  • 役割:極めて低コストで、常時オンライン、フルスタックかつ万能なスーパーアシスタントを雇用するようなものです。分析、グラフ作成、コード記述が可能です。
  • 価値:非定型な難題を解決し、1人の従業員にチーム並みの戦闘力を持たせることです。

9. 究極の形態:人間と機械が協働する新しい組織構造

未来の企業は、どちらかを選ぶのではなく、「人間 + エージェント + ワークフロー」の混合体になるでしょう。

  • 下層(ワークフロー):確実性が高く、ミスの許容度が低いすべての基礎業務(請求書精算など)を担当し、企業の骨格となります。
  • 中層(エージェント):複雑な対話や柔軟なタスク(初期対応のカスタマーサービス、データ分析など)を担当し、企業の筋肉となります。
  • 上層(人間):目標の設定、エージェントの作業結果の評価、そしてAIには処理できない感情や倫理的な問題の処理を担当し、企業のとなります。

したがって、続く章では、Difyの使い方を重点的に解説します。なぜなら、Difyは堅牢なワークフローを構築するのに役立つだけでなく、基礎的なエージェントを構築するための最適な演習場でもあるからです。