モデルプロバイダー設定ガイド
Difyがサポートする3種類のモデルプロバイダー(ネイティブ、アグリゲーション、セルフホスト)と設定方法の詳細ガイド。
モデルプロバイダー設定ガイド
Difyに入力後、右上のアバターをクリックし、設定 (Settings) > モデルプロバイダー (Model Provider) を選択します。

このページでは、任意のモデルプロバイダーを選択してインストールおよび設定できます。

以下は、いくつかの有名なモデルプロバイダーです:

1. 大規模言語モデルベンダー(ネイティブモデルプロバイダー)
概要: これらのベンダーは、基盤モデルの直接のトレーニング者であり所有者です。最新のモデルバージョン、最も安定したサービス品質、および公式の技術サポートを備えた最もネイティブなAPIサービスを提供します。これらのモデルにアクセスするには、通常、対応する公式サイトでAPIキーを申請する必要があります。
- OpenAI: ChatGPTシリーズ(GPT-4o, GPT-3.5)の作成者であり、業界のベンチマークです。
- Gemini (Google): 超大規模なコンテキストウィンドウを持つGoogleのマルチモーダル主力モデル。
- Anthropic (Claude): 安全性と優れた自然言語理解能力で知られています。Claudeはバージョン3から現在の4.5まで、コーディングとライティングにおいて強力なパフォーマンスを発揮しています。
- DeepSeek (深度求索): 推論とコーディング能力において優れたコストパフォーマンスとパフォーマンスを提供する、中国の主要なオープンソースおよびクローズドソースモデルベンダー。
Difyへの接続ヒント: Dify公式は通常、これらの主要ベンダーに対する組み込みサポートを提供しています。プラグインをインストールした後、「モデルプロバイダー」リストにAPIキーを入力するだけで使用できます。

2. モデルアグリゲーションベンダー(MaaS / APIアグリゲーションプラットフォーム)
概要: これらのプラットフォームは通常、モデル自体をトレーニングするのではなく、世界中のさまざまな主要モデル(クローズドソースのGPT/ClaudeやオープンソースのLlama/Qwenを含む)を統一されたインターフェースに統合します。
主な利点:
- 統一インターフェース: 通常、OpenAIインターフェース形式と完全に互換性があり、1回の統合で数十種類のモデルを切り替えることができます。
- グラフィックボード不要: ユーザーは高価なハードウェアなしで、非常に低価格でオープンソースの大規模モデルを使用できます。
- 便利な支払い: モデルの支払いの難しさやアカウント停止などの問題を解決します。
代表的なベンダー:
- OpenRouter: ほぼすべての主要なオープンソースおよびクローズドソースモデルを集約した世界的に有名なモデルアグリゲーションプラットフォーム。価格は透明で、通常は非常に低いレートでトップレベルのモデルを使用できるため、開発者に選ばれる「モデルスーパーマーケット」です。
- 302.ai: LLMだけでなく、絵画モデル、音声モデルなども統合した非常に包括的なAI中継プラットフォーム。フレンドリーなインターフェースと便利な管理を提供します。
- SiliconFlow: 新興の高性能大規模モデル推論プラットフォーム。超高並行性、超低遅延のオープンソースモデルサービス(DeepSeek、Kimiなど)の提供に特化しています。推論速度が非常に速く(トークン生成速度が高い)、無料枠があることが多いため、開発やテストに最適です。
Difyへの接続ヒント: Difyでは、「OpenAI-API-Compatible」方式で接続するか、対応するモデルプロバイダープラグインを見つけて接続できます。プラットフォームのBase URLとAPIキーを入力します。

3. 自己ホスト型モデル(ローカル/プライベートクラウド推論)
概要: ユーザー自身のハードウェア(GPU/CPU)を使用して、ローカルサーバーまたはプライベートクラウドでモデルを実行します。
主なシナリオ:
- データプライバシー: データはローカル環境から出ないため、機密業務の処理に適しています。
- コスト管理: 長期間大量に呼び出す場合、APIよりも安価になる可能性があります。
- オフライン実行: ネットワークのない環境でAI機能を使用します。
代表的なツール:
- Ollama: 現在最も人気のあるローカルモデル実行ツール。最大の特徴は、Dockerをインストールするのと同じくらい簡単な「究極のシンプルさ」です。macOS、Linux、Windowsをサポートし、1つのコマンドでLlama3、Qwen2などのモデルをダウンロードして実行できます。個人開発者や軽量アプリケーションに最適です。
- vLLM: 本番環境向けの高性能推論エンジン。PagedAttention技術を採用し、ビデオメモリの使用率とスループットを大幅に向上させています。プライベートサーバーで多数のユーザーに高並行サービスを提供する必要がある場合、vLLMはOllamaよりも専門的な選択肢です。
Difyへの接続ヒント:
DifyはOllamaおよびLocalAIを介した接続をサポートしています。DifyのコンテナがローカルモデルのIPアドレス(host.docker.internalやLAN IPなど)にアクセスできることを確認する必要があります。
