Dify 支持的三类模型供应商及配置详解：原生厂商、聚合平台与本地部署。

模型供应商配置指南

进入 Dify 后，点击右上角头像，然后点击 设置 (Settings) > 模型供应商 (Model Provider)。

Settings

在此页面，您可以选择任意的模型供应商进行安装和配置。

模型供应商

以下是一些著名的模型供应商：

安装模型

1. 大模型厂商（原生模型提供商）

简介：这类厂商是基础模型的直接训练者和拥有者。他们提供最原生的 API 服务，通常拥有最新的模型版本、最稳定的服务质量以及官方的技术支持。接入这类模型通常需要直接去对应的官网申请 API Key。

Dify 接入提示： Dify 官方通常对这些主流厂商有内置支持，安装插件后在“模型供应商”列表中填入 API Key 即可。

原生模型

简介：这类平台本身通常不训练模型，而是将全球各种主流模型（包括闭源的 GPT/Claude 和开源的 Llama/Qwen 等）整合到一个统一的接口中。

核心优势：

代表厂商：

OpenRouter: 全球知名的模型聚合平台，汇集了几乎所有主流的开源和闭源模型。价格透明，通常能以极低的汇率使用顶级模型，是开发者首选的“模型超市”。
302.ai: 功能非常全面的 AI 中转平台，不仅聚合了 LLM，还包含了绘画模型、语音等模型。界面友好，管理便捷。
硅基流动 (SiliconFlow): 新兴的高性能大模型推理平台。专注于提供超高并发、极低延迟的开源模型服务（如 DeepSeek、Kimi 等）。其特点是推理速度极快（Token 生成速度高），且常有免费额度，非常适合开发测试。

Dify 接入提示：在 Dify 中可以通过“OpenAI-API-Compatible”方式接入，也可以找到对应的模型供应商插件接入。填写该平台的 Base URL 和 API Key 即可。

聚合平台

简介：利用用户自己的硬件（GPU/CPU）在本地服务器或私有云上运行模型。

核心场景：

代表工具：

Ollama: 目前最流行的本地模型运行工具。最大特点是极致简单，像安装 Docker 一样简单。支持 macOS, Linux, Windows，一条命令即可下载并运行 Llama3, Qwen2 等模型。非常适合个人开发者和轻量级应用。
vLLM: 面向生产环境的高性能推理引擎。采用了 PagedAttention 技术，极大地提高了显存利用率和吞吐量。如果你需要在私有服务器上为大量用户提供高并发服务，vLLM 是比 Ollama 更专业的选择。

Dify 接入提示： Dify 支持通过 Ollama 和 LocalAI 接入。你需要确保 Dify 的容器能够访问到你本地模型的 IP 地址（例如使用 host.docker.internal 或局域网 IP）。

本地部署