模型供应商配置指南

Dify 支持的三类模型供应商及配置详解:原生厂商、聚合平台与本地部署。

模型供应商配置指南

进入 Dify 后,点击右上角头像,然后点击 设置 (Settings) > 模型供应商 (Model Provider)

Settings

在此页面,您可以选择任意的模型供应商进行安装和配置。

模型供应商

以下是一些著名的模型供应商:

安装模型

1. 大模型厂商(原生模型提供商)

简介: 这类厂商是基础模型的直接训练者和拥有者。他们提供最原生的 API 服务,通常拥有最新的模型版本、最稳定的服务质量以及官方的技术支持。接入这类模型通常需要直接去对应的官网申请 API Key。

  • OpenAI: ChatGPT 系列(GPT-4o, GPT-3.5)的创造者,行业标杆。
  • Gemini (Google): Google 的多模态旗舰模型,拥有超大的上下文窗口。
  • Anthropic (Claude): 以安全性和极佳的自然语言理解能力著称,Claude 从之前的 3 到现在的 4.5 一直是编程与写作强手。
  • DeepSeek (深度求索): 国内领先的开源与闭源模型厂商,性价比极高,在推理和代码能力上表现优异。

Dify 接入提示: Dify 官方通常对这些主流厂商有内置支持,安装插件后在“模型供应商”列表中填入 API Key 即可。

原生模型

2. 模型聚合厂商(MaaS / API 聚合平台)

简介: 这类平台本身通常不训练模型,而是将全球各种主流模型(包括闭源的 GPT/Claude 和开源的 Llama/Qwen 等)整合到一个统一的接口中。

核心优势

  1. 统一接口:通常完全兼容 OpenAI 接口格式,一次接入即可切换几十种模型。
  2. 无需显卡:让用户无需昂贵的硬件也能以极低价格使用开源大模型。
  3. 支付便捷:解决了模型支付困难、封号等问题。

代表厂商

  • OpenRouter: 全球知名的模型聚合平台,汇集了几乎所有主流的开源和闭源模型。价格透明,通常能以极低的汇率使用顶级模型,是开发者首选的“模型超市”。
  • 302.ai: 功能非常全面的 AI 中转平台,不仅聚合了 LLM,还包含了绘画模型、语音等模型。界面友好,管理便捷。
  • 硅基流动 (SiliconFlow): 新兴的高性能大模型推理平台。专注于提供超高并发、极低延迟的开源模型服务(如 DeepSeek、Kimi 等)。其特点是推理速度极快(Token 生成速度高),且常有免费额度,非常适合开发测试。

Dify 接入提示: 在 Dify 中可以通过“OpenAI-API-Compatible”方式接入,也可以找到对应的模型供应商插件接入。填写该平台的 Base URL 和 API Key 即可。

聚合平台

3. 自己部署的模型(本地/私有云推理)

简介: 利用用户自己的硬件(GPU/CPU)在本地服务器或私有云上运行模型。

核心场景

  1. 数据隐私:数据完全不出本地,适合处理敏感业务。
  2. 成本控制:长期大量调用时,相比 API 可能更省钱。
  3. 离线运行:在无网环境下使用 AI 能力。

代表工具

  • Ollama: 目前最流行的本地模型运行工具。最大特点是极致简单,像安装 Docker 一样简单。支持 macOS, Linux, Windows,一条命令即可下载并运行 Llama3, Qwen2 等模型。非常适合个人开发者和轻量级应用。
  • vLLM: 面向生产环境的高性能推理引擎。采用了 PagedAttention 技术,极大地提高了显存利用率和吞吐量。如果你需要在私有服务器上为大量用户提供高并发服务,vLLM 是比 Ollama 更专业的选择。

Dify 接入提示: Dify 支持通过 Ollama 和 LocalAI 接入。你需要确保 Dify 的容器能够访问到你本地模型的 IP 地址(例如使用 host.docker.internal 或局域网 IP)。

本地部署