聊天模型对比
下表对 Spring AI 支持的各类 Chat Model 进行了功能对比,涵盖以下能力:
下表对 Spring AI 支持的各类 Chat Model 进行了功能对比,涵盖以下能力:
- 多模态(Multimodality):模型可处理的输入类型(如文本、图片、音频、视频等)。
- 工具/函数调用(Tools/Function Calling):模型是否支持函数调用或工具使用。
- 流式输出(Streaming):模型是否提供流式响应。
- 重试机制(Retry):是否支持请求重试机制。
- 可观测性(Observability):监控与调试相关功能。
- 内置 JSON(Built-in JSON):是否原生支持 JSON 输出。
- 本地部署(Local deployment):模型是否可以在本地运行。
- OpenAI API 兼容性(OpenAI API Compatibility):模型是否兼容 OpenAI 的 API。
下面是优雅翻译并整理成 Markdown 表格的 Spring AI 支持的聊天模型对比:
| 提供商 | 多模态 | 工具/函数调用 | 流式输出 | 重试 | 可观测性 | 内置 JSON | 本地部署 | OpenAI API 兼容 |
|---|---|---|---|---|---|---|---|---|
| Anthropic Claude | 文本、PDF、图片 | 是 | 是 | 是 | 是 | 否 | 否 | 否 |
| Azure OpenAI | 文本、图片 | 是 | 是 | 是 | 是 | 是 | 否 | 是 |
| DeepSeek (OpenAI-proxy) | 文本 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
| Google GenAI | 文本、PDF、图片、音频、视频 | 是 | 是 | 是 | 是 | 否 | 否 | 否 |
| Google VertexAI Gemini | 文本、PDF、图片、音频、视频 | 是 | 是 | 是 | 是 | 否 | 否 | 是 |
| Groq (OpenAI-proxy) | 文本、图片 | 是 | 是 | 是 | 是 | 否 | 否 | 是 |
| HuggingFace | 文本 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
| Mistral AI | 文本、图片、音频 | 是 | 是 | 是 | 是 | 否 | 否 | 是 |
| MiniMax | 文本 | 是 | 是 | 是 | 是 | 否 | 否 | 是 |
| Moonshot AI | 文本 | 是 | 是 | 是 | 是 | 否 | — | — |
| NVIDIA (OpenAI-proxy) | 文本、图片 | 是 | 是 | 是 | 是 | 否 | 否 | 是 |
| OCI GenAI/Cohere | 文本 | 否 | 否 | 否 | 是 | 否 | 否 | 否 |
| Ollama | 文本、图片 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
| OpenAI SDK (官方) | 输入:文本、图片、音频 输出:文本、音频 | 是 | 是 | 是 | 是 | 否 | 否 | 是 |
| OpenAI | 输入:文本、图片、音频 输出:文本、音频 | 是 | 是 | 是 | 是 | 否 | 否 | 是 |
| Perplexity (OpenAI-proxy) | 文本 | 否 | 是 | 是 | 是 | 否 | 否 | 是 |
| QianFan | 文本 | 否 | 是 | 是 | 是 | 否 | 否 | 否 |
| ZhiPu AI | 文本、图片、文档 | 是 | 是 | 是 | 是 | 否 | 否 | 否 |
| Amazon Bedrock Converse | 文本、图片、视频、文档(PDF、HTML、MD、DOCX 等) | 是 | 是 | 是 | 是 | 否 | 否 | — |