Lzh on GitHub

聊天模型对比

下表对 Spring AI 支持的各类 Chat Model 进行了功能对比,涵盖以下能力:

下表对 Spring AI 支持的各类 Chat Model 进行了功能对比,涵盖以下能力:

  • 多模态(Multimodality):模型可处理的输入类型(如文本、图片、音频、视频等)。
  • 工具/函数调用(Tools/Function Calling):模型是否支持函数调用或工具使用。
  • 流式输出(Streaming):模型是否提供流式响应。
  • 重试机制(Retry):是否支持请求重试机制。
  • 可观测性(Observability):监控与调试相关功能。
  • 内置 JSON(Built-in JSON):是否原生支持 JSON 输出。
  • 本地部署(Local deployment):模型是否可以在本地运行。
  • OpenAI API 兼容性(OpenAI API Compatibility):模型是否兼容 OpenAI 的 API。

下面是优雅翻译并整理成 Markdown 表格的 Spring AI 支持的聊天模型对比

提供商多模态工具/函数调用流式输出重试可观测性内置 JSON本地部署OpenAI API 兼容
Anthropic Claude文本、PDF、图片
Azure OpenAI文本、图片
DeepSeek (OpenAI-proxy)文本
Google GenAI文本、PDF、图片、音频、视频
Google VertexAI Gemini文本、PDF、图片、音频、视频
Groq (OpenAI-proxy)文本、图片
HuggingFace文本
Mistral AI文本、图片、音频
MiniMax文本
Moonshot AI文本
NVIDIA (OpenAI-proxy)文本、图片
OCI GenAI/Cohere文本
Ollama文本、图片
OpenAI SDK (官方)输入:文本、图片、音频 输出:文本、音频
OpenAI输入:文本、图片、音频 输出:文本、音频
Perplexity (OpenAI-proxy)文本
QianFan文本
ZhiPu AI文本、图片、文档
Amazon Bedrock Converse文本、图片、视频、文档(PDF、HTML、MD、DOCX 等)