聊天模型对比

下表对 Spring AI 支持的各类 Chat Model 进行了功能对比，涵盖以下能力：

下面是优雅翻译并整理成 Markdown 表格的 Spring AI 支持的聊天模型对比：

提供商	多模态	工具/函数调用	流式输出	重试	可观测性	内置 JSON	本地部署	OpenAI API 兼容
Anthropic Claude	文本、PDF、图片	是	是	是	是	否	否	否
Azure OpenAI	文本、图片	是	是	是	是	是	否	是
DeepSeek (OpenAI-proxy)	文本	是	是	是	是	是	是	是
Google GenAI	文本、PDF、图片、音频、视频	是	是	是	是	否	否	否
Google VertexAI Gemini	文本、PDF、图片、音频、视频	是	是	是	是	否	否	是
Groq (OpenAI-proxy)	文本、图片	是	是	是	是	否	否	是
HuggingFace	文本	否	否	否	否	否	否	否
Mistral AI	文本、图片、音频	是	是	是	是	否	否	是
MiniMax	文本	是	是	是	是	否	否	是
Moonshot AI	文本	是	是	是	是	否	—	—
NVIDIA (OpenAI-proxy)	文本、图片	是	是	是	是	否	否	是
OCI GenAI/Cohere	文本	否	否	否	是	否	否	否
Ollama	文本、图片	是	是	是	是	是	是	是
OpenAI SDK (官方)	输入：文本、图片、音频输出：文本、音频	是	是	是	是	否	否	是
OpenAI	输入：文本、图片、音频输出：文本、音频	是	是	是	是	否	否	是
Perplexity (OpenAI-proxy)	文本	否	是	是	是	否	否	是
QianFan	文本	否	是	是	是	否	否	否
ZhiPu AI	文本、图片、文档	是	是	是	是	否	否	否
Amazon Bedrock Converse	文本、图片、视频、文档（PDF、HTML、MD、DOCX 等）	是	是	是	是	否	否	—

聊天模型

Chat Model API 为开发者提供了一种将 AI 驱动的聊天补全能力集成到应用程序中的方式。它基于预训练的语言模型（如 GPT，生成式预训练变换器），能够根据用户的自然语言输入生成类人化的回复。

Amazon Bedrock 会话

Amazon Bedrock Converse API 为会话型 AI 模型提供了一个统一接口，并增强了多项功能，包括函数/工具调用、多模态输入以及流式响应。