图像生成

从文本提示生成新图像，或在工作区中编辑现有图像。将结果保存到项目中并在聊天中预览。此实验性功能需要 OpenRouter API 密钥。

从文本提示生成新图像，或在工作区中编辑现有图像。将结果保存到项目中并在聊天中预览。此实验性功能需要 OpenRouter API 密钥。

实验性功能
图像生成是一项实验性功能，需要先在设置中启用并配置 OpenRouter API 密钥。

主要功能

使用自然语言从文本提示创建新图像
编辑和转换工作区中的现有图像
保存到你选择的工作区路径；如果缺少适当的扩展名（.png 或 .jpg），将自动添加
在对话中显示生成的/编辑的图像的预览
目前通过 OpenRouter 使用 Gemini 2.5 Flash Image Preview 模型
在实验性设置下有一个简单的开/关切换

使用场景

图像生成

之前：你必须将提示复制到外部网站，下载结果，然后将其移动到你的工作区。

使用此功能：要求 Roo 生成图像，批准，选择保存位置，然后继续编辑，图像已在你的项目中。

图像编辑

之前：导出图像，上传到外部编辑器，进行更改，下载，然后重新导入到项目中。

使用此功能：要求 Roo 直接转换你现有的图像——它会读取文件，应用你的编辑，并将结果保存在你的项目中。

工作原理

启用后，Roo 会通过 OpenRouter 将你的提示（以及可选的现有图像）发送给具备图像功能的模型。OpenRouter 返回的生成的或编辑的图像将保存到你在当前工作区内指定的路径。Roo 会在聊天中显示预览，并且该文件会出现在你的文件浏览器中。

要求

OpenRouter 账户和 API 密钥
互联网连接
一个开放、可写入的工作区文件夹

配置

启用图像生成（实验性）目的：打开此功能，以便 Roo 可以按需创建图像默认：关闭位置：设置 > 实验性
OpenRouter API 密钥目的：授权图像生成请求默认：空（必需）获取你的密钥：https://openrouter.ai/keys
图像生成模型目的：选择用于生成的模型默认：Gemini 2.5 Flash Image Preview 可用模型：目前仅限于 Gemini 2.5 Flash Image Preview 及其免费版本

使用图像生成

在聊天中，要求 Roo 生成图像并描述你想要的内容（主题、风格、灯光、构图）。
在提示时确认操作。Roo 可能会要求你选择一个保存路径（例如：images/sunset.png）。
Roo 生成图像并保存。如果你不包含扩展名，将根据输出格式自动添加适当的扩展名（.png 或 .jpg）。
在聊天中查看图像预览，并在你的工作区中找到该文件。

编辑现有图像

Roo 还可以转换和编辑工作区中的现有图像：

要求 Roo 编辑图像，描述你想要的转换
同时指定输入图像路径和保存结果的路径
Roo 将对现有图像应用你请求的编辑

支持的输入格式：PNG、JPG、JPEG、GIF、WEBP

示例请求：

"将 photos/portrait.jpg 转换为水彩画，并另存为 art/watercolor-portrait.png"
"将 images/logo.png 放大并增强至更高分辨率"
"对 screenshots/app.png 应用复古滤镜"

注意：输入图像路径和输出路径都必须可访问（未被 .rooignore 阻止）

获得更好结果的技巧

具体化

在你的提示中包含以下元素：

风格：艺术媒介、艺术运动或特定艺术家的风格
情绪：情感基调、氛围
调色板：特定的颜色或配色方案
相机/灯光：角度、视角、灯光条件
宽高比：尺寸或方向

限制

实验性功能；可用性和模型列表有限
目前仅限于 Gemini 2.5 Flash Image Preview 模型
每次请求生成一张图像
支持的输出格式：PNG 或 JPG
支持的编辑输入格式：仅限 PNG、JPG、JPEG、GIF、WEBP
图像路径必须可访问（未被 .rooignore 限制阻止）
使用可能受你的 OpenRouter 计划限制和成本影响

状态

此功能为实验性，未来版本可能会更改或移除。通过 GitHub Issues 提供反馈。

后台编辑

了解实验性后台编辑设置，它允许在 Roo Code 在后台进行文件编辑时进行不间断的编码。

其他功能

探索 Roo Code 的其他功能，包括用于更快交互的建议回复、文本转语音功能以及对 18 种语言的支持。