图像生成
从文本提示生成新图像,或在工作区中编辑现有图像。将结果保存到项目中并在聊天中预览。此实验性功能需要 OpenRouter API 密钥。
从文本提示生成新图像,或在工作区中编辑现有图像。将结果保存到项目中并在聊天中预览。此实验性功能需要 OpenRouter API 密钥。
实验性功能
图像生成是一项实验性功能,需要先在设置中启用并配置 OpenRouter API 密钥。
图像生成是一项实验性功能,需要先在设置中启用并配置 OpenRouter API 密钥。
主要功能
- 使用自然语言从文本提示创建新图像
- 编辑和转换工作区中的现有图像
- 保存到你选择的工作区路径;如果缺少适当的扩展名(.png 或 .jpg),将自动添加
- 在对话中显示生成的/编辑的图像的预览
- 目前通过 OpenRouter 使用 Gemini 2.5 Flash Image Preview 模型
- 在实验性设置下有一个简单的开/关切换
使用场景
图像生成
之前:你必须将提示复制到外部网站,下载结果,然后将其移动到你的工作区。
使用此功能:要求 Roo 生成图像,批准,选择保存位置,然后继续编辑,图像已在你的项目中。
图像编辑
之前:导出图像,上传到外部编辑器,进行更改,下载,然后重新导入到项目中。
使用此功能:要求 Roo 直接转换你现有的图像——它会读取文件,应用你的编辑,并将结果保存在你的项目中。
工作原理
启用后,Roo 会通过 OpenRouter 将你的提示(以及可选的现有图像)发送给具备图像功能的模型。OpenRouter 返回的生成的或编辑的图像将保存到你在当前工作区内指定的路径。Roo 会在聊天中显示预览,并且该文件会出现在你的文件浏览器中。
要求
- OpenRouter 账户和 API 密钥
- 互联网连接
- 一个开放、可写入的工作区文件夹
配置
- 启用图像生成(实验性) 目的:打开此功能,以便 Roo 可以按需创建图像 默认:关闭 位置:设置 > 实验性
- OpenRouter API 密钥 目的:授权图像生成请求 默认:空(必需) 获取你的密钥:https://openrouter.ai/keys
- 图像生成模型 目的:选择用于生成的模型 默认:Gemini 2.5 Flash Image Preview 可用模型:目前仅限于 Gemini 2.5 Flash Image Preview 及其免费版本
使用图像生成
- 在聊天中,要求 Roo 生成图像并描述你想要的内容(主题、风格、灯光、构图)。
- 在提示时确认操作。Roo 可能会要求你选择一个保存路径(例如:
images/sunset.png)。 - Roo 生成图像并保存。如果你不包含扩展名,将根据输出格式自动添加适当的扩展名(
.png或.jpg)。 - 在聊天中查看图像预览,并在你的工作区中找到该文件。
编辑现有图像
Roo 还可以转换和编辑工作区中的现有图像:
- 要求 Roo 编辑图像,描述你想要的转换
- 同时指定输入图像路径和保存结果的路径
- Roo 将对现有图像应用你请求的编辑
支持的输入格式:PNG、JPG、JPEG、GIF、WEBP
示例请求:
- "将
photos/portrait.jpg转换为水彩画,并另存为art/watercolor-portrait.png" - "将
images/logo.png放大并增强至更高分辨率" - "对
screenshots/app.png应用复古滤镜"
注意:输入图像路径和输出路径都必须可访问(未被 .rooignore 阻止)
获得更好结果的技巧
具体化
在你的提示中包含以下元素:
- 风格:艺术媒介、艺术运动或特定艺术家的风格
- 情绪:情感基调、氛围
- 调色板:特定的颜色或配色方案
- 相机/灯光:角度、视角、灯光条件
- 宽高比:尺寸或方向
限制
- 实验性功能;可用性和模型列表有限
- 目前仅限于 Gemini 2.5 Flash Image Preview 模型
- 每次请求生成一张图像
- 支持的输出格式:PNG 或 JPG
- 支持的编辑输入格式:仅限 PNG、JPG、JPEG、GIF、WEBP
- 图像路径必须可访问(未被
.rooignore限制阻止) - 使用可能受你的 OpenRouter 计划限制和成本影响
状态
此功能为实验性,未来版本可能会更改或移除。通过 GitHub Issues 提供反馈。