Lzh on GitHub

图像生成

从文本提示生成新图像,或在工作区中编辑现有图像。将结果保存到项目中并在聊天中预览。此实验性功能需要 OpenRouter API 密钥。

从文本提示生成新图像,或在工作区中编辑现有图像。将结果保存到项目中并在聊天中预览。此实验性功能需要 OpenRouter API 密钥。

实验性功能
图像生成是一项实验性功能,需要先在设置中启用并配置 OpenRouter API 密钥。

主要功能

  • 使用自然语言从文本提示创建新图像
  • 编辑和转换工作区中的现有图像
  • 保存到你选择的工作区路径;如果缺少适当的扩展名(.png 或 .jpg),将自动添加
  • 在对话中显示生成的/编辑的图像的预览
  • 目前通过 OpenRouter 使用 Gemini 2.5 Flash Image Preview 模型
  • 在实验性设置下有一个简单的开/关切换

使用场景

图像生成

之前:你必须将提示复制到外部网站,下载结果,然后将其移动到你的工作区。

使用此功能:要求 Roo 生成图像,批准,选择保存位置,然后继续编辑,图像已在你的项目中。

图像编辑

之前:导出图像,上传到外部编辑器,进行更改,下载,然后重新导入到项目中。

使用此功能:要求 Roo 直接转换你现有的图像——它会读取文件,应用你的编辑,并将结果保存在你的项目中。

工作原理

启用后,Roo 会通过 OpenRouter 将你的提示(以及可选的现有图像)发送给具备图像功能的模型。OpenRouter 返回的生成的或编辑的图像将保存到你在当前工作区内指定的路径。Roo 会在聊天中显示预览,并且该文件会出现在你的文件浏览器中。

要求

  • OpenRouter 账户和 API 密钥
  • 互联网连接
  • 一个开放、可写入的工作区文件夹

配置

  1. 启用图像生成(实验性) 目的:打开此功能,以便 Roo 可以按需创建图像 默认:关闭 位置:设置 > 实验性
  2. OpenRouter API 密钥 目的:授权图像生成请求 默认:空(必需) 获取你的密钥:https://openrouter.ai/keys
  3. 图像生成模型 目的:选择用于生成的模型 默认:Gemini 2.5 Flash Image Preview 可用模型:目前仅限于 Gemini 2.5 Flash Image Preview 及其免费版本

使用图像生成

  1. 在聊天中,要求 Roo 生成图像并描述你想要的内容(主题、风格、灯光、构图)。
  2. 在提示时确认操作。Roo 可能会要求你选择一个保存路径(例如:images/sunset.png)。
  3. Roo 生成图像并保存。如果你不包含扩展名,将根据输出格式自动添加适当的扩展名(.png.jpg)。
  4. 在聊天中查看图像预览,并在你的工作区中找到该文件。

编辑现有图像

Roo 还可以转换和编辑工作区中的现有图像:

  1. 要求 Roo 编辑图像,描述你想要的转换
  2. 同时指定输入图像路径和保存结果的路径
  3. Roo 将对现有图像应用你请求的编辑

支持的输入格式:PNG、JPG、JPEG、GIF、WEBP

示例请求:

  • "将 photos/portrait.jpg 转换为水彩画,并另存为 art/watercolor-portrait.png"
  • "将 images/logo.png 放大并增强至更高分辨率"
  • "对 screenshots/app.png 应用复古滤镜"

注意:输入图像路径和输出路径都必须可访问(未被 .rooignore 阻止)

获得更好结果的技巧

具体化

在你的提示中包含以下元素:

  • 风格:艺术媒介、艺术运动或特定艺术家的风格
  • 情绪:情感基调、氛围
  • 调色板:特定的颜色或配色方案
  • 相机/灯光:角度、视角、灯光条件
  • 宽高比:尺寸或方向

限制

  • 实验性功能;可用性和模型列表有限
  • 目前仅限于 Gemini 2.5 Flash Image Preview 模型
  • 每次请求生成一张图像
  • 支持的输出格式:PNG 或 JPG
  • 支持的编辑输入格式:仅限 PNG、JPG、JPEG、GIF、WEBP
  • 图像路径必须可访问(未被 .rooignore 限制阻止)
  • 使用可能受你的 OpenRouter 计划限制和成本影响

状态

此功能为实验性,未来版本可能会更改或移除。通过 GitHub Issues 提供反馈。