Lzh on GitHub

费率限制和成本

了解和管理 API 使用对于获得流畅且经济高效的 Roo Code 体验至关重要。本节解释了如何跟踪您的令牌使用和成本。费率限制默认为 0(禁用),通常无需调整,现在已按配置文件进行配置;有关如何在需要时设置它们的详细信息,请参阅 API 配置文件 文档。

了解和管理 API 使用对于获得流畅且经济高效的 Roo Code 体验至关重要。本节解释了如何跟踪您的令牌使用成本费率限制默认为 0(禁用),通常无需调整,现在已按配置文件进行配置;有关如何在需要时设置它们的详细信息,请参阅 API 配置文件 文档。

令牌使用

Roo Code 使用令牌与 AI 模型交互。令牌本质上是单词的片段。在请求和响应中使用的令牌数量会影响处理时间和成本。

  • 输入令牌:这些是您提示中的令牌,包括系统提示、您的指令以及提供的任何上下文(例如,文件内容)。
  • 输出令牌:这些是 AI 模型在其响应中生成的令牌。

您可以在聊天历史记录中看到每次交互使用的输入和输出令牌数量。

成本计算

大多数 AI 提供商根据使用的令牌数量收费。定价因提供商和特定模型而异。

Roo Code 会根据配置模型的定价自动计算每次 API 请求的估计成本。此成本显示在聊天历史记录中,在令牌使用旁边。

注意:

  • 成本计算是一个估计值。实际成本可能会因提供商的计费方式而略有不同。
  • 一些提供商可能提供免费套餐或积分。请查看您的提供商文档以获取详细信息。
  • 一些提供商提供提示缓存,这大大降低了成本。

限制自动批准的请求

为了进一步帮助管理 API 成本并防止意外开销,Roo Code 为自动批准的操作包含了“最大请求数”设置。这允许您定义 Roo Code 在任务期间无需您的明确重新批准即可进行的连续 API 调用的特定限制。

  • 工作原理:如果您设置了限制(例如,5 个请求),Roo Code 将执行最多 5 个自动批准的 API 调用。在进行第 6 个调用之前,它将暂停并提示您“重置并继续”,如下所示。
    • 当达到自动批准的请求限制时的通知截图。
  • 配置:此限制在“自动批准操作”设置中配置。您可以设置一个特定数字或选择“无限制”。有关配置此设置和其他自动批准设置的详细步骤,请参阅自动批准操作文档。
    • 设置自动批准操作的“最大请求数”的截图。

此功能提供了额外的保护措施,特别是对于涉及多个 API 调用的复杂或长期运行的任务。

优化令牌使用的技巧

  • 保持简洁:在您的提示中使用清晰简洁的语言。避免不必要的词语或细节。
  • 仅提供相关上下文:有选择地使用上下文提及(@file.ts@folder/)。只包含与任务直接相关的文件。
  • 分解任务:将大型任务分解为更小、更集中的子任务。
  • 使用自定义指令:提供自定义指令以指导 Roo Code 的行为,并减少在每个提示中进行冗长解释的需要。
  • 选择正确的模型:某些模型比其他模型更具成本效益。考虑使用更小、更快的模型来处理不需要更大模型全部能力的任务。
  • 使用模式:不同的模式可以访问不同的工具,例如Architect无法修改代码,这使得它在分析复杂代码库时是一个安全的选择,而无需担心意外地允许昂贵的操作。
  • 如果未使用 MCP,则禁用它:如果您不使用 MCP(模型上下文协议)功能,请考虑 在 MCP 设置中禁用它,以显著减小系统提示的大小并节省令牌。

通过了解和管理您的 API 使用,您可以有效且高效地使用 Roo Code。