中转服务器 · 管理后台

仪表盘

队列状态

后端服务概览

名称	地址	状态	连接数	请求总量	失败数

自适应调度指标

后端	平均延迟	错误率	吞吐量	评分	趋势

重试统计

任务管理

我们返回的 ID	后端 ID (grok2api)	状态	服务	路径	方法	优先级	重试	生成结果	创建时间

服务管理

添加服务

名称	目标地址	API Key	权重	最大并发	健康	连接数	请求	失败	操作

OpenAI 兼容接口

接口基址

可用模型数

-

API Keys

-

兼容端点 OpenAI API

可用模型

模型 ID	路由到	后端状态

快速测试

并发设置

Worker 数量 -

Worker 是后台消费队列的并行协程。增加 Worker 可处理更多并发任务；减少 Worker 会取消多余协程（正在处理的任务会自动重试）。

20 个

推荐：视频密集型 → 10–30 ｜聊天密集型 → 30–100

队列容量 -

队列满时新请求直接返回 429。适当调大可接受更多突发请求，但队列过大会导致任务等待时间极长。

个任务槽

按类型并发上限 -

按请求中的 model 类型（含 video / image / chat）分别限制最大并发数，超出时返回 429。填 0 表示该类型不限制。仅影响内存中的运行时配置，重启服务后将从 config.yaml 重新加载。

视频 (video) 0=无限制

图像 (image) 0=无限制

聊天 (chat) 0=无限制

限流器 -

令牌桶限流：每秒向桶中补充令牌，桶满时停止补充。单个请求消耗一个令牌，令牌不足时等待（最多 8 秒）或返回 429。

每秒补充令牌数 (RPS)

桶容量 (突发上限)

运行时配置

当前配置 (来自 config.yaml)

加载中...