仪表盘
队列状态
后端服务概览
| 名称 | 地址 | 状态 | 连接数 | 请求总量 | 失败数 |
|---|
自适应调度指标
| 后端 | 平均延迟 | 错误率 | 吞吐量 | 评分 | 趋势 |
|---|
重试统计
任务管理
| 我们返回的 ID | 后端 ID (grok2api) | 状态 | 服务 | 路径 | 方法 | 优先级 | 重试 | 生成结果 | 创建时间 |
|---|
服务管理
添加服务
| 名称 | 目标地址 | API Key | 权重 | 最大并发 | 健康 | 连接数 | 请求 | 失败 | 操作 |
|---|
OpenAI 兼容接口
接口基址
可用模型数
-
API Keys
-
兼容端点
OpenAI API
| 方法 | 路径 | 说明 |
|---|---|---|
| POST | /v1/chat/completions | 聊天补全(支持 stream: true) |
| POST | /v1/completions | 文本补全 |
| POST | /v1/embeddings | 文本向量 |
| GET | /v1/models | 列出可用模型 |
可用模型
| 模型 ID | 路由到 | 后端状态 |
|---|
快速测试
并发设置
Worker 数量 -
Worker 是后台消费队列的并行协程。增加 Worker 可处理更多并发任务;减少 Worker 会取消多余协程(正在处理的任务会自动重试)。
20
个
推荐:视频密集型 → 10–30 | 聊天密集型 → 30–100
队列容量 -
队列满时新请求直接返回 429。适当调大可接受更多突发请求,但队列过大会导致任务等待时间极长。
个任务槽
按类型并发上限 -
按请求中的 model 类型(含 video / image / chat)分别限制最大并发数,超出时返回 429。填 0 表示该类型不限制。仅影响内存中的运行时配置,重启服务后将从 config.yaml 重新加载。
视频 (video) 0=无限制
图像 (image) 0=无限制
聊天 (chat) 0=无限制
限流器 -
令牌桶限流:每秒向桶中补充令牌,桶满时停止补充。单个请求消耗一个令牌,令牌不足时等待(最多 8 秒)或返回 429。
每秒补充令牌数 (RPS)
桶容量 (突发上限)
运行时配置
当前配置 (来自 config.yaml)
加载中...