API Tools / Function Call Gateway

本工程是一个中游 Gateway：位于三方上游 LLM API 与下游 coding-agent / SDK 客户端之间，负责协议转换、工具能力补齐、配置管理和长上下文治理。

上游：三方 API
  - Chat API：完全不支持 tools
  - Sub API：部分支持 tools / function call
  - Full API：完整支持 tools / function call / tool use

中游：本项目 Gateway
  - 协议转换
  - 工具桥接 / 本地真实执行
  - 上游能力配置
  - 上下文压缩、记忆、fan-out

下游：Codex / Claude Code / DeepSeek-TUI / OpenCode / OpenAI SDK / Anthropic SDK

原则：

可以 adapter，但不能 fake。
可以 fallback，但 fallback 必须连接真实工具 runtime 或真实 native-tools provider。

这套工程要解决什么

协议转换 下游可以使用 OpenAI Chat、OpenAI Responses、Anthropic Messages 三类接口；上游也可以是这三类格式之一。Gateway 在中间做请求/响应互转。
工具能力补齐 如果上游完全不支持 tools，或只部分支持 tools，Gateway 可以把工具定义以文本协议方式提供给上游模型，解析上游返回的文本工具调用，本地执行真实工具，再把真实结果回填继续生成。对下游来说，经过 Gateway 的请求仍然具备可编程、可工具调用的能力。
配置与能力声明 Gateway 提供 Web UI 和配置文件，用来管理上游 profile、下游 key、上游是否支持 tools、function calls、parallel tool calls、vision/识图、streaming、JSON schema、上下文窗口、工具权限、MCP、HTTP Actions 等。Admin UI 可通过上游 /v1/models 自动拉取模型列表。
长上下文 / 类无限上下文 Gateway 支持 token 估算、压缩、SQLite 记忆召回、超长输入 fan-out 分片与综合，让下游获得类似“无限上下文”的使用效果。

当前能力概览

能力	当前状态	主要模块
OpenAI Chat / Responses / Anthropic Messages 协议互转	已实现并有测试	`src/gateway_protocol.py`
HTTP API 入口、认证、ACL、错误映射	已实现并有测试	`src/gateway_http_handler.py`, `src/gateway_errors.py`
上游代理与路径映射	已实现	`src/gateway_proxy.py`, `src/gateway_config.py`
工具调用编排、多轮执行、文本 fallback	已实现并有测试	`src/gateway_tool_runtime.py`
内置 coding-agent 工具	已实现，当前 67 个唯一工具名	`src/gateway_builtin_tools.py`
MCP / HTTP Action 扩展	已实现基础能力	`src/gateway_mcp.py`, `src/gateway_http_actions.py`
流式 SSE 编排	已实现并有测试	`src/gateway_streaming.py`
上下文压缩、SQLite 记忆、fan-out	已实现并有测试	`src/gateway_context.py`
Admin UI / client config snippets / 上游模型自动获取	已实现并有测试	`src/gateway_admin.py`, `src/gateway_http_handler.py`

当前回归测试（以实际门禁输出为准）：

python3 -m compileall -q src tests
bash -n scripts/mimo_gateway.sh scripts/deploy.sh scripts/generate-ssl.sh scripts/claude_m1.sh scripts/install_deps.sh
git diff --check
python3 -m pytest -q
# 200 passed

本轮真实测试上游 / Mimo 兼容结论（2026-05-25，地址只保存在本地 ignored 配置或环境变量中）：

GET  /v1/models                         OK，返回 mimo-v2.5-pro 等模型
POST /v1/chat/completions               OK
POST /v1/responses                      OK
POST /v1/messages                       OK
POST /anthropic/v1/messages             上游直连 404（必须通过本 Gateway 的 /anthropic 别名）
POST /v1/tools/call / /v1/functions/call 上游直连 404（必须由本 Gateway 本地 tool runtime 执行）
POST /v1/messages + forced tool_choice   OK，可返回 Anthropic tool_use（例如 echo_probe）
POST /v1/responses + forced tool probe    未返回 function_call，仅 reasoning/message

正确接入方式：
Claude Code -> http://127.0.0.1:8885/anthropic -> Gateway adapter/orchestrate -> Mimo text reasoning
Codex       -> http://127.0.0.1:8885/v1        -> Gateway adapter/orchestrate -> Mimo text reasoning
工具执行     -> Gateway 本地真实 runtime / MCP / HTTP Actions；不是把 prompt 文本伪装成工具成功。
项目目录     -> 请求体显式 root 或下游客户端项目目录；不是 Gateway 服务启动目录。
Skills/插件  -> 先加载该项目目录的 skills 和项目内插件声明的 skills。

Mimo 上下文按 1M 配置：upstream.max_input_tokens=1048576，gateway/client_context_window=1048576。
已覆盖：Anthropic SSE tool_use.input 规范化为 input_json_delta；streaming adapter 本地 Read/Bash/Skill 确定性 smoke；direct `/v1/tools/call` / `/v1/functions/call`；Claude Code / Codex 项目目录识别；项目级 `.traces` 读取隔离；项目内 plugin skills；Memory/RecallMemory 项目根隔离；streaming passthrough 也会剥离 Gateway 内部 workspace 路由字段。
可复跑的项目级 smoke：`tests/integration/project_scope_cli_smoke.py`；`./scripts/mimo_gateway.sh verify` 已包含它，设置 `GATEWAY_VERIFY_REQUIRE_CLI=1` 时会把 Claude Code CLI 与 Codex CLI 也作为必过项。示例 artifact: `.gateway_runtime/project-scope-cli-smoke-20260525-035342/summary.json`，`pass=true`。

快速开始

# 1. 创建本地配置（已有 .gateway_service.json 时可跳过）
cp gateway.config.json .gateway_service.json
vi .gateway_service.json

# 至少确认这些值：
# - upstream.base_url=<你的真实测试上游地址> / upstream.model=mimo-v2.5-pro
# - upstream.tools_enabled=adapter，capabilities.supports_tools=false，supports_function_calls=false
#   说明：Mimo /v1/messages forced probe 可返回 tool_use，但 /anthropic 别名、direct tool endpoint、
#   Codex /v1/responses function_call 未证实；为了 Claude Code + Codex 一致稳定，默认仍走 Gateway adapter。
# - upstream.max_input_tokens=1048576，gateway.client_context_window=1048576
# - gateway.client_snippet_api_key 或环境变量 GATEWAY_DOWNSTREAM_KEY
# - admin.password 或环境变量 GATEWAY_ADMIN_PASSWORD
# - 下游项目目录优先来自请求体 workspace_root/gateway_workspace、Claude Code 的
#   Primary working directory/Worktree、Codex Responses 的 <environment_context><cwd>
# 注意：真实账号/API key 只放 .gateway_service.json 或环境变量，不提交。

# 2. 后台启动（默认端口 8885）
./scripts/mimo_gateway.sh start

# 3. 验证是否运行
curl http://127.0.0.1:8885/healthz
./scripts/mimo_gateway.sh status

默认入口：

API:       http://127.0.0.1:8885/v1/...
Admin UI:  http://127.0.0.1:8885/ui
管理员:    admin / admin（仅开发默认值；首次配置请改强密码）

启动 / 停止 / 排查命令

推荐统一走 scripts/mimo_gateway.sh，它会读取 .gateway_service.json，按需创建本地配置，并把日志写到 .gateway_runtime/gateway-8885.log。

# 后台启动：优先使用 screen；没有 screen 时退回 nohup
./scripts/mimo_gateway.sh start

# 前台运行：适合本地调试，Ctrl-C 退出
./scripts/mimo_gateway.sh foreground

# 查看当前监听、健康状态、日志路径
./scripts/mimo_gateway.sh status

# 查看日志
./scripts/mimo_gateway.sh logs

# 停止 / 重启
./scripts/mimo_gateway.sh stop
./scripts/mimo_gateway.sh restart

# macOS launchd 后台运行
GATEWAY_START_METHOD=launchd ./scripts/mimo_gateway.sh start

# 强制使用 nohup
GATEWAY_START_METHOD=nohup ./scripts/mimo_gateway.sh start

常用环境变量：

# 改端口 / 监听地址
GATEWAY_PORT=9000 GATEWAY_HOST=127.0.0.1 ./scripts/mimo_gateway.sh start

# 使用临时配置做 smoke，不影响默认 .gateway_service.json
TMPDIR=$(mktemp -d)
GATEWAY_CONFIG_PATH="$TMPDIR/config.json" \
GATEWAY_SQLITE_LOG_PATH="$TMPDIR/gateway_log.sqlite3" \
GATEWAY_DOWNSTREAM_KEY=smoke-key \
GATEWAY_ADMIN_PASSWORD=admin \
UPSTREAM_BASE_URL="http://127.0.0.1:9001" \
UPSTREAM_MODEL="smoke-model" \
python3 src/toolcall_gateway.py --host 127.0.0.1 --port 8899

如果不想触达真实测试上游，也可以先起一个本地弱上游 mock：

python3 scripts/mock_openai_upstream.py --port 9001 --model mimo-v2.5-pro
UPSTREAM_BASE_URL=http://127.0.0.1:9001 ./scripts/mimo_gateway.sh start

验活命令：

curl -fsS http://127.0.0.1:8885/healthz
curl -fsS -u admin:admin http://127.0.0.1:8885/ui >/dev/null
curl -fsS -u admin:admin http://127.0.0.1:8885/client-config.json >/dev/null

# 直接工具调用只依赖 Gateway 本地工具 runtime，不依赖上游模型：
curl -fsS http://127.0.0.1:8885/v1/tools/call \
  -H 'authorization: Bearer <your-gateway-key>' \
  -H 'content-type: application/json' \
  -d '{"tool":"calculator","arguments":{"expression":"6*7"}}'

/v1/models、/v1/chat/completions、/v1/responses、/v1/messages 需要 UPSTREAM_BASE_URL / API key 指向可访问的真实上游；未配置上游时，Gateway 自身可以启动，但这些上游转发接口会返回上游配置/连接错误。

下游接入

Claude Code

推荐用 Anthropic-compatible 前缀 /anthropic，这样 Claude Code 会请求 http://127.0.0.1:8885/anthropic/v1/messages，Gateway 会规范化到内部 /v1/messages 再按当前上游 profile 转发。不要把 Claude Code 直接指向真实测试上游：该上游没有 /anthropic/v1/messages 别名，也没有本地工具执行端点；即使 /v1/messages 强制探针可返回 tool_use，Claude Code 仍需要 Gateway 的别名、SSE 规范化和本地 runtime。

claude_mnative() {
    export ANTHROPIC_BASE_URL="http://127.0.0.1:8885/anthropic"
    export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1
    export ANTHROPIC_AUTH_TOKEN="your-gateway-key"
    export ANTHROPIC_API_KEY=""
    export ANTHROPIC_DEFAULT_OPUS_MODEL="mimo-v2.5-pro"
    export ANTHROPIC_DEFAULT_SONNET_MODEL="mimo-v2.5-pro"
    export ANTHROPIC_DEFAULT_HAIKU_MODEL="mimo-v2.5-pro"
    export ANTHROPIC_MODEL="mimo-v2.5-pro"
    export ANTHROPIC_SMALL_FAST_MODEL="mimo-v2.5-pro"
    export ENABLE_LSP_TOOL="1"
    local claude_bin="${CLAUDE_BIN:-$(command -v claude 2>/dev/null || true)}"
    if [ -z "$claude_bin" ]; then echo "Claude binary not found; set CLAUDE_BIN" >&2; return 127; fi
    "$claude_bin" --dangerously-skip-permissions "$@"
}

# 非交互验活
claude_mnative -p "Reply with OK only."

兼容说明：Gateway 同时接受 Authorization: Bearer <key> 和 x-api-key: <key>； /anthropic/v1/messages 与 /anthropic/v1/messages/count_tokens 会映射到对应的 /v1/messages 与 /v1/messages/count_tokens。

Codex / OpenCode / DeepSeek-TUI / OpenAI SDK

export OPENAI_BASE_URL="http://127.0.0.1:8885/v1"
export OPENAI_API_KEY="your-gateway-key"
# Codex 建议 wire_api=responses；base_url 指本 Gateway /v1，不要直连 Mimo 上游。

Codex config.toml 片段：

model_provider = "gateway"
model = "mimo-v2.5-pro"
model_reasoning_effort = "xhigh"
model_context_window = 1048576
model_max_output_tokens = 131072

[model_providers.gateway]
name = "gateway"
base_url = "http://127.0.0.1:8885/v1"
env_key = "OPENAI_API_KEY"
wire_api = "responses"

Python SDK 示例：

from openai import OpenAI
client = OpenAI(base_url="http://127.0.0.1:8885/v1", api_key="your-gateway-key")

API 端点

端点	方法	说明
`/healthz`	GET	健康检查
`/ui`	GET	Admin UI
`/client-config`	GET	下游客户端配置片段
`/admin/upstream-models.json`	GET/POST	Admin 鉴权后拉取上游 `/v1/models`；GET 只用已保存 active profile，POST 可用表单临时配置
`/v1/models`	GET	模型列表
`/v1/chat/completions`	POST	OpenAI Chat
`/v1/responses`	POST	OpenAI Responses
`/v1/messages`	POST	Anthropic Messages
`/anthropic/v1/messages`	POST	Claude Code / Anthropic SDK base URL 兼容别名，内部映射到 `/v1/messages`
`/v1/messages/count_tokens`	POST	Anthropic token count 兼容
`/anthropic/v1/messages/count_tokens`	POST	Anthropic token count 兼容别名
`/v1/chat/completions/count_tokens`	POST	Chat token count 兼容
`/v1/tools/call`	POST	直接工具调用
`/v1/functions/call`	POST	直接工具调用兼容路径
`/tools/call`	POST	直接工具调用兼容路径（无 `/v1` 前缀）

当前代码结构

src/
├── toolcall_gateway.py       # 兼容入口；导入时映射到 gateway_app
├── gateway_app.py            # 主入口 + 旧单体兼容重导出层
├── gateway_config.py         # 配置、上游 profile、路径映射、能力开关
├── gateway_errors.py         # 统一错误类型和 error payload
├── gateway_http_handler.py   # HTTP 路由、下游 key 认证、ACL、错误映射
├── gateway_admin.py          # Admin UI / client config 页面渲染
├── gateway_protocol.py       # 三协议请求/响应/工具格式转换
├── gateway_proxy.py          # 上游 HTTP 客户端
├── gateway_tool_runtime.py   # 工具解析、规范化、多轮编排、直接调用
├── gateway_builtin_tools.py  # 内置工具真实实现
├── gateway_streaming.py      # SSE 流式编排与事件转换
├── gateway_context.py        # token 估算、压缩、记忆、fan-out
├── gateway_mcp.py            # MCP client / tools/list / tools/call
├── gateway_http_actions.py   # HTTP Action executor
├── gateway_logging.py        # SQLite / JSONL 日志、统计、失败记录
└── gateway_computer_use.py   # GUI / computer-use 辅助工具

文档索引

文档	用途
`docs/ARCHITECTURE.md`	上游/中游/下游定位、模块边界、请求流程
`docs/CURRENT_AUDIT.md`	当前审计结论、风险点核验、已修复项
`docs/RUNNING_AND_TESTING.md`	部署、配置、启动、测试
`docs/gateway-admin-ui-config.md`	Admin UI、下游 key、能力配置
`docs/gateway-infinite-context-memory.md`	长上下文、SQLite 记忆、fan-out
`docs/full-gateway-tool-runtime-marketplace.md`	完整 Tool Runtime / Marketplace 方案
`docs/coding-agent-builtin-tools-implementation.md`	内置 coding-agent 工具实现

重要边界

Gateway 不把假的 tool result 伪装成真实成功。
真实测试上游 / Mimo 直连缺少 /anthropic 别名和 direct tools endpoint；/v1/messages forced probe 可返回 Anthropic tool_use，但 Codex /v1/responses function_call 未证实。因此 Claude Code/Codex 默认由本 Gateway 的 adapter/orchestrate + 本地真实工具 runtime 提供稳定工具能力；真实地址只放本地 .gateway_service.json、.env 或运行时环境变量，不写入提交代码。
文本 fallback 只是一种弱上游兼容方式；工具仍由 Gateway/MCP/HTTP Action/真实 executor 执行。
Gateway 是中游服务，不能把服务启动目录当作用户项目目录；工具读写、项目级 .traces、SQLite 记忆隔离、Skills/插件都以当前请求解析出的下游项目根为准。Memory/RecallMemory 默认也只读写当前项目根，避免服务目录或其他项目记忆串入。
workspace_root / gateway_workspace / projectDir / cwd 等字段只作为 Gateway 内部路由信号；普通转发和 streaming passthrough 都会在上游请求前剥离，metadata JSON 字符串和 metadata.user_id 内嵌 JSON 里的同类字段也会清理。
Skill/list_skills/read_skill/run_skill 是真实 Gateway 工具；项目内 skills 优先，服务 cwd 下的 skills 不会串入另一个项目，用户全局 skills 和显式 GATEWAY_SKILLS_DIRS 在项目目录之后加载。
项目内插件只读取当前项目根下 .codex/plugins、.claude/plugins、.opencode/plugins、plugins 中 manifest 声明的 skills，且 skills 路径必须仍在项目根内。
写文件、Shell、GUI、网络类工具要通过配置显式授权；公开模板和 Docker 默认关闭写入/Shell。
admin.password 模板字段会在加载/保存时转换为 password_hash，避免明文密码被回写。
gateway.client_snippet_api_key 会自动同步成可认证的 downstream key，避免复制出的客户端配置不可用。
上游 tools_enabled=auto 会结合 upstream.capabilities.supports_tools / supports_function_calls 判断是否发送原生 tools；若能力关闭，会自动走本地真实工具文本适配，native_only 则会 fail-fast。
gateway.text_tool_adapter_compact_token_limit 是弱上游文本工具适配前的压缩阈值上限（默认 48000）；实际阈值动态计算为 max(8000, min(upstream.max_input_tokens * 0.45, 此值))，设为 0 可关闭。
已存在配置文件如果 JSON 损坏或根节点不是对象，会 fail closed 返回结构化 500；不会回退到默认 admin/admin 或无下游鉴权。
请求/响应日志和 Admin 配置展示会递归遮盖常见敏感字段（token、secret、password、cookie、API key、key hash 等），避免运维面泄漏凭据。
Admin 写操作会拒绝跨源浏览器 Origin/Referer 请求；无来源头的 CLI/脚本请求仍保持兼容。
HTTP POST 请求体有读取前上限，默认 64MB；可通过 gateway.max_request_body_bytes / GATEWAY_MAX_REQUEST_BODY_BYTES 调整，超限返回 413。
请求/响应日志和 tool failure 内容会先遮盖敏感字段，再按 gateway.max_log_payload_chars / GATEWAY_MAX_LOG_PAYLOAD_CHARS 截断，避免 SQLite/JSONL 膨胀。
gateway_app.py 当前保留旧单体兼容导出层，新增实现应优先放入对应 gateway_* 模块。

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
config		config
docs		docs
examples		examples
nginx		nginx
scripts		scripts
src		src
tests		tests
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
docker-compose.prod.yml		docker-compose.prod.yml
docker-compose.yml		docker-compose.yml
gateway.config.json		gateway.config.json
gateway.config.yaml		gateway.config.yaml
hermes-skill-deps.sh		hermes-skill-deps.sh
mcp_defaults.yaml		mcp_defaults.yaml
requirements.txt		requirements.txt
tool_gateway_audit_report.md		tool_gateway_audit_report.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

API Tools / Function Call Gateway

这套工程要解决什么

当前能力概览

快速开始

启动 / 停止 / 排查命令

下游接入

Claude Code

Codex / OpenCode / DeepSeek-TUI / OpenAI SDK

API 端点

当前代码结构

文档索引

重要边界

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

API Tools / Function Call Gateway

这套工程要解决什么

当前能力概览

快速开始

启动 / 停止 / 排查命令

下游接入

Claude Code

Codex / OpenCode / DeepSeek-TUI / OpenAI SDK

API 端点

当前代码结构

文档索引

重要边界

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages