什么是 CodexCodex 是 OpenAI 推出的 AI 编程代理coding agent它不同于简单的代码补全工具。Codex 能够在终端中直接理解项目上下文、执行命令、修改文件、创建 PR像一个真正的开发伙伴一样工作。目前 Codex 有三个形态Codex CLI基于命令行的 AI 编程代理开源且本地运行Codex IDE集成到 VS Code、Cursor、Windsurf 等编辑器的插件Codex Web基于云的 Codex 智能体通过 ChatGPT 界面访问其中 CLI 版本是开源的核心也是这次「任意模型接入」能力的主阵地。OSS 模式是什么OSS 模式全称 Open-Source Mode是 Codex CLI 内置的一个运行模式。开启后Codex 不再依赖 OpenAI 的专有模型而是允许用户指定任何兼容 OpenAI API 的后端服务作为模型引擎。这意味着你可以在完全离线的环境下使用 Codex无需连接 OpenAI你可以自由选择模型Qwen、Llama、DeepSeek、Mistral 等你可以在自己的硬件上运行数据不出本地你可以通过 OpenRouter 等网关使用多种商业或开源模型快速上手 OSS 模式安装 Codex CLI如果已安装 Codex CLI请跳过此步骤。使用一行命令即可完成安装curl -fsSL https://chatgpt.com/codex/install.sh | sh也支持 npm 和 Homebrew 安装npm install -g openai/codex # 或者 brew install --cask codex启动 OSS 模式Codex CLI 提供了两种方式进入 OSS 模式方式一命令行参数直接在启动时加上--oss标志codex --oss此时 Codex 会使用默认 OSS 配置连接本地 Ollama 服务localhost:11434并使用gpt-oss:20b模型。方式二通过配置文件编辑~/.codex/config.toml配置自定义模型提供商model gpt-oss:120b model_provider ollama然后直接运行codex即可。内置模型名称Codex 为 OSS 模式内置了几个模型别名模型名说明gpt-oss:20b20B 参数的轻量级 OSS 模型gpt-oss:120b120B 参数的高性能 OSS 模型gpt-oss:120b-cloud云端托管的 120B 模型这些名称会映射到你实际选择的后端模型上Codex 会根据名称选择合适的元数据配置。自定义模型提供商核心配置Codex 的真正威力在于config.toml中的[model_providers]配置段。你可以定义任意数量的自定义提供者。配置语法以下是一个完整的配置示例# 选择使用的模型和提供者 model qwen2.5-coder:32b model_provider ollama model_reasoning_effort high # 定义模型提供者 [model_providers.ollama] name Ollama base_url http://localhost:11434/v1 wire_api responses [model_providers.lmstudio] name LM Studio base_url http://localhost:1234/v1 wire_api responses [model_providers.openrouter] name OpenRouter base_url https://openrouter.ai/api/v1 wire_api responses experimental_bearer_token your-openrouter-api-key关键配置项说明model模型名称可以是任意字符串Codex 会传递给后端model_provider指向下方定义的提供者 IDmodel_reasoning_effort推理强度可选low、medium、highbase_urlAPI 服务的完整地址支持远程地址wire_apiAPI 协议类型responsesOpenAI Responses API或chatChat Completions APIexperimental_bearer_token认证令牌用于需要 API Key 的服务实战接入各种模型服务使用 Ollama本地Ollama 是目前最流行的本地模型运行工具。配置如下model qwen2.5-coder:32b model_provider ollama [model_providers.ollama] name Ollama base_url http://localhost:11434/v1 wire_api responsesCodex 会自动检测本地安装的 Ollama。确保 Ollama 正在运行Codex 就能直接使用。使用 DeepSeekDeepSeek 提供了与 OpenAI 兼容的 API 接口国内可直接访问无需魔法model deepseek-coder model_provider deepseek [model_providers.deepseek] name DeepSeek base_url https://api.deepseek.com/v1 wire_api responses experimental_bearer_token sk-你的DeepSeek-API-KeyDeepSeek 的编码模型在编程任务上表现出色且国内访问延迟低非常适合作为 Codex 的日常推理引擎。使用 OpenRouter云端网关OpenRouter 提供了访问上百种模型的统一入口包括 Claude、Gemini、DeepSeek、Mistral 等model anthropic/claude-sonnet-4-20250514 model_provider openrouter [model_providers.openrouter] name OpenRouter base_url https://openrouter.ai/api/v1 wire_api responses experimental_bearer_token sk-or-v1-你的Key使用自定义 OpenAI 兼容服务如果你有自己的模型推理服务如 vLLM、TGI、SGLang 等部署的model my-custom-model model_provider self-hosted [model_providers.self-hosted] name Self-Hosted base_url http://192.168.1.100:8080/v1 wire_api responses experimental_bearer_token local-dev-keyProfiles 配置 多模型自由切换Codex 支持 Profiles 机制可以同时定义多组模型配置随时切换# 默认配置 model gpt-oss:120b model_provider ollama # 定义提供者 [model_providers.ollama] name Ollama base_url http://localhost:11434/v1 wire_api responses [model_providers.openrouter] name OpenRouter base_url https://openrouter.ai/api/v1 wire_api responses experimental_bearer_token sk-or-v1-xxx # 定义 Profiles [profiles.fast-coder] model qwen2.5-coder:7b model_provider ollama model_reasoning_effort low [profiles.reasoning] model deepseek/deepseek-r1 model_provider openrouter model_reasoning_effort high使用 Profile 启动