OpenAI Codex 完全指南:从入门到精通(2026年6月版)
OpenAI Codex 完全指南从入门到精通2026年6月版一句话总结Codex 是 OpenAI 推出的 AI Agent 编程助手能自主完成代码编写、文件操作、浏览器控制、图像生成、远程操控等任务。它既是开发者的实习生也是非技术人员的万能助手。 目录Codex 是什么准备工作与安装界面与基础操作核心能力详解高级功能Codex vs Claude Code 对比定价与使用限制实战技巧与最佳实践常见问题 FAQ资源与延伸阅读1. Codex 是什么1.1 产品定位Codex 是OpenAI 推出的智能体Agent编程系统它不仅仅是一个代码补全工具而是一个能够✅自主编写代码根据自然语言描述生成完整功能✅操作本地文件读取、修改、重命名、整理你的电脑文件✅控制浏览器自动浏览网页、填写表单、抓取数据✅操控电脑界面像人一样点击、输入、操作任何 macOS/Windows 应用✅生成图像创建产品 mockup、UI 设计图、游戏素材✅远程控制通过手机 ChatGPT App 控制电脑上的 Codex 工作✅并行处理同时运行多个任务大幅提升效率1.2 技术演进时间版本关键特性2021Codex (初代)powering GitHub Copilot2025.05codex-1 / codex-mini基于 o3 微调的编程 Agent2025.12GPT-5.2-Codex首次引入 Computer Use2026.02Codex App (macOS)桌面应用、多 Agent 管理2026.04GPT-5.5Agentic-first 训练浏览器控制2026.05Windows 支持Computer Use 上线 Windows2026.06Record Replay录制工作流转为可复用 Skill截至 2026 年 6 月每周约有 500 万开发者在使用 Codex。1.3 使用场景Codex 适合以下人群人群典型用途编程新手零基础学习编程、快速搭建原型全栈开发者并行开发、自动化测试、代码重构设计师/产品经理生成 UI mockup、自动化设计流程内容创作者批量处理文件、生成图像、自动化发布运营/市场数据分析、自动化报表、广告投放非技术人员用自然语言完成复杂电脑操作2. 准备工作与安装2.1 前置条件一个ChatGPT 账号免费版可用但额度少Plus/Pro 体验更好macOS完整功能或 WindowsComputer Use 已支持Node.js 18如需使用 CLI2.2 安装方式方式一桌面应用推荐新手访问官网https://chatgpt.com/codex/get-started/点击 “Download for macOS”Windows 用户也可下载安装后使用 ChatGPT 账号登录方式二CLI 命令行推荐开发者# 1. 全局安装npminstall-gopenai/codex# 2. 登录会打开浏览器授权codex login# 3. 验证安装codex--version# 4. 进入项目目录开始使用cd~/projects/your-project codexAdd a unit test for the parseDate function方式三IDE 扩展VS Code / Cursor 扩展商店搜索 “OpenAI Codex”安装后登录同一 OpenAI 账号即可使用2.3 首次设置首次打开 Codex 时会询问你的职业方向工程 / 产品 / 财务 / 市场营销销售 / 运营 / 数据科学 / 设计学生 / 其他建议随便选一个后续可以随时修改。选择后会推荐个性化的任务模板。3. 界面与基础操作3.1 主界面布局Codex 桌面应用采用三栏式布局┌─────────────────┬─────────────────────────┬─────────────────┐ │ 左侧边栏 │ 中间对话区 │ 右侧预览区 │ │ ├ 新对话 │ │ │ │ ├ 搜索 │ 我们该做什么 │ 结果预览/文件 │ │ ├ 插件 │ │ │ │ ├ 自动化 │ [输入框] │ │ │ └ 项目 │ 推荐任务... │ │ └─────────────────┴─────────────────────────┴─────────────────┘3.2 核心概念项目Project项目是 Codex 工作的基本单位。你可以新建空白项目从零开始使用现有文件夹让 Codex 读取和操作你电脑上的任何文件夹关键特性选中文件夹后Codex 可以读取其中不限数量的文件这是普通 ChatGPT 做不到的。3.3 对话输入技巧Codex 支持多种输入方式输入方式用法示例自然语言直接描述需求“把这段代码重构为 TypeScript” 提及引用插件或文件“github 查看最近的 PR”/ 命令使用内置命令“/mcp connect github”$ Skill调用预设技能“$adspirer-setup”拖拽文件直接上传文件拖拽图片、PDF、代码文件语音输入点击麦克风图标口述复杂指令4. 核心能力详解4.1 能力一本地文件操作 ⭐Codex 可以自主读取和操作本地文件不限数量。实战示例批量重命名视频素材场景文件夹里有 80 个命名混乱的视频素材如yellow_lunar_surface_training_sim_alpha_03.mp4想根据内容重命名为可读名称。操作步骤点击 “进入项目工作” → “使用现有文件夹”选中素材文件夹输入指令“请分析每个视频的内容根据画面内容重命名所有文件使用中文描述”Codex 会自动读取视频、分析内容、执行重命名其他文件操作 批量整理文件分类 批量提取 PDF/Word 内容并汇总 分析 Excel/CSV 数据并生成报告️ 批量处理图片压缩、格式转换、添加水印4.2 能力二代码编写与调试 ⭐Codex 的核心能力支持多种模式模式说明适用场景Ask 模式只读分析不修改代码代码审查、学习代码库Code 模式全功能可读写运行开发新功能、修复 BugPlan 模式先出方案再执行复杂重构、架构调整实战示例修复 Bug你修复 auth/ 目录下所有失败的测试 Codex 1. 读取测试文件定位失败用例 2. 分析失败原因如异步处理错误 3. 修改源代码 4. 重新运行测试验证 5. 返回修改摘要和 diff4.3 能力三浏览器控制Browser UseCodex 内置浏览器可以 打开本地开发服务器实时预览修改 抓取网页数据需遵守 robots.txt 在渲染页面上直接标注“把这个按钮改大 20px” 自动化测试前端界面限制目前仅限未登录的公开页面完整浏览器控制正在开发中。4.4 能力四电脑操控Computer Use⭐⭐这是 Codex 的王牌功能它可以像人一样操控你的电脑️看屏幕截取屏幕理解当前界面状态️点击输入自动点击按钮、填写表单、输入文字多应用协作同时操作 Figma、Xcode、Slack 等多个应用⚡后台运行你继续工作Codex 在后台自动完成任务实战场景 在 Figma 中自动调整设计稿 在 iOS 模拟器中测试 App 修复只有 GUI 才能复现的 Bug 操作 Excel 生成复杂报表⚠️注意Computer Use 需要手动开启且初始不支持欧盟/英国/瑞士地区。4.5 能力五图像生成Codex 集成了 gpt-image-1.5 模型可以 生成产品 hero 图、UI mockup️ 根据截图修改设计“把背景改成深色模式” 创建游戏素材、图标 生成架构图、流程图⚠️ 图像生成消耗额度较快约为文本任务的 3-5 倍。4.6 能力六Skill技能系统Skill 是 Codex 的外挂让 Agent 能执行特定领域的复杂任务。内置 Skill 示例Skill功能Cloud Deployment自动部署到 Cloudflare、Vercel、NetlifyImage Generation生成和编辑图像API Documentation自动引用最新 OpenAI API 文档Document Handling读写 PDF、Excel、Word自定义 Skill你可以创建自己的 Skill封装特定工作流程# 创建 Skill 目录 mkdir -p ~/.codex/skills/my-skill # 编写 SKILL.md 定义任务流程 # 包含指令、代码模板、API 配置、脚本Skill 可以提交到团队仓库确保所有成员共享相同的工作流程。4.7 能力七MCP模型上下文协议MCP 是 Codex 连接外部世界的通用接口由 Anthropic 开源现已成为行业标准。支持的 MCP ServerGitHub、Notion、Slack、LinearPostgres、MongoDB、RedisGoogle Calendar、Gmail以及数千个社区 MCP Server安装 MCP Server# 从 Registry 安装codex mcpinstallgithub# 添加自定义 Servercodex mcpaddnotion--command/usr/local/bin/notion-mcp# 查看已安装codex mcp list使用示例 /mcp connect github 找仓库里所有动了 apps/billing 的 open PR总结一下 review 状态4.8 能力八Hook 与自动化Hook 让 Codex 在特定生命周期事件时自动执行命令# .codex/hooks.toml [[hooks]] event pre-commit command pnpm run lint:fix description 提交前自动修复代码格式 [[hooks]] event post-edit command pnpm test -- --findRelatedTests $CODEX_EDITED_FILES description 每次编辑后运行相关测试Auto-review自动审查[auto_review] enabled true reviewer_model gpt-5.4 block_on_severity high开启后每次提交前会启动第二个 Codex Agent 审查代码拦截约 1/8 的潜在回归问题。4.9 能力九子代理SubagentsCodex 支持最多 8 个并行子代理同时工作主 Agent 分解任务 ├─ 子 Agent 1: 研究 Stripe SDK 模式 ├─ 子 Agent 2: 编写核心代码等研究完成 ├─ 子 Agent 3: 编写测试并行 ├─ 子 Agent 4: 更新文档并行 └─ ...每个子代理在独立的云沙箱中运行互不干扰。4.10 能力十Goal 模式长期任务Goal 模式让 Codex 可以处理跨天甚至跨周的长期任务 设置持久目标Codex 自动规划执行步骤⏰ 定时唤醒继续未完成的任务 Memories 记住跨会话的上下文使用方式/goal 每周一早上 9 点生成上周所有平台的广告性能报告 对比 KPI 目标标记异常发送摘要到 Slack5. 高级功能5.1 远程控制手机端Codex 支持通过手机 ChatGPT App 远程控制电脑 在 iOS/Android ChatGPT App 上发送指令 电脑上的 Codex 接收并执行 实时推送任务进度和结果使用场景下班路上让 Codex 开始跑测试出差时远程修复线上 Bug睡前设置明天的自动化任务5.2 Chrome 扩展2026 年 5 月推出的 Chrome 扩展让 Codex 可以在浏览网页时一键将当前页面内容发送给 Codex 分析在网页上直接标注修改建议抓取页面数据并自动处理5.3 Record Replay录制回放2026 年 6 月新功能你手动演示一遍工作流程Codex 自动记录操作步骤转换为可复用的 Skill以后一键自动执行相同流程5.4 Thread Handoff线程移交可以在本地和远程主机之间移交任务线程在公司电脑上开始任务回家后在家里的电脑上继续Codex 自动协调上下文同步5.5 Appshots截图转上下文macOS 专属功能截取任何应用窗口Codex 自动理解截图内容基于截图内容执行操作6. Codex vs Claude Code 对比两者都是顶级 AI Agent 工具但定位不同维度CodexClaude Code模型GPT-5.5只能 GPTClaude Opus 4.8可替换易用性⭐⭐⭐ 小白友好⭐⭐ 重度开发者功能浏览器电脑操控生图远控适合专业开发者价格$20/月够用API 计费消耗快代码质量盲评胜率 25%盲评胜率 67%Token 效率约 4x 更高效基准Terminal-Bench82.7% 69.4%SWE-bench Pro58.6%69.2% 上下文窗口200K tokens1M tokens 多代理8 并行子代理Agent Teams协调式开源✅ Apache-2.0❌ 闭源MCP 支持✅✅更丰富Hook 粒度生命周期级更细粒度PreToolUse 等选择建议你的情况推荐工具原因编程新手 / 非技术人员Codex界面友好功能全面需要操控 GUI 应用CodexComputer Use 独一档预算敏感CodexToken 效率更高高 stakes 代码支付/安全Claude Code代码质量更高超大代码库Claude Code1M 上下文窗口复杂多代理编排Claude CodeAgent Teams 更成熟两者都要都用“Claude 做架构Codex 敲代码”业内共识65% 的开发者日常更喜欢用 Codex但盲评代码质量时 Claude Code 胜出 67%。最佳实践是两者结合使用。7. 定价与使用限制7.1 订阅方案方案月费Codex 权限备注Free$0有限试用额度极少Go$8基础访问轻量用户Plus$20完整访问大多数用户够用Pro$100GPT-5.5 Pro 5x 额度重度用户Pro Max$20020x 额度团队/企业Business$25/人团队协作企业功能Enterprise定制全部功能安全合规7.2 API 直接计费CLI 用户模型输入 / 1M tokens输出 / 1M tokensGPT-5.5$5$30GPT-5.5 Pro$30$180codex-mini$1.50~$157.3 使用限制任务时长通常 1-30 分钟复杂任务可达数小时并行任务最多 8 个子代理同时运行互联网访问Plus/Pro/Team 可选开启支持域名白名单地区限制Computer Use 暂不支持欧盟/英国/瑞士8. 实战技巧与最佳实践8.1 编写有效的 AGENTS.mdAGENTS.md 是 Codex 的项目说明书帮助 Agent 理解你的项目# Project Context ## 架构 - 前端Next.js TypeScript - 后端Node.js Express - 数据库PostgreSQL ## 代码规范 - 使用 TypeScript strict mode - 所有 API 调用通过 /lib/api - 状态管理使用 Zustand - 不允许使用 any 类型 ## 测试 - 新代码必须写测试TDD - 覆盖率不低于 80% - 使用 React Testing Library ## 关键路径 - 入口src/app/page.tsx - APIsrc/app/api/ - 组件src/components/8.2 Prompt 技巧❌ 不好的 Prompt✅ 好的 Prompt“修复这个 Bug”“修复 auth/login.ts 中导致 401 错误的 Bug保留现有日志格式”“写个功能”“在 src/features/ 下添加用户收藏功能包含模型、API、前端组件、测试”“优化代码”“将 src/utils/date.ts 中的 parseDate 函数重构为使用 date-fns保持 API 兼容”8.3 安全最佳实践永远审查 AI 生成的代码尤其是涉及支付、认证、安全的部分使用只读模式先了解代码库再开启编辑权限设置域名白名单限制互联网访问开启 Auto-review拦截潜在回归敏感代码不要上传到云沙箱使用本地 CLI8.4 效率提升技巧并行任务同时提交多个独立任务让子代理并行处理使用 Skill将重复工作流封装为 Skill一键执行Goal 模式设置长期目标让 Codex 自动规划模板提示为常见任务准备标准 Prompt 模板小步快跑复杂任务拆分为小步骤逐步验证9. 常见问题 FAQQ1: Codex 会取代程序员吗不会。Codex 是软件工程实习生级别的助手能加速开发但必须人工审查。它擅长✅ 样板代码、重复工作✅ 快速原型和探索✅ 自动化测试和文档❌ 架构设计、复杂算法、安全关键代码Q2: 免费版能用 Codex 吗可以但额度非常有限。建议至少使用 Plus$20/月获得完整体验。Q3: Codex 能访问我的私有代码库吗可以。CLI 版本在本地运行使用你的本地 Git 凭证。云版本通过 GitHub App 授权访问。Q4: 任务可以无人值守运行多久Codex 支持长时间任务从几分钟到数小时不等。Goal 模式甚至可以跨天运行。Q5: 如何防止 Codex “幻觉”生成错误代码使用xhigh推理级别牺牲速度换准确性开启 Auto-review 自动审查始终运行测试验证对关键代码进行人工 Code ReviewQ6: 为什么同样的 Prompt 结果不同Codex 的 GPT-5.5 模型存在一定随机性。如需一致性使用更详细的 Prompt在 AGENTS.md 中明确规范对关键任务使用 Claude Code更确定性Q7: 可以离线使用吗不可以。Codex 需要联网调用 OpenAI API但 CLI 版本在本地执行代码。Q8: Windows 支持如何2026 年 5 月起Computer Use 已支持 Windows。CLI 通过 WSL2 在 Windows 上运行。10. 资源与延伸阅读官方资源 Codex 官网 开发者文档 GitHub 仓库 社区论坛 官方 YouTube 频道社区与生态 MCP 协议官网 MCP Server 目录️ AGENTS.md 标准 — Linux 基金会标准 快速开始 Checklist注册/登录 ChatGPT 账号下载 Codex 桌面应用或安装 CLI选择一个本地文件夹作为第一个项目尝试一个简单的文件操作任务安装一个 MCP Server如 GitHub编写你的第一个 AGENTS.md尝试 Code 模式编写一个小功能探索 Computer Use如可用最后的话Codex 正在快速进化2026 年的 Codex 与 2025 年已是完全不同的产品。建议每季度回顾一次新功能保持工具链的更新。记住——AI 是杠杆放大的是你的判断力而不是替代它。本文档最后更新于 2026 年 6 月。

相关新闻