Codex 的 reasoning effort（推理深度）一共有几档？minimal 和 low 有什么区别？

按 OpenAI Codex 配置参考页（config-reference），model_reasoning_effort 的取值是 minimal、low、medium、high、xhigh 五档（xhigh 是否可用取决于具体模型）。minimal 推理最浅、几乎不思考，适合纯格式化、补全这类机械操作；low 比 minimal 多一点推理，适合简单查询。两者都用于不需要深思的任务，差别是 minimal 更极致地砍掉思考。官方没有声明哪一档是默认值，多数日常编程任务从 medium 起步是稳妥选择，跑不通再升 high。

Codex 的 Fast mode（加速模式）提速多少？代价是什么？

按 OpenAI Codex speed 页，Fast mode 让受支持模型的速度提高约 1.5 倍（increases supported model speed by 1.5x），代价是用量积分按更高倍率消耗——官方页给的倍率是 GPT-5.5 为标准档的 2.5 倍、GPT-5.4 为标准档的 2 倍。开关：CLI 里敲 /fast on、/fast off、/fast status，或在 config.toml 里写 service_tier = "fast" 加 [features].fast_mode = true。Fast mode 只在用 ChatGPT 账号登录时可用；用 API key 时走标准 API 计费、用不了 Fast mode。判断很简单：你盯着屏幕在等结果就开，离开屏幕去做别的就关。

Codex 的 verbosity（输出密度）默认是哪档？要不要手动调？

按 config-reference，model_verbosity 取值是 low、medium、high 三档；官方说明是「不设时使用所选模型或预设自带的默认」（when unset, the selected model/preset default is used），并没有把某一档钉死成默认。verbosity 控制 Codex 给你的回复写多详细，和推理深度（reasoning effort，控制 Codex 内部想多深）是两件事——前者影响阅读体验和小幅输出成本，后者影响结果质量。新手做复杂任务想看思路就保持中等或调 high，熟悉的任务只要结果就调 low。

Codex 的 Profiles（配置集）只能在命令行用吗？App 能一键切档吗？

Profiles（配置集）把「模型 + 推理深度 + 输出密度 + 服务档位 + 沙箱 + 审批」打包命名，用 codex --profile 一秒切换。按 config-reference，profile 文件存为 $CODEX_HOME/ .config.toml，靠 --profile 加载——这是命令行（CLI）的能力。桌面应用（App）没有这个一键切换入口，IDE 扩展虽与 CLI 共享 config.toml，也没有等价的一键切档命令。所以主要用 App 的人要切档只能进 Settings 手动调每个旋钮。

OpenAI 官方给的省用量做法有哪些？

OpenAI Codex pricing 页公开了四条让用量上限更耐用的做法：① 给指令要精准，但删掉不必要的上下文（别把半个仓库贴进 prompt）；② 用嵌套的 AGENTS.md（智能体指令文件）控制注入的上下文量，把规则按目录分层而不是堆在一个长文件里；③ 关掉不用的 MCP（模型上下文协议）服务器——每个 MCP 都会往消息里加上下文、吃额度；④ 换更小的模型（如 GPT-5.4 或 GPT-5.4-mini）能延长本地消息用量上限，省多少取决于你从哪个模型切过去。官方页没有给出「能省百分之多少」这类量化承诺，按任务难度路由模型只能定性地说「能省一些」。

Codex 自动调用子代理（subagent）会额外烧用量吗？

Codex 不会自动拆子代理，只在你明确要求时才启动。但每个子代理都独立跑一遍模型加工具调用，所以子代理工作流的总用量会明显高于单代理（官方没有给出具体倍率）。实用判断：一个代理能干完就别拆；真要并行（比如同时探索多个文件）时给子代理用轻量 mini 模型而不是主模型，能压住成本；小任务并行优先用便宜的 mini 跑多个，往往比用主模型拆子代理划算。

推理深度调到最高（xhigh）是不是结果一定更好？

不是。OpenAI Codex 文档对推理档位的建议是「按任务难度选一档，自己测试在你的工作流里哪档最好——不同用户、不同任务适合不同设置」（Choose a reasoning level based on how hard the task is and test what works best）。简单任务用 xhigh 不仅更慢更费用量，还可能因为「想太多」引入不必要的复杂度，结果反而不如 medium。正确顺序是：先用 medium 跑一遍，跑不通升 high，只有遇到「medium 反复跑不通」的硬骨头才上 xhigh——而且质量问题先查提示词和 AGENTS.md，调高推理深度不是恢复质量的首选手段。

Codex 用 ChatGPT 付费会员和用 OpenAI API key 哪种合算？

看用量大小和场景。ChatGPT 付费会员模式：每月固定费用、按时段滚动配额、能用 Fast mode。API key 模式：按标准 API 价格计费、用不了 Fast mode，适合接 CI 自动化或做产品集成。简单判断：个人开发者每天用几个小时，ChatGPT 付费会员的固定费用心里有底；把 Codex 接到 CI/CD 流水线或做企业产品、用量极大，API key 计费更精细。不确定就先用 ChatGPT 会员跑两周，看月底用量再决定要不要切 API key。具体价格以 OpenAI 官方定价页为准。

OpenAI Codex 模型怎么选？任务×推理档位速查表

Q: OpenAI Codex 模型选不对会怎样？新手第一步该选哪个？

选不对最常见的两种亏：用最强模型跑简单批改（白烧用量）、用快模型跑复杂重构（结果不行返工）。新手第一步不用纠结：OpenAI 官方在模型页写的是「多数 Codex 任务从 gpt-5.5 起步」（For most tasks in Codex, start with gpt-5.5）。先用官方推荐的最新前沿模型把活跑顺，再按任务往轻量 mini 省、往专精模型调。具体可用模型名以 OpenAI Codex 模型页当前列表为准。

⏱️ 预计阅读 15 分钟 ｜ 🎯 目标：给你一张能直接抄的「任务 × 档位」决策速查表，看一眼就知道当前这件事该用什么模型、什么推理深度、要不要开加速。

你刚开始用 Codex，设置里有一堆看不太懂的开关——模型（model）、推理深度（reasoning effort）、输出密度（verbosity）、加速模式（Fast mode）。这篇不绕弯子：先给你一张选型速查表，再逐个旋钮讲清楚每档管什么、什么任务该调到哪。

一、先抄这张表：任务 × 档位决策速查

不想读完全文也没关系。下面这张表覆盖了八成日常场景——找到你当前在做的任务，照着调就行。

你在做的任务	模型	推理深度	加速模式	一句话理由
日常写代码（接口 / 表单 / 不难的 bug）	主模型（gpt-5.5）	medium	关	标准任务，主模型够用、能等就别烧
批量改文件（统一格式、批量替换）	轻量 mini	low / minimal	关	任务简单、跑量，省用量
跨文件复杂重构	主模型	high	关	要全局理解，长任务不指望加速
架构迁移 / 安全审计（最难）	主模型	xhigh	关	错了代价大，质量优先
实时编辑器补全	spark / mini	minimal / low	开	要的是即时响应
只读探索 / 看陌生代码	mini	low	关（沙箱设只读）	不写代码，别让它乱改

新手最容易亏的两件事：用最强模型跑批量改（白烧用量）、用快模型跑复杂重构（结果不行又返工）。学会按任务难度调档，是省用量最大的杠杆——不是「永远调最高」。

不知道当前任务落在哪一行？用这三步判断：

先问难度：这件事是「机械重复 / 改格式 / 查一下」，还是「要跨多个文件理解后再动手」？前者往轻量挡走，后者往主模型 + 高推理走。
再问紧不紧：你会盯着屏幕等结果吗？会就考虑开加速，不会（后台跑 / 长任务）就关掉，省用量。
最后问代价：这件事改错了好不好回滚？好回滚的（有 git 检查点）大胆用低挡试，难回滚的（架构迁移、删数据）才值得上最贵的 xhigh。

OpenAI Codex 任务×档位决策速查表：日常写代码、批量改文件、跨文件复杂重构、架构迁移安全审计等任务分别对应的模型、推理深度与加速模式选型

下面把每个旋钮拆开讲，每节都给一张可抄的对照表。

二、Codex 不是「一个模型」，是「一组旋钮」

Codex 设置页里那几个下拉菜单，本质是把控制 AI 行为的几个维度分开交给你。核心是四个旋钮：

旋钮	管什么	主要影响	取值
① 模型（model）	选哪个底层 AI 引擎	智能、速度、用量全维度	gpt-5.5 / gpt-5.4 / mini / 编程专精 / spark
② 推理深度（reasoning effort）	模型内部「想多深」	主要影响质量与成本	minimal / low / medium / high / xhigh
③ 输出密度（verbosity）	给你的回复写多详细	阅读体验 + 小幅输出成本	low / medium / high
④ 加速模式（Fast mode）	花更多用量换更快响应	速度 ↑、用量消耗 ↑	on / off（另有 flex 等服务档位）

四个旋钮互相独立——同一个模型可以配低推理 + 简短输出 + 不开加速，也可以配高推理 + 详尽输出 + 开加速。但新手不用记全部组合，只要记住第一节那张速查表里的几种典型搭配就够。

为什么 OpenAI 不做一个「智能档位」总开关？因为不同任务的最优解互相矛盾：

场景	目标	矛盾点
实时补全	速度	牺牲深度
复杂重构	质量	牺牲速度和成本
跑批改文件	省用量	牺牲单次智能

没有任何单一按钮能同时把速度、质量、成本都拉满——所以 Codex 把选择权交给你，按任务自己权衡。

Codex 的四个独立旋钮：模型、推理深度、输出密度、加速模式各管一件事，可自由组合，说明 Codex 不是单一模型而是一组可调维度

🔥 翔宇判断

旋钮系统的本质，是 OpenAI 把「成本 vs 质量 vs 速度」的三角抉择交到用户手里。会切档的人比常年用最高档的人更专业——前者懂任务，后者只懂烧用量。新手最该练的不是「调到最优」，而是「按任务复杂度切档」这一个动作。

三、模型（Model）怎么选：按定位选，不是按高低排

模型是四个旋钮里影响最大的一个。要点先说在前面：Codex 的几个模型不是一条从弱到强的直线，而是定位不同。下表是 OpenAI Codex 模型页给的官方定位（按用途归类，不是按高低排序）：

模型	官方定位	适合
gpt-5.5	最新前沿模型，面向复杂编程、计算机操作、知识工作与研究型工作流	官方推荐的默认起点
gpt-5.4	旗舰专业模型，把 gpt-5.3-codex 的编程能力与更强推理、工具调用、智能体工作流合一	专业复杂任务
gpt-5.4-mini	快速高效的轻量模型，面向需要快速响应的编程任务和子代理	简单任务、批改、子代理
gpt-5.3-codex	面向复杂软件工程的编程专精模型，其编程能力也支撑了 gpt-5.4	纯代码编写、Bug 修复
gpt-5.3-codex-spark	纯文本研究预览模型，为近乎即时的实时编程迭代优化	编辑器实时补全

具体可用模型名以 OpenAI Codex 模型页当前列表为准。OpenAI 模型迭代很快，本文不写死具体型号；用「定位」选模型比记型号更稳。

3.1 新手默认：从官方推荐的最新前沿模型起步

OpenAI 模型页明确写了「多数 Codex 任务从 gpt-5.5 起步」（For most tasks in Codex, start with gpt-5.5）。先用最新前沿模型把活跑顺，跑顺了再按需要往 mini 省、往专精模型调。

很多新手会纠结「最新最强的不是最贵吗，为什么官方反而推荐先用它」。这里要分清两件事：单看一次请求，更强的模型确实可能更贵；但省不省用量看的是「把活做成」的总成本，不是单次成本。能力更强的模型往往一次就把任务做对，弱模型可能要反复试、来回返工，加起来未必更省。所以新手的正确顺序是「先用够强的把任务跑顺、建立判断，再针对简单任务往轻量挡省」——而不是一上来就为了省钱用最弱的模型，结果在返工上把省下的用量又赔进去。

# 命令行（CLI）模式：在 ~/.codex/config.toml 写
model = "gpt-5.5"

# 桌面应用（App）模式：在 Settings → Model 选最新主模型

3.2 什么时候该换轻量 mini

下面这些场景换 mini 系列更划算——官方对 mini 的定位就是「快速高效、面向快速响应的任务和子代理」：

场景	为什么 mini 更合适
批量改文件（统一格式、批量替换）	任务简单、跑量，智能不是瓶颈
简单自动补全	速度比智能更重要
子代理做探索性扫描	子代理只负责报告、不下决策
不重要的实验性脚本	出错代价低
当月用量吃紧、要省	mini 输出成本是主模型的零头

切换最快的方法：CLI 里敲 /model，选 mini。

3.3 Spark：实时迭代专用

gpt-5.3-codex-spark 是研究预览模型，专为「近乎即时的实时编程迭代」设计。适合在编辑器里要 AI 即时回应、做局部小改；不适合跨文件重构、复杂逻辑设计、长会话深推理。新手第一周一般用不到，先用主模型跑顺。

3.4 模型 × 推理深度：组合矩阵

模型和推理深度是两个旋钮，真正决定一次任务表现的是它们的组合。下面这张矩阵把「模型档次 × 推理深度」拆开，标出每个交叉格典型用在哪、要注意什么。读这张表的方法：先按任务难度找行（轻量还是主模型），再按要不要深思找列。

模型＼推理深度	minimal / low	medium	high / xhigh
轻量 mini	批量改文件、机械补全、只读扫描 —— 最省用量的角落	简单到中等任务的省钱挡，质量够用就停在这	一般不这么配：mini 上 high 性价比不高，要深推理直接换主模型
主模型（gpt-5.5）	主模型配低推理多用在「要主模型的知识但任务不难」的过渡场景	日常写代码的标准挡，多数任务的落点	复杂重构 high、架构迁移与安全审计 xhigh，质量优先、不在乎多花用量

两条用这张表的经验：

左上角最省、右下角最贵。同一件事能用左上角解决就别往右下角挪——这就是省用量的核心动作。
轻量模型 + 高推理这一格基本是浪费。要的是深推理就直接上主模型；mini 的价值在「快和省」，给它配 xhigh 等于既不够聪明又不省钱。

四、推理深度（Reasoning Effort）怎么调

推理深度是第二大影响力旋钮，决定模型「内部想多深」。

4.1 五档分别什么意思

按 OpenAI Codex 配置参考，model_reasoning_effort 的取值是 minimal | low | medium | high | xhigh 五档（注意：xhigh 是否可用取决于具体模型）。官方没有声明哪一档是默认值——所以下表只标用途，不标「默认」。

档位	意思	适合的任务
minimal	推理最浅、几乎不思考	纯格式化、机械补全
low	很少推理、快速直出	简单查询、增删改查（CRUD）
medium	平衡推理与速度	多数日常编程任务（新手稳妥起点）
high	深度推理、慢但质量好	复杂调试、跨文件重构、安全审计
xhigh	最深推理、最慢、最贵	大规模重构、跨框架迁移、最难的算法（受模型支持限制）

Codex 推理深度五档阶梯：从 minimal 几乎不思考到 xhigh 最深最慢，逐级对应机械补全、简单查询、日常编程、复杂重构、架构迁移，按任务难度选一档而非越高越好

4.2 按任务选档对照表

任务类型	推荐深度	理由
机械格式化 / 补全	minimal / low	不需要思考
简单查询 / CRUD 接口	low / medium	任务标准
调试已知模块的 bug	medium	大多数 bug medium 能搞定
跨多文件并发 bug	high	要追踪复杂状态
中等复杂度新功能	medium	标准任务
跨模块大规模重构	high	要全局理解
框架迁移 / 数据库迁移	xhigh	错了难回滚，质量优先
安全审计代码	high / xhigh	错过漏洞代价大
跑批 / 后台体力活	minimal / low	量大，要省

4.3 新手两个误区

误区一：默认就上 xhigh。 简单任务用 xhigh 不仅更慢更费用量，还可能因为「想太多」引入不必要的复杂度，结果反而不如 medium。OpenAI 文档对推理档位的建议是按任务难度选一档、自己测试在工作流里哪档最好，并强调不同用户、不同任务适合不同设置——没有「越高越好」这回事。

误区二：把推理深度当质量补救。 结果不行时，先查的应该是提示词和 AGENTS.md，而不是把 reasoning effort 一路拉高。下面是结果不达标时的排查顺序，调推理深度排在最后：

顺序	先查什么	怎么改
1	提示词是否含糊	把模糊需求写成明确的工程任务，见提示词工程
2	AGENTS.md 是否缺约束	补上项目规则、风格、禁区，见 AGENTS.md 指南
3	上下文是否够 / 是否太杂	该补的文件没给、不相关的内容塞太多，都会拉低质量
4	模型选得对不对	复杂任务用了 mini，先换主模型再谈推理
5	最后才升推理深度	前面都对了仍不行，medium → high → xhigh 逐级试

前四步没排查就一路拉高推理深度，多数时候只是更慢更贵，质量并不会真正变好。

4.4 调推理深度的几种方式

# 方式一：CLI 一次性指定
codex -c 'model_reasoning_effort="high"' "重构这个模块"

# 方式二：写进 ~/.codex/config.toml 持久化
model_reasoning_effort = "high"

# 方式三：会话内切换
/reasoning high

CLI 与 IDE 扩展共用 config.toml，一次配置多端生效。

五、输出密度（Verbosity）和加速模式（Fast Mode）

第三、四个旋钮影响相对小，但用对了能省时间或省用量。

5.1 输出密度（Verbosity）

按 config-reference，model_verbosity 取值是 low | medium | high 三档；官方说明是「不设时使用所选模型或预设自带的默认」——同样没有把某一档钉死成默认。

档位	意思	适合场景
low	简洁、只给关键信息	已经熟悉任务、只要结果
medium	平衡解释和结果	日常工作
high	详细解释每步	学习、复杂任务想看 Codex 思路

verbosity 控制「Codex 给你输出多详细」，reasoning effort 控制「Codex 内部想多深」——前者影响阅读体验，后者影响质量，是两件事。

5.2 加速模式（Fast Mode）：花用量换速度

按 OpenAI Codex speed 页，「Fast mode 让受支持模型的速度提高 1.5 倍」（increases supported model speed by 1.5x），代价是用量积分按更高倍率消耗——官方页给的倍率是 GPT-5.5 为标准档的 2.5 倍、GPT-5.4 为标准档的 2 倍。也就是说，提速 1.5 倍要付出 2 到 2.5 倍的用量，划不划算取决于你是不是真在等。

Fast mode 只在用 ChatGPT 账号登录时可用；用 API key 时走标准 API 计费、用不了 Fast mode。

# 会话内开关
/fast on
/fast off
/fast status

# 持久化在 config.toml
service_tier = "fast"

[features]
fast_mode = true

什么时候开：

场景	开 Fast 吗
我盯着屏幕在等结果	✅ 开
Codex 跑长任务我去做别的	❌ 关，省用量
实时编辑器补全	✅ 开
跑批 / 后台 cron	❌ 关
当月用量快用完	❌ 关

💡 通俗讲

Fast mode 像挂特需号：你在候诊室等的时候挂特需省时间值，回家睡觉等结果就没必要付特需的钱。它提速约 1.5 倍，却要按 2 到 2.5 倍消耗用量——只在你「人在屏幕前等」时才划算。

5.3 服务档位（Service Tier）：还有一个 flex

按 config-reference，service_tier 的内置值含 flex 和 fast。flex 速度更慢但消耗更低，适合不在乎延迟的批处理；fast 就是上面的加速模式。新手第一周不用碰 flex，先把标准档与 fast 切顺。

六、配置集（Profiles）：把组合存起来一键切

旋钮多了，每次任务前手动调四个开关很烦。配置集（Profiles）就是解决这个的——把「模型 + 推理深度 + 输出密度 + 服务档位 + 沙箱 + 审批」一整套打包命名，启动时一行 --profile <名字> 切换。

6.1 直接抄这套配置集

把下面这段加到 ~/.codex/config.toml：

# ============ 配置集 1：日常默认 ============
[profiles.daily]
model = "gpt-5.5"                       # 主模型
model_reasoning_effort = "medium"       # 平衡推理
model_verbosity = "medium"              # 平衡输出
sandbox_mode = "workspace-write"        # 工作区可写
approval_policy = "on-request"          # 按需问

# ============ 配置集 2：批改省用量 ============
[profiles.budget]
model = "gpt-5.4-mini"                  # 轻量模型
model_reasoning_effort = "low"          # 低推理
model_verbosity = "low"                 # 简短输出
sandbox_mode = "workspace-write"
approval_policy = "on-request"

# ============ 配置集 3：复杂重构 ============
[profiles.deep]
model = "gpt-5.5"
model_reasoning_effort = "high"         # 深推理
model_verbosity = "medium"
sandbox_mode = "workspace-write"
approval_policy = "on-request"

# ============ 配置集 4：极难任务 ============
[profiles.extreme]
model = "gpt-5.5"
model_reasoning_effort = "xhigh"        # 最深（受模型支持限制）
model_verbosity = "high"                # 详细输出
sandbox_mode = "workspace-write"
approval_policy = "on-request"

# ============ 配置集 5：只读探索 ============
[profiles.readonly]
model = "gpt-5.4-mini"                  # mini 省用量
model_reasoning_effort = "low"
sandbox_mode = "read-only"              # 只读
approval_policy = "on-request"

切换：

codex --profile daily      # 日常
codex --profile budget     # 批改省用量
codex --profile deep       # 复杂重构
codex --profile extreme    # 极难任务
codex --profile readonly   # 只读探索

上面的字段名（model / model_reasoning_effort / model_verbosity / sandbox_mode / approval_policy / service_tier）均来自 OpenAI Codex 配置参考，取值随官方文档更新，以当前文档为准。

6.2 配置集只在命令行（CLI）有效

按 config-reference，profile 文件存为 $CODEX_HOME/<名字>.config.toml，靠 codex --profile <名字> 加载——这是命令行（CLI）的能力。桌面应用（App）没有这个一键切换入口，IDE 扩展虽与 CLI 共享 config.toml，也没有等价的一键切档命令。主要用 App 的人要切档，只能进 Settings 手动调每个旋钮——这是 CLI 比 App 顺手的地方之一，Codex 四个入口对比里展开讲过。

七、官方省用量做法 + 实战补充

OpenAI Codex pricing 页公开了四条让用量上限更耐用的官方做法。下面前四条是官方原话要点，后两条是配套的实战补充（已标注非官方）。

#	做法	来源
1	控制提示词大小：给指令要精准，但删掉不必要的上下文，别把半个仓库贴进 prompt	官方
2	嵌套 AGENTS.md：用嵌套的 AGENTS.md 按目录分层控制注入的上下文，不要堆在一个长文件里	官方
3	关掉不用的 MCP：每个 MCP（模型上下文协议）服务器都往消息里加上下文、吃额度，不用就关	官方
4	换更小的模型：换到 GPT-5.4 或 GPT-5.4-mini 能延长本地消息用量上限，省多少取决于从哪个模型切过去	官方
5	不盯着等结果时关掉 Fast mode、用标准档位	实战补充
6	一个代理能干完就不无谓拆子代理	实战补充

官方 pricing 页没有给出「能省百分之多少」这类量化承诺。按任务难度路由模型确实能省，但只能定性地说「能省一些」，不要轻信网上各种精确百分比。

下面把最常用的两条展开。

7.1 控制提示词与缩短 AGENTS.md

AGENTS.md 在每次对话都自动加载，文件越长每次消耗的输入令牌（token）越多。新手该做的：全局 AGENTS.md 别堆太长；项目专属规则放项目根的 AGENTS.md，不要全塞进全局；单体仓库（monorepo）里用多级 AGENTS.md，不要把所有子项目规则放根目录。

7.2 关掉不用的 MCP + 压缩长会话

配置文件里只列你真用的 MCP，不用的删掉或暂停。
长会话里用 /compact 把之前的内容压缩成摘要，释放上下文空间——对话超过二十来轮、切换到新子任务、或看到上下文占用偏高的提示时，压一下。
跑批别用交互模式逐个开，用 codex exec 循环跑：

# 反例（每篇都重新加载完整上下文）：
for file in *.md; do
  codex
  > 改 $file 的标点
done

# 正例（一条命令循环跑，每篇任务体令牌独立）：
for file in *.md; do
  codex exec --profile budget "把 $file 的中文标点改全角"
done

7.3 子代理（Subagent）的用量账

Codex 不会自动拆子代理，只在你明确要求时才启动。但每个子代理都独立跑一遍模型加工具调用，所以子代理工作流的总用量会明显高于单代理——官方没有给出具体倍率，但「每多一个代理就多一份模型与工具开销」这笔账要心里有数。

情况	该怎么做
一个代理能干完	别拆，拆出来反而费用量
真要并行（同时探索多个文件）	给子代理用轻量 mini，而不是主模型
一批小任务要并行	优先用便宜的 mini 跑多个，往往比主模型拆子代理划算

子代理什么时候真正值得用，见子代理与并行编排。

7.4 每月花五分钟看一次 Usage

省用量不是一次配好就完事，而是定期回头看。Codex 设置里有 Usage 面板，每月底花几分钟看三件事，往往能在下个月省下一笔：

看什么	发现问题的信号
这个月用了多少、还剩多少天	提前耗尽 → 多半在某类任务上用了过高的档
哪个配置集用得最多	`deep` / `extreme` 占比异常高 → 任务真变难了，还是忘了切回轻挡
有没有「本该切 mini 却用了主模型」的场景	这是最常见、也最容易补回来的漏切

八、六种典型任务的完整旋钮组合

第一节给了速查表，这一节把六种高频任务展开成完整组合，连沙箱、配套动作一起说清。

8.1 任务 A：日常写代码

场景：写一个接口、加一个表单、改一段业务逻辑、debug 一个不太难的 bug。

旋钮	设置
模型	主模型（gpt-5.5）
推理深度	medium
输出密度	medium
加速模式	关

用 daily 配置集就是这套。

8.2 任务 B：跑批改、批量处理

场景：批量改文章标点、批量替换 import 路径、给一批组件补 alt 文本。

旋钮	设置
模型	轻量 mini
推理深度	low / minimal
输出密度	low
加速模式	关

切到 budget 配置集，配合 codex exec 后台跑。这类任务质量不分高下（标点改对就是改对），mini + 低推理跑得更快、用量是主模型的零头——把批改硬塞给主模型是新手最常见的浪费。

8.3 任务 C：跨文件复杂重构

场景：把嵌套 if-else 拆成早返回、把一套路由迁到另一个框架、class 组件改 hooks。

旋钮	设置
模型	主模型
推理深度	high
输出密度	medium
加速模式	关

切到 deep 配置集，可以先让它 Plan（规划）再动手。复杂重构动手前先 git commit 一次当检查点——改坏了能直接 git reset 回滚。

8.4 任务 D：架构迁移、安全审计

场景：换数据库、换状态管理库、做安全审计、跨语言迁移。

旋钮	设置
模型	主模型
推理深度	xhigh
输出密度	high
加速模式	关

切到 extreme 配置集，配合 Plan 模式 + 反复核对。这是少数 xhigh 真值得的场景：任务越难、回滚成本越高，多花的用量越划算。反过来，简单任务硬上 xhigh 就是纯烧用量。

8.5 任务 E：实时编辑器补全

场景：在 IDE 里按 Tab 补全函数、补全 import、补全测试用例。

旋钮	设置
模型	spark（如有）/ mini
推理深度	minimal / low
输出密度	low
加速模式	开

实时补全主要在 IDE 扩展里用（见 Codex 四个入口对比），CLI 模式很少做这件事。

8.6 任务 F：探索 / 调研

场景：让 Codex 解释陌生代码、扫一个新仓库介绍架构、查 API 怎么用。

旋钮	设置
模型	mini
推理深度	low / medium
输出密度	high
沙箱	read-only（只读）

切到 readonly 配置集。这种任务沙箱必须设只读——避免 Codex「热心」帮你改代码。沙箱与审批怎么配，见 OpenAI Codex 沙箱与审批。

九、五个最容易踩的旋钮坑

坑	后果	正确做法
以为最高档 = 最好结果	简单任务上 xhigh 反而「想太多」出错、白烧用量	按任务难度选档：medium 起步、high 留给复杂、xhigh 留给最难
长期开 Fast mode	提速约 1.5 倍却按 2~2.5 倍消耗用量，后台 / 长任务开纯烧	只在「人在屏幕前等」时开，离开就关
从不切到 mini	简单批改硬用主模型，用量翻倍且质量没差	批改 / 探索切 mini，这是最大的省用量杠杆
AGENTS.md 越写越长	每次对话全文进上下文，浪费输入令牌	按目录分层、嵌套，长了拆子目录（见 AGENTS.md 指南）
所有 MCP 都开着	每个 MCP 的工具描述都塞进上下文，启动开销叠加	不用的 MCP 在配置里关掉

⚠️ 资深用户也常犯前两个

「全程 xhigh」和「长任务也开 Fast」是熟手都会偷懒踩的坑。最省心的办法是定两条硬规则：推理深度 medium 当默认、只在 medium 跑不通时升 high；Fast 只在人盯着屏幕等时开。这两条能让同样的用量明显多撑一阵。

十、跑顺一两周之后的进阶路径

第一份默认配置跑顺后，会自然产生进阶需求：

你的感受	下一步
「每天在重复调相同的旋钮」	用 Profiles 配置集打包，一键切
「批改太烧用量」	切 `budget`：mini + 低推理
「实时补全延迟高」	切 spark / mini + 开 Fast
「跑批想更省」	试 `service_tier = "flex"`
「想看本月用量趋势」	Codex 设置里的 Usage 面板
「想把成本接进自己的监控」	用 OpenTelemetry（OTel）导出运行数据

十一、开会话前的自检清单

每次开会话前对自己问一遍：

[ ] 这个任务真需要主模型吗？mini 够不够？
[ ] 复杂度够升 high 吗？还是 medium 就行？
[ ] 我会盯着屏幕等吗？要不要开 Fast？
[ ] AGENTS.md 是不是又长了？要不要剪一下？
[ ] 开着的 MCP 都用得到吗？
[ ] 当月用量还剩多少？
[ ] 这个任务该用配置集，还是手动调？

一句话收官

OpenAI Codex 不是「一个模型」，是「一组旋钮」——模型 / 推理深度 / 输出密度 / 加速模式四个独立维度。新手最大的杠杆是学会按任务难度切档，不是「调到最高」。

记住第一节那张速查表就够开工：日常写代码用主模型 + medium、批改切 mini + 低推理、最难任务才上 xhigh、只在盯着屏幕等时开 Fast。光是「该用 mini 的时候不硬用主模型」这一条，就能让同样的额度明显多撑一阵。模型名、档位默认值、价格倍率这些都会变，落地前以 OpenAI 官方当前文档为准。

下一步

AI 编程实操课：Claude Code + Codex + Agent 工作流，覆盖一人公司、自媒体自动化、AI 副业全场景。237 篇实战教程 + 最佳实践 + 源码包，跟着做就出成果。国内版-FlowUS | 国际版-BMC
YouTube 频道：翔宇工作流
微信公众号：搜索「翔宇工作流」

OpenAI Codex 模型怎么选？任务 × 推理档位决策速查表 + 省用量指南