三大终端 Agent 横向对比:Claude Code / Codex CLI / Gemini CLI
基础概念
到了 2026 年,主流的官方终端 Agent 工具基本可以归为三个:Claude Code、Codex CLI、Gemini CLI——都是模型厂商自家出的、一等公民级别的工具。
这张卡不重复每个工具的具体能力——那些已经在各自的入门卡里写过:Claude Code 入门、Codex CLI 入门、Gemini CLI 入门。本卡的目标是:把它们摆在一起,从你最关心的几个维度横向看清差异,最后给出按场景的选型建议。
读者拿到这张卡的正确姿势:先看主对比表对齐基本事实,再用"按场景选型"那段对照自己的处境做决策,不要把对比表当成绝对排名。每个工具都有适合自己的场景,唯一错的选择是"什么都不试就先选好"。
三工具的本质定位
关键观察:三个工具都是厂商绑定,围绕"自家模型 + 自家生态"构建。强项是深度集成,劣势是模型不能换——你选了哪个工具,基本就锁定了哪家模型。
基础用法
下面给一段示意——同一个任务"读取当前目录的 README 并新建一个 hello.txt",三个工具的最小启动方式:
claude "读取 README.md 然后新建 hello.txt 写入'hi'"
codex "读取 README.md 然后新建 hello.txt 写入'hi'"
gemini "读取 README.md 然后新建 hello.txt 写入'hi'"
调用方式都很相似——这恰好说明:入口体验上三个工具没有本质差异。差异在于背后的模型、权限模型、扩展生态、价格定位、长期能否帮你形成稳定工作流。下文的对比表围绕这些"看不见但很重要"的维度展开。
同类工具对比
主对比表覆盖 9 个维度:
| 维度 | Claude Code | Codex CLI | Gemini CLI |
|---|
| 维护方 | Anthropic 官方 | OpenAI 官方 | Google 官方 |
| 默认模型 | Claude Sonnet 4.6 / Opus 4.7 | GPT-5.3-Codex | Gemini 2.5 Pro / 3 系列 |
| 模型可换 | 仅 Anthropic 系列 | 主推自家,可对接 OpenAI 兼容 endpoint(体验打折) | 仅 Google 系列 |
| 上下文窗口 | 200K(Sonnet)/ 1M(Sonnet 4.6 1M context)/ 200K(Opus) | 128K(5.3-Codex-Spark 同 128K,主线 5.3-Codex 200K+) | 1M tokens(Gemini 2.5 Pro/3) |
| 安装方式 | 推荐 native installer(curl / brew / winget),npm 标记 deprecated | npm / brew / 二进制 | npm install -g @google/gemini-cli |
| 协议 | 闭源(GitHub 仓库是 issue tracker,不是源码) | Apache-2.0 开源 | Apache-2.0 开源 |
| 价格定位 | Pro / Max / Team 月度订阅,或 API 按量 | ChatGPT 订阅可用,或 OPENAI_API_KEY 按量 | OAuth 1000 次/天免费;API Key 250 次/天(仅 Flash) |
| 扩展机制 | Skills + Hooks + MCP + Subagents(最完整) | Skills + Hooks + MCP(0.121.0+) | MCP + 自定义 tool + GEMINI.md |
| 沙箱/权限 | settings.json 工具白名单 + dangerously-skip-permissions | 内置 sandbox_mode + approval_policy | 默认询问 + YOLO 模式 |
核心区别
把上面 9 行折成一句话:
- Claude Code:生态最完整、扩展点最多、Subagents/Skills/Hooks 全都有,适合长期投入构建工作流的人;代价是绑定 Anthropic、闭源、定价偏高
- Codex CLI:开源、跨平台轻量化,ChatGPT 订阅用户的天然选择;2026 年才补齐 MCP/Skills/Hooks,生态成熟度比 Claude Code 略落后
- Gemini CLI:1M 上下文 + 慷慨免费额度,适合预算敏感、需要超长上下文的人(整个 monorepo 一次塞进去);强绑定 Google 模型
常见误区
| 误区 | 准确理解 |
|---|
| 新工具一定比旧的好 | Claude Code 出得最早、生态最成熟;Codex CLI / Gemini CLI 是 2025 年才追上来的。新和旧不等于好和差,按场景选 |
| 必须只选一个 | 同时装两三个完全可以,根据当前任务切换。Claude Code 配套写代码 + Gemini CLI 一次性塞整库做架构梳理是真实存在的组合 |
| Anthropic 的就一定最贵 | Claude Code Pro 月度订阅在大量使用场景下比 Anthropic API 直接按量更划算;按量计费才是真正容易超支的 |
| 开源 = 免费 | Codex CLI / Gemini CLI 工具本身开源,但调用模型仍然要付费(除非用 Gemini 免费额度或本地模型) |
| 横向对比表里某项"打勾"就一定要用 | Claude Code 有 Subagents 不代表你必须用它。功能存在 ≠ 你需要它 |
| 上下文越大越好 | Gemini CLI 1M 听起来很爽,但塞太多无关代码进去反而让模型走神;上下文管理本身是技术,见 Prompt cache 与上下文预算 |
| 选型一次到位 | 工具更新太快(Claude Code 几乎每周 release,Codex CLI 2026-04 还在补 Skills),现在的"最佳选择"半年后可能换主 |
优劣势分析
不是逐工具列优缺点(那在各自入门卡里有),而是按场景给出"什么时候用哪个"的决策建议。
| 你的场景 | 首选 | 备选 | 理由 |
|---|
| 第一次接触 CLI Agent,想快速跑通 | Claude Code | Gemini CLI | Claude Code 文档最齐、例子最多;Gemini CLI 免费额度低门槛 |
| ChatGPT Plus / Pro 订阅用户,想顺便用 CLI | Codex CLI | — | ChatGPT 订阅可直接 Sign in,零额外成本 |
| 整个 monorepo 想一次性让 Agent 看完做架构梳理 | Gemini CLI | Claude Code(1M context 版本) | 1M tokens 真能塞下中型项目 |
| 团队想强制工作流、做权限治理、配 hooks | Claude Code | Codex CLI(2026-04 起) | Skills + Hooks + Subagents 三件套生态最完整 |
| 想 git history 永远干净、AI 改动可追溯/可回退 | Claude Code + 自定义 hook | Codex CLI + git hook | 用 PostToolUse hook 自动 commit;详见 lifecycle-hooks |
| 预算紧张,想免费跑起来 | Gemini CLI | — | Google 免费额度大方(OAuth 1000 次/天) |
| Windows 原生终端为主 | Claude Code | Gemini CLI | Codex CLI 在 Windows TUI 上社区反馈偏弱 |
| 开源洁癖、不想用闭源工具 | Codex CLI | Gemini CLI | 两家都是 Apache-2.0;Claude Code 仓库只是 issue tracker |
关键提醒:上表是"在 2026-04 截面"的判断,三个月后可能就要重新看。把这张表当成"当前最稳定的起点",而不是长期定论。
思考题
初级:我已经付了 ChatGPT Plus,还应该额外订阅 Claude Code 吗?
参考答案:
按你的实际使用场景判断:
- 如果你只是偶尔写写脚本、改改 bug:Codex CLI 配 ChatGPT Plus 完全够用,不用额外花钱
- 如果你大量做长上下文任务(读整个仓库、跨文件重构):Claude Code 的 1M context 版本 + Subagents 在多文件推理上有可见的优势,值得为生产力多付一份订阅
- 如果你是团队场景需要 hook / Skills / 团队权限:Claude Code 的扩展生态最完整,定价相比效率提升合算
最务实的做法是:先免费试一周 Codex CLI(已有 ChatGPT 订阅),如果遇到"工具没法做的事"反复出现,再考虑 Claude Code。不要先选订阅再找用途。
中级:团队 10 人想统一终端 Agent 工具,应该怎么决策?
参考答案:
不要拍脑袋决定,用三步走:
-
盘点真实场景——团队里日常需要的是什么:写新代码?审 PR?改 bug?跑 TDD?做架构梳理?不同场景的最优工具不一样
-
测算成本——按团队规模 × 月活跃使用量 × 模型平均 token 估算。10 人团队按量计费可能每月 $1000+,订阅 Claude Code Team 或者 ChatGPT Business 反而更便宜
-
统一底线,留一定弹性——团队级别强制:
- 共享
.claude/settings.json(项目级权限模型)
- 统一 hooks 做敏感命令拦截、审计日志
- 统一 MCP server 接入
但允许个人选用不同工具:有人用 Claude Code 做 PR 审查、有人用 Gemini CLI 做整库梳理、有人用 Codex CLI 顺手 ChatGPT 订阅。强制大一统不现实也没必要,团队真正要统一的是"代码进入仓库前的 quality gate",不是"用哪把锤子敲"。
进一步阅读:settings.json 全局 vs 项目层级、危险权限治理与 sandbox 实践。
进阶:三大工具的扩展生态(Skills / Hooks / MCP)正在快速趋同,未来还会有差异化吗?
参考答案:
会,差异化只会换一个层面:
- 协议层(MCP / 工具调用)正在快速标准化:MCP 已被 Anthropic / OpenAI / Google 官方采纳,这层不会有差异化
- Skills / Hooks 的 API 也会被互相抄袭:Codex CLI 在 2026-04 抄了 Claude Code 的 Skills 形式;Gemini CLI 也会跟上
但下面这几层短期不会趋同:
- 模型本身的能力差异:长上下文、代码生成、工具调用准确率,这些直接由背后的模型决定,是不能"抄"的
- 生态厚度:Anthropic 官方 + 社区贡献的 Skills / MCP server / hook 模板,这是 first-mover advantage 形成的护城河
- 运行时形态:Claude Code 推 native installer + 自动更新;Codex CLI 推开源 + 二进制;Gemini CLI 推 npm + 大窗口——这些产品哲学不会变
- 价格 / 商业模式:Anthropic 走订阅;OpenAI 把 CLI 绑 ChatGPT 订阅;Google 用免费额度引流——商业模式分歧短期不会消失
所以未来的"选型"会从"哪个功能多" 转向 "哪家模型 / 哪种付费方式 / 哪种产品哲学和你的工作流匹配"。这个转向其实对用户更友好——功能无差时,按个人偏好选就行。
参考资料
- Claude Code 官方文档:https://code.claude.com/docs/en/overview (查询日期 2026-04-23)
- Codex CLI 官方仓库:https://github.com/openai/codex (查询日期 2026-04-23)
- Codex CLI 官方文档:https://developers.openai.com/codex (查询日期 2026-04-23)
- Gemini CLI 官方仓库:https://github.com/google-gemini/gemini-cli (查询日期 2026-04-23)
- Gemini API 限速文档:https://ai.google.dev/gemini-api/docs/rate-limits (查询日期 2026-04-23)
- CLI Agent 工具对比横评:https://www.codeant.ai/blogs/claude-code-cli-vs-codex-cli-vs-gemini-cli-best-ai-cli-tool-for-developers-in-2025 (查询日期 2026-04-23)