---
title: "三大终端 Agent 横向对比：Claude Code / Codex CLI / Gemini CLI"
wiki: cli
category: "终端 Agent 工具"
slug: terminal-agents-comparison
url: https://learnagent.wiki/cli/cards/terminal-agents-comparison
tags: ["对比", "Claude Code", "Codex CLI", "Gemini CLI", "选型"]
last_updated: 2026-04-23
reading_time: 9
---

> 到了 2026 年，主流的官方终端 Agent 工具基本可以归为三个：**Claude Code、Codex CLI、Gemini CLI**——都是模型厂商自家出的、一等公民级别的工具。

# 三大终端 Agent 横向对比：Claude Code / Codex CLI / Gemini CLI

## 基础概念

到了 2026 年，主流的官方终端 Agent 工具基本可以归为三个：**Claude Code、Codex CLI、Gemini CLI**——都是模型厂商自家出的、一等公民级别的工具。

这张卡不重复每个工具的具体能力——那些已经在各自的入门卡里写过：[Claude Code 入门](/cli/cards/claude-code-overview)、[Codex CLI 入门](/cli/cards/codex-cli-overview)、[Gemini CLI 入门](/cli/cards/gemini-cli-overview)。本卡的目标是：把它们摆在一起，从你**最关心的几个维度**横向看清差异，最后给出**按场景的选型建议**。

读者拿到这张卡的正确姿势：先看主对比表对齐基本事实，再用"按场景选型"那段对照自己的处境做决策，**不要把对比表当成绝对排名**。每个工具都有适合自己的场景，唯一错的选择是"什么都不试就先选好"。

### 三工具的本质定位

```mermaid
graph TB
    subgraph "厂商官方 + 模型绑定"
        CC["Claude Code<br/>Anthropic 自家全栈<br/>Skills / Hooks / MCP / Subagents 都齐"]
        CX["Codex CLI<br/>OpenAI 自家<br/>2026 年起补齐生态"]
        GM["Gemini CLI<br/>Google 自家<br/>1M 上下文 + 慷慨免费额度"]
    end

    style CC fill:#fff3e0,color:#333
    style CX fill:#e8f5e9,color:#333
    style GM fill:#e3f2fd,color:#333
```

**关键观察**：三个工具都是厂商绑定，围绕"自家模型 + 自家生态"构建。强项是深度集成，劣势是**模型不能换**——你选了哪个工具，基本就锁定了哪家模型。

## 基础用法

下面给一段示意——同一个任务"读取当前目录的 README 并新建一个 hello.txt"，三个工具的最小启动方式：

```bash
# Claude Code
claude "读取 README.md 然后新建 hello.txt 写入'hi'"

# Codex CLI
codex "读取 README.md 然后新建 hello.txt 写入'hi'"

# Gemini CLI
gemini "读取 README.md 然后新建 hello.txt 写入'hi'"
```

调用方式都很相似——这恰好说明：**入口体验上三个工具没有本质差异**。差异在于背后的模型、权限模型、扩展生态、价格定位、长期能否帮你形成稳定工作流。下文的对比表围绕这些"看不见但很重要"的维度展开。

## 同类工具对比

主对比表覆盖 9 个维度：

| 维度 | Claude Code | Codex CLI | Gemini CLI |
|------|------------|-----------|-----------|
| **维护方** | Anthropic 官方 | OpenAI 官方 | Google 官方 |
| **默认模型** | Claude Sonnet 4.6 / Opus 4.7 | GPT-5.3-Codex | Gemini 2.5 Pro / 3 系列 |
| **模型可换** | 仅 Anthropic 系列 | 主推自家，可对接 OpenAI 兼容 endpoint（体验打折） | 仅 Google 系列 |
| **上下文窗口** | 200K（Sonnet）/ 1M（Sonnet 4.6 1M context）/ 200K（Opus） | 128K（5.3-Codex-Spark 同 128K，主线 5.3-Codex 200K+） | **1M tokens**（Gemini 2.5 Pro/3） |
| **安装方式** | 推荐 native installer（curl / brew / winget），npm 标记 deprecated | npm / brew / 二进制 | npm install -g @google/gemini-cli |
| **协议** | 闭源（GitHub 仓库是 issue tracker，不是源码） | Apache-2.0 开源 | Apache-2.0 开源 |
| **价格定位** | Pro / Max / Team 月度订阅，或 API 按量 | ChatGPT 订阅可用，或 OPENAI_API_KEY 按量 | OAuth 1000 次/天免费；API Key 250 次/天（仅 Flash） |
| **扩展机制** | Skills + Hooks + MCP + Subagents（**最完整**） | Skills + Hooks + MCP（0.121.0+）| MCP + 自定义 tool + GEMINI.md |
| **沙箱/权限** | settings.json 工具白名单 + dangerously-skip-permissions | 内置 sandbox_mode + approval_policy | 默认询问 + YOLO 模式 |

### 核心区别

把上面 9 行折成一句话：

- **Claude Code**：生态最完整、扩展点最多、Subagents/Skills/Hooks 全都有，**适合长期投入构建工作流的人**；代价是绑定 Anthropic、闭源、定价偏高
- **Codex CLI**：开源、跨平台轻量化，**ChatGPT 订阅用户的天然选择**；2026 年才补齐 MCP/Skills/Hooks，生态成熟度比 Claude Code 略落后
- **Gemini CLI**：1M 上下文 + 慷慨免费额度，**适合预算敏感、需要超长上下文的人**（整个 monorepo 一次塞进去）；强绑定 Google 模型

## 常见误区

| 误区 | 准确理解 |
|------|---------|
| 新工具一定比旧的好 | Claude Code 出得最早、生态最成熟；Codex CLI / Gemini CLI 是 2025 年才追上来的。新和旧不等于好和差，按场景选 |
| 必须只选一个 | 同时装两三个完全可以，根据当前任务切换。Claude Code 配套写代码 + Gemini CLI 一次性塞整库做架构梳理是真实存在的组合 |
| Anthropic 的就一定最贵 | Claude Code Pro 月度订阅在大量使用场景下比 Anthropic API 直接按量更划算；按量计费才是真正容易超支的 |
| 开源 = 免费 | Codex CLI / Gemini CLI 工具本身开源，但调用模型仍然要付费（除非用 Gemini 免费额度或本地模型） |
| 横向对比表里某项"打勾"就一定要用 | Claude Code 有 Subagents 不代表你必须用它。**功能存在 ≠ 你需要它** |
| 上下文越大越好 | Gemini CLI 1M 听起来很爽，但塞太多无关代码进去反而让模型走神；上下文管理本身是技术，见 [Prompt cache 与上下文预算](/cli/cards/cache-and-context-budget) |
| 选型一次到位 | 工具更新太快（Claude Code 几乎每周 release，Codex CLI 2026-04 还在补 Skills），现在的"最佳选择"半年后可能换主 |

## 优劣势分析

不是逐工具列优缺点（那在各自入门卡里有），而是**按场景给出"什么时候用哪个"的决策建议**。

| 你的场景 | 首选 | 备选 | 理由 |
|---------|:---:|:---:|------|
| 第一次接触 CLI Agent，想快速跑通 | Claude Code | Gemini CLI | Claude Code 文档最齐、例子最多；Gemini CLI 免费额度低门槛 |
| ChatGPT Plus / Pro 订阅用户，想顺便用 CLI | Codex CLI | — | ChatGPT 订阅可直接 Sign in，零额外成本 |
| 整个 monorepo 想一次性让 Agent 看完做架构梳理 | Gemini CLI | Claude Code（1M context 版本）| 1M tokens 真能塞下中型项目 |
| 团队想强制工作流、做权限治理、配 hooks | Claude Code | Codex CLI（2026-04 起）| Skills + Hooks + Subagents 三件套生态最完整 |
| 想 git history 永远干净、AI 改动可追溯/可回退 | Claude Code + 自定义 hook | Codex CLI + git hook | 用 PostToolUse hook 自动 commit；详见 [lifecycle-hooks](/cli/cards/lifecycle-hooks) |
| 预算紧张，想免费跑起来 | Gemini CLI | — | Google 免费额度大方（OAuth 1000 次/天）|
| Windows 原生终端为主 | Claude Code | Gemini CLI | Codex CLI 在 Windows TUI 上社区反馈偏弱 |
| 开源洁癖、不想用闭源工具 | Codex CLI | Gemini CLI | 两家都是 Apache-2.0；Claude Code 仓库只是 issue tracker |

> 关键提醒：上表是"在 2026-04 截面"的判断，三个月后可能就要重新看。把这张表当成"当前最稳定的起点"，而不是长期定论。

## 思考题

<details>
<summary>初级：我已经付了 ChatGPT Plus，还应该额外订阅 Claude Code 吗？</summary>

**参考答案：**

按你的实际使用场景判断：

- **如果你只是偶尔写写脚本、改改 bug**：Codex CLI 配 ChatGPT Plus 完全够用，不用额外花钱
- **如果你大量做长上下文任务（读整个仓库、跨文件重构）**：Claude Code 的 1M context 版本 + Subagents 在多文件推理上有可见的优势，值得为生产力多付一份订阅
- **如果你是团队场景需要 hook / Skills / 团队权限**：Claude Code 的扩展生态最完整，定价相比效率提升合算

最务实的做法是：**先免费试一周 Codex CLI**（已有 ChatGPT 订阅），如果遇到"工具没法做的事"反复出现，再考虑 Claude Code。不要先选订阅再找用途。

</details>

<details>
<summary>中级：团队 10 人想统一终端 Agent 工具，应该怎么决策？</summary>

**参考答案：**

不要拍脑袋决定，用三步走：

1. **盘点真实场景**——团队里日常需要的是什么：写新代码？审 PR？改 bug？跑 TDD？做架构梳理？不同场景的最优工具不一样

2. **测算成本**——按团队规模 × 月活跃使用量 × 模型平均 token 估算。10 人团队按量计费可能每月 $1000+，订阅 Claude Code Team 或者 ChatGPT Business 反而更便宜

3. **统一底线，留一定弹性**——团队级别强制：
   - 共享 `.claude/settings.json`（项目级权限模型）
   - 统一 hooks 做敏感命令拦截、审计日志
   - 统一 MCP server 接入

   但**允许个人选用不同工具**：有人用 Claude Code 做 PR 审查、有人用 Gemini CLI 做整库梳理、有人用 Codex CLI 顺手 ChatGPT 订阅。强制大一统不现实也没必要，团队真正要统一的是"代码进入仓库前的 quality gate"，不是"用哪把锤子敲"。

进一步阅读：[settings.json 全局 vs 项目层级](/cli/cards/global-vs-project-settings)、[危险权限治理与 sandbox 实践](/cli/cards/dangerous-permissions-and-sandbox)。

</details>

<details>
<summary>进阶：三大工具的扩展生态（Skills / Hooks / MCP）正在快速趋同，未来还会有差异化吗？</summary>

**参考答案：**

会，差异化只会换一个层面：

- **协议层（MCP / 工具调用）正在快速标准化**：MCP 已被 Anthropic / OpenAI / Google 官方采纳，这层不会有差异化
- **Skills / Hooks 的 API 也会被互相抄袭**：Codex CLI 在 2026-04 抄了 Claude Code 的 Skills 形式；Gemini CLI 也会跟上

但下面这几层短期不会趋同：

1. **模型本身的能力差异**：长上下文、代码生成、工具调用准确率，这些直接由背后的模型决定，是不能"抄"的
2. **生态厚度**：Anthropic 官方 + 社区贡献的 Skills / MCP server / hook 模板，这是 first-mover advantage 形成的护城河
3. **运行时形态**：Claude Code 推 native installer + 自动更新；Codex CLI 推开源 + 二进制；Gemini CLI 推 npm + 大窗口——这些产品哲学不会变
4. **价格 / 商业模式**：Anthropic 走订阅；OpenAI 把 CLI 绑 ChatGPT 订阅；Google 用免费额度引流——商业模式分歧短期不会消失

所以未来的"选型"会从"哪个功能多" 转向 "哪家模型 / 哪种付费方式 / 哪种产品哲学和你的工作流匹配"。这个转向其实**对用户更友好**——功能无差时，按个人偏好选就行。

</details>

## 参考资料

1. Claude Code 官方文档：https://code.claude.com/docs/en/overview （查询日期 2026-04-23）
2. Codex CLI 官方仓库：https://github.com/openai/codex （查询日期 2026-04-23）
3. Codex CLI 官方文档：https://developers.openai.com/codex （查询日期 2026-04-23）
4. Gemini CLI 官方仓库：https://github.com/google-gemini/gemini-cli （查询日期 2026-04-23）
5. Gemini API 限速文档：https://ai.google.dev/gemini-api/docs/rate-limits （查询日期 2026-04-23）
6. CLI Agent 工具对比横评：https://www.codeant.ai/blogs/claude-code-cli-vs-codex-cli-vs-gemini-cli-best-ai-cli-tool-for-developers-in-2025 （查询日期 2026-04-23）

---
*Source: https://learnagent.wiki/cli/cards/terminal-agents-comparison*
*Markdown mirror of https://learnagent.wiki, served as text/markdown for LLM ingestion.*