---
title: "AI Agent 5 分钟入门"
wiki: agent
category: "新手入门"
slug: what-is-ai-agent-5min
url: https://learnagent.wiki/agent/cards/what-is-ai-agent-5min
tags: ["入门", "零基础", "AI Agent", "第一课", "Claude"]
last_updated: 2026-04-27
reading_time: 7
---

> 如果你是被人塞了一个链接、一脸懵地点进来的，没关系，这一页就是写给你的。

# AI Agent 5 分钟入门

如果你是被人塞了一个链接、一脸懵地点进来的，没关系，这一页就是写给你的。

放轻松，下面没有公式、没有黑魔法、也没有"你必须先懂编程"这种门槛。倒杯水，5 分钟就够。

## AI Agent 到底是什么

一句话先说清楚：**AI Agent 就是一个会自己动手干活的 AI**。

你以前用 ChatGPT，更像是问一个**百事通**——你问，它答，剩下的事得你自己去做。
AI Agent 不一样，它更像你新招的一个**听话的实习生**：你说一句"帮我把这份 PDF 看完，挑出里面的重点发到我邮箱"，它真的会去翻文件、写邮件、发出去，最后回来跟你说一声"做完了"。

差别就在这一步：以前的 AI 只会"说"，AI Agent 会"做"。

要再形象一点，可以这么类比：

- **网页版 ChatGPT** 像一个隔着玻璃的客服，你递纸条进去，它递纸条出来。
- **IDE 里的 AI 插件**（写代码用的那种）像是坐在你旁边的副驾，能看你写什么，给你提提示。
- **AI Agent** 像一个有驾照、能上路的助理，你交代一个任务，它自己开车去办。

下面这张表把三类工具的差别说得最直白：

| 工具类型 | 它在哪干活 | 能不能替你做事 |
| --- | --- | --- |
| 网页版 ChatGPT | 一个聊天框 | 只能聊天，不能动手 |
| IDE 里的 AI 插件 | 编辑器内部 | 能改代码，出不了编辑器 |
| AI Agent | 你的电脑、你的账号、互联网 | 能读文件、跑命令、发消息 |

看明白这张表，你就抓住了 AI Agent 的核心：**它的"工作半径"比前两类大得多**。前两类是嘴上的助手，AI Agent 是手上的助手。

## 它能帮我做什么

讲再多概念都没有具体场景管用。下面这些都是真的、现在就能跑、不限于程序员的场景：

- **读完一份 PDF 帮你写大白话总结**。把一篇 30 页的报告丢给它，让它用 5 分钟讲清楚——你省下半小时阅读时间。
- **看一个 GitHub 项目然后告诉你这玩意儿是干嘛的**。你只要给它一个网址，它读完代码和说明，回头跟你说"这个项目主要做 XX，适合 XX 用"。比你自己翻 README 快多了。
- **把你乱糟糟的笔记整理成一份像样的文档**。会议记的草稿、灵感片段、一堆截图说明，让它整理成有标题、有段落、有重点的文档。
- **定时帮你看邮件，把重要的转发到飞书或微信**。每天早上自动跑一遍，垃圾邮件扔掉，重要的挑出来发到群里。你少打开十次邮箱。
- **修一段坏掉的程序**。哪怕你不太会写代码，把报错信息丢给它，它能告诉你哪里错了，甚至直接帮你改好。
- **帮你写工作日报、周报的初稿**。把今天做了什么用一两句话告诉它，它帮你扩成一段顺溜的话，你只需要微调。

注意，这里所有例子都不要求你会编程。**你需要的只是一个能用普通话沟通的助手，恰好它的英语和编程也很好**。

如果还要打个比方：以前请助理要付工资、还要培训三个月才能上手；现在你有一个 24 小时不睡觉、永远耐心、随时可以"开除再换一个"的实习生，门槛低到只要你会打字就行。

## 5 分钟亲自试一下

光看不练等于白看。下面给两条最低门槛的路径，挑一条对你口味的就行。

### 路径 A：完全不用安装（推荐零基础先走这条）

1. 打开网页：<https://claude.ai>
2. 注册或登录（用 Google 账号最快，3 秒搞定）
3. 在对话框里输入下面这句话试试：

```text
帮我把今天 ChatGPT 公布的新闻整理成一段中文摘要，控制在 200 字以内
```

按下回车，看它怎么回答你。你会发现它真的会去查、真的会总结、真的会用大白话告诉你。

**如果这一步跑通了，恭喜，你已经在用 AI Agent 了**。剩下的所有"高阶玩法"都是这一步的延伸。

可以再试几句这种：

- "把这段英文翻译成口语化的中文，别太书面"
- "我有个 Excel 表格不会做透视表，能一步步教我吗"
- "帮我写三条朋友圈文案，主题是周末爬山"

玩到这里，你已经入门了。下面这条路径是给想再深一点的人。

### 路径 B：装一个 CLI 工具（适合想让 AI 真正"动手"做事的人）

CLI 是"命令行"的意思，你可以理解成那种黑窗口里输文字的工具。听起来有点吓人，其实只要 3 行命令。

推荐一个叫 **Claude Code** 的工具（Anthropic 官方出的，目前体验最好的那一档）：

```bash
# 第一步：安装（macOS / Linux 用户）
curl -fsSL https://claude.ai/install.sh | bash

# 第二步：进入你想让它干活的文件夹
cd ~/Documents

# 第三步：启动它
claude
```

启动后会让你登录一次。登录完，对着它直接说人话就行：

```text
> 帮我把这个文件夹里所有 .md 文件按时间排序列出来
```

它会自己去跑命令、读结果、然后告诉你答案。你不用记任何指令，跟它说人话就行。

> 如果路径 A 你已经跑通了，你就已经用上 AI Agent 了。路径 B 只是在它头上又加了一双手——能直接读你的文件、跑你电脑上的程序。先用着 A，等哪天觉得"我要是能让它直接操作文件就好了"，再回来装 B 也不迟。

## 接下来看什么

到这里你已经看完第一课了。下面三条路任选其一，不用都看：

- **想直接玩，赶紧上手** → [Claude Code 入门](/cli/cards/claude-code-overview)
  适合你已经跑通了路径 B，想知道还能怎么用。

- **想搞懂它为什么这么聪明** → [Tool Use（AI 怎么调用工具）](/agent/cards/tool-use)
  适合你看完上面后，开始好奇"它到底是怎么帮我读文件的"。

- **想挑一个最适合自己的终端 AI 工具** → [三大终端 Agent 对比](/cli/cards/terminal-agents-comparison)
  适合你纠结"Claude Code、Codex CLI、Gemini CLI 我该装哪个"。

---

你已经看完第一课了，下面随便选一条接着看就行。不用一口气看完整个站，每天看一两张卡，一个月你就比 90% 的人更懂 AI Agent 是怎么回事。

---
*Source: https://learnagent.wiki/agent/cards/what-is-ai-agent-5min*
*Markdown mirror of https://learnagent.wiki, served as text/markdown for LLM ingestion.*