新手入门/AI Agent 5 分钟入门
新手入门

AI Agent 5 分钟入门

完全零基础也能看懂的 AI Agent 第一课,5 分钟读懂"它是什么、能干什么、我怎么开始"

难度 17 分钟concept更新于 2026-04-27

内容摘要

如果你是被人塞了一个链接、一脸懵地点进来的,没关系,这一页就是写给你的。

AI Agent 5 分钟入门

如果你是被人塞了一个链接、一脸懵地点进来的,没关系,这一页就是写给你的。

放轻松,下面没有公式、没有黑魔法、也没有"你必须先懂编程"这种门槛。倒杯水,5 分钟就够。

AI Agent 到底是什么

一句话先说清楚:AI Agent 就是一个会自己动手干活的 AI

你以前用 ChatGPT,更像是问一个百事通——你问,它答,剩下的事得你自己去做。 AI Agent 不一样,它更像你新招的一个听话的实习生:你说一句"帮我把这份 PDF 看完,挑出里面的重点发到我邮箱",它真的会去翻文件、写邮件、发出去,最后回来跟你说一声"做完了"。

差别就在这一步:以前的 AI 只会"说",AI Agent 会"做"。

要再形象一点,可以这么类比:

  • 网页版 ChatGPT 像一个隔着玻璃的客服,你递纸条进去,它递纸条出来。
  • IDE 里的 AI 插件(写代码用的那种)像是坐在你旁边的副驾,能看你写什么,给你提提示。
  • AI Agent 像一个有驾照、能上路的助理,你交代一个任务,它自己开车去办。

下面这张表把三类工具的差别说得最直白:

工具类型它在哪干活能不能替你做事
网页版 ChatGPT一个聊天框只能聊天,不能动手
IDE 里的 AI 插件编辑器内部能改代码,出不了编辑器
AI Agent你的电脑、你的账号、互联网能读文件、跑命令、发消息

看明白这张表,你就抓住了 AI Agent 的核心:它的"工作半径"比前两类大得多。前两类是嘴上的助手,AI Agent 是手上的助手。

它能帮我做什么

讲再多概念都没有具体场景管用。下面这些都是真的、现在就能跑、不限于程序员的场景:

  • 读完一份 PDF 帮你写大白话总结。把一篇 30 页的报告丢给它,让它用 5 分钟讲清楚——你省下半小时阅读时间。
  • 看一个 GitHub 项目然后告诉你这玩意儿是干嘛的。你只要给它一个网址,它读完代码和说明,回头跟你说"这个项目主要做 XX,适合 XX 用"。比你自己翻 README 快多了。
  • 把你乱糟糟的笔记整理成一份像样的文档。会议记的草稿、灵感片段、一堆截图说明,让它整理成有标题、有段落、有重点的文档。
  • 定时帮你看邮件,把重要的转发到飞书或微信。每天早上自动跑一遍,垃圾邮件扔掉,重要的挑出来发到群里。你少打开十次邮箱。
  • 修一段坏掉的程序。哪怕你不太会写代码,把报错信息丢给它,它能告诉你哪里错了,甚至直接帮你改好。
  • 帮你写工作日报、周报的初稿。把今天做了什么用一两句话告诉它,它帮你扩成一段顺溜的话,你只需要微调。

注意,这里所有例子都不要求你会编程。你需要的只是一个能用普通话沟通的助手,恰好它的英语和编程也很好

如果还要打个比方:以前请助理要付工资、还要培训三个月才能上手;现在你有一个 24 小时不睡觉、永远耐心、随时可以"开除再换一个"的实习生,门槛低到只要你会打字就行。

5 分钟亲自试一下

光看不练等于白看。下面给两条最低门槛的路径,挑一条对你口味的就行。

路径 A:完全不用安装(推荐零基础先走这条)

  1. 打开网页:https://claude.ai
  2. 注册或登录(用 Google 账号最快,3 秒搞定)
  3. 在对话框里输入下面这句话试试:
帮我把今天 ChatGPT 公布的新闻整理成一段中文摘要,控制在 200 字以内

按下回车,看它怎么回答你。你会发现它真的会去查、真的会总结、真的会用大白话告诉你。

如果这一步跑通了,恭喜,你已经在用 AI Agent 了。剩下的所有"高阶玩法"都是这一步的延伸。

可以再试几句这种:

  • "把这段英文翻译成口语化的中文,别太书面"
  • "我有个 Excel 表格不会做透视表,能一步步教我吗"
  • "帮我写三条朋友圈文案,主题是周末爬山"

玩到这里,你已经入门了。下面这条路径是给想再深一点的人。

路径 B:装一个 CLI 工具(适合想让 AI 真正"动手"做事的人)

CLI 是"命令行"的意思,你可以理解成那种黑窗口里输文字的工具。听起来有点吓人,其实只要 3 行命令。

推荐一个叫 Claude Code 的工具(Anthropic 官方出的,目前体验最好的那一档):

# 第一步:安装(macOS / Linux 用户)
curl -fsSL https://claude.ai/install.sh | bash

# 第二步:进入你想让它干活的文件夹
cd ~/Documents

# 第三步:启动它
claude

启动后会让你登录一次。登录完,对着它直接说人话就行:

> 帮我把这个文件夹里所有 .md 文件按时间排序列出来

它会自己去跑命令、读结果、然后告诉你答案。你不用记任何指令,跟它说人话就行。

如果路径 A 你已经跑通了,你就已经用上 AI Agent 了。路径 B 只是在它头上又加了一双手——能直接读你的文件、跑你电脑上的程序。先用着 A,等哪天觉得"我要是能让它直接操作文件就好了",再回来装 B 也不迟。

接下来看什么

到这里你已经看完第一课了。下面三条路任选其一,不用都看:

  • 想直接玩,赶紧上手Claude Code 入门 适合你已经跑通了路径 B,想知道还能怎么用。

  • 想搞懂它为什么这么聪明Tool Use(AI 怎么调用工具) 适合你看完上面后,开始好奇"它到底是怎么帮我读文件的"。

  • 想挑一个最适合自己的终端 AI 工具三大终端 Agent 对比 适合你纠结"Claude Code、Codex CLI、Gemini CLI 我该装哪个"。


你已经看完第一课了,下面随便选一条接着看就行。不用一口气看完整个站,每天看一两张卡,一个月你就比 90% 的人更懂 AI Agent 是怎么回事。

延伸阅读

优先展示同分类且标签更接近的内容,方便继续串联学习。

新手入门难度 14 分钟对比
01

AI Agent 和聊天机器人到底差在哪

用大白话讲清 AI Agent 和你熟悉的 ChatGPT、文心一言、豆包等聊天机器人的本质区别,看完不再混淆

入门零基础ChatGPTAI Agent对比
更新于 2026-04-27ai-agent-vs-chatbot
新手入门难度 18 分钟概念
02

12 个 AI Agent 真实场景:你也能用得上

12 个真实落地的 AI Agent 使用场景,覆盖工作、学习、生活、创作,每个都能马上动手试,不用写代码

入门零基础场景案例灵感
更新于 2026-04-27agent-use-cases-12
新手入门难度 15 分钟概念
03

什么时候不该用 AI Agent

6 个场景告诉你 AI Agent 不是万能的,硬上反而费时费力,知道边界比知道能力更重要

入门零基础边界理性反向
更新于 2026-04-27when-not-to-use-agent