技术架构
/
Feb 09, 2026
Step 6 06. Agent (智能体):从对话到行动
<!-- Title: 06. Agent (智能体):从对话到行动 -->
<!-- Series: LLM 原理与微调实战 (ID: 8) -->
<!-- Author: admin -->
# Agent (智能体):从对话到行动
## 1. Copilot vs Agent
* **Copilot (副驾驶)**:你问它答,你让它写代码它写代码。它被动等待你的指令。
* **Agent (代理人)**:你给它一个**目标**(比如“帮我策划一次去日本的旅行并订票”),它自己拆解任务,自己调用工具,直到任务完成。
Agent = LLM (大脑) + Memory (记忆) + Tools (手脚) + Planning (规划)。
## 2. 工具调用 (Function Calling)
LLM 本身无法联网,无法操作数据库。
我们需要给它定义一组 **Tools**:
* `search_google(query)`
* `read_file(path)`
* `send_email(to, body)`
当 LLM 发现需要查资料时,它会输出一个特殊的 Token,告诉程序去执行 `search_google`。程序执行完,把结果返还给 LLM。
## 3. AutoGPT 与 BabyAGI
这两个项目让 Agent 概念火遍全球。
它们引入了**自主循环**:
1. 设定目标。
2. 生成任务列表。
3. 执行第一个任务。
4. 根据结果,**新增/修改/删除**后续任务。
5. 循环直到目标达成。
## 4. 挑战
Agent 目前还很脆弱。
* **死循环**:在一个任务上卡死。
* **上下文溢出**:记忆太长,撑爆了 Context Window。
* **不可控**:可能会误删文件或发送错误邮件。
但它是通往 **AGI (通用人工智能)** 的必经之路。
## 结语
未来的软件交互方式,将不再是点菜单和按钮。
而是你对 Agent 说:“帮我搞定这件事。”
P
潘卫
南京市沉思波网络科技有限责任公司创始人、CEO
您的观点 (可选)
🎁 注册账号,同步您的个性化学习路径