在AI领域,Agent(智能体) 可以理解为 “会自己动脑、动手去完成目标的数字实体”。
结合之前的比喻:
- 大模型只是那位 “说书人”(只会根据上文续写下文,不主动行动)。
- Agent 则给这位说书人装上了 “眼睛、手脚和任务清单”。
具体来说,Agent 包含以下几个核心能力:
- 自主规划:不只被动接话,而是能把一个复杂目标(比如“帮我订下周三去北京的机票”)拆解成步骤——先查日期、再比价、再跳转支付。
- 感知环境:能接收来自外部的反馈(比如网页提示“座位已满”,它能看到并调整计划)。
- 调用工具:可以主动使用搜索引擎、计算器、API、操作软件等,而不只是输出文字。
- 执行动作:最终在现实或数字世界里产生影响——比如真正点下“确认下单”按钮。
简单区分:
- 大模型 = 大脑(只会说话推理)
- Agent = 大脑 + 手 + 眼 + 目标驱动
典型例子:AutoGPT、能自动发邮件的AI助理、在游戏里自己打怪升级的AI角色。可以说,Agent 让 AI 从“说到”变成了“做到”。