<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Agent on AI 学习笔记</title><link>https://GUkirito.github.io/tags/agent/</link><description>Recent content in Agent on AI 学习笔记</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Sat, 16 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://GUkirito.github.io/tags/agent/index.xml" rel="self" type="application/rss+xml"/><item><title>Agent（智能体）</title><link>https://GUkirito.github.io/2026-05-16-agent%E6%99%BA%E8%83%BD%E4%BD%93/</link><pubDate>Sat, 16 May 2026 00:00:00 +0000</pubDate><guid>https://GUkirito.github.io/2026-05-16-agent%E6%99%BA%E8%83%BD%E4%BD%93/</guid><description>&lt;p&gt;在AI领域，&lt;strong&gt;Agent（智能体）&lt;/strong&gt; 可以理解为 &lt;strong&gt;“会自己动脑、动手去完成目标的数字实体”&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;结合之前的比喻：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;大模型只是那位 &lt;strong&gt;“说书人”&lt;/strong&gt;（只会根据上文续写下文，不主动行动）。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Agent&lt;/strong&gt; 则给这位说书人装上了 &lt;strong&gt;“眼睛、手脚和任务清单”&lt;/strong&gt;。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;具体来说，Agent 包含以下几个核心能力：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;自主规划&lt;/strong&gt;：不只被动接话，而是能把一个复杂目标（比如“帮我订下周三去北京的机票”）拆解成步骤——先查日期、再比价、再跳转支付。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;感知环境&lt;/strong&gt;：能接收来自外部的反馈（比如网页提示“座位已满”，它能看到并调整计划）。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;调用工具&lt;/strong&gt;：可以主动使用搜索引擎、计算器、API、操作软件等，而不只是输出文字。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;执行动作&lt;/strong&gt;：最终在现实或数字世界里产生影响——比如真正点下“确认下单”按钮。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;简单区分&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;大模型 = 大脑（只会说话推理）&lt;/li&gt;
&lt;li&gt;Agent = 大脑 + 手 + 眼 + 目标驱动&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;典型例子：AutoGPT、能自动发邮件的AI助理、在游戏里自己打怪升级的AI角色。可以说，&lt;strong&gt;Agent 让 AI 从“说到”变成了“做到”&lt;/strong&gt;。&lt;/p&gt;</description></item><item><title>Skill（技能）</title><link>https://GUkirito.github.io/2026-05-16-skill%E6%8A%80%E8%83%BD/</link><pubDate>Sat, 16 May 2026 00:00:00 +0000</pubDate><guid>https://GUkirito.github.io/2026-05-16-skill%E6%8A%80%E8%83%BD/</guid><description>&lt;p&gt;延续之前的比喻：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;大模型&lt;/strong&gt; = 会思考、会说话的大脑（说书人）。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Agent&lt;/strong&gt; = 大脑 + 眼睛（感知）+ 手脚（行动）+ 任务清单（规划）。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Skill&lt;/strong&gt; = 给Agent配备的 &lt;strong&gt;“专项技能证书”&lt;/strong&gt;，比如“会用电钻”“会说法语”“会查股票”。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;具体来说&lt;/strong&gt;：一个Skill就是一段预先编写好的、让Agent能完成特定动作的代码或流程。例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;“发送邮件”技能 → Agent调用它就能自动填写收件人、主题、正文并点击发送。&lt;/li&gt;
&lt;li&gt;“计算器”技能 → Agent遇到数学运算时，不靠大模型瞎猜，而是精确计算。&lt;/li&gt;
&lt;li&gt;“查询天气”技能 → Agent调用天气API并解析结果。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;为什么需要Skill？&lt;/strong&gt;&lt;br&gt;
大模型虽然聪明，但不会实际操作外部系统，也可能出现幻觉。Skill 就像给Agent &lt;strong&gt;“外挂的机械手臂”&lt;/strong&gt;，让它能&lt;strong&gt;真正做事情&lt;/strong&gt;——而且Skill可以随时添加、更新、复用，就像给机器人换螺丝刀头一样。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;与Tool的区别&lt;/strong&gt;：&lt;br&gt;
这两个词经常混用，但细微差别是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Tool&lt;/strong&gt; 通常更通用（比如“搜索引擎”是一个工具）。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Skill&lt;/strong&gt; 更偏向封装好的、面向任务的能力（比如“帮我在Slack上发消息”是一个技能）。&lt;br&gt;
很多框架（如LangChain、Semantic Kernel）中，Skill 本质上就是调用一系列Tool的流程或模板。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;一句话总结&lt;/strong&gt;：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;大脑（大模型）决定“做什么”，Agent决定“怎么安排”，而&lt;strong&gt;Skill就是让安排落地的‘手和关节’&lt;/strong&gt; —— 缺了它，Agent只会说不会做。&lt;/p&gt;
&lt;/blockquote&gt;</description></item></channel></rss>