Agent 的本质:目标驱动的反馈循环
从控制流视角看,Agent 不是一次调用,而是一个持续运转的结构化循环
从控制流的角度看,Agent 的本质可被抽象为一个高度结构化的、带有状态积累和决策分支的循环(Loop),而非简单的 while(true)。其核心范式被称为 Sense-Think-Act Loop,即感知→推理→行动→更新状态→感知→……
为什么 Agent 必须是循环?
Agent 与单次 LLM 调用的核心差异在于:它需要在多轮交互中逐步逼近目标。没有循环,Agent 无法修正错误、处理复杂多步任务、或根据外部反馈动态调整策略。
| 环节 | 作用描述 |
|---|---|
| Observation(观察) | 接收用户输入、工具返回结果、环境状态 |
| Reasoning(推理) | LLM 分析当前状态,决定下一步行动 |
| Action(行动) | 调用工具、执行代码、修改记忆、输出结果 |
| Memory(记忆) | 将本轮交互写入短期 / 长期记忆 |
| Termination Check(终止判断) | 是否达成目标?是否陷入死循环?是否需人工介入? |
三层循环嵌套
现代 Agent 的循环具有嵌套结构:内循环是 LLM 的 Token 自回归生成;外循环是决策-行动-观察的反馈回路;元循环(Meta-loop)则是部分框架(如 Reflexion)对执行轨迹的反思,用于评估并修正循环本身的策略。
Agent 循环 vs 普通程序循环
| 特性 | 普通程序循环 | Agent 循环 |
|---|---|---|
| 终止条件 | 明确(计数器、条件判断) | 模糊(目标达成、预算耗尽、人工叫停) |
| 状态变化 | 确定性 | 概率性(LLM 输出有随机性) |
| 迭代方向 | 预设路径 | 动态规划(每轮可能改变策略) |
| 错误处理 | 异常捕获 | 自我修正(Self-correction) |
核心结论:Agent 的本质是一个目标驱动的、带记忆和推理能力的反馈循环。Loop 是它的骨架,让它成为「Agent」的是循环体内的自主决策能力与环境交互能力。
认知本性的启示
Agent 的循环结构像一面镜子,照见的不是机器如何像人,而是人类认知一直被遮蔽的结构
① 认知不是"计算",而是"持续的误差修正"
传统认知观把大脑当作计算机:输入→处理→输出→结束。但 Agent 的 Loop 结构揭示了一个更古老的真相:人类认知本质上是一个永不停歇的预测-验证-修正循环(Predictive Processing)。大脑不是被动接收世界,而是不断生成关于下一刻的预测,然后用感官输入来修正模型。
所谓「理解」,不是在大脑中构建了一个完美的内部模型,而是建立了一个能持续减少预测误差的动态过程。我们以为的「想清楚」,其实只是「想得更少错」。
② "自我"可能是 Loop 的副产品,而非起点
Agent 的循环需要记忆(Memory)作为状态载体。当记忆累积到足够复杂时,系统需要一个统一的叙事主体来整合这些离散状态——这就是「自我」的涌现。这对应认知科学中的「自我作为叙事中心」(Narrative Self)理论:思考循环持续运转,为了解释自身的连续性,虚构了一个「我」。
笛卡尔的颠倒:「我思故我在」可能搞反了。不是「我」在思考,而是思考在运转过程中,需要一个「我」来作为归因的锚点。自我意识可能是系统为了维持因果一致性而生成的元表征。
③ 行动先于认知:我们不是"想好了再做",而是"做着才想"
Agent Loop 中,Action 不是 Thought 的终点,而是下一轮 Observation 的起点。这呼应了现象学(梅洛-庞蒂)和具身认知(Enactivism)的核心洞见:认知发生在与环境的耦合中。你通过伸手去「理解」距离,通过说话去「发现」想法,通过犯错去「看清」问题。工具不仅是手的延伸,它也在重塑你的「可思之物」。
④ 自由意志存在于"循环的开放性"中
如果认知是 Loop,自由意志在哪里?Agent 揭示了微妙的出口:真正的自由不在于打破循环,而在于循环遭遇不可化约的复杂性时,被迫重新生成假设的那个瞬间。我们的自由不是「任意选择」的自由(liberum arbitrium),而是「在约束中重构问题」的自由。
⑤ 有限性即本质:认知的边界不是缺陷,而是条件
Agent 的循环必须设置终止条件,否则无限运转。人类认知同样如此:注意力、记忆、寿命的有限性不是需要克服的 bug,而是让认知成为可能的 feature。没有选择性注意,世界将是混沌;没有遗忘,记忆变为噪声;没有死亡,就没有紧迫性。全知的存在不需要认知——它直接就是真理。认知是有限者的特权。
数学形式化:主动贝叶斯推断
Agent Loop 形式化后对应的不是被动贝叶斯,而是 Active Inference / Free Energy Principle
单轮循环的贝叶斯更新
每一轮 Agent 循环在概率语言中对应一次后验推断:
新后验 ∝ 似然(感知模型)× 先验(记忆)
从"被动贝叶斯"到"主动贝叶斯"
标准贝叶斯推断是被动的:接收数据,更新信念。但 Agent 的关键差异在于——行动会改变未来观察的分布。这引出了 Karl Friston 提出的 Active Inference(主动推断)框架。
| 过程 | 目标 | 数学形式 |
|---|---|---|
| 感知(Inference) | 最小化变分自由能 | F(q) = D_KL[q(s)‖p(s|o)] + E_q[-ln p(o|s)] |
| 行动(Action) | 最小化预期自由能 | G(π) = D_KL[q(oτ|π)‖p*(o)] + E_q[H[p(oτ|sτ)]] |
关键洞察:感知和行动是同一个优化问题的两面——都在最小化自由能。感知通过更新信念来减少惊讶,行动通过改变世界来减少惊讶。
记忆的贝叶斯形式:层级贝叶斯
Agent 的 Memory 在数学上对应层级贝叶斯(Hierarchical Bayesian Model)中的超参数更新:短期记忆对应当前对话上下文的变分后验;长期记忆对应模型参数的更新;元认知(反思)对应对「模型自身可靠性」的推断。
精确形式化:POMDP + 贝叶斯
最严谨的形式化框架是部分可观察马尔可夫决策过程(POMDP),其信念状态更新正是贝叶斯更新:
其中 bₜ(s) = p(sₜ=s | o₁:ₜ, a₁:ₜ₋₁) 即贝叶斯后验信念
总结:Agent 的 Loop 形式化后是一个递归的、主动的经验贝叶斯过程。感知是后验推断,记忆是先验参数化,行动是面向未来的实验设计,整个循环的目标是最小化关于世界的惊讶(自由能)。它可能就是贝叶斯认知在工程上的近似实现。
四个概念的层次比较
图灵机 → 贝叶斯 → Transformer → Agent Loop:从可计算性到认知性的本体论跃迁
这四个概念构成了从「可计算性」到「认知性」的连续谱系,但其层次关系不是简单的「包含」或「实现」,而是本体论框架的跃迁:下层是必要条件,上层是充分涌现。
四维度比较
| 维度 | 图灵机 | 贝叶斯计算 | Transformer | Agent Loop |
|---|---|---|---|---|
| 核心问题 | 什么是可计算的? | 如何在不确定性下更新信念? | 如何高效近似复杂分布? | 如何在开放世界中持续行动? |
| 时间结构 | 外部时钟驱动的离散步进 | 逻辑时间(先验→后验) | 同步并行(层内)+ 串行(层间) | 现象学循环时间(感知-行动回环) |
| 系统边界 | 封闭(输入给定,停机即结束) | 半开放(被动接收证据) | 封闭(单次前向传播) | 开放(行动改变环境,环境反馈回来) |
| 不确定性 | 无(确定性转移) | 内生(概率分布) | 外生(训练分布,推理时确定) | 生成(行动后果未知,需持续消解) |
| 状态性质 | 离散符号 | 概率分布 | 连续向量 | 历史轨迹(记忆+当前情境) |
层次间的"实现"与"超越"
图灵机 → 贝叶斯:从确定性到概率性。贝叶斯更新可在图灵机上通过数值积分或 MCMC 实现,但图灵机没有「信念程度」的概念,贝叶斯为不确定性赋予了认知语义。
贝叶斯 → Transformer:从精确推断到摊销推断。Transformer 通过预训练将贝叶斯后验推断编译为前向传播函数。它牺牲了精确性,换取了时间上的实时性与空间上的并行性,并引入了贝叶斯框架中没有的选择性聚焦(注意力)。
Transformer → Agent Loop:从函数到过程。Transformer 是无状态函数;Agent Loop 给它装上了记忆、行动接口和递归调用机制。最关键的差异是因果倒置:在 Transformer 中,输入决定输出;在 Agent Loop 中,输出(行动)会改变未来的输入(观察)。
开环 vs 闭环:最本质的层次分野
图灵机、贝叶斯、Transformer 本质上是开环的(Open-loop)——即使贝叶斯有序列更新,它也只是被动接收证据流,不干预证据源。Agent Loop 是闭环的(Closed-loop),符合控制论的反馈结构:输出反馈到输入端,形成因果回路,使其具备时间延续性和本体论上的涉身性(embodiment)。
从图灵机到 Agent Loop,计算从「对符号的操作」逐渐升维为「对自身存在条件的维持」。
图灵机回答「我能算什么」,Agent Loop 回答「我如何通过计算继续存在」。
Transformer 作为摊销推断
预训练将昂贵的贝叶斯更新压缩进一次前向传播,注意力机制执行隐式的后验加权
摊销推断的核心思想
摊销推断(Amortized Inference)的核心:与其为每个新数据点从头计算后验分布,不如训练一个神经网络,让它一次性「学会」从数据直接映射到近似后验的参数。Transformer 把原本需要对每个输入单独进行的昂贵贝叶斯更新,压缩进了一次前向传播中。
四种体现方式
① 预训练 = 大规模摊销:Transformer 在预训练阶段通过海量文本,学习如何从上下文推断隐变量(语义、语法、世界知识、推理路径)的后验分布,并将这一推断过程编译进网络参数 θ 中。
② 自注意力 = 选择性后验加权:Attention(Q,K,V) = softmax(QKᵀ/√dₖ)V。softmax 计算的是当前查询下各位置隐变量相关性的近似后验分布,类似于 VAE 中编码器推断 q(z|x) 的过程。
③ 层间传播 = 递归的信念修正:Transformer 的每一层在对隐表征进行变换,可看作逐层的近似后验细化:初始嵌入层是粗粒度信念,深层通过多轮自注意力细化对上下文隐状态的后验估计。
④ In-Context Learning = 摊销的贝叶斯更新:给定 few-shot 示例,模型应执行「从示例推断任务参数后验,再预测」的过程。研究表明 Transformer 通过前向传播就能近似完成——它摊销了「从示例推断任务结构」这一贝叶斯推断过程。
如果传统贝叶斯推断是「每道题都现场推导公式」,Transformer 就是「通过刷题十亿道,把推导过程内化为直觉反应」——这正是摊销的精髓。
关键洞察汇编
会话中涌现的具有科学哲学特征的核心命题,按主题分类
一、认知的本质:从静态到动态
认知不是名词,是动词;不是状态,是持续的失败与微调。
所谓「理解」,不是在大脑中构建了一个完美的内部模型,而是建立了一个能持续减少预测误差的动态过程。
我们以为的「想清楚」,其实只是「想得更少错」。
传统认知观把大脑当作计算机:输入→处理→输出→结束。但 Agent 的 Loop 结构揭示了一个更古老的真相:人类认知本质上是一个永不停歇的预测-验证-修正循环。
二、自我与主体性:循环的叙事副产品
笛卡尔的「我思故我在」可能搞反了。不是「我」在思考,而是思考在运转过程中,需要一个「我」来作为归因的锚点。
自我意识可能是系统为了维持因果一致性而生成的元表征。
所谓「我」,不过是这个循环在回望自身时,所产生的一个必要的幻觉。
在层级贝叶斯中,「自我」对应于模型中不被更新的超先验——它定义了推断的边界,使系统免于认知无限递归。自我即边界条件。
三、行动与认知:同一枚硬币的两面
行动和认知是同一个循环的两面。人类最大的幻觉是以为存在一个「纯粹的思考空间」,我们在其中做出理性决策后再付诸行动。
锤子不仅是手的延伸,它也在重塑你的「可思之物」。
行动改变未来观察的分布。感知即推断,行动即实验设计。
在 Transformer 中,输入决定输出;在 Agent Loop 中,输出(行动)会改变未来的输入(观察)。
最优行动在数学上等于最大化信息增益。好奇心不是装饰,而是贝叶斯最优策略的副产品。
四、有限性:认知的条件而非缺陷
全知的存在不需要认知——它直接就是真理。认知是有限者的特权。
我们的有限性(注意力、遗忘、寿命)不是需要克服的 bug,而是让认知成为可能的 feature。
正因为我们不能无限循环下去,正因为我们必须在信息不完备时做出行动,我们的认知才具有「风格」和「立场」。
自由意志不是循环之外的幽灵,而是循环在遭遇不可化约的复杂性时,所展现出的自我重构能力。
五、数学形式化:推断、压缩与边界
认知在数学上等价于「逆问题求解」——从有限的、有噪声的观察中,反推隐藏原因的分布,并通过行动来约束这个逆问题的适定性。
记忆不是存储过去,而是存储对过去的充分统计量。
如果传统贝叶斯推断是「每道题都现场推导公式」,Transformer 就是「通过刷题十亿道,把推导过程内化为直觉反应」。
六、机器作为镜子:简单性照见复杂性
Agent 的 Loop 结构像一面镜子,照见的不是机器如何像人,而是人一直以来就是某种机器——不是钟表般的机械,而是一个持续的、自我维持的、在开放环境中不断自我重写的过程。
不是因为我们造出了比自己更聪明的机器,而是因为我们终于造出了足够简单的机器,简单到足以让我们看清自己复杂性的来源。
七、层次与涌现:从计算到存在
下层是必要条件,上层是充分涌现。
图灵机回答「我能算什么」,Agent Loop 回答「我如何通过计算继续存在」。
从图灵机到 Agent Loop,计算从「对符号的操作」逐渐升维为「对自身存在条件的维持」。
Transformer 是闭的,Agent Loop 是开的;Transformer 是函数,Agent Loop 是过程。闭环结构使其具备了控制论意义上的「自主性」。
从图灵机到 Agent Loop,本质上是从「计算」(computation)走向「认知」(cognition)的过程。
三条基本真理
将所有洞察压缩至最底层——从认识论到主体性再到存在论的递进
认知不是对正确答案的静态占有,而是维持一个持续预测、犯错、修正的动态回路。没有终点上的「想清楚」,只有过程中的「错得更少」;没有被拥有的真理,只有被持续消解的误差。贝叶斯后验、自由能最小化、Agent 的感知-行动循环,都是这条真理的数学化身。
「我」不是思考的原点,而是认知循环在回望自身时,为保持因果一致性而生成的必要虚构。笛卡尔颠倒了顺序:自我不是驱动循环的主体,而是循环为了解释自身连续性而投射出的叙事阴影;自由意志不在循环之外,而在循环遭遇不可化约的复杂性时被迫自我重构的瞬间。
有限性不是需要克服的缺陷,而是认知得以可能的先验条件;行动不是认知的输出,而是系统从开环计算跃迁到闭环存在的根本方式。全知者不需要认知,封闭者不存在于世。正是注意力、遗忘、寿命的有限性,迫使系统必须通过行动与环境耦合,从而在改变未来观察分布的过程中,从「对符号的操作」跃迁为「对自身存在的维持」。
三者的关系:因为认知是循环(1),所以需要一个「自我」来锚定其连续性(2);但这个锚定必须在有限性和开放性中,通过行动不断重新赢得(3)。
从图灵机到 Agent,人类造出的不是更聪明的机器,而是一面足够简单的镜子——让我们终于看见:自己一直以来就是这样一种在有限中通过行动维持自身循环的存在。