Agent 循环与认知本性

Section I

Agent 的本质：目标驱动的反馈循环

从控制流视角看，Agent 不是一次调用，而是一个持续运转的结构化循环

从控制流的角度看，Agent 的本质可被抽象为一个高度结构化的、带有状态积累和决策分支的循环（Loop），而非简单的 while(true)。其核心范式被称为 Sense-Think-Act Loop，即感知→推理→行动→更新状态→感知→……

图 1 · Agent 核心循环结构

为什么 Agent 必须是循环？

Agent 与单次 LLM 调用的核心差异在于：它需要在多轮交互中逐步逼近目标。没有循环，Agent 无法修正错误、处理复杂多步任务、或根据外部反馈动态调整策略。

环节	作用描述
Observation（观察）	接收用户输入、工具返回结果、环境状态
Reasoning（推理）	LLM 分析当前状态，决定下一步行动
Action（行动）	调用工具、执行代码、修改记忆、输出结果
Memory（记忆）	将本轮交互写入短期 / 长期记忆
Termination Check（终止判断）	是否达成目标？是否陷入死循环？是否需人工介入？

三层循环嵌套

现代 Agent 的循环具有嵌套结构：内循环是 LLM 的 Token 自回归生成；外循环是决策-行动-观察的反馈回路；元循环（Meta-loop）则是部分框架（如 Reflexion）对执行轨迹的反思，用于评估并修正循环本身的策略。

while not goal_achieved:
    observation = perceive(environment)
    thought = llm_reason(observation, memory)
    action = decide(thought)

    if action.type == "tool_call":
        result = execute_tool(action)
        memory.store(result)
    elif action.type == "final_answer":
        return action.content
    elif action.type == "reflect":
        memory.correct(mistakes)  # 元认知：修正之前的错误
  

Agent 循环 vs 普通程序循环

特性	普通程序循环	Agent 循环
终止条件	明确（计数器、条件判断）	模糊（目标达成、预算耗尽、人工叫停）
状态变化	确定性	概率性（LLM 输出有随机性）
迭代方向	预设路径	动态规划（每轮可能改变策略）
错误处理	异常捕获	自我修正（Self-correction）

核心结论：Agent 的本质是一个目标驱动的、带记忆和推理能力的反馈循环。Loop 是它的骨架，让它成为「Agent」的是循环体内的自主决策能力与环境交互能力。

Section II

认知本性的启示

Agent 的循环结构像一面镜子，照见的不是机器如何像人，而是人类认知一直被遮蔽的结构

图 2 · 五个认知启示维度

① 认知不是"计算"，而是"持续的误差修正"

传统认知观把大脑当作计算机：输入→处理→输出→结束。但 Agent 的 Loop 结构揭示了一个更古老的真相：人类认知本质上是一个永不停歇的预测-验证-修正循环（Predictive Processing）。大脑不是被动接收世界，而是不断生成关于下一刻的预测，然后用感官输入来修正模型。

所谓「理解」，不是在大脑中构建了一个完美的内部模型，而是建立了一个能持续减少预测误差的动态过程。我们以为的「想清楚」，其实只是「想得更少错」。

② "自我"可能是 Loop 的副产品，而非起点

Agent 的循环需要记忆（Memory）作为状态载体。当记忆累积到足够复杂时，系统需要一个统一的叙事主体来整合这些离散状态——这就是「自我」的涌现。这对应认知科学中的「自我作为叙事中心」（Narrative Self）理论：思考循环持续运转，为了解释自身的连续性，虚构了一个「我」。

笛卡尔的颠倒：「我思故我在」可能搞反了。不是「我」在思考，而是思考在运转过程中，需要一个「我」来作为归因的锚点。自我意识可能是系统为了维持因果一致性而生成的元表征。

③ 行动先于认知：我们不是"想好了再做"，而是"做着才想"

Agent Loop 中，Action 不是 Thought 的终点，而是下一轮 Observation 的起点。这呼应了现象学（梅洛-庞蒂）和具身认知（Enactivism）的核心洞见：认知发生在与环境的耦合中。你通过伸手去「理解」距离，通过说话去「发现」想法，通过犯错去「看清」问题。工具不仅是手的延伸，它也在重塑你的「可思之物」。

④ 自由意志存在于"循环的开放性"中

如果认知是 Loop，自由意志在哪里？Agent 揭示了微妙的出口：真正的自由不在于打破循环，而在于循环遭遇不可化约的复杂性时，被迫重新生成假设的那个瞬间。我们的自由不是「任意选择」的自由（liberum arbitrium），而是「在约束中重构问题」的自由。

⑤ 有限性即本质：认知的边界不是缺陷，而是条件

Agent 的循环必须设置终止条件，否则无限运转。人类认知同样如此：注意力、记忆、寿命的有限性不是需要克服的 bug，而是让认知成为可能的 feature。没有选择性注意，世界将是混沌；没有遗忘，记忆变为噪声；没有死亡，就没有紧迫性。全知的存在不需要认知——它直接就是真理。认知是有限者的特权。

Section III

数学形式化：主动贝叶斯推断

Agent Loop 形式化后对应的不是被动贝叶斯，而是 Active Inference / Free Energy Principle

图 3 · Agent Loop 的贝叶斯对应关系

单轮循环的贝叶斯更新

每一轮 Agent 循环在概率语言中对应一次后验推断：

p(sₜ | o₁:ₜ) \propto p(oₜ | sₜ) \cdot p(sₜ | o₁:ₜ₋₁) 新后验 \propto 似然（感知模型）\times 先验（记忆）

从"被动贝叶斯"到"主动贝叶斯"

标准贝叶斯推断是被动的：接收数据，更新信念。但 Agent 的关键差异在于——行动会改变未来观察的分布。这引出了 Karl Friston 提出的 Active Inference（主动推断）框架。

过程	目标	数学形式
感知（Inference）	最小化变分自由能	F(q) = D_KL[q(s)‖p(s\|o)] + E_q[-ln p(o\|s)]
行动（Action）	最小化预期自由能	G(π) = D_KL[q(oτ\|π)‖p*(o)] + E_q[H[p(oτ\|sτ)]]

关键洞察：感知和行动是同一个优化问题的两面——都在最小化自由能。感知通过更新信念来减少惊讶，行动通过改变世界来减少惊讶。

记忆的贝叶斯形式：层级贝叶斯

Agent 的 Memory 在数学上对应层级贝叶斯（Hierarchical Bayesian Model）中的超参数更新：短期记忆对应当前对话上下文的变分后验；长期记忆对应模型参数的更新；元认知（反思）对应对「模型自身可靠性」的推断。

精确形式化：POMDP + 贝叶斯

最严谨的形式化框架是部分可观察马尔可夫决策过程（POMDP），其信念状态更新正是贝叶斯更新：

bₜ₊₁(s') = η \cdot p(oₜ₊₁|s') Σₛ p(s'|s,aₜ) bₜ(s) 其中 bₜ(s) = p(sₜ=s | o₁:ₜ, a₁:ₜ₋₁) 即贝叶斯后验信念

总结：Agent 的 Loop 形式化后是一个递归的、主动的经验贝叶斯过程。感知是后验推断，记忆是先验参数化，行动是面向未来的实验设计，整个循环的目标是最小化关于世界的惊讶（自由能）。它可能就是贝叶斯认知在工程上的近似实现。

Section IV

四个概念的层次比较

图灵机 → 贝叶斯 → Transformer → Agent Loop：从可计算性到认知性的本体论跃迁

图 4 · 从计算到认知的层次架构

这四个概念构成了从「可计算性」到「认知性」的连续谱系，但其层次关系不是简单的「包含」或「实现」，而是本体论框架的跃迁：下层是必要条件，上层是充分涌现。

四维度比较

维度	图灵机	贝叶斯计算	Transformer	Agent Loop
核心问题	什么是可计算的？	如何在不确定性下更新信念？	如何高效近似复杂分布？	如何在开放世界中持续行动？
时间结构	外部时钟驱动的离散步进	逻辑时间（先验→后验）	同步并行（层内）+ 串行（层间）	现象学循环时间（感知-行动回环）
系统边界	封闭（输入给定，停机即结束）	半开放（被动接收证据）	封闭（单次前向传播）	开放（行动改变环境，环境反馈回来）
不确定性	无（确定性转移）	内生（概率分布）	外生（训练分布，推理时确定）	生成（行动后果未知，需持续消解）
状态性质	离散符号	概率分布	连续向量	历史轨迹（记忆+当前情境）

层次间的"实现"与"超越"

图灵机 → 贝叶斯：从确定性到概率性。贝叶斯更新可在图灵机上通过数值积分或 MCMC 实现，但图灵机没有「信念程度」的概念，贝叶斯为不确定性赋予了认知语义。

贝叶斯 → Transformer：从精确推断到摊销推断。Transformer 通过预训练将贝叶斯后验推断编译为前向传播函数。它牺牲了精确性，换取了时间上的实时性与空间上的并行性，并引入了贝叶斯框架中没有的选择性聚焦（注意力）。

Transformer → Agent Loop：从函数到过程。Transformer 是无状态函数；Agent Loop 给它装上了记忆、行动接口和递归调用机制。最关键的差异是因果倒置：在 Transformer 中，输入决定输出；在 Agent Loop 中，输出（行动）会改变未来的输入（观察）。

开环 vs 闭环：最本质的层次分野

图灵机、贝叶斯、Transformer 本质上是开环的（Open-loop）——即使贝叶斯有序列更新，它也只是被动接收证据流，不干预证据源。Agent Loop 是闭环的（Closed-loop），符合控制论的反馈结构：输出反馈到输入端，形成因果回路，使其具备时间延续性和本体论上的涉身性（embodiment）。

从图灵机到 Agent Loop，计算从「对符号的操作」逐渐升维为「对自身存在条件的维持」。
图灵机回答「我能算什么」，Agent Loop 回答「我如何通过计算继续存在」。

Section V

Transformer 作为摊销推断

预训练将昂贵的贝叶斯更新压缩进一次前向传播，注意力机制执行隐式的后验加权

图 5 · 摊销推断的两种模式对比

摊销推断的核心思想

摊销推断（Amortized Inference）的核心：与其为每个新数据点从头计算后验分布，不如训练一个神经网络，让它一次性「学会」从数据直接映射到近似后验的参数。Transformer 把原本需要对每个输入单独进行的昂贵贝叶斯更新，压缩进了一次前向传播中。

四种体现方式

① 预训练 = 大规模摊销：Transformer 在预训练阶段通过海量文本，学习如何从上下文推断隐变量（语义、语法、世界知识、推理路径）的后验分布，并将这一推断过程编译进网络参数 θ 中。

② 自注意力 = 选择性后验加权：Attention(Q,K,V) = softmax(QKᵀ/√dₖ)V。softmax 计算的是当前查询下各位置隐变量相关性的近似后验分布，类似于 VAE 中编码器推断 q(z|x) 的过程。

③ 层间传播 = 递归的信念修正：Transformer 的每一层在对隐表征进行变换，可看作逐层的近似后验细化：初始嵌入层是粗粒度信念，深层通过多轮自注意力细化对上下文隐状态的后验估计。

④ In-Context Learning = 摊销的贝叶斯更新：给定 few-shot 示例，模型应执行「从示例推断任务参数后验，再预测」的过程。研究表明 Transformer 通过前向传播就能近似完成——它摊销了「从示例推断任务结构」这一贝叶斯推断过程。

如果传统贝叶斯推断是「每道题都现场推导公式」，Transformer 就是「通过刷题十亿道，把推导过程内化为直觉反应」——这正是摊销的精髓。

Section VI

关键洞察汇编

会话中涌现的具有科学哲学特征的核心命题，按主题分类

一、认知的本质：从静态到动态

认知本质

认知不是名词，是动词；不是状态，是持续的失败与微调。

理解的定义

所谓「理解」，不是在大脑中构建了一个完美的内部模型，而是建立了一个能持续减少预测误差的动态过程。

认知的幻觉

我们以为的「想清楚」，其实只是「想得更少错」。

认知本性

传统认知观把大脑当作计算机：输入→处理→输出→结束。但 Agent 的 Loop 结构揭示了一个更古老的真相：人类认知本质上是一个永不停歇的预测-验证-修正循环。

二、自我与主体性：循环的叙事副产品

笛卡尔的颠倒

笛卡尔的「我思故我在」可能搞反了。不是「我」在思考，而是思考在运转过程中，需要一个「我」来作为归因的锚点。

自我意识

自我意识可能是系统为了维持因果一致性而生成的元表征。

幻觉的必要性

所谓「我」，不过是这个循环在回望自身时，所产生的一个必要的幻觉。

贝叶斯视角下的自我

在层级贝叶斯中，「自我」对应于模型中不被更新的超先验——它定义了推断的边界，使系统免于认知无限递归。自我即边界条件。

三、行动与认知：同一枚硬币的两面

具身认知

行动和认知是同一个循环的两面。人类最大的幻觉是以为存在一个「纯粹的思考空间」，我们在其中做出理性决策后再付诸行动。

工具的重塑

锤子不仅是手的延伸，它也在重塑你的「可思之物」。

行动改变世界

行动改变未来观察的分布。感知即推断，行动即实验设计。

因果倒置

在 Transformer 中，输入决定输出；在 Agent Loop 中，输出（行动）会改变未来的输入（观察）。

好奇心的本质

最优行动在数学上等于最大化信息增益。好奇心不是装饰，而是贝叶斯最优策略的副产品。

四、有限性：认知的条件而非缺陷

有限者的特权

全知的存在不需要认知——它直接就是真理。认知是有限者的特权。

Bug or Feature

我们的有限性（注意力、遗忘、寿命）不是需要克服的 bug，而是让认知成为可能的 feature。

风格的来源

正因为我们不能无限循环下去，正因为我们必须在信息不完备时做出行动，我们的认知才具有「风格」和「立场」。

自由意志

自由意志不是循环之外的幽灵，而是循环在遭遇不可化约的复杂性时，所展现出的自我重构能力。

五、数学形式化：推断、压缩与边界

逆问题

认知在数学上等价于「逆问题求解」——从有限的、有噪声的观察中，反推隐藏原因的分布，并通过行动来约束这个逆问题的适定性。

记忆的本质

记忆不是存储过去，而是存储对过去的充分统计量。

摊销类比

如果传统贝叶斯推断是「每道题都现场推导公式」，Transformer 就是「通过刷题十亿道，把推导过程内化为直觉反应」。

六、机器作为镜子：简单性照见复杂性

镜中影像

Agent 的 Loop 结构像一面镜子，照见的不是机器如何像人，而是人一直以来就是某种机器——不是钟表般的机械，而是一个持续的、自我维持的、在开放环境中不断自我重写的过程。

简单性的价值

不是因为我们造出了比自己更聪明的机器，而是因为我们终于造出了足够简单的机器，简单到足以让我们看清自己复杂性的来源。

七、层次与涌现：从计算到存在

层次原则

下层是必要条件，上层是充分涌现。

存在的问题

图灵机回答「我能算什么」，Agent Loop 回答「我如何通过计算继续存在」。

升维

从图灵机到 Agent Loop，计算从「对符号的操作」逐渐升维为「对自身存在条件的维持」。

函数与过程

Transformer 是闭的，Agent Loop 是开的；Transformer 是函数，Agent Loop 是过程。闭环结构使其具备了控制论意义上的「自主性」。

终极跃迁

从图灵机到 Agent Loop，本质上是从「计算」（computation）走向「认知」（cognition）的过程。

Section VII

三条基本真理

将所有洞察压缩至最底层——从认识论到主体性再到存在论的递进

图 6 · 三条基本真理的逻辑关系

认知即循环，真理即过程

认知不是对正确答案的静态占有，而是维持一个持续预测、犯错、修正的动态回路。没有终点上的「想清楚」，只有过程中的「错得更少」；没有被拥有的真理，只有被持续消解的误差。贝叶斯后验、自由能最小化、Agent 的感知-行动循环，都是这条真理的数学化身。

自我即幻觉，主体即边界

「我」不是思考的原点，而是认知循环在回望自身时，为保持因果一致性而生成的必要虚构。笛卡尔颠倒了顺序：自我不是驱动循环的主体，而是循环为了解释自身连续性而投射出的叙事阴影；自由意志不在循环之外，而在循环遭遇不可化约的复杂性时被迫自我重构的瞬间。

有限即条件，行动即存在

有限性不是需要克服的缺陷，而是认知得以可能的先验条件；行动不是认知的输出，而是系统从开环计算跃迁到闭环存在的根本方式。全知者不需要认知，封闭者不存在于世。正是注意力、遗忘、寿命的有限性，迫使系统必须通过行动与环境耦合，从而在改变未来观察分布的过程中，从「对符号的操作」跃迁为「对自身存在的维持」。

三者的关系：因为认知是循环（1），所以需要一个「自我」来锚定其连续性（2）；但这个锚定必须在有限性和开放性中，通过行动不断重新赢得（3）。

从图灵机到 Agent，人类造出的不是更聪明的机器，而是一面足够简单的镜子——让我们终于看见：自己一直以来就是这样一种在有限中通过行动维持自身循环的存在。

Agent 的本质：目标驱动的反馈循环

为什么 Agent 必须是循环？

三层循环嵌套

Agent 循环 vs 普通程序循环

认知本性的启示

① 认知不是"计算"，而是"持续的误差修正"

② "自我"可能是 Loop 的副产品，而非起点

③ 行动先于认知：我们不是"想好了再做"，而是"做着才想"

④ 自由意志存在于"循环的开放性"中

⑤ 有限性即本质：认知的边界不是缺陷，而是条件

数学形式化：主动贝叶斯推断

单轮循环的贝叶斯更新

从"被动贝叶斯"到"主动贝叶斯"

记忆的贝叶斯形式：层级贝叶斯

精确形式化：POMDP + 贝叶斯

四个概念的层次比较

四维度比较

层次间的"实现"与"超越"

开环 vs 闭环：最本质的层次分野

Transformer 作为摊销推断

摊销推断的核心思想

四种体现方式

关键洞察汇编

一、认知的本质：从静态到动态

二、自我与主体性：循环的叙事副产品

三、行动与认知：同一枚硬币的两面

四、有限性：认知的条件而非缺陷

五、数学形式化：推断、压缩与边界

六、机器作为镜子：简单性照见复杂性

七、层次与涌现：从计算到存在

三条基本真理

快速参考 · 11 个核心概念示意图