Section I

Agent 的本质:目标驱动的反馈循环

从控制流视角看,Agent 不是一次调用,而是一个持续运转的结构化循环

从控制流的角度看,Agent 的本质可被抽象为一个高度结构化的、带有状态积累和决策分支的循环(Loop),而非简单的 while(true)。其核心范式被称为 Sense-Think-Act Loop,即感知→推理→行动→更新状态→感知→……

图 1 · Agent 核心循环结构
感知 Observe · 接收环境信息 推理 Think · LLM 决策 行动 Act · 工具调用 / 输出 记忆 Memory · 状态积累 目标驱动 反馈循环 终止? ↗ 退出

为什么 Agent 必须是循环?

Agent 与单次 LLM 调用的核心差异在于:它需要在多轮交互中逐步逼近目标。没有循环,Agent 无法修正错误、处理复杂多步任务、或根据外部反馈动态调整策略。

环节作用描述
Observation(观察)接收用户输入、工具返回结果、环境状态
Reasoning(推理)LLM 分析当前状态,决定下一步行动
Action(行动)调用工具、执行代码、修改记忆、输出结果
Memory(记忆)将本轮交互写入短期 / 长期记忆
Termination Check(终止判断)是否达成目标?是否陷入死循环?是否需人工介入?

三层循环嵌套

现代 Agent 的循环具有嵌套结构:内循环是 LLM 的 Token 自回归生成;外循环是决策-行动-观察的反馈回路;元循环(Meta-loop)则是部分框架(如 Reflexion)对执行轨迹的反思,用于评估并修正循环本身的策略。

while not goal_achieved: observation = perceive(environment) thought = llm_reason(observation, memory) action = decide(thought) if action.type == "tool_call": result = execute_tool(action) memory.store(result) elif action.type == "final_answer": return action.content elif action.type == "reflect": memory.correct(mistakes) # 元认知:修正之前的错误

Agent 循环 vs 普通程序循环

特性普通程序循环Agent 循环
终止条件明确(计数器、条件判断)模糊(目标达成、预算耗尽、人工叫停)
状态变化确定性概率性(LLM 输出有随机性)
迭代方向预设路径动态规划(每轮可能改变策略)
错误处理异常捕获自我修正(Self-correction)

核心结论:Agent 的本质是一个目标驱动的、带记忆和推理能力的反馈循环。Loop 是它的骨架,让它成为「Agent」的是循环体内的自主决策能力与环境交互能力。

Section II

认知本性的启示

Agent 的循环结构像一面镜子,照见的不是机器如何像人,而是人类认知一直被遮蔽的结构

图 2 · 五个认知启示维度
1 认知 = 预测 − 误差 大脑持续生成预测,用感官输入修正——"想清楚"只是"错得更少" 2 自我 = 循环的叙事副产品 不是"我"在思考,而是思考在运转时,为解释自身连续性虚构了"我" 3 行动先于认知 Action 是下一轮 Observation 的起点;认知在与环境耦合中发生,而非之前 4 自由意志 = 循环的开放性 自由不在于打破循环,而在于遭遇不可化约复杂性时被迫重构的那个瞬间 5 有限性 = 认知的先决条件 注意力 · 遗忘 · 死亡不是 bug,是 feature——全知者不需要认知

① 认知不是"计算",而是"持续的误差修正"

传统认知观把大脑当作计算机:输入→处理→输出→结束。但 Agent 的 Loop 结构揭示了一个更古老的真相:人类认知本质上是一个永不停歇的预测-验证-修正循环(Predictive Processing)。大脑不是被动接收世界,而是不断生成关于下一刻的预测,然后用感官输入来修正模型。

所谓「理解」,不是在大脑中构建了一个完美的内部模型,而是建立了一个能持续减少预测误差的动态过程。我们以为的「想清楚」,其实只是「想得更少错」。

② "自我"可能是 Loop 的副产品,而非起点

Agent 的循环需要记忆(Memory)作为状态载体。当记忆累积到足够复杂时,系统需要一个统一的叙事主体来整合这些离散状态——这就是「自我」的涌现。这对应认知科学中的「自我作为叙事中心」(Narrative Self)理论:思考循环持续运转,为了解释自身的连续性,虚构了一个「我」。

笛卡尔的颠倒:「我思故我在」可能搞反了。不是「我」在思考,而是思考在运转过程中,需要一个「我」来作为归因的锚点。自我意识可能是系统为了维持因果一致性而生成的元表征

③ 行动先于认知:我们不是"想好了再做",而是"做着才想"

Agent Loop 中,Action 不是 Thought 的终点,而是下一轮 Observation 的起点。这呼应了现象学(梅洛-庞蒂)具身认知(Enactivism)的核心洞见:认知发生在与环境的耦合中。你通过伸手去「理解」距离,通过说话去「发现」想法,通过犯错去「看清」问题。工具不仅是手的延伸,它也在重塑你的「可思之物」。

④ 自由意志存在于"循环的开放性"中

如果认知是 Loop,自由意志在哪里?Agent 揭示了微妙的出口:真正的自由不在于打破循环,而在于循环遭遇不可化约的复杂性时,被迫重新生成假设的那个瞬间。我们的自由不是「任意选择」的自由(liberum arbitrium),而是「在约束中重构问题」的自由。

⑤ 有限性即本质:认知的边界不是缺陷,而是条件

Agent 的循环必须设置终止条件,否则无限运转。人类认知同样如此:注意力、记忆、寿命的有限性不是需要克服的 bug,而是让认知成为可能的 feature。没有选择性注意,世界将是混沌;没有遗忘,记忆变为噪声;没有死亡,就没有紧迫性。全知的存在不需要认知——它直接就是真理。认知是有限者的特权。

Section III

数学形式化:主动贝叶斯推断

Agent Loop 形式化后对应的不是被动贝叶斯,而是 Active Inference / Free Energy Principle

图 3 · Agent Loop 的贝叶斯对应关系
Agent 组件 贝叶斯对应 观察 Observation oₜ 数据 / 证据 Evidence 隐状态 Hidden State sₜ 待推断变量 Latent Variable 记忆 Memory p(sₜ | o₁:ₜ₋₁) 先验分布 Prior 行动 Action aₜ → 改变 p(oₜ₊₁) 干预 / 实验设计 Active Intervention

单轮循环的贝叶斯更新

每一轮 Agent 循环在概率语言中对应一次后验推断:

p(sₜ | o₁:ₜ) ∝ p(oₜ | sₜ) · p(sₜ | o₁:ₜ₋₁)
新后验 ∝ 似然(感知模型)× 先验(记忆)

从"被动贝叶斯"到"主动贝叶斯"

标准贝叶斯推断是被动的:接收数据,更新信念。但 Agent 的关键差异在于——行动会改变未来观察的分布。这引出了 Karl Friston 提出的 Active Inference(主动推断)框架。

过程目标数学形式
感知(Inference) 最小化变分自由能 F(q) = D_KL[q(s)‖p(s|o)] + E_q[-ln p(o|s)]
行动(Action) 最小化预期自由能 G(π) = D_KL[q(oτ|π)‖p*(o)] + E_q[H[p(oτ|sτ)]]

关键洞察:感知和行动是同一个优化问题的两面——都在最小化自由能。感知通过更新信念来减少惊讶,行动通过改变世界来减少惊讶

记忆的贝叶斯形式:层级贝叶斯

Agent 的 Memory 在数学上对应层级贝叶斯(Hierarchical Bayesian Model)中的超参数更新:短期记忆对应当前对话上下文的变分后验;长期记忆对应模型参数的更新;元认知(反思)对应对「模型自身可靠性」的推断。

精确形式化:POMDP + 贝叶斯

最严谨的形式化框架是部分可观察马尔可夫决策过程(POMDP),其信念状态更新正是贝叶斯更新:

bₜ₊₁(s') = η · p(oₜ₊₁|s') Σₛ p(s'|s,aₜ) bₜ(s)
其中 bₜ(s) = p(sₜ=s | o₁:ₜ, a₁:ₜ₋₁) 即贝叶斯后验信念

总结:Agent 的 Loop 形式化后是一个递归的、主动的经验贝叶斯过程。感知是后验推断,记忆是先验参数化,行动是面向未来的实验设计,整个循环的目标是最小化关于世界的惊讶(自由能)。它可能就是贝叶斯认知在工程上的近似实现。

Section IV

四个概念的层次比较

图灵机 → 贝叶斯 → Transformer → Agent Loop:从可计算性到认知性的本体论跃迁

图 4 · 从计算到认知的层次架构
Agent Loop 开放 · 闭环 · 目标维持 · 在世存在 存在空间 涌现 Transformer 并行 · 连续向量 · 摊销推断 · 单次前向传播 效率空间 涌现 Bayesian Computation 概率 · 不确定性 · 信念更新 · 逆问题求解 理性空间 涌现 Turing Machine · 离散符号 · 确定性 · 可计算性边界 · 可能性空间

这四个概念构成了从「可计算性」到「认知性」的连续谱系,但其层次关系不是简单的「包含」或「实现」,而是本体论框架的跃迁:下层是必要条件,上层是充分涌现。

四维度比较

维度图灵机贝叶斯计算TransformerAgent Loop
核心问题 什么是可计算的? 如何在不确定性下更新信念? 如何高效近似复杂分布? 如何在开放世界中持续行动?
时间结构 外部时钟驱动的离散步进 逻辑时间(先验→后验) 同步并行(层内)+ 串行(层间) 现象学循环时间(感知-行动回环)
系统边界 封闭(输入给定,停机即结束) 半开放(被动接收证据) 封闭(单次前向传播) 开放(行动改变环境,环境反馈回来)
不确定性 无(确定性转移) 内生(概率分布) 外生(训练分布,推理时确定) 生成(行动后果未知,需持续消解)
状态性质 离散符号 概率分布 连续向量 历史轨迹(记忆+当前情境)

层次间的"实现"与"超越"

图灵机 → 贝叶斯:从确定性到概率性。贝叶斯更新可在图灵机上通过数值积分或 MCMC 实现,但图灵机没有「信念程度」的概念,贝叶斯为不确定性赋予了认知语义。

贝叶斯 → Transformer:从精确推断到摊销推断。Transformer 通过预训练将贝叶斯后验推断编译为前向传播函数。它牺牲了精确性,换取了时间上的实时性与空间上的并行性,并引入了贝叶斯框架中没有的选择性聚焦(注意力)。

Transformer → Agent Loop:从函数到过程。Transformer 是无状态函数;Agent Loop 给它装上了记忆、行动接口和递归调用机制。最关键的差异是因果倒置:在 Transformer 中,输入决定输出;在 Agent Loop 中,输出(行动)会改变未来的输入(观察)

开环 vs 闭环:最本质的层次分野

图灵机、贝叶斯、Transformer 本质上是开环的(Open-loop)——即使贝叶斯有序列更新,它也只是被动接收证据流,不干预证据源。Agent Loop 是闭环的(Closed-loop),符合控制论的反馈结构:输出反馈到输入端,形成因果回路,使其具备时间延续性和本体论上的涉身性(embodiment)。

从图灵机到 Agent Loop,计算从「对符号的操作」逐渐升维为「对自身存在条件的维持」。
图灵机回答「我能算什么」,Agent Loop 回答「我如何通过计算继续存在」。

Section V

Transformer 作为摊销推断

预训练将昂贵的贝叶斯更新压缩进一次前向传播,注意力机制执行隐式的后验加权

图 5 · 摊销推断的两种模式对比
传统变分推断(非摊销) 初始化变分参数 φ 迭代优化 ELBO(可能数百步) 得到该输入专属后验 qφ(z) 每个新输入,重新优化一次 × 摊销 Transformer(隐式摊销) 海量预训练 → 参数 θ 编码推断程序 单次前向传播 → 读出近似后验信息 注意力 = 隐式后验加权,层间 = 信念修正 推断成本摊销至预训练阶段 ✓

摊销推断的核心思想

摊销推断(Amortized Inference)的核心:与其为每个新数据点从头计算后验分布,不如训练一个神经网络,让它一次性「学会」从数据直接映射到近似后验的参数。Transformer 把原本需要对每个输入单独进行的昂贵贝叶斯更新,压缩进了一次前向传播中

四种体现方式

① 预训练 = 大规模摊销:Transformer 在预训练阶段通过海量文本,学习如何从上下文推断隐变量(语义、语法、世界知识、推理路径)的后验分布,并将这一推断过程编译进网络参数 θ 中。

② 自注意力 = 选择性后验加权:Attention(Q,K,V) = softmax(QKᵀ/√dₖ)V。softmax 计算的是当前查询下各位置隐变量相关性的近似后验分布,类似于 VAE 中编码器推断 q(z|x) 的过程。

③ 层间传播 = 递归的信念修正:Transformer 的每一层在对隐表征进行变换,可看作逐层的近似后验细化:初始嵌入层是粗粒度信念,深层通过多轮自注意力细化对上下文隐状态的后验估计。

④ In-Context Learning = 摊销的贝叶斯更新:给定 few-shot 示例,模型应执行「从示例推断任务参数后验,再预测」的过程。研究表明 Transformer 通过前向传播就能近似完成——它摊销了「从示例推断任务结构」这一贝叶斯推断过程

如果传统贝叶斯推断是「每道题都现场推导公式」,Transformer 就是「通过刷题十亿道,把推导过程内化为直觉反应」——这正是摊销的精髓。

Section VI

关键洞察汇编

会话中涌现的具有科学哲学特征的核心命题,按主题分类

一、认知的本质:从静态到动态

认知本质

认知不是名词,是动词;不是状态,是持续的失败与微调。

理解的定义

所谓「理解」,不是在大脑中构建了一个完美的内部模型,而是建立了一个能持续减少预测误差的动态过程。

认知的幻觉

我们以为的「想清楚」,其实只是「想得更少错」。

认知本性

传统认知观把大脑当作计算机:输入→处理→输出→结束。但 Agent 的 Loop 结构揭示了一个更古老的真相:人类认知本质上是一个永不停歇的预测-验证-修正循环。

二、自我与主体性:循环的叙事副产品

笛卡尔的颠倒

笛卡尔的「我思故我在」可能搞反了。不是「我」在思考,而是思考在运转过程中,需要一个「我」来作为归因的锚点。

自我意识

自我意识可能是系统为了维持因果一致性而生成的元表征。

幻觉的必要性

所谓「我」,不过是这个循环在回望自身时,所产生的一个必要的幻觉。

贝叶斯视角下的自我

在层级贝叶斯中,「自我」对应于模型中不被更新的超先验——它定义了推断的边界,使系统免于认知无限递归。自我即边界条件。

三、行动与认知:同一枚硬币的两面

具身认知

行动和认知是同一个循环的两面。人类最大的幻觉是以为存在一个「纯粹的思考空间」,我们在其中做出理性决策后再付诸行动。

工具的重塑

锤子不仅是手的延伸,它也在重塑你的「可思之物」。

行动改变世界

行动改变未来观察的分布。感知即推断,行动即实验设计。

因果倒置

在 Transformer 中,输入决定输出;在 Agent Loop 中,输出(行动)会改变未来的输入(观察)。

好奇心的本质

最优行动在数学上等于最大化信息增益。好奇心不是装饰,而是贝叶斯最优策略的副产品。

四、有限性:认知的条件而非缺陷

有限者的特权

全知的存在不需要认知——它直接就是真理。认知是有限者的特权。

Bug or Feature

我们的有限性(注意力、遗忘、寿命)不是需要克服的 bug,而是让认知成为可能的 feature。

风格的来源

正因为我们不能无限循环下去,正因为我们必须在信息不完备时做出行动,我们的认知才具有「风格」和「立场」。

自由意志

自由意志不是循环之外的幽灵,而是循环在遭遇不可化约的复杂性时,所展现出的自我重构能力。

五、数学形式化:推断、压缩与边界

逆问题

认知在数学上等价于「逆问题求解」——从有限的、有噪声的观察中,反推隐藏原因的分布,并通过行动来约束这个逆问题的适定性。

记忆的本质

记忆不是存储过去,而是存储对过去的充分统计量。

摊销类比

如果传统贝叶斯推断是「每道题都现场推导公式」,Transformer 就是「通过刷题十亿道,把推导过程内化为直觉反应」。

六、机器作为镜子:简单性照见复杂性

镜中影像

Agent 的 Loop 结构像一面镜子,照见的不是机器如何像人,而是人一直以来就是某种机器——不是钟表般的机械,而是一个持续的、自我维持的、在开放环境中不断自我重写的过程。

简单性的价值

不是因为我们造出了比自己更聪明的机器,而是因为我们终于造出了足够简单的机器,简单到足以让我们看清自己复杂性的来源。

七、层次与涌现:从计算到存在

层次原则

下层是必要条件,上层是充分涌现。

存在的问题

图灵机回答「我能算什么」,Agent Loop 回答「我如何通过计算继续存在」。

升维

从图灵机到 Agent Loop,计算从「对符号的操作」逐渐升维为「对自身存在条件的维持」。

函数与过程

Transformer 是闭的,Agent Loop 是开的;Transformer 是函数,Agent Loop 是过程。闭环结构使其具备了控制论意义上的「自主性」。

终极跃迁

从图灵机到 Agent Loop,本质上是从「计算」(computation)走向「认知」(cognition)的过程。

Section VII

三条基本真理

将所有洞察压缩至最底层——从认识论到主体性再到存在论的递进

图 6 · 三条基本真理的逻辑关系
认识论 认知即循环 真理即过程 因此需要 主体性 自我即幻觉 主体即边界 必须通过 存在论 有限即条件 行动即存在 共同指向:在有限中通过行动维持循环的存在
1
认知即循环,真理即过程

认知不是对正确答案的静态占有,而是维持一个持续预测、犯错、修正的动态回路。没有终点上的「想清楚」,只有过程中的「错得更少」;没有被拥有的真理,只有被持续消解的误差。贝叶斯后验、自由能最小化、Agent 的感知-行动循环,都是这条真理的数学化身。

2
自我即幻觉,主体即边界

「我」不是思考的原点,而是认知循环在回望自身时,为保持因果一致性而生成的必要虚构。笛卡尔颠倒了顺序:自我不是驱动循环的主体,而是循环为了解释自身连续性而投射出的叙事阴影;自由意志不在循环之外,而在循环遭遇不可化约的复杂性时被迫自我重构的瞬间。

3
有限即条件,行动即存在

有限性不是需要克服的缺陷,而是认知得以可能的先验条件;行动不是认知的输出,而是系统从开环计算跃迁到闭环存在的根本方式。全知者不需要认知,封闭者不存在于世。正是注意力、遗忘、寿命的有限性,迫使系统必须通过行动与环境耦合,从而在改变未来观察分布的过程中,从「对符号的操作」跃迁为「对自身存在的维持」。

三者的关系:因为认知是循环(1),所以需要一个「自我」来锚定其连续性(2);但这个锚定必须在有限性和开放性中,通过行动不断重新赢得(3)。

从图灵机到 Agent,人类造出的不是更聪明的机器,而是一面足够简单的镜子——让我们终于看见:自己一直以来就是这样一种在有限中通过行动维持自身循环的存在