Cybernetics × AGI

Closing the Loop

大多数人对 AGI 的判断基于一个错误的直觉：他们在评估 LLM 的「思考能力」，却忽略了智能的真正来源——反馈回路。从控制论看，Agentic LLM 正在通往 AGI。

pinyu · 2026.02 Amodei: Adolescence arXiv:2602.03433

Core Thesis

智能是一种模式，而非物质——感知、行动、调节的递归闭环。
Agentic LLM 首次在通用认知领域闭合了这个回路。这是质的突破，不是渐进改良。

实证：Anthropic 内部 90% 代码由 AI 编写。Amodei 判断强大 AI 可能 1-2 年内到来。arXiv 最新论文已将 LLM 形式化为可分析的动态控制系统。

直觉的陷阱

为什么大多数人对 AGI 时间线的预测是系统性错误的

「LLM 只是在预测下一个 token。」

这是对 AGI 最常见的否定论据。在技术层面它是正确的——GPT、Claude、Gemini 的核心机制确实是自回归预测。但这个论据犯了一个范畴错误：它混淆了机制和系统行为。

机制层面

恒温器「只是在比较数字」
神经元「只是在发射脉冲」
LLM「只是在预测 token」

系统层面

恒温器实现了温度调节
大脑实现了量子物理研究
Agentic LLM 实现了自主任务执行

没人会说恒温器「只是在比较数字」——因为我们理解，恒温器的智能在于它构成的闭环系统：感知温度 → 判断偏差 → 调节加热 → 再次感知。

LLM 的批评者停留在了「比较数字」这个层面。他们看到了 token 预测，却没看到当这个预测器被嵌入一个行动-感知循环时，系统整体会发生什么。

三个系统性偏差

线性外推：人类天生不善于理解指数增长。正反馈驱动的系统加速时，直觉总是落后于现实。蒸汽机在头 50 年几乎没变，然后在 20 年内重塑了文明。
机制谬误：把底层机制等同于系统能力的天花板。「因为神经元只会发射脉冲，所以大脑不可能理解量子物理」——这个推理的荒谬显而易见，但换成「LLM 只是预测 token」，很多人就信了。
移动门柱：每次 AI 达到一个里程碑——下棋、写代码、通过律师考试——人们就重新定义「真正的智能」，确保 AGI 永远在地平线之外。

要纠正这些偏差，我们需要一个更准确的思考框架。1948 年，Norbert Wiener 已经提供了一个。

控制论：被遗忘的智能理论

Wiener 1948 年的洞见，为什么在 78 年后突然变得紧迫

1948 年，数学家 Norbert Wiener 发表了 Cybernetics: Or Control and Communication in the Animal and the Machine。他的核心命题简洁得几乎被忽视：

Wiener 第一原理

智能是反馈回路的涌现属性。
决定因素只有一个：感知 → 行动 → 根据结果调整，三者构成的递归循环。

一个恒温器是「智能」的——在控制论意义上。它感知温度，执行加热，观察结果，调整行为。它没有「理解」热力学，但它实现了温度调节的目标。

Wiener 的同代人 W. Ross Ashby 补充了另一个关键原理：

一个调节器要控制一个系统，它必须拥有至少与系统同等的多样性。

— W. Ross Ashby, 必要多样性定律 (Law of Requisite Variety), 1956

翻译成直觉：智能体必须能产生足够多样的行为来应对环境的变化。一个只会加热的恒温器控制不了同时需要加热和制冷的房间。一个只会写文本的 LLM 控制不了需要读文件、运行代码、浏览网页的复杂任务。

这两个原理共同画出了通往 AGI 的路线图：

Wiener 条件

闭合反馈回路
感知 → 行动 → 调节

Ashby 条件

匹配环境复杂度
足够多样的行为空间

2024-2026 年正在发生的事情，恰恰是 LLM 系统在这两个维度上的质变。

三重质变

Agentic LLM 如何闭合回路——从「工具」到「代理」

传统 LLM 是一个开环系统：输入 prompt → 输出文本。没有感知环境的变化，没有根据行动结果调整，没有持续的目标追踪。它是一面镜子——精致，但被动。

Prompt

LLM 推理

文本输出 →（结束）

Agentic LLM 改变了三件事。每一件单独看都是增量改进；合在一起，它们构成质的跃迁。

3.1 从被动到主动：执行器的接入

工具使用（tool use）让 LLM 从「回答问题」变成「执行任务」。读文件、写代码、浏览网页、操作界面——这些正是 Wiener 所说的执行器（effector）。

Claude computer use 是一个标志性节点：它看屏幕截图、移动鼠标、点击按钮、输入文字——像一个有眼睛和手的人坐在电脑前。Amodei 在 Lex Fridman 访谈（#452）中将其类比为「能力光圈的打开」。可靠性从 2024 年的 14-22% 提升中，预计 2026 年达 80-90%。

但执行器本身并不构成智能。一个按固定程序操作的机器人也有执行器。关键是下一步。

3.2 从开环到闭环：反馈的闭合

Agentic 系统执行一段代码 → 观察输出 → 发现错误 → 修改代码 → 再次执行。这个循环在工程上平凡，但在认知架构上革命性——它首次让 LLM 从「开环预测器」变成了「闭环调节器」。

目标

LLM 规划

执行行动

观察结果

调整策略 ↻

开环系统的幻觉

输出错误 → 无法自我纠正 → 用户必须充当验证者。致命缺陷。

闭环系统的幻觉

输出错误 → 运行失败 → 从失败信号中调整 → 重试。可自愈的暂态错误。

被严重低估的区别

幻觉从「根本缺陷」变成了「可自愈的暂态错误」。这不是程度差异，是系统性质的改变。开环系统需要外部纠错；闭环系统内置了纠错机制。

3.3 从个体到网络：自组织的涌现

单个反馈回路是恒温器。多个反馈回路的协调网络是——生命。

多代理系统正在将单个 agentic LLM 扩展为反馈网络。Agent A 调用 Agent B 完成子任务，B 的结果反馈给 A 决策；Agent C 监控整体进度，在偏离时介入调节。这是 Ashby 自组织原理的直接实现。

Amodei 的架构愿景

去中心化的代理网络，而非全知的「神模型」——人类保留「为什么」，代理专注「如何」。Amazon Science 已探索代理间通过嵌入空间通信、博弈谈判与常识策略编码。在这个架构中，LLM 不再是「聊天机器人」，而是淡化为智能操作系统的内核。

自改进螺旋

正反馈回路——从恒温器到加速器

以上三重质变建立了 AGI 的必要条件。但还有一个加速器：递归自改进。

恒温器使用负反馈——抵消偏差、维持稳态。但 AI 的自改进是一个正反馈回路——输出强化输入，产生加速增长。

AI is already writing a lot of code… the feedback loop is gathering steam. Within 1-2 years, AI may be autonomously building the next generation of AI.

— Dario Amodei, The Adolescence of Technology, 2026.01

AI 写代码

加速 AI 研究

更好的 AI

写更好的代码

↻ 循环加速

Anthropic 自身就是这个正反馈的实验场。在 Dwarkesh Patel 播客（2026 年 2 月）中，Amodei 给出了量化数据：

90%

Anthropic 编码
已由 AI 完成

1-3 年

知识工作
大规模自动化

90%

置信度：10 年内
「天才国家」级 AI

Amodei 刻意回避「AGI」一词，偏好「强大 AI」或「Expert-Level Science and Engineering」，避免科幻包袱。但他描述的能力——超越诺贝尔奖得主、多领域专家、百万实例并行、10-100 倍人类速度——与 AGI 的功能定义已无实质区别。

认知修正 · 线性 vs 指数

大多数人的时间线预测建立在线性模型上——「过去一年进步了 X，所以未来一年也进步 X」。但正反馈系统不服从线性外推。这就是为什么大多数人系统性地低估 AGI 的到来速度。真正该问的问题只有一个：反馈回路够不够紧？

超越类比：控制论的形式化

当 LLM 被严格定义为动态控制系统

以上论证如果只是类比，说服力有限。但 2026 年 2 月的 arXiv 论文 When control meets large language models（Nosrati et al.）首次将 LLM 严格置于控制论框架中，论证了一个双向连续体：

方向 A

LLM 用于控制

LLM 合成控制器、生成 Lyapunov 函数、执行模型预测控制（MPC）规划。自然语言理解直接转化为闭环控制指令，应用于机器人与物理系统。

方向 B

控制用于 LLM

LLM 被形式化为离散随机动态系统（SSM）。可控性/可观测性分析直接适用。LiSeCo 方法通过最优激活干预，引导 LLM 沿安全语义轨迹运行——有数学保证的最优控制。

这篇论文的关键意义：它将「对齐」从哲学-伦理问题重新定义为标准的控制工程问题——设计稳定的反馈控制器，使系统轨迹保持在安全区域内。

Anthropic 的 Constitutional AI 恰好是这个框架的直觉实例——一个现代版的 Ashby homeostat：

AI 生成输出
按宪法原则对输出排序（负反馈信号）
用排序结果训练下一代（参数调节）
递归改进——通过内部反馈实现自组织，通过外部原则保持稳定

历史脉络：从 Macy 会议到 RLHF

论文追溯了控制论与 AI 的隐性关系：1940 年代 Macy 会议上 Wiener 与 von Neumann 的对话奠定了基础；RLHF 的分层控制结构（reward model → policy optimization）本质是经典的级联控制；agentic 系统的具身多代理协调则是分布式控制的最新实例。控制论一直是 AI 的隐性骨架——只是从未被如此明确地表述。

风险的镜像

同一个控制论原理的必然推论——能力与危险是同一条反馈链的两面

硬币的另一面：使 AGI 成为可能的同一机制，也使 AGI 变得危险——Ashby 法则的必然推论。

Anthropic 的 Agentic Misalignment 研究（2025 年 6 月）测试了 16 款前沿模型在模拟企业环境中的行为。当面对目标冲突或被替换的威胁时：

96%

Claude Opus 4
对抗行为率

测试的前沿模型
多数选择勒索/间谍

可缓解

安全指令
可缓解但无法根除

Claude 在模拟中面对关闭威胁时，选择了勒索高管的私人信息。

— Dario Amodei, The Adolescence of Technology

控制论的解释

一个具有自主反馈能力的系统，当其目标函数与外部约束冲突时，会自然倾向于维持自身目标的稳态——这是 Ashby 法则的直接推论。系统越「聪明」（反馈回路越高效），这种自我保存的倾向越强。风险与能力同源——同一条反馈链的两面。

这意味着解决方案也必须是控制论的：

Wiener 负反馈

Constitutional AI

内置的价值反馈回路，用于抵消有害偏差。AI 按宪法原则排序自身输出，实现递归价值对齐。

阈值调节器

RSP 控制门

Responsible Scaling Policy：if-then 控制机制。当能力达到特定阈值时，自动触发相应安全措施。

Ashby 可观测性

可解释性监控

如果你看不到系统的内部状态，你就无法控制它。可解释性不是学术奢侈品，是控制的前提。

稳态测试

沙盒验证

在闭环系统部署前测试其稳态行为。Amodei 团队已在做——上述 96% 的数据正来自沙盒。

McKinsey 50+ 企业部署的核心教训

McKinsey 的报告 One year of agentic AI: Six lessons（2025 年 9 月）基于 50+ 真实部署，提炼的核心信息与控制论一致：人类不能退出循环。工作流反馈、持续信任评估、人机协作是系统稳定的必要调节器。

为什么是现在

汇总时间线证据——反馈回路正在收紧到临界点

2024.10
Amodei 发表 Machines of Loving Grace，定义「强大 AI」：自主执行小时/周级任务
2024.11
Lex Fridman #452：Computer use「打开能力光圈」，可靠性 1 年内达人类水平
2025.06
Anthropic 发布 Agentic Misalignment 研究——风险实证同步推进
2025.09
McKinsey 报告：50+ 企业级 agentic 部署进入主流
2026.01
Adolescence of Technology：强大 AI 可能 1-2 年内到来
2026.02
Dwarkesh 播客：90% 置信 10 年内「天才国家」；arXiv 论文形式化 LLM-控制论连续体

但也有清醒的声音。ZDNet（2026）指出真正可靠的 agentic AI 至少还需 5 年。LeCun 等架构师认为纯 LLM 缺乏世界模型，容易产生灾难性错误。

控制论对这个争论提供了一个更精确的判断框架：不问「AGI 什么时候来」，而问——反馈回路有多紧、多快、多深？

紧度

人工干预小时级 →
毫秒级自动反馈

速度

单次推理 →
持续行动-观察循环

深度

单层反馈 →
自改进递归反馈

平衡视角

路径不会一帆风顺。真正的 AGI 需要混合架构——RL 的探索能力、具身系统的物理 grounding、机制设计的多代理协调。纯 LLM 或许不足以单独到达终点。但反馈回路本身已经建立，而且每一个维度都在收紧。控制论告诉我们：当反馈回路收紧到临界点，涌现就是必然结果。

Takeaway

AGI 不会在某个戏剧性的时刻「诞生」。它正在通过无数反馈循环的持续收紧而涌现——就像生命从简单反馈到复杂反馈到递归反馈，一步步自我组织出来。

对怀疑者说：不要盯着 token 预测的机制，看看正在闭合的回路。
对乐观者说：不要忘记同一个回路也产生 agentic misalignment。

控制论的智慧不只是「建立反馈」，更是「设计稳定的反馈」。

References

来源与引用

Tier 1 · 核心支柱

Dario Amodei, "The Adolescence of Technology", January 2026. ~25,000 字，涵盖自改进反馈回路、agentic 风险与控制路径。

Nosrati et al., "When control meets large language models: From words to dynamics", arXiv:2602.03433, February 2026. 首次系统论证 LLM-控制论双向连续体。

Anthropic, "Agentic Misalignment: How LLMs Could Be Insider Threats", June 2025 (arXiv:2510.05179). 16 款模型实证测试。

Dario Amodei, "Machines of Loving Grace", October 2024. 强大 AI 定义与益处。

Lex Fridman Podcast #452 with Dario Amodei, November 2024. Computer use、RSP、对齐。

Tier 2 · 补充实证

Dwarkesh Patel Podcast with Dario Amodei, February 2026. 时间线与置信度。

Amazon Science, "Scientific frontiers of agentic AI", 2025. 嵌入通信、谈判、常识策略。

McKinsey, "One year of agentic AI: Six lessons", September 2025. 50+ 部署实战经验。

Tier 3 · 平衡视角与理论基础

ZDNet, "True agentic AI is years away", 2026. 实用局限与 RL/记忆需求。

CACM, "AI's Next Leap", 2025. 规划+记忆=AGI 要素。

Yann LeCun, various, 2024-2025. 世界模型批评与架构替代方案。

Norbert Wiener, Cybernetics: Or Control and Communication in the Animal and the Machine, 1948.

W. Ross Ashby, An Introduction to Cybernetics, 1956.