小脑：智能的另一半，最强的 AI 还没碰到

先说一个让人不太舒服的数字。

我们平时最拿来当“我正在思考”证据的大脑皮层，大约只有 150 亿个神经元。可蜷在后脑勺底下、平时很少被想起的小脑，装了 600 多亿个。

四倍。

这个数字很容易被拿来讲算力：“看，真正的算力在小脑，现在训练大模型这点资源，只是 AGI 的零头。”

我不太认这个账。小脑里的神经元，绝大多数是颗粒细胞，是哺乳动物大脑里最小、最简单的一类神经元。它们的连接高度重复，整个回路规整得像一张巨大的查找表。拿它的数量去比“算力”，有点像拿显卡的晶体管数证明它比 CPU 聪明。

这个数字让我在意的地方，其实和算力关系不大。

它提醒我：我们的颅腔里有一整块大陆，占了大半神经元，却不负责我们平时挂在嘴边的“思考”。它忙的是另一件事。一件今天的大模型还没有对应器官的事。

这件事，可能正好卡在 AI 从“准大师”走向“大师”的那条路上。

一、最强的 AI，也只是个准大师
#

2026 年的大模型有多强，不用再铺垫了。凡是有标准答案、有评分器、有明确语料的赛道，它都已经逼近甚至超过了人类专家。

可我总觉得它还缺一类东西。

我说的不是知识量。知识量这件事，人类已经没什么好争的了。模型读过的论文、代码、手册、论坛帖子，比任何一个人都多。

我说的是那种老手身上的“体感”：干了二十年的 DBA，盯一眼监控就觉得“不对劲”；老医生听两句描述，心里已经有了方向；写了十几年代码的人，扫一眼 diff 就知道这个地方迟早要出事。

你问他凭什么，他常常说不清。

这类人，和一个把所有教科书背得滚瓜烂熟、能把每个知识点讲得头头是道的优等生，不是一回事。

后者我愿意叫他准大师。

准大师的本事，主要来自陈述性知识的组合。把人类能写下来、能讲明白的东西全喂给他，他可以融会贯通，在一切说得出来的问题上对答如流。今天的大模型，大体就在这个位置上：它把人类显性知识的总和压进了权重里。

大师身上多出来的那一截，很少安静地待在语言里。

《庖丁解牛》这段大家都熟。庖丁说：“臣以神遇而不以目视，官知止而神欲行。”这句话我现在越看越觉得准确。真正熟到那个程度，眼睛和解释都退到后面去了，动作自己知道往哪儿走。

你让庖丁写一本《解牛手册》，他能写出一些原则，也能讲一些经验。但那本手册不会等于庖丁。最要紧的东西在他手上，在十九年“所解数千牛”之后长出来的那套感觉里。

今天的 AI 很像读完了全世界所有《解牛手册》的准大师。它能讲牛的解剖，讲刀刃的力学，也能复述庖丁的心得。

可真到下刀的那一下，它没有那双手，也没有那十九年。

二、能说出来的，和只能做出来的
#

这个差别，放在知识论里，是个很老的问题。

古希腊人区分过两类知识：Episteme，可陈述、可普遍化、关于“为什么”的知识，比如科学、数学、逻辑；Metis，难以陈述、随情境变化、关于“怎么办”的知识，比如手艺、判断、临场应变。

现代科学的气质更偏向前者。我们希望重要的知识都能被表达、检验、复制。AI 行业也继承了这套理想：一切都要 token 化，一切都要摊成步骤，一切最好都能用 chain-of-thought 讲出来。

但波兰尼那句话一直横在那里：

“We can know more than we can tell.”

我们知道的，远比我们能说出来的多。

我以前写过《专家能被蒸馏吗？》，讲的就是这个问题。很多时候，显性知识只是默会知识挤进语言之后留下的一部分。先有一大片活在身体、直觉、背景经验里的东西，语言从里面舀出一瓢，勉强凝成规则、手册、SOP。

所以“能解释”不等于“真理解”。有些理解，在解释里反而会变形。

真正懂代码的人，不一定是能逐行注释的人，而是扫一眼就闻到“这里有 bug”的人。你问他原因，他可能先说不出来，只能反复看几眼，然后慢慢把直觉翻译成解释。

这不是理解的缺陷。很多时候，这是理解已经沉到更深一层之后的样子。

到这里，有人会想到扩散模型。自回归模型学路径，扩散模型学地形。高手看一眼棋盘就觉得“不对”，脑子里未必跑过一条完整推理链，更像是直接感到这个局面落在了“合理棋局”的低概率区。

这个对应我觉得成立。但那更像是感知层面的默会。我们至少已经摸到了一点数学影子。

庖丁的功夫还不止于“看”。他的本事在动作里，在“这一刀下去，半秒后肌理会怎么开”这个预测里。

这是动作层面的默会。

而动作层面的默会，生理上绕不开小脑。

三、小脑到底在算什么
#

先别把小脑简单理解成“运动协调模块”。这个说法没错，但太粗了。

我更愿意用今天工程师熟悉的话说：小脑在跑一套前向模型。

你的大脑要让手端起一杯水，会先发出运动指令。但从指令发出，到肌肉动起来，再到感觉神经把“手现在在哪里”的反馈传回来，中间有几十到上百毫秒的延迟。

如果所有动作都靠“动一下、看一下、再调一下”来闭环，人会笨拙得不可想象。反馈永远慢半拍，动作也就永远慢半拍。

小脑的办法是提前算。

在指令真正生效之前，它先预测：“如果我发出这个指令，半秒后手、杯子、水面会是什么状态？”然后它用这个预测提前修正动作。等真实反馈回来，再拿反馈校准下一次预测。

这件事和大模型预测下一个 token，有一点底层相似：都是预测机器，都在缩小预测和现实之间的误差。

差别也很清楚。

LLM 的预测大多是开环的。它预测一句话，生成一个 token，最多更新上下文里的表征。它没有真的动手改变世界，再从世界那里拿到后果。

小脑的预测是闭环的。它预测，它行动，世界给反馈，它再把反馈刻回自己。

更关键的是，小脑这套前向模型不是通用模板。它是针对这一具身体、这一套环境、这一段历史慢慢长出来的。

你的小脑里刻着你的胳膊有多长，你常用键盘的键程和回弹，你家楼梯每一级的高度，你那辆车的离合器在哪个点结合。

这些东西很难转让。

把一个顶级钢琴家的小脑参数原封不动移植给另一个人，大概率没有意义。它编码的是这双手、这架琴、这几十年之间的耦合，不是一份抽象的《如何弹钢琴》。换一具身体，很多参数立刻失效。

“不可转让”这个词，后面还会反复出现。

四、小脑，是“你之所以是你”
#

我现在越来越倾向于把小脑看成个体性的一个硬底座。

“个体性”“独特性”听起来像哲学词，容易飘。小脑这条线，反而把它拉回到了一个可以工程化讨论的位置。

所谓“某一个人”，在计算意义上是什么？

很大一部分，就是一套不可复制的、由这个人自己的历史刻出来的前向模型。

你之所以是你，不只是因为脑子里装了哪些知识。那些知识别人能学，书上能查，大模型也装得比你全。

你之所以是你，是因为你的身体以某种独特方式，被你的经历塑成了今天这个形状。你走路的姿态，你敲键盘的节奏，你看到一个似曾相识的故障时心里冒出来的那点不安，这些东西别人拿不走，也没法完整复制。

准大师和大师之间，隔的就不只是知识量了。

准大师靠陈述性知识的组合，这正是大模型的主场。大师靠的那一部分，是感觉运动系统里刻下的个体化前向模型。

这个维度，今天的主流 AI 架构基本都还空着。自回归也好，扩散也好，参数再大也好，它们都还没有这样一个器官。

五、一万小时，雕的不是知识，是你
#

“一万小时定律”经常被讲成鸡汤，好像坚持够久，就能把足够多的内容塞进脑子。

我觉得重点不在内容。

一万小时真正沉淀下来的，是一万小时的后果。

一个新人 DBA 读完所有手册，知识未必比老司机少多少。但他没有体感。这个体感不是从书里读出来的，是盯了无数小时面板、扛过几十次真实线上事故之后，在身体里长出来的。

老冯自己做数据库这么多年，最清楚这种东西有多难写。很多判断不来自某条明确规则，更像是一句“这个味儿不对”。CPU、IO、连接数、延迟、复制延迟、业务流量放在一起，某个组合突然让人心里一紧。

你让我事后复盘，我当然能给出解释。可现场那一秒，通常不是解释先到，是感觉先到。

这里面最重要的变量，是真实后果。

在模拟环境里练，和在生产环境里干，长出来的东西不一样。半夜三点被电话叫醒时的紧张，误删生产数据时从脚底凉上来的后悔，熬一整夜把系统救回来之后那口气，都会给经验打上很深的标记。

一个随时可以 reset、错了也没人疼的世界，练得再久，也很难长出这种判断。

软件工程其实一直在做类似的事：把慢思考沉淀成快执行。

Kahneman 把认知分成 System 1 和 System 2。System 2 慢、刻意、有意识；System 1 快、自动、无意识。学技能的过程，很像把 System 2 编译成 System 1：新手开车时每一步都要想，熟了之后刹车和打方向就变成了反射。

我以前常说：代码是思考的化石。

程序员写代码，是慢思考。代码一旦编译部署，就变成确定、高速、无需再想的自动执行。软件工程史，很大程度上就是人类不断把 System 2 的成果沉淀成 System 1。

大模型现在缺的，正是这条个体级结晶通道。它回答“1 + 1”和回答复杂哲学问题，调用的是同一套推理结构。它没有“这件事我做熟了，所以变成我的反射”的机制。

蒸馏、缓存、微调当然存在，但它们大多是种群级优化：经验被汇总，形成一个新版本，再分发给所有副本。

小脑干的是另一件事：这一个实例的经验，慢慢变成这一个实例自己的形状。

这个区别很关键。

六、Pearl 的那道墙
#

工程师很自然会问：既然小脑是经验刻出来的，那让模型多见经验不就行了吗？数据再多一点，环境再丰富一点，模型再大一点，总会逼近吧？

在某个维度上，这条路被 Judea Pearl 的因果阶梯挡住了。

Pearl 把因果分成三层：

第一层是关联：看到 X，Y 有多大概率？这是观察。

第二层是干预：如果我主动做 X，Y 会怎样？

第三层是反事实：如果当时没做 X，Y 还会发生吗？

关键问题在第二层。没有额外的因果假设，光靠观察分布，原则上无法唯一确定干预分布。

翻成人话就是：你盯着世界看一辈子，也不等于知道自己动手改变它以后会发生什么。

看，和做，得到的是两种知识。

静态语料训练出来的大模型，哪怕再大，学到的主要还是第一层：世界的相关性，以及人类对因果的描述。它读过无数“如何解牛”“如何排障”的文字，可它并没有亲手做过 X，再亲眼看到 Y。

它接触的是人类对干预的记录和转述，不是干预本身。

所以问题不只是数据量。数据从哪里来，决定了知识属于哪一类。

如果是 2025 年，我大概会在这里收尾：纯观察数据有一堵墙，真正的大师级 AI 需要身体，需要进入世界亲手干预。

但现在已经是 2026 年了。

七、2026 年，这道墙正在松动
#

这里得诚实一点：前面那套论证有一个前提，放到 2026 年已经不稳了。

这个前提是：AI 只有观察数据。

今年发生的变化大家都看到了。Agentic RL、RLVR（基于可验证奖励的强化学习）、大规模可验证环境里的 Agent 训练，正在让模型不只是读结果，还能采取行动、拿到反馈、再用反馈更新自己。

一个 coding agent 在沙箱里改一行代码，跑一遍测试，看它失败，再根据失败调整下一步。这已经不只是“看别人怎么做”，而是“我做了 X，于是 Y 发生了”。

这就是干预数据。

Pearl 那道从“看”到“做”的沟，正在被工业化地跨越，而且最先发生在软件世界里。

那么，小脑这条线是不是就没用了？是不是再过几年，模型在沙箱里练够了，大师也就自然出现了？

我不这么看。

因为“从看见到动手”只是第一步。真正麻烦的地方，在更后面。

八、它没死，它被拆成了三件事
#

现在回头看，我前面说的“小脑命题”，其实不该被压成一句话。它至少包含三件事。

第一，模型得有干预数据。它要真的能动手，拿到“我做了 X，Y 发生了”的反馈。

这一点，2026 年已经开始满足了。这是今年最大的变化。

第二，干预环境要足够像你真正关心的世界。沙箱里的因果，得和真实场景对得上。

在代码、数学、棋类这些封闭域里，这一点部分成立。规则清楚，奖励可验证，试错成本低。可到了物理世界、医疗、金融生产系统、真实数据库事故，事情就没那么好办。你的 DBA Agent 可以在沙箱里练得很强，但沙箱里永远没有半夜三点那个真实电话，也没有误操作之后真实客户在等恢复。

第三，也是我最在意的一点：干预经验要归属于一个持续存在的个体。

这一万次试错，得累在“这一个它”身上，慢慢改变它自己的判断风格。否则经验只是公共训练材料，不会长成个体历史。

今天的大规模 agentic RL，大体还是另一种流程：成千上万个实例并行探索，经验被收集、汇总、平均、蒸馏进下一个 checkpoint，然后分发给所有副本。

这当然有效。模型会变强。

但经验属于种群，不属于任何一个具体实例。

没有哪个副本因为自己走过一段不可逆的路，而变成一个别人复制不了的“它”。它们共享的是同一个升级包，不是一段各自承担过后果的生活史。

所以小脑命题没有被 2026 年的新进展推翻。它只是被拆开了。

从“看”到“做”的边界，正在被跨过去；从“种群经验”到“个体历史”的边界，还基本没动。

我现在更愿意把真正的墙放在这里：

AI 的经验，能不能变成某一个它自己的历史？

九、那道墙，没人急着去撞
#

如果未来几年，agentic RL 一路狂飙，模型在一切可验证领域练到非常强，但个体化这件事仍然没人碰，我们会得到什么？

我想，大概会得到一种全知、失忆、没有身体历史、可以无限复制的旁观者。

它在可陈述领域达到超人级准大师水平，每一个副本都同样优秀，也同样缺少“这个人”的味道。删掉一个，再开一个，没有什么实质差别。因为没有哪个副本被自己的不可逆经历塑造过。

这已经是文明级的大事件。我不是唱衰它。这样的系统在经济上非常好：一致、可控、可复制、可审计，足够重组掉绝大部分知识工作。

但它的形状要看清楚。

个体化这道墙没人急着撞，未必是因为技术上完全撞不动。

一个不可复制、不可回滚、每一个都不一样的系统，在商业上很难卖。你怎么 QA？每个都不同，你测哪个？你怎么批量交付？独一无二的历史没法打包成标准产品。

安全上也麻烦。一个被自己历史塑造、无法完全预测、还不能简单删掉重开的智能体，你怎么对齐？怎么审计？怎么兜底？

所以市场会自然偏向“工具”这个形态。工具好交付，好控制，好复现。能力边界和安全边界，在这里缠在了一起：墙那边可能有真正的大师，也可能有真正难控的系统。

这就很微妙了。

这道墙不只是“我们还没跨过去”，也可能是“我们暂时并不想跨过去”。

尾声：你的那一万小时，机器还没有容器去装
#

绕一圈，还是回到开头那个数字。

600 亿。

我们后脑勺底下那块平时不起眼的小脑，占了大半神经元，却并不负责写论文式的思考。它把一具身体、一套环境、一段历史，慢慢刻成一个不可复制的形状。

庖丁十九年不只是学会了“牛的结构”，老 DBA 十年也不只是记住了“数据库手册”。真正沉下来的，是那套连自己都说不太清的手感、节奏、预感和责任。

2026 年最强的 AI，已经读遍人类手册，也开始学着亲手试错了。这是很大的进步。

可它每一次试错，最后大多还是进入公共池子，变成下一代模型的共享能力。它在变强，但还没有变成“某一个它”。

而让你成为“这一个你”的那部分，恰好也是人类最古老的局限：大师会死，手艺会失传，一身本事无法完整复制。我们珍视的独特性，和我们摆脱不了的有限性，是同一件事的两面。

机器追上来的，是显性知识那一半。那一仗其实已经不用再打了。

现在还属于人的，是那一万小时，是不可回滚的后果，是半夜三点的恐惧、误删数据的懊悔、救活系统之后的释然，是被历史刻进身体、连自己都说不清的东西。

是这一个你。

AI 缺的那块，讲到最后，不只是算力。

它缺一具身体，也缺这具身体走过的、不可复制的、属于它自己的历史。

一、最强的 AI，也只是个准大师#

二、能说出来的，和只能做出来的#

三、小脑到底在算什么#

四、小脑，是“你之所以是你”#

五、一万小时，雕的不是知识，是你#

六、Pearl 的那道墙#

七、2026 年，这道墙正在松动#

八、它没死，它被拆成了三件事#

九、那道墙，没人急着去撞#

尾声：你的那一万小时，机器还没有容器去装#

相关文章