先说一个让人不太舒服的数字。
我们平时最拿来当“我正在思考”证据的大脑皮层,大约只有 150 亿个神经元。可蜷在后脑勺底下、平时很少被想起的小脑,装了 600 多亿个。
四倍。
这个数字很容易被拿来讲算力:“看,真正的算力在小脑,现在训练大模型这点资源,只是 AGI 的零头。”
我不太认这个账。小脑里的神经元,绝大多数是颗粒细胞,是哺乳动物大脑里最小、最简单的一类神经元。它们的连接高度重复,整个回路规整得像一张巨大的查找表。拿它的数量去比“算力”,有点像拿显卡的晶体管数证明它比 CPU 聪明。
这个数字让我在意的地方,其实和算力关系不大。
它提醒我:我们的颅腔里有一整块大陆,占了大半神经元,却不负责我们平时挂在嘴边的“思考”。它忙的是另一件事。一件今天的大模型还没有对应器官的事。
这件事,可能正好卡在 AI 从“准大师”走向“大师”的那条路上。
一、最强的 AI,也只是个准大师#
2026 年的大模型有多强,不用再铺垫了。凡是有标准答案、有评分器、有明确语料的赛道,它都已经逼近甚至超过了人类专家。
可我总觉得它还缺一类东西。
我说的不是知识量。知识量这件事,人类已经没什么好争的了。模型读过的论文、代码、手册、论坛帖子,比任何一个人都多。
我说的是那种老手身上的“体感”:干了二十年的 DBA,盯一眼监控就觉得“不对劲”;老医生听两句描述,心里已经有了方向;写了十几年代码的人,扫一眼 diff 就知道这个地方迟早要出事。
你问他凭什么,他常常说不清。
这类人,和一个把所有教科书背得滚瓜烂熟、能把每个知识点讲得头头是道的优等生,不是一回事。
后者我愿意叫他准大师。
准大师的本事,主要来自陈述性知识的组合。把人类能写下来、能讲明白的东西全喂给他,他可以融会贯通,在一切说得出来的问题上对答如流。今天的大模型,大体就在这个位置上:它把人类显性知识的总和压进了权重里。
大师身上多出来的那一截,很少安静地待在语言里。
《庖丁解牛》这段大家都熟。庖丁说:“臣以神遇而不以目视,官知止而神欲行。”这句话我现在越看越觉得准确。真正熟到那个程度,眼睛和解释都退到后面去了,动作自己知道往哪儿走。
你让庖丁写一本《解牛手册》,他能写出一些原则,也能讲一些经验。但那本手册不会等于庖丁。最要紧的东西在他手上,在十九年“所解数千牛”之后长出来的那套感觉里。
今天的 AI 很像读完了全世界所有《解牛手册》的准大师。它能讲牛的解剖,讲刀刃的力学,也能复述庖丁的心得。
可真到下刀的那一下,它没有那双手,也没有那十九年。
二、能说出来的,和只能做出来的#
这个差别,放在知识论里,是个很老的问题。
古希腊人区分过两类知识:Episteme,可陈述、可普遍化、关于“为什么”的知识,比如科学、数学、逻辑;Metis,难以陈述、随情境变化、关于“怎么办”的知识,比如手艺、判断、临场应变。
现代科学的气质更偏向前者。我们希望重要的知识都能被表达、检验、复制。AI 行业也继承了这套理想:一切都要 token 化,一切都要摊成步骤,一切最好都能用 chain-of-thought 讲出来。
但波兰尼那句话一直横在那里:
“We can know more than we can tell.”
我们知道的,远比我们能说出来的多。
我以前写过《专家能被蒸馏吗?》,讲的就是这个问题。很多时候,显性知识只是默会知识挤进语言之后留下的一部分。先有一大片活在身体、直觉、背景经验里的东西,语言从里面舀出一瓢,勉强凝成规则、手册、SOP。
所以“能解释”不等于“真理解”。有些理解,在解释里反而会变形。
真正懂代码的人,不一定是能逐行注释的人,而是扫一眼就闻到“这里有 bug”的人。你问他原因,他可能先说不出来,只能反复看几眼,然后慢慢把直觉翻译成解释。
这不是理解的缺陷。很多时候,这是理解已经沉到更深一层之后的样子。
到这里,有人会想到扩散模型。自回归模型学路径,扩散模型学地形。高手看一眼棋盘就觉得“不对”,脑子里未必跑过一条完整推理链,更像是直接感到这个局面落在了“合理棋局”的低概率区。
这个对应我觉得成立。但那更像是感知层面的默会。我们至少已经摸到了一点数学影子。
庖丁的功夫还不止于“看”。他的本事在动作里,在“这一刀下去,半秒后肌理会怎么开”这个预测里。
这是动作层面的默会。
而动作层面的默会,生理上绕不开小脑。
三、小脑到底在算什么#
先别把小脑简单理解成“运动协调模块”。这个说法没错,但太粗了。
我更愿意用今天工程师熟悉的话说:小脑在跑一套前向模型。
你的大脑要让手端起一杯水,会先发出运动指令。但从指令发出,到肌肉动起来,再到感觉神经把“手现在在哪里”的反馈传回来,中间有几十到上百毫秒的延迟。
如果所有动作都靠“动一下、看一下、再调一下”来闭环,人会笨拙得不可想象。反馈永远慢半拍,动作也就永远慢半拍。
小脑的办法是提前算。
在指令真正生效之前,它先预测:“如果我发出这个指令,半秒后手、杯子、水面会是什么状态?”然后它用这个预测提前修正动作。等真实反馈回来,再拿反馈校准下一次预测。
这件事和大模型预测下一个 token,有一点底层相似:都是预测机器,都在缩小预测和现实之间的误差。
差别也很清楚。
LLM 的预测大多是开环的。它预测一句话,生成一个 token,最多更新上下文里的表征。它没有真的动手改变世界,再从世界那里拿到后果。
小脑的预测是闭环的。它预测,它行动,世界给反馈,它再把反馈刻回自己。
更关键的是,小脑这套前向模型不是通用模板。它是针对这一具身体、这一套环境、这一段历史慢慢长出来的。
你的小脑里刻着你的胳膊有多长,你常用键盘的键程和回弹,你家楼梯每一级的高度,你那辆车的离合器在哪个点结合。
这些东西很难转让。
把一个顶级钢琴家的小脑参数原封不动移植给另一个人,大概率没有意义。它编码的是这双手、这架琴、这几十年之间的耦合,不是一份抽象的《如何弹钢琴》。换一具身体,很多参数立刻失效。
“不可转让”这个词,后面还会反复出现。
四、小脑,是“你之所以是你”#
我现在越来越倾向于把小脑看成个体性的一个硬底座。
“个体性”“独特性”听起来像哲学词,容易飘。小脑这条线,反而把它拉回到了一个可以工程化讨论的位置。
所谓“某一个人”,在计算意义上是什么?
很大一部分,就是一套不可复制的、由这个人自己的历史刻出来的前向模型。
你之所以是你,不只是因为脑子里装了哪些知识。那些知识别人能学,书上能查,大模型也装得比你全。
你之所以是你,是因为你的身体以某种独特方式,被你的经历塑成了今天这个形状。你走路的姿态,你敲键盘的节奏,你看到一个似曾相识的故障时心里冒出来的那点不安,这些东西别人拿不走,也没法完整复制。
准大师和大师之间,隔的就不只是知识量了。
准大师靠陈述性知识的组合,这正是大模型的主场。大师靠的那一部分,是感觉运动系统里刻下的个体化前向模型。
这个维度,今天的主流 AI 架构基本都还空着。自回归也好,扩散也好,参数再大也好,它们都还没有这样一个器官。
五、一万小时,雕的不是知识,是你#
“一万小时定律”经常被讲成鸡汤,好像坚持够久,就能把足够多的内容塞进脑子。
我觉得重点不在内容。
一万小时真正沉淀下来的,是一万小时的后果。
一个新人 DBA 读完所有手册,知识未必比老司机少多少。但他没有体感。这个体感不是从书里读出来的,是盯了无数小时面板、扛过几十次真实线上事故之后,在身体里长出来的。
老冯自己做数据库这么多年,最清楚这种东西有多难写。很多判断不来自某条明确规则,更像是一句“这个味儿不对”。CPU、IO、连接数、延迟、复制延迟、业务流量放在一起,某个组合突然让人心里一紧。
你让我事后复盘,我当然能给出解释。可现场那一秒,通常不是解释先到,是感觉先到。
这里面最重要的变量,是真实后果。
在模拟环境里练,和在生产环境里干,长出来的东西不一样。半夜三点被电话叫醒时的紧张,误删生产数据时从脚底凉上来的后悔,熬一整夜把系统救回来之后那口气,都会给经验打上很深的标记。
一个随时可以 reset、错了也没人疼的世界,练得再久,也很难长出这种判断。
软件工程其实一直在做类似的事:把慢思考沉淀成快执行。
Kahneman 把认知分成 System 1 和 System 2。System 2 慢、刻意、有意识;System 1 快、自动、无意识。学技能的过程,很像把 System 2 编译成 System 1:新手开车时每一步都要想,熟了之后刹车和打方向就变成了反射。
我以前常说:代码是思考的化石。
程序员写代码,是慢思考。代码一旦编译部署,就变成确定、高速、无需再想的自动执行。软件工程史,很大程度上就是人类不断把 System 2 的成果沉淀成 System 1。
大模型现在缺的,正是这条个体级结晶通道。它回答“1 + 1”和回答复杂哲学问题,调用的是同一套推理结构。它没有“这件事我做熟了,所以变成我的反射”的机制。
蒸馏、缓存、微调当然存在,但它们大多是种群级优化:经验被汇总,形成一个新版本,再分发给所有副本。
小脑干的是另一件事:这一个实例的经验,慢慢变成这一个实例自己的形状。
这个区别很关键。
六、Pearl 的那道墙#
工程师很自然会问:既然小脑是经验刻出来的,那让模型多见经验不就行了吗?数据再多一点,环境再丰富一点,模型再大一点,总会逼近吧?
在某个维度上,这条路被 Judea Pearl 的因果阶梯挡住了。
Pearl 把因果分成三层:
第一层是关联:看到 X,Y 有多大概率?这是观察。
第二层是干预:如果我主动做 X,Y 会怎样?
第三层是反事实:如果当时没做 X,Y 还会发生吗?
关键问题在第二层。没有额外的因果假设,光靠观察分布,原则上无法唯一确定干预分布。
翻成人话就是:你盯着世界看一辈子,也不等于知道自己动手改变它以后会发生什么。
看,和做,得到的是两种知识。
静态语料训练出来的大模型,哪怕再大,学到的主要还是第一层:世界的相关性,以及人类对因果的描述。它读过无数“如何解牛”“如何排障”的文字,可它并没有亲手做过 X,再亲眼看到 Y。
它接触的是人类对干预的记录和转述,不是干预本身。
所以问题不只是数据量。数据从哪里来,决定了知识属于哪一类。
如果是 2025 年,我大概会在这里收尾:纯观察数据有一堵墙,真正的大师级 AI 需要身体,需要进入世界亲手干预。
但现在已经是 2026 年了。
七、2026 年,这道墙正在松动#
这里得诚实一点:前面那套论证有一个前提,放到 2026 年已经不稳了。
这个前提是:AI 只有观察数据。
今年发生的变化大家都看到了。Agentic RL、RLVR(基于可验证奖励的强化学习)、大规模可验证环境里的 Agent 训练,正在让模型不只是读结果,还能采取行动、拿到反馈、再用反馈更新自己。
一个 coding agent 在沙箱里改一行代码,跑一遍测试,看它失败,再根据失败调整下一步。这已经不只是“看别人怎么做”,而是“我做了 X,于是 Y 发生了”。
这就是干预数据。
Pearl 那道从“看”到“做”的沟,正在被工业化地跨越,而且最先发生在软件世界里。
那么,小脑这条线是不是就没用了?是不是再过几年,模型在沙箱里练够了,大师也就自然出现了?
我不这么看。
因为“从看见到动手”只是第一步。真正麻烦的地方,在更后面。
八、它没死,它被拆成了三件事#
现在回头看,我前面说的“小脑命题”,其实不该被压成一句话。它至少包含三件事。
第一,模型得有干预数据。它要真的能动手,拿到“我做了 X,Y 发生了”的反馈。
这一点,2026 年已经开始满足了。这是今年最大的变化。
第二,干预环境要足够像你真正关心的世界。沙箱里的因果,得和真实场景对得上。
在代码、数学、棋类这些封闭域里,这一点部分成立。规则清楚,奖励可验证,试错成本低。可到了物理世界、医疗、金融生产系统、真实数据库事故,事情就没那么好办。你的 DBA Agent 可以在沙箱里练得很强,但沙箱里永远没有半夜三点那个真实电话,也没有误操作之后真实客户在等恢复。
第三,也是我最在意的一点:干预经验要归属于一个持续存在的个体。
这一万次试错,得累在“这一个它”身上,慢慢改变它自己的判断风格。否则经验只是公共训练材料,不会长成个体历史。
今天的大规模 agentic RL,大体还是另一种流程:成千上万个实例并行探索,经验被收集、汇总、平均、蒸馏进下一个 checkpoint,然后分发给所有副本。
这当然有效。模型会变强。
但经验属于种群,不属于任何一个具体实例。
没有哪个副本因为自己走过一段不可逆的路,而变成一个别人复制不了的“它”。它们共享的是同一个升级包,不是一段各自承担过后果的生活史。
所以小脑命题没有被 2026 年的新进展推翻。它只是被拆开了。
从“看”到“做”的边界,正在被跨过去;从“种群经验”到“个体历史”的边界,还基本没动。
我现在更愿意把真正的墙放在这里:
AI 的经验,能不能变成某一个它自己的历史?
九、那道墙,没人急着去撞#
如果未来几年,agentic RL 一路狂飙,模型在一切可验证领域练到非常强,但个体化这件事仍然没人碰,我们会得到什么?
我想,大概会得到一种全知、失忆、没有身体历史、可以无限复制的旁观者。
它在可陈述领域达到超人级准大师水平,每一个副本都同样优秀,也同样缺少“这个人”的味道。删掉一个,再开一个,没有什么实质差别。因为没有哪个副本被自己的不可逆经历塑造过。
这已经是文明级的大事件。我不是唱衰它。这样的系统在经济上非常好:一致、可控、可复制、可审计,足够重组掉绝大部分知识工作。
但它的形状要看清楚。
个体化这道墙没人急着撞,未必是因为技术上完全撞不动。
一个不可复制、不可回滚、每一个都不一样的系统,在商业上很难卖。你怎么 QA?每个都不同,你测哪个?你怎么批量交付?独一无二的历史没法打包成标准产品。
安全上也麻烦。一个被自己历史塑造、无法完全预测、还不能简单删掉重开的智能体,你怎么对齐?怎么审计?怎么兜底?
所以市场会自然偏向“工具”这个形态。工具好交付,好控制,好复现。能力边界和安全边界,在这里缠在了一起:墙那边可能有真正的大师,也可能有真正难控的系统。
这就很微妙了。
这道墙不只是“我们还没跨过去”,也可能是“我们暂时并不想跨过去”。
尾声:你的那一万小时,机器还没有容器去装#
绕一圈,还是回到开头那个数字。
600 亿。
我们后脑勺底下那块平时不起眼的小脑,占了大半神经元,却并不负责写论文式的思考。它把一具身体、一套环境、一段历史,慢慢刻成一个不可复制的形状。
庖丁十九年不只是学会了“牛的结构”,老 DBA 十年也不只是记住了“数据库手册”。真正沉下来的,是那套连自己都说不太清的手感、节奏、预感和责任。
2026 年最强的 AI,已经读遍人类手册,也开始学着亲手试错了。这是很大的进步。
可它每一次试错,最后大多还是进入公共池子,变成下一代模型的共享能力。它在变强,但还没有变成“某一个它”。
而让你成为“这一个你”的那部分,恰好也是人类最古老的局限:大师会死,手艺会失传,一身本事无法完整复制。我们珍视的独特性,和我们摆脱不了的有限性,是同一件事的两面。
机器追上来的,是显性知识那一半。那一仗其实已经不用再打了。
现在还属于人的,是那一万小时,是不可回滚的后果,是半夜三点的恐惧、误删数据的懊悔、救活系统之后的释然,是被历史刻进身体、连自己都说不清的东西。
是这一个你。
AI 缺的那块,讲到最后,不只是算力。
它缺一具身体,也缺这具身体走过的、不可复制的、属于它自己的历史。








