作者: AI最严厉的父亲
原文链接: https://x.com/dashen_wang/status/2037360754274488659
写于2026年3月。数据是真的,预测是大胆的,悲观的部分是我最不想说对的。
ps:本文又臭又长,但是我还是你坚持读完。给我一个不同的意见。
我认识一个朋友,前几年做短视频博主,做得还不错,几十万粉丝。去年他跟我说,他现在用AI做内容,以前三个人干的事他一个人干,而且做得比以前好。我当时还觉得他在凡尔赛。
上个月我们又聊,他说他现在在考虑怎么"管理"他那几个AI——因为它们开始会自己规划任务了。
我没说什么,但我在想:他用的那个词,"管理",可能很快就会显得天真,就像二十年前有人说"我在管理我的文件夹"一样。那时候人们也觉得那是很认真的事情。
然后我想起另一个朋友。他在某个制造业工厂做质检,一个月六千块,做了八年,很熟练。
去年工厂引入了视觉检测AI,他被调去负责"监督AI",薪资降到了四千八。今年他跟我说,他现在在送外卖,因为工厂那边连"监督AI"的岗位也不需要了。
这两个朋友,一个在往上走,一个在往下走。
而他们之间的距离,正在以一种让人来不及反应的速度变大。
这篇文章,我想说清楚几件事:接下来四年,那些往上走的机会在哪里;那条往下走的路会通向什么地方;以及,如果你有孩子,你现在应该怎么想这件事。
最后这部分,是我最私人的想法,也是我觉得最值得认真对待的部分。
一、先说一个让我久久不能平静的数字
2021年,世界上最聪明的AI,做了一套小学数学题,得了35分。
这不是玩笑,这是OpenAI自己公布的测试数据,测试集叫GSM8K,就是那种"小明有3个苹果,给了小红2个,还剩几个"的题型。最先进的AI,35分。
(GSM8K:Grade School Math 8K,包含8500道小学水平数学应用题的测试集,曾是衡量AI数学推理能力的标准基准之一。)
然后到了2026年,同类型的测试,得分是99分。用了不到五年。
这条曲线的形状不是缓慢爬升,是一根杆子,几乎垂直插进天空——垂直到让出题的人觉得尴尬,这道题现在已经被废弃了,因为它失去了测试意义,就像你不会用"会不会骑自行车"来考驾照一样。
于是他们出了更难的题。
全球几百个领域的顶尖专家联手出了一套"AI绝对通不过"的考试,叫做Humanity's Last Exam,我姑且叫它"人类的最后一块自留地"。
(Humanity's Last Exam,HLE:由全球顶尖专家协作出题的超难考试,涵盖数学、物理、化学、生物、法律等100多个专业领域,设计目标是让AI短期内无法通过。设计规则:只要现有AI能答对某题,就撤换那道题,直到AI彻底答不出来为止。)
2024年底这套题出来的时候,顶尖AI的得分是个位数百分比。
到2026年2月,Claude Opus 4.6拿到了53.1%。
从个位数到超过一半,用了大约一年半。
那帮出题的顶尖专家们,现在大概要认真想想,什么叫"只有人类才能做到的事"。因为他们以为的那条线,正在以他们没有预料到的速度被穿越。
二、在谈预测之前,我要先发明几个词
你记不记得,三年前"Agent"这个词突然就流行起来了?或者"RAG"、"MCP"?这些词在两年前还不存在,或者只有极少数研究员在用,现在已经是科技媒体的日常词汇了。
(Agent:智能体,指能自主规划、执行任务、调用工具的AI系统,不只是回答问题,而是会主动做事。RAG:检索增强生成,让AI能实时调用你私有数据来回答问题的技术。MCP:Model Context Protocol,让AI和各种外部工具互联互通的标准接口,理解成AI的"USB接口"就够了。)
新技术总是先有现象,再造词语。词语跟不上的地方,就是变化正在发生的地方。
我接下来说的这几个词,现在还没有人这么叫,但我猜五年内它们会进教科书。
第一个:编排者经济(Orchestration Economy)
过去,"谁能做"决定了谁有价值。医生有价值是因为他懂医学,程序员有价值是因为他会写代码。执行能力是稀缺的。当AI的执行能力全面溢出,稀缺的就变成了"知道让谁做什么"。编排者,就是那个不一定会做,但知道怎么把一堆AI工具组合起来让整件事完成的人。
第二个:技能蒸发(Skill Evaporation)
每个人都有一些花了多年时间积累的技能。翻译、校对、排版、基础编程、数据整理、客服话术……过去是护城河。技能蒸发,是指这些技能在极短时间内失去市场价值。不是慢慢贬值,是蒸发。蒸发最快的是"有清晰输入输出、可被验证、大量重复"的技能。就像马车夫在1920年代的遭遇,只是速度快了二十倍。
第三个:静默生产(Silent Production)
当Agent可以24小时在后台运行,生产活动就开始在你睡觉的时候发生。你早上起来打开手机,你的AI昨晚写了三篇草稿、处理了十二封邮件、抓取了竞争对手的价格数据。没有人盯着它,它就是在工作。静默生产的规模将在2027年到2028年间变得可被统计。
第四个:意图层(Intent Layer)
现在你用软件的方式是:打开APP,找功能,点击,填表,提交。这个交互模式统治了三十年。意图层是指一个新的范式:你只需要表达你想要什么,有一个系统帮你路由到正确的工具并执行。你在微信里说"帮我把今天的会议录音整理成三条结论发给我老板",它自己调用三个工具,你不需要知道背后发生了什么。意图层一旦成熟,APP时代就会终结。
第五个:薄壳公司(Thin-Shell Company)
人类层极薄,AI基础设施密实——10个人,借助AI Agent和自动化,能支撑起传统意义上需要几百人才能跑通的业务体量。2029年前后会成型。
三、OpenClaw:一个你必须知道的故事
2025年11月的一个深夜,一个叫Peter Steinberger的奥地利开发者——他曾经创办了一家PDF工具公司,软件被装进超过十亿台设备——把WhatsApp的接口和Claude的API连在了一起。
一个小时后,他有了一个能工作的原型:你在WhatsApp上发一条消息,AI在你的电脑上帮你执行任务。
他以为这太简单了,OpenAI或者Anthropic肯定早就做了。他们没有。"大公司做不了这种事。不是技术问题,是组织结构问题。"
2026年1月,他把项目开源。72小时内,6万个GitHub Star。四个月后,超过25万Star——超越React这个全球最流行的前端框架用了整整十年积累的记录,成为GitHub历史上增长最快的开源项目。
这个项目叫OpenClaw。
英伟达CEO黄仁勋3月初评价OpenClaw:"这可能是有史以来最重要的一次软件发布。"他说完11天后,英伟达发布了NemoClaw——专门为OpenClaw构建的企业安全插件。
当世界上最贵的芯片公司为一个诞生四个月的开源项目专门做配套产品,一个新时代的轮廓就清晰了。
OpenClaw回答了一个问题:当AI足够强大的时候,人机交互的入口是什么?
不是APP,不是网站。是你的微信、WhatsApp、Telegram。你发一条消息,AI在你的设备上帮你做事——整理文件、起草邮件、抓取数据、运行代码、定时任务。它24小时不下班,有持久记忆,你睡觉的时候它还在工作。
而OpenClaw的Skill系统(ClawHub平台上已有超过3000个社区开发的功能插件)意味着:AI Agent的边界,由它能调用的工具决定。谁在建造这些工具,谁就在建造明天的基础设施。
四、2027年:第一次让大多数人沉默的时刻
有一套叫SWE-bench的测试,专门检验AI能不能解决GitHub上真实的代码bug。不是玩具题,是需要读懂整个项目逻辑、定位问题、修复、提交的真实工程任务。
2026年初,Claude Code搭配最强模型的得分是80.8%——随机抽一百个真实bug,AI能独立搞定八十多个。据SemiAnalysis统计,Claude Code目前年化收入超过25亿美元,占Anthropic企业营收的一半以上。
预测:2027年Q1,SWE-bench得分将首次突破95%。
初级程序员的岗位,将在2027年进入招聘冻结期。不是裁员潮,是根本不再开新坑。
但反向命题是:会"编排"AI完成复杂工程任务的人,2027年会变得极度稀缺。
他们懂得拆解任务、设计工作流、评估AI输出质量。培养一个这样的人需要三到六个月,不是三到六年——这个差异将让整个行业的人才结构在极短时间内重写。
一人公司时代,2027年正式到来。
不是励志故事,是可复制的方法论。中文互联网上"年入百万的独立开发者"的案例,将从稀有物种变成常见现象。
五、2028年:AI开始帮AI变得更聪明
2028年,AI将首次在没有人类提出假设的情况下,独立发现一个此前未被科学界记录的自然规律,并将其发表。
不是AI写了一篇人类已经知道答案的论文,而是AI自己提出问题,自己设计验证路径,自己得出结论,而这个结论是人类没有想到过的。这个时刻意味着:知识的生产,将不再是人类的专属能力。
广告驱动的互联网,同年开始生病
当越来越多的搜索和决策被AI代劳,传统广告逻辑崩塌。广告主花钱是为了影响人类决策,但如果决策是AI做的,广告往哪里打?
2028年,至少一家主流平台会在财报中第一次把"AI导致的流量结构变化"列为核心风险项。
六、关于工作方式,我有一个非常具体的想象
未来的工作方式不是"人被AI替代",而是人类只做人类的事,AI做生产的事。
想象一个场景,可能就发生在2028年到2029年之间:
三个认识多年的朋友,某个周四下午约在咖啡馆。其中一个说,我最近一直在想一个问题:某个行业的某个环节,现在的解决方式非常低效,如果用某种思路来改造,可能能做出一个有价值的东西。
另外两个人开始反应,一个说我知道这个行业,这个痛点确实存在,另一个说我记得有人做过类似的尝试但失败了,原因是XXX。
就这样,三个人聊了大概两个小时。聊到下午五点,其中一个打开手机,把这两个小时的会议记录发给了自己的AI,加上一句话:"帮我把这个想法变成可执行的方案。"
第二天早上,他收到了一份完整的东西:市场分析、竞品调研、技术可行性评估、产品原型、MVP开发路径、第一批潜在用户名单,以及初步的财务模型。
(MVP:Minimum Viable Product,最小可行产品,以最小成本和时间验证产品核心功能的开发策略。)
那个场景里,三个人做了什么?他们在喝咖啡,在争论,在回忆,在连接彼此的认知。他们在做人类的事:社交、思考、创意、判断。
AI做了什么?执行、检索、分析、整合、生产——所有有清晰标准的工作。
人类最稀缺的,将不再是执行力,而是想法的质量、判断的准确度,以及一个至今仍被严重低估的能力:知道什么时候不该信任AI的结论。
七、2029年:AI从屏幕里爬出来
此前所有变化都发生在数字世界。2029年,溢出了。
人形机器人将在2029年前后越过部署拐点。特斯拉Optimus、Figure AI,加上国内的多家机器人公司,正在快速积累可靠性数据。当一台能完成多种体力任务的机器人成本跌破5万美元,仓库、工厂、物流中心的经营逻辑就会重写。
预测:2029年,全球仓储、物流、基础制造产线的人形机器人部署总量将突破一千万台。