Andrej Karpathy 10 月还在说 AI 编程是"slop",12 月就说自己"从未如此落后"。DHH 夏天还拒绝让 AI 写代码,年底说这是互联网之后最让人兴奋的事。这两个月里发生了什么?
软件工程正经历一次不可逆的重构。触发它的是 2025 年 11—12 月三个模型跨过了一条看不见的能力线。最有说服力的证据来自人类行为学:行业里最有名的怀疑者,在两个月内集体改变了立场。
速度本身就是信号
"AI 能写代码"早就不算新闻了。真正的新闻是:行业里辨识度最高、也最难被说服的那批人,几乎同时改变了立场。Gergely 用一连串具名的人物转变构建了一条证据链。
Andrej Karpathy——OpenAI 联合创始人,以对 AI 工具的坦率批评著称。看看他在两个月里说了什么:
从"slop"到"skill issue",中间只有两个月。态度翻转的速度本身就说明问题——一个深思熟虑的人不会在两个月里慢慢改变主意,只会在某一天突然觉得自己落后了。
There's a new programmable layer of abstraction to master in addition to the usual layers involving agents, subagents, their prompts, contexts, memory, modes, permissions, tools, plugins, skills, hooks, MCP, LSP, slash commands, workflows, IDE integrations, and a need to build an all-encompassing mental model for strengths and pitfalls of fundamentally stochastic, fallible, unintelligible and changing entities suddenly intermingled with what used to be good old fashioned engineering.
Karpathy 不是个例。文章记录了同一时期一批具名工程领袖的同向转变:
Just last summer, I spoke with Lex Fridman about not letting AI write any code directly, but it turns out part of this resistance was simply based on the models not being good enough at the time! I spent more time rewriting what it wrote, than if I'd done it from scratch. That has now flipped.
For more than 15 years, I thought I loved writing code, loved typing out code by hand, and loved the "cadence of typing"... Now, I'm not so sure. What I learned over the course of the year is that typing out code by hand now frustrates me.
Any time I have to type precise syntax by hand now feels like such a tedious chore. Surprisingly and thankfully, programming is still fun, probably more fun. My biggest problem now is coming up with enough worthwhile ideas to fully leverage the productivity boost.
Y'all have to throw away your priors. The cost of software production is trending towards zero.
为什么偏偏是 2025 年末
那么是什么触发了这次集体转变?答案指向一个极其紧凑的时间窗口——2025 年 11 到 12 月,三家公司在 24 天内先后发布了各自最强的编程模型:
三个独立团队几乎同时跨过同一条线——这本身就是信号。当底层能力(训练数据规模、算力、算法改进)到达某个阈值时,独立团队会同时涌现出相似水平的能力。典型的 simultaneous discovery。
It genuinely feels to me like GPT-5.2 and Opus 4.5 in November represent an inflection point — one of those moments when the models get incrementally better in a way that tips over an invisible capability line. Suddenly, a whole bunch of much harder coding problems open up.
Simon Willison 的措辞很精准——"incrementally better in a way that tips over an invisible capability line"。模型一直在变好,但在某个节点上,量变突然翻成了质变。
Peter Steinberger(PSPDFKit 创建者,~20 年工程经验)提供了一个微观视角。他建了一个自定义 CLI 工具叫"oracle",专门在 AI agent 卡住时介入帮助:
从"每天多次卡住"到"几乎什么都能一次搞定"——这种日常使用中的体感变化,比任何基准测试都直接。
散落在文章各处的关键数字,摆到一起看
Boris Cherny(Claude Code 创建者)给出了最具体的数字:
The last month was my first as an engineer when I didn't open an IDE at all. Opus 4.5 wrote around 200 PRs, every single line. Software engineering is radically changing, and the hardest part even for early adopters and practitioners like us is to continue to re-adjust our expectations. And this is *still* just the beginning.
Gergely 在文章开头用了一段不起眼的个人经历,但细看信息量不小:
2025 年 3 月,Anthropic CEO Dario Amodei 说:
I think we will be there in three to six months, where AI is writing 90% of the code. And then, in 12 months, we may be in a world where AI is writing essentially all the code.
当时多数人——包括 Gergely——把这当成 CEO 的惯性乐观。9 个月后回头看,它更像是提前泄露了剧本。
按扎心程度排列,越往下越难接受
Gergely 列出了一系列正在失去市场溢价的技能。以下按"反共识程度"重新排序——先从容易接受的开始:
Shaquille O'Neal 在 Replit 的广告中 vibe-coded 了一个应用。当 NBA 退役球星都能用自然语言搭原型时,"能快速搭 demo"不再是工程师的差异化能力。产品经理、设计师、业务人员都可以自己做原型了——工程师的差异化要往后挪——从"能做出来"移到"做出来之后怎么让它可靠地运行在生产环境中"。
过去精通多种编程语言是明确的职业溢价——Go 团队偏好有 Go 经验的人,Rust 同理。但当 AI 可以在任何语言中立即产出还不错的代码时,"我精通五种语言"变得和"我打字速度 120 WPM"一样——不再是决定性优势。
Gergely 说他"很难想象初创公司还会分别招前端和后端开发者"。逻辑链:后端工程师现在可以 prompt 出还不错的前端代码,反之亦然 → AI 成了跨栈的桥梁 → 初创公司只需招"用 AI 能跨栈搞定事情的人",不再按技术栈切分岗位。
Cursor 团队已经在做的事:所有 Linear ticket 自动传给 Cursor,AI one-shot 出一个实现,开发者决定合并还是迭代。当"拿到需求 → 写代码"这个环节被自动化,在层级分明的组织里长期存在的"PM 写 ticket → 开发者执行"模式就触到了存在危机。
手动重构会比用自然语言描述"我要什么样的重构"然后让 AI 执行慢得多。传统 IDE 的重构功能(重命名、提取函数)已经在走这条路,AI 只是把它推到了极致。当然,大规模重构仍有 AI 搞砸的风险——这也是为什么验证能力变得比编写能力更重要。
Peter Steinberger(PSPDFKit 创建者,~20 年经验)直接说了:
These days, I don't read much code anymore. I watch the stream and sometimes look at key parts, but I gotta be honest, most code I don't read. I do know where components are and how things are structured, and how the overall system is designed; that's usually all that's needed.
注意他的替代策略:不读具体代码,但清楚组件在哪里、结构是什么、整体系统怎么设计。抽象层级上移了——从"这行代码做什么"到"这个系统的架构是什么"。
他还提到了一个微妙的转变:选技术栈的第一变量变了。
写代码的复杂度下降了,但总复杂度并没有减少——它搬家了
Karpathy 12 月那段话里有一串令人窒息的名词清单。他其实在试图给一个全新的认知层画地图:
16 个概念,大部分一年前还不存在。它们构成了一个全新的可编程抽象层。老一层(编辑器 + 编译器 + 调试器)是确定性的,文档完善,30 年没怎么变过。新一层完全是另一种东西:
Clearly some powerful alien tool was handed around, except it comes with no manual and everyone has to figure out how to hold and operate it while the resulting magnitude 9 earthquake is rocking the profession.
"Alien tool"——你拿到了一件从没见过的工具,形状诡异,还会自己变形。你得一边弄清楚怎么握住它,一边用它干活,一边脚下的地在震。
文章付费部分的核心论点——从标题和导言摘要中提取
文章后半部分展开了硬币的另一面。Gergely 在导言中已给出了核心论点:
Gergely 点名了三个升值方向:
Gergely 的文章提供了一样稀缺的东西:一个精确的时间戳。2025 年 11—12 月,行业里最冷静的那批人在 8 周内完成了从怀疑到拥抱的转变。Karpathy 的轨迹就是整个行业的缩影。他 10 月的位置,还是 12 月的位置——你现在站在哪里?