今年三月,一个团队在内部复盘时发现了一个让人笑不出来的数据:AI 辅助后,团队 PR 数量涨了 98%,但代码评审时间涨了 91%。成员的个人交付速度确实快了,可反映到最终产出上,实际发版的频率几乎没有变化。

这不是个例。DX 在 2025 年 Q4 对 5.1 万名开发者的调研发现,每天用 AI 的开发者确实多合入了 60% 的 PR。但另一份基于 3 家企业的随机对照试验显示,拿到 AI 工具的团队,每周完成任务量只多了 26%。更扎心的是 METR 的 RCT:开发者觉得自己快了 20%,实际反而慢了 19%。

“代码生成只需 5 分钟,评审却要 5 天”,这句话正在从段子变成很多团队的日常。

团队成员各自为战

AI 编程助手带来的直观印象:既然每个人都能靠 AI 补齐短板、十倍速产出,那团队就该各干各的,把效率拉满。

这个逻辑的前半段是对的。GitHub 和 McKinsey 的联合研究确认,AI 让开发者在明确的任务上快了 20% 到 56%。当你不再需要等另一个人的时间,一个人加一个 AI 确实能顶一个小团队。

但问题出在"各干各的"这几个字上。每个人都在本地调教自己的 AI 工厂,产出的代码量在爆炸,但团队对这些代码的理解并没有同步增长。更麻烦的是,每个人和 AI 的"合作方式"都不一样——有人习惯让 AI 先写再改,有人习惯手写骨架再让 AI 填充,有人直接让 AI 全权代理。这些代码放在各自的上下文里都没问题,合到一起的时候,风格不一致、架构假设冲突、隐式的技术债务就全冒出来了。

CodeRabbit 分析了 470 个 AI 辅助开发的开源 PR,发现 AI 参与的 PR 里,问题密度比纯人工代码高出 70%:逻辑错误多了 75%,可读性问题多了 3 倍,安全漏洞——跨站脚本多了 200%,不安全的直接对象引用多了 91%。卡内基梅隆 2026 年的 MSR 论文进一步确认,AI 采用后,静态分析警告增加了 30%,代码复杂度增加了 41.6%。

代码量涨了,但每段代码需要被评审的力度也涨了。结果是评审环节压垮了团队。一位工程主管在内部总结里写:"我们往发动机里灌了 10 倍的燃料,但传动系统还是原来的。"

瓶颈永远是对齐

2026 年 5 月的 arXiv 论文正式把这种现象命名为"生产力-可靠性悖论":个体层面的效率提升,不会自动转化为系统层面的产出增长。论文识别出三个调节变量——任务抽象层级、代码库成熟度、开发者经验——以及两个放大机制:代码评审成了卡点,以及模型上下文窗口的限制。

换句话说,当"打字"的成本趋近于零,软件开发真正的约束就不在写代码这一侧了。

那是什么?

是团队认知同步。是对架构决策的共同理解。是在没有沟通成本的前提下,确保每个人产生的代码往同一个方向去。这些东西曾经被"写代码很慢"这个事实掩盖了——以前你写一行的时间,足够跟旁边的人说清楚这行为什么这么写。现在你五秒钟生成了一百行,旁边的人还不知道你在改什么。

这恰好解释了为什么高绩效团队开始以一种新的方式回归集体编程(Mob Programming)。不是一群人围着一台机器轮流打字那种老形式,而是"以 AI 为成员"的新型协作。

Scania / TRATON 集团在 2025 年公开了他们称为 Mob AI 的实践:一个人共享屏幕作为 driver,一个人导航,其余人观察和调试,而一个 LLM 作为随时可用的成员——生成脚手架、解释 API、调试错误、重构代码。团队描述说:“就像结对编程,但你的搭档是一个 AI。“这种模式帮助初级工程师快速成长为全栈 AI 工程师。

Mob Programming 的先驱 Woody Zuill 在 2025 年 8 月的播客中专门讨论了 AI 对协作的影响。他的观点是:AI 不会替代人类协作,但会改变协作的形态——焦点从"一起写代码"转向"一起决定写什么”。另一位实践者在 2026 年 1 月的博客里说得更直接:他现在几乎不再用手写代码的方式进行 mob session 了,取而代之的是 swarm——一群人聚在一起对齐方向,AI 去落地。团队花在需求和架构讨论上的时间变多了,花在实现细节上的时间变少了。

看起来 Mob Programming 在做一件反直觉的事:在每个人都能独立产出更多代码的时候,反而把更多人拉回同一个屏幕前。但仔细想就合理了。当代码生成不再稀缺,对齐和理解就成了稀缺资源。集体编程不是低效的复古,而是在换了一条腿走路。

独立开发者也绕不开对齐问题

上面说的都是团队场景。独立开发者没有队友,没有人跟他对不齐——那他是不是就没有这个问题了?

是,也不是。

没有团队内部的对齐问题了,但出现了另一个问题:一个人和 AI 生成的上万行代码之间的对齐问题。

独立开发者面临的场景是:你一个人用 AI 飞快地搭建了一个项目,AI 生成了 80% 甚至 90% 的代码。这些代码你逐行读过,每一行都懂了,但你未必能说清整个系统的架构是什么——因为你不是"写"出来的,你是"审"出来的。你知道每一块砖长什么样,但不知道整栋楼的结构。

更麻烦的是,三个月后系统需要加功能,你打开自己写的代码,发现完全不知道从哪下手。因为你没有经历那些代码从零到一的决策过程。AI 替你做了大多数决策,而你没有把这些决策记录下来。

一个最直接的例子:有独立开发者连续用 Claude Code 重度开发了两周,结果发现月底算力账单够买一台 MacBook——但他甚至说不清这些算力花在了哪些决策上。

破局的关键在于:既然写代码不再是瓶颈,那就把省下来的时间花在那些曾经被压缩的事情上。

做的事情变少,而不是变多。 个人的吞吐量是有限的,AI 能让你在同样时间内写出更多代码,但并不代表你应该这样用。它真正的杠杆在于让你从"怎么实现"中抽身出来,把更多精力放在"为什么要实现"和"这样实现对不对"上。一个能帮你省 50% 编码时间的工具,如果让你花更多时间在无效代码上,那它并没有真正帮你省时间。

把架构文档当作代码来写。 独立开发者最容易跳过的事情就是文档——反正代码是我写的,我看得懂。但在 AI 时代,你的"合作者"是 AI,它不读你的脑图。把关键决策、架构假设、模块边界写清楚,不止是为了未来的自己,更是为了让 AI 在生成后续代码时不会偏离方向。某种意义上,架构文档是你给 AI 的"系统提示”。

建立自己的验证流水线。 独立开发者的评审环节不是别人来做的,但也不应该靠肉眼来替代。自动化测试、静态分析、安全检查——这些在团队里通常由评审流程强制保证的东西,在单兵作战时更需要制度化。不是因为代码质量更重要了,而是因为代码量和复杂度涨了,人眼已经跟不上了。JetBrains 在 2026 年 5 月提到,大约 20% 到 25% 的 AI 幻觉可以通过自动化的结构分析和静态分析在提交前捕获。这意味着你只需要在提交前多加几步自动化检查,就能避免大量后期返工。

主动管理上下文,而不是被动接收 AI 的输出。 独立开发者最大的风险是被 AI 的输出带着走——AI 很擅长生成看起来合理的代码,但它不知道你正在解决的问题的全貌。每次让 AI 生成代码前,先问自己:我有没有把当前任务的边界、约束和验收标准说清楚?如果答案是否定的,AI 的代码大概率需要返工。

写代码从来不应该是瓶颈

回头看,“每个开发者都是一支军队"这个说法在对的方向上迈了一步,但停在了一个危险的位置。AI 确实让个人具备了军队级别的火力,但军队除了火力还有指挥系统、情报系统和后勤保障——这些对应的恰恰是认知同步、架构决策和验证流水线。

那些在 AI 时代真正跑得更快的团队和个人,不是把 AI 当作打字加速器的人。他们找到了一件事:当写代码的成本趋近于零,真正值钱的是那些成本没有变零的东西。


欢迎关注我的公众号,第一时间获取最新文章。