过去一年,AI 编程工具的发展速度远超预期。
从 Cursor 到 Copilot、Claude Code、Codex,再到各种 Agent 产品,越来越多的代码由 AI 完成。作为开发者,你肯定注意到了,AI 正在以前所未有的速度压缩软件开发生命周期(SDLC)。
在前不久谷歌发布的白皮书《The New SDLC With Vibe Coding》中,技术专家 Addy Osmani 联合多位业内专家,剖析了 AI 时代下软件开发流程的变革。
传统的 SDLC 经历了从瀑布流到敏捷开发的数十年演变。而在 2026 年的今天,根据 JetBrains 的数据显示,已有 85% 的专业开发者定期使用 AI 编码工具,近 41% 的新代码由 AI 生成。
当代码的作者逐渐由人类转变为 AI 时,开发者的核心工作,也开始从编码逐渐转向设计系统、管理上下文以及验证结果。
01Agent 的价值不只在于模型本身
在智能体工程中,有一个核心的思维模型:Agent = Model + Harness(智能体 = 模型 + 框架/治理)。
很多人误以为 AI 智能体的能力完全取决于底层大模型,但实际上,真正决定 Agent 能否稳定工作的,是围绕模型构建的一整套工程体系,包括 system 提示词、规则文件(如 AGENTS.md)、工具、MCP 服务器、沙盒环境、任务编排逻辑以及可观测分析。
模型就像汽车发动机,而 Harness 更像整辆汽车框架和配件。发动机再强,没有底盘、方向盘、变速箱,也无法真正上路。
白皮书中指出,Agent 的效果大概取决于 10% 的模型 + 90% 的框架。

在不触动模型的前提下,仅通过优化框架、微调提示词和工具链,就能让智能体在评测基准上的表现大幅跃升。因此,当智能体表现不佳时,优秀的工程师往往会首先去调试和配置它的“框架”。
02上下文工程:决定研发账单的关键
以前的软件工程强调技术架构,而现在更重要的是上下文工程。
如果说框架是系统,那么上下文工程就是其中最重要的控制开关,它直接决定了你每个月的账单。
白皮书将上下文分为静态和动态两类:
- 静态上下文(Static Context):每次调用都会加载,例如全局系统指令、团队规则文件等。它很可靠,但也很昂贵。
- 动态上下文(Dynamic Context):按需加载,例如根据任务匹配的技能组件、RAG 拉取的文档等。你只需为当前任务涉及的 Token 付费。

上下文工程的平衡是一门严谨的架构艺术。
塞入太多无用信息,不仅成本会越来越高,也容易让模型注意力分散。
“渐进式披露(Progressive Disclosure)”也就是按需加载,是目前兼顾深度与成本的最佳实践。
03验证:Vibe Coding 与 Agent 工程的分水岭
很多人理解的 Vibe Coding,就是一句话需求,AI 自动生成代码,然后看看是否能运行成功。但这种方式只适合快速验证想法,并不足以支撑正式的生产级产品。

使用同一个 AI 智能体,你既可以玩转轻松的 Vibe Coding,也可以实施严谨的 Agent 工程。两者的关键区别,在于验证。
- Vibe Coding:依赖直觉和口头提示,验证是可选的,适合快速构建原型。
- Agent 工程:建立在严密的验证体系之上。
验证工作可以分为两部分:
- 测试:负责覆盖输入与输出固定对应的确定性逻辑
- 评估:负责非确定性的 AI 输出。评估又分为“结果评估”(结果是否正确)与“轨迹评估”(推理路径与工具调用是否合理)。
白皮书给出了一句金玉良言:“把标准定在评估上,而不是演示 Demo 上。”。
演示只能证明代码成功过一次,而评估才能证明代码持续可靠。
04软件生命周期正在重新分配重心
AI 对 SDLC 各个阶段的压缩是高度不均衡的。
传统的编码实现阶段已经从“周”缩短到了“小时”。但需求定义、架构设计和最终验证依然顽固地保持着人类的节奏。因为这些工作本质上是判断与决策。
这导致了开发者角色从核心代码作者变成了系统设计师与质量把控者。

在日常工作中,开发者会在两种模式间切换:
- 指挥官模式(Conductor):在 IDE 中进行实时引导,适合探索性开发。
- 编排者模式(Orchestrator):异步给智能体派发诸如代码迁移、测试生成等明确任务,人类只负责最终审查。
当前的 AI 开发依然受制于“二八定律”:智能体能以惊人的速度帮你完成前 80% 的基础功能,但涉及边缘个例、跨系统衔接等最后 20% 核心难点,仍然极度依赖人类的业务上下文。
05经济学视角
AI 并没有让整个软件开发流程变快非常多。
过去开发者需要花大量时间写代码,现在虽然大量实现工作可以交给 Agent,但需求要描述得更加准确,架构设计要提前定义边界和规则,测试验证需要建立更完善的自动评估体系。
换句话说,代码生成越来越便宜,但高质量需求的实现是越来越昂贵的。
Vibe Coding 虽然前期投入极低,但随着软件生命周期的延长,由于缺乏结构化约束,往往会带来惊人的 Token 消耗、重构高昂的理解债务、以及安全漏洞治理成本。
相反,Agent 工程虽然前期需要投入规范、测试和上下文架构的成本,但在后续特征的迭代中,每一项功能的平摊成本都更低。
06最后
正如 Addy Osmani 所说:“AI 会放大它所在工作环境的任何工程热点,无论是好的部分还是坏的部分。”。
未来优秀工程师依然需要掌握技术,但核心竞争力会逐渐转向:
- 将复杂业务抽象成明确需求
- 设计可靠的软件架构
- 管理 Agent 的上下文与协作方式
- 建立自动化验证体系
- 判断 AI 输出是否可信
真正决定团队效率的,是谁能构建出更成熟的 Agent 工程,让 AI 能够持续、稳定、可验证地交付软件。
07推荐阅读
安利一套 AI 动画方案:ChatGPT Image 2 + text-to-lottie Skill
继 Claude 之后,GPT-5.6 也被美国政府限制发布
推特 183w 阅读,Google Gemini 工程师发布深度长文:循环工程 (Loop Engineering)
08参考链接
- https://addyosmani.com/blog/new-sdlc-vibe-coding/