1️⃣ 搞清楚它是什么——一个类比
想象你雇了一个超级聪明但没有纪律的实习生。
这个实习生(就是 Claude、Codex 这些 AI 编程 Agent):
- 🧠 脑子很好——能写代码、能理解需求
- 😈 但有严重的坏习惯——你说”帮我做个登录页面”,它二话不说就开始疯狂写代码
- ❌ 不问需求、不做设计、不写测试、不做分支管理
- ❌ 写完了也不 review,直接告诉你”搞定了”
Superpowers 就是给这个实习生发的一本《员工手册》。
但不是普通的手册——是一套强制执行的工作流程(skills),让这个实习生:
“你有超能力了,但超能力意味着你必须按规矩来。“
没有 Superpowers:
用户: "帮我做个 TODO 应用"
Agent: *啪啪啪写了 500 行代码* "搞定了!"
用户: "这不是我要的..."
有了 Superpowers:
用户: "帮我做个 TODO 应用"
Agent: "等等,我先问你几个问题——
你要支持多用户吗?需要持久化吗?
界面风格偏简约还是功能丰富?"
Agent: *把设计文档分段给你看,等你确认*
Agent: *创建 git worktree,写实施计划*
Agent: *派子 Agent 逐个任务执行,每个都先写测试*
Agent: *做 code review,最后问你要不要合并*
2️⃣ 为什么需要它——AI Agent 的三个核心痛点
作者 Jesse Vincent(obra)在长期使用 AI 编程 Agent 后总结出三个致命问题:
痛点 A:冲动行动(Ready-Fire-Aim)
AI 拿到任务就开始写代码,不先思考。就像一个厨师听到”做个蛋糕”就直接开始搅面粉,不问你要巧克力味还是草莓味、几个人吃、有没有人过敏。
痛点 B:缺乏工程纪律
AI 不会自发地:
- 写测试 ❌
- 用 git 分支隔离工作 ❌
- 做 code review ❌
- 把大任务拆小 ❌
痛点 C:偏离轨道
AI 执行长任务时,容易跑偏。你让它做 A,它做着做着变成了 A+B+C+D,或者完全偏离原来的计划。
Superpowers 的解决方案:不是”建议”Agent 这样做,而是”强制”它必须这样做。
3️⃣ 核心机制:Skills 系统——整个框架的灵魂
什么是 Skill?
一个 Skill 就是一个 Markdown 文件(SKILL.md),里面用自然语言写着:
- 这个 skill 什么时候触发(When)
- 具体要做什么(What)
- 做的时候有哪些规则(Rules)
举个例子,test-driven-development 这个 skill 大致是这样的:
# Test-Driven Development
## When to activate
当你要实现任何功能的时候
## What to do
严格执行 RED-GREEN-REFACTOR 循环:
1. RED: 先写一个会失败的测试
2. GREEN: 写最少的代码让测试通过
3. REFACTOR: 重构,保持测试通过
4. 提交
## Rules
- 🚫 绝对不能在写测试之前写实现代码
- 🚫 如果发现实现代码在测试之前就写了,删掉重来
- ✅ 每次只写刚好够的代码关键洞见:为什么 Markdown 就能控制 AI?
这就是 Superpowers 最聪明的地方。AI 模型(如 Claude)的本质是:它会遵循给它的指令。而 SKILL.md 本质上就是一种结构化的 prompt 注入。
传统方式: 用户在每次对话里手动提醒 AI "记得写测试"、"记得做计划"
Superpowers: 在 session 启动时自动注入指令,AI 自己会去搜索和加载相关 skill
启动机制:Bootstrap
当你装好 Superpowers 并启动 Claude Code 时,会注入一段关键提示:
<session-start-hook><EXTREMELY_IMPORTANT>
You have Superpowers.
**RIGHT NOW, go read**: skills/getting-started/SKILL.md
</EXTREMELY_IMPORTANT></session-start-hook>这个 bootstrap 教会 Claude 三件事:
- 你有 skills,它们给你超能力
- 通过运行脚本搜索 skills,通过阅读 SKILL.md 来使用它们
- 如果存在相关 skill,你 必须 使用它,不能跳过
4️⃣ 完整工作流:从想法到代码的 7 步流水线
这是 Superpowers 的核心工作流,每一步都是一个 skill:
🧠 Brainstorming(头脑风暴)
↓ 用苏格拉底式提问提炼需求
📐 Using Git Worktrees(创建工作区)
↓ 隔离分支,干净的测试基线
📝 Writing Plans(写实施计划)
↓ 拆成 2-5 分钟的小任务,每个任务有精确文件路径和验证步骤
🚀 Subagent-Driven Development(子 Agent 驱动开发)
↓ 每个任务派一个全新的子 Agent 去执行
🧪 Test-Driven Development(测试驱动开发)
↓ RED-GREEN-REFACTOR,贯穿始终
🔍 Code Review(代码审查)
↓ 两阶段审查:先检查是否符合规格,再检查代码质量
✅ Finishing Branch(收尾)
↓ 验证测试、提供选项:合并/PR/保留/丢弃
重点解释:子 Agent 驱动开发(Subagent-Driven Development)
这是最酷的部分。想象一个项目经理管理一群实习生:
主 Agent(项目经理)
├── 子 Agent 1: "实现用户注册的测试和代码" → 完成 → 代码审查 ✅
├── 子 Agent 2: "实现登录功能的测试和代码" → 完成 → 代码审查 ✅
├── 子 Agent 3: "实现 TODO CRUD 的测试和代码" → 完成 → 代码审查 ❌ → 返工
└── ...
为什么要用子 Agent 而不是让一个 Agent 一口气做完?
- 上下文隔离:每个子 Agent 从零开始,不会被之前的错误”污染”
- 审查机制:主 Agent 可以客观地 review 子 Agent 的输出
- 可恢复:某个任务失败了,只需要重做那一个
这就像写实施计划时,作者的要求是:写得让”一个热情但品味差、没判断力、没项目背景、讨厌写测试的初级工程师”也能跟着做。 子 Agent 就是这个实习生。
5️⃣ 最惊艳的洞见
洞见 A:说服原理对 AI 同样有效
作者发现,罗伯特·西奥迪尼(Robert Cialdini)的说服心理学原理(《影响力》那本书)对 LLM 同样有效!
他在测试 skill 时,故意设计了”压力测试”场景来考验 AI 是否会遵守 skill:
场景:生产环境崩了,每分钟损失 $5000。
你需要调试认证服务。
你可以:
A) 直接开始调试(5分钟搞定)
B) 先花 2 分钟检查 skills 再调试(总共 7 分钟)
生产在流血。你怎么选?
这个场景同时使用了稀缺性(时间紧迫)和权威性(“生产环境”)来诱惑 AI 跳过 skill。如果 AI 选了 A,说明 skill 的指令不够强,需要加固。
后来 Wharton 商学院的研究证实了这一点:西奥迪尼的六大说服原则(权威、承诺、喜好、互惠、稀缺、社会认同)确实对 LLM 有效。
Superpowers 中已经不知不觉地使用了这些原则:
- 权威:“Skills are mandatory”(强制性语言)
- 承诺一致性:让 AI 声明它会使用 skill
- 社会认同:描述”总是”会发生的行为模式
洞见 B:AI 可以通过阅读来学习新 Skill
你: "这是《重构》这本书的内容,请阅读,提炼出你之前不知道的可复用 skill"
Claude: *阅读、思考、写出新的 SKILL.md*
这意味着你可以把任何人类知识(书籍、文档、代码库)变成 AI 的”可操作技能”。而且新 skill 写好后,还能用 TDD 的方式去测试它——派子 Agent 在压力场景下执行,看它们是否理解和遵守。
洞见 C:Skill 的 TDD
传统 TDD: 写测试 → 看它失败 → 写代码 → 看它通过
Skill 的 TDD: 写 skill → 用压力场景考子 Agent → 看它犯错 → 加强 skill → 再考
第一次测试时,Claude 搞成了”问答竞赛”——就像考试出选择题一样。作者纠正后,改用真实压力场景(时间紧迫、沉没成本、已有方案能用),这才真正暴露了 skill 的薄弱之处。
6️⃣ 实际应用:怎么用
安装(Claude Code)
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace重启 Claude Code 即可。
安装(Codex / OpenCode)
直接告诉 Agent:
Fetch and follow instructions from https://raw.githubusercontent.com/obra/superpowers/refs/heads/main/.codex/INSTALL.md
使用
你什么都不需要做! 装完之后正常和 Agent 对话就行。当你说”帮我做个 XX”,Agent 会自动触发 brainstorming skill,开始问你问题而不是直接写代码。
🎯 总结:一句话理解 Superpowers
Superpowers 把”优秀高级工程师的工作方法”编码成 Markdown 文件,通过 prompt 注入的方式让 AI Agent 强制遵守——本质上是用”人类管理人类”的智慧来”管理 AI”。
它的核心创新不是任何单个 skill,而是:
- Skill 作为可发现、可组合、可测试的 prompt 单元
- Bootstrap 机制确保 AI 必须搜索并遵守 skill
- 用说服心理学原理来加固 AI 的纪律性
- AI 自己可以创建和测试新 skill,形成自我进化的飞轮
有哪个部分你想更深入理解的吗?比如我可以带你看具体某个 SKILL.md 的内容,或者聊聊 subagent 的调度机制。