来源: Dan McAteer @ X 视频原文: https://youtu.be/kwSVtQ7dziU
核心思想
Karpathy 的核心观点只有一句话:当 AI Agent 不好用时,99% 是你的问题,不是模型的问题。
这 10 条洞察,本质上是在教你如何从”写代码的人”升级为”调度 AI 的人”。
1. 用”宏观动作”思考,而不是”一行代码”
你是指挥官,不是士兵。
以前思考的是”这一行怎么写”,现在思考单位应该是”这个功能交给哪个 Agent”。
怎么做:
- 把屏幕分成多个窗口,每个窗口跑一个 Agent
- 把互不冲突的任务并行分配给不同 Agent
- 你只负责分配任务、审查结果、整合输出
类比: 就像项目经理,不再自己写文档,而是把不同模块分给不同人同时推进。
2. 出了问题,先怀疑自己
刀不快,别怪铁不好。
当 Agent 没给出你想要的结果,第一反应不是”模型太烂”,而是问自己:
- 我的 prompt 写清楚了吗?
- 我的
AGENTS.md/CLAUDE.md指令文件够不够详细? - 我的工具配置(记忆、上下文)有没有问题?
- 我的任务编排逻辑合理吗?
Karpathy 原话: “当它不好用时,感觉就是技术不到位(skill issue)。“
3. 把自己从瓶颈中移除
好的系统不需要你时刻守着。
如果 Agent 每做一步都要等你来 prompt 下一步,那你就是瓶颈。真正的杠杆效应是:
你偶尔输入很少的 token,却让大量的事情自动发生。
怎么做:
- 设计完全自主的 Agent 工作流,减少人工介入节点
- 让 Agent 自己决定下一步,而不是等你指令
- 你的精力用在”启动”和”验收”,不是”过程监控”
Karpathy 自己的例子: 把整个智能家居统一到一个 WhatsApp agent。“我回家了” → agent 自动协调灯光、温度、音乐。
4. 培养 Agent 编排的”肌肉记忆”
这是一门需要刻意练习的新技能。
管理多个 Agent 就像学开车 —— 刚开始很别扭,熟练后自然而然。你需要练习的是:
- 如何在屏幕上合理分配多个 Agent 窗口
- 形成”分配任务 → 等待 → 审查 → 整合”的节奏感
- 判断哪些任务该并行,哪些该串行
5. 把指令文件(AGENTS.md)当成可调优的代码
你的 markdown 指令文件,本质上是在给 AI 编程。
CLAUDE.md、AGENTS.md 这类文件不是写完就扔的文档,而是你和 Agent 之间的接口定义,需要持续迭代:
- 不同的指令措辞会产生截然不同的行为
- 可以 A/B 测试不同版本,看哪个效果更好
- 甚至可以让 Agent 帮你优化指令本身(元优化)
类比: 就像调超参数 —— 写好指令文件,就是在调模型的”行为超参”。
6. 用 Agent + API 替代一堆独立的 App
不要登录 6 个不同的管理后台,用一个 Agent 统一搞定。
思路转变:
- 以前:每个工具有自己的 UI,你手动操作
- 现在:工具暴露 API,Agent 负责调度,你只说”我要什么”
适用场景: 数据查询、工单系统、监控报警、内容发布……凡是有 API 的,都可以被 Agent 整合。
7. 投资于持久运行、循环执行的 Agent
让 Agent 在你睡觉时也在工作。
单次对话式的 Agent 只是入门。更高级的玩法是:
- Agent 有自己的沙箱环境
- 能跨会话记住上下文(持久化记忆)
- 持续循环执行,不需要你每次重新启动
- 出问题时能自动恢复
类比: 从”随叫随到的助手”升级为”有自己工作节奏的员工”。
8. 模型能力是”锯齿状”的,不是均匀的
AI 很擅长有标准答案的事,但在模糊判断上很弱。
| 擅长的任务 | 不擅长的任务 |
|---|---|
| 写代码、跑测试 | 讲笑话、理解微妙语气 |
| 可验证的逻辑推理 | 创意审美、意图揣摩 |
| 格式化、转换数据 | 非验证性的主观判断 |
实践建议: 设计工作流时,把 AI 擅长的部分交给它,把需要”人类判断”的节点留给自己。
9. 为 Agent 写文档,而不是为人类写文档
文档的读者变了,写法也要变。
传统文档是给人读的(HTML、图文并茂)。现在,如果你的代码库有供 Agent 理解的 Markdown 文档,Agent 就能:
- 自动向任何人解释代码逻辑
- 根据不同受众用不同语言表达
你的价值变了: 你不再需要写”能让人看懂”的文档,而是提炼模型自己无法生成的核心洞察,其余的都交给 Agent 去解释。
10. 只把精力放在 Agent 做不到的事上
AI 能做的,迟早比你做得更好。你的时间要用在刀刃上。
你的不可替代价值:
- 创意直觉(知道什么值得做)
- 品味判断(什么是好,什么是烂)
- 全新的问题框架(提出别人没想到的方向)
凡是 Agent 能做的,就大胆交出去。你要专注的,是那个模型暂时还无法生成的”第一个想法”。
总结
你的角色转变:
代码执行者 → 任务编排者 → 方向决策者
能力建设路径:
1. 学会并行分配任务(第1、4条)
2. 打磨工作流,让自己不是瓶颈(第3、7条)
3. 把指令文件当代码迭代(第5条)
4. 用 Agent 整合工具链(第6条)
5. 了解模型边界,扬长避短(第8条)
6. 重新定义自己的价值(第2、9、10条)
最后一句话: 如果你觉得 AI Agent 没用,大概率是 skill issue。