Karpathy：与 AI Agent 协作的 10 条实战洞察

来源: Dan McAteer @ X 视频原文: https://youtu.be/kwSVtQ7dziU

核心思想

Karpathy 的核心观点只有一句话：当 AI Agent 不好用时，99% 是你的问题，不是模型的问题。

这 10 条洞察，本质上是在教你如何从”写代码的人”升级为”调度 AI 的人”。

1. 用”宏观动作”思考，而不是”一行代码”

你是指挥官，不是士兵。

以前思考的是”这一行怎么写”，现在思考单位应该是”这个功能交给哪个 Agent”。

怎么做：

把屏幕分成多个窗口，每个窗口跑一个 Agent
把互不冲突的任务并行分配给不同 Agent
你只负责分配任务、审查结果、整合输出

类比： 就像项目经理，不再自己写文档，而是把不同模块分给不同人同时推进。

2. 出了问题，先怀疑自己

刀不快，别怪铁不好。

当 Agent 没给出你想要的结果，第一反应不是”模型太烂”，而是问自己：

我的 prompt 写清楚了吗？
我的 AGENTS.md / CLAUDE.md 指令文件够不够详细？
我的工具配置（记忆、上下文）有没有问题？
我的任务编排逻辑合理吗？

Karpathy 原话： “当它不好用时，感觉就是技术不到位（skill issue）。“

3. 把自己从瓶颈中移除

好的系统不需要你时刻守着。

如果 Agent 每做一步都要等你来 prompt 下一步，那你就是瓶颈。真正的杠杆效应是：

你偶尔输入很少的 token，却让大量的事情自动发生。

怎么做：

设计完全自主的 Agent 工作流，减少人工介入节点
让 Agent 自己决定下一步，而不是等你指令
你的精力用在”启动”和”验收”，不是”过程监控”

Karpathy 自己的例子： 把整个智能家居统一到一个 WhatsApp agent。“我回家了” → agent 自动协调灯光、温度、音乐。

4. 培养 Agent 编排的”肌肉记忆”

这是一门需要刻意练习的新技能。

管理多个 Agent 就像学开车 —— 刚开始很别扭，熟练后自然而然。你需要练习的是：

如何在屏幕上合理分配多个 Agent 窗口
形成”分配任务 → 等待 → 审查 → 整合”的节奏感
判断哪些任务该并行，哪些该串行

5. 把指令文件（AGENTS.md）当成可调优的代码

你的 markdown 指令文件，本质上是在给 AI 编程。

CLAUDE.md、AGENTS.md 这类文件不是写完就扔的文档，而是你和 Agent 之间的接口定义，需要持续迭代：

不同的指令措辞会产生截然不同的行为
可以 A/B 测试不同版本，看哪个效果更好
甚至可以让 Agent 帮你优化指令本身（元优化）

类比： 就像调超参数 —— 写好指令文件，就是在调模型的”行为超参”。

6. 用 Agent + API 替代一堆独立的 App

不要登录 6 个不同的管理后台，用一个 Agent 统一搞定。

思路转变：

以前：每个工具有自己的 UI，你手动操作
现在：工具暴露 API，Agent 负责调度，你只说”我要什么”

适用场景： 数据查询、工单系统、监控报警、内容发布……凡是有 API 的，都可以被 Agent 整合。

7. 投资于持久运行、循环执行的 Agent

让 Agent 在你睡觉时也在工作。

单次对话式的 Agent 只是入门。更高级的玩法是：

Agent 有自己的沙箱环境
能跨会话记住上下文（持久化记忆）
持续循环执行，不需要你每次重新启动
出问题时能自动恢复

类比： 从”随叫随到的助手”升级为”有自己工作节奏的员工”。

8. 模型能力是”锯齿状”的，不是均匀的

AI 很擅长有标准答案的事，但在模糊判断上很弱。

擅长的任务	不擅长的任务
写代码、跑测试	讲笑话、理解微妙语气
可验证的逻辑推理	创意审美、意图揣摩
格式化、转换数据	非验证性的主观判断

实践建议： 设计工作流时，把 AI 擅长的部分交给它，把需要”人类判断”的节点留给自己。

9. 为 Agent 写文档，而不是为人类写文档

文档的读者变了，写法也要变。

传统文档是给人读的（HTML、图文并茂）。现在，如果你的代码库有供 Agent 理解的 Markdown 文档，Agent 就能：

自动向任何人解释代码逻辑
根据不同受众用不同语言表达

你的价值变了： 你不再需要写”能让人看懂”的文档，而是提炼模型自己无法生成的核心洞察，其余的都交给 Agent 去解释。

10. 只把精力放在 Agent 做不到的事上

AI 能做的，迟早比你做得更好。你的时间要用在刀刃上。

你的不可替代价值：

创意直觉（知道什么值得做）
品味判断（什么是好，什么是烂）
全新的问题框架（提出别人没想到的方向）

凡是 Agent 能做的，就大胆交出去。你要专注的，是那个模型暂时还无法生成的”第一个想法”。

总结

你的角色转变：
  代码执行者  →  任务编排者  →  方向决策者

能力建设路径：
  1. 学会并行分配任务（第1、4条）
  2. 打磨工作流，让自己不是瓶颈（第3、7条）
  3. 把指令文件当代码迭代（第5条）
  4. 用 Agent 整合工具链（第6条）
  5. 了解模型边界，扬长避短（第8条）
  6. 重新定义自己的价值（第2、9、10条）

最后一句话： 如果你觉得 AI Agent 没用，大概率是 skill issue。

🪴 Quartz 4.0

Explorer