来源: Dan McAteer @ X 视频原文: https://youtu.be/kwSVtQ7dziU


核心思想

Karpathy 的核心观点只有一句话:当 AI Agent 不好用时,99% 是你的问题,不是模型的问题。

这 10 条洞察,本质上是在教你如何从”写代码的人”升级为”调度 AI 的人”


1. 用”宏观动作”思考,而不是”一行代码”

你是指挥官,不是士兵。

以前思考的是”这一行怎么写”,现在思考单位应该是”这个功能交给哪个 Agent”。

怎么做:

  • 把屏幕分成多个窗口,每个窗口跑一个 Agent
  • 把互不冲突的任务并行分配给不同 Agent
  • 你只负责分配任务、审查结果、整合输出

类比: 就像项目经理,不再自己写文档,而是把不同模块分给不同人同时推进。


2. 出了问题,先怀疑自己

刀不快,别怪铁不好。

当 Agent 没给出你想要的结果,第一反应不是”模型太烂”,而是问自己:

  • 我的 prompt 写清楚了吗?
  • 我的 AGENTS.md / CLAUDE.md 指令文件够不够详细?
  • 我的工具配置(记忆、上下文)有没有问题?
  • 我的任务编排逻辑合理吗?

Karpathy 原话: “当它不好用时,感觉就是技术不到位(skill issue)。“


3. 把自己从瓶颈中移除

好的系统不需要你时刻守着。

如果 Agent 每做一步都要等你来 prompt 下一步,那你就是瓶颈。真正的杠杆效应是:

你偶尔输入很少的 token,却让大量的事情自动发生。

怎么做:

  • 设计完全自主的 Agent 工作流,减少人工介入节点
  • 让 Agent 自己决定下一步,而不是等你指令
  • 你的精力用在”启动”和”验收”,不是”过程监控”

Karpathy 自己的例子: 把整个智能家居统一到一个 WhatsApp agent。“我回家了” → agent 自动协调灯光、温度、音乐。


4. 培养 Agent 编排的”肌肉记忆”

这是一门需要刻意练习的新技能。

管理多个 Agent 就像学开车 —— 刚开始很别扭,熟练后自然而然。你需要练习的是:

  • 如何在屏幕上合理分配多个 Agent 窗口
  • 形成”分配任务 → 等待 → 审查 → 整合”的节奏感
  • 判断哪些任务该并行,哪些该串行

5. 把指令文件(AGENTS.md)当成可调优的代码

你的 markdown 指令文件,本质上是在给 AI 编程。

CLAUDE.mdAGENTS.md 这类文件不是写完就扔的文档,而是你和 Agent 之间的接口定义,需要持续迭代:

  • 不同的指令措辞会产生截然不同的行为
  • 可以 A/B 测试不同版本,看哪个效果更好
  • 甚至可以让 Agent 帮你优化指令本身(元优化)

类比: 就像调超参数 —— 写好指令文件,就是在调模型的”行为超参”。


6. 用 Agent + API 替代一堆独立的 App

不要登录 6 个不同的管理后台,用一个 Agent 统一搞定。

思路转变:

  • 以前:每个工具有自己的 UI,你手动操作
  • 现在:工具暴露 API,Agent 负责调度,你只说”我要什么”

适用场景: 数据查询、工单系统、监控报警、内容发布……凡是有 API 的,都可以被 Agent 整合。


7. 投资于持久运行、循环执行的 Agent

让 Agent 在你睡觉时也在工作。

单次对话式的 Agent 只是入门。更高级的玩法是:

  • Agent 有自己的沙箱环境
  • 能跨会话记住上下文(持久化记忆)
  • 持续循环执行,不需要你每次重新启动
  • 出问题时能自动恢复

类比: 从”随叫随到的助手”升级为”有自己工作节奏的员工”。


8. 模型能力是”锯齿状”的,不是均匀的

AI 很擅长有标准答案的事,但在模糊判断上很弱。

擅长的任务不擅长的任务
写代码、跑测试讲笑话、理解微妙语气
可验证的逻辑推理创意审美、意图揣摩
格式化、转换数据非验证性的主观判断

实践建议: 设计工作流时,把 AI 擅长的部分交给它,把需要”人类判断”的节点留给自己。


9. 为 Agent 写文档,而不是为人类写文档

文档的读者变了,写法也要变。

传统文档是给人读的(HTML、图文并茂)。现在,如果你的代码库有供 Agent 理解的 Markdown 文档,Agent 就能:

  • 自动向任何人解释代码逻辑
  • 根据不同受众用不同语言表达

你的价值变了: 你不再需要写”能让人看懂”的文档,而是提炼模型自己无法生成的核心洞察,其余的都交给 Agent 去解释。


10. 只把精力放在 Agent 做不到的事上

AI 能做的,迟早比你做得更好。你的时间要用在刀刃上。

你的不可替代价值:

  • 创意直觉(知道什么值得做)
  • 品味判断(什么是好,什么是烂)
  • 全新的问题框架(提出别人没想到的方向)

凡是 Agent 能做的,就大胆交出去。你要专注的,是那个模型暂时还无法生成的”第一个想法”


总结

你的角色转变:
  代码执行者  →  任务编排者  →  方向决策者

能力建设路径:
  1. 学会并行分配任务(第1、4条)
  2. 打磨工作流,让自己不是瓶颈(第3、7条)
  3. 把指令文件当代码迭代(第5条)
  4. 用 Agent 整合工具链(第6条)
  5. 了解模型边界,扬长避短(第8条)
  6. 重新定义自己的价值(第2、9、10条)

最后一句话: 如果你觉得 AI Agent 没用,大概率是 skill issue。