"Using coding agents well is taking every inch of my 25 years of experience as a software engineer." Simon Willison (@simonw) is one of the most prolific independent software engineers and most trusted voices on how AI is changing the craft of building software. He co-created Django, coined the term "prompt injection," and popularized the terms "agentic engineering" and "AI slop." In our in-depth conversation, we discuss: 🔸 Why November 2025 was an inflection point 🔸 The "dark factory" pattern 🔸 Why mid-career engineers (not juniors) are the most at risk right now 🔸 Three agentic engineering patterns he uses daily: red/green TDD, thin templates, hoarding 🔸 Why he writes 95% of his code from his phone while walking the dog 🔸 Why he thinks we're headed for an AI Challenger disaster 🔸 How a pelican riding a bicycle became the unofficial benchmark for AI model quality Listen now 👇 https://t.co/wlEIyOehU8
我从 @simonw 那里得到的最大收获: 1. 2025 年 11 月是 AI 编程的拐点。GPT 5.1 和 Claude Opus 4.5 跨越了一个门槛,编程 agent 从「大部分能用」变成了「几乎总能做到你想要的」。假期里折腾过的工程师意识到这项技术已经真正可靠了。 2. 中级工程师是最脆弱的群体——不是初级,也不是高级。AI 通过让有经验的工程师利用数十年的模式识别来放大他们的能力,同时也极大地帮助新人上手。Cloudflare 和 Shopify 各招了一千名实习生,因为 AI 把上手时间从一个月压缩到了一周。但那些还没积累深厚专业知识、又已经获得了新手红利的中级工程师,处境最为岌岌可危。 3. AI 疲劳是真实存在且被低估的。Simon 同时运行四个编程 agent,到上午 11 点时已经精神崩溃。他确实节省了时间,但大脑已精疲力竭于指挥多个自主工作者的密集工作中。有些工程师为了让 agent 持续运行而牺牲睡眠。这可能只是新鲜感问题,但背后的动态——管理 AI 在减少体力劳动的同时放大了认知负荷——是真实的张力。 4. 代码现在很廉价。这个简单的想法有深远影响。过去占用最多时间的事情——写代码——现在花的时间最少。瓶颈已经转移到其他所有事情上:决定构建什么、证明想法可行、获取用户反馈。由于原型几乎是免费的,Simon 在起步时经常为每个功能构建三个版本。 5. 「暗工厂」是目前 AI 辅助开发中最激进的实验。一家叫 StrongDM 的公司确立了一个政策:没有人写代码,没有人读代码。他们 24/7 全天候运行一群 AI 模拟终端用户——数千个虚假员工提出「给我 Jira 访问权限」之类的请求——每天耗资 1 万美元的 token。他们甚至让编程 agent 根据 API 文档构建了 Slack、Jira 和 Okta 的模拟版本,以便在不受速率限制的情况下进行测试。 6. 「红/绿 TDD」是单一杠杆率最高的 agentic engineering 模式。让编程 agent 先写测试、看着它失败、再写实现、看着它通过,能产出明显更好的结果。五个词的 prompt「use red/green TDD」就能编码整个工作流,因为 agent 认识这个术语。 7. 「囤积你知道怎么做的东西」是 Simon 另一个最爱的 agentic engineering 模式。Simon 维护着一个包含 193 个小型 HTML/JavaScript 工具的 GitHub 仓库,以及一个编程 agent 实验研究仓库。每一个都捕获了一种技术、一个概念验证或他测试过的库。当新问题出现时,他可以把 Claude Code 指向过去的项目,说「结合这两种方法」。 8. 「致命三元组」让 AI agent 安全问题从根本上无法解决。每当 AI agent 同时具备:访问私密数据、接触不可信内容(比如收到的邮件)、以及向外发送数据的能力(比如回复邮件),你就有了一个致命三元组。Prompt injection——恶意指令隐藏在不可信文本中覆盖 agent 的预期行为——无法被可靠地阻止。Simon 三年来每隔六个月都预测 AI 安全会发生一次「挑战者号灾难」。还没发生,但他相当确定终将发生。 9. 每个项目从薄模板开始,而不是长篇指令文件。编程 agent 在匹配现有模式方面非常出色。一个包含你偏好的缩进和风格的单个测试文件,比几段文字说明更有效。Simon 每个项目都从一个包含一个测试(字面上测试 1+1=2)的模板开始,按他喜欢的风格排布。agent 会学习并在整个代码库中遵循这个惯例。这比维护精心设计的 prompt 文件更省力也更可靠。 10. 骑自行车的鹈鹕基准意外成为了真正的 AI 基准。Simon 最初创造它是为了嘲弄数字基准——让每个 LLM 生成一张鹈鹕骑自行车的 SVG,然后比较图画。出乎意料的是,画得好不好与模型在其他方面的整体水平有很强的相关性。没人能解释为什么。它已经成为一个 meme:Gemini 3.1 的发布视频里有一只骑自行车的鹈鹕。AI 实验室都知道这件事,并在暗中竞争。

2026年初产品岗位市场现状 尽管裁员和 AI 抢工作的新闻不断,科技招聘实际上出现了很多积极信号和有趣的新趋势: 1. PM 岗位空缺达到三年多来的最高水平 2. AI 并未减缓对软件工程师的需求(至少目前如此) 3. AI 相关岗位整体爆炸式增长 4. 设计岗位趋于平稳 5. 湾区的重要性在持续提升 6. 远程工作机会持续减少 7. 尽管持续裁员,科技岗位总数仍在增长 更多内容见🧵
357 tweets · 110 sources