
揭晓我 agentic engineering 工作台的下一件重器——Firstmate! 这是我现在唯一直接对话的 agent session。如果你觉得同时管理多个 agent session 很耗费心力,这就是解法。 一如既往免费开源——详情见下 👇

哦天哪,这事挺重要的—— **不要让你的 agent 做 TDD!** 我现在有实证数据表明,测试驱动开发对 coding agent 是有害的。 还有哪些流行的实践你想让我来打假? 详细评测结果见下方 👇
the model alone is no longer the product
我强烈反对模型公司把太多精力放在 harness 上,但如果有人有充分的反驳理由,我很想听。 我反对的理由: 如果 OpenAI 不做 GPT 5.5,没人能做——这是他们的核心竞争力。 如果 OpenAI 不做 Codex CLI 和 App,我们有 opencode 和 t3code。做 harness **不是**他们的核心竞争力。 这不是说 Claude Code、Codex 这些产品不好——我真心觉得这些是由极其优秀的人做出来的顶级产品。 我的观点是:如果模型公司更专注于核心能力,给我们更好、更快、更安全、更便宜的模型,而不是在应用层与生态竞争,这个世界可能会更好。 你怎么看? > 引用 @gdb:模型本身已经不再是产品。
我从不在 agent harness 里用「remote control」,因为感觉更像是个不上不下的折中方案。 我直接 Tailscale 连到 Mac,然后用 Terminus 做真正的操作。这套方案零额外成本。
揭秘我的 agents HTML 工作流 HTML 是新的 markdown。Lavish 是你 HTML artifacts 的新编辑器。 只需告诉你的 agent——用 `npx lavish-axi` 和我讨论技术方案 100% 开源,本地运行。详情见下方 thread 👇

分享一些我在真实项目中使用 agent 的真实数据。所有代码变更都由 opus 4.7 或 gpt 5.5 完成。 高达 68% 的 agent 变更存在错误,全靠 no-mistakes 工具救场。 最大的问题来源是:改了代码但没更新相关文档,其次是 code review 阶段发现的问题。 现在我无法想象,如果没有 no-mistakes,我的代码库会变成什么样——即使用今天最好的模型,代码库也会绝对沦为一团糟。
OpenAI 新发布的实时语音模型 + gpt-4.5 fast 模式带来了一个新可能—— 实时语音转现场演示! 我只需要说话,白板就会自动生成内容 原型已开源,详见 thread
760 tweets · 188 sources