发现 Ponytail 和 Codex 是绝配。 GPT 写防御性代码上瘾——没有明确指示总是堆一大堆 boilerplate,看着想哭。 Ponytail 的核心理念是「The best code is the code you never wrote」,通过强制 agent 先确认是否真的需要写新代码,大幅减少 over-engineering。 官方数据:比无 skill 的 agent 少写 80–94% 代码,降低 42–75% 成本,速度快 3–6 倍。 今天装上试试,star 数已经很多了。
Shadcn 作者的新的这个 improve skills 思路真的很不错啊,我之前也有类似的想法: https://t.co/law7mEczUW 简单来说就是使用最强大的模型来做最有价值的工作:比如:深入理解代码库,发现问题,出高质量的计划。 然后把实际执行交给更便宜去完成,skill 本身绝不直接修改代码,只负责产出计划。 主 Skill 包括多种模式,有快速的,也有全面的,但是这个思想真的很不错,大家可以深入了解一下,我觉得不仅仅是代码改进和审计,开发新的功能之类的也完全都可以使用这个方式的。 这个 repo 4 天就 3.7K 个stars,我觉得现在 skills 是最容易获得 stars 的方式了。。。。。
昨天抽空试了一下这个方法论,真的不错。不过我不是做 audit,而是做新 feature——让 GPT-5.5 High 用这个 skill 出 plan,不写一行代码,产出 Metadata、Scope 和 Steps。 再让 Composer 2.5(X 订阅送的)和 DeepSeek v4 pro 分别出一版实现,效果都不错,花费极少。 如果对代码质量要求更高,再用自己的 review-forge review 一下,就能花小钱办大事。 是个非常好的省钱穷鬼工作流。 【引用】Shadcn 作者的 improve skills 思路很不错——核心是用最强大的模型做最有价值的工作:深入理解代码库、发现问题、出高质量计划;把实际执行交给更便宜的模型。skill 本身绝不直接修改代码,只负责产出计划。 这个思路不只适用于代码改进和 audit,开发新功能同样完全可以套用。该 repo 4 天拿到 3.7K stars——感觉 skills 是现在最容易涨星的方向了。
In light of what happened, I'm doubling down on skills like /improve. A frontier model got pulled. If it happened once, it's gonna happen again. Fable today. 4.9 tomorrow or maybe gpt 6 one day. So, treat intelligence as borrowed. Drain intelligence when it's available. Build a catalog of plans today. Then implement later with a cheaper, open source, or a model you control. Build the backlog now. https://t.co/rqHw0fPv4G
@vikingmute: Shadcn 作者的这个 improve skills 思路真的很不错,我之前也有类似的想法: (链接) 简单来说就是用最强大的模型做最有价值的工作:深入理解代码库、发现问题、输出高质量计划。然后把实际执行交给更便宜的模型完成,skill 本身绝不直接修改代码,只负责产出计划。主 Skill 包含多种模式,有快速的也有全面的,但这个思想真的很棒,大家可以深入了解一下。我觉得不仅是代码改进和审计,开发新功能之类的也完全可以用这个方式。这个 repo 4 天就 3.7K stars,我觉得现在 skills 是最容易获得 stars 的方式了…… 引用 @shadcn: 鉴于最近发生的事,我要更坚定地推进 /improve 这类 skill 的建设。一个前沿模型被下架了。发生了一次,就会再次发生。今天是 Fable,明天可能是 4.9,或者某天是 GPT-6。 所以,把智能当作借来的资源。趁现在还能用,尽可能榨取它的价值。今天就积累计划目录,之后再用更便宜、开源或你自己控制的模型来执行。 现在就建立 backlog。
分享一篇文章:《How LLMs Actually Work》 好像前几天在 HackerNews 排名第一。同类文章很多,但这篇深入浅出,有直观的例子,非常适合有一定编程基础但没深入学过 Transformer 的人阅读。比喻也很恰当,一看就是人写的,没什么 AI 味。 最近重新爱上了写东西,写了两篇技术文章,之后还会继续写。我的原则是:人写,绝对不用 AI。写作是一种乐趣,是梳理逻辑、表达观点的过程,不想让这种乐趣被 AI 剥夺。
最近产量起来了,又写了一篇干货新文章:《我是怎样使用 AI 构建 E2E 测试体系的?》 将我之前总结基于 E2E 的新特性开发流程做了一个总结,原因是 TinyShip 是一个 Next.js、Nuxt.js、TanStack Start 三套前端框架组成的 monorepo,同时支持 PostgreSQL 和 SQLite,也就是说每改一个功能,有 6 种不同的组合可能出问题。光靠人肉点根本顾不过来。 我总结了一套 Spec → Code → Verify(agent-browser)→ Test → Green 五阶段流程,让 AI 辅助结合 E2E 完成新功能的开发和验证。所以更像是 E2E 驱动新功能开发。 如果你也有多框架的项目,或者也头疼人肉测试成本太高,可以试试这套流程。


最近一个月看来看去,觉得最漂亮最简洁的组件库就这两个了: COSS UI 基于 BaseUI,简洁美观、组件齐全,细节非常考究,还有 skills 等资源,对 AI 非常友好。 HeroUI 色彩鲜艳、更活泼,theme 丰富,可定制化也很强。 如果大家用厌了 shadcn/UI 的默认样式,可以试试这两个组件库,我更喜欢 COSS。
写了一篇干货文章:《我是怎样使用 AI 来做 Code Review 的?》 https://t.co/SOAwhs2jz8 对之前总结的 AI Code Review 做了系统梳理,并补充了更详细的分步流程。 AI 的代码产出速度太快了,如果长时间不干预,整个系统很快就会失控、质量严重下降、变成一个黑盒。我实践了一套叫 Review Forge 的流程,用来规范项目中 Code Review 的方式,同时让我对每次代码改动更有信心。 如果你也是用 AI 写大部分代码、review 已经跟不上了,可以试试类似的流程。
开源了我最近 review AI 代码的流程 skill——review-forge 越来越发现 Review 的重要性,AI 代码产出太快,如果长时间不干预,整个系统很快就会失控。 这个 skill 包含以下关键流程: **review**:让不同模型根据当前 diff 或 branch 生成 bug 报告,每个模型出一份独立报告(目前用 GPT5.5 / Composer 2.5 / DeepSeek V4 Pro)。多模型交叉验证很重要,因为每个模型都有盲区。 **synthesize**:汇总各模型 bug report 生成 summary.md,被多个模型同时发现的问题基本就是铁板钉钉的真问题。 **手动 Review 并决定修复哪些**:AI 擅长 review 但不擅长决策,后者需要对整个项目的理解、权衡风险和收益,必须由人来拍板。 **fix**:让一个模型修复 summary 中的问题,跑测试验证,更新 status.md。 **verify**:让另一个模型验证是否修复,更新 status.md,如此循环直到问题解决。 这是从《Using AI to write better code more slowly》出发不断实践的结果,想让 AI 写得好、写得慢的可以参考。
Introducing zero-native Build native desktop + mobile apps with web UI and Zig → Tiny binaries, low memory usage → Selectable web engines (WKWebView, WebKitGTK, WebView2, Chromium/CEF) → Next.js, Vue, Svelte, Vite, React → macOS, Linux, Windows, iOS, Android https://t.co/gMBinlXWOU
这哥们是我见过最高产的人,可以关注下,在 Vercel Lab 创建了这么多开源作品,太多想法了,这个看起来不错 ZeroNative [引用 @ctatedev]: 介绍 zero-native 用 Web UI 和 Zig 构建原生桌面 + 移动应用 → 极小二进制体积,低内存占用 → 可选 Web 引擎(WKWebView、WebKitGTK、WebView2、Chromium/CEF) → 支持 Next.js、Vue、Svelte、Vite、React → 支持 macOS、Linux、Windows、iOS、Android 和 Tauri 很像啊,默认还是使用系统 WebView,看起来就是用 Zig 替代了 Rust,好像还支持切换到 CEF(Chromium Embedded Framework)打包 Chromium。想要稳定性的话。
很喜欢这个 liveline。 AI 时代还有人认认真真打磨这样一个功能丰富、属性众多的实时动画折线图——真的像艺术品。除了 React 没有其他依赖,动画 60fps,非常丝滑,很适合实时数据展示,官方示例也很多。整体感觉非常漂亮,现在真的很喜欢这种精心打磨的小作品。
760 tweets · 188 sources