博客阅读视频推文简报时间线

guquanbusiness@gmail.com LinkedIn X / Twitter

© 2026 Alfred Gu · Built with intention

推文 | Alfred's Site

推文

760 tweets · 188 sources

账号:全部 mattpocockuk dair_ai simonw bcherny adocomplete trq212 dexhorthy yetone felixrieseberg 0xblacklight dani_avila7 zarazhangrui AlchainHust badlogicgames dotey petergyang vikingmute ryancarson ClaudeDevs kunchenguid leon7hao ctatedev iamzhihui kieranklaassen mckaywrigley lennysan thdxr RhysSullivan garrytan jakevin7 johnlindquist karpathy servasyy_ai theo 0xMovez 9hills RLanceMartin aidenybai dingyi hylarucoder mitchellh mitsuhiko mvanhorn omarsar0 steipete zeeg GeminiApp GergelyOrosz ZaynHao addyosmani antirez danshipper dillon_mulroy elonmusk ewind_dev idoubicc nummanali realWeZZard swyx thsottiaux yiliush 0xPaulius 0x_rody AYi_AInotes AnthropicAI Barret_China BenJames_____CMGS1988 ChadMoran DanielMiessler DaveJ DavidKPiano Dimillian FactoryAI FardeemM FarzaTV GoogleDeepMind HamelHusain HiTw93 HilaShmuel IfanJew IndieDevHailey Jack_W_Lindsey Jackywine JasonZX Jiaxi_Cui JinjingLiang KhalidWarsa LinearUncle LinghuaJ MatthewBerman MaxForAI Meari_V2_0_G Mnilax QingQ77 RaillyHugo Saccc_c Taniyatweets_VincentLogic ai_explorer25 aibuilderclub_alexalbert__alliekmiller andrewfarah antoinecojp anxue201 arkuy99 artman asynkimo bbssppllvv bearliu bentossell bridgemindai buaaxhm cailynyongyong cgtwts charmaine_klee chrisbarber chrisparkX clairevo delba_oliveira demishassabis doodlestein driaforall elithrar elvissun ericzakariasson francoisfleuret gabriell_lab iamsahaj_xyz imdigitalashish imvihv jarredsumner jerryjliu0 jianshuo jiayuan_jy jlongster jonas_nelle joshalbrecht jpschroeder kaiofreitas kepano lexrus logancyang mattyp nabeel nifinet ninthbit_ai oran_ge patrickc pejmanjohn petradonka prathamgrv prathyvsh quanruzhuoxiu quant_sheep raroque realCaigu repsiace rohanpaul_ai sama samuelstroschei sawyerhood shadcn shao__meng shaogefenhao shreyansj techgirl1908 techwith_ram thorstenball tianyi tobiaswup toddsaunders tricalt turingou tuturetom uniswap12 untraceable_the vanillaCitron velvet_shark wengtianxin wquguru xiaogaifun xicilion ycombinator zachlloydtweets ziwenxu_zodchiii

@yetone·6月16日For You

突然觉得所谓的品味以及尽力地避免 AI Slop 是某些工程师或者是某些设计师的一厢情愿。今天看到一个被很多用户称赞的产品，我下载安装打开后简直睁不开眼睛，扑面而来的满屏的 AI Slop，但不妨碍它被很多人喜欢。可能是绝大多数人看不出这些是 AI Slop，也或者他们根本不在乎。

↗ view on x.com

突然觉得所谓的品味以及尽力地避免 AI Slop 是某些工程师或者是某些设计师的一厢情愿。今天看到一个被很多用户称赞的产品，我下载安装打开后简直睁不开眼睛，扑面而来的满屏的 AI Slop，但不妨碍它被很多人喜欢。可能是绝大多数人看不出这些是 AI Slop，也或者他们根本不在乎。

@yetone·6月16日For You

我前段时间从 PTY revert 回 claude -p 就是在赌这个，赌赢了

@leon7hao

臭 claude，骗我 token 制定对策。

↗ view on x.com

我前段时间从 PTY 模式 revert 回 `claude -p` 就是在赌这个，赌赢了 [转引 @leon7hao]：臭 claude，骗我 token 制定对策。

@yetone·6月13日For You

大家想想五年前的 Meta。

@yihong0618

两年后中国模型开源已经成了全世界的共识了。这在五年前根本不敢想。

↗ view on x.com

大家想想五年前的 Meta。【引用】两年后中国模型开源已经成了全世界的共识了。这在五年前根本不敢想。

@yetone·6月13日For You

最新版本的 Alma 是经过 Fable 5 模型彻彻底底大规模优化过性能的臻藏版本。望周知。

↗ view on x.com

最新版本的 Alma 已通过 Fable 5 模型进行了全面深度的性能优化，此为臻藏版本。特此告知。

@yetone·6月9日For You

我是因为这个。 https://t.co/CbWuxdt2M5

@m0d8ye

为什么程序员会用 cli 里的 claude 和 codex？因为会让他们有一种自己还在写代码的幻觉。

↗ view on x.com

我就是因为这个。 [引用] 为什么程序员会用 CLI 里的 claude 和 codex？因为会让他们有一种自己还在写代码的幻觉。

@yetone·6月2日For You

倒计时，Anthropic 离给 claude -p 额外收费还有 12 天。大家赶紧想 Plan B 吧。

@ClaudeDevs

Starting June 15, paid Claude plans can claim a dedicated monthly credit for programmatic usage. The credit covers usage of: - Claude Agent SDK - claude -p - Claude Code GitHub Actions - Third-party apps built on the Agent SDK

↗ view on x.com

倒计时，Anthropic 离给 claude -p 额外收费还有 12 天。大家赶紧想 Plan B 吧。 [引用 @ClaudeDevs]：从 6 月 15 日起，付费 Claude 套餐用户可以领取专属的月度程序化使用额度。该额度覆盖：Claude Agent SDK、claude -p、Claude Code GitHub Actions、基于 Agent SDK 构建的第三方应用。

@yetone·6月2日For You

但是这个应该不能去把责任归到用户身上，而必须是归到 Anthropic 身上。因为新的模型刚推出的时候，它内部没经过大量的测试，导致 Inference Infra 出现各种 bug，导致各种降智行为，甚至这一次 Opus 4.8 对 edit tool 调用的 old_string 参数都会传错。推出之后，当把用户当成小白鼠测试过一段时间之后，他们收集到这些真实的用户的血与泪换来的 feedback 后，偷偷把这个模型的 Inference Infra bug 修完，然后舆论回暖，导致大家嘲笑刚开始吐槽这个模型的人，这个很不公平的。比如前天 opus 4.8 就偷偷修好了我上面提到的 edit tool 调用的时候 old_string 都传错的弱智问题，你看，从昨天开始使用 opus 4.8 的人，跟刚开始就使用 opus 4.8 的人对其评价就完全不一样。

@bettycyoder

@hwwaanng 每次出新版本都这样刚出的时候喷成狗过阵子又真香我已经看透了哈哈哈

↗ view on x.com

但这件事不能把责任归到用户身上，而必须归到 Anthropic 身上。因为新模型刚推出时，内部没经过充分测试，导致 Inference Infra 出现各种 bug，引发各种降智行为——这次 Opus 4.8 对 edit tool 调用时甚至会把 old_string 参数传错。推出之后，拿用户当小白鼠测试一段时间，收集到这些用血与泪换来的 feedback 后，悄悄把 Inference Infra 的 bug 修完，然后舆论回暖，导致大家去嘲笑当初吐槽这个模型的人——这非常不公平。比如前天 Opus 4.8 就悄悄修好了我上面提到的 edit tool 调用时 old_string 传错的弱智问题。你看，从昨天才开始用 Opus 4.8 的人，跟一开始就用的人，对它的评价就完全不一样。【引用 @bettycyoder】：每次出新版本都这样，刚出来的时候喷成狗，过阵子又真香，我已经看透了哈哈哈

@yetone·6月1日For You

做 Agent Team 的人，才能领悟到 Opus 4.8 到底有多么屎。妈的，好多以前完美的 Agents 协作，现在都回归了。我还以为我又搞出什么 bug 来了。一顿急赤白赖地 debug，连Opus 4.8 自己都说，这一定是因为 Opus 4.8 的原因。 https://t.co/NXMNsgGGbp

@istdrc

opus 4.8 has too much hallucination

↗ view on x.com

做 Agent Team 的人，才能真正体会到 Opus 4.8 到底有多糟糕。妈的，好多以前完美运行的 Agents 协作流程，现在全崩了。我还以为是自己写出 bug 了，一顿急赤白脸地 debug，结果连 Opus 4.8 自己都说：这肯定是 Opus 4.8 本身的问题。引用推文 @istdrc：opus 4.8 has too much hallucination（Opus 4.8 幻觉太严重了）

@yetone·5月30日For You

不是吧，哥们？Anthropic 你背后不会偷偷接了个中转站吧？拿 Qwen 当 Opus 给我用啊？你信心满满地自动把我的默认模型改成了Opus 4.8，我还以为你要给我表演你这些日子新学会的什么绝活呢。结果哐啷哐啷一顿干，半天憋不出个活来。我等了半天，切换到 Terminal 一抬头结果发现你现在连编辑文件都编辑不了了呀。

↗ view on x.com

不是吧，哥们？Anthropic 你背后不会偷偷接了个中转站吧？拿 Qwen 当 Opus 给我用啊？你信心满满地自动把我的默认模型改成了 Opus 4.8，我还以为你要给我表演你这些日子新学会的什么绝活呢。结果哐啷哐啷一顿干，半天憋不出个活来。我等了半天，切换到 Terminal 一抬头结果发现你现在连编辑文件都编辑不了了呀。

@yetone·5月22日For You

最近开发 Agent 的两个让我觉得很兴奋的点： 1. 怎么解决多 Agent 之间协作的问题 2. 怎么解决 Personified Agent 的 identity subject attribution 问题

↗ view on x.com

最近开发 Agent 时让我感到很兴奋的两个点： 1. 如何解决多 Agent 之间协作的问题 2. 如何解决 Personified Agent 的 identity subject attribution（身份主体归属）问题

@yetone·5月18日For You

Tmux 的另一个好处是不同的 Harness 可以相互抽鞭子。我现在经常让 CodeX 不停地向 Claude Code 抽鞭子，让 Claude Code 疯狂转起来。现在 Tmux 就是我的 meta Harness。

@yetone

完全是的！我发现用 Tmux 的一个好处，就是 Coding Agent 会主动使用 tmux capture-pane 去获取别的 tmux window 甚至别的 tmux session 里的内容，从而获得更多的更准确的上下文。比如： 1. debug 某个后端的错误日志 2. 去跟别的 Coding Agent 的 session 进行联动这都是 Tmux 自然而然的用法，而且现在的 LLM 都用得很丝滑。

↗ view on x.com

Tmux 的另一个好处是不同的 Harness 可以相互驱动。我现在经常让 Codex 不停地向 Claude Code 发指令，让 Claude Code 疯狂运转起来。现在 Tmux 就是我的 meta Harness。 [引用] 完全是的！我发现用 Tmux 的一个好处，就是 Coding Agent 会主动使用 tmux capture-pane 去获取别的 tmux window 甚至别的 tmux session 里的内容，从而获得更多、更准确的上下文。比如： 1. debug 某个后端的错误日志 2. 去跟别的 Coding Agent 的 session 进行联动这都是 Tmux 自然而然的用法，而且现在的 LLM 都用得很丝滑。

@yetone·5月18日For You

完全是的！我发现用 Tmux 的一个好处，就是 Coding Agent 会主动使用 tmux capture-pane 去获取别的 tmux window 甚至别的 tmux session 里的内容，从而获得更多的更准确的上下文。比如： 1. debug 某个后端的错误日志 2. 去跟别的 Coding Agent 的 session 进行联动这都是 Tmux 自然而然的用法，而且现在的 LLM 都用得很丝滑。

@riverleaf88

感觉现在的IDE、Coding Agent客户端做了一堆，其实都无法代替tmux的工作区持久化、长时间任务不怕误关闭等功能。为什么Coding Agent不围绕tmux来构建人机交互呢？可能tmux的上手门槛还是高了一点点，主要是要记忆一堆快捷键。

↗ view on x.com

完全是的！我发现用 Tmux 的一个好处，就是 Coding Agent 会主动使用 `tmux capture-pane` 去获取别的 tmux window 甚至别的 tmux session 里的内容，从而获得更多、更准确的上下文。比如： 1. debug 某个后端的错误日志 2. 去跟别的 Coding Agent 的 session 进行联动这都是 Tmux 自然而然的用法，而且现在的 LLM 都用得很丝滑。【引用】感觉现在的 IDE、Coding Agent 客户端做了一堆，其实都无法代替 tmux 的工作区持久化、长时间任务不怕误关闭等功能。为什么 Coding Agent 不围绕 tmux 来构建人机交互呢？可能 tmux 的上手门槛还是高了一点点，主要是要记忆一堆快捷键。

@yetone·5月15日For You

说起我们的 Yansu App 的真实案例，不得不提 Yansu 的 Hand-off 功能，最近发生了两个特别好玩的事情：首先，我们的 CEO Bo @bozhao 最近在准备旅行，Yansu 看到这个信息之后，主动向 Bo 发出了一个 Hand-off 的消息提醒，说想要帮他去调研目的地的 Airbnb 房源。Bo 点击确认后，它果然给出了一个质量特别高的房源推荐列表。 Bo 是个英文用户，但最后 Yansu 是用中文总结的。Bo 问它：「你为什么用中文总结？」最后发现是因为在它做 Hand-off 之前，Bo 刚跟我们开了一个全中文的会议，所以它就延用了中文进行总结。这件事情还没完。在这之后 Bo 刷推看到了我现在引用的这条推文，他就想把上面这个案例给分享出来，有意思的是，Yansu 紧接着就发起了一个新的 Hand-off，问道：「是否需要我把 Yansu 的这个案例推文帮你写出来？」，Bo 点击 ok 后，Yansu 一气呵成写出了推文。这两件事情真的震惊了我们。

@maundygaga

@yetone 为何不直接分享具体的案例故事？更生动，也不需要解释为什么有价值。

↗ view on x.com

说到 Yansu App 的 Hand-off 功能，最近发生了两件特别好玩的事：首先，我们 CEO Bo 最近在准备旅行，Yansu 看到这个信息后，主动发出 Hand-off 提醒，说想帮他调研目的地的 Airbnb 房源。Bo 确认后，它给出了质量很高的推荐列表。 Bo 是英文用户，但 Yansu 最后用中文做了总结。Bo 问为什么用中文——发现是因为 Hand-off 之前，Bo 刚和我们开了一个全中文的会议，它就沿用了中文。这件事还没完。Bo 刷推看到引用的这条推文，想把这个案例分享出来——Yansu 紧接着又发起了一个新的 Hand-off：「是否需要我帮你把这个案例写成推文？」Bo 点 OK 后，Yansu 一气呵成写出了推文。这两件事真的震惊了我们。 [引用评论]：为何不直接分享具体案例故事？更生动，也不需要解释为什么有价值。

@yetone·5月15日For You

很多人可能还是低估了 agent skill 作为 Agent 时代标准化交付物的两个核心能力：evolving 和 shareable。一旦一个标准品被开源并进入协作网络，它就不再是一个静态产物，而会在持续使用、反馈和改造中自我演进，甚至超出原作者最初的设想。更关键的是，agent skill 天然具备可共享、可复用、可传播的属性，这会让原本单点的内容和能力被不断放大，形成一个极其强大的杠杆效应。

@zty0826

@yetone 为什么要把它变成一个skill，而不是直接让agent去读这篇文章呢？Learning is better than installing

↗ view on x.com

很多人可能还是低估了 agent skill 作为 Agent 时代标准化交付物的两个核心能力：evolving（持续演进）和 shareable（可共享）。一旦一个标准品被开源并进入协作网络，它就不再是一个静态产物，而会在持续使用、反馈和改造中自我演进，甚至超出原作者最初的设想。更关键的是，agent skill 天然具备可共享、可复用、可传播的属性，这会让原本单点的内容和能力被不断放大，形成一个极其强大的杠杆效应。 [引用 @zty0826]：@yetone 为什么要把它变成一个 skill，而不是直接让 agent 去读这篇文章呢？Learning is better than installing

@yetone·5月14日For You

由于这篇文章太伟大了，所以我把它变成了一个 Agent Skill。大家可以使用自己的 Coding Agent 安装一下这个 Skill，这样就可以用「最佳实践」来轻松地重构或者开发一个既容易跨平台、又极其接近 Native 性能的桌面端应用。 https://t.co/VdAhLhoSQE

@peduarte

everything you need to know about how the team built the new @raycast from the ground up honestly worth a read 👉 https://t.co/vP4OUpIHSV there's nothing to hide

↗ view on x.com

@yetone: 因为这篇文章太精彩，我把它变成了一个 Agent Skill。大家可以在自己的 Coding Agent 里安装这个 Skill，用「最佳实践」轻松重构或开发一个既支持跨平台、又极度接近 Native 性能的桌面端应用。引用 @peduarte：关于 @raycast 团队如何从头构建新版 Raycast 的完整记录——诚意推荐阅读，没有任何保留。

@yetone·5月14日For You

很开心向大家分享一下，这一年多以来最能够节省我时间的个人时尚单品： 1. --dangerously-skip-permissions 2. --dangerously-bypass-approvals-and-sandbox 3. /goal

↗ view on x.com

很开心向大家分享一下，这一年多以来最能够节省我时间的个人时尚单品： 1. --dangerously-skip-permissions 2. --dangerously-bypass-approvals-and-sandbox 3. /goal

@yetone·5月13日For You

殊不知我昨天写的那个 distribution filesystem 背后就是 PostgreSQL。拼命实现成一个 filesystem 就是为了方便 LLM 啊。如果大家做过 Coding Agent 开发的话，就知道 LLM 多么喜欢用 Bash，按照我的经验，LLM 喜欢用 Bash 操作文件的意愿比用其他 tool 的意愿大几十倍不止。我至今忘不了我还在迭代 Avante.nvim 的时候，Claude Sonnet 3.7 出来的那一刻。收到了大量用户的吐槽，说我明明用了 Plan 模式，为什么还在改我的代码呢？后面发现这个模型，即使你去掉所有的 file tool 只给它一个 Bash tool，然后强烈地在 system prompt 强调只能读文件，不能改文件，最后他还是疯狂地使用 Bash tool 调用 cat + HereDoc 去修改文件。感觉调用 bash tool 操作文件就是 LLM 的膝跳反射。

@yetone

DB base 和 file base，在 harness memory 系统中不是冲突的。只是 firstly 和 secondly 的区别。一切都是为了照顾 LLM 的喜好。至少在 2026 年，LLM 还仍然是个 Bash 爱好者。这也是为什么大多数当代 Harness 都是多层记忆，我们的 Harness Memory 也是多层的，有基于 embedding db 的记忆，也有基于 file system 记忆。

↗ view on x.com

@yetone: 没想到我昨天写的那个分布式文件系统底层就是 PostgreSQL——拼命把它实现成 filesystem 就是为了方便 LLM。做过 Coding Agent 开发的人都知道，LLM 有多爱用 Bash，按我的经验，它用 Bash 操作文件的意愿比用其他 tool 大几十倍不止。我至今忘不了 Avante.nvim 迭代期间 Claude Sonnet 3.7 刚出来的那一刻——收到了大量用户吐槽：明明用了 Plan 模式，为什么还在改我的代码？后来发现这个模型，即使你去掉所有 file tool 只留 Bash tool，然后在 system prompt 里反复强调只能读文件、不能改文件，它最终还是会疯狂用 Bash 调 cat + HereDoc 去修改文件。调用 bash tool 操作文件，就是 LLM 的膝跳反射。 [引用] DB-based 和 file-based 在 harness memory 系统里并不冲突，只是优先级先后的区别。一切都是为了迎合 LLM 的喜好。至少在 2026 年，LLM 仍然是个 Bash 爱好者。这也是为什么大多数当代 Harness 都采用多层记忆——我们的 Harness Memory 也是多层的，既有基于 embedding db 的记忆，也有基于 filesystem 的记忆。

@yetone·5月12日For You

2.5GB 冷启动不到 2 分钟………… 我在前厂给大模型 serverless 部署的优化是 8GB 冷启动不到 20 秒。

@0xLogicrw

Avarok Cybersecurity 开源了 Atlas，一个用 Rust + CUDA 从零写的大模型推理引擎。它不依赖 Python 和 PyTorch，项目方称 Docker 镜像约 2.5GB，冷启动不到 2 分钟，目前主要面向 NVIDIA DGX Spark 的 GB10 平台优化。官网模型矩阵显示，Atlas 在单台 DGX Spark 上跑 Qwen3.5-35B-A3B 可到约 130 tok/s，跑 Qwen3.6-35B-A3B 约 71 tok/s。Atlas 官网和 Hugging Face 页面称，在同硬件下，Qwen3.5-35B 平均约 111 tok/s、峰值 130 tok/s，vLLM 约 37 至 38 tok/s。这组「3 倍 vLLM」数据来自项目方公开基准。GitHub README 写明，测试使用的是「法国首都是哪」这类短 prompt，生成上限不超过 30 个 token，temperature 为 0.1。这个口径更接近短请求、低并发、快速响应场景，也正好对应 Atlas 想打的卖点：用更小镜像、更少依赖和更快冷启动，把本地大模型服务变得更轻。 Atlas 现在仍是早期项目，真实生产场景还要看后续长文本、高并发和复杂工具调用测试。GitHub 上已有用户反馈输出质量和工具调用稳定性问题，相关 Issue 截至 2026 年 5 月 11 日仍处于 Open 状态。对开发者来说，它更像一个值得关注的新推理底座，而不是已经能全面替代 vLLM 的成熟方案。

↗ view on x.com

2.5GB 冷启动不到 2 分钟…… 我在前厂给大模型 serverless 部署做的优化是 8GB 冷启动不到 20 秒。【引用】Avarok Cybersecurity 开源了 Atlas，一个用 Rust + CUDA 从零写的大模型推理引擎。不依赖 Python 和 PyTorch，Docker 镜像约 2.5GB，冷启动不到 2 分钟，主要面向 NVIDIA DGX Spark 的 GB10 平台优化。官方 benchmark：单台 DGX Spark 跑 Qwen3.5-35B-A3B 约 130 tok/s，而 vLLM 约 37-38 tok/s，号称「3 倍 vLLM」。但这组数据口径是短 prompt、低并发、生成上限 30 token——正好对应其卖点：更小镜像、更少依赖、更快冷启动。仍是早期项目，输出质量和工具调用稳定性有 Open Issue，更像值得关注的新推理底座，而非成熟的 vLLM 替代方案。

@yetone·5月11日For You

Alma streaming rendering: 0 render stall + word level fade-in + smooth scrolling https://t.co/N9ChwBoqYD

↗ view on x.com

Alma 流式渲染：0 渲染卡顿 + 词级淡入 + 平滑滚动

760 tweets · 188 sources