简报 | Alfred's Site

4个源，过滤5篇2026-05-16

Eric Jang – Building AlphaGo from scratch

Dwarkesh Patel

用从零复现 AlphaGo 的视角，把强化学习最核心的设计权衡讲得异常清晰：为什么 MCTS 能绕开 credit assignment 问题，而 LLM 的 RL 至今仍在用"吸管吸信号"的方式苦苦挣扎。额外价值在 AI 自动化研究的边界分析——LLM 能做好"执行实验"，但"选择下一个研究方向"这一层决策至今还是黑洞，直接映射到用 AI 工具做产品时的瓶颈感知。

U.S. DOJ demands Apple and Google unmask over 100k users of car-tinkering app

tencentshill

美国司法部向苹果、谷歌、亚马逊和沃尔玛发出传票，要求提供 10 万余名汽车调校 App（EZ Lynk）用户的个人信息，理由是该 App 可能被用于绕过排放控制系统，违反《清洁空气法》。这是应用商店中心化身份体系作为监控节点被激活的典型案例——对任何有规模的 App 开发者而言，用户数据不只是产品资产，也是法律风险敞口。

ruvnet/RuView

RuView 用 WiFi 信号做"穿墙感知"——不需摄像头，通过 ESP32 节点捕获 Channel State Information，实现人员检测、呼吸心率监测、姿态估计。架构上的有趣决策是"物理驱动在前、机器学习在后"，约束（无摄像头）迫使系统从纯信号域自监督学习，是一个经典的"产品约束催生新架构"案例。项目已有 57.5K star，但属于硬件感知领域，与全栈/AI 工具开发的日常工作距离较远。

Pluralistic: No one wants a permanent gerontocracy (15 May 2026)

Cory Doctorow

Doctorow 用民调数据论证：美国 80% 跨党派选民支持对国会、总统、最高法院设年龄上限——这是罕见的高度共识议题。文章的核心不是政治观点，而是揭示了"资历/庇护制度"如何制造纳什均衡陷阱：任何一方单边退出都是"单方面缴械"，于是理性个体集体锁死在烂平衡里。这个机制可以迁移到产品/组织的"技术债均衡"和"功能通货膨胀"问题。

K-Dense-AI/scientific-agent-skills

原名"Claude Scientific Skills"的科研 Agent 技能库，近期完成品牌升级——改名 Scientific Agent Skills，同时拥抱开放的 Agent Skills 标准，支持 Cursor/Claude Code/Codex 等多个 agent 平台。核心设计哲学是：LLM 理论上能调用任何库，但显式定义的 skill（含文档、示例、最佳实践）能显著提升可靠性和一致性——这个"能用 vs 擅长用"的区别，对自己设计 skill/agent 时的分层策略有参考价值。

4个源，过滤5篇

Eric Jang – Building AlphaGo from scratch

Dwarkesh Patel

每日简报