用从零复现 AlphaGo 的视角,把强化学习最核心的设计权衡讲得异常清晰:为什么 MCTS 能绕开 credit assignment 问题,而 LLM 的 RL 至今仍在用"吸管吸信号"的方式苦苦挣扎。额外价值在 AI 自动化研究的边界分析——LLM 能做好"执行实验",但"选择下一个研究方向"这一层决策至今还是黑洞,直接映射到用 AI 工具做产品时的瓶颈感知。
美国司法部向苹果、谷歌、亚马逊和沃尔玛发出传票,要求提供 10 万余名汽车调校 App(EZ Lynk)用户的个人信息,理由是该 App 可能被用于绕过排放控制系统,违反《清洁空气法》。这是应用商店中心化身份体系作为监控节点被激活的典型案例——对任何有规模的 App 开发者而言,用户数据不只是产品资产,也是法律风险敞口。
RuView 用 WiFi 信号做"穿墙感知"——不需摄像头,通过 ESP32 节点捕获 Channel State Information,实现人员检测、呼吸心率监测、姿态估计。架构上的有趣决策是"物理驱动在前、机器学习在后",约束(无摄像头)迫使系统从纯信号域自监督学习,是一个经典的"产品约束催生新架构"案例。项目已有 57.5K star,但属于硬件感知领域,与全栈/AI 工具开发的日常工作距离较远。
Doctorow 用民调数据论证:美国 80% 跨党派选民支持对国会、总统、最高法院设年龄上限——这是罕见的高度共识议题。文章的核心不是政治观点,而是揭示了"资历/庇护制度"如何制造纳什均衡陷阱:任何一方单边退出都是"单方面缴械",于是理性个体集体锁死在烂平衡里。这个机制可以迁移到产品/组织的"技术债均衡"和"功能通货膨胀"问题。
原名"Claude Scientific Skills"的科研 Agent 技能库,近期完成品牌升级——改名 Scientific Agent Skills,同时拥抱开放的 Agent Skills 标准,支持 Cursor/Claude Code/Codex 等多个 agent 平台。核心设计哲学是:LLM 理论上能调用任何库,但显式定义的 skill(含文档、示例、最佳实践)能显著提升可靠性和一致性——这个"能用 vs 擅长用"的区别,对自己设计 skill/agent 时的分层策略有参考价值。
4个源,过滤5篇