Dwarkesh Patel 提出一个反常识论点:AI 过去几年真正的进步驱动力不是算法效率提升,而是数据规模的爆炸式扩张——RL 本质上是用算力"挖掘"训练数据,不是突破了学习机制。人类与模型在样本效率上的鸿沟(人类一生约 2 亿 token vs. 模型训练数百万亿)是根本性的,而非可通过 scaling 弥合。这对"AI 是否能自主推进 AI 研究"这个问题形成直接压力——如果连样本效率问题还没解,就很难期待 AI 研究员做出真正突破。
Doctorow 用传销骗局的"大骗局"框架解析美国精英阶层的系统性欺骗:从 Amway 到 AI 泡沫,参与者都在同时行骗和被骗,集体维持一个无人相信却人人宣扬的虚假叙事。跨领域迁移价值极高——任何"行业内人人说好、外人看不懂"的领域(AI 投资热、Web3、企业转型项目)都适用这个诊断框架。
GLM-5 系列(5/5.1/5.2)是智谱 AI 面向"长周期 agentic 工程任务"的开源旗舰模型,5.2 是最新版本,在 Terminal-Bench 2.1 上达到 81.0 分,逼近 Claude Opus 4.8(85.0),同时保持开源可自部署优势。核心设计哲学不是"单次通过率",而是"能在数百轮迭代、数千次工具调用中持续优化"——对做 agent 系统的独立开发者有直接参考价值。
文章提出"满页瘫痪"(full page paralysis):不是开头难,而是完成时才最难——因为完成意味着作品变得真实、有限、可被评判。"只要没完成,它就还可能是完美的"——这个心理防御机制解释了为什么很多项目卡在 90% 处。
Dan Abramov 用 RSS/Google Reader 类比解释 atproto 的架构哲学:为什么 Bluesky 没有"实例"——因为它把数据托管和应用层彻底分离了,你的身份归你自己,而不是归某个服务器。这个"托管与应用分离"的设计决策,直接对应软件设计中"数据层与表现层解耦"的第一性原理,值得做产品/系统设计的人深想。
一篇关于美国 140 余座煤电厂转天然气改造过程的深度分析,拆解了监管压力(EPA MATS 法规)与页岩气经济性双重驱动下的能源基础设施转型。文章详细比较三种改造路径的技术权衡与成本,揭示"技术可行但系统协调失败"的规律——改造后的气电厂效率不及新建厂,是历史基础设施的锁定效应使然。可类比到任何存量系统改造 vs. 推倒重建的决策框架:监管与经济结构变化如何迫使既有资产做次优适配。
6个源,过滤7篇
Google Research 发布的时序预测基础模型,2.5 版本将参数量从 500M 压缩至 200M,同时将上下文长度从 2048 扩展到 16k,是一个"规模反直觉"的架构决策——更小的模型覆盖更长的上下文。2026 年 6 月刚更新了 PyPI 包(v2.0.0),并新增 LoRA 微调支持和 Agent skill 集成,是近期重新活跃的触发点。