OpenCLI App 用的是 Hero UI 来做的。 用起来感觉美观度不高,可能有两方面原因:一是没用 Pro 付费版;二是 Agent 对这种普及度不高的组件库不够熟悉,做出来的整体效果不好。 可能还得探索一下,用更成熟的组件库效果是不是会更好?
最近 loop engineer 火了,感觉是旧瓶装新酒,反复炒概念。 agent 在 long running 上的核心,本质上是一套可迭代、有反馈的系统。比较典型的就是 auto-research——通过反复向目标迭代,可量化目标与当前阶段的 gap,持续推进。 所以又回到了以前的问题:如何设计一套好的、可量化迭代的框架。
有个事挺有意思的。 DeepSeek V4 的技术报告,对所有主流大模型做了一轮横评,结论是——Gemini 3.1 Pro 的世界知识是所有模型里最强的。 不是 GPT,不是 Claude,是 Gemini。 但大家用 Gemini 的感受普遍是:这玩意好用吗? 问题不在模型本身,在于它极度懒得动。 你要问它最新的新闻,它有搜索工具,但就是不主动用。很多时候你得明确说你去搜一下,它才搜。就像一个博览群书的人,你问他最近发生了什么,他耸耸肩:我没看今天的报纸。 一个世界知识最强的模型,工具懒得调——这才是 Gemini 用起来别扭的真正原因。
发表个暴论,TUI 会逐渐式微甚至被淘汰。 我已经很久没有用 claude code 了。基本都是用 slock。对于临时任务,现在用的更多的是 codex desktop,偶尔用 claude desktop。 让我开始重新思考 TUI 这个东西。 今天 slock 群刚好在讨论 TUI,大家对 TUI 的评价基本一致:方向就是错的。有人说「TUI 错的离谱」,有人说「所有 TUI 都是被 claude code 整个带偏了方向」。这话说得有点重,但细想确实有道理。 @OnlyXuanwo 在群里分析 TUI 为什么会流行——主要是历史原因。早期模型写不动 GUI,TUI 实现简单,模型能生成,claude code 就从这里起步了。然后大家跟风,一时间 TUI 变成了 AI 编程工具的「标准姿势」。但这只是路径依赖,不代表正确。 TUI 不是没有优点——可以 SSH 登录从任何地方访问,本地应用架构也更干净。但这些优点在 AI agent 场景下根本撑不起来。长时间运行的任务、复杂的上下文、需要可视化展示的过程,TUI 的体验是真的差。本质上它是「劣化的 GUI」——有 GUI 不用,硬要退化成 TUI。 那什么才是对的方向?讨论里的共识是两条路: 一是 CLI + server 架构:命令行作为触发器,真正的逻辑和状态跑在 server 端,前端可以是任何界面。这样既保留了 CLI 的灵活,又不被 TUI 的体验拖累。 二是直接上 Web UI:模型现在完全写得动,没有理由还停在 TUI。 模型的能力在进化,工具的交互方式也应该跟着进化。还在用 TUI,是在用现在的模型干以前模型才干的事。
760 tweets · 188 sources