我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。 几个月下来,托管服务的 MRR 突破了 8k 刀,除去运营成本,利润非常低。 今天终于把服务迁移到了 FastClaw,通过存算分离的架构,让 Agent 无需常驻,而是在收到请求时动态挂载 sandbox 来提供服务。服务器从 18 台降到了 3 台,运营成本降到了 1/6,下个月有机会赚到钱了。😄 跟 OpenClaw 比,FastClaw 真的是太轻量了。 1. 代码体积约为 OpenClaw 的 1/40 2. 运行资源占用约为 OpenClaw 的 1/7 3. 单二进制分发,无环境依赖 4. OpenClaw 的 gateway 启动大概需要 15s,FastClaw 秒级启动 FastClaw 本身是为云原生多租户场景而设计的 Agent 运行框架,同样也适用本地运行场景。 继续完善,欢迎体验。✌️ https://t.co/NlJFmEYWKq
聊一聊 Agent 的存算分离架构设计👇 一个有灵魂,有记忆的 Agent,一次任务的生命周期包括以下步骤 1. 用户输入 query(text + files) 2. Agent 读取提示词文件(soul.md,identify.md,user.md 等) 3. Agent 读取可用的工具和技能(tools,skills 等) 4. Agent 读取记忆(memory.md,memory_search 查询) 5. Agent 构建上下文(prompt + tools + memory + query) 6. Agent 进入 Loop(LLM 调用 → 工具调用 → 观测 → 再推理) 7. Agent 交付结果(Artifacts) 什么需要存:提示词文件,工具和技能,对话记录,交付产物 什么需要算:上下文拼接,LLM 调用,工具调用 简单表示这个过程:fn(query, agent runtime) = artifacts 三种 Agent 运行方式: **1. 本地裸机运行**(OpenClaw 类 Agent 的常见模式) 提示词文件、skills、对话记录全部存在本地磁盘,Agent 在固定 workspace 目录下运行,存跟算是一体的。优点足够简单;弊端在于安全性——Agent Loop 执行 `exec(rm -rf /)` 很容易破坏宿主机。 **2. 本地带 sandbox 运行**(Codex 类 Agent 的常见模式) 解决两个问题:防止 Agent 越权操作;解决宿主机依赖缺失导致工具调用异常。 涉及敏感操作时,把宿主机 workspace 挂载到 sandbox 执行,产物自动同步回宿主机。存算分离只在工具调用环节引入 sandbox 做动态计算,存储主要靠宿主机文件系统。 **3. 云端多副本运行**(Manus 类工具型 Agent 的常见模式) 多租户、多任务、长时间运行。最简实现:k8s 集群 + 每个 pod 部署 Agent 框架,通过 PVC 挂载云硬盘持久化用户资料。隔离性好,但 pod 需要常驻,运行成本高,难以规模化。 --- 云端 Agent 要做到规模化,必须结合 serverless 架构做存算分离: - 计算层依赖 k8s 集群动态扩缩容 - 存储层按 Agent 生命周期分四种方案: 1. **热状态**(Loop 的 step、plan、游标)→ KV(redis),高性能低延迟,用于断点恢复 2. **对话和任务记录** → 关系型数据库(postgres) 3. **长期记忆**(对话摘要提取)→ 向量数据库(pgvector、milvus) 4. **工作产物**(用户文件、Agent 输出、tools、skills)→ 对象存储(S3、OSS) --- 以 FastClaw 为例的云端 Agent 运行流程: 1. k8s 集群日常 2 个 pod 部署 fastclaw gateway 2. 负载均衡路由用户请求,Agent 开始计算: - 从 DB 读取提示词文件 - 初始化 pod 内临时目录作为 workspace - 初始化 sandbox,挂载 workspace - 从对象存储下载用户资料和 skills 到 workspace - 调用 memory_search 从向量数据库查询记忆 - 拼接上下文,调用 LLM,解析工具 - 在 sandbox 执行工具调用,读写 workspace 文件 - Loop 过程中的状态设为 checkpoint 保存到 KV - 输出结果给用户 3. 惰性检查关闭不活跃 sandbox,关闭前把 workspace 文件上传到对象存储 计算层:pod 水平扩容支持并发,sandbox 承接工具调用(e2b 秒级启动,可建 sandbox 池提升并发容错);存储层:KV + DB + vector DB + OSS 组合,瓶颈在 IO 延迟。 最大挑战:分布式多副本下的数据一致性,需要合理使用锁机制和负载均衡策略。 理解了这套架构,再去看 Manus、Claude managed agents 的实现就很好理解了。

我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。 几个月下来,托管服务的 MRR 突破了 8k 刀,除去运营成本,利润非常低。 今天终于把服务迁移到了 FastClaw,通过存算分离的架构,让 Agent 无需常驻,而是在收到请求时动态挂载 sandbox 来提供服务。服务器从 18 台降到了 3 台,运营成本降到了 1/6,下个月有机会赚到钱了。😄 跟 OpenClaw 比,FastClaw 真的是太轻量了。 1. 代码体积约为 OpenClaw 的 1/40 2. 运行资源占用约为 OpenClaw 的 1/7 3. 单二进制分发,无环境依赖 4. OpenClaw 的 gateway 启动大概需要 15s,FastClaw 秒级启动 FastClaw 本身是为云原生多租户场景而设计的 Agent 运行框架,同样也适用本地运行场景。
760 tweets · 188 sources