在 a i a 阵的时代,未来的智能体软件系统应该长什么样?著名程序员 danshafer 和 cloud 最近就一起拣写了一篇关于智能体原生软件架构的思想,抛弃了传统的以静态代码为核心的软件架构, 而是构建以智能体为核心的新的系统。这些系统呢,灵活性是非常强的,不仅能够去按照代码执行任务,还能够去帮你组织文件,管理你的工作流程等等比较广泛的任务。所以软件未来呢,将会从一个写代码实现功能的时代, 进化成为描述一个目标让智能体帮你实现的时代。它的目标呢,不再是写死逻辑,而是让 agent 有 能力利用自己的循环,把你最终想要的目标完成。为了达到这点呢,这篇文章提出了五个核心原则。 第一呢,就是要 agent 和人的 ui 达到同等的能力,也就是 parity。 任何用户能够在软件 ui 上面做的事情, agent 理论上都能够去通过调用工具的组合来去完成。比如说你在 ppt 里面创建一个新的对话框,那么 agent 的 理论上也可以写一行代码完成, 这样的话呢, agent 才有充分接管人的任务的能力。第二呢,就是保持最小化的颗粒度,也就是 granularity。 我 们现在写软件很容易把很多的函数写得很长,这个函数里面包含了非常多的 business logic, 也就是商业逻辑,这个商业逻辑一旦被写死的话,它的灵活性是非常差的。 所以该原则 granularity 的 意思呢,就是我们不要把这么长的商业逻辑写到一个函数里面,而是保留最小的这些功能点,比如说读取文件、写文件,移动文件、执行这些 shell 命令等等。把我们原来想实现的商业逻辑,让智能体自己去灵活地 figure out, 自己去通过 prompt 来去组合,这样子的话,充分的把每一个写死的函数打到最小的颗粒度,从而能够让 agent 能够最灵活化的把它们做排列组合。这就带来了第三点的特性,叫做 composeability, 也就是可组合性。 正是因为 agent 有 了跟人用 ui 一 样的工具能力,再加上 agent 可调用的工具性,是非常可组合的最小颗粒度。 agent 理论上就能够通过用户的这些提示词 来去自主的排列组合,创建出新的功能,通过自己的循环来满足用户的需求。这样的话呢,就不需要重新的去写代码,任何一个新的功能都是通过新的 prompt 来实现,而不是通过新的代码更新而实现。 这就引出了第四条的特性,叫做自发能力,也就是现在所谓 ai 的 功能定义好,它绝对不会做这个功能之外的事情。 但是在智能体原生的软件系统里面,只要用户的知识范围是在你的覆盖范围之内,那么 agent 就 有能力去通过排列组合把你没有定义的这些能力呢?能够把它做出来, 所以你不需要给每一个目标来去预设你的逻辑了。最后一点叫做 improvement over time, 也就是随着时间能够自我改进,传统的软件你不去更新它的代码,它是绝对不会有任何迭代的。 但是现在的 agent native 的 应用,可以通过累计对话的上下文,把之前执行错误的内容放到这个知识库里面, 包括通过用户自定义自己的提示词等等来去实现自我的迭代,这样的话系统的能力随着时间推移就可以不断的提升。所以一句话总结,你是否做了一个 agent 的 原生应用,就是你给这个应用一个任务,它能够去作用的空间是在你的应用领域范围之内, 但是呢,这个任务却不是被预先定义的,它是否能通过自我发掘而完成你的任务呢?如果是,就说明你这个系统已经具有了 a 正原生能力,如果不是,说明你还是在传统的软件范围之内。
粉丝1.5万获赞5.8万

看看我的 agent 团队们,有写图文的、网站运营的、监控金价的、记账的,还有提供情绪价值的,后面还要增加一个视频剪辑的 open cloud 小 龙虾 用上多 agent 的 模式了吗?但像我这样每个 agent 对 应一个机器人的配置是有点广泛。在飞书上其实有一种更简单的方式,就是通过拉群,实现一个机器人多个 agent 多个群聊分别管理的模式。我们来以选择题、写作和神稿三个事情为例,完整的配置一遍, 一共三个步骤。首先用这样的命令创建多个 agent, 分 别负责不同的工作,然后给每个 agent 的 职责拉一个飞书群,并且把我们的唯一的这一个 飞书机器人添加到群里面。接着把每一个群聊和 agent 绑定起来,在这里查看群的 id, 通过这样的 bindings 配置把两者映设起来。最后不要忘记给飞书 channel 增加这两张配置,开放群聊和群聊中,不需要艾特机器人也能回复。 配置完成之后,在各个群里和 agent 对 话,给他们安排好职责和身份,让他们记录下来,你就可以在不同的群里指挥不同的员工工作了。像这样的流程,先选择题再写作,审稿,审完再改, 最后得到一篇完整的内容就可以发布了。这样做配置简单,效果强大,快来把你的 agent 军团也安排起来吧!关注我,带你玩转 open club!

这周我们烧了十亿多的 token, 在 openclaw 上大概就是一千五百美金吧。呃,但是我觉得非常值啊,因为我们终于 figure out, 怎么去管理一个 ai agents 团队, 所以如果你是一个艺人公司,或者你想用 ai 来管理协调你的整个团队的话呢?那请看完这条视频,因为我们已经帮你省下了一千五百刀的学费。 整个 a i a 阵子团队的协调枢纽和核心呢,就是最近这个特别火的 openclaw, 他 只要被调教好了,就是一个非常完美的项目经理。但也像所有刚招进团队的同事一样, openclaw 本身并不是一个开箱即用的 数字员工,我们需要去培训,他就是什么事情能做,什么事情需要让其他的人类同事或者其他的 agence 搞定进度该怎么汇报?有哪些规则要遵守?那么这些规则呢?在 open core 里其实就是一个叫做 agence 点 md 的 文档, 这个文档就定义了 ai 的 所有行为准则,它是一个配置文件,基础的配置就非常简单,就像一个没有被培训过的新员工一样。但是在过去一周的时间里,我们不断的去优化这个配置文件,让他成长到了可以帮我们去协调其他 六七个 a 公司的一个项目经理。那我们其实主要增强了他在以下三个方面的核心能力吧。第一个就是主动性, 因为很多人说 agents, 大家觉得他只是一个工具,只是一个机器人,那是因为他们是被动的,就是你给他一个指令,他就去执行一次, 然后你推一推他,他就往前走一步,他并不会主动的去想办法解决他遇到的问题,也不会主动的复盘和思考说怎么样把一件事情做得更好。 那如果 aids 只做到这样的程度呢?它确实只能当一个螺丝钉,但是 open course 不 一样的,它本身有一个心跳机制,就是 heartbeat 会定时去检查哪些项目卡住了,然后哪里遇到了它自己解决不了的问题,并且主动跟我们去汇报。 当然只做到这个程度的话,肯定还是不够的,所以我们在 a 证点 m d 里呢,就配置了更多的规则,让它能够做到不需要我去问任何一个项目的进度,它就可以完全汇报给我。 第二是可重入性,可重入性其实就是说这个 a 证它能不能稳定的靠谱的把一个很长期的东西干完, 它并不是说这个 agents 可以 百分之一百的在线,永远保持 up time, 因为项目的推进总是会出现问题的,然后网络即便再好的网络环境也会有意外的中断,所以我们要的其实是 它能够在项目中断,网络断掉了之后,当它重入的时候,能够从断掉的地方稳定地继续向前推进,它甚至可以去 fix 去解决为什么会断掉了这个问题。 openclaw 的 工作记忆管理,呃,其实是被动进行的,也就是说如果他认为和你对话当中没有涉及到什么重要的任务,没有涉及到什么重要的内容,他是不会主动记录到他。当他的工作日记当中 就导致比如说你重启了 gate 位之后,它就忘记了它在干嘛,所以我们在调试的过程当中呢,就优化了它去主动压缩上下文,主动刷新 session 的 这个配置,让它能够在横跨多天的非常长的任务或者是对话当中,依然清楚地知道啊不同的项目应该怎么样去推荐。 然后第三点,我们对它的改进,我觉得可以称之为 a gentle thinking, 就是 像 agent 像 ai 一 样去思考。因为很多人觉得调教 ai 来进行人机写作,应该是像 agent 像人类一样思考,但是我觉得恰恰相反,因为归机生物就应该用他们自己最熟悉,他们自己干的最好的方式来解决问题。我举个例子,大家肯定都让自己的 agent 去做过一些很简单的自动化,比如说去帮你发一条推特,去帮你在 tapp 上面呃 发一个 issue。 那 这个时候 a 正题有很多技能是可以用来干这个事情的,比如他可以像人类一样去操作浏览器,模拟人类的点击和思考,模拟人类在浏览器的输入框中,用键盘输入 来完成这条帖子的发送。当然呢,他也可以直接写一段呃 js playwrite 的 脚本,调用这个脚本来实现刚才的这个任务。但是最高效或者说最省钱最快速的方法, 肯定显然就是他直接去调用呃相关平台的这个 api。 那 么在刚才的这个任务里,比如说发帖子,在所有他可用的方式里,最慢最浪费投坑的方式其实就是模仿人类的这个方式。所以我们在给 openclaw 定的这个行为准则当中呢,就明确规定了 他在不同工具托 use 的 一个优先级,优先级高低吧,就不仅是当他自己要去解决问题的时候,应该以一个什么样的方式思考,什么样的方式去用工具,包括当他要和其他的 agents 交互的时候该怎么办?比如我们团队当中的 ai 工程师就是 cloud code, 那 open code 跟 cloud code 去共享一个项目 context 的 时候呢?它根本就不需要像人类一样,两个 agents 那 边开会聊天,它只要把自己在这个项目上的工作记忆日记直接把那个路径开放给 cloud code 就 可以了, 它们就直接可以完成整个工作 context 的 共享。除了上面的几个主要配置优化呢,我们还做了很多在细节层面的调整。呃,我也把这个版本的配置文件 留在评论区了,大家可以直接把它发给你自己的 agent, 他 就会自己根据这个文件里的指示完成所有的升级。 all right 我是 v a 七,现在在做一家 ai 加跨境的公司,如果你也想探索 ai agents 或者是相关的业务领域的话,欢迎来一起交流。 have a good one。

玩星际争霸一样带感的管理智能体你见过吗?最近有个爆火的项目, rof 直接把各路 ai 都做成了虚拟形象,让你像指挥游戏角色一样管理智能体团队。以前管一堆 ai, 要开个窗口看终端面板,翻日制,查报错、盯进度, 乱的像一锅粥。现在 rof 直接给你整个沉浸式 3 d 空间,这就是你的专属公司总部啊!他还接入了超强大的 skill 技能库,你就像给游戏角色配装备一样,想让 ai 小 人干啥活,直接给他装配对应的技能就行。 你看,可的已经在应用开发区忙得飞起,再贴一个 open 小 人,点一下他的工作区,这小家伙立马跑过去干活,干了啥?还一五一十给你汇报,完全不用懂那些复杂的命令,这不就是玩战略游戏吗?选中指派、看小人跑位、盯执行、听汇报大局战略一目了然,还能同时控制多项功能,效率直接拉满 研发团队说他们的终极愿景是给你打造一个一人公司,到时候 hr、 运营开发、数据分析全是听话的 ai 虚拟角色,不知疲倦,二十四小时待命,只为你打工。这部 ai 虚拟军团直接把智能体管理完成了游戏,未来打工人的快乐这不就来了吗?

把电脑交给 ai 管理,让他帮我完成百分之八十的重复工作,是怎样一种体验?今天测试一下二零二六年的原生工作台。这是 mini max 最新推出的 agent 桌面端,它和普通 ai 助手最大的不同是,它能直接操作你电脑里的文件、 浏览器,甚至帮你部署网站。今天我测试两个 case, 看看他到底能帮我节省多少时间。第一个 case, 我 让他帮我部署一个个人简历网站。以前大家要做这件事,得先找模板、改代码、配置服务器、上传文件要花半天时间吧。现在我直接告诉 agent 分 析博主李哥 builder, 参考我发的这篇图文笔记, 制作一份李哥的 pdf 个人简历,可以看到他阅读了这个网页的内容,然后为我制作了个人简历。 我再说一句,根据这份简历,做一个李哥个人网站,风格要简洁、专业、现代化,突出独立开发和内容创作经验。你看他开始执行,这就部署成功了。全程只需要说两句话,我们可以看看这个网站的效果。 第二个 case, 我 平常写视频脚本,会存在不同的文件夹分类里,我想整理这些脚本,得一个个打开文件,手动复制数据,再分类整理,光是整理就要浪费不少时间。 但现在我可以让 agent 帮我做这件事,只需要选择对应的文件夹目录,然后告诉 agent, 帮我分析这个文件夹里的所有视频脚本,提取标题、标签、发布时间,整理到 excel 表格里, 然后生成一份数据报告,你看它就自动完成了。 minimax agent 搭载的是 m 二点五模型,在 office 高级处理、深度搜索、调研、长文档摘要等生产历场景中都有提升。传统的 ai 助手,你问他问题,他能给你答案,但你还得自己动手去执行。 而 agent 类的 ai 就 像你雇了一个助理,你只需要告诉他目标,他会自己想办法完成更进一步。他通过分析我的视频脚本,实际上变成了我的工作分身。他知道我的写作风格、常用的表达方式和关注的话题之后,他就能写出更符合我个人风格的内容,做到帮我提效的结果。 这就是二零二六年的工作方式,你专注做更有价值的事,而那些重复性的执行工作交给 ai 就 行。 ok 啊。以上就是我测试 mini max agent 的 桌面端的真实体验,如果你也在探索 ai 提交的方法,欢迎在评论区分享你的经验,我们下期见,拜拜!