网关是什么?今天我们一起搞清楚网关这个概念。如果你当前没有时间看完,可以先点赞收藏,等你有时间了慢慢看。网关英文名称是 gateway, 从技术定义上讲,它是连接两个不同网络段或者两种不同协议网络的网络节点。 在互联网体系结构中,数据并不是在一个单一的巨大的网络中流动的,而是由无数个子网组成的。当数据包在同一个子网内部传输时,通过交换机就能完成。 但是当数据包想要离开当前的子网,去往另一个完全不同的网络时,它必须经过一个出口,这个出口设备在逻辑上就被称为网关。在不同的应用场景下,网关的物理主体是不一样的。 对于普通家庭用户来说,你家里的路由器就是网关。当你打开手机的网络设置,看到默认网关一栏填着幺九二点幺六八点幺点幺时, 这其实就是路由器的内网 ip 地址。这意味着你手机里所有的外网请求都会先发给这个 ip 地址,由它转发到运营商的网络。对于企业级网络,网关可能是一台高性能服务器、一台三层交换机,或者是专门的防火墙设备。 在 o s i 七层模型中,早期的网桥和交换机主要工作在第二层数据链路层,而网关可以工作在第三层网络层以上,甚至可以一直工作到第七层应用层。 网关设备通常具有以下一种或多种功能,第一是协议转换,这是网关区别于普通路由器的重要特征。比如一个工业传感器使用 rs 四八五协议通信, 而后台服务器使用以太网 tcpip 协议。网关的作用就是接收 i s 四八五的数据包,拆解掉旧的协议头,重新封装成 tcpip 格式发送出去。 第二是路由转发,这是网关设备具备的基础功能。网关保存着一张路由表,当他收到一个数据包时,会检查包头的目的 ip 地址, 如果地址在内网,直接发送给目标。如果在远端网络,网关会通过复杂的算法计算出下一条的路径,把数据包转发给下一个更高级别的网关。第三是隔离与安全。 网关是内网和外网的唯一交汇点,因此它承担了流量过滤、访问控制、网络地址转换、入侵防御等功能,可屏蔽外部网络对内网主机的直接访问,保障内网安全。 第四是流量控制与负债均衡。在高级应用场景中,网关可根据流量大小动态分配带宽, 或将请求分发到不同的服务器上,防止单点故障。网关不是一个具体的设备型号,而是一种功能角色。不同类型的网关适用场景不同,我们分别介绍一下。一、默认网关最常用,日常接触最多,通常是路由器,是内网设备访问外网的必经之路。 内网设备要访问互联网,必须把数据发给这个默认网关,再由网关转发出去。二、应用网关专门处理某一类应用层协议的网关,负责该协议的转换、解析和安全控制。 常见类型有外部应用防火墙,专门检查 http、 http 流量的安全网关。邮件网关专门过滤垃圾邮件、病毒邮件,进行邮件加密。 三、防火墙网关侧重安全防护,是集成防火墙功能的网关,核心是通过规则过滤数据,实现网络安全防护。 核心功能包括访问控制,允许或禁止特定 ip 端口的通信、病毒拦截、入侵、检测数据。加密可禁止外网设备直接访问,内网设备仅允许通过授权的端口和 ip 访问保护内网数据安全。 四、工业网关工业场景专用,专门针对工业控制网络,核心是实现工业协议与以太网协议的转换。五、无线网关连接无线网络,比如 wifi 四 g、 五 g 和有线网络的网关,负责无线协议与有线协议的转换。 比如家里的无线路由器就是无线网关,它会把 wifi 协议的无线数据转换成以太网协议的有线数据,再转发给光猫,同时将光猫的有线数据转换成 wifi 协议,与手机实现无线连接。 除了物理硬件,程序员在开发微服务架构时也经常提到 api 网关,这就是软件层面的网关。 在分布式系统中,后端可能有几十个微服务,若让手机 app 直接连接这几十个微服务,管理会非常混乱。 这时我们需要在所有服务前设置一个 api 网关,由它处理所有统一操作。比如一、统一认证,检查用户是否有权限访问。二、流量限速,防止某一个接口被短时间内的海量请求充款。 三、协议适配将外部的 http 请求转化为内部的高性能 rpc, 调用。四、日制审计,记录所有经过的流量数据。最后总结一下,网关不是某一种特定的硬件,而是一种逻辑角色。 在家庭网络里,它是你的路由器,在工业控制里,它是协议翻译器。在软件架构里,它是微服务的入口。它的核心意义在于通过一个统一的接口,将复杂不兼容的两个网络系统连接起来,实现数据的安全交换与转发。 好了,本期的分享就到这里,若有疑问或想了解的技术知识点,可在评论区留言,我们下期再见!
粉丝14.1万获赞60.5万

有些朋友咨询我,电脑关机重启之后应该如何重新启动 openclaw? 我 们一起来看一下。首先我们按 win 加 r, 这里输入 cmd, 点击确认,打开命令行终端,在这里输入 openclaw get away, 如果你是中文版的 openclaw, 我 们这里输入 openclaw 杠 c n get 回,点击回车,稍等片刻,看到这个页面就已经启动成功了,我们再回到我们的浏览器,就可以进行正常的对话。我们要保证一直不关闭这个命令行终端,如果我们点击关闭的话, 就会与我们的网关断开连接。当然有一些朋友会设置开机自动启动 openclaw 网关。其实我不建议大家这样做,因为 openclaw 的 权限还是很高的。使用这条命令,快去重新启动你的 openclaw 吧!

你有没有想过,一个真正可控的 ai 智能体框架应该是什么样的架构?今天我们来深度解析 opencloud, 一个不走寻常路的 ai 智能体框架。 opencloud 的 核心思想是以 getwave 为中心的本地优先 ai 控制平面,它不是那种传统的微服务聊天机器人,而是单机控制平面,加上内嵌智能体运行时的架构。整个系统分五层,第一层,接入层, 负责连接 whatsapp、 telegram、 slack、 discord 等消息平台以及 c、 l i 和各种客户端, 这些入口统一接到 getaway, 而不是各自直接驱动模型。第二层,控制平面层,也就是 getaway, 是 系统的唯一真相来源,负责绘画列表、路由状态管理, 默认监听本地的一万八千七百八十九端口。第三层,执行层,也叫 a 帧、 run time u p 杠、 aint 杠,括号视线, 完成上下文组装模型推理、工具执行和流逝输出,默认超时六百秒。第四层,能力层,内置工具调用能力 skills 按需加载系统提示词里指注入技能的名称和描述,真正的技能文件,用到时才读取。 第五层,状态层,包括工作区文件、绘画记录和记忆缩影,绘画历史以 j s o n l 格式存储在本地磁盘。那么一条消息是如何在这五层里流转的呢? 消息先进入通道 gateway, 根据规则选择对应的 session 和 agent, 然后 runtime 动态组装系统提示词, 把工具列表、技能列表、当前时区、工作区文件和历史记忆一起注入上下文,接着调用模型,模型如果需要使用工具就执行工具, 把结果回填给模型指导完成最后流逝输出回复,同时把绘画记录和更新的记忆写回磁盘和缩影。这条练物的设计重点 是同一条绘画内的状态一致,而不是单纯追求并发量。系统提示词每次运行都是动态重建的,每个文件截断上线是两万字符,所有 bootstrap 文件总上线是十五万字符。 open cloud 的 绘画设计是一个核心亮点。默认情况下,每个 agent 的 私信共用一个主绘画,也就是 dm scope 等于 main 绘画键,由 git 统一管理, 格式是 agent 冒号 agent id 冒号 main key, 这是实现多通道统一人格的基础。绘画每天凌晨四点在 getway 主机本地时间自动重置,但这里有一个重要的安全警告,默认的 me 模式会让所有用户共享同一个绘画上下文, 不同用户的信息可能互相泄露。如果你的 a 诊托接收多个用户的消息,必须把 d m scope 改为 p r 杠 channel 杠 peer 按渠道和发送者隔离,或者 poor 杠 account 杠 channel 杠 peer 按账号加渠道加发送者三层隔离。 群聊则始终有独立的绘画模型,是按 size 串行,按通道限流的队列设计。 同一个 session 内,同一时刻只有一个活动运行,避免工具调用和绘画状态互相冲突。但不同 session 可以 并发, main 通道默认并发四 safetent 通道默认并发八默认防抖一千毫秒,每绘画排队上线二十条。记忆系统是另一个亮点。 open cloud 的 记忆本质是工作区里的纯 markdown 文件,文件是唯一的真相来源。 记忆分两类,一是 markdown 文件,包括每日记忆和长期记忆。二是向量剪索缩影默认使用 memory call, 如果 x r o t v 可用,就在 sq lite 内加速,否则回退到 javascript 内加速,否则回退到 javascript 用于语义剪索。 memory 下划线 get 用于安路径精确读取。当绘画接近上下文窗口上线时, openclaw 会先执行静默记忆刷新提醒模型,把重要内容写到词盘,然后再触发自动压缩。 openclaw 提供了两套 hook 机制,让开发者在关键节点扩展行为。内部 hook 主要有 agent boostrap, 可以 在系统提示词最终确定前增减 boostrap 文件以及各种命令 hook 响应 new reset, stop 等指令。 插件库更加丰富,运行在 agent loop 或 gateway pipeline, 比如 before 下划线 model 下划线 resolve 可以 在模型解析前覆盖 provider 和 model。 before 下划线 to 下划线 call 和 after 下划线 to 下划线 call 可以 拦截工具的参数和结果。 message 下滑线 received 和 message 下滑线 send 覆盖消息的入站和出站生命周期。 gateway 下滑线 start 和 gateway 下滑线 stop 则对应 gateway 的 整个生命周期。 这套 hook 机制让 openclaw 具备了很强的二次开发能力,可以在不修改核心代码的前提下灵活扩展各种能力。总结一下 opencloud 的 架构,亮点有四个,一、 gateway 单点控制 local first 部署,默认不暴露公网。二、动态上下文组装 scales, 按需加载, 兼顾性能与灵活性。三、按 size 串形的并发模型,保证状态一致性。四、 markdown 文件为唯一真相来源的记忆系统,透明可调试,可持久化。如果你在评估 ai 智能体框架, opencloud, 这套架构设计非常值得深入研究。 本期视频内容整理自 open core 官方文档和架构设计文档,感谢观看。如果觉得有帮助,点赞投币收藏,支持一下关注我,下期再见!

想象一下,你花了半小时向 ai 助手解释你的项目架构和编码编号,得到了一次满意的协助。第二天带着新问题回来,他却一脸茫然。 每一次对话从零开始,是当前 ai 助手最大的体验短板。这不是模型不够聪明,而是他缺少一个关键能力,记忆。 opengl 是 一个开源的 ai agent 网关平台,他的记忆系统试图从根本上解决这个问题。那么这套记忆系统到底是怎么构建的? 让我们从整体架构开始拆解。 opencloud 记忆系统由约七十个 type script 原文件组成,整个模块采用三层类继承架构。基础层 memory manager syncops 负责数据存储、文件监控和锁影重建。 中间层 memory manager embedding ops 负责嵌入向量的生成、缓存和批处理。顶层 memory index manager 作为搜索入口,提供状态查询和对外接口。上层继承,下层层层递进。这三层听起来有点抽象,我们用一个更直观的类比来理解。 你可以把整个记忆系统想象成一座图书馆。基础层是书架管理员负责图书的入库、上架和盘点。中间层是翻译官把文字转化为机器能理解的数学向量。顶层是导览员面对读者的提问,迅速找到最相关的书页。 有了这个整体画面,我们接着看看这座图书馆里的书,也就是记忆的数据是从哪里来的。 记忆的数据来源有两类,一是用户主动维护的 markdown 记忆文件,比如 memory 点 md。 二是历史绘画记录,也就是 jason l 格式的对话日记系统将这些文本切分为 chunk 生成嵌入向量后存入 sql 数据库,建立起可被高效解锁的记忆缩影。 数据存下来了,但光存还不够,关键在于怎么搜。举个例子,当你搜索 python 装饰器时,权威解锁能轻松命中。但换一种说法,怎么给函数加额外行为,权威解锁就无能为力了。所以 openclaw 实现了 bm 二五加向量语义的混合搜索。 bm 二五擅长精确的关键词匹配,速度极快。向量语义解锁通过嵌入模型捕捉语义层面的关联,两路结果按七比三的权重加权融合,再经过时间衰减调整和 mmr 多样化重排,最终产出高质量的解锁结果。 刚才提到了时间衰减和 mmr, 这两个机制非常关键,我们展开来看,想一想三天前讨论的 bug 修复方案和三个月前随口提到的想法,它们的权重应该一样吗?显然不应该。 openclaw 引入了指数时间衰减模型,灵感来源于心理学的遗忘曲线, 一条记忆经过三十天后权重衰减为一半,六十天后只剩四分之一。但有个精妙的设计,系统自动区分长清知识和时效信息, memory 点 md 这类核心文件不受时间衰减影响。就像你会忘记上周二午饭吃了什么,但不会忘记骑自行车的方法。此外, mmr 算法确保搜索结果不会被同一篇文档的重复内容霸占,每条结果既要与查询相关,又要与已选结果尽可能不同。 说完了搜索策略,我们再来看看搜索背后的基础设施。嵌入模型的选择。羽翼解锁依赖嵌入向量,而嵌入向量需要模型来生成。 openclock 内置了五种嵌入提供商, openai、 gemini、 voyage、 mister 和本地模型。在默认的 auto 模式下,系统按优先级链式尝试,真正体现工程功力的是它的四级降级链条。 即便在最极端的情况下没有任何 api key, 没有本地模型,系统依然能通过 scuttle、 fts 五权威检测,提供基本的记忆搜索。这种绝不崩溃的韧性设计,是面向终端用户产品不可或缺的品质。 当然,韧性不仅体现在降级策略上,性能优化同样值得深挖。 embedding api 调用既耗时又烧钱。 opencloud 通过 embedding cache 表实现了内容感知的缓存,同一段文本只需计算一次嵌入。更精巧的是锁影全量重建的处理方式。当需要重建锁影时,系统采用双数据库原子交换策略,在后台构建新锁影的同时,旧锁影始终可用于查询, 构建完成后,通过 rename 操作原子性的切换,整个过程用户感知不到任何中断,这是蓝绿部署思想。在嵌入式数据库层面的应用,除了锁影重建,日常的增量更新同样需要一套精心设计的同步机制, 记忆系统需要随着用户活动持续演进, openclaw 设计了三条并行的同步通道,文件监控、实时监听、变化绘画增量、同步追踪、新增内容定时轮询作为兜底,三条通道互为补充,既灵敏又不过度消耗资源。 此外,在中文解锁方面, openclaw 选择了无词典的字级别加 biggram 策略,不依赖专业分词库,在保持清亮的同时,实现了足够好的召回率。 到这里,我们已经完整走过了整个记忆系统的各个模块。最后来做一个总结,回顾整套记忆系统,它的设计哲学可以总结为四点,混合优于单一 b m 二十五和向量搜索融合互补。 韧性优于性能。四级降级确保服务不中断。仿生优于机械时间衰减模拟人类认知规律务实优于完美。在够用和复杂之间选择前者。当 ai 开始拥有记忆,它就不再只是一个工具,而是一个能理解你、记住你、越来越懂你的伙伴。

各位好,今天我们来分享 openclaw 系统的架构设计。 openclaw 不是 简单的服务堆砌,而是一个围绕 getaway 构建的统一智能代理平台。通过六层架构设计,它实现了从接入层到自动化层的完整闭环。接下来我会逐一展开每一层的核心设计思路和技术实现细节。 opencloud 的 核心架构定位非常清晰,以 get 位为中心构建统一控制平面。在单个 get 位实体内部,我们集中管理了渠道接入、设备连接、绘画、状态、消息路由、 a 帧的调度等关键能力。 整体架构分为六层,从接入层到自动化层层层叠统。部署上,通常一台主机运行一个 get 位,但在特殊场景下也支持同机部署多个完全隔离的 get 位实体。 接入层是系统的入口,负责统一汇聚各种外部对象。它包括三类核心对象,外部消息渠道、控制端、客户端和节点设备。 外部消息渠道如 whatsapp、 telegram 等,由 git 位内部维护。对应的适配器控制端如 client web 管理界面,通过 web socket 接入。节点设备如 micros、 alrad 等也通过 web socket 连接并申明自己的能力。 这些对象不直接通信,而是统一汇聚到 get 位,进行中转、叫验和编排。 get 位控制层是整个系统的中枢纽, 相当于平台的总线和总调度台。它通过 web socket 提供控制平面,通过 http 提供健康检查、工具调用以及 canvas、 r u i 等辅助接口。 这一层负责连接握手、身份认证、协议校验、消息归一化、事件发布、通道状态维护和系统级控制。 所有连接、所有消息、所有控制指令都要经过这一层的统一调度。绘画与路由层决定了系统为什么能在多渠道、多群主、多用户场景下仍保持上下文隔离。他把来自不同渠道的消息抽象成统一事件, 再根据绘画键、渠道群主用户身份和 agent 绑定规则完成路由绘画。系统负责上下文、历史生命周期重置策略、压缩策略和持久化存储。 为减少病发冲突,系统按绘画维度串行处理,同意绘画中的任务顺序执行不同绘画,再交给局调度机制协调。 agent 运行时是真正负责理解请求、调用模型执行任务的核心引擎。 它嵌入在 get 位内部,主链路包括接收、输入、装配、上下文、读取、工作空间、文件选择、模型、触发、推理、调用工具、处理、工具、结果流逝、输出、写回、绘画与记忆、 工作空间中的 agents m d、 so m d、 tools r amp。 d 等文件,共同决定 agent 的 角色设定、行为边界、工具权限和上下文风格。简单说, getaway 偏向平台控制与调度, agent run time 偏向智能推理与执行。 agent 的 能力不止来自模型,更来自强大的工具系统。 openclaw 内置了文件命令、执行进程、网页浏览器、绘画记忆、消息节点等多类工具 节点。系统把能力延伸到设备侧,比如相机、屏幕、录制、定位以及 converse 交互能力。记忆系统负责跨绘画信息保留和语义解锁。多 agent 机制则支持主 agent 调用,子 agent 用于专业分工、复杂任务拆解和隔离执行。这些能力共同构成了 agent 的 执行基础设施。最后一层是扩展与自动化层,这体现了 opencloud 可扩展架构设计。插件系统可以扩展新的渠道、新工具、新后壳、新的记忆后端, 甚至新的模型提供者。互可和矿分别提供事件驱动和时间驱动的自动化能力,适合做通知、同步巡检和批处理流程。因此呢, openclaw 不 只是一个聊天代理,而是一个可以持续外接能力的自动化平台, 能够根据业务需求不断扩展边界。现在我们来看完整的架构全景。六层架构,从接入层到扩展层,层同共同构建了以 get 位为中心的统一智能代理平台。 接入层统一汇聚,控制层统一调度,路由层上下文隔离、 agent run time 智能执行能力。系统提供工具支撑,扩展层持续增强能力。六层之间通过 get 位这个控制中疏紧密连接,形成了一个完整、灵活、可扩展的智能代理平台架构。 以上就是 openclaw 的 完整架构设计,通过六层鞋桶,我们构建了一个以 getway 为中心的统一智能代理平台,既保证了系统的统一控制和调度,又实现了足够的灵活性和可扩展性。谢谢大家!

大家好,最近很多人都在装这个叫 opencloud 的 ai 助理,把它当自己的小龙虾助手,它到底咋自动帮你干活的?今天用大白话给你拆明白。一、第一道门给喂你从手机、电脑、聊天软件发的指令,得先过这道门,对, 他先确认是你本人,再把指令送到对应的功能模块。没他的话,助理根本不知道谁在发命令,跟家门没开,你喊破喉咙也没人理一个道理。 二、大脑 agent 这是助理的大脑负责想明白你要干啥,分几步做,该用啥工具。它不是瞎执行,会边做边调整,比如发现任务不对,会自己改计划,跟个会思考的小管家似的。三、工具箱 skills 大 脑想明白了,得有工具动手吧。 skills 就是 这个百宝箱,里面有发邮件、写代码、操作浏览器这些功能, 没这箱子,大脑想得再明白,也只能干瞪眼。四、聊天线 canars 不 管你用啥软件,他都听得懂,你用微信、飞书还是网页跟他聊,他都能把你的话转换成自己能理解的格式。换个聊天软件,他还是那个懂你的助理。五、 手脚 nose 你 在客厅,他能远程操控卧室的手机、书房的电脑,打开文件、改文档, 甚至调用摄像头,就像给云端大脑安了手脚,能在你所有设备上干活。六、记性 memory 你 不用天天说我不吃辣,十点提醒我,他会记住你的偏好和历史操作, 聊过的天,提过的需求他都存着,还能越用越懂你。七、主动巡逻 heartbeat 他 不是等你下令才懂,会自己主动检查你的邮箱日历,发现异常就提醒你。比如快递到了,会议快开始了,他会自己盯着 八定时闹钟铳每天叫醒、每周总结、每月缴水电费,这些定时任务它都能管好,到点就自动执行,不用你盯着。 当这八个能力一起运作, open class 就 真的能自动干活了。你发个指令,它确认是你想清楚咋做,拿出工具在你设备上执行,还能记住你的习惯。你没下令,它也会自己巡逻到点做事。它不是普通聊天机器人,是个能思考、记事、动手提醒、 跨设备帮你干活的智能助手,而且越用越懂。你觉得有用的话,点个赞,关注一下,对,带你搞懂更多 ai 干货!

面试官问,最近 open class 这么火,你知道它的原理吗?那最近要面试的兄弟,这题一定要准备, open class 火到什么程度呢?中午吃饭我爸都在问我,那个龙虾到底是啥? 这么出圈的东西,面试被问到你答不上来就很减分了。那这题只需要抓住两个核心,架构和运行时机制,架构分两层,运行时机制分六步。那最后我再补几个面试官容易追问的点,帮你把这题彻底拿下。那先说架构。第一层叫 getaway, 往关层负责收消息,不管是 telegram 还是 whatsapp, 统一格式往里送, 同时做健全路由分发。第二层叫 agent running time, 运行时程,真正干活的地方接消息,组装上下文,调模型,执行工具全在这一层,重点就在这一个运行时里面的循环。那这是 opencloud 区别于普通聊天机器人的关键,那用户发一条信息进来, agent 不是 丢给大模型?拿回答案就完事了。 第二步,组装上下文,把历史记录系统、题词工具列表全拼好。那第二步,调大模型,把组装好的上下文一起发过去。 第三步,解析响应大模型,如果直接回复文字,这时候循环结束。如果回复,我需要调个工具,比如搜个网页,读个文件,那就进入第四步,执行工具等工具拿到结果进入第五步,把工具的结果塞回上下文。 第六步,带着新的上下文回到第二步,再调一次大模型,那这个循环会一直转,直到大模型认为任务完成,输出最终文本。那这就是 react 的 范式,想做看再想。那除了这个循环, open class 还有个很重要的差一点在于,它内置了一套丰富的工具生态,能直接操作操作系统, 读写文件、执行中断命令、浏览网页、调外部 a p i 等等。那普通聊天机器人就算有循环,没有这个工具,也只能回复文字,那有了这个工具的 open cloud 相当于被加上了手和脚,真能干事了。 那原理讲到这就差不多了,但面试官很可能会追问,比如工具调用失败怎么处理?你别回答什么 check cash, 那 失败的错误信息会作为结果回填到上下文,理由大模型自己决定的。当然从事不是无限的 系统层面,有迭代制度的上线兜底。那这个细节我们后面再单独讲。那面试官还可能追问,任务很复杂,上下文不够用怎么办?那首先 skills 是 按需加载的,平时只放原数据进去,命中了才展开完整内容,对 对话太长会触发 compaction, 用模型把早期对话压缩成栽药,压缩之前还有 memory flash, 先把关键信息写到词盘上,不会丢数据。好了,这里达到这个程度就差不多了。关于 open cloud 的 面试题,我会持续更新完整文字版的配图和更多面试官追问。已经整理到了面试呀,方便你反复消化,觉得有用,点赞收藏,关注我,拿下面试,我们下期见!

windows 模块是 open cloud 的 另外一个核心组建,它提供了一流的工具系统。 open cloud 将工具分为九个组, 每个组包含了 read、 write、 edit、 apply、 patch 四个工具,用于文件的操作。 read 是 读取内容, write 是 写文件, edit 是 编辑文件的特定部分。 apply patch 运用结构化的赋叠。 第六组是运行时,它包含了 execute、 batch、 process 三个工具,用于执行命令和管理进程。 第三个是 session 绘画组,它包含了 session list、 sessions、 history、 sessions spend、 session spend 四个工具,用于绘画协做法。布组包含了 web search 和 web fetch 两个工具。 一个呢是通过 browser search api 搜索网络。 web fetch 呢,就是获取和提取 url 的 具体内容。 那 ui 组包含了 browser 和 covers 两个工具,用于图形界面操作。 browser 控制专用浏览器, covers 驱动节点。 covers 自动话组包含了 glow 和 getaway 两个工具。 glow 呢,是管理定时任务。 getaway 控制网关,包括了重启啊,配置啊等等。再者是消息组,它只有一个 message 工具,用于发送消息到各个渠道。 再者是节点组,只有一个 note 工具,用于发现和定位,配对节点,发送消息,捕获相机和屏幕。 最后是内存组,它包含了 memory search 和 memory get 两个工具,用于长期记忆的管理。另外, open cloud 提供了灵活的工具配置策略,包括了三个层面 工具,配置文件、设置基础工具允许列表。另外, open cloud 提供了灵活的工具策略系统,包括三个层次工具配置文件 设置基础工具允许列表有四个预定义的配置文件, minimal coding、 message 和 for 这四个。接着是按提供商的工具策略, 可以为特定的模型提供商和模型进一步限制工具。比如你可以为谷歌的 anti gravity 设置 minimal 配置文件,而其他的模型使用 coding 配置文件。允许拒绝列表是最细力度的控制,你可以明确允许或拒绝特定工具或工具组。这种分层的 工具策略系统提供了极大的灵活性,可以根据不同的场景和安全需求精准控制代理的能力。 microsoft control 是 openclaw 最强大的功能之一,它提供了完整的浏览器自动化能力。 openclaw 使用 claw dev tools protoco 来控制浏览器,就是 cdp 协议啊, cdp 呢是 clone 和 clone 提供的底层协议,允许外部程序完全控制浏览器的行为。 openclaw 管理专用的 clone 或 clone 的 实力,不会干扰用户的热场浏览器的使用。 opencloud 支持多配置文件,每个配置文件是一个独立的浏览器实力,有自己的用户数据, cookies 扩展等配置端口,使用的范围是 一万八千八百到一万八千八百九十九,理论上可以控制约一百个浏览器的实力。 并且啊,浏览器工具呢,提供了丰富的操作,比如这个导航操作包括了 open navigate, 就是 导航到 url, focus, close 等等。 然后是交互操作,它可以通过 act 的 方法去实现,支持点击输入、按键选填、拖动、选择、填充等等。这些操作使用快照返回的引用,而不是 css 选择器。 另外快照操作包括 snapshot 和 screenshot, 高级操作还包括了 console, pdf upload, dialog 等等。浏览器控制的场景应用非常的广泛,比如网页的抓取代理可以访问网页抓取数据处理分页处理动态内容 表单自动填写代理可以登录网站填写表单,提交数据处理验证码等等。还有是 u i 测试代理,可以模拟用户操作验证页面行为截图对比。