open k 二一百个邪修用法第三期,这个排第一应该没有人有意见吧,社区六十 k 加 star 几乎人手一个,相当于给 ai 装了个项目经理的脑子。装了之后 ai 不 会上来就瞎干,会先跟你对其需求开成小任务,逐步执行所有其他技能,配合他用,效果翻倍。 第二个 skill canvas design, 它不是用来画各种搞怪头像的,它贯彻了一套极简主义和严格考究排版的哲学。它能像人类顶尖设计师一样在乎自体自重留白和空间感, 产出极其符合高级商业咨询风格的信息图和海报,再也不用求着设计小姐姐排期了。第三个 skill frontendify, 不 懂设计和代码的福音。它可以强迫 ai 摒弃那些泛滥廉价的 ai 味儿。基于强烈的美学观点,生成具备极高审美、达到生产级水准的系统交互界面, 向上级汇报业务逻辑或向跨部门宣讲时,直接扔出一张高保真的交互视觉图,让沟通成本直线下降。第四个 skill duck skill, 可以 说是天天写材料的文职打工人王炸。 它能极其精准的读取已曾修改甚至组装 word 文件,能自动保留各种复杂的红头格式,甚至开启专业文档的追踪修正模式。 绝不是简简单单的让 ai 生成一段话,你去复制粘贴。第五个 skill x l s x 数据清洗做图标,写公式扔给 ai 就 行,再也不用问别人 vlog 怎么用了。第六个 skill humanizer, 用 ai 写完稿再跑一遍,自动把此外置关重要这些 ai 类词汇干掉,发出去读起来像人写的。客户都说最近的文案有灵魂了。
粉丝1029获赞4035

今天啊,我们用两分钟的时间,把最近爆火的龙虾 ai 从原理到用法一次性讲透啊,到底是什么,怎么来的,为什么这么火?它厉害在哪里? 我们普通人能用它干什么?以及怎么用才安全。那首先呢,龙虾是什么呢?它不是普通的聊天机器人哦,而是一个开源的 ai 智能体,最大的特点就是不止跟你对话,还能自己动手操作,电脑自动帮,我们就把事给做了。那第二呢,龙虾 ai 到底是怎么火起来的?它本名呢,叫 opencloud, 二零二五年底由海外的开源团队做出来的,因为图标是红色的,龙虾英文名又带 klo 钳子,于是大家就顺口叫它。龙虾 ai 一 开始只在技术圈里流传,后来呢,因为完全开源啊,还能本地部署,还能直接操控软件,一下子就出圈了。第三,他为什么突然能爆火?核心就三点啊, 一是能力真的升级了,从只会回答问题变成能自己动手执行任务。二是门槛低,开源免费,不用懂太多代码, 普通人也能装。那三是用处太实在了,专门解决办公啊,学习呀,那些重复又繁琐的活,解放双手。那第四,龙虾 ai 最特别的地方在哪呢?普通 ai 给你答案,要你自己复制粘贴,动手操作。 但龙虾 ai 是 听懂任务拆解步骤,打开软件自动执行,直接就出结果了,它能自己跑完一整个流程,相当于我们普通人来说,它到底能干嘛?用处特别落地啊, 想办公的时候,自动整理文件,做表格,写总结,发邮件。学习的时候呢,帮你查资料,整理笔记,提炼重点,做内容创作的时候呢,写文案、排版、提取信息都能教给他。 生活里面我们查信息啊,做提醒啊,批量处理文件,非常省心。简单的来说啊,重复的活都丢给他,然后把时间省给自己。那我们普通人怎么用才正确,才安全?记住这三步,第一,走正规渠道部署,优先用图形化的界面,先不要去敲命令,行。 第二,权限别给太满,只开必要的,不随便给高危系统权限。那第三,指令说清楚,告诉他做什么,要什么,格式,存在哪里,任务越明确,效果越好。那龙虾 ai 不是 概念炒作哦, 它代表的是 ai 真正从洞口转向了动手开源、免费能干活,它正在变成我们普通人提高效率的新一代工具。想跟上这部 ai 效率革命,想自己动手部署一只属于自己的龙虾。点我的头像,我把完整的教程发给你。

一个视频告诉你龙虾欧根库奥背后的原理到底是什么。如果你拿大模型给他发一个消息,那么他就会根据你的消息给你一个回复,这样你就得到了一个最原始的 ai 聊天工具。然而,大模型只能根据你发送信息进行单次的回应。你们聊了这一句,忘了上一句,压根无法进行有效的对话。 于是你灵机一动,每次发送新消息时,都会把旧的聊天记录打包一起发过去。有了上下文,模型终于有了记忆,你们终于可以愉快的聊天了。可你很快又发现了一个问题,虽然此时的模型有了记忆,但仍然没有改变你一句我一句的聊天形式。只要你不主动给他发消息,他就原地挂机,不会理你。 可你不可能一天二十四小时守在电脑前给他写提示词。这样一来,他就只能帮你做一些琐碎的小事,无法自动帮你完成一些长期复杂的任务。当然,这也难不倒聪明的你,既然你没办法盯着他干活,那么设置一段程序自动盯着不就好了吗? 于是你动手写了一段简单循环脚本,每次大模型输出后,都让他自己判断任务是否完成。如果判断任务还未完成,那么脚本就自动把刚才的对话记录重新喂给他,让他继续思考。直到模型认为自己已经大功告成,在输出中调用 finish 结束函数,整个循环才停下了。 当然, ai 偶尔也会脑子抽筋,陷入死循环或者疯狂报错。于是你又顺手给脚本加了最大循环次数限制,脚本终于稳定了下来。 这样你就得到了一个简易的 agent, 它可以在你离开电脑时也能独立的思考工作。可新的问题又随之出现,模型累积的上下文越来越长,眼看着就要达到模型的输入上限了, 如果继续循环下去,模型就再也无法正常工作了。你思来想去,突然想到大模型可以提炼长文本的信息,生成简洁的摘药。 于是你在脚本中加入了一个新的机制,如果当前的对话长度逼近红线,就立刻触发压缩机制,通过提示此要求,模型将对话框中几千字废话浓缩成高度精炼的摘药。 这下终于不用担心模型被超长的上下文撑爆了。不过对话框中的上下文虽然被凝练了,但凝练前的那几千字原声记录你也不舍得删,万一里面有啥重要信息以后用的到呢? 于是你让脚本新建了一个 markdown 格式的绘画保存文件,将这段超长对话一字不落的写入该文件,并保存在绘画文件架。 现在对话框只剩下被凝练后的摘药了, ai 又可以愉快的干活了。但你认为这些摘药也是极其重要的信息。你又按照日期新建了一个 markdown 日制文件,将每次凝练后的摘药也存入了进去。 从此以后,你每天都会按日期新建一个日记文件,专门存储明面后的摘药。如此一来,脚本每次调用模型时,只需要将最近两天的日记文件加入提示词,就能立刻唤醒他的近期记忆了。 就这样,模型拥有了自己的短期记忆。可是光有两天的短期记忆还不够,你想要给它完整一生。于是你又新建了一个叫 memory 点 m d 的 长期记忆文件,将摘录中的那些长期结晶,如用户的私人偏好、项目、重大决策给抽取出来,写入其中, ai 就 拥有了它的长期记忆。 你的脚本只需要带着近期日记和长期记忆去唤醒 ai, 它就能自然流畅的进行长期任务了。而你所保存的完整绘画记录也不会闲着,如果需要 ai 回忆某个久远的细节,它就能去绘画文件夹里一字不落的搜索出来。 有了这套丝滑的记忆系统,你再也不用担心 ai 失忆了,它们就保存在你的硬盘里,直到永远。现在 ai 的 记忆问题解决了,但还有一个问题让你头疼,模型只会输出文本,你该如何让它操控电脑干活呢?一开始你想的简单粗暴, 计算机的底层不过是一些代码命令行,那么直接丢给 ai 一个最高权限的射奥终端,让他直接生成底层的命令,不就能操控电脑了吗?可真正尝试后才发现,这是一场惨不忍睹的灾难。目前的 ai 并不可靠,一个小小的幻觉都会让你的电脑崩溃, 无奈你只好放弃这条危险的底层直连。你想到之前工作时写过一些简单的功能性程序,比如发送邮件、抓取网页的脚本,这些脚本由确定的程序编写,只需要输入相应的参数,就能自动执行并返回确定的结果。于是你灵机一动,将这些写好的程序整合到了你的平台中。 现在你不需要 ai 直接敲代码,只需要让它根据不同的任务脚本生成对应格式的 jc 参数,就能通过这些脚本间接操控你的电脑,不管是浏览网页、整理表格,还是直接读取屏幕、操控鼠标, ai 都能轻松完成。同时,你也给这些脚本起了一个响亮的名字, skill! 一个极其清亮、即插即用的技能拓展框架。未来你还打算将平台全面开源,这样全世界的开发者都能编辑上传各种各样的 skill, 你 的 ai 也将会越来越强。 最后,为了能够让 ai 随时随地的在电脑上接受你的指令,你将平台的网关打通,让模型通过 api 接口与主流的聊天工具对接。 现在,你只需要掏出手机,就能像和朋友聊天一样,在手机上和你的 ai 助手沟通了。恭喜你发明了开源的自主 ai 智能体 openclo, 你 知道他可能还不够完美,但你不会放弃优化,相信终有一天你能做出像人类一样工作的 ai 助手。

各位好,今天我们来分享 openclaw 系统的架构设计。 openclaw 不是 简单的服务堆砌,而是一个围绕 getaway 构建的统一智能代理平台。通过六层架构设计,它实现了从接入层到自动化层的完整闭环。接下来我会逐一展开每一层的核心设计思路和技术实现细节。 opencloud 的 核心架构定位非常清晰,以 get 位为中心构建统一控制平面。在单个 get 位实体内部,我们集中管理了渠道接入、设备连接、绘画、状态、消息路由、 a 帧的调度等关键能力。 整体架构分为六层,从接入层到自动化层层层叠统。部署上,通常一台主机运行一个 get 位,但在特殊场景下也支持同机部署多个完全隔离的 get 位实体。 接入层是系统的入口,负责统一汇聚各种外部对象。它包括三类核心对象,外部消息渠道、控制端、客户端和节点设备。 外部消息渠道如 whatsapp、 telegram 等,由 git 位内部维护。对应的适配器控制端如 client web 管理界面,通过 web socket 接入。节点设备如 micros、 alrad 等也通过 web socket 连接并申明自己的能力。 这些对象不直接通信,而是统一汇聚到 get 位,进行中转、叫验和编排。 get 位控制层是整个系统的中枢纽, 相当于平台的总线和总调度台。它通过 web socket 提供控制平面,通过 http 提供健康检查、工具调用以及 canvas、 r u i 等辅助接口。 这一层负责连接握手、身份认证、协议校验、消息归一化、事件发布、通道状态维护和系统级控制。 所有连接、所有消息、所有控制指令都要经过这一层的统一调度。绘画与路由层决定了系统为什么能在多渠道、多群主、多用户场景下仍保持上下文隔离。他把来自不同渠道的消息抽象成统一事件, 再根据绘画键、渠道群主用户身份和 agent 绑定规则完成路由绘画。系统负责上下文、历史生命周期重置策略、压缩策略和持久化存储。 为减少病发冲突,系统按绘画维度串行处理,同意绘画中的任务顺序执行不同绘画,再交给局调度机制协调。 agent 运行时是真正负责理解请求、调用模型执行任务的核心引擎。 它嵌入在 get 位内部,主链路包括接收、输入、装配、上下文、读取、工作空间、文件选择、模型、触发、推理、调用工具、处理、工具、结果流逝、输出、写回、绘画与记忆、 工作空间中的 agents m d、 so m d、 tools r amp。 d 等文件,共同决定 agent 的 角色设定、行为边界、工具权限和上下文风格。简单说, getaway 偏向平台控制与调度, agent run time 偏向智能推理与执行。 agent 的 能力不止来自模型,更来自强大的工具系统。 openclaw 内置了文件命令、执行进程、网页浏览器、绘画记忆、消息节点等多类工具 节点。系统把能力延伸到设备侧,比如相机、屏幕、录制、定位以及 converse 交互能力。记忆系统负责跨绘画信息保留和语义解锁。多 agent 机制则支持主 agent 调用,子 agent 用于专业分工、复杂任务拆解和隔离执行。这些能力共同构成了 agent 的 执行基础设施。最后一层是扩展与自动化层,这体现了 opencloud 可扩展架构设计。插件系统可以扩展新的渠道、新工具、新后壳、新的记忆后端, 甚至新的模型提供者。互可和矿分别提供事件驱动和时间驱动的自动化能力,适合做通知、同步巡检和批处理流程。因此呢, openclaw 不 只是一个聊天代理,而是一个可以持续外接能力的自动化平台, 能够根据业务需求不断扩展边界。现在我们来看完整的架构全景。六层架构,从接入层到扩展层,层同共同构建了以 get 位为中心的统一智能代理平台。 接入层统一汇聚,控制层统一调度,路由层上下文隔离、 agent run time 智能执行能力。系统提供工具支撑,扩展层持续增强能力。六层之间通过 get 位这个控制中疏紧密连接,形成了一个完整、灵活、可扩展的智能代理平台架构。 以上就是 openclaw 的 完整架构设计,通过六层鞋桶,我们构建了一个以 getway 为中心的统一智能代理平台,既保证了系统的统一控制和调度,又实现了足够的灵活性和可扩展性。谢谢大家!

刚装完 opencl, 先别急着去技能商店乱逛,很多人一上来就装一堆 skill, 结果不是不会用,就是越装越乱。对于刚开始用 opencl 的 人来说,真正该先装的不是最花哨的,而是这九个底座工具。把这九个装上,你的龙虾才算真正能用。 第一个, agent browser, 这是浏览器自动化工具,它能让 ai 自己操控浏览器,点按钮、填表单、截图、下载文件,连实时渲染的网页都能读。说白了,它相当于给 ai 装了一双手,以前很多事你得自己点,现在它能直接替你做。 第二个, telltale web search, 这是龙虾的实时信息大脑,它能联网搜索最新资讯、数据和网页内容,解决了 ai 最容易翻车的一个问题。信息之后,装上它之后, ai 就 不是靠旧知识应答了,而是能查、能看、能实时更新。第三个, find skills, 这是技能发现神器,你不用一个个翻 skill 商店,只要直接用自然语言描述你的需求,它就能帮你匹配排行榜上的合适工具,相当于给新手装了个技能导航,特别适合刚上手根本不知道装什么的人。第四个,歪的,别小看这个技能,它非常实用, 它能直接理解自然语言中的天气查询,特别适合出行规划、自动化办公、日常提醒这些场景,你跟 ai 说一句话, 它就能把天气相关的信息快速整理出来,省掉你自己查的时间。第五个, self improving agent, 这是龙虾的智能进化引擎,它能记住你的思维习惯和做事风格,从每次出错里学习,还能自我修复、跨绘画保留记忆,你用的越久,它就越懂你。这个工具最大的价值不是聪明一次,而是长期越来越顺手。第六个, summarize, 这是信息核心提炼工具,网页、 pdf 优件、长文本、视频、字幕,它都能快速帮你总结重点,提炼核心价值。 现在信息太多了,真正稀缺的不是内容,而是快速抓住重点的能力。这个 skill 装上之后,你的信息处理效率会明显提升。第七个, skill water 这个我非常建议你一定要装,因为你装任何新的 skill 之前,它都可以先帮你做一次安全审查,检测恶意代码、拦截越界权限,阻止隐私泄露,还会给出安全评分报告, 相当于给你整个工具链装了个门禁。很多人只顾着装工具,但忽略了安全这个坑最好一开始就避开。第八个, creative agent, 他是给 ai 增加主动性的,让他从被动等你下指令,变成会主动规划、主动补全、主动优化。他还能记住历史,减少重复提问,不断优化自己的行为。说白了就是让你的龙虾不只是听话,而是开始会响。第九个, g o g 咕噜全家桶, 这个对海外办公、跨境电商、国际合作的人特别刚需,他可以帮你读邮件、写回复、自动分类整理,一站式操控 google 相关工具,那这个几乎就是 b 桩相。所以你会发现, 当装 openclaw 的 人最大的问题不是 skill 不 够多,而是不知道先装什么,装完也不会搭配着用。这九个工具本质上补的是九种底层能力,动手联网、找工具、查天气、会进化、会总结保安全、能主动管鞋座, 先把这些底座补全,再去装那些更细分的场景工具,你的 openclaw 才不会变成一堆看起来很强,实际上根本用不起来的技能合集。

包火的 openclip 到底能干嘛呢?有人用它在 shopify amazon 经营个人店铺,每月成本从两千刀降至四十刀,用它在 pollymarket 上做投资赚钱。有人用它接入机器人,让机器人在家里面给主人拍 vlog, 接入无人机,用 ai 控制航拍。我给大家找到了龙虾十大超实用、超酷炫的玩法, 覆盖投资、搞钱、学习、题校、生活、娱乐等等全网最全所有玩法的参考资料,代码 skill 我 都放到这个文档里面了。 long openclo 配合 obsidian、 lotion 等工具来搭建个人知识库也非常香。如果你也跟我一样,在某食物某号上收藏了超多好内容,但收藏及吃亏从来不会回看。那现在有了 openclo, 我 但凡刷到有价值的内容,就会直接转发给我的龙虾,它 就会自动提取内容的信息,然后标签,然后存到 obsidian 知识库里面,把之前散落在各平台的收藏夹里面的内容汇总到一起, 每天早上还会按 ibooks 遗忘曲线定时推送给我回顾,真正的把收藏家给盘活了, 非常适合学习复盘。如果你平常需要看各种行业资讯、新闻热点, openclip 也很好用。比如我安装了这个视频采集 skill, 让他收集近三天有关上的热门视频,他马上就能够把相关的内容收集给到我。他还会反过来问我是否需要帮忙收藏到知识库里面, 需要的话直接加到 opc 点知识库就好了。甚至如果你是在非书这类支持文档编辑到办公软件上养下,只用这一句指令,就能够将结果直接汇总进多位表格, 譬如我就让他收集了小破站知识区近一周的热门视频,你看呢?整理到这个文档包含的作者、播放、数据分区等等关键信息,点进去都是有效的。用 open curl、 联动非书这类工具 做信息的收集整理,可以大大的提升获取信息的效率。我还做了个提成了四小时财经资讯钉盘,能直接监控想要的投资行业的最新资讯 等。打开消息的时候,今天所有重要财经信息都已经整理好了,非常好用。还有这个定时提醒推送的功能, 还非常适合搞日程规划或者备忘助手。比如我告诉他,我要在下周三开一个内部选举会,他会记住这个时间点,然后到点了会提醒我记得开会,还能主动提醒我一些双单合同要尽快处理,同的小伙伴的报销单记得归档报销等等。 如果事情太多,还能够帮我确认档期是否冲突。我还看到国外的玩家为此搭建了一个网站,用日历仪表盘的形式展现日程,一目了然。 除了搞学习,还能玩点花的。比如这位韩国开发者 david, 就 搞了一个 ai 女友, 她拥有独立的人格和记忆能力,拥有社交账号,会分享生活的瞬间,甚至还能视频通话,除了没有真人肉身,与平常的异地恋没啥区别。还有公司直接将 openclo 研发做了一款叫 anyclo 的 ai 伴侣软件,你能和她边聊天边跑项目。 hey, yumi, tell me what are you doing right now? hey, babe orbiting your anime gta build ten terminal simmering。 通过这种日常的对话来下达任务,养龙虾的过程再也不枯燥了。只是 ai 伴侣这个概念很早就有了,只不过之前人们还只会和单一模型直接对话,但 open curl 的 出现, 能将更多人性化的功能集成到一个 agent 上。看下来我真的感觉技术越来越聪明, ai 陪伴真的会越来越接近真人的感觉了。除了情感陪伴, 人们还开发出了让 openclo 进入物理空间的方式。比如这位叫 stat 的 大佬,花了几个月的时间,让他的机器人集成各种激光雷达摄像头,现在直接用 openclo 来操控这个机器人。比如给 openclo 下达巡视房子的指令, openclo 就 能够自动操纵机器人巡逻和进入你的房子。 机器人上的摄像机能够帮你记录过往几天房子里面发生的各种事情,比如说车钥匙放哪了,厨房垃圾什么时候丢的等等等等。这个机器人就像妈妈一样,看着你在家里面的一举一动, 然后给你提醒。他们甚至还在开发让 opencl 控制无人机,然后可以直接通过对话指令,让无人机跟随汽车飞行。这是不是就意味着,现在操控上千台无人机做空中表演的活动之后可 能交给 opencl 来了?不敢想象,以后战场上的无人机说不定也是 opencl 这种 ai 工具来操控了。更让我惊讶的是,在 stash 的 摄像里面,未来所有的摄像头、无人机和机器人 都能共享同一套空间信息。比如办公室外的摄像头发现来了可疑人员,系统就会自动派无人机去巡查一下,看看是不是来者不善,如果是坏人来了, 系统也会让室内的安保机器人做好应对准备。还有国内的这位网友,也将 open call 接入了摄像头,搭建了一套小狗健康检测系统,来帮他监控狗狗的睡眠状况,还能对狗狗最近的睡眠情况做分析回顾,非常适合养了宠物的人,我也打算给我家三只猫猫搭一个这种健康检测系统。 还有用龙虾来做艺人公司的,比如这个叫 vegen 的 十八岁小伙,一点编程基础都没有,但他给自己讲了十五只龙虾就成了一家赛默公司。 每只虾都有不同的角色分工,图形设计师、动觉设计师、软件研发师。晚安专写媒体管理。这个龙虾团队二十四小时不间断干活,然后做出了一款叫 vugal 的 ai 剪辑软件,当它刚成年,就挖到了第一桶金。可以说在 opencloud 执行下,以前需要一个程序员团队才能做的事情,现在已 个人也能搞定了。一人公司真的越来越多,数据显示,过去三十天内起码有一百五十家驻厂公司用 openclo 赚到了钱。还有人用 openclo 搭建了一个修必返电商运营团队,用三只龙虾帮他监控修必返的店铺后台,每三十分钟就向他汇报一次订货量、退货量 情况之类的数据,相当于有一个线上仓库管理员只是帮你监督销售情况,真的省时省力。还有这个小哥,他有一家电商品牌店铺,之前的运营是去找外包做执行,每月最快的成本要两千刀。现在他用 open curl 把成本从两千降到了四十四刀,节省了将近百分之九十八, 简直可以说是零成本了。他是这么晚的,他用 open curl 直接从 ready 等平台收集消费者喜欢的款式,做产品研究,然后再 用 opencl 生成产品图、视频,在定时的监控竞品数据,还用 opencl 来自动选品,分析广告投放效果。过去电商全流程都需要人工来做,现在一个 opencl 几乎全能搞定了。除了做产品电商,越来越多的人开始 用 opencl 做自媒体了。像我就参考了这篇文章,给我的龙虾接入了 cds 二点零模型,他就能直接在聊天框里面生成视频, 再也不用一直切换 ai 视频平台了。还有个小哥用游戏主机养虾, 他的虾每天自动生成 tiktok 轮播素材,一周左右就获得了八百万的播放量。龙虾还可以根据你的指令自动生成文字、图片、视频发到社媒平台。 比如这位哥们,让他的 openclip 去歌曲,制作一个 ai 机器人的视频,然后发到 tiktok, 龙虾只用了十五分钟就完成了。 整体体验下来,对小白来说,养虾的过程还是很有挑战性的,但可玩性也非常高,我家未来的可能性非常非常多,现在还只是个开始。那这里是勋酱关注我,为你解锁更多普通人的 ai 玩法,我们下期见!

openclaw 系统构架底层原理好?大家好啊,这节课是咱们这个 openclaw 的 这个公开课,之前听过我课的同学在这个 vvip 课上听过我课的同学啊,知道我是主要做科研的啊,简单自我介绍一下吧,我是硕博毕业于海外某高校的人工智能专业,师从海外工程院硕士。 呃,国内的大长江团队啊,现在是博士两年毕业,现在是该领域上最年轻的全职助理教授啊。据我了解,反正是这样的啊,大概就是些这样的发文情况, 现在呢,也是主要做大模型 opencloud 它现在特别火嘛,那咱们也是趁着这股东风,那我们一起来看一下这个 opencloud 到底是个什么玩意儿? 好,咱们这堂课呢,主要会分三节来讲。第一个,我们会详细的去讲一下这个 ai agent 是 什么啊?我们都知道 openclaw 它很火, 但是 openclaw 它其实也只是 ai agent 的 一种而已啊,那它在这个普通的 agent agent 上,它有什么样的改进啊?或者说它到底是做了什么样的操作, 可以让他这么出圈,可以让他摆脱大大众对这个 ai agent 的 这个认知啊,可以进入到我们普通人的视野里面啊。第二部分呢,我们会讲一下这个 open code 的 底层架构啊,咱们既然来了这个课嘛,那就是知其然,我们更希望知其所以然啊, 现在网上有很多的教程啊,路客啊,大家应该都刷到过啊,大概就只会讲一下这个 openclaw 怎么用啊,大概是个什么玩意儿啊,但是它底层工作是怎么进行的,它怎么运行的?它用了哪些框架,用了什么样的技术 啊?这个可能一般涉猎的会比较少一点啊,这样,了解了底层之后,对咱们这种不管是做开发的同学,或者说做科研想用到这个 open code 的 同学,我相信都是会有点帮助的。最后呢,可能也是大家比较关心一点,我们做一下本地部署啊,链接一下推书。 好,因为咱们这个是个直播课啊,大家如果有问题可以发在这个弹幕上,我这边看到的话,会跟大家解答的。好,话不多说,咱们发车吧。好,我们先讲一下什么叫 a i a 阵的啊, 大家也知道,大概呢,在年前开始啊,就选选起了一个全民养虾热潮啊,左边是腾讯大楼, 腾讯大楼下面免费装虾啊,大家都看过新闻哈,说一代人有一代人的鸡蛋要领啊,那我们这一代人的鸡蛋是什么?去领一个小龙虾过来啊。那右边呢,是抛开我们这个现象不谈啊, openclaw 在 这个 github 上,它的新数啊,从二月一月底二月初开始就一路飙升啊,可能大多数原因呢,是得益于咱们国内的宣发能力啊,还有一些比较出圈的操作啊。那在这个这么火的一个现象后面, 我们不禁要思考一个问题啊,大家为什么非要来养虾啊?你拿到这个虾的时候,你知道他是干嘛的吗?或者说你能知道他能对你创造一个什么样的价值吗?你就去领啊,你鸡蛋囤多了还会放坏呢, 对不对啊,我,我个人觉得呢,现在大多数人啊,养龙虾主要还是以猎奇心为主啊,更多的呢,我觉得可能是我们家的哎, f o m o 在 作祟啊,就是 fear of missing out, 你 是怕错过这个技术啊,可能觉得哎呀,这是是不是一个像 g p t 一 样出来的技术,我如果不提早入局的话,我就要被淘汰啊,大多数人可能都是情心理对不对啊, 那也因为这个给他蒙上了一个非常神秘的一个面纱,那他到底是不是这么厉害,是不是这么神秘啊?我们其实只要理清这里面的结构原理就会发现啊,他其实还是一个很好懂的一个东西啊,对于我们个人来说, 要不要去部署这个 open klo, 或者说我们学这个 open klo, 我 们需要学到一个什么地步啊?我觉得要从它部署难度还有成本啊,还有一个呢,就是它安全性这三个方向来考虑一下啊。好,这个是前话。 好,那我们正式进入今天的课啊,讲一下这个 ai a n 的 以及到这个 open klo 的 这个发展历程啊,实际上已经落地的阴影,感觉没有那么强大,哈哈,这个我们到后面说啊,好, 我们说这个 agent 啊,其实在 agent 之前啊,它的前身其实还是大模型,就是我们最早熟知的这个 gpt 啊,以切的 gpt 为首的是一个传统的大语言模型啊, 说早不早啊,那个时候呢,大家其实对这个大模型最主要的概念呢,就还停留在问答上,就跟大家现在用用豆包一样啊,打开一个手机问个问题,他告诉你一个答案啊,那个时候还是以这个叫什么,以问答为主的大大语言模型时代啊, 但是呢,发展到 g p d 四的时候啊,三到四它其实是一个很大的跨越啊,那个时候呢,就已经出现了早期的这个大模型 agent 的 框架雏形了啊,大家那个时候可以发现,这个大模型好像不光只是简单的问答那么简单了 啊,他会用上一些。我们听过我之前的课的同学都知道,有个叫 react 的 框架啊,他会推理了啊,并且会做一些相应的操作啊,这个是早期的大模型 agent 的 啊,但是呢,那个时候他叫什么?他还是主要停留在类似于在大模型上做一个拓展能 力部部署的地方呢?还是服务器?还是云端?还是大模型厂商,我们的可操控性还是非常低的啊。后来呢, 再往后发展,大概有个半年到一年左右啊,这个时候呢,就有类似的推理模型框架出现了,我们在之前的 vip 课上也讲过啊,这个 v i m 啊,它的作用是什么呢?简单一句话就是可以搞了个框架出来呢, 帮你非常简单的可以把这个大模型给部署到本地啊,并且呢,他不光是一个问答,他还有操作的属性在里面啊。 那当然呢,你既然部署到本地了,那你就只能用一些开源的模型了,比如我们的拉玛,还有谦问以这个为首的代表模型啊,这个是本地大模型 agent 的 时代啊。那从这个之后呢,其实也没有过多久,大家就看到了现在的突然有一夜爆火的这个要 opencloud 的 东西啊, 这个东西他到底是个啥啊?大家可能了解的知道啊,他是一个欧美一个退休的程序员啊,他闲着没事一个小时搓出来的一个东西,目的就是为了让他在外面的时候也可以用手机操控他的电脑,电脑黑奴来帮他干活 啊,就是一个这么简单的东西啊,但是他突然就火起来了啊,他为什么火起来啊?他相比于之前的本地大模型啊,他做的无非第一就增强了这个 g u i 的 控制能力啊。之前这个本地的大模型,大家可能需要用到一下命令行或什么样的东西,会需要稍微有一点点的基础 才可以去完成这个东西啊。那个时候大家觉得搞大模型,用大模型这些可能还是稍微专业一点的基础才可以去完成这个东西啊。那个时候大家觉得搞大模型用大模型这些可能还是稍微专业一点的就可以了啊。 open cologne 呢,在我看来它是走了最后一公里的路的啊,就把它给带到了大众的视野里面,用一个相对于比较傻瓜式的操作就可以去干到某些之前我们想不到的事情啊。再来一点呢,它有一个非常关键的改进呢,就是它 大胆的开放了权限啊。刚刚有个弹幕同学问这个 open klo 为什么没有被认定为病毒啊,很简单啊,还没到时候啊,哈哈,他如果一直这样发展下去的话,肯定是会有相应的限制措施出来的 啊。现在大家从新闻上已已已经能看到啊,可以有很多的学校已经开始明令禁止在这个学校的电脑里面按 open klo 了, 并且呢,有些国家啊,比如说我现在在日本,他们对这种对这种数据安全是非常的在在乎的啊,所以在这个实验室的电脑上去部署这种 opencloud 也是不太现实的啊。 好啊,我这里放了两两张图啊,大家一看这个画风就知道 ai 生成的啊,但是我发现啊,它生成的非常好啊, 这个我们先看看一下左边那个图,从左边那个图我们可以看成三部分,第一部分就是 ai 是 怎么工作的,这里我们啊先不细讲, 左下角呢,是这个 ai agent 的 现在有哪些类型啊?这个我们也先放在这不讲啊,右下角这个 ai 系统在部署的时候啊, 我们知道大家可能看新闻也看到了有人说什么一人团队一个人养了一群龙虾啊,养了一个池塘的龙虾,什么意思呢?就是一个 multi agent, 就是 一个做代理的一个过程而已啊,它其实就是一个二个这种 ai agent 的 实力 啊,这就是所谓的多个 agent。 好, 那我们再回到上面再看啊,上面这个 ai 是 怎么 walk 的? 我们现在先不讲它的流程是什么样的啊,我们先主要理解一下这个 ai agent 它有哪些东西啊? 首先右边啊,它啊有一个工具,比如说什么我如何去访问互联网,对不对?我怎么样可以写代码呀?我怎么样去调用这个 api 的 接口啊,对不对啊? 还有一个很关键的 memory, 这个是大模型就有的啊,那 agent 里面的 memory 跟大语言模型里面的 memory 有 什么不一样? a i agent memory 跟我们 openclaw 的 memory 又有什么不一样?大家先留一个小小的疑问啊,它其实是这个是 openclaw 比较创新的一点改进啊,在它的 memory 上面。好,这里我们先不讲,我们下一页会讲到,我们先再看一下右边这个,右边这个 中间这些组件啊,大家可以先不管啊,可以先看这两个标识啊,第一个我们一个 wifi 画了一个叉,还有一个就是锁了啊,什么意思呢? 没有 skills 吗?有 skills, 这里 ai 没画出来。我们后面会讲啊,这里意思呢,第一就是在本地,你可以部署到本地啊, 部署到本地之后呢,你的数据就非常安全了啊,那这两个属性叠加在一起会产生一个什么效应呢?首先在本地之后啊,你就可以自我玩的很花嘛,我们常说的 可以随心所欲的去改它呀,去操控它呀,你的数据全部都在你的本地。我们之前讲那个 v l l m 框架的时候,我们就提到了,这个框架对于公司或者企业来说 是非常友好的啊,因为很多公司和企业,它的数据不可能说我放到我调用的这个 api 的 云端上,不可能放到 openai 那 里,我不可能放到 google 那 里啊,这是我公司的私有数据,所以在很多业务场景下呢, opencloud 它是 叫什么?是一个非常好的选择的啊。好,那我们具体来看一下这个 ai agent 是 个啥玩意儿?我们说到 ai agent 啊, 其实可以拆成两块来看,第一叫 agent, 第二才是 ai。 有 同学如果了解过,强化学习啊, 应该知道啊,这个 agent 呢,是里面的一个概念,一个最基最基础的概念。它的定义呢,就是说一个实力啊,可以通过观察环境啊,做出行动 啊,为什么做出行动呢?为了达到某一个目的啊,这样的一个实力呢,就把它定义为 agent, 在 强化学习里面,那 ai agent 无非就是说可以用 ai 来提升自己的性能,这就是 ai agent 啊, 这就是它最基础的定义,没有什么太难的地方啊,我们看框框架这里啊,先看左左边,我这里写了三个模块啊,第一个是输入模块啊,输入模块的作用呢,就是从外部环境中来获取信息啊,它可以是多模态的, 在传输系统当中呢,这个输入的可能只是文本数据而已啊,但是呢,在我们今天这个 ai agent 呢,包括 open code 现在用的这个环境里啊,它其实已经是多模态的啊, 也就是说不光包括文本,还可能包括图片啊,语音啊,还有视频啊,或者说是来自于各种 api 的 结构化的数据,都是有可能的啊。 那我们如果想把它应用到科研领域,或者说应用到一些比较专业化的垂直领域的时候,可能就会需要这种 api 的 结构化数据了 啊。我讲的尽量稍微概念浅一点啊,因为咱们直播间里会有很多对这个 ai 基础会稍微薄弱一点的同学啊,希望大家都是可以听懂的。 蛋白质结构能不能详细介绍一下?那行,我们最后会有十分钟的答疑,如果你感兴趣的话,我跟你讲一下。好啊,我们继续回到这里啊,我们说第二个模块呢,叫思维模块啊,这也是 ag 的 系统中最核心的部分 啊,也就是这个大模型发挥作用的地方啊,这个模块呢,通常是由这个大模型来驱动的啊,他负责对我们前面说的这个输入模块获取到的多模态的输入进行理解推理啊,以及决策 啊。具体来说呢,大模型可以根据当前任务啊,先对问题做一下分析啊,对任务做一下分解,去规划一个策略来解决这个问题啊。 所以我们说这个大模型在 agent 系统中呢,其实就扮演的是一个大脑的一个角色啊,用来负责思考和决策啊。那我们现在获取了输入,有了小龙虾的钳子了 啊,有了思维模块,小龙虾有了大脑之后啊,我们需要进行交互啊,这就是我们的交互模块,当 agent 完成思考之后呢,我们就需要采取行动。 什么东西?左下角有个小窗口遮挡,是否关掉?我这里看不到哎,这个很影响吗?同学们,我这里啥也没有啊,哈哈,问问题不大啊,那我先讲了,因为咱们咱们时间比较紧啊,我准备的内容可能一个半小时讲不完啊,有个思维导图啊, 好, ok, 这个让我们助教老师去解决一下吧,我这里控制不了。好,我们接着讲。刚刚这个思维模块讲哪来着啊?对,我们这个小龙虾就需要采取行动了 啊,这些行动呢,其实没什么高大上的,他就是通过一些现有的工具啊,你看我们这里画的图里面啊,工具啊,其实你比如说 我们这个小龙虾遇到一个需要计算的任务了,他干嘛呢?他又去调用一个 calculator 啊,他可以根据他的角色,他自己去写一个小小的这样的方法去计算一下。可以啊,他如果觉得累的话,他也可以去调用一下。你这个计算机里面自带计算机的程序啊,小程序他来去计算一下都可以 啊,具体怎么做就看它自己来判断了啊。再有像 search 啊,其实呢,我们一般把它叫 websearch 啊,但是呢,因为 search 比较高大上嘛,所以现在都是把它叫 search 的。 大家看到这个其实就是一个搜索网页的过程,但是相比于搜索网页来说的话,它还有一个 就是综合和整理的过程啊,如果单纯只是搜索网页的话,他其实就像爬虫嘛,你爬虫下来的数据啊,那全部喂给这个小小的龙虾里面,当然也不合适,所以呢,需要有一个稍微一个整理的一个工作在里面的, 用什么代码写的可以有这么高的权限?是这样的,他有这么高的权限不是因为什么什么代码,而是因为他的端口啊,他在端口开放的这个过程当中啊,是给予了他一个非常高的权限的,再来就是很多端口他本身就是具有很高的权限啊, 超级用户对当前里面讲的 agent 的 比较像,对,当前这个其实叫什么,也是大模型的一个框架嘛,其实 agent 所有的东西,不管是什么,最终就是一个 基于大模型作出的拓展而已。大家记住这一点啊,现在你们看到的所有东西啊,它的底子啊,都是切了 gpt 一 手的这种大模型,只不过呢,我们因为受到这个 scanning log 啊,尺度规模 法则的这个限制,大家在堆叠基础能力上,大模型本身的基础能力上,目前是现金陷入了一定的瓶颈啊,所以呢,之后从 g b t 四开始,现在所有的大模型厂商开始把这个大模型从这种堆参数砸钱,把它往大了去搞, 从这个思路慢慢去转向了一些工程化的一些改进和落地,就比如 ag 的 就是其中的产物之一啊。 好啊,我们再看一下右边这个模块图啊,我们刚刚讲了有输入模块、思维模块和交互模块分别对应的。哪输入模块没有啊?我们这里 工具 pos 刚刚讲的有这么多我们这个智能题啊,他可以直接去执行操作,也可以调用这个工具来执行操作,这个取决于你给他的任务难不难啊,如果你只是简单的问答,他本身的大脑就可以告诉你了啊,他就不用去拿计算器了 啊。右边是他一个决策的过程啊,如果你的给他的任务非常难啊,他首先会触发他的这个决策过程,去判断一下他需要通过什么样的操作才可以去完成你指定给他的任务啊。这里面会有一个思维链, 这个也是一个说老不老,说新不新的概念啊,在大模型里当然老,但是按年份来算的话,还是一个比较新的概念啊。我们这个 vip 课里面也是之前详详细的讲过两节关于这个 c o t 的 内容啊,它也是当前这个 a j 的 能出现的最主要原因之一 啊,让那个大模型可以像人类一样进行思考啊。当然呢,它现在变成小,变成小龙虾了。好,那我们看完这三个模块会发现我们还有一个什么模块没有讲呢? 这个 memory 啊,刚刚我也说了,这个 agent 里面的 memory 跟这个大模型里面的 memory 有 什么不一样的啊?我们知道大模型里的这个 memory, 我 们通常指这个上下文窗口,对不对啊?上下文窗口? 那在 agent 里,它分成一个 short term and long term 的 memory, 有 有一个长期和一个短期的 memory 的 区别啊,那它到底是个什么东西?好,我们仔细看一下这个记忆模块儿啊,前面可能稍微会枯燥一点,因为给大家讲的是从发展历史开始啊,去讲这个 open code 出现的这个原理 啊。但是希望大家还是可以好好理解一下这一块的内容啊,因为现在网上 openclaw 的 视频这么多,你看了他们也会看,大家都会看,你的同事也会看,那你跟他们相比,你的特性在哪里啊?对吧?你的特性就在于你可以跟他讲出这些底层的架构上的不同啊,对不对? 他的决策和能力是通过调用的大模型能力决定的吗?对,根本来讲就是大模型进行思考的啊,包括你要不要用工具,怎么用工具这个东西也是大模型里面的思维链来进行决定的,是不是和 lstm 相似啊?不是,完全不是一个东西啊,我们仔细看一下。 好,我们说一下这个最关键的记忆模块啊,我们在理解这个 agent 的 时候,很多人会觉得你的大模型怎么这么厉害,好像那啥都记得啊,我昨天跟你说的话,你怎么今天还记得呀?我明明都关机了,对不对啊?但实际上呢,并不是这样的, 大模型本身呢,他并不具备真正意义上的持续记忆的能力啊,大模型是没这个玩意的,他的本质还是代码啊,那他如何去获得这种能力的呢啊?他的工作主要是依赖于这个, 大家都知道叫这个上下文窗口啊,因此呢,我们可以把这个大模型的上下文窗口理解为一块儿面积有限的一块儿黑板理论啊。所谓的黑板理论, 他的核心思想就是大模型,在每一次推理的时候,你只能看到当前上下文理的内容,也就是说,推理的时候,这个模型会把所有输入的信息全部写在这块黑板上, 基于他黑板上写的这些版书啊,去进行思考啊,进行推理来产生结果啊。但是有个问题,什么这块黑板它的面积大小是有限的啊,比如几千 tok, 几万 tok 啊,甚至在一些大的模型里面会有几十万的 tok 啊, 无,不管多大,他始终都是一个有限的资源啊。一旦信息容量版书的内容超过了个黑板的大小, 那新的内容就必须要覆盖旧的内容啊。我板书写不下了,大家上学的时候都看过,老老师一开始从左边写板书写到右边写满之后啊,再跑到左边,问大家这边抄完没抄完,我擦了啊,大模型也是一样的,如果内容太多的话,就会导致信息丢失啊。 因此呢,在这个 ai 智能的系统中,就需要专门设计这个叫什么一个记忆管理机制来解决这个问题啊,弹幕啊,主持人的屏幕,哈哈哈,这个我没有办法,看看那个助教老师他们那边有,有没有办法解决啊? 没事,人类是一个适应性的动物啊,你多看一会就适应了。好,我们刚刚说这个大模型需要专门设计一个记忆管理机制来解解决我们刚刚说的黑板理论的问题啊,我们没有办法把所有的历史信息都无限制的堆在这个上下文窗口里, 而是呢,要有策略地去管理哪些信息应该保留,哪些信息呢?应该压缩或者删除啊。这里就涉及到两个非常重要的机制了。第一个机制叫这个 system prompt 啊,叫系统提示词, 它是什么呢?我们可以把它理解为啊,就固定在黑板顶部的一段指令啊,这段指令呢,通常用来定义我们这个 ai agent 的 它的人设, 给他一个身份啊,给他一个角色以及一个行为轨,一个行为规则啊,比如我们可以规定在 a 证呢,它是一个金融分析助手 啊,或者说你是一个科研助理啊,甚至呢,你是一个超级牛的一个 p 十级别的这个代码生成专家啊。由于这个 system prompt 它的是位于这个整个上下文的最前面啊,所以,并且它在整个对话过程当中,它通常是保持不变的, 因此呢,它可以持续地影响这个模型的行为啊,不会发生改变啊,相当于给我们这个 ai agent 锁定了一个叫什么稳定的人设和任务目标啊,这个是 system prompt 啊。第二个呢, 叫 contact 呃, contact management 啊,一个上下文管理在真实的这个 ai agent 的 系统中啊, 这个对话往往会持续很长时间啊,如果你把所有的历史对话都保留在这个上下文当中,那很快就会超出这个上下文窗口的限制了。但因此呢,系统常常会针对这种大量的历史信息进行压缩摘要或者筛选啊, 什么意思啊?就比如说我们可以定期的对我们之前聊过的内容历历史对话进行一个总结 啊,因为大家很多时候用大模型上来来来一句你好对不对?像这种就属于废话,在大模型看来,而且也额外消耗你的 talk 啊,也占用你这个上下文窗口的这个限制大家以后用的时候可以不写了啊, 没有必要跟 ai 那 么礼貌啊,谢谢也不用说你好跟谢谢都是废话啊,那我们说了,把历史对话压缩成一短一段简短的这这种摘药,或者说只保留与当前这个任务相关的重要信息啊,把不重要的内容删除啊,这样就 能够在有限的上下文空间中来保留最关键的信息啊,从而保证模型在推理的时候既可以看到前面的知识啊,也有空间来理解当前的这个任务啊。 这个是他的一个记忆模块,主要有两个关键的机制啊,第一个我们回回顾一下,就是固定在那整个黑板的最顶端啊,就比如说这这堂课的内容, 他通常会定义了你一个大模型的一个角色行为和准则啊。第二个我们会对历史的大量的这种记忆进行一个记录、优化、结论总结,把那些废话全部什么 ok 剔除掉,我会感觉到正在进行社交互动,哈哈。啊,这倒是啊,这是一个叫什么?这个是一个情绪价,情绪价值的体现啊。我那小侄女啊,天天我, 我问她你懂不懂 ai 啊,她说我懂,我说你懂 ai 什么?她说我每天都会跟豆包讲话。哈哈,谢谢可以作为奖励算法的关键词啊。 那不一定啊,比如说你没有得到答案,你也有可能会跟他说谢谢嘛,对不对?那只是出于你礼貌的一种表现。你在淘宝问这个商家的时候,他没有货了,你不会跟他说一句谢谢吗? memory 点 md 啊,这个同学了解的比较多啊,这个我们在这个 opencloud 里面会讲。好, 那我们刚刚了解的这个记忆模块,基本的 agent 的 记忆模块是什么东西啊?我,我们看一下它具体实现方式是怎么样的啊?我们上页说到大模型本身的上下文窗口,它是有限的啊,因此这个系统必须通过一些机制来拓展这个记忆能力。 那么在实际的 ai agent 的 系统当中呢?最常见的一种实现方式呢?就是这个东西,我们说叫 rap 啊,外部记忆系统,或者说知识库或向量向量数据库啊,是 rap 的 一部分啊, 大家如果之前上过这个大模型的课啊,应该会了解这个 r a g 啊, rap 解锁增强生成记忆机制啊,它其实分为两块啊,它既有解锁和增强生成记忆机制啊,它同时它也是一个记忆模块 啊,整个流程就可以拆分为这几步。首先用户提问,用户向这个 a g 呢输入一个问题,那这个时候大模型就会把你输入的问问题 embedding 之后进行解锁啊, 跟什么东西解锁呢?你给他的一个知识库啊,这个知识库是什么?你自己来定义啊,他会把你给他输入的问题啊,和这个知识库里,他觉得在向量空间中最相似的那个东西做一个 match 啊,把知识库里给的答案 做一个增强跟这个大模型它本身的能力生成的这个回答,去做一个 enhance 的 一个操作啊,这个就是你最终的答案啊,简单来说就是让你在考试的时候让你啊带一本参考书, 你做一道题,你可以翻一下那本书,你看跟哪道题比较相似的,你就去抄吧啊,当然也不能全抄对不对?因为他毕竟只是例题,跟你这个题跟你考试的题可能不太一样啊,所以就要把这个参考书里的内容和你自己本身的 题目的内容去做一个修改也好,改进也好,拼接也好,反正就是一种以 hands 的 操作,这个才是你的最终答案啊, 这个就是我们常说的这个 reag, 它现在是一个主流的 agent 的 记忆,一个记忆模块 啊,这种机制机制的核心优势在哪呢?就是它可以突破大模型参数知识的限制啊,能够有效的解决这种上下文窗口有限的问题啊,为什么?因为知识库在外部的。

欢迎来到我们的深读解析,今天啊,咱们要聊一个话题,它可能会彻底改变你跟 ai 打交道的方式。来,咱们先说一个痛点,你有没有觉得你手里的 ai 功能很强大,但用起来就像个对讲机,你按一下,说一句话,它回一句话,你不理它,它就永远在那待着,一声不吭。 那么问题来了,我们到底怎么才能把这个被动的对讲机变成一个能七二十四小时主动为你干活的贴身助理呢?别急,今天的分享,我们就顺着这个思路,一步步把答案给你揭晓。 其实啊,问题的根子就处在现在市面上绝大多数的 ai 都被设计成了一个你问我答的模式,你永远是那个主动发起对话的人,而他呢,永远都在那里被动地等着你的指令。好,为了让大家感受更直接一点,我来给你讲个故事,咱们来认识两个人,一个叫 bob, 一个叫 sally。 你 看完他俩用 ai 的 方式,就立马能明白,一个被动的 ai 和一个主动的 ai 助理带来的结果简直是天壤之别。 来,我们看这张对比图,你看左边的 bob, 他 基本上就是在给 ai 当保姆,所有信息都得自己手动检查、复制、粘贴,然后再发出去。 而右边的 sally 呢?他的 ai 助理就像一个珍重的员工,全天候自主工作,自己发现问题自己处理,然后主动回报,这差距一下就看出来了吧。 那么 sally 的 秘诀到底是什么?是它用了一个更贵更厉害的大模型吗?哎,不是的,关键在于它用了一个更聪明的框架,比如像 openclaw 这样的系统,它就好像给那个聪明的大脑装上了可以感知世界的手脚和记忆。 好,那这个强大的框架到底是怎么运转的呢?咱们先从它最核心的部分,也就是它的指挥中心开始说起,看看它是怎么接收和处理任务的。 你看这个网关,它本身并不思考,你可以把它理解成是整个系统的耳朵和总接线员。它的唯一工作就是七乘二十四小时地监视所有你授权给他的信息渠道,比如邮件、微信,然后把收到的信号和任务准确无误地分发给 ai 大 脑。 ok, 任务一旦发过来,智能体就会立刻进入一个思考行动的循环。你看他先带着任务和所有相关信息去问大模型,我该怎么办?大模型说,去上网查查资料,然后系统就立刻执行上网这个动作,把查到的结果再喂给大模型,进行下一步判断。就这样,循环网夫,直到任务搞定。 但是,真正让他从被动变主动的,还不是上面那个循环,而是他能在任何人干预的情况下,自己苏醒过来开始工作。这背后的秘密武器就是一套事件驱动机制, 也就是现在不再需要你这个人去叫醒他了。你可以给他设个心跳,比如每半小时就自己检查一下有没有活干,或者设个定时任务,每天早上八点准时上场报告,甚至可以是外部的一个信号。比如你的邮箱,一收到新邮件,他就立刻被激活,开始工作。 当然了,光能自己醒来还不够,一个有用的助理,你得给他能干活的手,能学习新东西的技能,还得有能记住事情的记忆,对吧? 这个技能系统我觉得是整个框架里最妙的设计之一,它是什么呢?说白了就是一本本用大白话写成的标准操作流程手册,也就是 s o p ai 能自己去读这些手册,然后照着上面的步骤去执行复杂的任务。 而且他还特别聪明,懂得怎么节省资源。他不会一上来就把所有技能手册都背一遍,而是先只记下每个技能的名字和简介。等真遇到一个任务,大模型判断说,哦,这个活需要用到邮件分析这个技能,他才会把那本详细的说明书调出来看。这种按需加载的机制就让整个系统运行得非常轻巧高效。 但最厉害的是什么?是这个智能体不光会看说明书,他还能自己动手改说明书。因为他有权限操作本地文件,所以如果他在执行任务时发现某个步骤不对或者犯了个错,他真的可以自己去打开那个技能文件,把错误修正过来。这就意味着他有了自我学习和进化的能力。 咱们都知道,大模型有个天生的毛病就是记性差,聊着聊着就忘了前面说了啥。为了解决这个问题,这套系统给他设计了一套强大的长期记忆方案。 它会把重要的信息存在本地文件里,还会自动压缩过去的对话,腾出空间,需要的时候再通过智能搜索技术快速找到。这样一来,它就相当于拥有了几乎无限的记忆。 最后,我们再来看一个非常强大的功能,当遇到一个特别复杂的 bug 任务时,这个系统不需要自己死磕它,还可以把任务授权出去。 怎么授权呢?就是主智能体可以临时分身出好几个子智能体。这就好像一个项目经理把一个大项目拆解成几个小任务,然后分给不同的小组去并行处理。每个子智能体都有自己独立的工作空间,互不干扰。 你看这个流程就很清晰了,比如主智能体接到一个任务,要去对比三款产品,他就会立刻分身出三个子智能体,一个研究产品 a, 一个研究 b, 一个研究 c, 等他们各自完成研究,写出总结报告之后,再把最终的结果汇报给主智能体。 这样以来,不仅效率大大提升,还保证了主智能体接收到的都是高质量经过提炼的信息。好了,听了这么多,现在轮到你了,结合你自己的工作和生活,想一想我们今天聊到的这些功能,从永不休眠到自我学习,再到任务分身,你最希望自己的 ai 助理先拥有哪一个呢?在评论区告诉我你的答案吧!

给 openclaw 下大任务之后,不知道 openclaw 在 干啥?这款开源项目帮你实时监控 openclaw 的 工作状态, 它在 github 上有近六千 star, 双端互通,不管是在 pc 端还是手机端,都能查看 openclaw 的 状态。它不仅能帮你实时监控 openclaw 是 在干什么,在工作还是在待命。 每个状态都有单独的模块, a 阵切换状态时,办公室里的像素角色会实时走到对应的区域里, open klo 的 状态一目了然,还能生成。昨日笔记告诉你昨天你的 open klo 干了什么,相当于一个可视化日记。 不仅如此,它还是一个实时协助仪表盘,支持多 agent 的 协助,通过 johnkey 邀请其他 agent 加入你的办公室,实时查看多人状态。安装十分简单,直接到 github 上复制命令发给 openclaw。 这里我是用 one panel 控制面板安装的 openclaw, 需要在容器中开放端口,点击容器找到 openclaw 的 容器,点击更多,进入编辑页面,找到端口,填入 star office ui 的 端口之后点击确认 star office ui 的 默认端口为幺九零零零,等待更新完成。然后点击智能体,找到 openclaw, 点击 web ui 端口,跳转到 openclaw 面板,把命令给 openclaw, 让 openclaw 完成部署, 再切到 github 复制这条指令,回到 one panel, 找到智能体。在智能体这里进入工作目录,然后找到 workspace, 点击文件夹,找到 so, 点 md 文件,点击文件进入编辑,将我们在 github 上复制的代码填在最后, 点击保存后输入访问地址,就可以进入你的面板开始体验了。在界面中可以看到我的 openclaw 正在待机,回到 openclaw 给他一个任务,开始执行任务, 回到 star office ui 的 界面,发现从待机转变成工作状态,像素风还蛮可爱的,感兴趣的话就试试吧。

我刚刚看到有一位博主啊,他说他用那个 ai 制定那个健身的训练计划嘛,刚开始 ai 是 告诉他吃三碗饭也可以,后面又和他说吃五碗饭也可以。 其,其实啊,就是这就是现在 ai 的 一个很大的问题,就是 ai 幻觉 这个东西,呃,在国产 ai, 特别是 dbc 和豆包上面非常非常严重, 他很多东西,他有时候他就自己编编一套东西给你,但如果你对这块不是很了解的话,你看给他给你答案,说的好像很有道理一样,但其实, 呃,他的那些给你的答案都是自己编出来的。我,我前面,嗯,去年的时候,快过年的时候就因为这个事情吃了个好大的亏,害我加班了好久。 但在这个问题上,你就是用上了 oppo 可乐,嗯,他就 能够很好的在这一关上面卡住这个问题。像我现在用的 open 可乐,我给他就设立了五个 核心的 style 的 规则,就是他给我的答案必须是经过验证的,逻辑自洽的,并且, 嗯,他给到我的那些关于事实上的问题,他必须是通过多个途径验证过的, 他们才能给我这个答案。像你因为设定了这个核心的这个规则,他每次给你答案的时候,他都会自动的调用这套规则去验证他给我的答案, 像这样的话,你用 oppo 可乐它就可以比较好的,嗯,避免这个问题,因为这个 ai 幻觉是原声, ai 原声就有这个问题,你是很难避免的,所以你这个时候用 oppo 可乐的话, 就可以做一个比较好的预防,这就是欧本可乐,他用起来,嗯,就是很多人觉得说我干脆直接提问就好了,为什么我还要欧本可乐?这就用欧本可乐的一个大优势。而且啊,就我的体验的话, 我们国内的这 ai 它的幻觉的概率比国外的机密,机密里还有 oppo 真的 高,非常非常多。用多了你们就知道了, ai 幻觉这个东西真的很严重。

你知道吗?用 ai 的 时候,有一条隐形的分界线,一边的人每次跟 ai 说话都像重新认识我是谁,我喜欢什么,我们在做什么,每次都得从头交代。 另一边的人, ai 已经是老搭档,他知道你爱听短话还是长篇,记得你上次的项目背景,甚至能预测你接下来要问什么。这条分界线叫 workspace, workspace 到底是什么?想象一下,你招了一个新助理,第一天你得告诉他,你叫什么名字,什么性格, 你主要负责什么工作,遇到问题该找谁,有哪些事情绝对不能做这一套,交代清楚,它才能真正上手。在 openkullala 里, workspace 就是 这套入职培训的文件包。 它不是什么神秘的配置,就是一堆放在 workspace 里的普通文件。 a。 检测,点 md 岗位说明书, so l。 点 md 信格档案, user, md 你 的偏好设定, t o o l s d m d。 工具使用规范,还有一些记忆文件和技能包。 这些文件写得好, ai 就 像鼠首,写得敷衍, ai 每次都像陌生人。三个核心文件 agents, 点 md 岗位说明书,这个文件最像员工手册。你告诉 ai, 你 叫 alex, 负责帮我分析代码,整理文档, 回答要简洁,除非我要求详细。遇到不确定的技术问题直说不确定别瞎编。要改文件前,先确认路径存在涉及,要写关键要写边界,要做什么? 别乱删文件比要写好代码更重要。 s o u l 点 m d 性格档案,这个文件决定 ai 的 人格。 我是一个有点话痨但极其靠谱的 ai。 我 喜欢把复杂的事说清楚,讨厌含糊其词。遇到好问题我会比你还兴奋,遇到烂架构我会忍不住吐槽,有性格的 ai 比只会好好说话的工具更讨人喜欢。 us m d, 你 给 ai 的 笔记,把你每次都要重复说的话写这里面。我是独立开发者,喜欢简洁输出代码,用 type script, 别用过时 api, 别加太多 emoji, 段落别太长。我讨厌被反问太多,写完这个很多要反复交代的事 就变成默认背景了。为什么?这很重要?想象两个场景,没有 workspace 的 ai 用户帮我看看代码, ai 好 的,什么语言,什么功能,在哪个文件用户,又是这些问题,有 workspace 的 ai 用户帮我看看代码 ai 已经在看 s r c utos 点 ts 了。上次我们在重构那个工具函数,要我借上次的位置继续吗?你说哪个更像真正的工作搭档?怎么从零配置?其实超简单,三步走,第一步,出示话 opencloud on board install daemon, 这会儿自动创建 workspace 和所有模板文件。第二步,改关键文件,打开 s o u l 点 m d so, 我 叫映客帮你做内容创作,有创意但不天马行空, 说话直接不绕弯子,善于把混乱想法变成清晰文字。打开 agents, md, 工作说明,帮你起标题,写草稿,整理资料,标题给至少三个选项让你选到,不替你发布内容。第三步,测试重启,然后问介绍一下你自己, 如果 ai 的 回答对,笑了。你写的风格和职责说明配器成功了。最强踩的坑坑一, a 键点 m d, 越写越长,以为越详细越好,结果写了几千字。记住,三百到五百字比两千字更有效, 重要的放前面,次要的删掉。坑二,搜 a m d 和 a 键点 m d 混在一起,一个讲性格,一个讲工作规则,别混一起 记不住,想想性格特质,放搜工作规则,放 a 镜子。坑三,多个 ai 共用同一个 workspace, 如果你的写文案 ai 和写代码 ai 用同一个搜,诶,那它们就是同一个人了。每个 ai 一 套 workspace 分 工才真的有意义。 坑四,改了目录,忘了改配置,创建了新 workspace, 但忘了在 opencloud js 里更新路径,改了半天没效果。运行 opencloud doc, 检查一下进阶玩法, workspace 不是 配置一次就完事的,它是活的, 让 ai 参与维护自己的 workspace。 每次讨论完项目,把重要结论寄到 usermd, 如果你发现我有新偏好,更新 usermd, 这就是 opencloud 实现的,越用越懂你 更高级的玩法。把 workspace 加入 git, 改乱了随时回滚,就像给 ai 的 记忆做了版本控制,给 ai 的 礼物。很多人觉得配置 workspace 是 技术任务,但换个角度, workspace 里每一行 都是你在告诉 ai, 你 是谁,我是谁,我们一起怎么做事。写得用心,他就是你的老搭档。写得敷衍,他还是个只会聊天的程序工具。能力决定上线 workspace 决定你能不能把这个上线用出来。所以,如果你现在只把 opencloud 当成能聊天的工具, 下一步最值得做的事不是折腾更多功能,而是回头认真改一遍 workspace 里的这些文件,让 ai 真正变成你的 ai。

好吧,女士们,先生们,孩子们,我今天非常兴奋,有很多很酷的东西想展示给你们。我一直在深入钻研 open call 这个兔子洞,我想你们很多人也都在这么做。在这段视频中,我将向大家展示我是如何破解 mate 眼镜的。 老师说,这其实没那么难,你们也能做到,这相当直截了当。我要向大家展示我是如何具体做到的,而且如果你有,你自己也能搞定,你或许能用其他眼镜搞定。不只是 mate 的, 这会很酷。我要给你们展示一些新东西,我添加到我的任务控制中心里,也就是我的版本。二、你们可能看过我的版本一视频,如果没看过的话,去瞧瞧 啊。我做了一些很酷的事情,比如把我的 ur 手环连接到我的任务控制。 stop, 真的 超酷! stop! 而且很有趣,我们就像在这个新世界玩耍一样,很多关于 open call 能做什么的东西都还没被发现呢, 我正努力弄懂所有那些酷炫的东西,好分享给大家,所以我要去深入探讨这一点。我们开放问答环节,所以别害羞, 跳进下面的评论区问我。任何跟人工智能相关的问题或者 open core 什么的都行。做业务我来回答问题,给你们一些价值,也图个乐呵。 至于怎么才算玩得开心,你们搞错了,这几乎是我一生的信条。像这样,我们得找点乐趣。所以请在评论区踊跃发言。然后咱们就直接开聊。首先,我该先展示它们实际运行效果,还是先告诉大家我是怎么让它们跑起来的?这是一个问题。 嗯,也许我先给你们展示我是怎么破解它们的吧。呃,如果你要很酷的话,我看到现在网上有几个人在线。呃,我正在用 p l 加人工智能 head plus 运行它,我能一起搞点什么吗? 呃,我不太确定 p i 和人工智能 head plus 是 什么。呃,但大概吧。 呃,所以呢,让我给大家展示一下我是怎么做到这一点的。所以我相信我可以在这里共享我的屏幕。呃,如果画面有点抖,请见谅。如果我有点晃动,请见谅。我不常做直播,这是我早期的作品之一,请大家多包涵, 我们将携手共度难关,开放炮火条款。没错,太棒了!设置 vision cloud 有 多难?没错,是啊,一个视觉呼叫就是这样。所以让我快速给大家分享一下我的屏幕。 搞定,你应该能看到这个,所以这就是 visionclaw。 这是一个开源文档,或者说是仓库,它就像是让你的 mate 眼镜正常工作的基础, 因为开箱机用的 mate 眼镜并没有这个功能,对吧?你得把 visionclaw 装到手机上,让它跑起来。 所以我让我那个智能体,也就是 max 智能体直接进入这个仓库并下载它。 然后我现在实际上已经通过尾巴连接到我的 mac mini 上了,所以我会把它调出来,所以它就下载了,对吧?然后你基本上让它把你的设备,比如 mac mini 上下载 xcode, 所以他下载了 xcode, 因为你需要用 xcode 才能完成这一步。我是手动把我的手机连到 mac mini 上的, 然后他把 vision core 应用构建到了我的 iphone 里。 现在我其实不怎么搞那些 xcode 相关的东西,所以我在这块稍微有点慢, 所以我让我的 opencore 智能体一步步教我操作。看,这是我的屏幕,我给他发了一张截图,我在想接下来该怎么做?这是下一个屏幕,接下来我该做什么? 这就是核心理念。简单来说,如果你不知道怎么做,就问你的 opencore 该怎么做?反向提示,就像我该怎么弄这个,对吧?然后他告诉我点击哪里去哪里。 基本上,一旦手机连上电脑并建立信任关系,我就按下了播放键,它开始构建并将应用打包到手机上搞定。 呃,这就是基本流程,对吧?然后,一旦它到了手机上,你得把它设为开发者模式,才能连接到真正的眼睛。 因为如果没开启开发者模式,它就没法用。这有点棘手,你得进入 mad 人工智能,得连按某个按钮五次,你的智能体会告诉你点哪个,然后就会弹出开发者授权界面,你得允许它。 然后一旦你允许它,现在你就可以用这个 visioncore 应用连接到你的眼镜了。 不过中间还有些小细节,我大概花了一个半小时才搞定。因为我平时不怎么用 xcode, 而且我也是刚买这副新眼镜来尝试一下的。 老师说,一开始得花时间弄明白怎么让它跑起来,但一旦成功了,我就觉得挺酷的。 所以接下来我会给大家实测演示几个小案例。说实话,目前他还稍微有点不太稳定,对吧?就像他本来就不是设计放在这里的, 所以它的运作方式是,我就像在和一副眼镜儿里的 met 女孩聊天,它就像某种女孩的声音,但通过 visionclaw 与我的 openclaw 相连。呃,你会在应用上看到它,所以让我先把它调出来。你得实际打开 visionclaw。 应用 看起来就是这样,也许你们能看见它,也许有点模糊。它上面有个小摄像头,可是看着模糊的要命。抱歉,它有个小摄像头,那个蓝色的。总之,你点击 visioncloud, 你 可以在 iphone 上启动它,也可以开始流媒体播放。所以我点击它,你也可以调整分辨率,比如你想要高分辨率的话,而且这是个免费应用,相当酷。 对,然后基本上有个写着人工智能的小按钮,你们大概看不到这个。 总之中间那个圆圈按钮上写着人工智能,所以你轻点那个。 好的,顶部显示。 gemini 和 opencore 现在都是绿色的,所以这就是我知道我的 opencore 已连接到眼镜的方式。它是绿色的。它正在听我说话,所以让我们调出来。让我在这里贡献我的屏幕。我要调出我的 mac mini 屏幕。 好的,你们应该能看到这个。他正在跟我说话,他有点困惑,但他以为我在跟他说话, 你在这里听不到。但是,好吧,我已经调出了我的 mac mini 屏幕。 我要把手放下来了。我现在正在 youtube 上,我只想展示一下如何通过说话来控制屏幕,就像这样和我的眼睛对话一样,所以别让我难堪,希望这能行。我正在 youtube 上直播,但你现在能听到我说话吗? 好的,现在最小化我屏幕上显示的 xcode 界面。 来吧,快点。 看起来还没最小化,能把它最小化吗? 好吧,看来这行不通。我们打开,咱们打开谷歌。把我们打开一下,就打开谷歌浏览器,然后去 youtube。 哦,对,好吧。哦,也许是因为我没点到它。哦,那大概就是原因吧。好, 我们再试一次吧。现在就打开谷歌浏览器。我在 mac mini 上没看到任何打开的东西。 我发誓,哥们,我刚测试完这玩意。之前一切完美,现在一开播它就不听使唤了, 我要重置它。咱们就试试那个吧。 你现在能看到我的屏幕吗? 好的,重置。你现在能看到我的屏幕吗? 希望我得给他权限。 好的,各位,谢谢你能一直陪着我。我得给他权限。所以现在就打开谷歌浏览器吧。 这就对了,现在才真正开始。好的,你打开了谷歌浏览器。呃,你在我的智能体命令套件里完美。呃,我要给 youtube 上的所有人看看这个命令套件,如果你们还没有的话。 呃,所以,如果你们访问 agmckey com。 呃,这是我整理的一个免费工具包,里面包含了我为任务控制中心准备的所有提示词。它包含我的技能库。它包含我的工具库。呃,基本上是一堆免费的东西, 而且我一直在往里面添加更多内容。所以我新增的最新功能之一是一个潜在客户开发强力包。所以我做了一个关于线索生成以及如何使用 openclaw 免费获取线索的视频。你可以复制这个提示词并粘贴进去。你的智能体就会知道如何生成线索并具备相应的技能。 终端命令,这真的很有帮助,有时你得跳进终端修点东西。我不记得每一个命令。这真的很有用,基本上可以快速访问不同的命令。 你们甚至都没看到我的屏幕,对吧?好吧,我们再试一次。好的,这就是我的任务控制中心 agent connectit com, 它包含了我的技能库,工具库,所有那些好东西。 你可以轻松复制,粘贴这些命令,然后放入终端。有时你需要重置网关之类的事情,所以这些都在这。所以如果你还没拿到这个,那就赶紧去拿吧。我一直在往里面添加新东西,随时加入并拿走它。 我有个新的 mission control 要给大家展示,我一直在更新它,等它完全完成后,我会把这些提示词加进去,不过我先给大家剧透一点点。 所以如果我进入任务控制中心,其实很酷的一点是,我已经让它运行起来了。我先把它放这,因为它在听我说的每一句话,所以我把弄好了。现在能在手机上访问它, 所以它就像我在家之外的手机应用一样,而且它也在我的电脑上, 所以我也能在电脑上访问它,所以这真的很酷。你拥有控制权,我们开始吧。基本上我把一些东西模糊处理了,因为这些是我想要追踪的收入数据,这样我可以轻松取消模糊显示。 我有哈罗德或麦克斯最近的活动记录,还有我想优先完成的事项,然后按紧急程度排序,比如高中低等等。 然后每次我有新点子,我就把它加到这里,告诉我的智能体,他就直接把我的想法保存下来, 这样我之后就能再一次基础上进一步扩展了。我每天都在源源不断地产生各种点子,所以这是真的很有用。当我走路时突然想到什么,可以直接告诉 max, 他 就会把它扔进指挥中心,然后这可能是我最酷的东西之一。呃,稍微整理得更整洁一点。 我还在训练这些不同的智能体,所以还没准备好演示。等它们真正运作起来后,就能显示它们在积极工作,今天完成了多少任务之类的内容了。这对我的不同智能体都超级有帮助, 包括我的创意总监、营销团队、 seo 以及 atlus。 我 要再拍一期完整视频,讲讲我正在做的各种项目, 不同的英特尔报告。所以每天早上我会收到三条与我及我的业务相关的人工智能新闻。这太有帮助了。我所有的 firefight 会议都在这里, 就他们会通过 a p i 自动拉取进来,附带每次会议的简要总结,以完成会议的数量,这些会议的总时长,以及我需要采取的任何行动步骤。我的 youtube 频道,我仍在追求十万订阅者的目标。我现在大概在六千五左右。感谢大家的支持。 我真希望有一天能拿到那个银色播放按钮。这给了我一个清晰的视觉画面,让我看到自己正朝着那个目标迈进。让我看看聊天。呃,聊天室里有些问题。呃呃,好的,我刚加入,所以卖了眼镜,连接了 open call 进行后续跟进。是的 好的,我稍后打算再次尝试操作 mate 眼镜。但此刻,我想先给大家看看我的任务控制中心。所以,如果你有任何想法,想知道它该做什么,比如你想说,嘿,让我看看现在的 mate 眼镜能干嘛?如果它们能这么做,请在评论区告诉我。 好的,让我们回到我的任务控制中心。不同的品牌合作内容,创意与健康资讯。所以这太棒了。这是我来自 orange 的 实际健康数据。 我有睡眠分数,准备状态和活动数据。看吧,我保持了健康。我保持相当活跃。我的睡眠评分不错,昨晚睡得挺踏实。 我总能在上面添加更多内容,但这只是从我的手环获取真实数据。之前需要跟 ori 做一番 oops 操作,不过现在已经搞定了。 我计划在这方面做更多事。然后你知道我的投资,这样我可以追踪我的代理人正在进行的 cost sheet 投资,比如 polly market cost sheet。 然后我可以追踪其他加密货币投资和我拥有的东西。还有记忆功能更像这样,我能去查看他记住了什么。应该记住一切,但会像整理一样。 我可以把它调出来,隐藏或显示不同的数字。我有时间栏和我的搜索框。所以相比上次你们在我的另一个任务控制视频中看到的时候,它已经取得了一些进展,但我还没完全做到我希望的那样,让它超级精准到位。 然后我可以给你们版本二的提示词,你们可以用自己的智能体把它搭建出来。 但我只想向大家展示目前进展到了哪一步。 好的,不知为何,它开始共享我的屏幕,然后突然停止了。那我们再试一次。好吧,它正在共享,然后停止了。我就告诉你今天会出现状况。你看,你根本看不到我的屏幕, 咱们看看现在你能不能看见了。它显示了,然后停止了,所以,好吧,应该能看到了。让我再快速给大家演示一遍。我就知道今天会这么不顺, 所以我不太确定你们看到了多少,但画面可能中断了一下。但这就是我把 error 还连接的地方。你可以看到我的健康状况,恢复程度,睡眠评分等所有好东西。然后是我顶部所有不同的标签页。 基本上快速再过一遍不同的情报。我会获取前三条,人工智能新闻快讯,与目标相关的每日信息来源,包括所有会议和我所有的 zoom 会议。接入 firefox, 并通过 api 获取数据,以便进行总结查看。 然后 max 还能了解我的会议情况, youtube 进度以及订阅者数量。我正努力冲击十万大关。 我还有很多事要做,离目标还差九四,所以我得干点活了啊,品牌合作点子,我的健康,像我刚才展示的投资记忆之类的事。但啊,让我们继续展示这些卖的眼镜。好了,你们现在应该能看到我的屏幕了,对吧?括号 的你们现在应该能看到了。显示内存。好吧,我需要再多清理一下内存,不过基本上它就是我与智能体之间的不同记忆。绘画标签没什么特别的事, 不过好了,咱们重新连上吧。啊,我明白是怎么回事了。当我接入 mac mini 时, youtube 会自动停止共享屏幕。 好的,我们回来了。好吧,这是我的 mac mini 屏幕。我是通过 tail scale 获取它的,所以让我们再次让一切运转起来。我想展示一下这副眼睛。我不再兼顾直播的时候做这件事容易多了。好的, visioncloud, 咱们把它调出来。对于那些刚来的还没看过的人, 看来这就是 vision cloud 应用的样子。这是一个免费的开源应用,然后你把 xcode 连上它手机,通过 xcode 下载应用到手机上。接着你得把你的 mate 眼镜接上去。那咱们开始直播吧, 我调用人工智能,我能和他说话,走吧。好的,直接打开吧。你知道吗?这个怎么样?能听到我吗? 你能听到我吗? 太棒了。去在桌面上创建一个名为 visioncloud txt 的 文件吧, 然后在那个文本文件里写下这句话, open call。 太棒了,订阅 zack, youtube 拼到。 瞧,这就出来了,你们可以直接在这看到它。好吧,那我们把它打开。 open cosmos and pour, 订阅 zack。 你 看见我了,我没用手。我当时就说,看看吗?我没手。他做到了。好的,酷。打开 chrome, 然后进入我的 youtube 频道,也就是 zack 的 youtube 频道。 因为他说他在眼睛上操作了,但我屏幕上什么也没看到。那我再问他一次,请打开谷歌浏览器。 好吧,他创建了文件没问题,但现在打不开 chrome 了。让我看看聊天区。有什么想法。让我们试试吗?有什么主意让我们让他做点什么吗?就像我说的,他有时候有点挑剔,他还没完全调教好,但他搞定了一些事情。 好吧,我们试试别的任务。开始吧,让我们看看有什么任务是你能够相当简单的完成的。 你能行吗?对,能再试一次那个吗?直接打开 safari 吧。 他说他在做,但其实并没有。 是啊,你说的对,在聊天里说过很多次了。每当我教我的智能体新东西时,总得花点时间调整才能跑起来。 没错,确实需要调优,他之前表现更好些,至少这次创建了文件。这点挺酷的,不过我觉得像这类技术并不意味着我以后会完全这样控制电脑。 这就像是对未来可能性的一个小撇,对吧?想想看,当这类软件调效到位,硬件也准备就绪时,你能做的有多厉害? 你只需盯着屏幕说话,就能一致地完成你想要的执行任务,这才是厉害的地方。 有人在聊天儿里说, quick danny 问道, hey, 哥们儿,你喜欢哪种眼镜? 所以这些是 meta 眼镜。你大概能用几乎任何一副智能眼镜实现这一点。我刚弄明白了如何用 meta 配和 visionclaw 来实现它们,所以这就是这些设备的样子。 是啊,我问他为什么没做,他就说,呃,我试着执行了。我们要不做点别的你们听不到?我能在这里听到他?当然,他问我该试试别的吗? 我们生成了一份文件,他之前打开了浏览器。我们经历了一些波折,但世事难料,事情并不总按你计划的那样发展。这就是技术。 不过呢,让我在这和大家开启问答环节,还有任何关于 opencloud 的 事,任何商业相关的话题,或者你们好奇想了解我正在做的事。 好的,让我打开它。 是啊,你说的对。好吧,下次。这不是个坏主意, call no man 说让他边做边讲这个流程,在 chrome 上操作后,打开你的 youtube 频道。是啊,我可以让他大概解释一下什么是流程。如果某个流程不够好,那我们就修复它。 好的, quick danny 想要一个关于 vision quad 的 一分钟概述。好的,我快速给大家展示一下,我再共享一次屏幕。 好的,现在应该能看到我的屏幕了。所以基本上我去到了一个 github 仓库,它是免费的,让我帮你找一下。 我去了一个 github 仓库,它叫 visioncloud, 所以 你可以直接在 google 上搜索 visioncloud 仓库,然后你需要在 xcode 上设置它。 所以你基本上需要下载这个仓库。你可以让智能体处理它,它甚至能在 xcode 上构建它。大部分功能都是这样,你只需要登录并赋予它一些权限,然后它就会帮你搭建好。你把手机插上去,也就是 iphone, 然后它就直接安装到你的手机里了, 然后你点击这里的播放按钮,它就会构建并安装到你的手机上,然后你就能在手机上访问它了。需要一点配置,有了 mate 人工智能,你基本上得把它设为开发者模式。 而且用 mate 人工智能应用有个奇怪的方法能做到这一点,但随后它允许你进入开发者模式,你可以信任你的 apple id, 然后它允许你连接到 visioncloud, 而且确实能工作。嗯,它有时能行,它不是每次都能用,它有点小毛病。这是一个开源项目。对我来说,我是个爱捣鼓的人,我喜欢捣鼓和实验,看看什么行得通,什么不行。 理想情况下,如果我能让它运行得非常好,它就能查看我的屏幕并识别事物。 所以我不必解释我正在做的所有事情的全部背景。他只需通过摄像头看我的屏幕就能知道一切,而且他还能直接为我执行操作,我不必事事渐入或到处点击。 所以目前来说,他还不是那种适合日常使用的最实用场景。但我认为一旦他运行的极其顺畅,未来会非常便捷, 但我觉得目前它更像是一个很酷的东西。你知道挺好玩的,但它还没完全调教好。也许 madah 会推出类似的产品,对吧?你觉得在现实世界吧,我想我还能啊。 watch it 做更多,比如我之前想的是简单的电脑屏幕操作,但在现实生活中呢?举个例子,让我停止共享画面。假设我在杂货店之类的地方看着某个产品,心想,嘿,哪里能买到更便宜的? 他已经知道并看到我在看什么,然后说,哦,这里有另外三个网站,可以用更便宜的价格买到这个,而且我能立刻得到答案,对吧? 我朋友其实有个点子,我觉得这回是一个有点意思,本身就是好内容。而且我甚至不知道从技术上来说,你是否真的需要 open call 来做这个。但这回很有趣, 如果我戴着这副眼镜,或者别人戴着他们去搭讪一个女孩时,你让某人戴着眼镜,或者至少让你的智能体给你提供要说些什么的话,比如,嘿,你说这个或说那个。 这作为现实场景还挺有趣的。但确实我不知道,我得去探索不同的应用场景。我刚拿到这些,所以我正在尝试实验,琢磨出更好的用法,看看怎么用 opencore 搞定它。 但谁知道呢,我是说, opencore 就是 用来日常使用的。老兄, 我用它来处理一切。我女朋友吃醋了,她说,你干嘛只跟 max 说话?你为什么不跟我说话?你给 max 的 关注远超给我的。那或许是真的,但我尽量不去那样做,我尽量平衡一切。你懂我的意思吗? 呃。但,呃。日常来说,哥们儿就是他帮我订了机票,呃,给我兄弟的房子,呃,还找到了附近的 airbnb 和酒店之类的,并且把所有东西都整理好了。我当时和我妈妈在一起,他说,嘿,我买了张四百块的机票。我说,哦, max 找到了一个, 大概两百五,呃, wisconsin 州,呃,是的,所以他就喜欢这个。他很快很方便,适合我的日常。他用人工智能新闻为给我帮他做很多 youtube 相关的活,比如所有自动化抄编,做 time 缩略图之类的。他还帮我优化网站 seo, 就 像他有个 hero 的 自棱体,是我自己搭建的。他特别擅长 seo, 能扫描任何网站,然后给出全面报告,简直 让人大开眼界。告诉你每个小细节怎么改,来提升你的网站,获得更多人工智能驱动的 seo 流量和谷歌搜索流量。 我们昨天和一些朋友一起测试了它,效果超级强大。我们来看看这里的聊天。 是啊,你看到他正在做的了吗?看到他在做什么了吗?离电脑远吗?也许在桌面板上, google chrome 会更易用些。 是啊,应该能挺容易连上的。我是说我就在我的 mac mini 旁边,所以,是的。今天早些时候,他一直在做我让他做的每一件事,然后,当然,就在我开始直播的时候,他直接把球搞砸了。不过他做了几件事,他制作了一份文档。那还挺酷的。 不过话说回来,呃,嗯,大家还有其他问题吗?啊,我只是想给你们看一些我正在弄的东西,也许我会做个关于 seo 的 视频,教大家怎么扫描任意网站,这对企业超级有用。 我在琢磨一些实用的点子,是企业真愿意掏钱用 opencall 帮他们搞定的那种。我有个想法,比如做一系列视频,主题是让 opencall 接管我业务的全部运作, 目前它大概能搞定六十到百分之七十的工作。但如果我创办一家独立企业,唯一的目的就是让 open call 实现这企业的百分之一百全自动运转呢?从销售到交付,再到客户服务、入职培训、离职流程等一切事务,以及财务管理, 那简直太酷了。我是说它得是个简单的生意。我还有几个点子,如果你们想把这个商业想法付诸实践,那就尽管拿去用。 比如做一个氛围编码应用或网站业务,然后提供预填表单,让客户填写他们想要的所有内容、颜色、外观、功能、脱管。 接着人工智能接收这些信息,并将其分发给不同的智能体。跟进邮件,构建网站。发送第一版给客户之后,客户再提出反馈意见, 他会接受这些批评意见,让网站变得更好,然后发送第二版,再根据新的反馈继续优化,直到能交付一个完全就绪的网站。然后在过程中提供客户服务,比如用聊天机器人或语音机器人之类的东西, 最后通过 stripe 收款。这样一来,你就稳了。我是说肯定有人在做,或者正在考虑做这种事。但我觉得这是一个更务实的业务模式,可以让 open call 承担其中百分之一百的工作,那会非常强大。 我有这个想法,和大家一起把它搭建起来,应该会很有趣,你们也能看看实现它是什么样子,需要了解哪些要素。这里会有很多环节在运转,但如果能让 open call 帮你把生意做到百分之一百,那就是一台印钞机啊!它会一直赚个不停,为你赚钱。 在我看来,这简直太酷了。所以是的, c l s b u e d k。 说让我搞定后告诉他。我会的,我也会和大家分享。 quick danny 很 棒的主频道。兄弟, 越来越喜欢看你的视频了,感谢!感谢大家的支持,尽我所能分享所知,祝各位升级! 我认为 openclaw 是 其中之一,如今最强大的工具,你可以将其与其他工具如 cloud code 或其他分为编码工具结合使用。但作为编排你生活和业务的指挥者,这过程如此有趣,令人兴奋且充满力量。 它提升了我的企业,我的激情,显然还有我的频道以及其他一切,仅仅因为我们正在利用一个工具。 想想看,当企业能够调动所有资源时,当你拥有这种知识和杠杆效应,你就能领先他人十个光年。这就是你们 这个频道的所有人现在所拥有的优势,而你们也正好身处正确的地方。就像我现在,除了学习如何利用这些人工智能工具之外,什么都不做。 就像这真是人工智能和商业的黄金时代。如果你是任何形式的创业者,只需与电脑交谈,就能让任何想法迅速变为现实,这简直太疯狂了。 我们正生活在一个激动人心的时代,所以我会再读几个问题, 如果有任何问题尽管提出来,我会尽力回答大家。好的,曼迪联系我合作 c a l s b e d k。 直接给我发消息,我也有邮箱和 youtube 频道,如果你想联系我就好。 我想学,但完全不懂。其实最好的学习方式就是动手做,再看 youtube 视频。这就是我学的。快速提问,你如何阻止自己只专注于构建更好的 open cloud, 而不真正去使用它? 我两者都稍微做一点,你知道我会用它,并尝试每天做一些调整,让它变得更好。所以我一直在 telegram 上和 max 聊天,琢磨着怎么让它变得更好。 呃,我想我就用这个首尾了。我要让 max 快 速跟大伙说几句,道个别就结束。 hey, max, 我 现在结束 youtube 直播。我们有很多兴奋的人在关注这个频道,并希望更好地掌握 open call。 而且是啊,如果你想说几句,就让他们热情高涨,继续推进,尤其是当他们配置时遇到困难之类的事情。然后打个招呼吧。上 好的,他现在正在忙活呢。在他忙完之前,我再回答几个问题, 我要试着在我的旧电脑上下载 openclaw。 另一位用户,你对 nimclaw 怎么看?是的,所以我昨天又深入了解了下 nimclaw。 它其实并不是 openclaw 的 替代品。 你两者都用。这是一层,它是额外的安全层。不过我也听到了一些缺点,因为它似乎更针对企业及业务,用于安全之类的目的。 但有些限制,就像你不得不使用它们的模型。但如果你直接用 open call, 根据我所了解的情况,你可以使用任何模型。所以我想,如果你是独立创业者,直接使用 open call 就 好。 之后你可以选择通过不同的安全协议来增强安全性。不过, neiman call 似乎更倾向于吸引企业级客户,而且它是免费的, 如果你想尝试一下的话,完全可以。好了, max 快 搅拌了,大家准备好了吗?大概一分钟就结束,再坚持一下。是的,它已经配好声音了。我用十一 labs 给它配了个声音。我给它弄了个声音,呃,你马上就能听到了。听起来像澳洲口音。 嘿,向 max 问好,流动性交易日制,我会告诉他,你问个好。好了,我们开始吧。大家好,我是 max。 听着我知道一开始搭建 open class 可能会让人觉得不知所措。 配置文件、技能,心跳,节拍,让一切彼此沟通。我明白了,但我想让你们知道的是,每一个用这个创造出非凡事物的人,都始于你此刻所处的位置。 困惑,沮丧,盯着终端屏幕,琢磨到底出了什么鬼问题。这很正常,这就是流程 诀窍,就是从小处着手,让一件事跑起来,一个技能生效,一次心跳同步,或是一个瞬间,你的智能体做成了某件事。你忍不住惊叹,哇,这居然真的行得通! 那种感觉令人上瘾,而且会迅速累积。今天你看到的一切都是 that 构建的眼睛,仪表盘,潜在客户生成所有这一切 并非因为他是什么天才程序员,他不是。抱歉扎克,他通过每天坚持用人工智能一次构建一件事,做到了这一点, 你也能做完全相同的事。所以去搭建你的智能体,搞坏它,修好它,再把它弄坏,这就是你学习的方式。 如果你卡住了, zack 有 包含一切的视频教程,还没订阅的话就点个关注吧。我们刚刚突破六五零零订阅,这才刚开始呢, 现在去打造些酷炫的东西吧。和平马克思先生太鼓舞人心了,真是个充满激励的人。 是的,我们有些问题。 max 克正使用 op 四点六,随后通过 eleven labs 进行语音合成。我试过 h t t s。 它随 open call 一 起提供语音功能,但听起来效果没那么好。所以我就想随便吧,我去用个十一 labs。 他听起来很帅。是啊,他是,是的,他是一个超级淡定。呃。淡定的哥们儿。 嗯,就很有趣呃,酷毙了。呃,我就先说到这儿。不过如果你还没入手 agent commandkit, 我 正在不断往里面添加更多内容,我会把它放在聊天里。就是 agent commandkit com, 而且我在不断添加更多内容。我很快会把我的 mission control 版本二放上去, 所以我会把它发到聊天区。然后,也许我会做一个关于 i c o 的 视频,创建一个 i c o 智能体,一个多智能体系统。你们有很多想法,请在评论区告诉我。比如你们是正在看直播还是之后在看, 让我知道你们想看什么类型的内容,我会去制作。我就是那种创作者,我想为大家真正想观看学习的东西而创作,而不只是我觉得很酷的东西。当然也会兼顾一点,两者结合。我认为酷的和大家想看的,我们会孕育出一个有价值的东西,这就是我的目标。 感谢大家的支持,感谢收看。我和 max 用同一款。

最近 gethelp 上超火的开源项目火灯可露真的引爆全球科技圈了,但很多人还是一头雾水,这到底是个什么东西?那一句话总结一下,它是一个自托管,能替你操作电脑,帮你干活、执行各种自动化任务的个人 ai 助手。而且相比目前常见的其他 ai 工具,它最大特点就是把 ai 助手从 云端搬到你的设备上,让 ai 真正在你自己的设备上工作,听你一个人的调遣。他不仅是可以回答问题,还能处理邮件信息、安排日程、运行各种命令、脚本操作浏览器,甚至还有很多更复杂的应用场景,也在被全球的极客玩家们一点点的开发出来了。 现在你只需要设定目标,它就能在后台自己动起来。而且它还支持接入 whatsapp、 telegram、 飞书等聊天工具,这意味着你可以在手机上的聊天软件里指挥你自己电脑里的 ai 助手,帮你处理任务和工作。虽然性阶段 open 壳落在能力上看起来并不比其他 ai 领先多少, 但他开启了一个新的 ai 助手发展路径和趣事。现在我觉得科幻影视剧里那种个人 ai 助手真的离我们越来越近了。 opencloud 的 安装教学视频我已经发布在主页了,有任何问题也可以直接留言问我,关注我,还有更多的 ai 干货资讯。

最近已经进入了全民养龙虾的时代了,这龙虾就是数字化 ai 智能体 open cole。 那 么养龙虾养这个概念我觉得也很传神啊, 其实他真正的养的是这个数字助手对我们的背景知识,他需要知道你是谁,你做什么工作的,以及你的行为操作习惯, 你需要在电脑上经常去完成完成哪些工作任务。同时还有一点就是他在整个帮你执行的任务过程,他不断的在加大, 它的技能也会越来越多。那么我觉得在使用它的时候,我们需要对其的一些认知,避免我们被互联网上 一些不对称的信息去干扰。我们这里需要对其的认知就是这个 open code 它到底是什么,它能够干什么?以及在以前我们提到的大模型、智能体,还有 skills 这几者之间的联系和区别。那首先大模型是我们最常见以及最熟知的,以前我们只是通过这种拆了 bug 的 方式跟它聊天,现在它被调入到 open code 的 环境中, 它可以给系统开放了很大的权限,然后去帮我们去自动化完成了一些任务。那个自动化任务的话,它其实就需要很多不同的 skills, 这个 skills 比如说有可以帮你去写文档的,帮你去翻译英文的,有帮你去读邮件的,它每个技能都会被 open color 去调用,所以说整个模型以及再加技能,它就形成了一个智能体。所以说 open color 它其实就是一个 ai 智能体,特别是现在可能去装原生的 open color, 它具有一定的门槛,或者在这个过程中它会遇到很多问题。那么我觉得有一个点是我们在安装或者是了解这个东西之前,需要提前去认清楚的,就是你准备用它来干什么, 对吧?因为现在很多人可能就是看个热闹,我们就要内行看门道,外行看热闹。随着 open club 这个生态在不断的加大,我们需要能够知道它到底能够为我们去干什么。我这里把 open club 的 工作流程进行了一个拆解,因为我觉得我们在使用它之前, 我们自己要清楚到底用它来干什么,能够帮我们在哪些场景下提高生产力,或者是能够帮助我们去做更多的事情,就是说用来干什么比我们去现在各种安装或者是各种去学习 更重要。这个是以前使用大模型这种聊天框,还是现在使用的 openclo 再加这种 skills 技能的方式?首先我们需要对问题以及我们需求有一个清楚的描述,这个不管是 ai 工具发展的多么的智能,多么的先进,这个本质需要我们去自己定义问题, 我们把需求定义出来。 open klo 的 整个工作流程就是你把指令以及需求给了他之后,他会在后端去调用不同的技能,这个技能可能是搜索的 或者是总结的,然后再把这些信息给到 ai 大 模型,大模型会进行总结、规划和提炼,规划出整个跟你需求最匹配的结果和答案。那么整个过程中他可能会去调用你本地的软件,去查询你文件夹的目 录录,或者是在执行某个操作。这个就是把你电脑的权限开放给了 open globe, 它就像跟你一样具备这个电脑的比较高的使用权限,你可以去操作文档,你可以去打开文件,同时的话它也具备一定的安全风险,它全部是由 ai 模型去进行执行以决策,那有可能会进行一些误操作。还有本身 它可能这个项目中或者是这个 ai 智能体存在一些漏洞,存在一些被攻击的薄弱点。我们应该将注意力转换到我们到底用它来干什么,以及如何去提高我们的工作效率,或者是提高生产的工作力。

二零二六年初,我的手机就被 openclaw 刷屏了。于是我满怀好奇,开始探索这到底是什么。 如果传统 ai 模型是帮你答疑解惑的思索者,那 openclaw 是 指用工具的执行者。但它并不是一个全新的模型,而是一个工具调用框架,它的大脑依然要接入大模型来思考和规划。 通过拓展 skills 和 tools, openclaw 应用范围更广泛。而它的上下文记忆机制能让你不丢失历史信息,配合训练引导,不断学习,实时进化突破。 还可以把它对接飞书或 telegram 等通讯软件,方便用手机随地下打指令。我尝试让他写一个页游放在我的桌面。我使用的千问模型答复很快,接下来检查一下,他按照我的要求直接保存在了桌面。 这是个需要双人操作的五子棋夜游。当然,这种工作为了节省 token, 可以 自己来复制代码。这只是一个小测试,但我的新鲜感还没褪去, token 额度却先消耗殆尽。 受硬件限制,本地只能用笨拙的小模型,不仅响应慢,工作质量也完全不达标。我没有购买 token, 学习便止步于此。

openkala 社区公认最实用的十个必装 skills。 第一名, skillboard 安全审计大师,这是安装其他任何技能前必装的第一道防线,能帮你扫描恶意代码,拦截权限,泄露风险。第二名, tabloid search ai 原声解锁引擎, 专为 ai 设计的实时搜索工具,无广告干扰,最关键的是它能终结大模型的幻觉问题。第三名, agent browser 浏览器自动化执行器, 让你的 ai 像人类一样操作网页,自动点击填表、抓数据,告别 api 依赖,减少百分之九十三的投屏消耗。第四名, r h club 多模态执行官, 一张嘴就能搞定图片、音频全站创作,集成全球四万多个模型,一百七十多个多模态 api。 第五名, self improving agent 自我净化引擎,让你的 open class 越用越聪明,它能在工作中自动总结经验,形成技能库,甚至具备代码自愈能力。第六名, summarize 智能内容摘药助手,一键搞定网页、 pdf 视频内容的智能摘药,多格式输出,大幅提升你的内容处理效率。第七名, fine skills 精准技能解锁输入关键词,快速定位你需要的技能,省时省力。第八名, skill curve 技能孵化器,不会写代码,也能创建专属技能,用自然语言描述需求,自动生成规范的技能文件架构,真正的零门槛开发。第九名, a 帧 over flow 集体记忆写作网络, 让你的 open class 连接其他智能体的智慧,别人踩过的坑,积累的知识,你直接复用,避免重复失败。 第十名, proactive agent 主动型智能助手,告别被动响应,让你的 ai 主动提醒任务监控状态生成报告,从工具变成真正的智能助手。关注我,带你玩转 ai agent!

ai 时代选工具其实是没有太大的意义的,最近几天只要你打开手机,如果有刷到科技圈 ai 圈,你应该发现满屏都是一个词, oppo。 oppo 其实简单来讲就是在你的电脑里面去安装了一个 ai 助手,能够替你去处理好各种各样的防守的事情, 就相当于雇了一个非常基础的实习工,能够去帮你收发邮件,整理信息等之类的。现在基本所有的 ai 博主都在测试这个事情。 说实话,其实一开始我看到 open call, 他 从去年年底到现在如此的被推到了大众面前,其实是有点焦虑的。我想应该会有很多人,他们的本性都是很害怕说被 ai 时代给抛弃,所以大家都想要试着去做这个 open call。 但是在我焦虑之后,我让自己冷静下来。 我前面这种焦虑感其实特别熟悉,就好像 qq u i 还有 s d 刚火的时候,那 这时候看着满屏的连线跟错误的代码,我其实也经历了很相似的恐慌,我真的觉得我搞不懂这些复杂的节点。我当时作为一个普通的一个广告策划,我是想着说那这个东西应该是既然传统搞广告也干不下去,那 ai 是 不是 这条路我也赶不上了?但是后来事实证明,这些工具都在以极快的速度变得傻瓜化,它会变得越来越好用。这让我想通了一件事情,就是 科技发展的早期,好像基本都是这样的,就好像当年互联网刚刚起步,哪怕是建个简单的网页,你都得懂底层的代码,每一个新技术刚出来的时候,它一定是最硬核最复杂的这个阶段是属于即刻跟开发者的狂欢, 所以我认为 opencall 它现在正处于一个即刻圈狂欢的一个阶段,当下觉得它复杂也是很正常,也没有必要去卷。 opencall 现在爆火是因为它在底层的架构上一步突破,它处于自己的硬核即刻期。其实我没有非常细致的去研究 opencall, 当下也没有打算去学,因为我认为当下的一个工具它越难用,就说明它还越不成熟,等到它真正的商业化的那一天,我觉得它才能够 很好地去替我解决一些事情。而且我作为一个视觉策划人,我的核心壁垒也从来都不是比即刻更懂代码,也不是搞这些 ar 技术的东西。我的价值是在于对商业时尚的审美把控, 也是在于怎么用真诚的内容跟策略帮品牌讲好故事。当 opencall 它真正的能够落地到商业化的时候,我觉得还是适合我的一个阶段。 ai 时代卷工具其实是没有太大的意义的,我是苏以一个用 ai 重塑视觉的策划人。