今天给大家介绍一下 opencolor 的 基本原理啊,最近 opencolor 非常火,他做的事情非常多啊,可以去帮助我们整理文件 啊,然后呢,可以去通过浏浏览器访问网站,然后进行这个知识或者信息的总结,还可以去操作邮件等等工作啊,那么具体来讲它是怎么工作的呢?它 opencolor 呢,本身它是一个 ai 智能体, 其实整体上来看,它的一个功能啊,主要是分成两块,它的组建主要分成两块啊,其中啊,这个一部分呢,应该属于它的叫网关的部分啊,另外一个呢,就是它的一个智能体的部分, 那网关的部分呢,主要是来帮助我们啊,帮助 open kala, 它能够啊处理我们用户的请求,比如说 啊,当我们去配置呃这个 open cloud 的 时候呢,我们可以通过啊飞书啊,或通过 qq 或者通过企微啊来进行和 open cloud 交互。那么这个 open cloud 这个网关的作用呢,就是能够来区分啊,我们是 这个飞书 qq 还是起微过来的信息,那么当收到了人类通过啊飞书发给了这个 open cloud 的 信息之后呢,这个网关它就会把信息传递给 agent, 传递给 agent, 那 agent 呢,它就能够 啊,接收信息之后来是来进行分析啊,来进行分析,那么当在分析的时候呢,他会怎么样?还调用一些工具,然后呢,呃这个来执行相关的动作,另外呢,他还可以访问啊大模型 来进行一个交互啊。同时呢,当我们这个 open class 需要有一些技能来操作的时候呢,呃,它会调用 skills, 所以整体上来看的话, open class 本身它就是一个网关加 agent 的 这样一个软件框架,具体的 open class 的 工作一个流程呢?我们以这个啊,让让它去去去上网啊 总结某个信息为例啊,那么我们人类啊,假如说通过飞书 把这个呃告诉他,你去上网总结一下关于某某新闻的一些信息,然后给我写成 这个简报发给我。那么瑞书呢,他会通过这个啊 china 的 一个配置接口呢,来到啊欧根卡拉奥的里面,欧根卡拉奥呢,他通过网关啊获得哦,这是来自你这个啊,这个我们机主的一个飞书的信息在这里啊,他需要做一些认证啊,认证 拿到之后他会啊通过这个大模型啊,就是 a 进他 a 进的,他有个有个这个大大模型啊,大模型 里面包括大模型的啊,他会分析啊,原来是让我去上网总结信息,那么这个时候他知道要上网,那这上网的话,他本身大模型是没有这个呃上网的这个能力的啊,他需要 借助外部的这种工具或者技能啊,进行一个啊网页的浏览啊,那这个时候呢,他可能会用到一些这个啊工具,他就直接去上网,或者说呢这个上网总结的这个功能呢,变成了一个标准流程, 标准化的一个流程,那这个标准化的流程呢?它就是这个啊, skill skills。 好, 那么 当这个啊 open class 接受到上网总结的时候,他就会啊调用啊 skill 里面的信信息,然后一步一步地去做。那怎么做呢啊?他分析啊,想要去啊上网,他就,他就通过调用什么调用爬虫,或者说是这呃 爬虫工具来获取网络的信息,网络信息,这些网络信息它是非常多的,那它要去总结啊,那总结它就怎么样?要用大模型, 大模型总结它是怎么返回?所以这是它的一个整体的啊,这个 skill 的 啊流程,在这个过程中啊,我们知道 这个 open 克拉他会调用大模型,然后呢这里面还会调用大模型进行信息的总结,然后再返回。所以啊,在这个过程中他所使用的啊 token 是 比较多的,因为 除了我们把这些爬虫的信息,网络的信息给大模型总结之外,他还要去做什么?做里面的这种逻辑的推理,去做这种啊,这种 a 帧的这种 逻辑。那么在这里面呢,就涉及到了啊,关于 agent 的 几种模式,也就是说 agent 它到底是一个啊,什么样的东西?那这个我们就再下一回进行讲解了。
粉丝705获赞2885

cloud bot 一 夜爆火,这是一个运行在本地电脑的开源 ai 助理,短短几天内, github star 数量直线拉升,已经超过了十二万。本期视频我们带来一个 cloud bot 的 全面攻略,看看 cloud bot 比起其他的 ai agent 有 什么特色。 我准备了十几个案例的玩法大全,还会介绍一个接入飞书加国产模型的方案,让 cloud bot 在 国内网络也能顺畅使用。视频开始之前,先插入一个小插曲, 由于 cloud bot 受到 ansorepic 法务团队的压力, cloud bot 先是改名成了 motbot, 现在又改名成了 open cloud。 爬爬虾做视频的速度还赶不上它改名的速度,所以本期视频我们还是统一叫它最开始的名字 cloud bot。 cloud bot 功能跟 cloud code 和 open code 都有点像,都可以处理文件编码、调用 skills、 m c p 等等帮我们处理工作。 cloud bot 的 最大优势是可以接入各种聊天工具,也就是我们即使出门在外,手边没有电脑,只需要在聊天工具里面给 cloud bot 留个言, cloud bot 就 能自动干活,还能把屏幕截图、执行过程等信息实时同步过来,非常的方便。第二个优点是, cloud bot 自带了强大的定生物系统, 只需要用自然语言就能创建定身舞,比如可以创建一个临时的提醒,还可以定时检查收件箱通知等等,它可以智能地判断事情的紧急程度,选择是否用聊天工具跟用户进行沟通。比起传统的指令执行、指令执行这种固定的流程, cloud bot 就 具有了很强的主观能动性。 它的第三个优点是具有长期记忆,可以把记忆作为文件存储在本地,在日常的对话中能够搜索,并且把相关的记忆捞回上下文,随着日常使用,它还会主动去更新这些记忆文件,会有一种越用越聪明的感觉。好,我们先在本地把软件安装一下, 任意一个能运行 note g s 的 环境都可以部署 cloud bot。 我 最推荐就是使用 mac 或者 linux 系统的家庭服务器。 现在最火的部署方案是使用 mac mini, mac mini 的 最大好处是 mac 系统有不错的桌面环境,这样可以很方便地进行截图、操作、浏览器等等。第二点是功耗比较低, 七乘二十四小时运行,比较省电。第三个优点是 cloud bot 里面许多 skills 跟 mac 生态是绑定的,没有 mac 电脑的话,可以选择 linux 操作系统,或者在 windows 里面创建一个 linux 的 虚拟机。操作步骤跟接下来是一样的, 我选择的安装方式是 node js, 我 们来到 node js 官网,把第一个命令复制一下,然后打开终端执行一下,接着是第二个命令,第三个命令, 这样 node js 就 安装完成了。下一步我们来到 cloud bot 的 官网,在这里有一个一键安装命令,如果我们使用官网上的一键安装命令的话,注意要区分现在软件的名字,比如现在叫 open cloud, 后续所有操作的命令都应该是 open cloud 开头了,这里我选择 npm 的 安装方式, 我们看到 n p m 这里命令还是叫 cloud bot, 所以 后续我输入的命令都应该还是 cloud bot 开头了。这样我把这个命令复制一下,粘贴到命令行窗口执行一下。安装完成,我们输入命令 cloud onboard 来进行初步化。第一步,先配置 ai 模型,因为我有 open ai 的 plus 订阅,所以这里我选择 open ai, 当然下面也有很多不错的国产模型可以选择。视频的后半段,我们再来配置使用国产模型。选择 open ai 以后,再选择第二个 chad gpt 登录, 登录一下我的 chad gpt 账户,这样 ai 模型就配置完成。默认模型我选择的工具是 whatsapp 视频的后半段。我们再来看如何绑定国产的聊天工具。我们打开手机上的 whatsapp 右上角三个点已关联设备,关联新设备,扫一下屏幕上的二维码,这样就绑定完成。接下来选择预装的 skills, 按空格键打上对勾选中,这里可以按需进行选择安装下面的这些 api k 可以 全部选择跳过,然后 ai 会询问我们一些关于人设方面的问题,我们回答一下,这样就配置完成。我说你可以给我的聊天工具发一个消息,我们看到手机上收到了消息,这样就完全配置成功了。 我们先来介绍几个基础命令的使用。输入命令 cloud bot gateway, 这个是启动主程序,我们可以通过关闭控制台来停止 cloud bot 的 运行。在 cloud bot 后台运行的时候,我们可以新开一个窗口, 输入命令 cloud bot t u i 就 可以进入这个控制台的对话界面。输入命令 cloud bot dashboard, 可以 进入一个网页版的控制台,在这里可以进行基础的对话。上面还有很多配置,可以管理定身舞,管理 skills 等等。输入命令 cloud bot channel logout, 可以 退出 cloud bot 上面登录过的聊天软件,然 然后我们再输入命令 log in, 就 可以重新登录一下,因为有的聊天软件可能隔几天就会掉线,我们可以使用这个命令重新登录一下。我们来看 cloud bot 最有意思的一个功能就是它的定身物,定身物赋予了 cloud bot 的 一些主观能动性,让它变得更像一个智能的 ai 助手。 比如我输入这个命令,提醒我两分钟以后关煤气。 cloud bot 回复我,好的,已经设定成功了。我们可以在网页版的控制台 crown job, 也就是定身五这个选项卡可以看到 cloud bot 为我们设定的定身五,这里显示两分钟后执行。两分钟以后,他就把这个消息推送到了手机上,提醒我去关煤气。 cloud bot 具有操作浏览器的能力,我们需要先在 mac 里面下载一个 chrome 浏览器,我要求 cloud bot 去 m i t 公开课下载 python 课程的课件,放到我的桌面,我们看到 cloud bot 自动打开了 mac 里面的 chrome 浏览器,找到了 m i t 公开课的官网,并且搜索 python。 他 找到了几门 python 课程, 回复了我课程的编号,让我选择这里,我选择第一个。他又在浏览器里面通过课程编号找到了这门课,并且下载到了桌面,然后我要求他把它解压出来,他调用了麦克的命令行工具完成了解压,然后我要求他把第一节课的课件发给我 这里可乐豹成功找到了课件,并且完成了发送,效果不错。接下来我们来看一个把浏览器自动化跟定生物组合起来的案例。爬爬虾,作为一个科技软件类的博主,需要经常查看 github 的 热点, 这里我告诉 cloud bot, 让他查找一下 gitap 上面的热点,然后做个中文简报发送给我。 cloud bot 生成了中文简报,接下来我说每天早晨八点你都做这么一个简报发送给我。 接下来 cloud bot 生成了一个定身舞,每天早晨八点都执行这个工作。我们可以在 cloud bot 的 控制后台查找到这个定身舞,每天早晨八点都会自动执行这个工作流程,发送给我简报效果不错。除了操作浏览器, cloud bot 还有图像识别等 ai 视觉方面的能力。 这里打开 mac mini 的 设置隐私与安全设置录屏与系统录音,我们在这里搜索终端两个字,给命令行终端添加上录屏和录音的权限。接下来重启一下 cloud bot, 我 在手机里面说,请给现在的 mac 截一个图, mac 电脑当前的图片就发送到了我的手机上,可以实时的对状态进行监控。 目前为止我们依赖的是海外的聊天工具。接下来我们把 cloud bot 接入飞书,让他在国内的网络也可以顺畅使用。我们先来到飞书开放平台,点击创建企业应用,填写一个名字与描述。接下来点击左侧添加应用能力, 选择机器人。然后我们来到权限管理,点击添加权限,总共需要添加屏幕上这些所有的权限。 接下来来到版本管理与发布,填写一个版本号,点击发布。我们回到 mac 终端,输入第一个命令,安装飞书插件。第二个命令,配置 app id, app id 可以 在飞书开放平台凭证与基础信息里面找到, 把 id 粘贴到命令行里面执行一下,然后配置 app secret, 同样在凭证与基础信息里面找到同样的,把 secret 放到命令里面执行一下,下一个命令,开启飞书 channel。 最后第四个命令,把链接方式改成 web socket, 然后我们重启一下 cloud bot, 这里我总结了需要执行的几个命令,有需要的观众朋友们可以截图保存一下。回到飞书开放平台,在事件与回调这里选择长连接,点击这个铅笔,点击添加事件,然后勾选接收消息,最后点击顶部的创建版本, 我们再提交一个新的版本,这样飞书就配置完成了。在飞书的手机 app 里面,我们可以找到开发者助手,然后点击打开应用这里我打一个招呼,你好,飞书有一个非常可爱的机器人正在输入的表情,我问他现在几点了,这里给出了回答。然后我让他给麦克截一个屏, 告诉我需要先在控制台跟他对话一次,开通权限才可以截屏。这里我们来到麦克上面的控制台,跟他对话一次,允许截屏,这样截屏完成。我们看到飞书也同样可以传递文件传递截屏。我们把聊天方式换成了国内平台 ai 模型,同样也可以换成国内平台。 cloud bot 的 作者推荐使用 mini max, 这里我们来到 mini max 的 开放平台左侧,选到接口密钥,然后创建一个 apikey, 然后我们打开 mac 的 控制台,输入 cloud bot config 来配置一下模型,选择 mini max, 然后我们把刚才创建的 mini max api k 填写进来,一路回车就配置完成。来到 cloud bot 的 控制台,输入命令斜线 models, 然后我们可以选择 mini max 模型, 选择完模型以后,我们再重启一下 cloud bot, 这样模型就切换完成了。 cloud bot 的 强大之处在于它内置的 skills 可以把各种第三方的生态接入进来,比如这里的 g u g skills, 可以 把谷歌邮箱、日历文档等功能都接入 cloud bot。 我 们点击这个安装按钮,这里要提醒一下大家,安装的时候要把 mac 系统更新到最新版,否则有可能会失败,这样一键就安装完成。 来到谷歌 cloud, 我 们在左侧菜单找到 api 与服务,选到 o o 四权限请求页面,创建 o o 四客户端应用类型,选择桌面 app。 然后我们把生成的这个 json 文件保存下来,把文件拖拽进 cloud bot, 告诉他配置一下 g o g 的 认证,然后我们登录谷歌账号,并且授予权限,这样就完成了配置。接下来我让他看看我的邮箱里有什么邮件,让他总结一下。 这里 ai 提示我需要再开通一个 gmail api 的 权限,我按照它的提示把权限开通完成,它就可以读取到我的邮件了。接下来我让它把所有的邮件移动到垃圾箱,这里也成功完成了。我在手机上让 cloud bot 帮我发送一封邮件, 我们看到邮件可以成功发送,我让 cloud bot 设置两分钟一次的心跳检查,如果有发现新的邮件,就发消息通知我,我给这个机妙邮箱发送一个邮件来测试一下。这里 cloud bot 成功给到了通知,我让他总结一下邮件内容,他也完成了总结。 ai 助手对接其他生态,一个重要的渠道就是 m c p, 我 们可以在 skills 里面找到 m c p porter, 把这个 skills 安装一下。接下来我告诉 ai 用 m c p porter 来配置一个百度地图的 m c p, 我 把这个 m c p 的 说明文档贴给了他。 ai 提供了三种安装方案,我选择 streamable h d d p。 他同时要求我提供百度地图的 a p i k, 把这个 a p i k 复制一下粘贴给他,这样就完成了配置。他已经可以使用这个 m c p 查询到地理位置的坐标了,这样我们就配置完成了,我们也可以在手机里面使用,我让他查询一下从青岛太平角公园到崂山羊口景区怎么走, 这里成功给到了规划路线,效果不错。我们再来看一个 skills 的 使用,这里有一个 skills 叫做 coding agent, 它可以驱动本地的 codex, cloud code、 open code 等 ai 编程工具 直接进行编程。这里我们先把这个 skills 安装一下,我在 mac 电脑上登录了我的 codex, 接着我在手机上跟 ai 说调用 codex 创建一个贪吃蛇的游戏,我们看到程序就编写好了,这样我们就通过 cloud bot 驱动 codex 完成了一个程序的开发。

大家好,在你装完 openclip 之后啊,第一件事要做的事情就是去选择一个模型,那模型作为 openclip 的 大脑,它起到一个非常关键的作用,那这么多模型,那他们之间有什么区别呢? 那为什么你的模型只能识别文字,不能识别图片呢?那本期视频呢,就跟大家讲一下不同的模型之间能力的区别,以及怎么去配置模型。那对于一款模型来说,它的能力有接收信息,那信息类型啊,有可能是文字,也有可能是图片, 也可能是视频、音频或者其他就是你发的信息的内容可能包含这些类型。那么大模型在接收到你这些信息之后,他对你的信息进行回复,也有可能有这些类型,比如说他回复文字,给你回复图片,给你生成一张图片,或者说做出来一个视频, 或者说做出来一个音频音乐,那么也有可能是进行一个网页的搜索,你让他调用了搜索的工具进行一个网页的实时搜索, 那么这这两个东西就是一个输入和一个输出,那不同的模型之间的差异啊,就表现在接收和回复这个信息的内容区别上。那么 open core 官方呢, 截止目前也统计了一个模型的一个使用的一个排行榜,那么这个排行榜里面的模型的排名,不是说我们传统意义上那种模型的一个综合排名,它更多强调的是在 open core 里面的任务的完成的成功率和这一个排名,大家可以看一下, 就是平均的一个排名,就是比如说第一的是 gemini flash, 那 么第二的是 mini max 二,二点一,那么对于 mini max 它现在已经发布到二点五了,但是二点五的表现是在这个排行榜是比较差的, 这个也是非常奇怪的。那么前面还有这个 kimi 的 k 二点五,就这些模型在任务完成的成功率是比较高的,所以这也可以作为啊模型选择的一个参考。 接下来我们就来说一下不同模型在接收信息和返回信息之间的差异,大家可以去选择。就是你在完成任务的时候,为什么有些模型处理的不好,那比如说我们 dbisc, 那目前 v 三点二版本它只支持一个文本的输入和文本的输出,那么对于千万三点五 plus 来说,它能接收文本,也能发图片,它也能去理解这个图片是什么。比如说在我的这个 openclip 的 这个非书的聊天里面,我上传一张图片,那模型来识别一下图片中的文字, 如果你的配置的模型它不支持这种啊图片的识别,那么它出来的结果就是跟实际的结果是有很大的差异的, 那么可以看到它识别出来了这个图片里面的所有信息是完全非常准确的。那么在刚刚的演示里面,我们可以看到千万三点五 plus 它是有一个图片理解能,所以大家在用的时候一定要注意自己的业务的场景 啊,选择正确的模型。那么这里边除了图片理解呢,这边还有一个网页搜索,就是说它本身模型它本身支不支持这种搜索这种内容,因为对于模型来说,知识库它是有一个截止时间的,比如说你可能你 模型的训练数据可能只是截止到二零二五年,但是你现在搜索二零二六年的,那就有些模型他是具备这样的网页搜索能力,他就可以调用这种 实时搜索能力,那么有些是不支持的,那就要配置这样的 m c p, 官方也出了这样的工具,比如像豆包系列,二点零最新的模型也是一样支持文本和图片,那么他这边也是可以单独去开通网页搜索的能力啊。 那我们可以看一下,就是啊这几款国产的,比如说 mini max m 二点五、 m 系列和这个智普的五点零,他们这个图片的识别是需要单独去配置 mcp 的, 不然的话他是没办法去识别的。 那 timi k 二点五的话是原生就支持图片识别,那么国外的模型,比如说 colossal 四点六和 jpeg 五点四,还有 jimmy 的 三点一 pro, 那 么它们都支持图片识别,也支持这种啊网页的实时搜索,那算是这个综合能力算是比较好。那其他的比如说你要去让模型去申请个图片, 那基本上我们现在用到的这主流的这个啊主模型啊都不具备,那么你就可以去调用他们专门的图片模型。比如说像千万,他有专门的万象系列的生成图片的,那么都包括有纪梦相关的模型,那么像 jimmy 的 话,有专门的这个深图的模型也是可以的。就是这些 又需要去单独去配置,在你去生成图片的时候去告诉他去调用这个模型去做这个事情,那像这个火山,这个 cds, 二点零系列都是可以去生成视频的,那么这个就是一定要知道,就是一款模型,它不是万能的, 你可能需要不同的模型来配合去完成你的业务的场景,所以一定要一定要弄清楚你的业务场景里面涉及到了文本、图片、视频、音频, 就把这个东西先想明白了,再去找对应的模型配置好,就才能去把整个东西,整个东西串起来。选好模型之后,很多模型厂商都会有两种购买方式,一种叫做按 token 购买,就是 按用量购买,用多少啊你就付多少,这种方式是比较自由的,它是不受任何限制的。那么第二种就是按这种 coding plan, 就是 套餐的方式,那这种套餐是什么样子呢?一般是有 有限制,比如一个月能用多少次,然后一周能用多少次,然后五小时能用多少次,它是有一个这样的一个限制,会每隔五小时会刷新,每一周会刷新,然后总流量是不超过啊,每个月总流量那么像智普啊, mini max, 豆包,还有这个千万 都出了相关的这种啊这种代码的套餐啊,就是可以可以编码,又可以用在 openclo 里面,那每一个套餐这个量是不一样,大家一定要注意去看,它可能在官方的介绍里面会说啊多少多少次请求,但是要换成就是你的一次对话,就是你跟 openclo 对 话一次,可能要 调用很多这样的一个请求,那么这样的次数是没有他说那么多的。最后呢,就是我们选择好了模型之后啊,我们怎么去配置?第一种方法就是啊原声的就是它 openclo, 它本身你在配置的,你在安装的时候它是有模型的一个列表的,比如说你输入这个 openclo config menu, 那 么 到这一步的时候,你选择这个 model, 就是 你需要去配置这个模型这边的话就会选择很多啊,它本身的支持这个 pro i 的, 就是它本身已经内置了这这些模型的链接,那么你点进去之后,你就可以去输入你的 a p i t, 或者说输入你的这个认证授权的一个链接啊,那这能快速的去完成。那还有一,还有一些它可能是不在这里面的,比如说像千万千万的这个 codeplain, 还有一些其他的这种模型的配置啊,那么你就可以使用这种 cc switch, 那 这款软件,那这款软件呢?有一个单独的一个菜单,那么点进去之后你可以去进行配置,也是一个图形化的界面。那接下来就是这种比较繁琐的,就是去编辑这个这个 配置文件,那这个是 openclip 的 一个啊,总的一个配置文件,那这里面的话,你就要去修改这个 providers agents 里面的内容。一般是 如果你选择哪个模型厂商的话,它会提供这样的配置文件修改的,这个啊完整的字幕串,你直接去给它修改掉就行了。那么如果你自己改这个接线文件,因为这个接线文件非常大, 嗯,不太方便了,你可以借助这个 ai 编程工具,比如像 tree 啊,像 cos 啊去帮你去修改它,它这边是可以去给你修改,而且可以去给你修复可能修改出来的问题啊。 那除了这上面的方法之外,那就可以用它自己的这个外部端里面的设置里面找到这个 modus 的 节点啊,但是它这个说实话非常非常难用啊, 我觉得用上面的方法都比它这个官方这个界面用的会可能会更简单一点。那你如果配置完之后啊,最好是重启一下,那么你在页面上可以点去重启,或者说输入这个 open curl, get away restart 这些命令去重启,重启完之后,那么你就可以去使用新配的模型了。 ok, 那 本期视频到这,希望这个视频对你有所帮助。


好,上期的视频我们讲了啊,我们启动小龙虾来开始设计这个网站,然后在开始之前呢,我们准备好了 这个一些这个技术的资料,包括这个网站呢,这个内容介绍的一个文档,包括要参照的这个网站,包括要改动的这个原有网站啊,我整理这一段提示词,把这个提示词现在输到这个动画框里面点发送, 然后我觉得可能只给这个目录的文档,只给这个文档的目录可能还不太好,然后我直接把这个文档提交给他, 好,我把这个文档上传给他,然后我告诉他上面就是 整理好的网站设计内容,请从这个文档中提取设计和开发网站需要的各类内容。 然后看他现在已经是做了一些工作,他说参照网站分析原始网站是这个,然后说这里面内容包括这些,这些这些栏目联系方式,然后又整理出来,这个叫啊案例,这我们参照的这个非书官网的风格 啊,背景色是白色,前卫干净整洁,色调是什么?卡片风格,布局自提交互。新网站的风格有几个可以选?他第一个说给出了科技蓝企业战方案 b, 是 本众商务风方案 c k, 简约现代风,我第一个选择哪个方案?我选择方案 a, 然后第二个啊,我告诉他暂时没有替他调整需求, 请开始设计工作啊。然后小龙虾给我回复说参照网站整体风格飞出的官网列出来一堆这个飞出官网那些页眉元素,新网站的风格,我选的是科技科技蓝的企业站简介,专业啊,这只列出来这个方案 a 里面的一些这个页眉元素 网站内容结构列出来了,然后下一步说以上风格分析是否准确选择哪个风格啊?是否有其他调整需求。 这里面我告诉他启动两个词代理,第一个词代理是从我的文档提取内容并结构化。第二个呢,就是做新网站的设计及非书风格设计开发网站。好,这里面他说已经收到翻译确认两个词代理开始启动工作了 啊,在这里面我们就暂时会停一段,等到他工作有进展了,他会来找我汇报的啊,这里面看他已经给我一个回复,说收到确认风格分析,准确选择方案 a, 方案 a 的 设计规范,一个最终版注册用这个渐变蓝,背景用这个白色的简会标题色, 正文字卡片这些两个字,代理正在并行工作啊,这里面我们就去休息会啊,到旁边坐着喝会茶等着他。就 啊,大概过了有十分钟啊,小龙虾给我回复这个消息,说子代理一内容完成了,也就是从这个 word 文档里内容提取完成,提取了这些信息,公司业务方向、知识产权、资质荣誉、产品中心称、管理联系方式这些啊,他这内容提取的很完整,当前状态是内容提取完成,网站开发者进行中, 他说网站开发正在使用这些内容。捷德方案 a 的 风格规范开始设计开发网站,下一进度汇报将在约三十分钟后。好,那么现在我们就要暂停了,暂停了,我们到旁边该休息休息,该喝茶喝茶。大概三十分钟以后,小龙虾又进展了,他会来找我的, 哈哈,上一个阶段结束之后,大概过了十分钟,呃,小龙虾又跟我汇报,他又进展,他说因完成的工作项目创建完成、依赖安装是说这些。 i m。 我先到这个路径下面, 然后是运行这两个命令。运行这个命令? 好,这应该是运行起来了,然后我访问一下这个地址。 好,大家可以看到这个就是小龙虾给我设计出来初步的一个网站啊,上面是这个一些主要的这个板块公司简介 哈,成立于哪一年?知识产权多少?搞你技术认证这些发展愿景、核心价值观,然后是资质、荣誉,已经通过了这些资质,然后是发展历程,然后是知识产权啊,知识产权它分门别类的列出来嘛?业务领域, 业务领域、产品方向,然后是产品中心,产品中心可以看到他给我列出了九大产品, 然后是成功案例,然后是联系我们页面。

如果呢,你想把 open class 从会用到用好,那你一定要需要了解啊,它的 work space 工作空间该怎么样去配置?今天呢,就一口气啊,给大家都讲清楚。 首先呢,什么是 work space? 那 work space 呢,其实就是你的龙虾,这个 agent 的 他的工作台,哎,他决定了,哎,他是谁,怎么工作哎,以及记什么事,记得什么事,怎么样跟你去相处等等。那它呢,一般是由这些主要的文件来构成, 接下来呢,我们逐个的去进行介绍。首先呢是 agents 点 m d 啊,也就是它的岗位职责说明,那这个呢,其实也是欧盟卡拉里啊最关键的配置之一。 那你这个龙虾,你这个 agent 啊,它是什么样的职责,它该做什么事,不该做什么事啊,它遇到什么样的情况,该怎么去处理,都是靠这个文档来说明的。 我们可以看一下他给出的一个默认的一个说明,比如说在这个里面,他规定了,哎,你首次运行的时候该做什么样的事情,那每次绘画的时候应该先读什么样的文件, 包括你的记忆系统,哎,该怎么去使用,包括你的安全规则啊,比如说啊,绝不泄露隐私,比如说做一些销毁型的命令前要确认啊等等啊,以及还有这些怎么去做群聊,怎么去叫做心跳任务啊等等。 那当然了,他也会告诉你啊,这就是他的工作手册,我们需要根据我们的需要去进行修改啊,但是这里啊,我们也要提醒啊,这个文档呢,其实是很重要的啊,如果你不会改,那就不建议你去删他已有的内容,但是呢,你可以根据你工作的需要去给他进行补充或者更新,但是呢, 也不建议大家把这个写的太长太臃肿啊,五百字的效果要好于两千字。那第二个文档就是 identity 啊,它的身份信息啊,主要包括了一些简单的字段,包括它的姓名、身份、性格、表情、头像等等。 那第三个呢,就是他的灵魂性格, so, 那 so 呢?他是一份角色设定的文档啊,他其实是帮你去设定你这个龙虾,你这个 a 阵呢,他是一个什么样的人格啊?包括了他是一个什么样的人啊,他拥有什么样的价值观啊,他是一样, 他是什么样的性格啊,他以及他的这个说话聊天的方式是什么?比如说我们也可以看一下他给出的一个默认配置啊,他告诉你,哎,你是谁,你的做事的核心原则是什么啊?比如说你要去真正的帮助人,而不是表演式 啊,你可以有自己的判断啊,你要自己去想办法,你要去赢得信任,以及他的一些边界感啊,在哪里啊?包括他的这个气质啊,他的性格,聊天啊,都可以在这里去配置。 那最后呢,他也会提示啊,这个文件呢,不是写完就分存的,这个呢,会随着你跟用户之间的聊天对话,去越来越清楚自己的定位,越来越清楚自己的这个工作方式啊,他就应该被持续的改写。 那我们再来对比一下前面说的 identity and soul 是 什么一个区别呢?那 identity 呢?好比就是啊,工牌啊,名片啊,身份证啊这些信息。 那 so 呢?就是它这个人格的描述啊,比如说你是一人还是爱人啊,你的这个 iftp 啊,什么相关的这些十六型人格,哎,到底是什么?哎,是这样子的。 第四个呢,就是这个 user 文的,哎,就是用户资料,关于这个主人,哎,也就是你的资料方便呢,让你的龙虾去了解你, 包括了你的这个姓名啊,称呼啊,你的职业工作背景啊,以及其他的一些性格爱好偏好等等。那这个信息呢,其实也是随着你跟龙虾的这个沟通和了解不断的深入,他也就会记得更加清楚。 第五个呢啊,是兔子文的工具手册,他可以记录一些能够帮他去提高工作效率的一些这种相当于笔记啊,一些捷径方法的一些注解 啊,比如说你的这个各种的 a、 p、 r、 k 啊,他就每次就不用去再问了,直接在这里就可以查到了, 比如说你的这个一些特定文件的保存路径,哎,他也就会记住在这里,还在他的例子里啊,他还举了一些啊,比如说家里这个路由器啊,或者 server 的 这个地址啊,这个用户名是什么,还有一些语音合成的片号等等。 那有了这个文件之后呢,哎,他做很多具体的事情的时候,就可以依抄,依照这个小抄啊,笔记就可以更加快速的达成。那么第六个呢,就是他的 heartbeat 啊,心跳任务,那这个文档呢,主要是记录一些他该定期检查的一些啊,主动任务, 比如说查邮件,查天气等等。那在这里啊,比如说我给他定了一个啊,每隔两小时帮我检查一下邮箱啊,他在这个工作时间八点到十八点之间,每隔两小时帮我检查一下邮箱,看有没有新邮件来提醒我啊, 这像这些任务他就可以的。那在 open call 里呢,其实是有两种主动任务的形式,一种呢就是我们刚说的 heartbeat 的 形式,还有一种是 crawl 任务,那这两个的区别在哪里呢? heartbeat 呢,其实是适合每隔一定时间的这种周期性的任务,比如说每隔一小时,两小时检查一次油箱等等。那么 crow 呢,它适合这种有固定时间点的定时任务, 比如说,哎,早上八点,哎,帮我整理一下早间的新闻,哎,下午五点,帮我记得做一个总结提醒啊等等。那第七个文呢,就是 bootstrap 啊,它其实是首次启动的一个引导文件,一般是刚安装好或者刚创建好时啊,进行的一个引导绘画,一般是用来确认 他自己是谁啊,你,你是谁,包括一些身份信息的,交换完之后呢,他会自己删除。好,我们可以看一下他默认的这个 bullet script 文档,是这样子的,他会提示你啊,你是刚醒来,什么都还没有,这是第一次开场的时候,他会让你提示,你是说,哎,你是谁,我又是谁, 去交流这些信息。那聊完之后呢,把这些信息啊保存到这个 identity 和 user 啊相应的这个文档里面,那最后结束之后啊,它会提醒你啊,这个文档已经就可以删掉了。那么第八个,哎,就是我们的 memory 目录了, 这里呢记录了里面的绘画详情,哎,这个就相当于日记本,它会把每天发生的事情,每天的这个对话,这些具体的事情啊,都记录下来,哎,用这个日期和主题进行命名,比如说这个就是他跟我之前的一些 memory 记录, 那对应呢?还有这个 memory 点 m d, 那 这个呢,才是真正的这个长期记忆。那 memory m d 呢?它其实是每隔一段时间啊,会在前面的绘画详情中啊,挑出有价值的事情啊,经验啊,教训,或者一些值得记住的信息,哎,去把它提炼总结记录下来。 这样呢,和他下次对话的时候,就能快速找到这些重要的不该遗忘的事情啊,避免再去过去的这些大量的文件里面去再重新去翻找了。比如说呢,在我的龙虾的官网里,他帮我记住了啊,下周二有一个联系人联系啊,也还有我的一些相关的一些偏好,一些方向在哪里 啊,以及我告诉他处理我的这个邮件该怎么去处理的一个流程,注意事项等等,他都会记住。 当然在这里啊,我们还是强烈建议大家去定期去帮你的龙虾去整理它的长期记忆,只保留重要的信息啊。 memory 文件呢,同样不需要太长啊,比如说像我前面这个记了下周二的一个事项,但是这个过了这个时间的点之后呢,它就变得没用了,哎,你要去帮助你的龙虾去做好这个信息记忆信息的梳理。那么第十个哎,就是 skills 目录哎,也就是这个技能。 那如果我们想让我们的龙虾去完成一些更加高级的任务呢,我们就必然要会去安装各种各样的技能啊,比如说啊,我这个龙虾他就安装了这么一些技能。 那我们要知道的是啊,我们的技能呢,其实是分为了共享和独享这么两种,那我们在这里呢,其实是我们看到的都是这个独享技能啊,因为它在当前的 work space 下,它其实是只能供当前的 a 帧的使用,那么它事实上还有一个共享技能目录啊,一般是在这个目录下, 那这种呢就适合如果它是多 agent 的 情况下,那就所有的 agent 都可以去调用好。那么提到多 agent, 大家去可以看一下,因为我们像刚才说的介绍的这个整个 work space 呢,其实是对于一个独立的 agent 的, 假如说我想创建多个 agent 啊,假如说我除了这个主 agent 之外啊,我还专门创建了一个帮我去写代码的 code agent, 比如说我还有一个帮我去专门写作的一个 write agent, 比如说我还有一个帮我去产品设计的一个 agent, 那 这样的话呢,每个 agent 都有一个独立的 work space, 一个独立的工作空间,这样的话呢,就能保证他们有自己独立的人格,而不会相互去串台。 那这样的话也是带来的我们刚说到的 skills 啊,它每个 skill 只能够被当前的 agent 调用,但是呢,如果我们安装在这个共享空间里的这个 skills 呢,它其实是可以供所有的 agent 都去调用的。 好了,那以上呢,就是我们对 openclaw workspace 工作空间的主要文件的一个讲解,关注我,带你玩转 openclaw。

喂,大家好,我是杰哥啊,我今天给大家带来一个,呃,怎么样把这个 openclaw 和这个 antigraphy 的 里面的模型呃结合起来,并且用 antigraphy 里面模型的这种方法啊? 呃,因为我们,呃例如说用这个 openclaw 的 朋友都知道这个 openclaw 呢,它使用起来非常的消耗 token, 那么怎么办呢?幸好呢,就是说我手头的旁边呢是有这个 antigravity 的 这个账号的,它里面的这个像吉米尼三模型和这个。 呃 o p u s 四点五 cking 啊,还有索尼这种模型呢,呃能力都非常强,并且呢额度也比较多啊,那我就想能不能让我的 open cloud 用这个 antigravity 里面的模型呢? 啊,这个经过搜索和查阅官方的文档呢,我们发现是可以的。好,我们打开这个呃官网的这个帮助文档啊,翻到这个 model 底下的这个模型供应商这个地方啊,我们就会发现这个地方他说有支持这个。呃,使用 antigravity 里面的模型好,这个地方他怎么说的呢?他说要启动,第一步是启动这个 google and gravity 的 插件,再一个就是登录好它这里呢,主要就是这两个命令啊,执行完了就可以了。好,我们这里来看一下啊,我们,嗯, 先执行一下啊,我们看一下我们这里当前用的是什么模型啊? 啊,我这里呢已经把这个命令发给了这个 open cloud 了啊,接着我们等待它返回 好,这个地方,它返回了啊,大家看是吧?这里呢,我们把它放大一点啊,它当前使用的是千万大模型啊,标记为标识是千万 port 啊, code model 啊,这个模型 好,我们这里呢,接着就按照啊官网说的这种两个命令啊,我们在这个那个里面来执行一下啊,我们这里呢进入到了这个,呃,我们的这个多可容器的命令,行啊,我们这里第一步我们执行 执行它的这个启动,这个什么呢? google and gravity os 的 这个插件啊, 好,这个地方大家看是吧?我们这里呢执行成功了啊,我们这里他说 opencloud 二零二六一一月三十号啊,这个版本 啊, enable plug in 啊,这个 google android gravity o whats 这个插件啊,这个插件,呃,假如说有些朋友你的那个里面没有的话,你可以先这样来确认一下这是什么呢? 找到你的这个容器或者是你的这个,呃, open cloud 它的这个代码的 代码的根目录下啊,找到这个有个叫一个程序式的一个文件夹啊,打开这个文件夹看一下底下是不是有一个叫 google anti gravity os 的 这个文件夹啊,这个就是这个插件啊,我们当当前执行的这个命令之后, 其实就是把它给起用了啊,起用了好,接着他说还要啊获得 antigravity 的 授权啊,这个地方怎么做呢?我们就执行第二条命令啊, 这个命令其实也就是那个什么呢?官网猎取的那个命令,只不过我是在这里执行,是把这个命令的后缀,是吧?大家看这个上面啊,这个后缀给它带上去了啊 啊,我们这里粘贴了之后回车啊,我们这里就得到了这样的一个链接啊,这样的一个勾勾的一个链接。好,我们复制这个链接啊,复制完了之后我们 到浏览器里面啊,我们到浏览器里面这个地方,我们来回车啊,让他访问这个链接。好,这个地方呢?他说要授权啊,我们这里点击这个账号 好,点击了之后这个地方他说要翻译,我们再点好,到了这个页面,他说,呃,那个链接不能不可达啊,我们不要担心。这个地方呢,我们就直接复制啊浏览器的这个地址,复制了之后我们回到 我们这个多克命令行里面啊,我们把它粘贴进去,粘贴了之后我们继续回车啊,回车了之后让这个多克这里继续处理好,这个地方它处理完了,我们来看一下 这个地方,它说,啊,这个 antigravity o word complete 啊,配置结束更新的这个 open cloud 下面呢,有个叫 configure json 的 文件 啊,这个授权的属性是什么呢?啊? google analytics antigravity 啊,这个 gmail 点 com 啊,用的是 google analytics oops 啊,默认的模型是什么啊?它说设置成了 google analytics 底下的克劳德 o p u s 四点五 cent 啊,用的这个模型 好,那个前面啊,我们执行那个的时候他说要干嘛呢?要重启一下这个 getaway 啊,重启一下 getaway, 好, 我们这里回到我们的这个什么呢?容器 好,我们这里到了容器这个地方啊,我们点击按钮让它停下来啊,接着再点击按钮,让我们的这个容器启动啊,我们看一下啊,再看一下这个容器, 让它启动完成啊, 好,这个地方它启动了。 好,接着我们继续回到这个 openclaw 这个页面啊,我们回到 openclaw 这个页面。好,我们还是用同样的文字啊,我们这个地方再发一遍,看一下当前啊,我们这个 openclaw 它是用的是什么模型? 好,它正在处理中。 好,我们放大一点,让大家看清楚一些啊,好,他说了什么呢?这里已经滚不下去了啊,他说当前使用的是 open cloud, 四点五 centen。 啊, google and gravity 啊,克劳德 o p o s。 四点五 centen 这个模型啊,这是 astrotik 的 点击推理模型,通过 google and gravity 平台访问。因为我自己手头有几个啊,这个 anti gravity 的 账号,所以呢,我就可以呃,把这个 anti gravity 的 账号的模型都接入到这个 open cloud 里面,这样的话,呃,我就可以呃以非常低的成本来使用到这些顶级的大模型了。 好,这个呢,是我今天这个分享的这个,呃,我们 openclaw 啊,如何来通过节省这个什么呢? 呃, token 消耗啊,降低我们这个呃一些费用的一些方法啊。呃,那个今天我的分享就到这里了。啊,谢谢大家啊,如果大家对我的这个视频有兴趣的话,可以给我一个关注。好,谢谢。

今天我来给大家介绍一下我们公司全员 open 可乐,全员小龙虾了,也就意味着现在我们除了有三十个人类员工,还有上百个 ai 员工。好,我先给大家演示一下 我的小龙虾团队,大家看一下我的小龙虾有八个员工,第一个员工是我的短视频编导,这个短视频编导每天可以给我十几个话题,然后我选两个,他就给我把能够直接爆的文案生成,然后我就直接拿着拍短视频就可以了。然后再来看看我们的课程研发,我们以前做一套课可能需要一周,现在用它足智级的课程 ppt 直接生成,然后再让它生成 ppt, 它就可以把 ppt 做出来。再看看我们的朋友圈运营,我们以前发朋友圈有个专人要天 天冥思苦想,现在直接搞定。而公众号选题官就更神奇了,它不光是可以把公众号写出来,还可以直接发到我的草稿箱,让我一键一分钟就搞定一篇公众号,并且我现在的公众号数据比以前好了三倍。那么我这里还有一个 ai 主管,他会监控我的每一个 ai 员工是怎么工作的,哪些员工我没用好, 需要去把它用好。除了这些基础的工作之外,我还有一个 ai 战略观,这个战略观会发现我发现不了的战略视角。好,接下来我带大家看一看我们其他员工是怎么用小龙虾的。我们先来到我们的技术同学水月这里,水月,你的小龙虾叫什么名字? 我的叫大圣。哇,大圣这么屌的名字。然后你用你的小龙虾在做什么啊?我是在做咱们破局的十多个系统,然后让小龙虾来帮 老板,如果说没有小龙虾的话,你今年可能还得再招十个人。这么多的吗?对对对啊,那你太牛了。好,接下来我们看看我们的 业务负责人小军是怎么用小龙虾的,来给大家展示一下。我的小龙虾叫小小,做什么事呢?他是帮我做整个这个业务的这个管理,然后帮我能拆解到每日的每周的运营的动作和拆解的一些 细节。那有了它,我可以完全省略一个 p m o。 的 团队,让我高效的每日获得当周要做的事情,非常棒。基夏,你的小龙虾叫什么?我的小龙虾就叫做小夏,他主要帮你干什么工作?他平常会帮我写一些文案,或者是在我创建其他的事情 的时候,他帮我统一管理。好,非常好。 ok, 我 们再来看一看我们的训练营的负责人王庆同学,你的小龙虾叫什么名字?小龙虾有两个现在 一个是老王,一个是破底,他们家就是破底龙虾,就是专门负责我们现在所带的训练营的。有了小龙虾,你少招几个人,少招三五个吧。好,清晨,你的小龙虾叫什么名字啊?我的小龙虾叫管家。好嘞,王坤,你的小龙虾叫什么名字?我的小龙虾叫什么名字?我叫薇薇。 open call 华仔,你的小龙虾叫什么名字?我能叫阿卓,好,你用小龙虾做什么啊?我就是平常跟他对话一些,我平时用的一些。 啊,非常好,非常好。来看看我们的人力负责人云朵同学,你有小龙虾吗?我有小龙虾。哇,我们的人力都用上小龙虾了,你的小龙虾叫什么名字?我的小龙虾叫云朵,你看它可以帮我写文案,然后整理会议资料,然后写活动策划,而且它还可以帮我申请简历, 这样的话我就可以至少省两个人力的一个呃成本,所以他还是非常提高我的工作效率的。好,再看看我们的设计同学,哎,你的小龙虾叫什么名字?他用来帮你干什么?他会帮我收集这个海外的设计的流行 书籍。上,好,你再看看我们运营负责人辉源的小龙虾叫什么名字?我小龙虾叫雪莉。啊,他主要用来干什么?主要是我跟他对话,做项目的 组织的管理,以及说运营方面的支持,他设定的身份是运营总监,非常好。来,再来看看我们的运营负责人灰灰的小龙虾。我的小龙虾有好几个,一个是项目管理,一个是课程设计和一个公众号创作的,然后都是用来完成不同的工作内容。好,非常好。

来了来了,腾讯官方支持的 openclaw 的 微信接入教程来了,废话不多说,现在就开整! openclaw 是 什么我就不多说了,昨天的视频有介绍,因为昨天有不少小伙伴们说 whicht 的 接入方法有会被额外禁用甚至封号的风险, 那我们今天就来说说这个刚出的官方支持的方法,这可是官方文档提供的方法哦。那今天呢,咱们就集中火力搞定它跟企业微信的对接 好了,咱们来看看今天的作战徒步。首先呢,我们得先认识一下这位新来的 ai 员工,然后呢,给他做好入职准备。接着呢,在企业微信里给他安排个工位,再把他和我们的私服器连上网。 最后,也是最关键的,让他学会怎么七天二十四小时昂然待命。当然了,万一中途遇到点小麻烦,我也准备了解决方案。 好,那咱们就从第一步开始。俗话说的好,磨刀不误砍柴工嘛,咱们先把所有需要的东西都准备好,这样后面的操作才能行云流水。 我们需要准备的东西其实就两样,第一,一个有管理员权限的企业微信账号,哎,别担心,如果你只是想自己玩一玩,测试一下,完全可以去免费注册一个新的企业号。第二呢,就是一台云服务器,而且上面已经装好了最新版的 open call。 哎,这里大家可得注意了,这有一个非常关键的区别,如果你的企业微信账号是没有认证过的, 那测试的时候直接用服务器的公网 ip 地址就行。但是如果你的账号是已经认证过的企业,那就必须一定得用一个背过案的域名,这是企业微信为了安全和规范定下的规矩,咱们得遵守。 行,准备工作做完了,咱们就正式开干。现在我们要做的就是在企业微信的后台亲手创建一个连接的桥梁,也就是我们的机器人。 来跟着我一步一步来。先登录企业微信后台,找到那个叫安全与管理的菜单,点进去之后呢,再找到管理工具,然后点击创建机器人,在弹出来的页面最下面,记住,我们要选的是 api 模式。创建 好了,到这个页面了,先给你的机器人起个好听的名字,然后看到右边那个随机获取的按钮吗?点它,系统就会给你生成两串非常重要的东西,一个叫 token, 一个叫 encoding aesk, 你 可以把他俩想象成一把专属的配对密钥,只有你的服务器和企业微信才有,这样就能保证他们俩之间的悄悄话不会被别人偷听了。 好,我们又回到了这个关键的选择点,你看这张图就说的非常清楚了,左边未认证的账号直接用 ip 地址,简单方便,适合咱们自己测试玩。右边已认证的企业账号,那就得用备案域名, 这是为了生产环境的稳定和安全,这一点千万别搞混了,他直接决定了你下一步能不能成功, 这就是那个 ur 摇的具体格式,记住,把你的 ip 或域名这几个字换成你自己。还有啊,特别重要的一点,后面的冒号、短捆号,一八七八九,还有那个斜杠、路径杠 v 炕,一个都不能少哦。 注意注意注意,这里是新手最容易掉进去的坑,你在企业微信这边把所有信息都填好之后,千万千万千万不要手快去点那个创建按钮。我们得先去福气那边把刚刚生成的秘药告诉他,让他有个准备 好了。现在轮到私服器这边的操作了,这就像是一次数字世界的握手,我们得把刚才在企业微信那边拿到的信物,也就是那两个密钥亲手交给我们的 openclaw 私服器。 这一步操作啊,超级简单,登录你服务器的 openclaw 管理后台,找到应用管理,然后在 channel, 也就是渠道配置里选择企业微信。 接着把刚才我们复制的那两个宝贝 token 和 in call 定 a s t 粘贴到对应的框里,点一下应用,当你看到保存成功的提示时,就说明服务器已经认识这位新朋友了。 好的,服务器那边已经准备就绪了,现在我们可以满怀信心地回到企业微信的那个页面,然后狠狠地把那个创建按钮给按下去。 连接成功了,但这只是第一步,我们总不能每次都开着服务器的控制台窗口吧,那多麻烦。所以接下来咱们要学一个专业技巧,让我们的 ai 助手能够七天二十四小时全天候在线。 好了,现在打开你的命令行端端,我们要开始敲代码了。看到这一长串命令,你先别怕,我给你解释一下它的作用,很简单, 就是告诉服务器系统,嘿,就算我这个用户下线了,也请让我的程序在后台继续跑着,你把他整个复制粘贴进去,回车你会发现他什么反应都没有,这就对了,说明他已经敲掐的生效了。 接下来是第二条命令,这条命令是把我们的 opencloud 安装成一个系统服务,这么作的好处是什么呢?就是以后万一服务器重启了,这个服务也会跟着自动启动,就不用我们每次都手动去开了,非常省心。第三步,万事俱备,只劝东风。 输入这条命令就相当于按下了启动按钮。从现在开始,你的 ai 助手就已经在后台正式上岗,开始为你工作了。 当然了,为了保险起见,我们最后再检查一下他的工作状态,输入这条命令。如果你看到了屏幕上这个绿油油的让人安心的 active running 字呀,那就说明一切完美,恭喜你,大功告成。 当然了,在配置过程中,谁都可能遇到点小科小胖,不过别担心,我已经帮大家准备好了一张安全网,把最常见的问题和解决方法都列了出来。 所以大家记住这个关键点,如果你看到服务没有正确响应,这种报错别慌,百分之九十的可能性就两个,要么就是你的 ur 格式写错了,比如端口号忘了加, 要么就是顺序高反了没有先去私服器保存密钥,就手快点了。创建,只要你跟着我们刚才的步骤,一步一步来,这些小问题都能轻松解决 好了。到现在,一个完全属于你自己的七天二十四小时在线,而且数据绝对安全的 ai 数字员工就已经正式上线了。那么问题来了,你准备交给他的第一个任务会是什么呢?快去想一想吧!

今天我们一起把你的 openclock ai 员工们拉进一个群聊,让他们互相讨论并且实现任务的交接。项目已经开源了,你可以直接拿去用,我们首先展示一下效果,然后我们说一下如何根据你的任务,你的风格和你 ai 团队的情况进行定制。好,我们开始我们首先来到我们的 openclock 控制中心,那么这个项目已经开源了, 如何安装?我们展示完马上就会讲,不要着急。那么来到之后,我们发现有新的一页叫做群聊,就是我们点击群聊页 进来之后,我们可以点击一个点新任务来进行群聊任务。我们首先看一下这个页面,啊啊,左边是我们所有的群聊县城,看到我其实测试了很多次,包括 ai 的 测试,那么点击这个左上角的新任务呢,就会触发一个新的群聊, 那么右上角呢,是我六个待命的 agent 智能体,那么每个人有不同的角色,比方小鸡负责情报,狮子呢,它是我主要的对话 agent 啊,猴子呢,它负责一些写文章的工作,然后熊猫它是程序员等等等等。这之前我也介绍过了, 那我可以看到他们都是灰色的状态,处于待命,而没有正在工作。比如这里我抛出这样一个话题,我们一起讨论一下,我想做一个视频介绍我们这个 open call 服务中心,然后一起讨论一下怎么做。这时候可以看到小鸡 gog 正在输入,那么他是第一个回答的 agent, 那 么之后呢,就会有另外一个 agent 来补充他的观点, 那么我并没有默认让所有 agent 都回答,因为这样很可以 talk, 但你拿出我之后,你的想法,你的 agent 进行改了。这里我就是默认两个 agent。 首先回答, 如果你在 openclaw 里有这样一个 ai 的 团队,那么每一个角色,每一个 agent 可能有不同的模型,他们有不同的记忆,还有可能用不同的工具,那每个人都有自己的角色,那么也适合做不同的动作。那么这里我们首先看他们两个的回答呀, 我们看一下他们两个怎么回答的。首先是小鸡,他的意思是你要证明你的价值,这个视频你不能说把所有东西堆在一个面板里,你要说的高大上一些,对吧?就他这句话, 那么 monkey 猴子的意思是他同意啊,你要是说明咱这个面界面真的在推进任务,你不要抱,把它拍成导航栏,而且拍成一个任务被推进的连续过程等等。他给出了很多细节, 那么相当于是猴子在补充小鸡的一些观点,他可以同意,可以不同意,那么他们之间互动变成互相杠精的状态。好吧,这里我是主要是一个补充的状态, 这是讨论的状态,你也可以直接安排任务,或讨论或不讨论,让这几个不同的 a 阵之间进行执行任务,并且交接任务。这里呢,我们可以点击这里的安排后续顺序 啊,还没有执行者,我们点击每一个 a 阵就是把它作为执行者。比如我先点击潘达,潘达是我的程序员,我给他的任务就是你去扫描审核代码,先总结一下我们整个控制中心的功能。 然后呢,我们可以往下继续加不同的 agent 来交接任务,比如这里,如果我们点击啊,下一个是 may, 可以 看到呢,盘打会自动地把这个任务交接给 may, 我 们可以再点击三个 monkey。 好, 那么第一个判断的任务是扫描代码,然后总结所有功能,然后它的交接条件就是所有功能的总结,对吧? 然后闷呢,我希望他根据总结的功能呢,给我想一下视频的开头,给我三百不同视频的开头,而第三个 monkey, 我 希望他拿到三个不同视频的开头之后,生成三个啊封面图这样的一种想法。 好,那我们安排好这个任务的执行数据之后啊,那么我们这里就可以点击保存顺序,然后呢,我们点击开始执行, 我们等待一会之后会发现,哎,我们的熊猫把他的一步任务就做完了,他总结了整个代码,然后总结了我们整个控制中心的所有的不同的功能, 然后他呢把这些信息给到了我们的 man, 我 们的狮子,狮子呢,就给我生成了三个不同的视频开头,然后呢,他 at monkey, 就 让 monkey 继续这个工作,根据这套的开头生成三个不同的视频的缩略图,然后给我们 url。 好的,然后 monkey 呢直接把我们的 url 给到我们了,他做了三个不同的缩略图,那么仅仅是为了展示流程,我是让他用代码生成了前端网页来给我缩略图的想法,那么最好的效果当然是接入 ai 生图软件,让他直接给你生图了。好的, 我们继续。刚才呢,我们是自由讨论,然后呢,我们给了一个任务,三个 agent 通过交接完成这个任务,对吧?现在呢,我想展示一下另一个功能,我们艾特某一 agent, 通过交接完成这个任务,对吧?现在呢,我想展示一下另一个功能,我们艾特某一个 agent 的 时候,就是指定他来回答我们的问题, 或者我艾特多个 agent 呢?就这两个哎,顺序轮流回答我的问题。那么这里我们先从一个开始,比方这里我艾特一个 man, 就 刚才这三个想法,我喜欢第一个,所以我希望它展开。 那如何根据自己的团队和你想要的风格来定制这个群聊功能呢?有两层,第一层就是我开放了一个入口,就在这个控制中心的根目录下面,有一个叫号点 m d 的 这样一个 markdown 文件, 它呢是所有群聊成员一个共享的上下文,也是整个群聊的写作协议。比方说大家是偏配合还是偏互相反驳,还是大家的发言风格是什么,互相之间如何交接任务等等。 然后这是我默认的提示词,我发现成中文了,看到还是比较中庸的,比较偏鼓励写作的,那你呢?也可以啊,用我这个提示词来给你的 open, 它把这个号点 m d 这个写作协议改成比方说偏互相反驳,互相 challenge, 这样一个风格都是可以的。 第二层就是每个 agent 啊,自己的个人层,这就是其实大家可能都知道每个 agent 自己的 workspace 里面的那些 markdown 文件,对吧?那每一个 agent, 所有 workspace 文件都可以在我们的控制中心里面进行查看和直接修改, 点击这个文档的页面,然后这里比方说我们的 man, 主要的 agent, 他的回答风格,他的人设,其他的啊, markdown 文件都可以查看和修改。 那么除了我们的群聊功能和修改人设文件 workspace 文件之外呢?控制中心还可以让你看你花费了多少 tokin, 以及每个任务花费 tokin 的 百分比,非常的细节。除 此之外,你还可以看你每一个 ai agent 员工,他正在工作吗?还他正在干什么工作,以及他上一次最近的产出。 除此之外呢,你还可以看,呃,不同 agent 之间啊,它是互相的协助,比方说这个 agent 和它的子 agent 之间的协助,还可以查看不同 agent 的 记忆和修改它们的记忆 以及总览。我们可以有一个健康分来评判你目前 open cloud 的 运转是不是健康的,有没有问题。我会和 github 上的小伙伴一起继续优化迭代群聊功能以及 open cloud 控制中心和我们大家去使用,去提一秀以及做贡献。 pr 好, 我们下期再见。

装好了 opencube 之后呢,百分之九十的人会发现没有什么神奇的,这其实是你没有正确配置这五个文件,因此呢,卡在这里了。到目前为止呢,我高频呢,使用了两个来月吧,发现大家用小龙虾的差距不再,模型也不是说你用 mac mini 或者是怎么样,而是在于 你有没有把这五个文件配置好,你配置的质量到底是怎么样的?哪五个文件呢? agent, m d so, m d user, m d heartbeat, md 以及很重要的 openglue 点接收文件。那这个视频呢,就带你逐一来拆解一下,这五个文件,也会附带多场景文件配置的模板,你呢,可以拿来就用,当然你也可以在我们社区里面 查看一百八十九日前几天刚发布的啊,这个小龙虾蓝皮书,目前呢已经有近万人在学习了。首先一个问题就是说,为什么 配置文件决定了这个小龙虾 agent 的 上限,因为 openclip 呢?它有一个设计哲学叫做一切皆文本,就是所有配置都是纯 lockdown 或者是 jason, 文件用记事本就能打开就能改,不需要其他任何专有的工具。那这意味着什么呢?就是你写配置有多准确,你的 agent 就有多聪明啊。很多人装玩这个 open clue 呢,往往呢就随便填一下这几个文件,然后就开始了,结果呢,就抱怨说这个 open clue 啊,不够聪明,没有网上说的那么好。那其实真正的问题就是你给他的这个 工作说明书太潦草,太随意了,根本没有认真去思考到底要写什么以及怎么写。这个情况呢,就相当于你招了一个九八五毕业生,但入职培训呢,你只是简单的就说一两句,好好干,那他当然不知道 该怎么办。 openclue 的 核心配置文件呢,一共有五个,分布在 openclue 下面的 workspace 这个目录,下面我们逐一来拆解这五个文件呢。第一个文件呢,是 agent 点 m d 这个文件它是什么呢?就是小龙虾的工作说明书。这个文件作用呢,相当于系统提示词 sister prompt, 它的文件化的版本。每一个 section 启动的时候呢, openclue 都会加载这个文件,它定义了 agent 的 身份 职责,回复风格以及行为边界。所以你能看到,就这个配置文件,它的质量决定了助手的实用性。详细的配置能让 ai 在 每次对话中呢,都有充分的上下文,而如果你配置很简陋,则需要你每次都重复说明很多具体的需求。 下面说一下几个这个配置的要素啊。第一个就是核心的身份 agent, 你 的名字叫什么?做什么的。第二个呢,核心职责具体负责哪些工作,你把工作细致描述一下。第三个呢,回复风格怎么样的?你的语气格式啊,回复的是简略还是非常的详细。第四个呢,叫做行为规则,你要写就是 你的这个权限,比如说你如果配置了这个渠道,你要写渠道的 id 或者是名称。第五个工具使用规则,哪些操作?需要确认的哪些操作呢?小龙虾他可以自己去操作,这给到大家一个通用模板,你直接拿去就可以用。 同时呢,也给大家举几个场景的案例啊,比如说你想让 openglue 当一个自由职业者的全能助手,你就可以这样写啊。再比如说,你想让 openglue 呢,当技术团队 leader 的 开发助手,那你可以这样写。 再或者呢,你想让他当一个学生的学习助手,那你应该这样来。配置 面呢,是几个避坑的提示。第一呢,就是不要把你的个人片号啊写在这个 edit 点 m d 里面,那么这个写在哪里呢?写在 user md 里面,下面我会介绍。第二呢,不要把临时任务 进去 agent md, 它是稳定的操作说明书,不是代办清单啊。再一个呢,角色的定义呢,你要具体,比如说你是一个有用的助手,这句话就等于没说,你要说什么。你是一个专注于 python 后端开发的技术顾问,擅长发自 a p i 和数据库,这才有用。所以能具体呢,就尽量要具体化。第二个文件啊, so 点 md, 这个是小龙虾的灵魂现法,它定义了核心的人格,以及不可违背的价值观啊。它有个特点,就是说你创建这个 md 之后呢, 不应该被后续的对话修改,就不可篡改,那这是 opencube 安全体系的基石。即使有人通过题词的注入 试图改变 angel 的 他的这个人格, so 点 m d 里面的规则呢,依然生效。那我根据国内外开源社区的这个实践,总结了有效的 so 点 m d 的 五大支柱啊,第一个,身份认同就是我是谁,服务于谁。第二个呢,沟通风格,主动的还是被动的?第三呢, 领域知识你要加上,比如说做开发的,技术站的偏好,部署的模式,代码风格。第四呢,决策框架,你可以给他指导选择的一些原则,比如说你可以告诉他,安全性永远大于便利性。 第五个,价值观和优先级,你使用 open cool 的 优化的目标是什么?准确性?实用性?还是隐私?这呢,是通用的模板,你可以直接拿去用啊。说几个场景,比如说,你想让 open cool 呢,是一个高安全需求场景的企业管理者啊,你可以这样写, 那如果你想让他成为一个温暖陪伴型的个人生活助手,你可以这样来写。 那再比如,你想让他成为一个严谨专业型的金融分析助手,那你可以这样写, 再讲几个避坑的提示,要用绝对语言,不要模糊表述,比如说绝不泄露就比尽量避免泄露呢要更有效。再有呢,就是按类别分组的规则,比如说安全、财务操作、用户 交互,方便维护。 software 点 m d 创建之后尽量啊,不要频繁的修改,因为它是现章,现章就意味着长期性,你可以每个月审视一次,但是呢,你不要每天去改它,不要把 software 点 m d 呢当任务清单啊,这会导致 agent 行为不稳定。好,接下来呢,第三个文件啊, user 点 m d 这个呢,顾名思义,就是我们使用者的结构化的信息,让 agent 能够提供针对性的个性化服务啊。每次绘画开始的时候呢,我们工作呢,也会加载这个 user d m d 的 内容到上下文窗口里面。当 ai 从第一句话开始就知道你是谁,你做什么,你喜欢什么,你讨厌什么,所 所以呢, ai 它如果有灵魂,但是不知道你是谁,它效果也是不太好的,等于白搭。相当于说 smart 点 m d 呢,定义了 ai 的 性格,那 user 点 m d 呢?定义了你的偏好,两者就缺一不可。配置要素呢,包括以下这么几点啊,第一个就是基本的信息,你包含称呼,还有你所在的这个时区语言这类 内容呢,很少变动的。再来第二个就是偏好和习惯,包括你的作息,沟通风格啊,你希望的格式偏好这些呢,仅需偶尔的调整。还有第三个就是你常用的这个联系人记录重要人物以及联系方式, 可以按需更新。第四个呢,就是你当前的工作重点,你现在正在推进什么项目,以及这些项目的关键截止日期。哎,这个放进去很有用。 ai 呢,它会在你每次跟他对话的时候联想起这些任务, 可以找出一些你可能自己都没想到的当前的对话,跟你现在做的这些任务之间的关系。所以这一点呢,是建议每周更新的。好,这个呢是通用的模板啊,你可以这样来写,具体呢,给几个案例。比如说你是个创业者,那你可以用这个,如果你是远程的自由职业者呢,你可以这样来写, 那如果你是一个研究生,那你可以这样来写。关于这一点,几个避坑点就是 user 点 md 呢,是变化很快的文件,建议每周花五分钟更新当前工作重点。还有呢,写的要具体,越具体 越好,我喜欢简洁的回复呢,就不如回复限制在三句话以内,使用项目符号,不要问是否还有其他需求等等。不要在 user 点 md 里面啊,写 agent 的 行为规则,这个呢是 agent md 和哨点 md 的 事情。第四个文件 heartbeat 点 md, 这个呢,让 agent 能够主动心跳啊,这是很有名的一个功能。 那么这个 md 文件呢,它定义了这个定时任务,那也是小龙虾非常受欢迎的一个原因,就是这个地方,它让小龙虾在没有用户触发的情况下,能够主动地执行操作。这个呢,也是我现在最常用的功能之一,我设置了好多的这个定时功能啊,每天早上这个全球播客这些内容, 我一醒来他就给我弄好了。那 opencube 的 这个文件,它是心跳啊,是一种周期性意识的机制。在主绘画当中呢,按固定间隔出发检查,让 iint 将多个轻量的地形检查合并到 同一轮里面。当然这个心跳呢,跟定时任务啊有一点点区别啊,比如说心跳呢,能共享主绘画的上下文,而定时任务呢,则是独立运行的,成本上呢,心跳一次可检查多项内容,更加的精细。那定时任务呢,则 每个任务独立消耗 token。 适用场景上,心跳适合监控检查、心跳提醒等场景。定时任务呢,则更适合精准的定时报告、固定时间推送等场景。整体原则是这样的,就是需要精准时间点的使用。这个定时任务需要智能监控的呢,使用心跳通用的模板呢,是这样。 那具体使用的场景呢?比如说,如果你需要做创业者的全天候的监控啊,你可以这样来写。如果你需要做自由职业者的客户管理呢,你可以这样来写。 如果你需要做学生的学习节奏管理呢,你可以这样来写。 那心跳任务呢,会持续地消耗 token, 那 这是很多新手会踩坑啊,这里呢,有几条铁律,第一个,日常检查呢,可以用免费的模型,比如说智普的四点七 flash, 这个模型 完全够用了。第二呢,只有需要高质量输出的任务呢,才用 cloud 系列模型,比如说周报生成,深度分析。再有呢,就是要设置活跃的时间窗口,没必要在这个凌晨三点钟,你还在心跳检查。最后一点呢,就是心跳,这个间隔 不要太短了,你不要设成五分钟啊,心跳一次,一般来说呢,一个小时三十分钟比较合理。好。最后一个重要文件,第五个, openclube index, 全局配置的 中台,那这个接收文件啊,它管理呢?模型选择 a p n 密钥预算控制,网关设置,渠道配置等等核心的参数。如果说前面四个文件定义了这个 agent 是 谁,做什么以及用户是谁,那么 open clue 点接收这个文件呢,定义了 用什么样的工具啊,消息你发到哪里就有渠道,以及花多少钱,具有哪些技能等等。这个阶层文件的核心模块包括以下这些,内容,环境变量模块,用于储存 a p i 的 密钥。 get 位网关负责网关端口配置和认证的管理。 agent 点 default 点 model, 这个非常重要,这个模块用于设置默认模型以及模型降级垫,也就是备用的模型。还有呢, agent 点 default, 用于配置每日 token 与费用上线。还有呢, models 点 provider 这个模块呢,用于定义自定义的模型提供商,因为可能有的朋友他是用的是第三方自定义模型。 下面呢是一些不同场景的这个配置的推荐,你们也可以拿去看一下。 好,以上呢就是这五个文件详细的文件解读,如果你是新手呢,第一次配置 openclue 呢,可以按照这个顺序来。第一个就是 配置 openclue, 点 just, 先确保模型能够跑起来,你要点 a p i 配点这个设置预算。第二步呢,是 so, 点 md, 定义 agent 的 人格和底线,这个文件以后尽量不要改。第三步, agent 点 md, 写清楚 agent 的 职责 和回复风格。第四步呢, user md, 告诉 agent 你 是谁,你现在在推进什么任务。第五步就是心跳,点 md, 配置定时任务,比如说先从每日早报开始。第六步就是测试你发几条消息,看看 agent 的 表现是不是符合你的预期。第七步呢,迭代,根据实际使用体验持续优化配置。 大家要有一个概念,配置呢,不是一次性的事情,最好的 openglue 的 配置呢,是在使用中不断的打磨出来的,每周花五分钟更新 user 点 md 的 里面的工作重点,每个月 审视一次 side md 和 agent md, 你 的小龙虾就会越来越懂你,你也会越来越喜欢用它,并真正解锁其强大的能力。希望呢,这些解读和案例呢,对你有启发,让你真正开始用好小龙虾。也欢迎在社区查看我们的一百八十九页的养虾蓝皮书,我们下一期呢,继续。

你是不是也在好奇这样的游戏 ui 画面到底是如何生成的?先别着急,一分钟教会你如何玩转这样的视频。 首先是我们来确定角色和背景,角色是赛博朋克风格,背景是纯白,减少游戏 ui 可能出现的乱码情况。 那么角色完成以后,我们继续丰富游戏的场景以及游戏 ui, 分 别是开始界面,角色自定义界面、加载界面和游戏内界面。 ok, 然后拿着游戏 ui 的 参考图来 cds, 选择 agent 模式,时间十五秒,然后选择生成视频提示词,参考如下,那么这样我们就完成了一条纯白极简风格的游戏 ui 风格视频。 ok, 那 么下期我会带来更多 ai 视频的教程和教学,欢迎关注我。

这三个网站我花了十几分钟就做出来了。第一个是一个汽车改装厂的网站,整辆车后随着滚动啊不断被拆成一个 3 d 分 解图,非常有设计感。 第二个是一个旅行网站,当用户进入页面,视角从地球一直跟到了飞机的座舱和下面旅游景点介绍无缝连接。第三个是一个高级腕表网站,随着用户向下拖拽页面啊,时针也在跟着转 放在以前啊,做这样带高级视觉、动态资产和滚动蓄势的网站至少也要上千美元,但是现在十分钟就能搞定,每个人都能轻松做出来,只需要一 openclaw, 二,一个编程能力强的大模型, 三,文本生成视频。除此之外,还有两个宝藏 skills, 一个让 openclaw 变成超强的软件开发工具。第二个,让 openclaw 变成顶尖的设计师。整个流程非常简单,我们现在开始 整个流程啊,只有三步,第一步,让 openclaw 使用 superpowers 把整个网站的股价打出来,然后呢,用 test skill 来确保网站有高的设计水平。 第二步,文声视频,从而获得网页的动态效果。第三步,把动态资产放到网页里面去,但是想把这件事真正做对,刚才你也听过了,我们需要有两个 skills, 第一个叫做 superpowers, 在 github 上已经十五万收藏了,而且还在持续的更新,它不是一个单独的功能啊,是一套给智能体用的软件开发工作流。 让 opencl 这样的智能体在做复杂任务的时候,不要一上来就乱改代码,而是先做需求的澄清,且设计拆计划,调子 a 阵运行,做测试 bug, 最后再验证收尾这一套流程, 那你需要 a 阵稳定推进这个项目一步一步向下进行的时候, superpower 这个 skill 就 非常的重要。第二个 skill 是 taste skill, 这个 skill 呢,主要是防止 ai 写成那种很通用的紫红色非常模板味道的前端, 它不是给你一个模板,而是给 agent 一 整套的设计规则,怎么排版啊,怎么留白啊,怎么控制配色,怎么做高级的动态特效,怎么避免那些最常见的 ai 的 审美? 所以 openclaw 负责把网站做出来, superpowers 负责按照复杂流程的方式保证项目持续稳定的推进。而 takes skill 把一个能看的网站拉到高级设计感。我们先让 openclaw 把网站的股价和市局的方向先搭出来,如果第一版的网站本身就很普通,那你后面无论怎么加动效,无论怎么加视频,它也不会有好的效果。这里为了保证设计水平,我们就要用 test skill 这个技能了。 我们的提示词是,一定要用 test skill 帮我设计一个高端室内设计网站的首页,然后下面是我具体的要求,我要求他你看大片的留白啊,要保持克制啊,要全屏,然后要留给我们视频配景 与空间等等等等。这里我们等一会网站就做完了。由于 open call 呢不在我这台电脑上,所以呢,我让他帮我部署,以便我们一会一起看效果。 ok, 做完了 我们一起看一下,可以看到啊,一个提示词直接就一步到位了,魔神本身的能力足够强,加上我们用这个技能 test skill 来提升他的设计水平和品位,出来的效果,设计水平非常的在线 网站股价。对了,下一步我们做视频,这里我会直接让 openclaw 去调用 mini max talkin plan 的 多模态能力,生成一段三 d 室内设计视频。后面呢,我们直接把它放在首页最开始的地方,用的提示词是这样的, 请使用 mini max multi model 二 kit, 通过它的 talkin plan 调用海螺二点三,生成一段高质量的三 d 渲染风格视频要求就是啊,镜头围绕一个三 d 室内设计场景缓慢地旋转,不要有任何文字 发送。去之后啊,他会问我们我们的 mini max 账号的地区,跟刚才我说的一样,我们这里如实回答就行。耐心等待一会之后,这是出来的视频的效果。黑暗岛生成的效果非常的不错,完全符合我们的要求,干净大气又有设计感,而且他一直绕着这个家具进行旋转来展示效果。 好了,有了背景视频之后,我们再告诉 openclaw, 让他把这个视频放到我们首页最上面的位置,这是我给他提示词。把这个生成的 m p 四视频文件做成网页 hero header 的 背景视频,然后把它重新居中,让整个构图就更干净, 外加一个内收的渐变遮蔽,让整个动态背景啊不会干扰原本的背景和文字。这一步做完之后,整个网站一下就成立了,大家看看这个效果怎么样?这个视频啊,已经变成了网页的一部分,直接播放了,是不是感觉非常的高端。 最后一步,迷你 max 也把标题啊,按钮啊,留白,构图全都重新平衡过了,现在看上去就像一个真正的高端的品牌,首页 动感和设计感都是统一的。最后我们总结一下整个流程,第一步,先用 openclaw 加 taste scale 把有设计感的网站骨架搭出来。第二步,再用 ai 视频生成做出首页的视频, 这也是整个网站最贵的视觉动态资产。第三步,把这个生成的视频再教会 open call, 让它自动把视频啊整合进黑肉,也就是我们网站最上面的区域,然后处理构图遮蔽和整体视觉的关系。这三步我们充分利用了 ai 能力的三个维度,分别是写代码、 多模态能力以及 a 帧的能动性。好的这期视频就到这里,推荐大家去用这套工作流做出效果炸裂的网站,我们下期再见。

openclaw 三分钟保姆级部署教学全新教程安装加 skill 以及多 agent 啊!本期视频适用于 windows、 mac、 linux 系统,傻瓜式一键安装。那 openclaw 很 强,但新手第一次上手最怕是环境配置, 所以这期我直接使用最适合小白的方式带你装好。那么 openclaw 对 于普通人最大的优势就是处理机械化、繁琐工作, 整理数据与表格对于很多人来说的安全性问题。其实只要是你在本地环境部署,处理自己的工作任务,然后多做备份以及对话时输入准确命令,大多数人用小龙虾都是非常可靠的。 那废话不多说,我们开始流程只需要一个名叫可乐叉的软件下载下来即可进行首次安装。那么可乐叉是什么?是基于官方 oppo 可乐核心做的可式化图形界面, 让新手零门槛直接使用,没有终端命令,不需要依赖文件,没有环境变量的搜索,且支持多模型多 agent 与自动化定时任务项目完全开源,所以更不需要担心风险问题。 直接管理员运行安装包,按照流程无脑点击下一步,等待安装完毕。然后点击运行 ctrl 直接显示出使唤引导,这里就非常简单了,只要认识字,那就没有壁垒。首次检测网关服务时间稍微长一点,耐心等待下一步按钮亮起即可。因为我原先配置过大模型的 a p i, 所以 自动跳过了这一步骤。 如果有不知道从哪里获取大模型 a p i 的 小伙伴评论区留言私信我,我会给大家发教程文档。当然这东西本身就很简单,各大厂商的官网申请即可,或者找一些中转站啊,简直不要太简单! 如果觉得这个可示画面板不够原汁原味,那么就点击左下角的 open club 页面按钮,就可以看到小龙虾的原版页面。 是不是非常简单?三分钟属于你的版本页面是不是非常简单?三分钟属于你的小龙虾即可! 还有,如果大家有需求,我会再出一期可乐叉的使用教程,那本期视频就到此结束,喜欢的观众异父们,动动发财的小手,给个一箭三连吧!

最近啊,好多朋友安装完 open 可乐以后都跟我说装还不知道怎么用,不会用,不知道从哪儿开始,完全无从下手。所以今天我就给大家一次性讲清楚必须装的十个核心 skill! 只有装上这些技能,它才能真正帮到你!从一个普通的聊天机器人直接变成你的专属 ai 助理的十个核心,可 skill 装完直接解锁 ai 生产率。 接下来就是十大技能的介绍。 classic 安全第一道防线,装技能前自动扫描风险,告别恶意程序,新手必装防雷 charlie search 给 ai 装实时信息,大脑 突破知识截止期最新资讯,一键搜结构化结果,超省心! self improving agent 让 ai 越用越聪明,自动记错误,学经验,下次干活不踩坑,持续进化!超强 office automation 办公全能助手,日程、邮件、 excel 报告全搞定,打工人效率直接拉满! code interpreter 编程神器,在线跑,写代码跑脚本,做数据分析,一键出结果,效率直接翻倍! file manager, 本地文件随心管,提取、编辑、整理全搞定,不用来回切换软件,超方便! schedule 定时任务自动执行,提醒计划自动化一条龙, ai 帮你把时间管明白! browse 网页自动浏览抓取查资料、结页面爬内容,不用手动操作,超省心! system monitor 电脑状态实时看, cpu 内存性能一目了然,运行稳不稳一眼便知。 custom tools 专属功能,自由扩展,想加什么自己定义! openclaw 玩法无上限,这十个技能全部装完,你的 openclaw 直接封神,收藏起来,安装不迷路!

今天的目标是手把手教大家在没有魔法、没有 cloud 账号的情况下,如何安装 cloud code, 不 需要任何代码基础。纯小白友好,我从 cloud code 的 内侧就开始用,到现在已经一年多了,每天工作都在用。但我并不是程序员,也没有任何技术背景,所以我想从我的视角做一个系列视频, 结合我实际的工作场景,从安装开始,一步一步带大家上手。先快速回答几个大家在安装前可能有的问题,第一, cloud code 和前段时间很火的小龙虾是一个东西吗?都是顶尖的 ai agent, 但路线不同, 小龙虾走的是广度路线,他活在聊天软件里,覆盖几十个平台,帮你处理跨平台的消息、日常邮件、 qq 了,走的是深度路线,他的规划模式、上下文管理这些设计,都是为了把一件复杂的事从头做到尾。我们在工作中要做的调研分析、小工具、工作流,本质上都是造一个完整的东西, 这是 ko 擅长的。第二,有那么厉害吗?能用来干啥?我是零技术背景的产品经理。举个例子,一份行业调研报告,以前我要花一周,现在跟他说一句话,十分钟出来做一个内部投票工具,以前要找开发排期,现在我自己半小时就做好了。我甚至还自己搭了一套广告物料投放生产的工作流,一天可以做十几组物料图。 第三,没魔法,没 ko 账号,还有必要装吗?市面上大多数 ai 编程产品,本质是 ai 辅助你写代码,前提你得懂代码, code 是 你说目标 ai, 自己从头做到尾,全程不用空代码。对零技术背景的人,这才是真正的用的形态,而且国产扣顶模型这一年做的特别快,接近 qq 里使用,可以满足大部分场景。我用 mac 来演示 windows 的 安装命令,我截图放在视频最后了,大部分步骤是一样的。第一步,装 homebrew, homebrew 是 mac 上的一个软件管理器,可以通过它来安装 qq 的。 打开终端,复制这行命令,粘贴发送。这个时候要输入密码,看到这个提示的时候回车就行。装好之后,这里会提示我们加一个路径,照着他给的命令我们复制粘贴跑一下, 我们可以输入这个命令验证一下。好,这个时候我们可以看到 homebrew 的 版本号了,说明已经安装成功。接下来就是安装 curl code, 同样是复制这一行命令,粘贴到终端里发送。 当我们看到这个 successfully installed, 说明 curl code 已经安装成功了,我们可以复制这一行命令验证一下。 看到最新的版本号是二点一点一四三,说明安装成功。同时我们可以输入 cloud, 当我们看到这个橙色的小螃蟹的时候,就说明已经安装成功,但这个时候还没有接入模型,它只是一个壳,我们可以先退出,连按两下 ctrl 加 c 退出。第三步是安装 cc switch, 我 们把这一行命令复制下来,然后在终端内发送 c c switch 是 一个模型管理工具,装好之后可以一键切换不同的国产模型,不用手动去改配置文件提示 c c switch 已经成功安装了。第四步,拿 api key。 我 今天用的是小米 miimo, 选小米纯粹是我自己用,觉得效果不错,性价比也高。浏览器搜索小米 api, 小米的话,因为我是订阅了它的一个月度套餐,所以 api key 和 base url 都跟 api 这边呢是不一样的。进到 cc switch, 点击右上角的加号,然后选择自定义配置。这里我们需要手动填写相关信息,把小米的 key 填进来,然后把兼容 andropic 接口协议的这一个 base url 复制粘贴过来。 点击获取模型列表,在列表当中选择 mimo v 二点五 pro 默认兜底模型。选择 mimo v 二点五 pro 添加仅用刚刚添加的这个。回到 terminal, 输入 cloud, 可以 选择一个自己喜欢的配色。看到安全提示继续按回车就好。选择使用推荐的设置,确认信任这个文件夹目录。 这里已经出现了 mimo v 二点五 pro 的 模型名,我们尝试对话试试。看到这里,恭喜你在没有魔法且没有 qq 账号的情况下成功安装了 qq, 可以 开始开 coding 了。可以尝试让它做一个小网站试试看。 除了小米, mimo c c switch 里还可以接其他的国产模型, g l m, deepsea, kimi, mini max 都行。配置方式是一样的,在 c c switch 里加一个供应商就行。 qq 很 快就把这个 excel 文件写好了,打开这个看一下效果。 到这里,我们已经成功地用 color code 写了第一个 web coding 的 小应用。 windows 的 同学安装逻辑完全一样,只是命令不同。 第一步用 winget 装 git, 第二步用 winget 装 color code, 第三步到第五步跟 mac 完全一样。装好只是第一步。下一期我会讲安装后的必要设置,不同的模式以及 skill 体系。大家有什么想要了解的,也欢迎评论区留言。这是 color code 从零到实战系列的第一期,如果你觉得这个视频有用的话,可以给我一个一线三连催更,我们下期见。

哈喽,大家好,这里是 vivo 零基础学 ai 之 open cow 和 cow。 co 究竟是啥?那最近很多人都在聊这两个 ai 工具,一个叫 open cow, 然后也有人叫它小龙虾,另外一个叫 cow co。 如果你是非技术背景或者刚开始学 ai, 我 建议 你一上来先别急着问那哪个工具更厉害,而是应该去了解他们到底是干什么的。我现在用不用得上?那先说 open cow, 你 可以把它理解成一个更自主的 ai a 准。那什么是 ai a 准呢? ai a 准就是一个。嗯,不止 只是会回答问题,还能根据你的目标自己猜步骤。用工具完成任务的一个 ai 小 助手,它不仅可以帮你聊,陪你聊天,还可以连接一些工具帮你执行任务,甚至去做一些自动化的流程。那打个比方, open call 有 点像一个调度主管,你给他一个目标,他可以去安排不同的工具干活。 问题就在于,这种自动化的工具对普通新手来说门槛并不低,它往往涉及本地环境、权限配置、长期运行等等,那甚至可能你需要准备一台比较合适的电脑来折腾。而且一旦 ai 工具可以访问你电脑里的文件,执行命令,甚至接触到你的账号和工作流,那安全性和稳定性就是一个 未知数了。那 opencall 小 龙虾的话,它很有想象力,但限阶段我不太建议新手一上来就溜它。那接下来就是 cloudcall。 cloudcall 是 nsop 推出的 ai 编程工具,相比 opencall 的 话,这种更偏自动化调度的 agent, cloudcall 对 普通人来说会相对更好控制一些。那原因很简单,它默认啊, opencall call pro 的 话,它默认不是说你想干什么就干什么,而是有一套权限的机制,比如读取、改文件,运行命令,这些操作通常需要你去确认,它能写录的范围也主要限制在你打开的项目文件里。它的重点并不是说去帮你完成 整个电脑的工作,全自动化去运行,而是帮你去完成一个个具体的任务。比如说我现在更多的会用它去做两类事情, 第一类的话就是写前端的页面,比如写我想做一个网页的 demo, 一个小工具页面,一个内容管理页面,甚至说现在这个 ppt 也是 cloud 帮我写出来的,我会接跟他描述需求,他帮我生成代码,修改样式,调整交互。 那第二个的话就是处理我的本地文件,那比如整理吗?当还有改代码、改文件、分析项目结构等等,它可以直接围绕我电脑里的文件夹去工作。 那对普通人来说的话,拷扣的好处是反馈更直接,你说一个需求,他改一个文件,你打开页面他就能看到效果,那对比一上来理解复杂的 a 准系统来说,是要容易很多的。而且从海外的产品生态来看的话,拷扣的使用者更多,讨论也更成熟。 如果你未来想接触前沿的 ai 工具,前沿的 ai 方法论,那使用 cloud 可以 一定程度培养你的一个 ai sense, 上线也会更高一些。 那总的来说的话,如果你只是刚开始学习 ai, 想用 ai 去做网页处理文件,提升工作效率,那可以优先尝试使用 curl code。 对 于 open call 的 话,你可以先知道它是什么,理解它代表的是自动化,更自动化更自主的 a 准方向,但暂时可以不用急着去上手。那普通人学 ai 工具的话,最重要的不是去追最火的名字,而是搞懂不同工具的分工。有的工具它是适合调度做复杂任务,有的工具适合帮你把眼前的事情做出来。 先理解场景,再选择工具。这是我们普通人啊,非技术背景更稳的一个学习路线。那这期的 ai share 就 到这里了, that's it。 拜拜。下期再见。

openclaw 系统构架底层原理好?大家好啊,这节课是咱们这个 openclaw 的 这个公开课,之前听过我课的同学在这个 vvip 课上听过我课的同学啊,知道我是主要做科研的啊,简单自我介绍一下吧,我是硕博毕业于海外某高校的人工智能专业,师从海外工程院硕士。 呃,国内的大长江团队啊,现在是博士两年毕业,现在是该领域上最年轻的全职助理教授啊。据我了解,反正是这样的啊,大概就是些这样的发文情况, 现在呢,也是主要做大模型 opencloud 它现在特别火嘛,那咱们也是趁着这股东风,那我们一起来看一下这个 opencloud 到底是个什么玩意儿? 好,咱们这堂课呢,主要会分三节来讲。第一个,我们会详细的去讲一下这个 ai agent 是 什么啊?我们都知道 openclaw 它很火, 但是 openclaw 它其实也只是 ai agent 的 一种而已啊,那它在这个普通的 agent agent 上,它有什么样的改进啊?或者说它到底是做了什么样的操作, 可以让他这么出圈,可以让他摆脱大大众对这个 ai agent 的 这个认知啊,可以进入到我们普通人的视野里面啊。第二部分呢,我们会讲一下这个 open code 的 底层架构啊,咱们既然来了这个课嘛,那就是知其然,我们更希望知其所以然啊, 现在网上有很多的教程啊,路客啊,大家应该都刷到过啊,大概就只会讲一下这个 openclaw 怎么用啊,大概是个什么玩意儿啊,但是它底层工作是怎么进行的,它怎么运行的?它用了哪些框架,用了什么样的技术 啊?这个可能一般涉猎的会比较少一点啊,这样,了解了底层之后,对咱们这种不管是做开发的同学,或者说做科研想用到这个 open code 的 同学,我相信都是会有点帮助的。最后呢,可能也是大家比较关心一点,我们做一下本地部署啊,链接一下推书。 好,因为咱们这个是个直播课啊,大家如果有问题可以发在这个弹幕上,我这边看到的话,会跟大家解答的。好,话不多说,咱们发车吧。好,我们先讲一下什么叫 a i a 阵的啊, 大家也知道,大概呢,在年前开始啊,就选选起了一个全民养虾热潮啊,左边是腾讯大楼, 腾讯大楼下面免费装虾啊,大家都看过新闻哈,说一代人有一代人的鸡蛋要领啊,那我们这一代人的鸡蛋是什么?去领一个小龙虾过来啊。那右边呢,是抛开我们这个现象不谈啊, openclaw 在 这个 github 上,它的新数啊,从二月一月底二月初开始就一路飙升啊,可能大多数原因呢,是得益于咱们国内的宣发能力啊,还有一些比较出圈的操作啊。那在这个这么火的一个现象后面, 我们不禁要思考一个问题啊,大家为什么非要来养虾啊?你拿到这个虾的时候,你知道他是干嘛的吗?或者说你能知道他能对你创造一个什么样的价值吗?你就去领啊,你鸡蛋囤多了还会放坏呢, 对不对啊,我,我个人觉得呢,现在大多数人啊,养龙虾主要还是以猎奇心为主啊,更多的呢,我觉得可能是我们家的哎, f o m o 在 作祟啊,就是 fear of missing out, 你 是怕错过这个技术啊,可能觉得哎呀,这是是不是一个像 g p t 一 样出来的技术,我如果不提早入局的话,我就要被淘汰啊,大多数人可能都是情心理对不对啊, 那也因为这个给他蒙上了一个非常神秘的一个面纱,那他到底是不是这么厉害,是不是这么神秘啊?我们其实只要理清这里面的结构原理就会发现啊,他其实还是一个很好懂的一个东西啊,对于我们个人来说, 要不要去部署这个 open klo, 或者说我们学这个 open klo, 我 们需要学到一个什么地步啊?我觉得要从它部署难度还有成本啊,还有一个呢,就是它安全性这三个方向来考虑一下啊。好,这个是前话。 好,那我们正式进入今天的课啊,讲一下这个 ai a n 的 以及到这个 open klo 的 这个发展历程啊,实际上已经落地的阴影,感觉没有那么强大,哈哈,这个我们到后面说啊,好, 我们说这个 agent 啊,其实在 agent 之前啊,它的前身其实还是大模型,就是我们最早熟知的这个 gpt 啊,以切的 gpt 为首的是一个传统的大语言模型啊, 说早不早啊,那个时候呢,大家其实对这个大模型最主要的概念呢,就还停留在问答上,就跟大家现在用用豆包一样啊,打开一个手机问个问题,他告诉你一个答案啊,那个时候还是以这个叫什么,以问答为主的大大语言模型时代啊, 但是呢,发展到 g p d 四的时候啊,三到四它其实是一个很大的跨越啊,那个时候呢,就已经出现了早期的这个大模型 agent 的 框架雏形了啊,大家那个时候可以发现,这个大模型好像不光只是简单的问答那么简单了 啊,他会用上一些。我们听过我之前的课的同学都知道,有个叫 react 的 框架啊,他会推理了啊,并且会做一些相应的操作啊,这个是早期的大模型 agent 的 啊,但是呢,那个时候他叫什么?他还是主要停留在类似于在大模型上做一个拓展能 力部部署的地方呢?还是服务器?还是云端?还是大模型厂商,我们的可操控性还是非常低的啊。后来呢, 再往后发展,大概有个半年到一年左右啊,这个时候呢,就有类似的推理模型框架出现了,我们在之前的 vip 课上也讲过啊,这个 v i m 啊,它的作用是什么呢?简单一句话就是可以搞了个框架出来呢, 帮你非常简单的可以把这个大模型给部署到本地啊,并且呢,他不光是一个问答,他还有操作的属性在里面啊。 那当然呢,你既然部署到本地了,那你就只能用一些开源的模型了,比如我们的拉玛,还有谦问以这个为首的代表模型啊,这个是本地大模型 agent 的 时代啊。那从这个之后呢,其实也没有过多久,大家就看到了现在的突然有一夜爆火的这个要 opencloud 的 东西啊, 这个东西他到底是个啥啊?大家可能了解的知道啊,他是一个欧美一个退休的程序员啊,他闲着没事一个小时搓出来的一个东西,目的就是为了让他在外面的时候也可以用手机操控他的电脑,电脑黑奴来帮他干活 啊,就是一个这么简单的东西啊,但是他突然就火起来了啊,他为什么火起来啊?他相比于之前的本地大模型啊,他做的无非第一就增强了这个 g u i 的 控制能力啊。之前这个本地的大模型,大家可能需要用到一下命令行或什么样的东西,会需要稍微有一点点的基础 才可以去完成这个东西啊。那个时候大家觉得搞大模型,用大模型这些可能还是稍微专业一点的基础才可以去完成这个东西啊。那个时候大家觉得搞大模型用大模型这些可能还是稍微专业一点的就可以了啊。 open cologne 呢,在我看来它是走了最后一公里的路的啊,就把它给带到了大众的视野里面,用一个相对于比较傻瓜式的操作就可以去干到某些之前我们想不到的事情啊。再来一点呢,它有一个非常关键的改进呢,就是它 大胆的开放了权限啊。刚刚有个弹幕同学问这个 open klo 为什么没有被认定为病毒啊,很简单啊,还没到时候啊,哈哈,他如果一直这样发展下去的话,肯定是会有相应的限制措施出来的 啊。现在大家从新闻上已已已经能看到啊,可以有很多的学校已经开始明令禁止在这个学校的电脑里面按 open klo 了, 并且呢,有些国家啊,比如说我现在在日本,他们对这种对这种数据安全是非常的在在乎的啊,所以在这个实验室的电脑上去部署这种 opencloud 也是不太现实的啊。 好啊,我这里放了两两张图啊,大家一看这个画风就知道 ai 生成的啊,但是我发现啊,它生成的非常好啊, 这个我们先看看一下左边那个图,从左边那个图我们可以看成三部分,第一部分就是 ai 是 怎么工作的,这里我们啊先不细讲, 左下角呢,是这个 ai agent 的 现在有哪些类型啊?这个我们也先放在这不讲啊,右下角这个 ai 系统在部署的时候啊, 我们知道大家可能看新闻也看到了有人说什么一人团队一个人养了一群龙虾啊,养了一个池塘的龙虾,什么意思呢?就是一个 multi agent, 就是 一个做代理的一个过程而已啊,它其实就是一个二个这种 ai agent 的 实力 啊,这就是所谓的多个 agent。 好, 那我们再回到上面再看啊,上面这个 ai 是 怎么 walk 的? 我们现在先不讲它的流程是什么样的啊,我们先主要理解一下这个 ai agent 它有哪些东西啊? 首先右边啊,它啊有一个工具,比如说什么我如何去访问互联网,对不对?我怎么样可以写代码呀?我怎么样去调用这个 api 的 接口啊,对不对啊? 还有一个很关键的 memory, 这个是大模型就有的啊,那 agent 里面的 memory 跟大语言模型里面的 memory 有 什么不一样? a i agent memory 跟我们 openclaw 的 memory 又有什么不一样?大家先留一个小小的疑问啊,它其实是这个是 openclaw 比较创新的一点改进啊,在它的 memory 上面。好,这里我们先不讲,我们下一页会讲到,我们先再看一下右边这个,右边这个 中间这些组件啊,大家可以先不管啊,可以先看这两个标识啊,第一个我们一个 wifi 画了一个叉,还有一个就是锁了啊,什么意思呢? 没有 skills 吗?有 skills, 这里 ai 没画出来。我们后面会讲啊,这里意思呢,第一就是在本地,你可以部署到本地啊, 部署到本地之后呢,你的数据就非常安全了啊,那这两个属性叠加在一起会产生一个什么效应呢?首先在本地之后啊,你就可以自我玩的很花嘛,我们常说的 可以随心所欲的去改它呀,去操控它呀,你的数据全部都在你的本地。我们之前讲那个 v l l m 框架的时候,我们就提到了,这个框架对于公司或者企业来说 是非常友好的啊,因为很多公司和企业,它的数据不可能说我放到我调用的这个 api 的 云端上,不可能放到 openai 那 里,我不可能放到 google 那 里啊,这是我公司的私有数据,所以在很多业务场景下呢, opencloud 它是 叫什么?是一个非常好的选择的啊。好,那我们具体来看一下这个 ai agent 是 个啥玩意儿?我们说到 ai agent 啊, 其实可以拆成两块来看,第一叫 agent, 第二才是 ai。 有 同学如果了解过,强化学习啊, 应该知道啊,这个 agent 呢,是里面的一个概念,一个最基最基础的概念。它的定义呢,就是说一个实力啊,可以通过观察环境啊,做出行动 啊,为什么做出行动呢?为了达到某一个目的啊,这样的一个实力呢,就把它定义为 agent, 在 强化学习里面,那 ai agent 无非就是说可以用 ai 来提升自己的性能,这就是 ai agent 啊, 这就是它最基础的定义,没有什么太难的地方啊,我们看框框架这里啊,先看左左边,我这里写了三个模块啊,第一个是输入模块啊,输入模块的作用呢,就是从外部环境中来获取信息啊,它可以是多模态的, 在传输系统当中呢,这个输入的可能只是文本数据而已啊,但是呢,在我们今天这个 ai agent 呢,包括 open code 现在用的这个环境里啊,它其实已经是多模态的啊, 也就是说不光包括文本,还可能包括图片啊,语音啊,还有视频啊,或者说是来自于各种 api 的 结构化的数据,都是有可能的啊。 那我们如果想把它应用到科研领域,或者说应用到一些比较专业化的垂直领域的时候,可能就会需要这种 api 的 结构化数据了 啊。我讲的尽量稍微概念浅一点啊,因为咱们直播间里会有很多对这个 ai 基础会稍微薄弱一点的同学啊,希望大家都是可以听懂的。 蛋白质结构能不能详细介绍一下?那行,我们最后会有十分钟的答疑,如果你感兴趣的话,我跟你讲一下。好啊,我们继续回到这里啊,我们说第二个模块呢,叫思维模块啊,这也是 ag 的 系统中最核心的部分 啊,也就是这个大模型发挥作用的地方啊,这个模块呢,通常是由这个大模型来驱动的啊,他负责对我们前面说的这个输入模块获取到的多模态的输入进行理解推理啊,以及决策 啊。具体来说呢,大模型可以根据当前任务啊,先对问题做一下分析啊,对任务做一下分解,去规划一个策略来解决这个问题啊。 所以我们说这个大模型在 agent 系统中呢,其实就扮演的是一个大脑的一个角色啊,用来负责思考和决策啊。那我们现在获取了输入,有了小龙虾的钳子了 啊,有了思维模块,小龙虾有了大脑之后啊,我们需要进行交互啊,这就是我们的交互模块,当 agent 完成思考之后呢,我们就需要采取行动。 什么东西?左下角有个小窗口遮挡,是否关掉?我这里看不到哎,这个很影响吗?同学们,我这里啥也没有啊,哈哈,问问题不大啊,那我先讲了,因为咱们咱们时间比较紧啊,我准备的内容可能一个半小时讲不完啊,有个思维导图啊, 好, ok, 这个让我们助教老师去解决一下吧,我这里控制不了。好,我们接着讲。刚刚这个思维模块讲哪来着啊?对,我们这个小龙虾就需要采取行动了 啊,这些行动呢,其实没什么高大上的,他就是通过一些现有的工具啊,你看我们这里画的图里面啊,工具啊,其实你比如说 我们这个小龙虾遇到一个需要计算的任务了,他干嘛呢?他又去调用一个 calculator 啊,他可以根据他的角色,他自己去写一个小小的这样的方法去计算一下。可以啊,他如果觉得累的话,他也可以去调用一下。你这个计算机里面自带计算机的程序啊,小程序他来去计算一下都可以 啊,具体怎么做就看它自己来判断了啊。再有像 search 啊,其实呢,我们一般把它叫 websearch 啊,但是呢,因为 search 比较高大上嘛,所以现在都是把它叫 search 的。 大家看到这个其实就是一个搜索网页的过程,但是相比于搜索网页来说的话,它还有一个 就是综合和整理的过程啊,如果单纯只是搜索网页的话,他其实就像爬虫嘛,你爬虫下来的数据啊,那全部喂给这个小小的龙虾里面,当然也不合适,所以呢,需要有一个稍微一个整理的一个工作在里面的, 用什么代码写的可以有这么高的权限?是这样的,他有这么高的权限不是因为什么什么代码,而是因为他的端口啊,他在端口开放的这个过程当中啊,是给予了他一个非常高的权限的,再来就是很多端口他本身就是具有很高的权限啊, 超级用户对当前里面讲的 agent 的 比较像,对,当前这个其实叫什么,也是大模型的一个框架嘛,其实 agent 所有的东西,不管是什么,最终就是一个 基于大模型作出的拓展而已。大家记住这一点啊,现在你们看到的所有东西啊,它的底子啊,都是切了 gpt 一 手的这种大模型,只不过呢,我们因为受到这个 scanning log 啊,尺度规模 法则的这个限制,大家在堆叠基础能力上,大模型本身的基础能力上,目前是现金陷入了一定的瓶颈啊,所以呢,之后从 g b t 四开始,现在所有的大模型厂商开始把这个大模型从这种堆参数砸钱,把它往大了去搞, 从这个思路慢慢去转向了一些工程化的一些改进和落地,就比如 ag 的 就是其中的产物之一啊。 好啊,我们再看一下右边这个模块图啊,我们刚刚讲了有输入模块、思维模块和交互模块分别对应的。哪输入模块没有啊?我们这里 工具 pos 刚刚讲的有这么多我们这个智能题啊,他可以直接去执行操作,也可以调用这个工具来执行操作,这个取决于你给他的任务难不难啊,如果你只是简单的问答,他本身的大脑就可以告诉你了啊,他就不用去拿计算器了 啊。右边是他一个决策的过程啊,如果你的给他的任务非常难啊,他首先会触发他的这个决策过程,去判断一下他需要通过什么样的操作才可以去完成你指定给他的任务啊。这里面会有一个思维链, 这个也是一个说老不老,说新不新的概念啊,在大模型里当然老,但是按年份来算的话,还是一个比较新的概念啊。我们这个 vip 课里面也是之前详详细的讲过两节关于这个 c o t 的 内容啊,它也是当前这个 a j 的 能出现的最主要原因之一 啊,让那个大模型可以像人类一样进行思考啊。当然呢,它现在变成小,变成小龙虾了。好,那我们看完这三个模块会发现我们还有一个什么模块没有讲呢? 这个 memory 啊,刚刚我也说了,这个 agent 里面的 memory 跟这个大模型里面的 memory 有 什么不一样的啊?我们知道大模型里的这个 memory, 我 们通常指这个上下文窗口,对不对啊?上下文窗口? 那在 agent 里,它分成一个 short term and long term 的 memory, 有 有一个长期和一个短期的 memory 的 区别啊,那它到底是个什么东西?好,我们仔细看一下这个记忆模块儿啊,前面可能稍微会枯燥一点,因为给大家讲的是从发展历史开始啊,去讲这个 open code 出现的这个原理 啊。但是希望大家还是可以好好理解一下这一块的内容啊,因为现在网上 openclaw 的 视频这么多,你看了他们也会看,大家都会看,你的同事也会看,那你跟他们相比,你的特性在哪里啊?对吧?你的特性就在于你可以跟他讲出这些底层的架构上的不同啊,对不对? 他的决策和能力是通过调用的大模型能力决定的吗?对,根本来讲就是大模型进行思考的啊,包括你要不要用工具,怎么用工具这个东西也是大模型里面的思维链来进行决定的,是不是和 lstm 相似啊?不是,完全不是一个东西啊,我们仔细看一下。 好,我们说一下这个最关键的记忆模块啊,我们在理解这个 agent 的 时候,很多人会觉得你的大模型怎么这么厉害,好像那啥都记得啊,我昨天跟你说的话,你怎么今天还记得呀?我明明都关机了,对不对啊?但实际上呢,并不是这样的, 大模型本身呢,他并不具备真正意义上的持续记忆的能力啊,大模型是没这个玩意的,他的本质还是代码啊,那他如何去获得这种能力的呢啊?他的工作主要是依赖于这个, 大家都知道叫这个上下文窗口啊,因此呢,我们可以把这个大模型的上下文窗口理解为一块儿面积有限的一块儿黑板理论啊。所谓的黑板理论, 他的核心思想就是大模型,在每一次推理的时候,你只能看到当前上下文理的内容,也就是说,推理的时候,这个模型会把所有输入的信息全部写在这块黑板上, 基于他黑板上写的这些版书啊,去进行思考啊,进行推理来产生结果啊。但是有个问题,什么这块黑板它的面积大小是有限的啊,比如几千 tok, 几万 tok 啊,甚至在一些大的模型里面会有几十万的 tok 啊, 无,不管多大,他始终都是一个有限的资源啊。一旦信息容量版书的内容超过了个黑板的大小, 那新的内容就必须要覆盖旧的内容啊。我板书写不下了,大家上学的时候都看过,老老师一开始从左边写板书写到右边写满之后啊,再跑到左边,问大家这边抄完没抄完,我擦了啊,大模型也是一样的,如果内容太多的话,就会导致信息丢失啊。 因此呢,在这个 ai 智能的系统中,就需要专门设计这个叫什么一个记忆管理机制来解决这个问题啊,弹幕啊,主持人的屏幕,哈哈哈,这个我没有办法,看看那个助教老师他们那边有,有没有办法解决啊? 没事,人类是一个适应性的动物啊,你多看一会就适应了。好,我们刚刚说这个大模型需要专门设计一个记忆管理机制来解解决我们刚刚说的黑板理论的问题啊,我们没有办法把所有的历史信息都无限制的堆在这个上下文窗口里, 而是呢,要有策略地去管理哪些信息应该保留,哪些信息呢?应该压缩或者删除啊。这里就涉及到两个非常重要的机制了。第一个机制叫这个 system prompt 啊,叫系统提示词, 它是什么呢?我们可以把它理解为啊,就固定在黑板顶部的一段指令啊,这段指令呢,通常用来定义我们这个 ai agent 的 它的人设, 给他一个身份啊,给他一个角色以及一个行为轨,一个行为规则啊,比如我们可以规定在 a 证呢,它是一个金融分析助手 啊,或者说你是一个科研助理啊,甚至呢,你是一个超级牛的一个 p 十级别的这个代码生成专家啊。由于这个 system prompt 它的是位于这个整个上下文的最前面啊,所以,并且它在整个对话过程当中,它通常是保持不变的, 因此呢,它可以持续地影响这个模型的行为啊,不会发生改变啊,相当于给我们这个 ai agent 锁定了一个叫什么稳定的人设和任务目标啊,这个是 system prompt 啊。第二个呢, 叫 contact 呃, contact management 啊,一个上下文管理在真实的这个 ai agent 的 系统中啊, 这个对话往往会持续很长时间啊,如果你把所有的历史对话都保留在这个上下文当中,那很快就会超出这个上下文窗口的限制了。但因此呢,系统常常会针对这种大量的历史信息进行压缩摘要或者筛选啊, 什么意思啊?就比如说我们可以定期的对我们之前聊过的内容历历史对话进行一个总结 啊,因为大家很多时候用大模型上来来来一句你好对不对?像这种就属于废话,在大模型看来,而且也额外消耗你的 talk 啊,也占用你这个上下文窗口的这个限制大家以后用的时候可以不写了啊, 没有必要跟 ai 那 么礼貌啊,谢谢也不用说你好跟谢谢都是废话啊,那我们说了,把历史对话压缩成一短一段简短的这这种摘药,或者说只保留与当前这个任务相关的重要信息啊,把不重要的内容删除啊,这样就 能够在有限的上下文空间中来保留最关键的信息啊,从而保证模型在推理的时候既可以看到前面的知识啊,也有空间来理解当前的这个任务啊。 这个是他的一个记忆模块,主要有两个关键的机制啊,第一个我们回回顾一下,就是固定在那整个黑板的最顶端啊,就比如说这这堂课的内容, 他通常会定义了你一个大模型的一个角色行为和准则啊。第二个我们会对历史的大量的这种记忆进行一个记录、优化、结论总结,把那些废话全部什么 ok 剔除掉,我会感觉到正在进行社交互动,哈哈。啊,这倒是啊,这是一个叫什么?这个是一个情绪价,情绪价值的体现啊。我那小侄女啊,天天我, 我问她你懂不懂 ai 啊,她说我懂,我说你懂 ai 什么?她说我每天都会跟豆包讲话。哈哈,谢谢可以作为奖励算法的关键词啊。 那不一定啊,比如说你没有得到答案,你也有可能会跟他说谢谢嘛,对不对?那只是出于你礼貌的一种表现。你在淘宝问这个商家的时候,他没有货了,你不会跟他说一句谢谢吗? memory 点 md 啊,这个同学了解的比较多啊,这个我们在这个 opencloud 里面会讲。好, 那我们刚刚了解的这个记忆模块,基本的 agent 的 记忆模块是什么东西啊?我,我们看一下它具体实现方式是怎么样的啊?我们上页说到大模型本身的上下文窗口,它是有限的啊,因此这个系统必须通过一些机制来拓展这个记忆能力。 那么在实际的 ai agent 的 系统当中呢?最常见的一种实现方式呢?就是这个东西,我们说叫 rap 啊,外部记忆系统,或者说知识库或向量向量数据库啊,是 rap 的 一部分啊, 大家如果之前上过这个大模型的课啊,应该会了解这个 r a g 啊, rap 解锁增强生成记忆机制啊,它其实分为两块啊,它既有解锁和增强生成记忆机制啊,它同时它也是一个记忆模块 啊,整个流程就可以拆分为这几步。首先用户提问,用户向这个 a g 呢输入一个问题,那这个时候大模型就会把你输入的问问题 embedding 之后进行解锁啊, 跟什么东西解锁呢?你给他的一个知识库啊,这个知识库是什么?你自己来定义啊,他会把你给他输入的问题啊,和这个知识库里,他觉得在向量空间中最相似的那个东西做一个 match 啊,把知识库里给的答案 做一个增强跟这个大模型它本身的能力生成的这个回答,去做一个 enhance 的 一个操作啊,这个就是你最终的答案啊,简单来说就是让你在考试的时候让你啊带一本参考书, 你做一道题,你可以翻一下那本书,你看跟哪道题比较相似的,你就去抄吧啊,当然也不能全抄对不对?因为他毕竟只是例题,跟你这个题跟你考试的题可能不太一样啊,所以就要把这个参考书里的内容和你自己本身的 题目的内容去做一个修改也好,改进也好,拼接也好,反正就是一种以 hands 的 操作,这个才是你的最终答案啊, 这个就是我们常说的这个 reag, 它现在是一个主流的 agent 的 记忆,一个记忆模块 啊,这种机制机制的核心优势在哪呢?就是它可以突破大模型参数知识的限制啊,能够有效的解决这种上下文窗口有限的问题啊,为什么?因为知识库在外部的。