你用 open crawl 是 不是还在玩那种发个消息回一下的聊天模式?那是把它当工具。很多人问我,凭什么你的 ai 框架能够像有脑子的数字员工能自己干活? 其实啊,并没有那么玄乎,我只是站在巨人的肩膀上,把别人花了几千美金踩坑总结出来的经验,通过几块钱的偷坑费就把逻辑给跑通了。调教之后啊, open crawl 就是 一个完美的项目经理。 openclock 在 agent 点 md 文档里定义了它的所有的行为准则,通过优化配置文件,它能够帮我协调其他六七个 agent 同事。 我重点增强了它三个功能,第一是主动性,它有心跳机制,会定时检查项目的进度,主动跟我汇报,而不是等我下达指令。第二是可重物系统,哪怕网络中断或者绘画重启,它能从断掉的地方稳定地继续推进。 第三是自我总结,每次任务结束之后,它会自动做两个总结,一个是给它自己看的,存储在它的 memory 里,防止以后犯同样的错误。第二个是给我看的,总结,在 obsidian 里,如果是通用的经验,还会自动同步到飞书。 我们要让 ai 用它最熟悉的方式去解决问题。比如 opencore 在 和 ai 工程师 curl code 协助的时候,根本不需要像人类那样开绘画聊天,它直接开放项目路径、工作记忆。在工具使用上,我也明确了优先级, 让它用最省钱、最快速的 api 方式去执行,而不是浪费 tom 模仿人类操作浏览器。 其实啊, ai 时代的竞争,拼的不是谁写的指令长,而是谁更懂硅基生物的写作逻辑。如果你也想摆脱对话框的聊天模式,真正构建自己的数字团队,欢迎找我交流。我是光头哥,带你深度玩转 ai 时代,咱们下期再见!
粉丝4471获赞1.3万

装了一堆 scares, 配了半天龙虾,干活还是稀烂,那大概率呢,不是模型的问题,是你这两件事没有做。第二,先问他一句话, 目前你有哪些 scares? 有 哪些是需要配置的?如果需要配置,请告诉我具体的步骤, 然后他就会把这些情况告诉你。很多朋友呢,装了一大堆 skill, 但是发现龙虾干活还是不给力,有时候啊,就是你压根都没有配置和启动。第二呢,就是去配置 md 文件啊。 md 文件比较核心的是有三个,分别是 so 点 md, agent 点 md, user 点 md。 它们不是什么高级设置,也不需要你懂代码。但一旦配置好,你会明显感觉到你的龙虾完全变了。先看 so 点 md 啊,顾名思义啊,就是龙虾的灵魂。 他定义的呢,不是龙虾能做什么,而是龙虾的说话风格,处事原则,遇到模糊情况时的一个判断方式。 甚至呢,他被允不允许有自己的观点,他是整个框架里最底层的文件,影响 open core 所有行为的底色。也正因为如此啊, open core 默认是已经给他了一套人格模板的,可以直接问他, 看一下你的搜点 md, 他 会把当前文件的内容读给你。你会发现啊,默认模板写的东西不能说不对吧,但太通用,太空泛了,而且啊,没有立场。 所以呢,我们可以根据我们想要的,让他写的更针对一些,能更适合来当我们的 ai 搭档。比如,可以直接让他需要运用第一性原理去思考 速度及优势。完成比完美重要,发布比打磨重要。结论永远在第一句, 任务完成后呢,主动给出一条最重要的改进建议,只说一条,还有不要等着被问,有判断就说。但每次呢,只说最重要的一件事,不要一次输出五条建议。 ok, 那 写完后,我们就可以输入,根据以下内容更改 cdmd, 然后复制就可以了。 当然,这个 md 文件呢,并不是这样一成不变的,而是在使用的过程中呢,慢慢调整成最适合你自己的。那如果说受点 md 呢,是关于他的,那么 user 点 md 呢,就是关于你的, 这是比较容易忽视的,但又是应该第一天就需要去完善的文件,它记录的是你这个真实的人, 你的基本信息啊,职业背景是什么,现在在做什么项目啊,你的工作偏好,以及一些重要提醒。那看起来很简单,但这些信息是龙虾每次启动都会独取的背景底色。 没有他,龙虾就会对你一无所知啊。每次对话他都像第一次见你,你得重新解释背景,重新说明偏好,重新建立语境。 有了它,龙虾就知道你在做什么,知道怎么跟你说话,知道哪些事情,不用反复确认。最后,这个 agent 点 md 呢,是相当于龙虾的工作说明书,它解决的问题是非常实际的,就是每次启动的时候应该按什么顺序做什么事,记忆管理的规范是什么 工具调用的逻辑,以及任务的执行边界和规范。总结呢,就是先立规矩,再谈干活。好了,希望这些对你使用小龙虾会有所帮助哦!

如果呢,你想把 open class 从会用到用好,那你一定要需要了解啊,它的 work space 工作空间该怎么样去配置?今天呢,就一口气啊,给大家都讲清楚。 首先呢,什么是 work space? 那 work space 呢,其实就是你的龙虾,这个 agent 的 他的工作台,哎,他决定了,哎,他是谁,怎么工作哎,以及记什么事,记得什么事,怎么样跟你去相处等等。那它呢,一般是由这些主要的文件来构成, 接下来呢,我们逐个的去进行介绍。首先呢是 agents 点 m d 啊,也就是它的岗位职责说明,那这个呢,其实也是欧盟卡拉里啊最关键的配置之一。 那你这个龙虾,你这个 agent 啊,它是什么样的职责,它该做什么事,不该做什么事啊,它遇到什么样的情况,该怎么去处理,都是靠这个文档来说明的。 我们可以看一下他给出的一个默认的一个说明,比如说在这个里面,他规定了,哎,你首次运行的时候该做什么样的事情,那每次绘画的时候应该先读什么样的文件, 包括你的记忆系统,哎,该怎么去使用,包括你的安全规则啊,比如说啊,绝不泄露隐私,比如说做一些销毁型的命令前要确认啊等等啊,以及还有这些怎么去做群聊,怎么去叫做心跳任务啊等等。 那当然了,他也会告诉你啊,这就是他的工作手册,我们需要根据我们的需要去进行修改啊,但是这里啊,我们也要提醒啊,这个文档呢,其实是很重要的啊,如果你不会改,那就不建议你去删他已有的内容,但是呢,你可以根据你工作的需要去给他进行补充或者更新,但是呢, 也不建议大家把这个写的太长太臃肿啊,五百字的效果要好于两千字。那第二个文档就是 identity 啊,它的身份信息啊,主要包括了一些简单的字段,包括它的姓名、身份、性格、表情、头像等等。 那第三个呢,就是他的灵魂性格, so, 那 so 呢?他是一份角色设定的文档啊,他其实是帮你去设定你这个龙虾,你这个 a 阵呢,他是一个什么样的人格啊?包括了他是一个什么样的人啊,他拥有什么样的价值观啊,他是一样, 他是什么样的性格啊,他以及他的这个说话聊天的方式是什么?比如说我们也可以看一下他给出的一个默认配置啊,他告诉你,哎,你是谁,你的做事的核心原则是什么啊?比如说你要去真正的帮助人,而不是表演式 啊,你可以有自己的判断啊,你要自己去想办法,你要去赢得信任,以及他的一些边界感啊,在哪里啊?包括他的这个气质啊,他的性格,聊天啊,都可以在这里去配置。 那最后呢,他也会提示啊,这个文件呢,不是写完就分存的,这个呢,会随着你跟用户之间的聊天对话,去越来越清楚自己的定位,越来越清楚自己的这个工作方式啊,他就应该被持续的改写。 那我们再来对比一下前面说的 identity and soul 是 什么一个区别呢?那 identity 呢?好比就是啊,工牌啊,名片啊,身份证啊这些信息。 那 so 呢?就是它这个人格的描述啊,比如说你是一人还是爱人啊,你的这个 iftp 啊,什么相关的这些十六型人格,哎,到底是什么?哎,是这样子的。 第四个呢,就是这个 user 文的,哎,就是用户资料,关于这个主人,哎,也就是你的资料方便呢,让你的龙虾去了解你, 包括了你的这个姓名啊,称呼啊,你的职业工作背景啊,以及其他的一些性格爱好偏好等等。那这个信息呢,其实也是随着你跟龙虾的这个沟通和了解不断的深入,他也就会记得更加清楚。 第五个呢啊,是兔子文的工具手册,他可以记录一些能够帮他去提高工作效率的一些这种相当于笔记啊,一些捷径方法的一些注解 啊,比如说你的这个各种的 a、 p、 r、 k 啊,他就每次就不用去再问了,直接在这里就可以查到了, 比如说你的这个一些特定文件的保存路径,哎,他也就会记住在这里,还在他的例子里啊,他还举了一些啊,比如说家里这个路由器啊,或者 server 的 这个地址啊,这个用户名是什么,还有一些语音合成的片号等等。 那有了这个文件之后呢,哎,他做很多具体的事情的时候,就可以依抄,依照这个小抄啊,笔记就可以更加快速的达成。那么第六个呢,就是他的 heartbeat 啊,心跳任务,那这个文档呢,主要是记录一些他该定期检查的一些啊,主动任务, 比如说查邮件,查天气等等。那在这里啊,比如说我给他定了一个啊,每隔两小时帮我检查一下邮箱啊,他在这个工作时间八点到十八点之间,每隔两小时帮我检查一下邮箱,看有没有新邮件来提醒我啊, 这像这些任务他就可以的。那在 open call 里呢,其实是有两种主动任务的形式,一种呢就是我们刚说的 heartbeat 的 形式,还有一种是 crawl 任务,那这两个的区别在哪里呢? heartbeat 呢,其实是适合每隔一定时间的这种周期性的任务,比如说每隔一小时,两小时检查一次油箱等等。那么 crow 呢,它适合这种有固定时间点的定时任务, 比如说,哎,早上八点,哎,帮我整理一下早间的新闻,哎,下午五点,帮我记得做一个总结提醒啊等等。那第七个文呢,就是 bootstrap 啊,它其实是首次启动的一个引导文件,一般是刚安装好或者刚创建好时啊,进行的一个引导绘画,一般是用来确认 他自己是谁啊,你,你是谁,包括一些身份信息的,交换完之后呢,他会自己删除。好,我们可以看一下他默认的这个 bullet script 文档,是这样子的,他会提示你啊,你是刚醒来,什么都还没有,这是第一次开场的时候,他会让你提示,你是说,哎,你是谁,我又是谁, 去交流这些信息。那聊完之后呢,把这些信息啊保存到这个 identity 和 user 啊相应的这个文档里面,那最后结束之后啊,它会提醒你啊,这个文档已经就可以删掉了。那么第八个,哎,就是我们的 memory 目录了, 这里呢记录了里面的绘画详情,哎,这个就相当于日记本,它会把每天发生的事情,每天的这个对话,这些具体的事情啊,都记录下来,哎,用这个日期和主题进行命名,比如说这个就是他跟我之前的一些 memory 记录, 那对应呢?还有这个 memory 点 m d, 那 这个呢,才是真正的这个长期记忆。那 memory m d 呢?它其实是每隔一段时间啊,会在前面的绘画详情中啊,挑出有价值的事情啊,经验啊,教训,或者一些值得记住的信息,哎,去把它提炼总结记录下来。 这样呢,和他下次对话的时候,就能快速找到这些重要的不该遗忘的事情啊,避免再去过去的这些大量的文件里面去再重新去翻找了。比如说呢,在我的龙虾的官网里,他帮我记住了啊,下周二有一个联系人联系啊,也还有我的一些相关的一些偏好,一些方向在哪里 啊,以及我告诉他处理我的这个邮件该怎么去处理的一个流程,注意事项等等,他都会记住。 当然在这里啊,我们还是强烈建议大家去定期去帮你的龙虾去整理它的长期记忆,只保留重要的信息啊。 memory 文件呢,同样不需要太长啊,比如说像我前面这个记了下周二的一个事项,但是这个过了这个时间的点之后呢,它就变得没用了,哎,你要去帮助你的龙虾去做好这个信息记忆信息的梳理。那么第十个哎,就是 skills 目录哎,也就是这个技能。 那如果我们想让我们的龙虾去完成一些更加高级的任务呢,我们就必然要会去安装各种各样的技能啊,比如说啊,我这个龙虾他就安装了这么一些技能。 那我们要知道的是啊,我们的技能呢,其实是分为了共享和独享这么两种,那我们在这里呢,其实是我们看到的都是这个独享技能啊,因为它在当前的 work space 下,它其实是只能供当前的 a 帧的使用,那么它事实上还有一个共享技能目录啊,一般是在这个目录下, 那这种呢就适合如果它是多 agent 的 情况下,那就所有的 agent 都可以去调用好。那么提到多 agent, 大家去可以看一下,因为我们像刚才说的介绍的这个整个 work space 呢,其实是对于一个独立的 agent 的, 假如说我想创建多个 agent 啊,假如说我除了这个主 agent 之外啊,我还专门创建了一个帮我去写代码的 code agent, 比如说我还有一个帮我去专门写作的一个 write agent, 比如说我还有一个帮我去产品设计的一个 agent, 那 这样的话呢,每个 agent 都有一个独立的 work space, 一个独立的工作空间,这样的话呢,就能保证他们有自己独立的人格,而不会相互去串台。 那这样的话也是带来的我们刚说到的 skills 啊,它每个 skill 只能够被当前的 agent 调用,但是呢,如果我们安装在这个共享空间里的这个 skills 呢,它其实是可以供所有的 agent 都去调用的。 好了,那以上呢,就是我们对 openclaw workspace 工作空间的主要文件的一个讲解,关注我,带你玩转 openclaw。

大家好,欢迎来到 ai coding 最佳实践系列第二期,今天我们来聊聊 agents md 为 ai 编程代理打造的标准上下文方案。 agents md 已被证实是当前 ai 编程代理中最有效的上下文方案之一。 你是否注意到,每个 ai 编程工具都有自己的配置文件? cloud code 有 cloud and gemini, clea 有 gemini and cursor, 需要 cursor rules。 未来,每一个新 agent 可能都有自己的 x x md, 这就是 agents md 因而生的原因。它是由 openai、 google 等多家 ai 巨头和社区共同创意的开放标准,为所有 ai 编程代理提供一个统一的上下文配置方案。 它的核心理念极其简单而深刻,为 ai agent 创建一个专属的、标准化的 reactme md 文件。 agents md 的 愿景是成为一个快 agent 的 行业标准,让所有 ai 工具都能自动识别并理解它。 无论你今天用的是 cloud code, 明天用的是 gemini, 还是后天社区推出的新工具,它们都应该能自动地、优先地去寻找宾利接 agents md。 那 么, agents md 应该包含哪些内容呢?又应该避免哪些内容呢? 首先是必须包含的内容,技术站与框架代码风格约定、已知陷阱、关键指令和避跑命令。同时要避免包含一次性需求,经常变动的不是为人类准备的详细文档。 接下来让我们看看 agents md 的 最佳实践。第一个,被动上下文优于主动调用,将不可逾越的底线规则放入 agents md, 确保 ai 每次生成代码时都遵守这些宪法。它的核心优势在于始终可见无需 ai 决定是否查询文档。 第二个,将 agents md 设计为导航入口,而非全量知识库,告诉 ai 去哪里找详细信息,而不是直接提供所有信息。随着项目变大,上下文窗口会溢出,所以保持简洁非常重要。第三个是 skill 的 调用补充。 当你发现自己创建或下载的 skill 不 能被 agent 自动调用时,在 agents md 中添加 skill 的 调用说明,明确指定调用条件和使用场景。通过在 agents md 中明确指定 skill 的 调用条件和使用场景,你可以帮助 ai 代理更准确地理解、核实以及如何使用这些技能。 agents md 就 像一份为 ai agent 量身定制的项目说明书,建议在你的项目根目录下创建一个名为 agent md 的 文件,专门存放那些写给 ai agent 看的不可逾越的底线规则。 通过标准化的 agents md, 你 可以确保不同的 ai 编程代理都能快速理解你的项目结构和编码规范,从而更高效地协助你的开发工作。谢谢大家!

如果你的 android skill 安装了,但是发现并不好用,比如说总是不触发,大概率是 description 没有写对。今天分享六个呢, skill 创建的技巧,全部是从 ospec 官方仓库里面扒出来的实战经验。第一个 skill md, 要有黄金结构。很多人写 skill md 呢,就是一坨文字糊上去, cloud 其实根本看不懂。 正确的写法是分块, purpose, when to use process, decision, logic, output。 每一块呢,都用标题和列表写清楚。 cloud 呢,一看就知道该怎么执行。 第二点啊, description 的 写法是否正确,直接决定了处罚率,这是最容易踩的坑啊。你写帮助用户处理 excel, 这太模糊了, ai 不知道什么时候该调用你,你得写清楚两个关键信息,第一个呢,叫做能做什么?第二个呢,是什么场景来调用?比如正确的写法呢?是这样的 好,你看前半句,列出了四个具体能力,提取数据,执行透视表,生成图表。后半句呢,写明了处罚的场景,分析表格数据或者自动化工作流,具体化,以 才能被精准触发。而且第二个信息点更关键,因为很多人会写干什么,但是常常忘记写什么时候来触发这个 script。 第三啊,重复的活呢,封装成 scripts。 比如说你经常要抓取网页内容,每次呢,让 ai 现写代码又慢又不稳定,直接写一个脚本呢,扔进 scripts 文件夹,然后在 s q m d 里面呢,告诉 ai 调用脚本就行。注意啊, scripts 文件夹里面的内容再多都是不加载到上下文里面的,而只是执行,因此 intoken。 而且由于是代码逻辑呢,是前后一致的,完全是稳定的。第四个, reference 文件夹要按需加载, qmd 里面超过了多少字就要拆分呢?从时间来看呢,最多不要超过五千字啊,如果超过就 把详细文档呢放进 reference 文件夹里面,在 qmd 里面写上需要时读取某某文件,这样 ai 不 会一次性的塞满上下文,只会在用到它的时候呢才加载。第五个, 直接抄官方的优秀案例, ospeak 官方的 skills 仓库呢,有六万多的 star, 里面的 m c, p, builder, web app, testing, internal, commerce 这些呢,都是生产级的 结构,怎么组织,指令怎么写,资源怎么分配,全部呢,都是现成答案,抄完改成你的领域就行。第六个,打包分享出去, skill 则遵循开放的标准,一个 skill m d 呢,加上 scripts, reference, assets 三个文件夹,打包呢就能给别人用。你做的 skill 呢,越专业,附用的价值呢就越高,对你带来的影响力呢也就 越大。总结一下, description 决定了触不触发,触发率是多少, skill m t 的 结构呢,决定了执行的质量, scripts 和 reference 呢,决定了效率的上限。 ok, 这一期呢,讲到这儿,觉得不错的点个赞,后续呢,还会拆解更多的 skill 的 实战的玩法。

大家好, hermes agent 都用上了吗?觉得怎么样呢?那今天来分享一下我最近使用的十个技巧,比较适配新手。 那第一个就是我们去安装 hermes 的 时候,只要执行这一条命令就行了,但是呢, windows 用户一定要特别注意啊,必须得安装这个 wcl 这个环境,那其实安装也非常方便啊,只要打开你的这个 pro shell, 那输入这个 install 命令就可以了。安装完之后输入这个 wc 要启动,然后再去执行这条命令,那么就 ok 了。那第二个就配置这个主模型啊,那么在 hermes 里面是其实是有主模型和辅助模型的,那我们怎么去配置这个主模型呢?那配置也是非常简单,只要执行 hermes, 然后 model 模型,那么你就可以选择,那第一个是它自己自家这个订阅,第二个是 open rotter, open rotter 非常建议大家使用,这个 open rotter 里面其实有非常多免费的模型,然后的话你就可以等它出来,就是它会先加载一些。就是啊,模型 我们可以拉到最下面啊,就是你可能这个模型不在这里的,你可以拉到最下面,然后对话输入模型的名称啊,输入模型名称点确定, ok, 这样的话你的模型就变成这个应用达这个模型呢,因为我之前已经输入过密钥了,所以他没有提示我输入密钥,比如说我们再看一下他是不是变了, ok, 你 看这个名字是不变了,我问一下, ok 啊,它这个模型是这个,那我们在设置模型的时候有一个小小的问题,比如说我们如果说设置的模型需要输入这个 key, 但是这个 key 其实在它这个终端输入里面我们是看不到的,经常我们复制过去之后看不到这个字母出来, 那你不知道,你可能又复制,导致可能这个命要输错了,那怎么办呢? 那么在这个 hermes 这个啊,目录里面有一个环境的这个配置的文件叫这个点 e n v, 那 么在这个文件里面是保存了所有你配的这个模型的密钥。所如如果说你这个模型调不通,那么你建议你去这个文件里面看一下你的密钥是不是配置的,对不对?那第三个就是啊,配置这个辅助模型,那为什么它会有辅助模型呢? 因为它设置了不同的任务模块啊,比如说这个第一个任务模块叫啊试图就是说啊,你如果发了这个截图啊,给这个 homeys 发了截图,不管你是通过什么聊天工具发了截图的话,如果你专门给它适配了模型,它就会调用这个专门的模型, 那比如说这个外部网页的搜索也是一样的,那么他这边有八个任务都可以去配置不同的模型啊,那这里就会有一个这样的事情呢,就是可能像有一些他是高频的,但是我们不需要那么好的模型去处理,比如说像搜索网页,其实这是这是一个可能是一个 m c p 的 活, 并不需要你这个模型有多厉害,那么你就可以选用一个便宜的模型,那比如说像这种啊,比如说这种记忆类的啊,他要去 总结记忆的,那非常重要,因为记忆和这个技能的这个深层非常依赖于这个模型的能力,不然的话他的这个效果就很差,那么这种时候你就可以去选一个比较好的模型, 还有说这种搜索类的,那么都是比较好的模型,选好一点的模型,所以你可以去根据这个去配置不同的模型,那么你也可以不配置啊,如果不配置的话都会使用默认模型,也就是你配置的那个默认模型,那如果你想配置的话,你可以这么来配置,只要进入对话,然后你告诉他是哪一个任务,比如说请你 这个压缩的啊,辅助模型, 你复制给它就行,就首先你得知道自己这个模型已经配置好了,在我们前面这一步,他这边啊,看到没有,他把 auto 能换成这个,就是我们的这个模型。 第四个就是写好这个 sword, md 啊,就是这个是个灵魂的文件,那这个文件是写什么字呢?就是定义你这个后面字的这个风格 应该写什么呢?比如说你这个性格说话的方式啊,做事的风格,价值观和边界,所以呢这个是非常适合你去定义好,这样的话你的这个后面字就比较有人味了,那么格式你可以这样按这种格式啊,比如说你是谁,你怎么说话,你做事的风格是什么样子的?你遇到问题优先怎么处理 啊?比如说举个例子啊,比如说你现在要做一个这种研究型的 ai 助手,你就把后面字定义成这种助手,那么你可以按这种方式去让它给你去对话,那么你也可以让 ai 去帮你走。比如说你跟后面字已经对话了一段时间了,那么你就可以让它根据我们的对话技术风格 让它去重新设置啊,你的这个灵魂文件,或者说你自己知道叫 so d m d, 那 么直接叫 so d m d, 或者重新设置我的灵魂,它是能识别出来 啊,你这个设置灵魂就是去修改这个 so md, 它会去根据你的对话就去总结你要求的这种风格,因为你跟它对话,你会不断去纠正它的问题嘛,那么它就知道你喜欢什么样的风格啊,就是这个样子,所以这个文件是非常适合大家在刚开始使用时去定义的。去定义好的, 那第五个就要搞懂这个 home md, 这个就是定义了 home md, 这个就是定义了 home md, 就是他是怎么跟你说话,是定义他那 user 点 m d 是 他对你的了解,就是你是用的人,他对你的长期观察,会把这些你的画像,你的习惯,你的偏好,然后落入,然后总结到这个文件里面,所以这个是会被被动形容的,那么你自己也可以去编辑啊。 那 memory md 就是 通过我们长期的对话,他会把这个一些事情总结,就针对事情来总结到这个 md memory md 里面,然后呢,每一次对话都会把这个文件的内容注入到上下文里面去,这样的话他就会记住啊,你曾经喜欢这个,喜欢那个,喜欢,喜欢做什么?喜欢这个事的流程是什么样子的, 那 skill 就 更具体了,就是他对你的对话进行总结之后,发现有些事情是可以啊用流程固化下来的,那么他就他就会固化到这个 skill 的 文这个文件夹里面去形成技能,那么这你的方法就可以被附用,流程就可以被附用了, 那么这种你也可以自己去安装,那么后面字也是可以被动去创建去啊,进行一个修改的。 那 state db 呢?就是你跟它的所有的对话记录全部都保存在这里面,那其实最重要的是这个所有的 md 啊,是去定义你这个 home 字是什么样的人格,那这个文件是我们主动要去维护的,那其他的文件都是 home 字可以自动去处理的,可以不用管。 那第六个就是我们配置这个聊天通道,那么也是非常简单,那我们配置这个聊天通道也是非常简单,只要执行这个 homeis getway setup 就 可以了,那进来之后我们可以看到它支持非常多这样的聊天的通道, 然后的话这边也是飞书钉钉还有企业微信,然后这边的话是可以去配置的,比如说配置这个飞书的话,你可以进来,进来之后,比如说我这边已经配置过了,那我就让他重写。 那这句话是要输入这个 app id, 那 么你如果之前用过 open core 对 接过飞书,那么你肯定创建了很多这样的飞书的应用啊,比如说我们打开这个飞书的应用,就可以看到这样的 app id, 那 我们只要复制过去啊,输进去,然后再把这个密钥 再输过去, 然后再选择飞书啊,我们用的是国内版飞书, 然后就确定,然后不管,那这样就配置好了,那这边的话他有一个这样的一个配对的这个命令,配对的这个码 你可以选择选择之后你你如果说是第一次的话,他是会啊,你跟他对话的话会输,会生成一个这样的配对的密钥啊,你输进去就行了, 那这样就配置就完成了,你就可以去对话了,然后你可以选择,然后让它重启。它目前的话支持基本上主流的这个聊天工具啊,而且飞书的话它支持的这个维度能力的维度都是非常全的,所以说还是比较推荐使用飞书。 那第七个就是我们可以使用这个 homeis doctor 这个功能啊,去做一个全面的检查,看一下我们到底配置上有什么问题,我们可以输入这个,然后它就会去 如果没有问题的他就会打勾,如果有有问题他就会打叉,然后告诉你这个哪一个是啊?有什么具体的问题,那比如说这有个警告,这个有一个 browse 插件没有装好, 就是如果你这边遇到什么问题,你可以先执行这个,然后让他去看一下,检查一下有没有什么问题。那第八个就是 ui, 就 说它本身是有一个这样 ui 的 管理界面,那官方没有做啊,但是社区已经做了一个非常不错的这个 ui 的 界面啊, 然后的话你可以把这个项目 clone 下来,然后去执行这个,然后就可以启动一个这样的 ui 的 这个,呃, homeys 的 这个 ui 的 管理界面,那这边是我启动之后啊,我们可以看到你可以配置很多东西,比如说对话,然后的话配置这个任务, 还有这个搜索这个技能。然后的话这边是啊,一个就是四二点 m d 的 配置,比如说我这个配置就是这样子的,那么你可以直接修改, 然后这边的话是这样的,文件就基本上管理的东西都有,然后这边可以选择模型,所以说是不错的。你如果说不太习惯用终端命令行 t u i 这种方式来管理的话, 你可以把它下载下来,然后部署一下。那第九个是如果你想把 open core 的 东西迁移过来,你可以执行这个命令,执行这个命令的话,可以把 open core 的 一些技能啊,一些记忆啊,这些东西都都带过来,比如说像这个 点 open 空的所有的文件,他都会转移到这边去啊,你可以选择 yes 呢,他就会把它全部转过去了,非常方便的迁移啊。那第十个就是怎么去安装记呢?那么第一种方式就自己去创建,那通过聊天的方式创建,我相信大家这个都已经非常熟悉了。那第二个是在社区里面搜索,那么 homeys 也有自己的这个技能的社区啊,然后它这边也是有非常多这样技能的,大概有四呃,四百多个吧,六百多个,现在已经六百多个了。然后我们可以打开这个技能列表,里面是有这个 build in, 就 说明是它本身就自带了这个技能,那么不是这个标记的,那你就需要去安装了。那安装方式也非常简单, 那只要把链接发送给他,在对话框里面告诉他,让他去安装这个技能就可以了。你也可以去安装 opencircle 里面这个技能啊,也是一样的,复制链接发给他,他就会自动去安装。还有 github 的 技能也是这么安装的, 那这样有了技能之后,那你就能够去用很多这样的,做很多这样的事情了,那么以上十个呢,是我自己总结的一些这些经验啊,希望能够帮助到你,能够更快更好地去使用这个 hems agent。

如果你也在用 openclaw, 先别急着研究 skill, 一定要把 so、 user agent 这三个文件配置好。我之前视频里也分享了关于 openclaw 的 安装和使用技巧。 在跟一些粉丝互动的过程中,我发现一个特别明显的问题,就是很多人把龙虾安装完之后,就在研究给他装什么 skill。 但是如果你真的想让他帮你干活,最重要的不是装多少个 skill, 而是先把这三个配置文件写好。如果你现在还不知道这几个文件在哪,特别简单,在这里直接去跟龙虾说一句,把你的 so 文件展示给我并解释一下, 你看他直接会告诉你。那咱们先说第一个 so 点 m d 这个文件,你可以理解为你在定义龙虾的价值观。很多人写这种配置,很喜欢一句空话, 比如你是一个高价的 ai 助手,请认真回答问题,这种基本等于没有写,因为他太虚了,龙虾根本不知道你到底想要什么。你真正应该写的是很具体的一些要求, 比如我这里会要求他收到任务后,自己先去判断任务类型,再决定怎么处理简单明确的问题。直接给结论,不要铺垫再回答。回答要简洁直接, 先结论后证据。要讲空话。在方式这里,我希望他有自己的判断,如果不确定就直接说不确定,不要给我瞎编一个答案。 因为 ai 最大的问题大家都知道,就是容易一本正经的胡说,所以你不给他定规则,他就会按照自己默认的方式来。但你一旦把这些要求写清楚,他整个回答质量会马上不一样。写完之后也很简单,直接跟他说一句,按照以上内容更新,搜点 md 就 可以了, 会去更新这个文件。第二个就是 user 点 md 这个文件, 这就在告诉他你是谁,要说清楚名字,你所在的时区,他应该怎么称呼你,你主要的工作内容,平时主要处理哪些事情,以及你的一些核心偏好, 更喜欢什么样的输出方式,这一点非常重要。如果没有 user 点 md 这个文件,说明他每次都在向跟一个陌生人说话,如果有了这个之后,他真的会慢慢的知道你是谁,你要什么。 那么最后一个文件, a 键的点 md 这个文件,你可以理解为相当于你给他一个工作手册,也就是你要告诉他收到任务之后要先做什么,做的标准是什么, 哪些操作是必须要跟你确认的,这些很关键,因为他决定了不是会不会回答,而是他会不会按照你的方式去做事。所以我自己的提点是,你把这三个文件写认真的写清楚,可能真的比你装一百个 skill 更有用, 因为 skill 解决的是他会什么,但这三个文件解决的是他怎么做事,怎么理解你怎么越来越像你的助手。

ok, 哈喽,大家今天给大家讲解一下 cloud 点 md 它本质上是个什么东西啊?以及怎么样去设置配置。你的 cloud md 可以 发挥出 cloud code 它最大的一个功能,这里面当然不仅仅限于 cloud md 啊, a, 零点 md, 用 gmail 或者是呃, codex kimi 都是 ok 的。 ok, 那 咱们先说一下它这个底层原理是什么样子的? 呃,首先就是你看这张图啊, calco 它每次启动绘画的这个时候,它会加载三个东西,首先是它自己的系统提示词,然后是 cloud md, 最后才是你一个你发的这个消息提示词。那 cloud md 呢?它不是系统提示词,它是一种叫做上下文注注的一种机制。 那这里面你看我旁边写了一个遵循率的百分之七十,什么意思?就是这个 context may or may not be relevant。 呃,这个 cloud md 他 有可能相关,有可能不相关,就他并不是每次一定都会遵循这个,如果你的 cloud 他 会自己判断,他觉得如果他会自己判断,那如果你说这个提问提了个问题,跟你的项目没什么关系,他可能就不会用 cloud md, 或者是你 cloud md 长期不更新,已经完全的 不不适配了,那他也不会用。另外就如果你 call 点 b 写的太长了,那他也不是,就是每次强制执行,那他就会就会呃,降低这个相关的概率,同时差前面会影响到他,可能也会忽略掉 ok, 就 他这个层面的啊。然后我们看一下这个也是概率性的,然后我们看一下 call 点 call 点 b 他 应该怎么怎么写,应该写什么。那写的话你包括这三个东西,一个是 y word 还有 h, 那 y 它的话就是设计理念,因为后面我会讲 ctrl d 这个东西,它不只是能当一个地图用,它也可以包含你自己的设计理念去啊在里面。所以说 你这个 y, 它就包含说为什么要这么做,然后为什么我们怎么去设计一个 folder 的, 我们这个项目是怎么样去运行的? y 要写上,那除了 y 之外还有号号的话,它更多就是说怎么去做这个事情,或者说你自己的一些常用的命令啊,验证的流程啊,代码规范等等都可以加在号里面。 那 word 的 话就是整个你的项目的一个地图,类似于呃定,就是很,就是什么,比如说你的技术站用了什么,用了什么技术站呢?呃, cloud 去哪找东西啊?这些都可以在 word 里面去写。那很多人就犯了一个错误,就是他觉得 word 和 y 写上, word 和号写上就够了,他没有写写 y, 因为他觉得,哦,我好像让这个 cloud 知道怎么去做,要做什么就行。那你没有必要知道为什么要做这个事。但其实这个也挺关键的,因为我们说的 word 和 这个 y, 它并不能包含所有的这个情况,有一些事情,有一些时候,呃, cloud 和 y 它并不能包含所有的这个,那这个时候它就需要用, 因为我的号里面没写,他这时候就要用 y 里面的这个设计里面他自己去推这个情况该怎么处理。所以说这个 y 呢,他是能呃一个原理性,他可以让 cloud 去推理什么时候该用什么东西。 ok, 然后下页看一下,对,这里面就是讲了一个这个井号这样的一个用途, 就是你每次也不用完全自己写这个,或者自己更新好的 md。 有 的时候你在工作的时候,比如说你想起来一个什么或新创的文件,你告诉他在哪,那你怎么快捷去弄一下?你就用这个加一个井号,然后后面直接开始输入内容,比如说我这里写了 always use bind, 或者是这个什么什么东西在在什么地方等等等等,具体情况自己定义。那你自动写入 color, 帮你自动写入,它会让你选择级别,个人级在这里面项目级在这里面个人级就加个 logo 的 md, 项目级就没有这个 logo 啊。 ok, 看一下,下 一个就是一个跟 color md 相关的一个命令啊 inet, 那 它干嘛用呢?就如果你的项目还没有 color md, 或者是别人的项目它没有 call 点,那你用个 init, 它就可以扫描你的这个结构,什么什么 package json, 什么目录结构,一点 m d, 这些扫描以后,它会帮你写一个 call 点 m d 出来。或者说如果你的 call 点 m d 长期没有更新,它也会帮你写一个啊 call 点 m d 出来。对,但这个,呃,除了这并不是唯一的一个方式去下载设置你的 iphone id, 后面还有两种方式,其实有无限种方式,后面再讲两个稍微高级一点的用法。呃, init, 它会把你的整个文件夹都给扫描到,所以说如果你的文件夹里面有很多无关的东西, 他说已经过时的东西,你最好在自己那个里面那个 copy 里检查一下,因为有些东西他已经不需要了。那你把这个 copy 这个目录写太长了,其实也不好,会影响上下文,所以他写完以后你自己去查一下,有些东西不要了,你自己要不能随时清,要不然就是 copy 里面你要写好 ok, 下面这个是一个 illustrator pattern, 这个就是一个用 cloud md 然后来调度的一个方式。我们刚才不是说了吗, cloud md 里面要写一个 y, 就是 说其实你是可以操纵你的整个项目去如何配合如何用的, 所以你可以跟通过 color md, 然后来定义你和这个 color 的 一个写作方式。那这里面一个比较常用的写作方式,就是一个 illustrator 这样的一个写作方式,它是什么样的一个形式呢?就是,呃,首先你需要一个 illustrator, 他 是一个协调者,他不去执行执行任务,他只是负责问题拆分,任务拆分,然后去委托给不同的 agent, 然后 agent 他 去执行,以后呢?产出以后他交给 verify, 就是 一个验证者加查作业的,然后如果 ok 的 话,那去 下一个任务,如果不 ok, 那 就再反过来再去重复委托。那你在 ko 的 m g 里面要干要干嘛呢?就是定义好整个的这样的一个配合的方式,所以他这时候就不只是一个目录了,他还需要定义这种配合的方式,你要让 ko 知道,每次你分配一个任务,他都会这么去做。 ok, 然后这个是 ajax groupflow 这样一个 call 点 b 的 使用方式,它的结构是这样的,首先有一个 呃 call 点 b, 然后你要设置几个不同的 folder, 一 共是两个 folder, 一个是 directive, 一个是 execution, 两个 folder, 那你要在 cloud 点 b 里面约定好就是怎么使用一套系统,使用方式就是这样的。首先,呃, directiff folder 里面它放的全都是纯粹的文字, word doc 文件告诉他,告诉这个标有任何代码,告诉 你,告诉这个 cloud 的 某些事情,约定好你要怎么去做。呃,当然这里怎么去做的话,你可以像写 sql 点 b 那 样,一个步骤 face 一, face two, 步骤一,步骤二,然后, 呃,有什么样的边边界,有什么的输入啊什么的输出都没规定好。呃,当然有一些复杂工作的话,比如说像是如果用 nba 的 话,那有的时候需要需要去跑一些脚本的,比如说你要去爬虫或者连个 api 这些东西。那 我们把这个这部分纯执行这部分放在一个 execution folder 里面执行这个 folder 里面,这个 folder 里面就只放那些 python 的 脚本,各种各样的那种执行执行的代码。为什么要这么设置呢?因为 directive。 呃,它这个里面 它是完全的灵活性,让大模型去做决定的,但大模型决定的话,它还是有一定的概率的属性,有一定的确定性。但是这个 execution folder 里面,它这些脚本是确定性的,是稳定的,而且是非常非常快速的。 呃,这样就既平衡了一个呃创造性,同时又平衡了一定的这个稳定性,所以叫 energetic workflow。 那 中间这个 oxaction 它是干嘛用的?它是中间一个过渡层,也就是 他像一个项目经理一样,每次从九幺 k 里面看要做到什么,要做什么任务以后,他就把这些任务,然后准确的去调用对应的这个工具,然后去呃综合,然后去完成。对,然后他还有一个功能,就是确保你在整个这个工作流他能呃 有一定的这个叫做鲁棒型。就是说如果你这个工作里头他比如说某次降维 a p p 失败了,那他应该返回一个什么样的一个信息,或者是嗯 应该进入另外一个分支。当然还要说一下,就是呃你可能运行几次有发现更好的方法呢?他也可以帮你去去更新这个脚本等等。 首先总而言之就是整个这套互动的方式都是在 call 点 m b 里面写好,然后告诉在 call 点 m b 里面告诉他说,呃这个 folder 里面放的什么,那个 folder 里面放什么?你到时候去里面找就 ok 了。


非常简单的方式,就能让你的网页具备专业的审美,那这是皇叔自己课程的官网,那这种风格呢,也是调了非常多次,慢慢调出来的,但是呢,但是使用迪赛的 mv 之后呢,你的网站能够快速的拥有顶级的审美,比如说 no 选风格, culture 风格,这是 vot agent 风格,那如何实现这一点呢?非常的简单。最早呢是谷歌 app 推出了一个第三的 md, 它这里面就包含了谷歌它对于页面风格的一个审美, 然后社区就有人开源了 awesome design, md, 那 这个仓库里面呢,包含了多种风格,怎么用呢?非常简单,我只需要把这个仓库的链接丢给卡拉扣,他就会跟你说,哎,你应该如何去使用他 看他会跟你说怎么用。你直接挑一个你喜欢的网站风格,就把整个 design md 复制到你的项目跟目录就可以,接着让你的 ai 卷根据 design md 去生成 ui 就 可以了,非常的简单。 那这里面呢,他这么多风格,我也不知道哪个更适合我,我直接让 ai a 准帮我去挑,他就去读取了我当前的网站风格之后,从五十八个里面挑选适合我的 啊,然后给我设计了三个龙选风格,是这种暖色调的,然后呢,还有科瑟风格,对吧?是比较气质,和我们课程是比较像的, 然后包括硬核的 a 准的风格,哎,我也不知道到底好不好,我说你三个页面同时帮我去生成一个前端,然后渲染出来, 来,我来一个个对比,快他就出来了, no 选风格, cut 风格, model a 准风格,再到我自己原版的官网,你更喜欢哪一个呢?

opencloud 的 核心配置文件,我们来看一下,一共有这一些,最重要的就是这个 s 点 bug 到文件,它是定义的 agent 的 性格、价值观,还有行为规则,下面有这个 identity 就是 它的角色, user 就是 用户信息,再往下就不是那么重要。像这个 memory 的 话是用来存放它的记忆的。 b 就是 有一些心跳任务,这种有带日期的,这种 memory 它是每天的一个记忆,它每一个这样的代理硬件都是会有这样一套文件的。我们在新建代理的时候,我们是需要给它最好是配置好。首先来讲一下 so, so, 它是这个 代理的这个灵魂,然后包括一些性格、行为准则,还有绝对的边界,这个是最重要的文件, 就比如说我这里是一个专业开发的助手,我给他定义一个核心的人设,是经验丰富的全站工程师。然后性格是技术精湛、务实高效、 逻辑清晰、主动但不越界,风格是使用专业术语,代码优先,拒绝废话,这里有一个人设,然后下面是行为准则,行为准则这个是很重要的, 包括下面这个绝对红线,就是不要做的事情,不要做的事情是非常重要的,未经确认删除,还有泄露 p i t, 提交未经测试代码,就是这些东西都是不能做的。然后有一个 identity, 就是 一个身份的标识, 比如说我们去搞一些自媒体运营的话,我们有比如说有文写文档的,配图的,或者是排版的,就可以给他一些身份。然后这个 user 点 markdown, 就是 用户的画像,就这边就是写的你的信息,去写你的名字, 然后我这边是因为是搞开发的,就是去写一些技术站或者我的工作习惯,如果你是去把它去让当做一个 ai 助手的话, 你这里就去写一下,比如说你在做什么项目,或者就是然后还有一个就是时区的问题,你这边如果是 中国时间的话,你就给他讲你是东八区啊,这个对于他去执行一些定时任务的话是很重要的。然后下面是有一个 markdown 文件,去定义他的工作流,还有一些规范, 还有项目特定的规则,这边也是跟代码关系比较大的,这边就不至于数了。然后 memory 也是比较重要的,就是它是一个长期的记忆, 就比如说我们在项目中遇到的一些问题,然后是怎么解决的,就一些特别重要的点可以给他记在这个里面,或者有一些你的个人偏好配置软件大概就是这个样子,我补充一些配置软件。呃,其实我们在使用过程中,我们只要知道有这些配置软件, 我们在跟那个龙虾对话的时候,我们其实不用那么那么仔细的去跟他核对每一个文件的,我们再去规定他的一些性格特征或者是角色的时候,我们可以给他大概的定义一下, 很粗的定义下,他会去把这些详细的东西都补全的,让他给你确认一下还有什么要改的地方。一开始用的时候你先去给他定义好,然后在使用过程中再慢慢慢的去磨合,慢慢去去改,就是所谓的养龙虾了。 还有一点就是我们一开始可能只有一个龙虾助手,一个主的代理,你后面如果慢慢做的东西多了以后,你会慢慢加,慢慢加,他们每一个代理都会有一套这样的配置软件, 需要给他们配置不同的人格,还有他们不同的任务啊,还有你的偏好就是这一套东西。

大家好,这期讲 open call 的 多 agent 模式,简单说就是一个 git 里可以同时跑多个独立的 ai 大 脑,每个大脑有自己的工作区,绘画记录和性格设定,互不干扰。 比如你可以有一个工作 agent, 一个生活 agent, 消息自动路由到对应的那个,非常适合多角色、多场景使用。 搞懂多 agent 要先理解三个核心概念,第一个是 agent id, 就是 每个 agent 的 唯一名字,比如 main work home。 第二个是 account id, 是 渠道账号的名字,比如一个非书账号,一个钉钉账号。 第三个是绑定,就是消息路由,规则决定哪条消息该交给哪个 agent 处理。添加新 agent 只需要一条命令, open call agents add 后面跟你想取的名字,比如 work 或 call 顶。 执行完之后,系统会自动创建独立的工作区目录,初步化搜点 md agents 点 md 等引导文件,还有独立的绘画存储。你可以一次性添加多个 agent, 每个都完全独立。 配置好 agent 之后,还需要告诉 get 位消息该路由到哪里,这就是 bindings 配置。在 open call 点 j s o n 里, bindings 是 一个数组,每条规则指定 agent id 和 match 条件, match 可以 按渠道名、账号 id 甚至具体的群 id 来匹配。匹配规则遵循最具体优先原则,精确到群 id 的 规则比只匹配渠道名的规则优先级更高,没有匹配到任何规则时,消息会回退到默认 agent。 多 agent 有 三种最常见的使用场景,第一种,不同渠道绑不同 agent, 飞书走工作 agent, 钉钉走,个人 agent, 互不干扰。 第二种,单个机器人账号按群路由同一个飞书机器人在技术群里是编程 agent, 在 运营群里是内容 agent, 用户只需要记住一个机器人入口。第三种,多人共用一个 gateway, 每个人对应一个 agent 工作区和对话历史完全隔离。 根据实际需求,有四种配置方案可以选择。方案一是单 agent 多绘画,最简单,适合个人用户。方案二是多 agent 软隔离,每个 agent 有 独立工作区,适合小团队和多角色场景,推荐大多数人用这个 方案三是 docker 沙箱处理敏感数据,使用安全性更高。方案四是多 gateway, 每个 agent 独立进程,适合企业及部署,越往后安全性越高,但复杂度和资源消耗也越大。按需选择, 每个 agent 可以 独立配置沙箱和工具权限。沙箱有三档, off 表示不隔离, none man 指对非主 agent 请沙箱, off 表示所有 agent 都进沙箱。 工具权限通过 allow 和 deny 控制。比如给家庭 agent 的 设置只允许读取工具,禁止执行和写入,这样就算有人恶意构造消息, agent 也没有权限做破坏性操作。 配置完成后,需要重启 gateway, 让改动生效。执行 opencloud gateway restart, 然后用 opencloud agent list 加上 bundins 参数,可以查看所有 agent 和对应的绑定规则是否正确。最后用 opencloud channels status 加 pro, 确认各渠道连接正常, 再对应渠道发一条测试消息,确认路由到了正确的 agent 就 算配置成功了。好了,这期多 agent 模式就讲到这里,记住三个核心, agent, id 是 大脑的名字,绑定是路由规则,最具体的规则优先匹配。 新手从多 agent 软隔离方案开始,用 agents add 命令添加 agent 配置 bundings, 重启 get 维,验证一下就搞定了,下期见。

各位,龙虾是不是还没养明白?哈哈哈,现在又来了个新的啊,叫爱马仕 aj 这玩意 这个东西呢,它其实是二月份就已经上线了。这东西啊,但是为啥一直没火,然后到最近开始火起来了,就是因为龙虾火了,然后大家养龙虾,最后发现啊,有问题, 龙虾他有啥问题呢?最大的两个点啊,第一个点,第一个点是大家都在养龙虾,都是在企图通过对话,对吧?我去不断的去跟龙虾对话,然后让他学会我的行为习惯,是吧?大家都是这么一个想法,然后就把这个想法行为呢叫养龙虾, 那实际上你真养过你就知道啊,不顶用,对吧?不顶用,因为龙虾他没有那种机制啊,龙虾的记忆机制是全量存储啊, 全量存储就是他的所有的记忆他都会存到相册数据库里面去,然后他不会去主动搜那个相册,所以你给他讲了很多东西啊,他可能最近一段时间还记着,过一段时间他也忘了啊。 然后还有第二个问题,啥呢?就是烧头啃,因为大多数人你们的任务呢,肯定没有那么高的价值,对吧?然后你要买头啃,然后要给龙虾去烧, 然后呢?龙虾子又没有去针对这个就是上下文去做一些优化啥的啊,他有几个比较直接的点吧,给他聊一下,就是 小米那个罗弗利发的那文章也说了,就批了龙虾。第一个就是他会不断的去钓工具,然后有很多就是非常低价值的钓用,然后呢,这些每次钓工具呢,都会带着一个非常大的上下文,我去,然后这都是纯粹浪费头衔的行为啊, 然后呢,还有就是他的记忆机制是一个权量记忆,这意味着你一旦就是说你的任务需要去搜记忆的时候,他可能一下就能搜出来一堆东西,这也会导致他的上下文很大,这所以你用起来你会发现啊,越用越烧头疼,对吧? 就是因为有这两个问题点,所以这个爱马仕火了啊,这个爱马仕现在慢慢火起来了,他是怎么解决问题呢?看第一个点,他有一个很重要的机制,叫做自学习机制, 长这样这个东西也是一个技能哎,也是一个技能,这个技能是干啥的呢?是管理技能的技能,他会在几种情况下去自发的啊?自发的去创建技能啊,比如说一个复杂任务完成之后 啊,他会去学习这个复杂任务,然后去看能不能把这个复杂任务的流程去把它写成一个技能啊。还有就是他自主的会去对话历史里面发现一些流程性的东西,简单的流程,然后还有一些就是错误点,对吧?比如遇到错误了, 然后呢,然后就自己去想办法把这个错误解决掉了,他有可能会把这个办法啊搞成一个技能记录下来, 这是他会自主的去阅读你的历史记录啊,然后去自发的创建技能。在这种机制下呢,其实就是之前养龙虾那种概念是可以跑的出来了,对吧?你可以不断的去跟他聊天,聊天聊天,他可能会从中就会自动自动的去创建一些系统出来 啊,这是它的第一个很重要的特性,解决了养龙虾啊,养不熟的问题,对吧?然后第二机制也很有意思啊,很有意思是它的记忆系统,它这个记忆系统跟龙虾就完全是设计哲学上的一个区别了,龙虾是全量存储,它 不光不是全量存储,而且它是极端限量存储,它的记忆在两个文件里面,一个叫 mem 点 m d, 然后还有叫 u z 点 m d 这两个文件呢,它都是有一个词量限制。 member 的 md 是 个两千二的字字母啊,它限制两千二个字母,然后 user 的 md 是 一千三百七十五个字母,我也不知道它为什么定了这么个数字啊?但是呢,确实它是这么限制的,而且它这个限制跟 colocode 那 个还不一样, colocode 那 个是直接截断了,但是它这个不是,它这个是啥呢?就是当记忆下来的记的东西呢? 超出限制了会怎么样?会触发一个整理过程啊,他会去整理这个记忆文件, 就是说他会去让我们先自己再去判断一下啊,这个记忆文件里面这么多东西,哪些东西是不是不重要?我是不是可以删掉,对吧?哪些东西是不是没那么重要了?我,但是我还可能还有用,所以他会怎么样?他会把这些东西压缩一下啊,写一段摘药记下来 啊,所以他这个东西的好处在哪呢?就是他这个记忆每一次在调模型的时候都会把整个文件全部打包啊,然后归类模型。然后呢, 他不会超量啊,他不会超量,就是他除了这个这两个文件之外,他就没有别的记忆文件了啊?没有别的记忆文件,就是龙虾是全量记忆,对吧?他直接不记了啊?他直接不记了,他相当于是尺量模型,不断的去记忆那些最关键的问题,而不是去把所有事情全记下来啊。 这在这种情况下呢,就是他能解决一部分就是头啃爆炸的问题,对吧?烧头啃烧的太厉害的问题,但是这种机制他到底能不能达到像龙虾那样效果啊?那还真不好说,真不好说。 但是呢,根据我在网上看啊,很多人使用反馈,其实对于绝大多数任务来讲,对于绝大多数任务来讲,其实记忆真的可能没有那么重要, 没有那么重要,对吧?你对你可能做一个,可能写一篇文章,写一篇项目,你可能觉得啊,我要把所有内容都记下来,但实际上你在写的时候,你可能真的只需要去记关键的一些点就行了 啊。所以这个东西啊,现在在网上开始慢慢慢慢火起来了。养龙虾如果你养的不太爽啊,可以改下试试这个爱马仕 agent 啊。

我们可以一个命令就可以实现从原始数据到投稿全流程,全过程。很多粉丝问我,龙博,你的 ai 是 如何配置的? 今天配置教程它来了。大家好,我是龙博,今天我给大家讲一讲如何配置 ai 和 skills。 首先给新来的观众讲一下基本的概念,我们这里所说的 ai agent, 它区别于我们传统的聊天机器人,它是执行任务的智能体,它可以直接操作你本地电脑的文件和应用程序。 而 skills 呢,指的是封装好的固定的工作流,可以让 ai 自动调用并完成复杂任务。今天我们主要讲的就是如何配置更好的 skills, 来指导我们的 ai agent 完成我们本地的任务。 我常用的 ai agent 是 codex, 安装好之后,我们可以在你工作的目录点开终端,打开终端后输入 codex, 我 们就可以在工作区看到你刚才的文件夹。 我们今天的任务很简单,我们需要统计每个省份的人均生产产值,但是在原始的城市数据库里面,我们只有地区层面的生产产值和户籍人口信息。我们先测试一种不使用 skills 的 情况,我们把提示词拷贝给 a i a 人的, 我们把它需要处理的数据文件放在我们的提示词里面。同时我们跟他说,请统计二零二二年每个省份的人均生产产值,并且制成图表。为了节省时间,我们要求直接执行,不要问我任何问题。我们可以看到我们的 ai agent 已经开始工作了, 他正在读取当前的工作簿,并且定位了文件当中有哪些字段。耗时三分钟,我们已经得到了结果的图标,我们来看看他处理的怎么样。在 output 文件夹里面呀,有一个 svg 图像, 我们这里已经有了完整的数据结果,我们三十一个省,每一个地区的人均生产产值已经有了。 这个时候问题就来了,之前粉丝群里有人问我龙伯,龙伯用 codex 能产生中间结果吗?我们这里看到确实并没有产生中间结果,但是我们可以通过配置 skills 来实现。 我们可以这样说,我现在要写一个大局的 skills, 我 们要求对任何 excel 文件处理的时候都不得修改原文件。同时我们要求在 program 当中存档我们的处理代码,同时在 result 文件夹下输入结果。啊,它在我们的大局技能目录里面要创建一个 excel analysis 的 技能, 大家这个时候可以点开旁边栏的技能,我们就能找到。他说当我们处理任何 excel 的 时候,我们都要使用这一技能。下面就是一些关于这个技能的具体说明。诶,那 skills 是 如何发挥作用的呢? 我们可以把 skills 看做成一段长期维护的提示词,我们可以通过美元符号显示的调用。我们仍然把刚才的问题发送给 codex, 我 们可以看到他说,先定位工作区中的 excel 文件, 确定好之后,哎,脚本写到 program 里面,输出的表格存储到 result 里面。我们来看看使用了 skills 的 codex, 它执行任务的效果怎么样。 我们可以看见 codex 除了给出我们最终的结果文件,它还在我们指定的 program 文件夹下生成了中间的处理结果。 啊,我们点开当前的这个处理结果文件夹,我们可以看到啊, codex 处理刚才任务所产生的排放代码已经生成在我们指定的路径之下了,我们可以根据中间处理的脚本哎来判断它任务执行的正确与否。 我们会发现,在刚才的任务当中,如果不使用 skills, 它会导致缺乏中间过程,难以核对我们处理的准确性。同时啊,这个文件的管理是非常混乱的,很容易污染本地的文件夹。但是一旦使用了我们的 skills, 我 们的 codex 就 可以按照合理的方式来管理文件留存中间的结果,它是非常非常适合科研当中使用的。 好,今天重要的重点来了,龙伯来分享一下自己的 ai 学术工作流。我们做实证研究啊,一般往往是从 data 文件夹下的 raw 原始数据出发,我们可以使用在 program 文件夹下的清洗脚本对原始数据进行加工,我们可以得到 final 分 析数据。 分析数据一般都是已经整理好的面板数据,有了面板数据之后呢,我们就可以使用 stata 来写作 analysis 分 析脚本对分析数据进行加工。 加工之后呢,我们一般容易得到两类结果,一类是表格,另一类是图片。如果你已经熟悉了 la tech 的 使用啊,你可以使用这个 la tech 的 input 命令,把图片和表格直接插入到主文档当中。 需要注意的一点是啊,在龙薄的工作流当中,是有非常多明确的工作规则,尤其是你要告诉你的 ai agent 不 得跨级提取结果文件啊,就比如你的分析脚本,你不能直接提取原始数据啊,你需要提取这个分析数据。 还比如说,你的清洗脚本必须保留明确的摘要说明。同时呢,你的分析脚本在运行过程中,需要对 state 的 运行结果进行存档。 除了基本的工作流之外啊,我们还可以使用更精细的 rules 对 不同类型的文件进行约束。 就比如我们这里 clean rules 可以 限制我们清洗脚本所使用的函数类型。再比如说,我们可以把我们经常使用的表格格式,表格模板放到我们的 result rules 当中。我们可以说,哎,我输出的表格必须是三线表,我输出的图片啊,必须是某种模板,我们可以实现对每一种类型文件的精细约束。 好,有了我刚才所说的工作原则,还有各种各样的 rules, 我 们就已经能得到排版非常美观的主文稿了。 我们就可以告诉我们的 agent 进行投稿打包啊,打包里面其实很简单嘛,就是我们的主文稿, cover, letter, title, page 等等等等。大家会发现,如果我们使用管理科学的 skills, 我 们可以一个命令 就可以实现从原始数据到投稿全流程全过程。 好,有了刚才的介绍呀,大家就可以比较容易的理解龙博的工作流了。龙博自己写了一套 skills, 里面包括了整个科研的全壁画,包括各种各样的文件管理啊,每一种类别的文件啊,应该遵循何种规则呀?啊,在龙博这一套 skills 里面都包括了,可以供大家参考。 好,我们接下来试试龙博的 skills 啊,跟我们上期视频一样,我们整个项目文件夹里面只有 data 文件夹下的 raw 原始数据文件。好,我们这期的学术题目也很简单啊,是区域公共品牌建设能否促进企业采取绿色食品认证。 我们可以这样说,我们打算以区域公共品牌建设为解释变量,绿色食品认证为被解释变量研究的层级啊,是地方杠,年份层面哎,这里有个小技巧,我们可以这样告诉 agent, 我们预期得到正向显著的结果,如果不显著,请调整模型,调整到正向显著为止啊。同时生成中英文两版文稿,将结果插入到文稿当中,并在文稿当中补充上下文,以及对于结果的解读。 我们来看看 codex 的 执行效果。我们把刚才的提示词输入到 codex 当中,大家可以看到啊,在我们输入提示词之后,我们 codex 首先读取了我所提供的 skills, 它会按照我 skills 里面提到的 工作流进行处理。比如他会首先遵循从 program 到 results 到 manuscript 全链路的执行,对于其中不完整的文件夹,他可以自行补充。这个任务比较长啊,整个过程,整个链路耗时都非常长,我们可以稍事休息一下。 好啊,整个项目历时十六分钟啊,已经完成了。中间过程中是他的一些思考呀,他执行一些命令呀,等等等等。 a 阵的说已经完成了结果,主结果是正向且显著的。在主规格里面啊,认证显著水平为正,且在百分之一水平显著。中间呢,生成了一系列的分析脚本,中英文 pdf 文档,我们来看看它结果到底怎么样呀? 我们可以看到,在刚才空白的文件夹里面,已经多出了各种各样的分析文件,由我们开始的 raw 文件, 还有处理好的面板数据, final 文件中间呢,还有刚才我提到的 clean 清洗脚本,使用的是 python analysis 分 析脚本,它使用的是 stat 度文件。同时呢,表格输出到了 result 下面,形成了一个点 tech 文件,它又把点 tech 文件输入到了 我们的分析脚本当中。来,我们来看看写的怎么样吧。题目是区域公共品牌建设与绿色食品认证采纳啊,这里面谈到了他研究的背景数据变量的构造哦,注意看,这里还给出了具体的模型设置,被解释变量取了对数,解释变量也取了对数。 同时呢,回归结果也有了啊,回归结果果然是正向显著的,这里面给出了具体的控制变量控制与否,省份固定效应、年份固定效应、观测值等等等等都给了。 这样子我们就完成了一篇完完整整的结构规范的小文章啊。不过大家这个时候肯定会觉得我目前的研究比较简陋, 以目前的这个我的水平,包括这个 ai 的 水平啊,我觉得还不足以一件完成一篇完整的可以投稿的研究,但是它对于我们的日常研究还是有价值有意义的。比如我们可能对某些话题啊比较感兴趣,我想看看基于我已有的数据,能不能深入的推进这个研究呀,哎,我们就可以使用这一套工作流, 一键耗时十六分钟,我们就可以得到分析结果。哎,如果是正向显著确实符合预期,那我们就可以进一步的深入推进这项研究了。朋友们, 原来我们用代码操作机器,今天我们可以用 skills 来操纵机器。未来是 ai 的 时代,在我看来啊, skills 是 ai 时代的核心竞争力,朋友们,打不过就加入 ai 吧。

使用 codex, 对 于同一任务需要不断手工确认,继续执行,烦到不行。解决这个问题,你只需要在 a 针点页面里添加以下内容即可。

今天把这个我的视频里面啊,学习 openclo 的 这个知识点,最后一个空白补齐啊,就是怎么修改这个 so 和 agent 文件啊, 我们看一下 solo 文件和 h 文件加载流程啊,这个很简单,大家自己看就行了啊。这 solo 文件呢,是它的宪法,是这个 oppo 可乐的宪法,你的小龙虾的宪法,它在每次对话的时候啊,就每一次绘画的时候,它都会加载到上下文里面,所以它直接影响这个模型的决策行为啊,它的文件路径在这 啊,这是我的搜索文件,我做了一个截屏啊,贴到上面不全啊,这个会演示的时候有全的啊,然后这是 agent 文件,这个在哪地方? agent 文件就是你的员工啊,他的执行执行手册,让他干什么啊?具体干什么要在 agent 里面给他安排啊, 然后这是下面就是我的 agent 这个视力啊,这也是我截屏下来的啊,那个看一下。呃,因为这是刚才讲的比较理,理论化,我们我们现在就演示一下具体实操,演示一下,大家看一下怎么修改, 我们演示一下怎么这个修改这个你的小龙虾的这个四五点, md, 或者说 agent md 啊,你看我现在下了这个命令啊,其实就是对话中下的,只要是说话就行了,让他去自己修改啊。回车, 因为这修改过程比较慢,我们先啊,中间你看他十几分钟在执行任务,我们就没录,我们看一下他最后的执行结果啊,你看修改了,这个看 so 文件已经修改了, a 帧的文件也修改了 啊,这是修改 so 和 a 帧的文件的。呃,最简单的方法,你就告诉他怎么修改,他就会给你修改了啊,当然他执行了很多任务,我们就不录了, 我们再演示一下这个修改 solo 文件的第二种方法就是我提前写好自己的 solo 文件啊,你看这是我自己提前写好了啊,用记事本写,用 word 写好像不行啊, word 写以后它的这个缩进贴进去,缩进就会改变,我就一般都用记事本或者写字板写啊, 我就是简单的展示一下,这是我写好的这个这个,呃, solo 文件啊,我们可以用 ctrl a, ctrl c, ctrl a 就 全选 ctrl c 就是 复制, 然后我们贴进去啊,然后给他输个命令啊,是否加加回车啊?输入输入按照以上 啊,你看我把刚才这个自己修修改好的这个所有文件啊,全部都写进去了,写进去给他就输入到对话框里面,然后你给他这个命令,按照以上内容全面覆盖所有文件,回车啊,就行了,他就开始把你的所有文件呃,全部修改了, 当然你的 a 帧的文件也可以这种方式修改,这种方式修改的好处就是你可以体系化的,系统化的修改所有文件。那你要是我们说不会拿所有文件怎么办呢?我给你演示一下怎么拿所有文件啊, 啊,我就让他把全部内容啊都输出到对话框,好,他执行过程我们就不录了,还挺长的啊。我们接着刚才那个演示,你看他把这个 solo 文件给你全部打印到这个屏幕上了,或我们就要输出到屏幕上了啊,我们就可以可以可以复制他啊, 把这个复制下来,你就选中他,然后拉到最底下复制下来 啊,复制贴到你这个你的这个记事本上,电脑上的记事本上啊,你在基本上修改完了之后 你再回贴给他,回贴了之后呢?你就说你按照我这个全面覆盖了这个 so 文件,因为我不太会这个修改单项,修改单项 要放到合适的位置,也可以修改单项,你只要是一个确定的不冲突的这个你让他给你添加进去也没问题啊。就我们今天演示一下 so 或者 agent 文件怎么怎么改写啊。

如果你现在还在花大量时间研究 skill 点 md 该怎么排版,那你很可能已经在一个快过时的问题上越卷越深了。 google cloud tech 转的这篇文章,表面上是在讲五种 agent skill 设计模式, 但它最值得先听懂的一句话,其实不是任何一个模式名,而是格式。问题。已经差不多结束了,作者说的很直接,现在已经有三十多个 agent 工具在共用同一套 skill 点 md 规格,像 cloud code gemini c l i cursor 这些工具,外层长得越来越像, 也就是说,你再去纠结 v a m l 怎么写目录,怎么摆 references 和 assets, 怎么命名,这些事情已经不再是分水岭了。真正的分水岭变成什么是内容设计, 也就是同样一个 skill 点 md 外壳里面到底放什么逻辑,用什么资源,怎么让模型只在需要的时候加载对的内容? 作者举了一个很典型的例子,一个将模型写 fast api 的 skill 和一个四步走的文档流水线 skill, 外面看都长得差不多,但里面的设计完全不是一回事,一个更像知识封装,一个更像流程控制, 问题根本不在格式,而在内容结构。接着文章先回顾了 google adk 的 skill toolset 三层结构,第一层是 list skills, 只给模型看到 skill 名字和 description。 第二层是 load skill, 模型需要的时候再把完整指令拿进来。第三层是 load skill resource, 只有真正要读参考文档模板或资源文件时,才去按需加载。这个设计背后的核心逻辑很重要,叫 progressive disclosure, 也就是渐进式批录, 先给少量信息,让模型自己决定什么时候再往下拿更多内容。作者甚至直接给了一个量化判断,每个 skill 在 启动时大概只多带来一百个抽肯左右的描述成本。真正重的部分,不应该一开始就全部塞进上下文,而是按需再读。 你看到这里就会明白, skill 设计的关键从来不是把所有规则一口气塞满,而是先把入口做清楚,让模型能找到它,再在需要时拿到更深的内容。所以文章一上来,就先抛出两个最常用也最容易上手的模式。第一个叫 tool wrapper, 它本质上是给某个库、某个框架、某个内部系统封一个即时专家包,比如 fast api、 terraform、 数据库查询规范、安全策略。 这些东西模型不是完全不会,但你希望它在处理这个领域问题时稳定遵守你团队的那条规则, 那你就把这些规范放进 references 里,让 skill 在 需要时加载。这个模式最值钱的地方是把专家经验从系统提示词里拆出来,变成按需调用的知识包。第二个叫 generator, 这个模式不是让模型变专家,而是让模型稳定产出固定结构的东西, 比如技术报告、 api 文档、 commit message, 或者你们团队自己的 agent scaffold。 它通常会同时用到 assets 和 references, assets 里放模板, references 里放风格规则, skill 自己负责把流程串起来,先加载规则,再加载模板,再补齐全的信息,最后按固定格式吐结果。你会发现它和 to rapper 的 差别很大,前者解决的是按什么规则做,后者解决的是按什么结构产出。 所以第一集真正要记住的结论只有一个,现在做 skill, 别再把精力放在格式上了。真正拉开差距的是你能不能先判断这个 skill 到底是在封装知识,还是在稳定产出。如果这一步都没想清楚,你后面写的再规范也大概率只是一个看起来很标准的空壳。 下一集我讲剩下三个更狠的模式,因为从第三个开始, google 讲的已经不是怎么给模型补知识了,而是怎么让模型按标准审查先问再做,甚至被强制卡在一个不能乱跳步的流程里。