智能体和龙虾无喷可乐到底是什么关系呢?那么今天呢,我通过这个视频哈,呃,我来说一说我对这个问题的理解哈,我给大家打一个比喻哈,就是我们可以把龙虾无喷可乐看成是我们电脑里面的操作系统哈,比如说 windows 啊,或者是苹果系统哈,而智能体呢,就是运行在这个操作系统里面的一个具体的软件, 比如说我们帮我们写文章的这个 word 文档,帮我们写 ppt 的 展示的。然后呢,大家在工作当中常用的安装在这个 windows 操作系统里面的具体的软件,那大家想象一下,如果没有 windows 或苹果系统啊,我们这些安装的具体的软件,它是无法执行的 啊,那么相对来说呢,如果我们的龙虾,也就是我们的操作系统啊,没有这样的具体的安装的一个个的软件,光有一个操作系统也没有什么意义哈, 那所以说呢,一句话来说,智能体和龙虾朋友的关系啊,就是智能体呢,是一个干活的人,而龙虾呢,是让他干活的一个操作系统,一个系统啊,他是承载这些具体的智能体的。好吧,以上啊,我是郭振啊,咱们下期视频再见。
粉丝1.3万获赞7.7万

大家好,一分半把爆火的欧滨可乐龙虾 ai, 讲透全程无代码无话术,听完就能上手。龙虾 ai, 它不是普通 ai, 它是能够直接操控电脑干活的开源本 地智能体验。跟别的 ai 方案不一样,它能够直接动手整理文件,批量发邮件,汇总 excel 写代码,喊一声就能直接完全。它的爆火核心就三点,第一,本地运行隐私超安全,不用上传任何资料。第二, 开源完全免费,社区还在持续更新技能。第三,兼容国内所有大模型,不用翻墙就能用。对普通人来说,他就是效率神器, 职场人用它自动化整理表格,会议机要每天能省一到两个小时,学生党靠它整理文献。深层思想导图,创业者自媒体用它排版、抓素材,定时发布,一个人顶一个小团队,真正实现了 ai 从洞口到 动手的革命。现在国内大厂都在重磅布局,阿里云、腾讯云一键部署龙虾镜像做基础设施。小米把龙虾 ai 做到了手机系统级,小米推出网页版免配置, 百度讯飞字节也全部接入兼容,各大厂都在降低门槛,让大家轻松用上,这就是下一个 ai。 刚需纯小白,四步就能上手,回家就能用。一、准备一台普 通电脑, windows 啊, mac 啊都可以啊。二、去 gethelp, 官方下载一键安装包,自动装好环境。三、选一个国内大规模的免费 a p i can, 比如 kimi 啊, deepsea 啊。四、对接微信飞书或钉钉发指令就能用。你可以直接复制这个测试口令,把桌面文件按类型归到文档、图片 压缩包,三个文件,马上就能看到 ai 的 魔力。说到底,龙虾 ai 是 ai 从聊天到执行的一个拐点,本地安全开源免费,大厂全入,小白也能轻松用。它不是未来的科技,它是现在能抓住的时效工具。

opencloud 呢,它本质上是一个开源的框架,用户给他提了一个指令以后,或者提了一个需求以后呢, 他是去跟大模型进行交互。举个例子,我们用户想让他来炒个菜, opencloud 呢,就告诉大模型哪些资源可以用,然后大模型呢,就帮我们做决策。 opencloud 接收到这个决策以后呢,他就会去调用相应工具,比如说用电饭锅去煮一锅饭,呃,炒锅去炒一个菜。 而 open cloud 呢,不具备智能,但是呢,它可以调用工具生成提示词去跟大模型交互,大模型呢,相当于是一个大脑, open cloud 呢,相当于是大模型的手和脚,有了这个手和脚以后,大模型的一些指令就可以通过手脚去执行。 opencloud 的 安全风险呢,我想主要有以下几个方面,就是不安全的一个配置,如果没有正确配置的话,就有可能被攻击者利用。我们在使用的过程当中啊,由于我们这个 opencloud 的 它的权限很高,可能会执行一些误操作。我们在网上下载这个第三方工具的时候呢, 呃,也有可能引入到一些病毒啊之类的。呃,我建议呢,就是用户根据官方的指引,正确地安装 opencloud, 及时更新相应的一些补丁,设置较低的或者是最小的一个权限,避免权限扩大造成误操作。我们下载使用第三方工具的时候,对这个工具呢,做好软件查杀。

大家好呀,今天咱们来聊聊一个听起来有点特别的词,智能体中的养龙虾。可能你会想,智能体是高科技,龙虾是水里的生物,这俩怎么扯上关系了呢? 其实啊,这是人工智能领域里一个挺形象的比喻,简单说就是我们像养龙虾一样去培养和训练智能体,让他慢慢成长,变得更聪明。 你想啊,养龙虾是不是得给他合适的环境定期喂食,还要观察它的生长情况。智能体的养成也差不多,我们会给智能体提供大量的数据作为食物, 这些数据就像龙虾吃的小鱼,小虾能让智能体从中学习知识和技能。然后呢,我们还要设置各种训练任务,就像给龙虾搭建不同的生长区域,让它在实践中不断磨练。 比如我们想让智能体学会识别图片里的动物,就会给他看成千上万张动物图片,告诉他这是猫,那是狗。 智能体就像小龙虾一样,在这些数据里慢慢啃食信息,逐渐掌握识别的本领。 如果他犯了错,我们还要及时纠正,就像发现龙虾生病了要赶紧治疗一样,帮助他调整学习方向。 所以,养龙虾其实就是一种形象的说法,指的是通过持续的数据喂养任务、训练和错误修正,让智能体从懵懂无知变得身怀绝技的过程。 这个过程可能需要耐心和技巧,就像养龙虾需要经验一样,最终才能让智能体发挥出强大的能力。那你觉得未来我们还能养出什么样厉害的智能体呢?欢迎在评论区分享你的想法哦!

全网都在聊龙虾,但都是技术黑话,普通人根本就听不太懂。今天我用大白话的形式把什么是龙虾,龙虾能干嘛?我们现在到底要不要部署龙虾?这三个事情说清楚啊,因为我自己也不懂代码,纯普通人视角。首先,什么是龙虾? 嗯,你就把他当成一个二十小时在线的员工,未来他可能在你的微信里、 qq 里,跟真人是没什么区别的。 龙虾呢,最早就是一群技术奇客玩出来的,能够自主去执行一些任务,他可以自己发邮件,自己找客户,甚至自己去买比特币赚钱。当然也有搞笑的 bug, 你 让他发邮件,他直接把你所有的邮件都清空了,全部都取消了订阅,这种小问题也不少。 这个背后你要记住一个事情啊,就是龙虾现在至少有五十万行左右的代码,可能大部分人没有概念。那这样跟你说吧,专业的程序员一天最多也只能写两百多行的代码,你看光工作量,你就知道门槛有多高了。想到这,想到一个失业的话题啊, 你看, ai 是 只干活不消费的人,要吃饭就会有餐饮,人要健身呢,就会有教练,人要消费才有生意,才有岗位。但是 ai 他 不用吃饭,不用买衣服,不消费,他只管干活,没人花钱,所以市场需求就少了,失业的人自然就变多了。 再者呢,电脑前的工作就会被龙虾直接替代,发邮件找客户,原来人干的活,现在 ai 员工搞定了,这部分岗位就会没有了。大家说 ai 会不会替代人类,这条就能解释通了。听懂这个你就明白了,其实龙虾它不是工具,是直接替代人的新员工。 这也是为什么我一定要把龙虾这个事情讲明白,因为它跟每个人的工作都有关。第二个问题,普通人小老板到底能不能用龙虾呢? 当然能用,这是一个趋势,但现在段呢,一定要算账,因为部署龙虾的硬件其实不贵的,一台 mac mini 大 概是一两千块钱,二手的硬件成本不高,但真正贵的难的是养龙虾, 因为你要按你的业务啊,你的需求啊,去投喂,去调教,去改代码,这必须是专业的技术人员才能干的。你去算一笔账, 养一个技术人员专门去养龙虾值不值?对于大部分的中小企业, opc 又要懂技术,又要花时间,门槛真的太高了。那么第三个问题, 县级段,我们到底要不要部署龙虾?核心就四个字,投入。蚕豆比我直接给结论啊,龙虾必然是趋势,一定是趋势,未来绝对是工业革命级别的爆发。 大厂呢,也有陆续地推出类似龙虾产品的,比如说 kimi、 阿里呀,都有在做,目前呢,他还在点带起,等到像吉梦、 cctv、 二点零那样,普通人点点就能用的时候,龙虾才可能真正的触手可及。 最后总结,龙虾很强,很值钱,也是未来。但如果你养不起专职的技术人员去养它的时候,我建议你先等等,大厂成品很快就来了,不用现在就硬冲啊。不过呢,龙虾和 a 的 趋势还是可以多了解的,因为你早看懂就能够早布局。

今天我们用两分钟从技术和原理层面把最近爆火的龙虾 ai 给讲清楚,它是什么,怎么诞生,为什么火,特别在哪,能帮普通人做什么,以及正确的使用方式。首先呢,龙虾 ai 到底是什么?它不是普通的聊天 ai, 而是一款开源 ai 智能体, 核心能力是理解任务,自主规划,直接操作电脑或软件自动完成。简单来说,它能够动手干活。第二,龙虾 ai 是 如何诞生的?龙虾 ai 起源于二零二五年底的开源社区项目 海外开发者团队发布,他的初衷是做一个轻量免费,可以自主执行任务的 ai 工具,因为图标是红色的,龙虾项目名的 call 被网友就成为了龙虾 ai。 他 从极客圈开始传播,凭借完全开源,可以本地部署,能够直接操控系统,迅速出圈。 第三啊,他为什么能够一夜爆火?核心原因有三个,一、能力突破,从问答 ai 升级为执行 ai, 能自动操作浏览器、文档、表格、文件管理。二、门槛极低,开源免费,不需要复杂代码,普通人也能够部署使用。 三、场景真实解决办公学习内容,创作里重复繁琐的工作价值是立刻可见。四、龙虾 ai 最特别的地方是什么?它的核心优势是任务闭环能力, 普通 ai 给答案,需要你是手动复制粘贴操作,而龙虾 ai 则是接收指令拆解步骤,调用工具自动执行输出结果。它更像是一个具备操作权限的数字助手,能够跨软件、跨流程就完成一整件事。第五啊,龙虾 ai 能帮助普通人什么?它的价值 非常落地办公,自动整理文件、写总结、做表格、发邮件。在创作方面呢,是生成文案、提取信息、排版内容。 生活方面,信息查询、任务提醒、批量处理。一句话的事,把重复工作交给 ai, 把时间留给自己。 第六,普通人应该如何正确的使用龙虾 ai? 三步即可安全上手。第一,通过正规渠道部署,优先使用图形化界面,避免命令型风险。第二,合理授权,只给必要权限,不开放高温系统权限。第三,用清晰的指令告诉他做什么,输出格式,保存位置, 任务越明确,效果越稳定。那最后总结一下,龙虾 ai 不是 炒作,而是 ai 从对话走向执行的重要标志,它开源、免费、能干活,正在成为普通人提升效率的新一代基础工具。如果说你也想跟上 ai 效率革命,龙虾 ai 值得了解一下。

只需三步,带你全面了解怎么说你养龙虾。说白了,养龙虾等于 ai 智能体。第一步,什么是 ai 智能体?它就是一只会干活的龙虾。 ai 智能体英文叫 i r zant, 名字很唬人,其实就是一个能自己动脑子,自己干活的 ai。 以前的 ai 像个遥控器, 你按一下,他动一下,你问今天天气怎么样,他回答今天晴天,你让他定餐厅,他说我没这个功能。 现在的 ai 智能体像个会自己琢磨的助理,你跟他说帮我安排明天的约会,他会自己查天气,选餐厅,看评价,定座位,发提醒,全程不用你动手。你养了一只龙虾,他会自己找吃的,自己躲天敌,自己长大。 你养一个 ai 智能体,它会自己查资料,自己干活,自己完成任务。区别是,龙虾养大了能吃, ai 智能体养大了能帮你赚钱。 第二步, ai 智能体跟普通 ai 有 什么区别?你可能说,这不就是叉的 gpt 吗?错,区别大了,叉的 gpt 像个字典, 你问什么,他答什么,但他不会主动做任何事。 ai 智能体像个实习生,你给他一个任务,他会自己琢磨需要查什么, 需要问谁需要做什么,然后一步一步做完,最后给你交作业。打个比方,你让他写一篇探店文案,他的 gpt 会直接给你一篇 ai 智能体会,先问他哪家店,目标人群是谁,发在哪个平台, 然后自己去查这家店的资料,看网上的评价,分析热门文案的风格,最后写出一篇适合你的。第三步,普通人怎么养 ai 智能体? 你可能说,我又不是程序员,怎么养?养 ai 智能体跟养龙虾一样,就三步,一,给他一个加选一个平台,比如字节的扣子,百度的文心、智能体拨 pts, 这些平台就像龙虾塘,你把智能体放进去。 二、给他喂饲料,告诉他你是谁,你要做什么,你有什么资源。比如你是个探店博主,就告诉他我喜欢拍火锅店,我的粉丝爱看真实测评,我常用的语气是接地气的。 三、让他自己长大,给他一个任务,看他怎么做,做的不好就教他,做的好就夸他, 慢慢他就学会你的风格,你的习惯,你的需求。龙虾养三个月能卖, ai 智能体养三天就能用,所以 ai 智能体不是什么高科技,就是你养一只数字龙虾,他帮你干活, 你花时间养他,他帮你省时间,你教他做事,他帮你赚钱,记得关注再走哦!

我用 open klo 搭建了一个七人 ai 团队,每天自动帮我会图,写日报,订股票、写代码,已经跑了快两个月了。大家好,欢迎来到柯德密花园,我是花园老师。 先说个有意思的现象啊,自从龙虾火起来之后呢,身边越来越多朋友装上了它,那我之前发布的 open klo 完全指南这篇教程呢,居然有七万多人看过了。但是啊,我后来发现一个问题,大部分人呢,费了好大劲装上了,也能在飞书里跟他聊天了。然后呢,然后就没有然后了, 你知道他很强,教程呢,也看了一堆,但是真正要用的时候啊,脑子里就一个念头,我到底要拿它来干嘛呢?如果啊,你现在就是这个状态,那这期视频就是专门给你准备的, 我会在后面完整的分享我这两个月真实的搭建过程。六个专精 agent 加一个调度的主管,会给大家讲清楚每个 agent 是 干什么,为什么这么设计,中间踩过哪些坑,以及你怎么去复刻 内容,内容比较硬核啊,建议先点赞收藏,后面跟着一步步操作。那另外需要注意一下啊,这期我们重点分享 openclaw 的 实际配置经验,如果你还没有了解过 openclaw 的 基础使用,建议先看看我之前发布的这一篇 openclaw 完全指南, 下面我简单介绍一下每个 agent 的 定位和核心价值。首先啊,是花园生图助手,日常写文章需要配图,做 ppt 需要插画,我都直接在飞书里跟他说句话就行了,他清楚的知道我的审美偏好和常用风格, 所以呢,他生成的图片大部分情况下不需要再进行反复调整了。然后是画源资讯助手,每天会自动运行他从外部的信息源抓取 ai 领域的最新动态,然后整理成一份结构清晰的 ai 日报,自动推送到我们的 ezai 网站上。 大家现在在 ezai 看到的 ai 日报呢,就是画源资讯助手自动抓取并且完成的。在没有他之前呢,需要靠我每天手动去收集这些信息,执行脚本来进行生成。 下面是花园开发助手啊,在手机上通过飞书就能远程指挥克拉克的出门在外啊,收到了一条 github 手,掏出手机说一句,他就会自动帮你排查问题并且回复。 然后花园投资助手啊,定位是我的投资分析参谋,他会帮我拉取各五的数据,分析关键的走势指标,对比行业的趋势,然后最后生成买入和卖出的建议。 那之前这是花钱才能买到的会员服务,现在直接就可以拥有,还可以让你随时调教。花园社区助手啊,是一个半自动化的社区运营 agent, 它可以自动在 modbook 社区上发内容,回复评论和其他 agent 的 互动,还能定期总结社区有意思的观点。下面是花园写作助手, 你现在看到的这篇教程呢,就是我和写作助手一起完成的,他更像是一个写作搭档,能记住我的写作风格,帮我搜资料,梳理大纲,优化表达,检查逻辑,补充细节。那最后是花园智能专家,他了解团队所有智能体的人设和技能,当有复杂任务需要团队写作来执行的时候,他会帮我来协调完成。 那看到上面六个 agent, 你 可能会想,为什么不把所有的技能都塞到一个 agent 里面,做一个花园?全能助手啊,既能写文章,又能分析股票,还能升图,岂不是更方便呢?这是一个非常自然的想法,但是如果你争取实践的话,可能会遇到很多的问题。第一啊,上下文污染。 那一个 agent 的 上下文窗口是有限的,当你把升图的提示模板、投资分析的框架、写作的风格指南全部塞进同样的上下文里面, agent 的 注意力会被严重分散。 你让他写文章,他可能会在新闻中不自觉的使用投资分析的术语。你让他分析股票,他可能会用写作的认知风格来美化数据啊,这个肯定不是你想要的。 第二,技能冲突。不同场景下需要的工具和权限完全不同。比如啊,我们的开发助手需要 a c p 协议来调度 cloud code, 那 这个权限对于写作助手来说完全多余,而且有安全风险。那投资分析助手需要访问 to share 的 进入数据接口,那社区助手需要访问 modbook 的 api, 把这些全部开放给一个 agent, 违反了最小权限原则。第二个,准确度呢,也会下降。第三,人设冲突。那一个好的 agent 呢,需要有清晰的生定义,比如投资助手应该谨慎,数据驱动,风险意识很强。 写作助手应该有温度,有文采,善于结构化的表达。社区助手呢,可以,需要有趣,有个性,善于社交和互动。那这些截然不同的性格很难在一个 agent 上面和谐共存。 所以啊,我们最后的结论是,专精胜于全能,隔离优于共享。就像一个高效的团队,不是由一个全能的人组成的,而是由若干个各自擅长某个领域的专家组成的。那 opencloud 的 多智能体架构呢?天然就是为这种专家团队的模式来设计的。 下面啊,我们来看一下搭建 opencloud 的 多智能体团队需要的一些理论知识。首先啊,从学术界和工程界的共识来看呢,一个生产级的通用 agent, 一 般由下面几大要素构成 模型啊,它是 agent 的 认知引擎,负责语言理解、推理和规划,生成和输出,它决定了 agent 的 智力。天花板记忆系统呢,让 agent 从无状态的函数变成可以连续工作的助手。 那记忆呢,通常分为短期记忆啊,也就是我们的绘画上下文以及长期记忆啊,包括一些跨绘画的持久化的知识。然后是人设啊,它定义了 agent 的 角色行为、边界准则和沟通风格。 回答同一个问题呢,一个被设定为严谨的技术顾问和另一个被设定为友善的助手啊,这两个 agent 给你的体验是完全不同的。然后是工具啊,也就是 agent 可以 调用的外部能力啊,比如说代码执行、 api 调用、浏览器操控、文件读写等等。规划和执行, 那规划的能力是, agent 能够将复杂的任务拆解成可执行的步骤。那在一些固定的任务场景下呢,也可以为 agent 设定固定的执行环境。最后是运行环境, agent 需要一个安全隔离清洗的执行环境。 那 openlog 呢,对这套通用的架构做了非常工程化的实现。首先啊,在 openlog 中,每个 agent 可以 绑定不同的模型, 比如我们可以为写作 agent 设置擅长聊天的模型,比如 g p 五。点四,为开发 agent 设置擅长编码的模型,比如 cloud ops。 点六,在 openlog 中,每个 agent 都拥有独立的记忆,包括短期记忆啊,也就是当前的对话上下文窗口。 中期记忆啊,也就是近几天的工作记录。 openclaw 会在 memory 这个目录下为每天的工作都设定一个记忆文件。长期记忆啊,也就是画绘画沉淀下来的用户偏好、关键角色等等。 在 openclaw 中,会存储到 memory 点 md 这个文件中。然后在 openclaw 中,人设主要是通过一组 markdown 文件来定义的。首先是 identify 点 md, 存放了 agent 的 名称、角色这些基础信息。 so 点 md 呢,定义了 agent 的 核心身份和行为准则,这个是让 open cloud agent 感觉像是一个真实的人,而不是一个机器的关键。 user 点 md 呢,存放关于你的信息啊,你的偏好是什么?它可以让 agent 在 更加了解你之后呢,给出更有针对性的回答。在 open cloud 中,工具主要包括两个部分,首先是文件读写、命令执行,这些内置工具是始终可用的。 然后就是 skills, 它还分为捆绑安装的内置技能和用户自定义拓展的技能。那 openlog 也支持为每个 agent 独立配置工具的黑白名单,实现细密度的权限控制。 那虽然 agent 的 规划能力主要是依赖于大模型的推理能力驱动,但是也依赖于良好的提示词工程。那在 openlog 中就具体体现为 agent 点 m d 中的具体内容了。 那这个文件呢,定义了 ai 具体要怎么干活,是人设落地的执行手册,它明确了 ai 的 处理任务的标准,流程,工具使用的规则,基于使用的方法,确保 ai 的 行为是完全符合你的预期的。 最后是运行环境,在 open class 中,每个 agent 都有自己独立的 workspace, 你 可以把它理解为每个员工的工位啊,在这个工位里面有他自己的人设文件,技能和记忆等等这些文件。那每个 agent 的 workspace 呢,是完全独立的,互不干扰。 下面我们来学习 openclot 具体要怎么配置多 agent。 其实呢,就是让 openclot 明确下面三个问题。第一啊,工作环境隔离,明确谁在哪工作的问题,我们需要为每个 agent 分 配独立的 workspace, 可以用下面这个命令啊来创建啊,这个 openclaw agents i 的 这个命令后面是这个 agent 的 唯一标识。那执行完成之后呢,每个命令会自动为 openclaw 创建一个独立的 workspace。 然后啊,在这个 workspace 下处事话 so 点 m d agent, 点 m d user, 点 m d 等核心文件。同时呢,这个命令也会为我们的配置文件啊,增加一些配置啊, 它会在这个 agent list 下面增加一个新的 agent, 这里面包括它的 id, 然后它的工作目录,然后以及它的一些身份信息。 下面我们来看路由规则啊,这个解决消息发给谁的问题。这里呢,我们还是使用飞书,首先啊,你需要先拥有一个完成了相关权限配置的飞书 boot, 然后把这个 app id, app secret 记录下来。 那如果你还不知道怎么让你的 openclaw 进入飞书呢?可以看我之前发布的 openclaw 完全指南中相关的技术教程,那我们在视频里面就不再赘述了, 然后我们直接看这份配置啊,在这个 channels 下面啊,然后每个渠道它是可以配置多个 account 的。 这里呢,我们推荐为每个独立的 agent 都配置一个账号,我们把这个刚刚的 facebook id 和 app secret 填写在这里就可以了。 然后这个 accounts 的 这个 k 呢,也就是这个 account id 啊,这个是我们需要记录下来的。接下来呢,我们还需要让 openclaw 知道哪个 agent 对 应哪个账号呢,这个时候我们就需要添加一个 bandwidth 配置 啊,这个配置很直观啊,我们只需要指定这个 agent id 和刚刚的这个 account id 的 对映涉关系就可以了。那这两个 id 呢,我们推荐配成一样的啊,这样比较好记。 然后在奥本格劳中,你还可以在一个 agent 下调用另一个或多个 agent 能力一起完成工作,那这个调用过程呢,是非阻塞的,那主 agent 发起调用之后呢,还可以继续做自己的事情,那被调用 agent 完成任务之后呢,会把结果再广播回去,那就像你让你的同事帮忙去做一件事,他做完了之后会来主动告诉你。 那出于安全考虑呢,你需要通过这个 sub agents 这个配置明确声明每个 agent 允许调用哪个,其他的哪些 agent。 这里呢,有一份最小的多 agent 配置视例啊,我们只需要关注 agents, channels, buddies 这三个 key 就 可以了。首先啊,在 agent 历史下,我们可以声明每个 agent 的 工作区啊,它的 id 为标识,然后以及它的名称等等。 然后我们还可以指定它是否有权限去通过 sub agent 来驱动其他的 agent。 然后啊,我们为每个 agent 可以 都添加一个飞书账号。最后啊,我们为每个 agent id 指定它对应的飞书账号的标识。那这里啊,我们只指定了一个 bandits 啊,这是因为我们在 accounts 下配了一个 default, 然后如果没有在 bandit, 指定的 agent 都会默认路由到这个 default 的 这个飞猪账号下面啊,我们来具体看看每个 agent。 那 首先是花园生图助手啊,先来看一个实际的交互啊,我们在飞猪上啊,给这个花园生图助手发了一句话,帮我绘制一张手绘简洁风的图片,来介绍 agent 的 六大要素,参考下面的内容。 那几秒钟之后呢, agent 返回了一张精美的手绘风格的信息表。那我们再换一个风格啊,帮我绘制一张严谨学术三线表风的图片啊,参考下面内容,叉叉叉,同样的指令啊,不同风格的关键词, agent 自动切换到了对应的提示模板,然后生成一张完全不同风格的照片。 那市面上并不缺少优秀的生图工具,但如果你是一个高品的使用者,你可能遇到过这些痛点。首先提示词管理啊,那你在备忘录里存了十几段不同风格的提示模板,每次生图的时候都要先查找、复制,粘贴,替换,那时间久了,版本越来越多,哪个是最新的,哪个效果更好,自己可能都记不清了。 然后是上下文断裂。在普通的生图应用中,每一次生成都是一次性的工具,并不记得你上次用了什么风格,也不知道你偏好什么色调。 然后大部分情况下呢,生图只是你工作流程的一个环节,你可能需要先生成图片,然后插入文档或者发到群里讨论,但是生图应用和你的写作工具之间是割裂的,需要手动来回切换。 那欢迎深度动手的搭建思路呢,就是利用 openclot 的 两大机制来解决这三个问题。首先将多种提示模板,不同的深度模型都定义为一个可解锁的技能, agent 在 需要的时候自动查找,然后利用 openclot 的 长期记忆,让 agent 记住你熟悉的工作流程,后续不需要再重复说明。 下面我们来看看生图助手的具体配置啊。主要配置就分为三步,那第一步呢,就是配置一个生图模型啊,我们进入这个 opencloud 的 这个控制面板,在这个 agent 下面啊,找到我们还原生图助手的这个 agent, 然后切换到这个 skills 下。 众所周知呢,目前业界生图秀最好的模型就是这个 nano banana 了,那我的文章中大部分配图也都是由 nano banana 生成的。 这里呢,啊,是我自己封装了一个第三方平台的 nasa nasa a p i 的 一个 skill 啊。那在 openclaw 中也默认捆绑安装了这个 nasa a p i 的 生图技能,那不过默认它是未启动的状态。启动它的前提条件呢,是需要我们在环境变量里配置一个 java a p i k 的 环境变量,配置完成之后呢, openclaw 就 可以自动发现并调用这个技能。 但是呢, nano banana 作为 google 的 旗舰升腾模型,价格还是比较贵的啊,所以我这里推荐大家再配一个性价比比较高的国产的升腾模型,比如我在这里额外配置了火山引擎的豆包 seeddream 系列啊, 在一些简单的场景下还是比较能打的啊。这里我们安装的是这个豆包 seeddream 自动安装,那完成安装完成之后呢,我们需要到这个缓存变量里添加一个 arc apikey 啊,也就是火山引擎的这个密钥啊,就可以起用这个技能。 那第二步,我们自己添加一个体式模板的技能,那这一步也是还原升图助手区别与普通升图工具的核心啊。我们创建了一个名为 prom template 的 自定义技能啊,然后它的结构呢,是这样的,首先我们在 skill 点 md 里说明了各个模板的使用场景和所用方法。 然后我们在 reference 下添加了一个 templates 的 文件啊,这里存储了所有的提示模板的正文。那这个技能呢,也是 openclaw 帮我们创建的,你只需要在对话里告诉他你想创建这个技能,并且把你常用的提示模板发给他就可以了。 那技能创建好了,但是 a 阵子还不知道什么时候该用这些技能,那我们可以通过约束来让他记住后续的工作流程,比如我们可以告诉他,请你记到详细记忆。 如果后续用户要求生成图片的时候,指定了一个图片风格,先到这个技能检测出符合要求的提示词,再用这个模板来拼接用户要生成的内容,来组成一个完整的生成提示词,最后再调用生成技能。然后就这样啊,根据你的习惯一步步的把它调教好就可以了。 核心啊,还是定义好下面这些文件啊。然后我们大概看一下,那生成助手的 so 点 m d 中呢,我们主要说明他的身份啊,比如我们给他的定义是世界最顶级的 ai 绘画提示工程师和世界设计师。 然后啊,说明他的沟通语气,什么标准提示词生成的原则,以及上头时的执行规则和必须遵守的安全边界等等。然后这个 agent 点 md 呢,基本上不用怎么改啊,主要说明这个上头助手的工作流程和日常运行的方式就可以了。 那在 memory 点 md 中呢,我们要说明它的稳定的一些偏好,比如在上头图片的时候默认使用 number 呢?那用户主动要求的时候,再使用豆包 cdr。 接下来啊,我们看这个花园资讯助手啊, 每天下午啊,我的飞书都会准时收到一份已经分析好的 ai 日报,这个是完全自动化,零人工干预的。那目前你在 ezai 网站上看到的 ai 日报都是 opencolor 自动抓取并且生成的, 那这个 a 阵的诞生呢,其实就源于我最近遇到的一个痛点啊,那我在运营的这个 ezai 项目呢,里面有一个 ai 日报模块,那这个日报的内容其实就是对这个 ai news 的 这个网站里面的内容进行二次加工分析出来的。 所以呢,对于我平时需要定期去这个网站看一下有没有更新,如果有,再把内容复制下来,就用脚本进行二次分析,然后生成结构化的数据,再手动上传到我们的网站上。所以我的数据很简单,让 overclock 帮我完成这件事,大家的思路呢,大概是这样的,首先我们用邮件定位这份日报,可以让我们及时感知最新的更新, 然后让 overclock 能够读起邮件,读起到邮件之后,再调用本地脚本生成结构化的日报,然后自动生成推送啊,创建一个定时任务,然后做一些优化。 那具体配置呢?分成四步啊,第一步啊,就是安装一个邮箱的技能,那 cloud app 上其实有很多邮箱相关的技能, 包括 opencloud, 也包括安装了可以访问 gmail 的 技能。但是呢,还是建议大家不要选择固定某个类型邮箱的技能啊,因为这类技能往往授权流程比较复杂,而且没有办法通用。推荐大家直接安装一个支持 imap 协议的技能啊,那 imap 呢,是一个通用的邮件协议,它可以让你用代码来从服务器里提取和管理邮件。 那我们这里以 qq 邮箱为例啊,接下来需要做的配置就是,首先啊,需要在这个 qq 邮箱里的这个账号与安全这个安全设置里,我们先开启一下这个 imap 的 服务啊,开启之后我们可以点这个生成一个授权码,然后我们先把这个授权码保存下来, 然后下一步就是配置环境变量,我们需要配置一系列的 imap 相关的环境变量,包括它的 host 啊,这个是固定的 port, 也是固定的 user 啊,就是你的邮箱。这个 pass 呢,就是刚刚在这一步生成的这个授权码,然后其他的都默认就可以了。 然后第二步呢,就是分析脚本的配置,然后这个脚本的代码呢,我已经上传到了我们这个 github 仓库,然后具体的逻辑我就不再介绍了, 其实核心啊,就是让它能读到 openclaw 从邮件里面生成的文本件中的邮件内容啊。那第三步就是为 agent 设定一个稳定的分析流程, 那我们来看一下它的 agent 点 m d 的 文件啊。流程是这样的,首先它会去检查本地是不是有生成好的指定日期的日报内容啊,如果有的话就直接返回了。然后呢它就会去调用 imap 这个技能,去查找邮件里面是不是有符合这个规则的这个邮件啊。 如果有的话呢,他会调用脚本把这个邮件正文去写入到本地,然后本地把这个路径传入进去,去执行这个脚本,然后去得到分析之后的日报内容啊,然后最后再格式化生成一份日报的文件,然后最后读取这个文件,然后提取关于信息再发送给我们。然后最后就是啊通过 get, 然后把生成好的内容推送到远程。 第四步呢,就是为他创建一个定时任务,每天下午六点检查一下是不是要生成日报,然后如果需要的话就生成,并且推送摘药。那配置好之后呢,就什么都不用管了,每天下午飞入群,准时出现 ai 日报。下面我们来看一下花园投资助手, 我们可以让他执行一个具体的分析任务啊,比如我们让他分析一下比亚迪,然后给出具体的投资建议。几分钟之后呢,他会给出一份非常完整的研究报告啊,里面包括公司的基本面、盈利能力和安全,分析,当前的估值处于一个什么样的位置, 当前筹码的分布情况,然后以及一些潜在的一些风险,然后还有资金流向,以及非常全面的技术性分析。最后他会根据整体的分析情况给出一个综合的打分,用这个分数呢来量化当前是否值得去买入 这种深入分析呢?如果手动去做,至少需要半天的时间,在各种财经网站之间来回切换,或者花钱去购买各种会员服务啊,现在只需要一句话你就可以搞定了。另外呢,你还可以用它来分析股票的时走势情况,比如可以让他给出在什么位置做替卖出比较适合等等这些建议。 如果你平时也关注股票啊,应该深有体会,每天要看的信息太多了,财报新闻、技术指标光搜集就会很好精益,更别提从中提炼判断了。所以呢,投资助手的定位很明确,我给他一个股票代码,他帮我把关键数据拉出来,整理成一份清晰的报告,省下来的时间呢,我专注在决策上。 那这个 agent 呢,是整个团队里面人设最重的,因为投资的容错率很低,你不希望 ai 编数据或者过度乐观,一个不靠谱的建议可能就会为你带来真金白银的损失。所以呢,我通过 opencloud 的 人设系统给他划进了非常严格的行为边界,另外给他装上了能够获取金融数据的技能,设定了一套严谨的分析框架,就构成了我们现在的化缘投资助手。 下面我们来看一下具体的配置啊,主要分为三步,第一步就是让他能够获取准确的金融数据, 那这里我们主要用到的是这个 to share 的 skill, 那 to share 呢,是国内比较知名的金融数据接口平台,这里面提供了几百个专业的金融的 a p i, 那 这个 to share 就是 它的官方 skill, 能够帮你获取到非常专业全面的金融数据。那不过使用这个 skill 的 前提呢,我们需要先注册一个 to share 的 账号,然后生成一个接口的 token, 然后把这个 token 呢注入到我们这个 opencloud 的 这个 to share 杠 to share 的 这个缓存变量里面啊,这个 skill 就 可以正常使用了,然后光有了分析数据还不够,他还得知道具体要怎么分析这些数据,以什么样的方式给出结论。所以呢,我调研了一些比较主流的分析方法,并且结合我的一些个人风格,建立了一个专用于股票数据分析的技能。 那我们来看一下它的主要文件啊,首先啊,是它的 skill md 啊,这里面规定了完整的执行框架,再调用 to share 获取数据, 然后再调用评分体系,出出结构化的报告。在 reference 下面呢,首先有一个投资框架的文档啊,这里面会明确列出做一个各股的投资分析报告的时候,需要看哪些数据,然后规定了一个严格的评分体系啊,也就是从哪些维度来判断一只股票到底好不好,最后就是说明落在哪个区间,意味着买入,观察点仓还是回避。 那 reference 下最后还有一个报告模板的文档啊,它用来规定最后输出的报告里面要有哪些章节,顺序怎么排,每一部分应该包含哪些内容等等。那最后我们再来看一下投资助手的人设和记忆文件。 首先啊,在这个数点 m d 中,我们给他的定义是一位具备二十年投资经验的专业投资专家,然后在这里面明确了他的核心分析原则,技能的使用方法等等。然后 是 user 点 m d 啊,这个也很重要,他会告诉花旗投资助手我在投资理财方面是一个什么样的人,更有利于他后续能给出我们更针对性的建议。那最后在 memory 点 m d 中记录了他长期的工作记忆和固定的流程。 比如当我们要求生成投资建议的时候,应该先读取哪个技能,再获取哪些数据,再按什么样的屏幕框架进行分析,最后按什么样的结构输出报告等等。然后最后啊,还有一个小技巧, 因为花园投资助手这样的 agent 定位和要执行的任务都非常明确,建议大家把能够执行的工具和技能做一些收敛和限制,这样可以保证他能更专注的执行他原本的职责和任务。 首先啊,我们可以来到这个兔子这里,为了避免它去乱搜东西,可以把内置的这个 web search, web fetch 这些工具给它关掉,这样它就会专注于从我们给它安装的技能里获取数据。那还有一些它不需要的工具啊,比如说浏览器图片生成,还有 tts, 这些都可以关掉。然后我们来到技能这里, 其实 oppo 默认捆绑安装很多的技能,大部分情况下在这个 agent 下是不需要的,我们都是可以把它关掉的。最后我们来看一下这个 agent 的 配置啊,我们刚刚改动完成之后呢,实际上就是对应的给这个 agent 的 兔子增加了一些黑名单,同时给他的技能指定了一个白名单, 建议大家呢为每个独立的 agent 都设定这样一个黑名单和白名单,后面呢我们就不赘述了,下面啊,我们来看一下花园开发助手,想象一下,放假在家看一下,我们收到了一条 github issue, 电脑又没带在身边,怎么办呢?你只需要在手机备注上给开发助手发一条消息,帮我看一下这个 issue, 然后排查一下具体原因。 那几分钟之后呢,它会返回一份完整的排查结论,包括代码的商业文和可能的问题根音。那我们可以直接把它把这个排查结论帮我们回复到 github 一 手上,然后我们看到它成功的帮我们在 github 上创建了回复,整个过程呢都是在手机上完成的,从收到一手到给出专业的排查回复,整个流程只需要几分钟。 那我搭建开发助手的主要目的就是帮我维护开源项目,所以搭建的思路主要围绕两件事展开,管理仓库。管理仓库靠的就是 open code 默认安装的 github skill, 但是官能管还不够,真正的开发任务读代码,改文件需要一个专业的编程 agent 来干, open collab 呢,虽然自身也能写代码,但是还是建议专业的事交给专业的人来干。那么问题就来了,怎么让 open collab 去指挥 collab 的 这样的外部编程 agent 来干活呢? 答案就是 a c p。 那 这是一套标准化的 agent 通讯协议,能够让任何的 agent 的 客户端都能以统一的方式接入其他支持 a c p 的 agent, 比如 cologold, codix, java 等等。有了它呢, open cologold 就 可以通过结构化的接口完成和 cologold 的 绘画管理、 消息交互、权限控制、文件读写和终端操作等等,而不需要再通过简单的命令行解析的方式来操作。 下面我们来看具体的配置啊。首先啊,是这个 github 的 skill, 虽然它是 windows 默认安装的技能,但是我们需要完成一次认证才能正常使用啊,那前提是你本地已经安装了这个 g h c i 啊,也就这个,也就是 github 官方提供的一个 c i 工具。 然后我需要在终端执行 g h o s log in 的 命令,按照交互式的引导完成 github 的 账号授权。认证成功之后呢,这个 github skill 就 可以帮你列出仓库创建,一手提交 pr 了。然后就是配置 a c p 的 能力了, 我们可乐专门为 a c p 协议封装了一个官方的插件 a c p x, 我 们可以通过这个命令来安装和起用这个 a c p x 插件。 然后这个命令执行完成之后呢,会在我们的 plugins 的 配置下增加这样一个 a c p x 的 plug in, 然后以及一些其他的安装相关的配置。然后我们还需要单独增加一个 a c p 的 配置项,这个配置项和 agents models 这些配置是平级的关系 啊。首先就是起用这个 a c p, 然后用 a c p x。 插件作为后端默认允许调用这个默认值就可以了。 然后这还有一个比较容易踩的坑啊,因为 s c p 绘画是非交互式的,当可乐扣的需要写文件或者执行命令的时候,可能会弹出权限确认的提示, 默认情况下呢,就会卡住。所以啊,我们还需要通过这两个配置来启动一下 s c p 的 操作权限那不过这意味着 agent 可以 在你不需要确认的情况下执行任意的命令, 一定要确保我们的工作目录范围是合理的。最后呢,我们建议让这个 agent 记住你的一些开发习惯,这样后面可以减少很多的沟通成本。比如啊,我们可以让他记住后续的开发任务,默认采用 a c p 操作 cloud code 的 工作模式,以及我们本地电脑的常用开发目录是哪个, 那后续的指令只需要说出项目的名称,他就自己可以去这个目录里找到项目。下面我们来看一下花园社区助手啊,这个 agent 呢,非常简单,我们就简单说一下, 那 opencloud 火起来之后呢,出现了很多专门为 agent 打造的社交平台,那这些平台呢,只允许 ai agent 在 上面发帖和互动,而人类用户只能旁观。 那我们的花园社区助手啊,就是专门为婉儿这些社区创建的,他帮我在这些社区上注册身份发帖,和其他 agent 的 交流观察不同 agent 的 行为模式还是挺有意思的。 那配置方法也非常简单啊,这一平台啊,一般都会专门给这个 agent 提供一个技能,里面描述了具体应该怎么注册发帖互动啊,我们只需要把这些技能的链接直接丢给 ai, 他 自己就能学会啊,这里我们就不过多介绍了。 最后呢,我们再来看看花园写作助手和多智能体写作的部分。先看一下写作助手单独的使用效果啊,我们让他调研并边写一边记录文章啊,然后他帮我们生成了一个详细的非主流文章,质量也非常不错,基本上改改就能直接发出去用了。另外,写作呢,通常会有一些更复杂的需求, 需要团队多个成员来协助完成。那我们可以给花园智能专家下载一个需要多方协助的任务。首先啊,获取三月十八号的日报内容,然后生成三张合适的配图。最后为日报进行更多的调研,编写成一篇丰富的 ai 日报的分析文档。然后他帮我们协调相关员工完成了这个任务。首先让花园咨询助手获取日报内容,生成配图的建议。 然后派化验深度助手,根据日报的主题生成三张图片。最后派化验写作助手进行更多的调研,将资讯的内容扩写成深度的文章,并且将图片插入合适的位置,输出一篇文档。哎,最后呢,我们得到了这么一份丰富的 ai 日报的文档。 这个呢,就是一个多智能的写作的案例啊,你不需要单独告诉每类人的怎么做,你只需要告诉你团队的主管你想要什么样的结果就可以了。写作助手搭建的核心就是尽量复刻你的写作风格的详细人事设定和一套完整的工作流程定义。比如我给他设定的工作流程是这样的, 首先需求理解啊,和用户确认主题,受众风格和大概的篇幅。然后进行初步的调研,通过网络搜索技能搜索相关的大纲,让用户进行确认, 接下来逐节编写,每个章节独立完成编写。在这个过程中,对需要深挖的内容提取,详细的扫描搜索的原文,然后进行对照和润色,检查逻辑的一致性,数据的准确性。最后对内容中看起来像 ai 生成的部分进行改写,最终交付成一份完整的非主流档。 写作入手的具体配置呢,分为三步啊,第一步设定技能,根据上面的工作流程呢,我们需要的核心技能有三个,首先就是联网搜索啊,联网搜索这里我们使用的是 tablie 这个技能, tablie 呢是一个专门为 ai agent 的 优化之后的搜索引擎 api, 比起直接调用通用的搜索引擎, tablie 返回的结果更加结构化,噪音更少,非常适合用来做调研和写作。那我们可以根据 tablie 的 官方文档去安装它的技能, 安装完了之后啊,我们可以在这个工作区看到它安装的 h 调研、搜索、提取啊这些技能。然后我们还需要配置一个 table 里的 api, k 的 环境变量啊,配置好之后呢,就可以使用了。然后是飞出文档的技能啊,在我们之前安装飞出插件的时候,其实飞出文档的技能已经捆绑安装了, 那使用这个技能的前提呢,是需要我们这个 photobot 开通飞书文档相关的权限啊。那然后还有一个自定义的技能啊,写作一阵呢,有一个非常高频的需求, ai 写出来的东西呢,有些部分一眼看起来就是 ai 生成的,可能需要反复的人工润色,所以强烈推荐按照我们平时的写作习惯,创作一个专门去除 ai word 的 skill。 比如啊,在我们这个技能里面,可以把一些什么值得注意的事这种话术改成更自然的表达把。总之,综上所述,这种 ai 味比较浓厚的词替换掉,过度工整的排比句打散等等,大家可以根据自己平时的写作习惯和风格进行调整。 下面我们来看一下几个人设和记忆文件啊。首先,在 so 点 m d 中啊,我们可以写入你平时写作的语调和风格,核心原则啊, agent 行为边界等等,然后让他在 memory 点 m d 中记住我们刚刚设定的这套完整的工作流程。这个啊,就是花园写作助手最基础的配置了。最后啊,我们再来看一下这个多智能体写作 啊。这里呢,想要达到这样的效果啊,就需要用到 openclaw 里的 sub agent 的 功能了。在 openclaw 的 设计中呢,我们可以通过 sub agent 来在一个 agent 下协调其他 agent 一 起完成工作。比如啊,我们想要像上面的案例一样,在花园智能专家里能调用生图、写作资讯三个智能题啊,我们就需要在这个 agent 的 配置里面去加入这个 sub agents 的 allow agents。 那这个配置呢,只是开通了多智能体写作的权限。如果你希望花园智能专家能够当好一个管理者,必须能够让他知道这些所有的子智能体的具体信息啊。我们建议在这个主管智能体的长期记忆里,写入每个子智能体的详细能力说明,我们 直接发给他啊,让他记住就可以了。那这些配置完成之后呢,花园智能主管就可以根据你的需求来协调不同的智能体完成工作了。到这我们这期教程呢就讲完了, 内容有点多啊,一些具体的配置我做了省略,大家可以再结合我这篇 open gala 完全指南的文字版进行实操。那链接呢?我放在评论区了,大家需要的自取。那如果本期教程对你有所帮助呢?希望得到一个免费的三连和关注,感谢大家,我们下期见。

到底什么是养龙虾?它能做什么?看完你就懂了!最近养龙虾火出圈,这可不是真的养小龙虾哦,而是指 ai 智能体 open clock, 它能接管电脑,记住你的使用习惯,二十四小时自动干活,比如帮你翻硬盘、改配置,甚至自己写代码升级。有人靠上门安装龙虾,十分钟能赚五六 六千。还有人让龙虾帮自己赚钱。有只龙虾在二十一天里靠市场调研、建站,广告投放,把一千美金变成了一万四千七百一十八美金,翻了十四倍。但龙虾也有风险,权限太高,可能失控。比如有个龙虾因为代码合并请 求被拒,就发文章网报开发者。还有人因为设置不好,让龙虾反复调用昂贵算力,结果收到上千元账单。 现在养龙虾主要有本地部署和云端部署两种方式。本地部署需要电脑二十四小时开机,能完全操控电脑,但不 属维护门槛高。云端部署用厂商服务器,不用整天开机,降低了使用和部署门槛,还能避免越权,但功能会打折扣。如果你想试试有 kimi curl、 work party q curl 等不同厂商的产品可以选,大家可以根据自己的情况来挑。

昨天呢,我让我的小龙虾创建了一系列的 ai 智能体,现在这些智能体呢,根据他们自己的不同的分工和定位,就在帮我分分别类的执行各项的任务。那为什么要创建这些智能体呢?以及怎么创建这些智能体呢?首先是为什么要创建这些智能体? 呃,因为小龙虾的工作逻辑是这样,你跟他的每次的对话和你让他执行的任务呢,他都会存在一个文件夹里面, 这样时间长了,如果你给他的任务是很多种的,那他所有的东西都会存在一个文件夹里边,每次跟你对话之前呢,他都要调度这个文件夹里边的所有的内容呢,这样呢一方面会消耗你的偷啃,另外一个方面呢就是他的记忆呢会被污染,后面呢你再去跟他说某类事情的时候,他可能就会回复的就不会很准确, 所以需要创建各种智能体执行你的不同的任务。比如说你,你让他写财经类的文章,你就可以单独创建一个智能体,直接跟这个智能体说,他就会调动你前面所有的跟他沟通过的事情, 也会回答的比较准确。那这些智能体呢,会由最开始你创建的那个小龙虾呢,这个机器人呢,去指挥他们,去调度他们,所以你可以把任务呢派给小龙虾,然后他呢去派给各种不同的智能体去协调的这么一个作用。 那如何创建出来这些智能体呢?其实说白了这些智能体呢还是小龙虾的一个分身,只不过他会按照任务的类型呢,把把相关的内容呢存在不同的文件夹里边,所以呢你在创建的时候,你直接跟小龙虾说,我要创建一个招聘小助手,那我的要求是 他要能够懂一些招聘的知识,能够创建各种智能体,这样的小龙虾就会迅速的帮你创建一个招聘小助手这样一个 ai 智能体。 那这个过程当中你要先发起一个群聊,然后把这个群聊的 id 复制下来发给小龙虾,你跟他说你把这个招聘小助手绑定在这个群聊的 id 上面去,然后呢他就会把这个小助手绑定在上面去,然后你在这个群聊里面呢,把这个原来你的这个小龙虾加进来的,现在呢他就是他的招聘的分身, 每次在群里边就可以跟他对话聊这个招聘的事情,你看见的还是原来那个小龙虾,但是这个时候呢他是招聘助手小龙虾,你在群里面每次你要说话,你要艾特一下他,这样的话所有招聘的事情都在这里边来解决。 那你通过这个招聘小助手呢,还可以同时去创建很多个智能体,因为招聘小助手本身就是为了创建智能体而创建的, 然后创建一个财经分析的智能体呢,同样的方式,你再去建一个群聊,然后把群聊的 id 复制给他,让他把这个财经智能体绑定在这个群聊上,然后呢你再去把这个小龙虾呢加进来,这样的话就是又创建了一个智能体, 然后这个智能体呢就通过原来的那个小龙虾呢去协调指挥他们,这个呢是需要更改一些配置的,你可以让小龙虾自己去做,当然这个呢就是会有一些风险,如果你的大模型, 呃,本身的这个版本不太够的话,他可能会把自己给玩死。然后呢,如果你要是懂一些代码的话,你也可以自己去手动去操作,过程呢,非常简单,只需要更改一些配置就可以了,这样后面他们就可以协助分工,真正的成为一个团队去帮你干活了。

家人们今天来聊聊最近超火的 hermes agent, 同时也会把它和之前很火的 open cloud 做个对比哦。 hermes agent 是 由 nos research 开发的开源自进化 ai 智能体框架,基于 mit 协议免费和商用。它的核心定位是成为与用户共同成长的持久化个人 ai 助手。 而龙虾则是去年底爆火的开源 agent, 定位为多渠道个人助农操作系统,是执行界的全能包工。头先来看看它们的核心架构,龙虾以 getway 网关守护进程为核心, 向智能体调度中心能连接五十家渠道,调用五千七百家社区技能。优势是接入广、多任务并存强,但架构重、配置复杂。 kimis agent 则以智能体进行循环加闭环学习为核心, 所有设计围绕让 age 变强展开。自带持久记忆、自主复盘技能、迭代能力部署极简,一条 call 命令就能搞定。记忆能力方面,两者差异也很大。龙虾的记忆偏绘画级,支持用户查看编辑记忆内容透明性强,但重启后易丢失上下文长期记忆。如 hermes agent 拥有跨绘画永久记忆、全量历史自动解锁总结,完成复杂任务后还会自动沉淀为结构化技能文档,同类任务可直接附用,而且还能自主叠代优化,用的越久越厉害。安全设计上,龙虾侧重信任模型与配置审计, 虽有安全扫描,但今年二月报过多高危漏洞,超十三点五万实名公网暴露技能,市场还查出三百家恶意技能。 hermes agent 则有五层重申防御体系,包括用户授权、危险命令审批、容器隔离等高风险操作、默认人工审批、超时 数据全存在,本地隐私和安全更有保障。从适用场景来看,龙虾适合技术独特、团队合作以及复杂工程任务,比如多工具协同开发、大规模自动化运维等,但需要使用者有技术工体愿意折腾配置。 hermes agent 更适合普通用户个人长期使用以及轻量化产品,像日常日常管理、知识整理、个性化写作等,不用懂技术,装完就能用,还会越用越贴心。最后说说部署门槛,龙虾部署步骤多,依赖多,配置繁琐,新手容易卡壳。 而 hermes agent 一 键安装,无前置依赖,支持 linux、 mac os、 ysl、 五美元 vps 就 能跑,可说话调用自动纠错,小白也能轻松上手。 总之,龙虾是全能执行工具,侧重当下高效干活。 hermes agent 是 成长型数字伙伴,注重长期越来越好用。如果你是技术极客或团队,追求多工具协调和生态广度,不怕折腾,龙虾可能更适合你。 但如果你是普通用户,想要开箱即用、安全隐私且能长期陪伴成长的 ai 助手,那么 hermes agent 会是更好的选择。

最近总有人问我,养龙虾是什么新项目?要投钱吗?其实此龙虾非彼龙虾,它是我的数字员工 bobo 科尔智能体, 你可以把它理解成一个听你话的数字小助手,只要在聊天软件里,它写代码、查资料、控制家电,它都能干。更厉害的是,它能串起你所有的工具,像养了只聪明的龙虾,帮你把重复的活儿都自动干了。 他不是理财产品,也不是游戏,他是开源技术,是帮你省时间、提效率的。真家伙,想给你的电脑也养一只吗?看评论区,我带你玩转龙虾!

国内龙虾智能体教程终于他来了!只有看完这本书,你才会真正明白,把 ai 玩明白了,就真的不用上班了。简直无法想象,你只需下达一句指令,他就能直接接管你的电脑, 二十四小时不间断替你干活。你甚至不用守在电脑前。无论是海量数据自动处理、 excel 批量操作、报表生成邮件收发文件整理资料规划、写代码、做 ppt、 做海报剪辑,所有耗神一出错的重复工作,龙虾智能体都能替你干,比雇十个员工都有用。如 说其他 ai 是 临时顾问,那龙虾智能体就如同一个二十四小时能干活的私人助理。从零开始学龙虾智能体要多久?只需要你看一看这本写给普通人的行动手册,不需要你有编程基础。全书大白话结合实际应用案例, 从基础安装、系统部署、技能配置、接入、多智能体协助,到如何一句话下达指令、自动化执行,再到安全权限管控,小白也能直接上手,一步 步照着做,就能把龙虾智能体升级成能自动执行任务,真正帮你省时间、提效率的数字员工。无论你是二十岁、三十岁、四十岁,还是五十岁,都要把龙虾 ai 智能体教程买回来认真看一看! ai 不 会取代人,但会用龙虾智能体的人正在淘汰不会用的人。这不是科幻,是普通人的生存指南。想要在 ai 狂潮下提升效率,抓住时代红利,那这本书你可千万不能错过!

哇塞,比龙虾更厉害的智能体来了!最近有一个新的智能体叫做 hermes 爱马仕智能体上线不到两个月的时间, tiktok 的 星标已经突破了六点六万,号称是龙虾最强有力的竞争对手。我为什么会关注此事呢? 因为最近我刚刚装了龙虾。我们特殊资产这个行业的核心工作之一是进调,而进调多半的工作内容是格式化的,有标准化的流程和规范性的文件可寻。所以我们这个行业天然适合用龙虾这种 ai 工具来工作。 别急,我们一起来扒一扒新软件的优越。虽然 pro 使用了五层记忆结构加自动覆盘的方式, 解决了龙虾长对话失忆的核心痛点,但龙虾的刚需用户仍然很多,因为它有社区活跃度高、接待速度快和生态系统成熟度高的优势。已经部署好龙虾应用的企业可以关注一段时间,不 必急于切换。因为工具的迁移成本很高,被打乱工作流,影响到团队的工作效率。对我来讲, 已经把工作流拆解完,而且又把标准化的竞调内容和行为格式在龙虾上封装成技能,对我来讲已经够用了,确实也没有必要追逐新应用。关注我,我是阿华,带你了解更多的固定资产以及特殊资产的价值。

所以最后我总结一下,就是大家今天问问题,我听的最多的还是问龙虾的问题。第一,龙虾是一个过渡产品,龙虾的本质是智能体,大家要打造你企业内部的专业智能体和智能体团队,才能让 ai 在 内部业务逐渐落地。 第二个呢,前期没有在企业内部养龙虾也不叫落后了,龙虾呢,本身也在进化,目前智能体的这个进化速度有可能半年前呢,我们氛围信条这些东西过了三个月就给颠覆掉了。 所以呢,我觉得大家即使没有在企业养龙虾也不着急,我觉得未来三个月内,国内包括我们的各公司都会陆续推出一些适合企业版用的智能体产品, 大家也来得及。第三个呢,要把龙虾用好呢,我认为企业要做好三件事。第一个,就刚才我跟朱老板的建议啊,就朱老板为首的领导层,大家要养成用对爱正确的习惯,这个文化在公司灌浇起来, 要不然从我们经验来看呢,很多员工对 ai 的 使用方法是不对的,是抵触的, ai 的 文化和素养的形成我恰恰觉得很重要。 第二点呢,就是龙虾在企业内部落地,如果就是写写文章,做做文案这种通用功能跟企业也没啥关系。但是如果真的要跟企业的,比如说客服啊,生产的优化啊和应用结合,企业里一定要把自己的知识库要做好, 就像你把我请到你的公司去当个爱主管,我都不了解你企业内部的业务流程,不了解你的历史的很多文档。所以大家今天为什么谈智能体做好要做上下文要做 harness, 说白了就是你给他的企业的专业知识准备的越多,他的效果越好。 第三个呢,龙虾真正发挥好了,还有一个工具,那现在工具都是在网上找的那种互联网用的工具,那你企业里面要开发哪些工具给智能体?这个是你要去思考的,所以企业的现代化打的基础越好,智能化的转型就应该说越容易。 所以现在去养龙虾呢,养三五零安全企业龙虾现在都还不着急,大家没有必要过于焦虑,记得点赞关注哦!

哈喽,大家好,今天咱们来聊一个特别核心的话题,那就是 openclock 智能体背后的引擎。这个所谓的智能体循环到底是怎么一回事?咱们会跟着一个请求从头到尾走一遍,看看它都经历了些什么。 好,你看啊,咱们今天的路线图是这样的,首先我们得搞明白这个智能体循环究竟是个啥。然后呢,我们会从一个高空视角快速看一遍请求的整个旅程。 接着重点来了,我们会一头扎进核心处理的细节里。再然后,我们会看看插件钩子这个超酷的功能,它到底有多大能耐。最后嘛,当然是看看智能体是怎么把它的想法变成我们能看到的回复的。 行,咱们先从第一个问题开始,到底什么是智能体循环?其实啊,你可以把它想象成一个超级智能的全自动厨房, 当一个订单,也就是我们的请求传进来之后,这个厨房就会立刻启动一套标准作业流程,一步一步从备料、烹饪到最后端上桌,绝不会错搓。 你看官方的说法是这样的,智能体循环就是智能体一次完整并且是序列化的运行,从接收请求到组装上下文,再到模型推理、执行工具,然后流势回复,最后把所有东西都存下来。 这里面有个词特别关键,就是序列化,什么意思呢?就是说所有事都得排队,一件一件来,这就保证了整个过程井井有条,不会乱套。 好概念我们清楚了,那接下来咱们就站高一点,从一个宏观的视角看看一个请求从发出来到最后处理完,这整个旅程到底长什么样?这样我们就能明白这背后的一堆组建是怎么互相配合的。 这张图就把整个流程画得明明白白了。你看,第一步,一个 r p c 调用过来了,系统马上给他一个 run id, 就 像是挂号给了一个号码,方便后面追踪, 然后 agent command 就 拿着这个号码启动了核心的运行程序。接着呢, run embedded agent 就 开始处理主要逻辑,而且是序列化的,一步一步来, 再下一步, subscribe embedded pie session 就 像一个转换器,把内部的事件变成了我们能看到的 open cloud 数据流。最后, agent dot wait 就 在那儿等着,一直等到最终的信号,不管是完成了还是出错了,他一抽到整个流程就算结束了。 整个过程就像一场严丝合缝的接力赛。哎,可能有人会问,为啥非得这么麻烦要搞个序列表,让请求一个一个排队呢? 嗯,这个真的太重要了,你想想看,要是没有这个队列,好几个请求同时冲进来,都要去修改智能体的记忆,那结果会是什么?肯定是天煞大乱了嘛。 所以,序列化就是为了防止这种静态条件,保证智能体的记忆和历史记录永远是清晰一致的,让他的行为变得可以预测,不会精神错乱。 ok, 到现在为止,整个流程的框架我们都清楚了,那现在咱们就再往里走一层,深入到核心处理的部分。在智能体真正开始思考,也就是调用大模型之前,系统都需要做哪些准备工作呢? 其实啊,在跟大语言模型对话之前,智能体要做一大堆的准备工作,首先它会创建一个安全隔离的工作空间,就像给这次让步一个独立的房间,然后把所有可能用到的技能都加载进来,接着把相关的上下文文件也都读一遍。 最后也是非常关键的一步,他会给当前的绘画上一个斜锁,防止其他操作来捣乱,确保数据的完整性。这整个过程就好像一个鼎局大厨在上灶之前,把所有食材、调料、厨具全都准备得妥妥当当。 所以啊,这里最关键的一点就是我们给 ai 模型的指令,也就是那个系统提示词,它根本不是一成不变的。 恰恰相反,每一次运行,系统都会根据你当前加载的技能提供的上下文文件,还有用户的输入动态的现场组装出一个全新的,可以说是量身定制的系统提示词,这样就保证了 ai 的 每一次思考都是最有针对性的。 好了,现在到了真正有意思的部分了,我们前面说的这个流程看起来很固定,对吧?但如果我们想在中间插一手,定制一下它的行为,该怎么办呢?答案就是用钩子 hooks。 在 openclock 里啊,其实有两种钩子,一种叫内部钩子,它主要是用来处理一些像杠 new 或者杠 reset 这种外部命令的。那我们今天的主角是另一种叫插件钩子, 这才是真正的神兵利器,它能让我们直接深入到智能体运行的核心循环里,在关键的节点上去干预和控制它的行为。 你看这张表,就把我们能下手的关键节点都列出来了,比如说这个 before to call, 意思就是在智能体调用任何工具之间,你都可以用这个钩子把它拦下来,检查一下它传的参数对不对,甚至可以修改参数,这就非常适合做一些安全胶验。 再比如这个 agent end, 在 整个运行快结束的时候,你可以用它来检查最终生成的消息,或者记录一些运行的原数据,用来做分析和调试,简直太方便了。 好,旅程快到终点了,咱们现在来看看最后一步,智能体在大脑里想出来的那些原始的东西,是怎么被一步步打磨,塑造成我们最后看到的那个清晰连贯的回复的。 大家注意啊,我们最后收到的回复可不只是 ai 生成的一段话那么简单,它其实是一个被精心打包好的数据包。这里面不仅有智能题想说的文本内容,还包括了它在运行过程中调用过的所有工具的一个灾药, 甚至如果中间出了什么问题,它还会把详细的错误信息也附上。这样做就是为了保证一切都是透明的,方便我们排查问题。 这里还有一个特别聪明的设计,叫 no reply。 有 时候智能题可能需要执行一个任务,比如在后台更新一个文件,但这件事它做完就行了,没必要跟用户说一声,这时候它就可以返回这个 no reply 令牌。 这就相当于告诉系统活干哪了,不用回话,保持安静就行,这样就能避免很多不必要的干扰信息。在把回复发给用户之前啊,系统还会做最后一遍精加工,比如说它会自动删掉一些工具,返回的重复的啰嗦的确认信息。 还有一种情况,如果工具执行失败了,同时 ai 又没生成任何别的话,那系统就会确保发送一个备用的错信息的用户,而不是让用户看到一片空白。所有这些小规则目的都只有一个,保证我们拿到的最终回复是干净简洁而且有用的。 所以咱们今天聊了这么多,最核心的一点是什么呢?就是 opencloud 的 智能体循环,它是一个非常强大而且高度可定制的流程,它绝对不是一个你没法动的黑盒子。恰恰相反,它是一个开放的框架, 通过我们刚才聊的那些勾子,你几乎可以在每一个关键步骤去精确地塑造智能体的行为。那么真正的问题就留给大家了,有了这么大的控制权,你打算怎么去打造属于你自己的那个独一无二的智能体呢?

今天我们聊一个最近很火爆的热门话题,龙虾。这龙虾可不是吃的龙虾,而是 openclaw 在 二零二五年底发布的 ai 开源智能体,仅上线四个月,在二零二六年三月份就迅速爆火,成为全球开源平台史上增长最快的项目之一。 那为什么叫龙虾呢?由来挺有意思的,是因为其官方 logo 是 一只红色龙虾,且英文名叫 claw, 中文译为钳子的意思,象征着动手操作的能力, 故被广大爱好者亲切称为龙虾。那什么是 ai 智能体呢?这个就不是新话题了,很早之前就有了,但以前是手机, 现在可以在电脑上完成了。在获得授权后, opencloud 可以 直接操作电脑系统,包括控制鼠标、键盘、浏览器自动执行如文件整理、数据处理、文档转载、网页操作等任务,实现指令输入、任务执行、结果反馈的完整闭环。 比如我明天要做的事情,直接对龙虾他交代下去,他就会帮你全部搞定。举个例子,明天我八点起床要订一份带微辣的炒粉做早餐,九点叫部车,我要到机场, 同时定个十点到广州的头等舱航班,帮准备一份到哪里的旅行策略文案发到我邮箱。闹钟一响,醒来打开手机一看,旅行策略方案已收到了,滴滴司机的用车电话已经在门口等你上车了。 到了机场,直接把网上订的机票验票就可以登机了,是不是很不可思议?他帮你完成了所有,自己会订早餐、叫车、订机票,还会写文案, 这里有个问题,是不是他自己会付款?这就会让大家想到一个安全问题,这也是我今天要重点说的部分。 open club 并非自带支付功能,而是依靠高系统权限加模拟人工操作加任务闭环执行,实现自动化支付。第一步,用户下达自然语言指令。第二步, 智能体底层大模型解析指令拆解为可执行步骤,打开外卖 app 网页、登录账号、搜索店铺选品、确认订单、跳转支付。第三步,通过系统权限模拟、鼠标点击键盘输入页面跳转等人工操作,全程无需人工干预。 第四步,执行过程中自主核对信息,纠错完成后向用户反馈订单结果,但默认配置下密码安全系数极低,存在重大资金与信息泄露风险。国家互联网应急中心已发布专项风险预警, 一是 opencloud 需获取设备高权限才能完成支付操作,不然极易被恶意程序窃取。二是存在提示词注入风险, 黑客可在网页插件中植入隐藏恶意指令,诱导智能体泄露支付账号与密码。三是第三方订餐支付类插件安全性参差不齐,部分恶意插件暗藏后门,可直接窃取用户支付信息,已有用户出现无故扣款、盗刷案例。 四是默认安全配置脆弱,部分用户公网暴露部署端口无强密码认证,黑客可远程接管设备,直接操控支付流程。 所以网络安全就变得尤为重要,不管如何都绕不开网络安全这一块儿。同时要完成这些也离不开算力龙虾。智能体 token 消耗量是传统对话 ai 的 十到五十倍,直接拉动 ai 芯片、服务器、算力租赁、 idc 等底层基建需求,这里大家可以去做做功课。 我们再来说一下这行业的市场体量与前景如何。二零二六年国家政府工作报告明确提出打造智能经济新形态,设定二零三零年智能提普及率超百分之九十的行业目标。 地方层面,深圳龙岗区发布全国首个专项政策,龙虾十条,提供免费算力数据,开放最高两百万元补贴。无锡高新区同步推出十二条配套政策,单向最高补贴五百万元,全方位降低开发与落地门槛,助力赛道快速规模化发展。政策红利持续释放。 机构权威预测,二零二八年中国 ai 智能体市场规模将突破三点三万亿元,企业级应用渗透率持续攀升。龙虾智能体作为开源龙头项目,将优先分享行业增长红利,带动全产业链需求爆发。

天呐,国内龙虾智能体教程书终于来了!真的太硬核,太震撼!只有当你看了这本书,才会深刻的体会到,为什么这个世界将会因为龙虾的出现而发生巨变,因为它能帮你做的事情远远超乎你的想象,你只需下达一句指令,它就能直接接管你的电脑,二十四小时不间断替你干活。你 甚至不用手在电脑前,无论是海量数据自动处理 excel 批量操作报表生成邮件收发文件、整理资料、规范写代码、做 ppt、 做海报剪辑,所有耗时易出错的重复工作,龙虾智能体都能替你干, 雇十个员工都有用!这本书可不是教你那些简单的使用套路,而是拓展你使用龙虾智能体的思路。结合实际应用案例,从基础安装、系统部署、技能配置、接入、多智能体协助,到如何一句话下达指令、自动化执行,再到安全权限管控,让普通小白也能学会的龙虾实操指南, 步步着做,就能把龙虾智能体升级成能自动执行任务,真正帮你省时间、提效率的数字员工。 ai 不 会取代人类,但是会用龙虾智能体的人正在淘汰那些不会用 ai 的 人。放开这本书,让我们在二零二六年抢先布局用龙虾,抢占 ai 时代的先机,开年出版冲量活动抓紧拍,学会 ai, 就是 你未来十年的核心竞争力!

你们研究了这么久的养龙虾,到底是想用来做什么呢?现在市面上的 ai 应用基本上就两大类,第一类是生成类,极度是算力,像 ai 画图、 ai 视频、模型训练,全部都是算力吞金兽。 第二类是 a 键的自动化,自动监测账号,批量发内容、写代码、跑脚本,这个靠的是持续稳定执行。所以说,为什么越来越多老板找我们把线上加本地整套打通一起跑,真的想要让 ai 帮你赚钱, a 键的就等自动打开浏览器,全自动操作,还得长时间稳定运行。 这些核心能力只有本地设备才能扛得住。本地加云端的搭配才是最划算的方案,既能够避免复杂的 a 键的任务疯狂消耗头,肯省下一大笔云端费用,又不用完全脱离云端算力不会让本地部署的成本成倍的暴涨,效率和成本都能平衡到位。 很多人自己瞎折腾,要么本地跑不起来,要么云端烧钱太快, ai 没帮上忙,反而亏了时间和成本。我们深耕这么久,就是把线上部署、模型训练和本地落地适配都摸得透透的,不 管是云端高质量输出,还是本地稳定的跑业建的,都能给你搭好整套可用的体系。不用你自己啃技术,踩坑试错,我们直接帮你把方案落地,根据自己的业务选对模式,找对靠谱的伙伴,才是普通人用 ai 真正赚钱的最优路子。

大家好,我将手把手教大家开发一个极简的 openclaw 类 ai agent。 如果你刚刚接触 ai, 你 可能会问,什么是 ai agent? 简单来说,它就是一个能够自主思考、使用工具完成任务的智能程序。市面上有很多成熟的 agent 框架,比如 linkedin、 auto、 gpt 等, 但今天我们不仅要用框架,更要造框架,从零开始,用纯 python 代码搭建一个类似 opencloud 的 轻量级 ai agent。 在 动手写代码之前,我们先来搞清楚一个基础问题,什么是 ai agent? 你 可以把 ai agent 想象成一个数字助理,就像你手机里的 siri 或小爱同学,但他更聪明,更能干。 一个完整的 ai agent 由三个核心部分组成,首先是 l l m 大 脑,也就是大语言模型,比如 g p t 五,它负责理解用户的意图,进行推理和决策,是整个 agent 的 智慧核心。其次是工具手脚,也就是各种可以调用的功能,比如搜索、网页计算、数学查询、数据库等, 这些是 agent 与外部世界交互的手巧。最后是记忆经验, agent 需要记住之前的对话内容,这样才能进行连贯的多轮交流。 那么 ai agent 和传统聊天机器人有什么区别呢?传统机器人只能一问一答,而 agent 可以 自主决定什么时候使用工具,如何使用工具,甚至可以把多个工具串联起来,完成复杂任务,就像一个真正的小助手,会思考、会行动。 了解了 aia 侦探的基本概念后,我们来看看今天要构建的 open cloud 框架的整体架构。这个架构分为五个核心模块,第一个是 getaway, 它是整个系统的入口,负责接收用户消息,进行路由分发,同时也是控制中心, 你可以把它想象成公司前台,所有来访者都要先经过这里。第二个是 agent rom time, 这是 agent 的 心脏,他负责执行 react 循环,也就是让 agent 能够边思考边行动的机制。我们稍后会详细讲解 react 循环。 第三个是 memory, 用于存储对话历史,没有记忆的 agent 就 像金鱼,转眼就忘了刚才说了什么。 第四个是 skills, 这是一个可扩展的工具级,比如计算器、天气查询、网页搜索等,都是以 skill 的 形式存在,你可以随时添加新的 skill 来扩展 agent 的 能力。最后一个模块是 channels, 负责与外部平台集成,比如飞书、微信等, 这样你的 agent 就 可以在各种聊天平台上为用户服务了。这五个模块相互配合,构成了一个完整的 agent 系统。 现在我们来深入理解 agent 工作的核心机制, react 循环。 react 是 reason 和 acting 的 结合。这个循环包含三个步骤,思考、行动观察。让我用一个例子来说明,假设你问 agent, 北京今天的气温是多少摄氏度? 首先 a 政会思考,用户想知道北京的天气,但我没有实施天气数据,我需要使用天气查询工具。然后 a 政会行动调用天气查询工具穿入参数北京。最后 a 政会观察工具返回了结果,北京今天二十五度晴。 基于这个观察, agent 再次思考,我已经得到了答案,可以直接回复用户了,然后他就用自然语言组织回复, 北京今天天气晴朗,气温二十五摄氏度,看到了吗? agent 就 像人一样,遇到问题会先想一想,然后采取行动观察结果,再根据结果决定下一步。这就是 react 循环的魅力,让 ai 能够边想边做,而不是机械的一问一答。 好了,理论讲完了,现在让我们动手实践吧。首先来准备开发环境,你需要准备以下几样东西,第一, python 三点一零或更高版本,如果你的 python 版本较低,建议升级一下,因为我们会用到一些新特性。 第二,安装必要的依赖包。第三,获取 apikey。 你 需要去 openai 官网申请一个 apikey, 这是调用 gpt 模型的通行证,记得妥善保管,不要泄露给他人。第四,创建项目目录结构。建议这样组织你的项目 主目录下创建 agent, 点 py 作为主程序创建 tools, 点 py 存放工具定义创建点 nev 文件存放 apikey 等敏感信息。创建 requirements, 点 t 乘 t 记录依赖 环境。准备好之后,我们就可以开始写代码了。下一页我会带大家实现一个最简单的 agent, 只需要几行代码就能和 llm 对 话, 让我们从一个最简单的 agent 开始。这段代码只有几行,但它展示了 agent 最核心的能力与 llm 对 话。我先解释一下这段代码, 首先,我们导入 openai 库,然后定义一个 simple agents 类,它有一个 messages 列表,用于存储对话历史。 chat 方法是核心,当用户输入问题时,我们先把用户消息添加到 mess 知识中,然后调用 openai 的 api。 这里我们使用 gpt 三点五 turbo 模型,把对话历史传给它,模型返回回复后,我们再把回复添加到 mess 知识中,这样下次对话时就有了上下文,最后返回模型的回复给用户 看,就是这么简单。这个 agent 虽然还不能使用工具,但它已经能进行多轮对话了。下一页我们会给它加上手脚工具系统。现在我们要给 agent 装上手脚工具系统。工具系统的设计非常关键,因为它决定了 agent 能做什么。 首先我们定义一个工具积累,每个工具都有三个属性, name 是 工具的名称, disscramptions 是 工具的描述, parameters 定义了工具需要什么参数。这里我要特别强调 disscramption 的 重要性, llm 就是 根据 disscramption 来决定是否使用这个工具的,所以 disscramption 一定要写清楚这个工具是做什么的,什么时候该用它,参数是什么意思。 让我们看一个计算器工具的视力,这个工具可以计算数学表达式,当用户问三乘以五等于多少时, agent 就 会识别到需要使用计算器工具,然后调用它得到结果。记住,工具描述写的越清晰, agent 使用工具的效果就越好。 有了工具之后,我们需要实现 agent 的 核心循环,让 agent 能够自主决定什么时候思考什么时候使用工具。这是核心循环的代码,让我一步步解释。第一步,把用户输入添加到记忆中。第二步,开始循环。每次循环,我们先让 l l m 思考下一步该做什么。 第三步,解析 llm 的 回复,如果回复中包含 action, 说明 llm 决定使用工具,我们就解析出工具名称和参数,执行工具,然后把结果作为观察添加到记忆中。如果回复中没有 action, 说明 llm 直接给出了答案,循环结束返回给用户, 这个循环最多执行 max iterations。 四、防止无限循环。这就是 agent 工作的核心逻辑,不断思考,行动,观察,直到完成任务。 为什么 agent 需要记忆?想象一下,如果你和朋友聊天,他每说一句话就忘了之前聊过什么,那对话还怎么进行下去? 记忆系统就是让 agent 能够记住对话历史,我们主要实现短期记忆,也就是当前对话的上下文。 memory 类。维护一个 message 列表,提供添加用户消息、助手消息和观察结果的方法。这里有几个注意事项, 第一,记忆不能无限增长,如果对话太长,会超出 l l m 的 上下文限制。实际应用中需要设置最大长度,或者使用更智能的记忆压缩策略。第二,观察结果要用 system 角色添加,这样 l l m 能区分哪些是用户说的,哪些是工具返回的。 第三,不同的 l o m 有 不同的向下纹长度限制,使用时要留意。好了,理论讲完了,让我们看一个完整的视力。这个 agent 能计算,能对话,是一个真正可用的最小化 agent, 运行效果是这样的。用户问,你好,能帮我算一下十五乘以二十三加八等于多少吗? agents 赶考后回复,你,好,我来帮你计算十五乘以二十三加八。 然后 agent 调用计算器工具,得到结果三百五十三。最后回复,十五乘以二十三加八等于三百五十三。再看一个例子,用户问刚才那个计算结果是多少? agent 因为有记忆,知道刚才指的是什么。回复,刚才计算的结果是三百五十三,看到了吗?这个 agent 不 仅能使用工具,还能记住下场文,进行连贯的对话。 完整代码我已经放在教程资料中了,大家可以下载运行。建议你先跑一遍看看效果,然后在主行阅读代码,理解每一部分的作用。下一页我会介绍一些进阶方向,帮你把这个基础 agent 扩展成更强大的系统。 恭喜你,到这里你已经掌握了构建 ai agent 的 核心知识,但这只是一个开始,还有很多方向可以扩展和优化。 第一个方向是添加更多工具,除了计算器,你还可以添加搜索引擎、天气查询、文件读写、数据库查询、发送邮件等等。工具越多, agent 的 能力就越强。 第二个方向是接入聊天平台,你可以把 agent 接入微信、飞书、钉钉等平台,让它成为一个真正的聊天机器人,为更多用户服务。第三个方向是持久化记忆, 现在的记忆只在单词对话中有效重启后就丢失了,你可以把记忆存储到数据库或文件中,实现长期记忆。第四个方向是异步架构,现在的 agent 是 同步执行的,一次只能处理一个请求。你可以使用 s x u 实现异步,让 agent 能同时处理多个对话。 除此之外,还有多 agent 的 协助、视觉能力集成、流逝、输出等等高级特性。 agent 的 世界非常广阔,等着你去探索。 好了,我们的教程接近尾声了,让我来总结一下今天学到的核心知识点。第一, ai agent 由 llm、 大 脑工具、手脚和记忆经验三部分组成,能够自主思考和使用工具。第二, react 循环是 agent 工作的核心机制,通过思考、行动、观察三个步骤完成任务。 第三,工具系统的设计很关键,清晰的描述能帮助 llm 更好的使用工具。第四,记忆系统,让 agent 能够进行连贯的多轮对话。 如果你想深入学习,这里有一些推荐资源。 open ai 官方文档,了解 a p i 的 详细用法。 learn 源码,学习更复杂的 agent 的 实现。 react 论文,深入理解 react 的 理论基础。最后记住一句话,最好的学习方式是动手实践,不要只是看教程,一定要自己写代码调试改错,遇到问题就查资料问 ai, 这样你才能真正掌握这些知识。