只需要一张产品图,就能直接生成模特佩戴效果,再进一步延展生成展示视频。这套工作流现在已经不需要手动搭建节点了,可以直接让 agent 带你模式,帮你完成。操作。很简单,打开 uart 新建项目创建工作流,左侧是主流热门的模型,右侧是 agent 的 自然语言输入区。第一步,先让模特戴上眼镜, 分别上传模特图和产品图,再连接到一个图片生成节点模型选择 banana pro, 在 指定框中输入让模特佩戴产品,然后就可以交给 agent 接管啦。在对话框直接说需求,比如帮我生成六组 不同的眼镜展示动作,点击发送, ai 就 会按照我们的要求生成可用的画面。选中满意的继续往下。在对话框中输入视频要求,比如人物的动作,还有运行方式。把图片生成展示视频,中途如果有任何不满意的地方, 需要单独修改对应的节点,这是目前小白入门门槛低的一种工作流方式了。而且 solo 二和 nano banana 还可以免费用。
粉丝3974获赞6.3万

网站范式彻底变了,谷歌情人节放大招,发布了 web m c p 协议,核心目标就一个,让浏览器本身成为一个 api。 以后网站是给 agent 们用的,不是人类。开发者直呼 web m c p 是 自 html 五以来外部领域最棒的创新,这是 agent 们与网站互动的新标准。 以前 ai 帮你订机票、买东西,是怎么操作的呢?它得像人一样,先看网页截图,再分析 d o m 结构,然后连蒙带猜的去点按钮,慢贵还容易出错。现在 web m c p 协议想终结这一切,给网站和 ai 智能体建了一条专用高速路,网站可以在自己的前端 javascript 里 直接注册一系列结构化的工具,比如查询航班等。 ai 过来一看,不用再拆界面了,直接像点菜一样调用这些明明白白的工具就行。数据返回也是结构化的,这像极了当年为了 seo, 大家纷纷研究原标签和结构化数据。只不过这次流量入口不再是谷歌爬虫,而是全网的每一个智能体。

hello, 朋友们,大家好,我是土豆,那么本期的视频内容呢,我们会带着大家去从零把 openclock 小 龙虾这个 ai 智能体搭建到你的本机,也就是你的电脑上面, 然后这个东西是什么呢?它就是适用于任何操作系统啊,比如说 windows, linux 或者是 mac 操作系统的一个 ai 智能体 get 位网关, 他是能够通过你们的微信或者是飞书啊,或者是这些 whatsapp 的 一些社交软件 app, 可以 进行给他发送消息,发送完毕以后呢,比如说你让他帮你生成一个图片或者是一个视频, 然后他能够代替你去做一些你平时工作的一些繁琐的事情,那都是可以去通过这个智能体,然后来给到他了,他就相当于你工作当中的一个啊, ai 机器人智能体。好, 接下来呢,我们来看一下它的安装方式,那往下翻啊,这个地方的工作原理呢?你们还有核心功能,你可以自己去看一下,点到快速开始的这个位置呢,他说去安装我们的 openclock, 但是这个位置呢,他是使用 npm 安装的,使用 npm 安装的话,你们就要去安装一下 note g s 啊, 好,然后呢我们直接到下一步入门指南的这个位置,然后跳过这些,然后我们找到这个 windows 的 pro shell 安装。然后我们怎么找呢?就是你的 windows 下面有一个 pro shell, 或者是说你在你的桌面呢,去右键,然后打开这个终端,打开也是这个 pro shell 啊, 好,然后呢我们把这一段命令呢给它复制下来,然后右键然后回车,在这个位置啊, 会有一个绿色的,它首先会去找你的本地电脑是否有没有安装 node js, 因为我们刚才说了 npm 是 node js 嘛,它是使用 npm 进行安装的,这一个 mini 呢,就相当于一键安装全自动的。 如果说你们我当前的电脑呢,它是有 note g s 的, 所以说呢,它是直接跳过了它这个地方有个 ok, 如果说你们没有的话,它就会自动的去帮你安装 note g s 这块呢可能会比较耗时一点。然后呢,呃,紧接着如果说 note g s 有 的话,它就开始安装你的 open cloud。 好,这个安装完毕以后呢,它可以。呃,这边呢就有一个 openclaw 在 安装的 success 呃 file 里就安装成功了。安装成功以后呢,它这个命令的主要呢就是可以全自动的帮你去呃 做配置了,就自动到配置了。那首先呢,他会问你,呃你,你能不能同意他这个有风险的事情啊?因为他本身权有权限的话,他是能做任何事情的在你的电脑上面。所以说呢,我们这边呢用左右键选择一下 yes, 然后就是同意。然后呢再就是我们的快速开始, 快速开始的话,这个地方呢,我之前是已经安装过了,所以说呢,我这边的话第一个是是否使用已经存在的一个配置,然后呢第二个呢是更新配置,然后我这边呢选择重新开始。然后呢你们能看到的是,呃,这样一个啊, 首先呢我们要选择模型,那模型的这个呃厂商啊,有 oppo a 啊,或者是说,呃谷歌呀,还有我们的小米啊,还有很多啊,那这个地方呢,我们先不配置,先直接跳过, 然后呢这个呢就是我们的模型的一个厂商,就是他的一个厂商,那这边呢也是啊,给他选择一个哦,然后这个地方呢就是我们的默认模型, 默认模型的话也是选择一个默认的就行了,因为我们后面呢还会在外部以外当中呢去做一些配置的,好吧?然后这个地方呢就是选择我们的一个渠道, 就是你们是要通过 whatsapp 还是说呃谷歌这个 chat, 那 我们后面呢可能会去带着大家一起去配置那个飞书,然后通过飞书呢社交软件呢,然后来操控我们的这个智能体。好,这个地方呢也是给大家去跳过 选择跳过,然后呢这个位置呢就是是否跳过,然后我们这边呢也是啊,然后呢这个地方呢就是一个多选了,我们用空格给他选中,选中以后呢,然后回车也是给大家跳过,跳过以后呢,他这个时候就开始进行配置了, 配置完毕以后啊,就是说配置完毕以后呢,他有可能是能够成功的,因为他的网关如果说打开了,你们就能够直接访问看, 他就直接弹出来了,弹出来以后这个拒绝请求是为什么呢?是因为你当前的这个网关并没有打开,知道吧?就相当于没有启动你的服务。好,下面呢就会告诉你已经完成了。好,完成以后呢,我们在这个地方点击安装, 那上面呢就是我们安装的一些步骤啊,那这个位置大家看啊,这个漏的呢,必须是要大于等于二十二的这个版本,那我们刚才这个版本是多少?大家也可以看一下,他全自动帮我们安装的时候,他的版本是二十二点幺六,对吧?也是大于等于的,那是符合的 好。然后呢我们这边拉到下面,首先呢我们要检查一下啊,使用这个命令快速检查一下我们这个东西有没有问题,对吧?就相当于一个医生检查一下有没有问题。 好,没有问题,那我们现在呢就相当于检查完成了,检查完成以后呢,我们就可以直接启动我们的网关了,怎么来启动呢? 首先啊,大家要去看一下我们这个网关是否有没有被启动。好吧,如果说刚才的这个新手引导,就刚才我们那个配置,那个引导,如果说你们跳过了,怎么再重新打开呢?重新打开的话就使用这个命令进行重新打开,就是运行我们的新手引导重新进行配置 好网关的一个检查呢,就是该到位的这个网关检查呢,我们就使用这个命令 看看是不是网关已经已经被启动了,你看他这时候正在检查 好我们的网关渠道,渠道也没有,这个筛选也没有,就相当于我们的网关都没有被启动,是吧?这个地方有两个警告,然后呢啊,也没有一个,呃,抛红的地方啊,那就是一个正常的状态,然后呢我们后面再做一个健康检查。 好,我们在做健康检查的时候,你们看这个地方有一个 failed to start, 他, 他是说的什么意思呢?就是说我们现在这个网关他并没有启动,对吧?比如说我们刚才这个网网址打开的时候,他不能打开,对吧?我们怎么来启动呢?好,接下来我们来看一下启动方式啊, 好,我们点击看快速开始,然后把它第一步入门指南下面呢有拉到下面 有一个启动 get 位的网关两种方式。第一种呢是我们在安装新手引导的时候呢,把所有的服务安装好了,然后呢他就会自动的帮我们去启动,但是我们并没有去配置,跳过了很多,对吧?然后呢这个地方呢还有一个手动进行运行,我们把这个进行复制一下,然后呢 回车,这时候呢他就会对我们的这个网关啊进行一次启动,然后我们再刷新一下我们这个地址,是不是就能看到你本机已经把这个面板呢是能够打开了, 对吧?这样的话我们的这个小龙虾呢就启动起来了,启动起来以后呢,我们现在呢就要去配置我们之前没有配置的一些东西。好,我们刚才的呃点击安装啊,刚才的一个健康检查是不是还没做完? 虽然说我们现在这个健康状态呢,他是一个正常的,那你们在呃平时做的时候呢,也可以尝试着去做一个健康健康的一个检查啊,比如说我们这一块再开一个,开一个终端,然后做一下健康检查 啊,你们看现在呢他就告诉我们了,这个 open open 的 open cloud 小 龙虾已经启动起来了,没有刚才的这个错误吧?是不是没有刚才我们遇到的这个错误,就是他告诉我们是关闭的, 现在呢我们就属于一个正常的范围了,我们现在就要去配置我们的模型啊,厂商啊,还有 api 那 些东西。 好,现在呢如果说大家要对这个聊天进行访问,或者是要使用这个小龙虾的话,那么他肯定是有问题的,因为你们没有配置什么 api k, 就是 我们的模型的 api k, 那 我们怎么来弄呢?我这边呢就使用我们的这个 model, 就是 基础的大模型,然后来帮助大家去做一个试验, 那你们如果说新的账号去注册的话,他会送你两千万个投屏啊,就是还是挺多的,我们点开控制台, 然后呢呃,这边邀请好友也是能够领取,最高领取两亿个 tokyo 啊,那这边呢我们点击 apikey, 然后呢点击新建一个 apikey, 比如说小龙虾,然后点击确定,确定以后呢我们需要在当前的这个终端啊,打开终端,然后使用命令, 就是 open, 就是 配置,我们回车, 然后呢选择这个 local 本地,然后呢我们选择第二个模型配置,然后呢我们选择这个厂商啊,这个厂商你们可以选择千万啊,或者是很多很多厂商他都支持的。那这边呢我们选择智普 ai, 然后选择 c n, 那 上面呢它都是 api 的, 就比如说你看 api 的 这这 ai, 然后这个也是啊,我们这边呢选择这个 c n 啊,按照我这个来选就行了。然后呢我们把刚才这个小龙虾的这个配置呢 api 可以 点击复制,然后呢右键,然后回车, 回车以后呢我们然后就直接点击啊点击回车,回车完毕以后呢下面有一个 content 六,然后我们选择这个 content 六,然后呢这样的话他就配置好,配置好以后呢我们刷新这个网页,刷新完毕以后呢,比如说我们现在在跟他去聊天,就说你好啊,你是谁? 好,然后呢现在大家看啊,是不是就已经接通了,这样的话,我们的一个本地化的一个 ai 智能体的基础就已经搭建好了, 后续呢我们会紧接着告诉大家怎么去搭建把,把它搭建到我们的飞书上面,并且呢使用各种 style 的 一个提示库,总合起来一个很完善的一个 ai 智能体,能够帮助你们去深图或者是做一些啊 comui 的 事情,或者是说帮助你们去完善一些工作, 或者是又或者是做一些定时的任务。它这个里面呢功能呢是非常非常多的,包括技能啊,节点啊, skill 啊,还是挺完善的啊。 那本期的视频内容呢,就到这了,如果说大家有什么问题的话,也可以在评论区留言,然后也可以进我们的讨论组一起讨论 ai 相关的一些知识,那么我们下期再见,各位,拜拜。

强烈不介意,学完 python 和 python 之后,我直接就开始 a 整了,这种小伙伴说白了就像空中楼阁一样,所有的 ai 在 你的眼里都是黑箱,你只能是掉一边,别的什么也干不了。这样的小伙伴,其实来讲,你的天花板是比较低的。小 赵是强烈建议你在两周到四周里, python 和 python 那 些操作语法最主要的内容学完,学完之后,剩下的内容其实都是在做项目的过程中呢,不断地去升华,不断地熟练。 第二步直接就可以切入到深度学习。有很多小伙伴之前也问的就是传统机器学习需要学多少,我个人觉得啊,逻辑回归、决策树、随机森林,他这一步都把这几个工业界还在用,同时能让你 掌握一些算法和模型里面的基础的相关知识,有这么一个概念,学一学就行了,迅速切换到深度学习,因为这才是当今工业界的主流。深度学习里边,说白了 c n 呐, r n l t m 就是 快速的过一下,跑一跑代码,不需要花太多的时间。 这块搞定之后,第三块一定要跑一到两个小 demo 的 项目。什么意思?就比如说你把一些垂类的数据在 bot 上也好, t 五上也好,就这种小模型上,你全流程的训练一波,微调一波,优化一波,你就知道了,原来训练模型是这个样子。 有了这么一些经验之后,第四块直接你就可以切换到大模型领域,因为这是当今工业界的主流。但是我个人依然认为,小模型有小模型的价值,大模型有大模型的价值,不要在所有的业务场景里无脑的上大模型, 大模型终究来讲耗资源大,它运行慢。那么大模型这块主要学什么?大?主要除了少量走高大上路线这个小伙伴,他去学底层的算法,搞基,做预训练模型。剩下的小伙伴主要来讲学架构, 比如说大模型的 dance 架构,大模型的 m o, e 架构,大模型内部的一些黑科技。再有一个就是大模型的微调一定要会。小赵是建议,不仅仅进行 s f, t 的 阶段,一定要争取把自己的技术栈扩展到强化学习阶段啊,也就是 r, l, h, f 的 阶段,不管是 revolve, model, p, p, o, d, p, o, j, r, p o 这些东西都要上。 搞定了之后,最好在一个全流程的领域里把这三阶段的训练走一圈。大模型的根底你就很扎实了,有前面的做基础, 你现在是一个有非常深厚内功的所谓的 agent 工程师了,我们就可以切换到 agent。 第五块,切 agent 一定要切 launch and long graph, 这个框架, 一定要全流程的搭自己的 r, a, j, 把这个东西给跑起来,有自己全流程优化的一个经验,这个很重要。 agent 搞定之后,第六块,小赵是觉得就可以继续地去做项目,不管是大模型的项目, agent 的 项目能够真正地落地,写到简历上,所谓的就业,那就是一马平川,千万不要左一头右一头地来回跑。

不管你的 a g 的 跑多久,服务器重启多少次提升, metal 的 agent 上下文都能瞬间无缝衔接,这才是真正的全天候助手,永远记得你是谁,你想要什么?没有长效记忆的 agent 永远只能做一次性的搜索引擎,成不了懂你的管家,每天早上都要重新加他一次。你喜欢什么?这你受得了吗? 只需要一行配置,你的 a 技能就能用为蛤蟆体,它能把庞大的内存化变成结构化的相当数据库,随用随取,绝不超载。我们来具体看一下,如果没有记忆的话,他可能服务器崩溃,重启之后他就会醒来,就像个白痴。但如果有了记忆之后呢?他就能够从硬盘中恢复所有的偏好设置,来直接给你一个完美的一个答案。我们来看一看。 好,他现在已经想起来了,这完全模仿人类的大脑运动一致短期记忆在脑海里的过滤,有用的知识被提成语义记忆,并在需要时进行压缩巩固。这又是全天候智能的终极体验。你不再有上文耗尽的焦虑,哪怕你跟他聊了一年,他的回答依然敏捷精准,充满了对你的专属理解。 没有记忆的大脑只是计算记。记忆是将工具生活为伴侣的唯一桥梁。如果你也想让你的 ai 有 记忆,可以去试试,我是安迪,教你用 ai 解除工作自由。

家人们,我被 ai 智能体吓到了,事情是这样,我推荐了一款普通人也能做硬件开发的 ai 工具,居然有了二十五万播放量。然后有用户评论说,二九八 n 这种电机模块都没有,失望, 学过两年半硬件开发的人都知道 l 二九八 n 是 一款电机驱动芯片,我寻思这么常用的芯片,这软件居然不支持,一看库管里虽然有很多种电机驱动支持,但还真没有 l 二九八 n 主包正好感冒了,于是找朋友帮忙, 你能不能做个 l 二九八 n 的 酷啊,有用户要用,最近忙了,没时间搞酷,你不是吹全流程 ai 吗?怎么 ai 不 起来了?对啊,我怎么都忘了有 ai 了。于是我告诉 ai, 帮我做个 l 二九八 n 的 酷 ai, 居然啥也不问,就独自开始干起来了。可以看到 ai 多次思考问题,然后上网查资料,然后巴拉巴拉的干活,我能做的只有围观。过了一会儿,居然告诉我已经写好库了,让我安装。还没完, ai 自告奋勇要帮我写个视力程序, 那你就写吧,写出来我正好试试。又等了一会儿, ai 写好视力了,翻译、销路测试居然可以正常使用,以前这工作可要让我做大半天啊! a i 按这发展速度,以后岂不是没我什么事了?家人们,主包十多年的开发经验怎么办啊?有没有擦皮鞋的工作,点赞收藏,以后我来给各位擦皮鞋!

假如你从二六年春节后开始学习 ai agent, 需要多久才能学会?接下来告诉你一条最快的学习路线,让你少走弯路。如果你年龄在四十五岁以下,那么恭喜你,只要不是三分钟热度,一个月的时间就能从新手进阶成 ai 领域的工程师。首先,按照这个流程制定一个学习计划,每日打卡。第一周,打基础, 先掌握 agent 的 核心理论,搞懂核心组建吃透大语言模型、规划模块、记忆模块和工具及这些基础概念。第二周,吃透 agent 的 工作原理和难点解决方案,扩展学习 react, c o t 等经典 agent 的 范式。 第三周,强化学习,了解多智能题写作的逻辑,掌握 prompt 的 调优技巧,让你的 agent 更精准的输出你想要的结果。第四周,进行实战, 结合前面所学知识,自己动手完成几个大模型项目,跟着走下来,你就能真正把 ai 技术接入实际业务,升职掌心不在话下。如果你还不知道从何开始,我这里整理了学习路线以及配套视频教程,留下学习双手奉上。

太吓人了,家人们 open clone 的 更新速度快赶上中国基建速度了,名字从 clone bot 改成 motbot, 又改成 open clone, 现在独立的 mac os 端 app 又上线了, 今天带领大家安装一下这个 app 和本地化部署最新的一个 open clone 最新版的和之前的版本命令行有着翻天覆地的变化,安装前彻底删除之前的版本 运行,我都整理在视频的配套文档里,直接复制粘贴即可,操作非常简单。首先我们打开终端,在这边输入终端,找到终端 app 赶紧回车,这个时候我们就打开了终端, 我们发现了终端里面是有程序在运行的。第一步呢,我们要把电脑上的 open clone 给它卸载掉,因为 open clone 它更新的比较快,所以之前有很多版本。 我们第一步呢要根据我的个视频配套文档将它进行彻底的删除,删除分为这么几个部分,第一步是停止后台的服务,第二步啊是删除程序文件,第三步的话是清理一些配置数据和日制。只有你把电脑上之前的 open curl 把它卸载干净之后, 我们安装最新版本的时候呢,就不会报错。如何卸载?整个命令我都是放在这边,我们可以按照这个这一步来复制粘贴,复制打开终端,在这边首先第一步把网关给它停止掉,接着我们把网关呢给它卸载掉, 卸载好之后呢,我们要把里面的一个程序文件也给它卸载掉,复制到这边粘贴他如果报这样的个错误, e a c c e s 旁边选点 i 的, 说明我们这边是没有权限的,那怎么办呢?我们要在前面加个速度,再粘贴回车,输入你苹果电脑的密码 好了,程序也卸载掉,卸载完之后的话,我们呢要通过这种方式把整个文件夹也给他卸载掉,里面还有一些数据和日制,我们也可以呢通过这种方式把它卸载掉,直接复制到这边粘贴回车。如果他有缓存文件,我们这边呢也把缓存文件给他卸载复制粘贴。卸载完之后的话,我们最后一步呢可以检查一下, 我们使用这三个命令,就把之前的所有的版本我们都检查一下,粘贴回车,看一下这上面有没有 mod boot, 有 没有 clone boot 和 open clone, 它这边的发现呢就是都没有说明。我们这时候呢我们的电脑上就是一个干净的一个文件, 那么接着我们就进行安装,如果你之前从来没有安装过 open curl, 那 么我们之前的所有的卸载的步骤你就忽略掉。下面我们就进行第一次安装的一个演示,在官网这边呢,它提供了很多种方式,第一种方式呢就通过一个谢尔命令行来实现,还有呢通过 n p m, 如果你是黑客的话,你可以是通过这种方式,也是通过命令行,或者呢你是通过 p n p m 这样的命令。这边呢它还提供了一个 macos 的 一个客户端,这个处于测试阶段,到最后我们也安装一下这个客户端。首先我们来使用第一种方式, 就通过一行命令,这种方式这边复制打开中单到这边粘贴,粘贴好之后我们回车。首先呢它要检查你的电脑上已经有了哪些东,比如说你的电脑上 homebrew 已经有了, node js 已经有了, git 已经有了,这时候呢它就开始安装了,官网上目前显示的是个 beta 版,就是一个最新的一个测试版本, 如果你在安装过程中呢,它这边显示 npm install failed 失败,说明这种方式的话我们就没有办法安装,也就说通过这种脚本这种方式我们没有办法呢,一键进行安装,那我们就要换成第二种方式,我们使用这边的 npm, 使用 npm 安装呢,首先我们要在自己电脑上安装 npm, 如何安装 npm 呢?我们看一下我的文档,首先你要访问 node node g s o r g 这个网站,这边有个获得 node 点 g s, 你 点击它,然后我们就可以进行下载,这边根据你的一个系统的版本进行下载,如果你是 windows 的, 你就下载 windows 版的, 如果是 mac os 你 就下载 mac os, 选择好之后,你在这边呢就可以点击 mac os 安装程序下载,点击这边就帮你进行下载, 下载成功后我们就看到的这个安装包,然后双击进行安装,这边呢直直接点,继续继续同意,然后安装。我的电脑上呢之前已经安装成功了,所以的话我这边就不需要重复的安装,等你安装成功之后,我们呢再来检查一下它是否安装成功,如何进行检查呢? 这边呢打开终端,在终端这里面呢我们输入 n p m, 刚刚我选会说说明我们的电脑上的 n p m 已经安装成功了,我们下面要使用这个命令,你也可以呢输入 node, 刚刚我选我们要保证我们自己的 node 版本呢,要在二十二版本之上,你不能低于二十二,如果你通过我刚刚这种方式的话,你下载的 node 版本应该是二十四, 而 node 和 n p m 它们之间是什么关系呢?也就是说你的电脑上安装的 node, 它自动的安装的,所以我们只需要安装 node 就可以了。 node 安装好之后,我们回到呢官网到这边的话,我们呢只要把这个命令和下面这个命令呢复制粘贴就可以了,复制上面的命令,复制打开终端粘贴回车。这个时候呢它就给你去安装 opencloud。 同样的这边这个地方呢,它报错了,报的什么错误呢?就 person denied, 就是 权限的问题,你没有权限。苹果电脑的话,你只要在前面加个 so do, 然后再粘贴发送,输下你电脑的密码,当你如果看到这个说明就安装成功了,表示呢我们已经呢在自己的电脑上下载了六百九十二个包。 接着呢我们来复制这个命令,这个命令呢就是我们开始对 open clone 呢进一个向导安装,复制到这边粘贴回车。首先呢它跳出这样的一个界面,它给你一个安全的一个通知,就是呢,它这里面呢是有一些安全风险的,你是否是理解了这个安全的风险, 如果你接受这个风险的话,你就可以继续通过方向键选择 yes 和 no, 我 们选择 yes 回车安装向导,它提供两种方式,一种呢叫 quick start, 就是 快速安装,还有格子 module 是 手动的安装,我们选择 quick start 就快速安装。接着需要配置一下它的一个模型 over chrome 呢,它需要是连接模型,所以我们在这边呢需要进行一个设置一下。选择模型的时候,一般的厂商它都是有的, 我们这边呢选择千万,因为它是免费的,选择它,然后呢点击回车,你连接千万这个模型呢,我们呢有这个千万 all sorts, 我 们通过这样的身份认证来实现回车,这时呢它就打开一个千万 all sorts, 我 们通过这样的身份认证来实现回车,这时呢它就打开一个千万,然后用你的账号和密码进行登录, 我这边因为之前已经登录过,所以我这边点击确认,这边显示认证成功,认证成功之后,我们再来看下一步,下一步他问一下你的默认的模型是什么?也就是我们这边可以设置很多个模型,你这边默认的模型是什么?我们这边就是 keep current, 保持当前的就是千万这个模型。点击回车,接着我们可以选择一个 channel, channel 是 什么呢?就是渠道,也就说我们的一个 open clone, 它可以呢和我们的一些通讯工具进行连接, 你在这些通讯工具上和它可以进行一个对话。这边呢我们演示一下 whatsapp, 在 使用 whatsapp 连接之前呢,我们看一下现在主流的市市场上的一些社交软件,它这边呢都是支持的。点击 whatsapp 回车,说连接 whatsapp no 吗?连接它的时候呢,它需要生成一个二维码, yes 的 话就生成, no 的 话就是不用生成。 我们这边来选择 yes 好 了,这时候呢就给你个二维码,我们需要用手机呢进行一个扫描,在手机端呢打开你的 whatsapp, 然后呢接着点自己找到里面的,找到右上角这边有个二维码,然后这边有个扫描按钮,对着这个二维码进行扫描,接着我们呢点一下,继续点击关联新设备,输入一下你手机的密码,然后再一次扫描 好了,当你手机上呢出现一个新的设备,说明呢它已经连接成功了,这边显示此 whatsapp 呢需要呢被重启一下, 我们等一下呢就可以重启一下 whatsapp, 接着往下面来看 whatsapp from set up, 这边呢需要设置一个个人的一个手机的账号,你可以呢为 open chrome 呢独立的设置一个手机的账号,我们选择下面一个,这样的话就安全一点,因为我们可能是通过 whatsapp 呢进行个自动化的一些处理, 有可能将来会对 whatsapp 呢进行封号,所以我们这边选择个独立的手机号。回车这边说 whatsapp dm 的 policy, 选择一个政策,我们就会选择 recommended 它推荐的。回车这边你是否要设置 allow from 等等这个这个地方的话我们就选择默认,接着显示 configure scale is null。 你是否需要配置一些技能包,这技能包的话我们现在配也可以,将来配也可以,如果你现在配的话,你就点击 yes, 如果你将来配的话,我们就点击 no, 这个我们可以呢等安装成功之后再配,选择 no。 这边问你是否要挂载一些插件,我们这边呢最好你把它呢所有东西都选择点击空格,就是选择, 第一个呢就是加速它这个启动的,第二个是命令行生成日期,第三个是 ccemily, 就是 你每次会画的话是否要进行个记忆, 我们都把它选择,选择好之后,我们点击回车,这时候它就在安装 gateway service, 这边的 gateway 呢,我们就可以简单地理解成就是我们现在安装的 open chrome 的 应用,到这步就表示呢它已经安装成功了,我们如何去访问它呢?这边有两种方式,一种的话是通过 t u i, 是我们通过终端的这种方式,还有一种呢是通过 web ui, 就 通过网页的这种方式,我们可以选择下面一种通过 web ui, 这样更加直观一点。这个时候呢,它就打开一个网页,通过这个网页的话,我们就可以和我们的 open chrome 进行一个对话了。这边显示的是 chat, 我 们在这边可以发送信息。 你好,你是什么大冒险发送,他这边就告诉你了,我是一个千问,我们使用的是千问大冒险,说明这个地方没有问题。我们再来看一下这边的 over view, 在 这个地方呢,它显示的是 connected, 说明我们已经连接成功了。再来看一下 channels, 我 们刚刚呢是配置的一个 whatsapp, 我 们看一下这边都选择 yes, 说明这边呢已经配置成功了, 这样呢,你就可以在 whatsapp 上呢和它进行一个对话。这边还有个 skills, 我 们刚刚的 skills 呢是没有进行安装的,你可以点击这边的 skills, 然后进行安装。如果呢你需要这样 i password 这个技能的话,你只要点击这个 install, 还有你一些苹果电脑上的一个苹果 apple notes, 你 需要的话你也可以点击它。 我们一些常用的一些技能这边都是有的。这边有个 github github, 它的技能呢已经帮你安装成功了,当然你也可以呢把这个技能呢给它呢去除掉,比 比如说 disable 的, 你点击它就可以去除掉,根据自己的实际情况可以选择,这里面的技能包还是比较多的,比如还是 notion, 如果你想连接 notion 的 话,你可以在这边呢填写 api key, open clone 呢就可以去操作你的一个 notion。 除了通过浏览器这种方式访问 open clone, 我 们也可以呢通过下载 mac os 的 一个 app 来实现访问, 点击它的官网,这边有个 mac os, 在 这边呢我们可以下载一个 app download for mac os。 点击在这边我们找到的下载包,找到 d m g 结尾的,然后点击它进行下载。下载成功之后呢我们找到这个下载包, 然后呢双击进行安装,双击安装方式很简单,就是把这个呢拖到右边,这样就表示呢安装成功了,我们可以拿来访问一下,在这边呢输入 open claw, 就是 呢它这边 app 就 在这边, 我们呢点击它这边点击打开,这时候我们看一下这边菜单栏呢,他就多了这个图标,点击它,我们可以看到我们刚刚呢在浏览器上问的问题,他这边呢同步的给我们显示,比如说我在这边再问一下,你叫什么名字,发送他自己呢给他起个名字叫爪子,不过呢你也可以呢给我起个你喜欢的名字, 我是一个个人助手,系统你可以帮我进行一个面评。同样的我们来看一下网页端,找到这面的跟我们信息呢进行同步, 也就说我们可以呢通过不同的一个客户单和他进行一个对话,点击他,我们可以右击,在这边呢,我们可以进行一些设置,在这边我们可以呢显示我们 tiktok 的 一个使用量,还有在这边可以查询到一个网关的一个端口号,以及他在哪一个设备上面也可以呢,发送心跳控制浏览器,还有呢可以允许你进一个截屏, 也可以呢是制作一些 voice wake, 制作一些声波,我们呢可以点击这边那个 settings。 在 这边呢我们可以呢进行一个设置。这个客户端呢,除了可以连接本地你电脑上部署的一个 open curl, 你 也可以呢连接远程的 remote, 比如说你想连接你服务器上的一些云服务器,上面呢有一个 open curl 的 话,你在这边呢也可以呢通过这种 ssh 的 方式进行个连接,在 在这边呢可以进行个 voice wake, 进行声音的一个制作,这样的话它就可以实现颗粒进行一个对话。还有些 config 一 些设置,它的设置呢,在这边的话它是没有办法显示的,你可以呢回到我们这边的网页端, config, 在 这边呢我们进行设置,或者呢你就可以选择终端这种方式进行设置,还有这 instance, 还有些 session 绘画,你也可以在这边呢 chrome 在 这边设置一些定时的任务, google 版,你就可以呢给他设置一个定时的任务,点击它,在这边你可以设置。当然最简单的方式呢,你就可以在对话框里面进行设置,比如说我呢回到这个地方点击它,你可以在这里面呢就是发送一个指令,让他帮你呢设置个定时的任务也可以呢,到这边 chat, 到这里面我们来设置,比如说我在这边设置一个 每天早上六点钟的一个叫醒服务,这边点击发送,你看呢这时候呢只要设置每日一个叫醒,我们来看一下他这边已经设置成功了,在设置过程中呢,他发现一个网关有一些问题,所以呢他这边呢自动的帮你进行修复,接着我们点一下这边 呢,它就不是没有设置成功,那说明的话我们这边呢还是有问题的。这边呢他帮我们自动的进行重启,我们这边可以呢再去重新设置一下,复制到这边粘贴发送。他这边显示我已经为你设置了每天早上六点一个叫醒服务, 然后每天六点钟的准时给你发送信息,内容是早安,这是你的个叫醒服务提醒,这个就表示它设置成功了。设置成功我们到这边呢 job 这里面检查一下,看到没,这边呢 job 就 多了一个,一就说明我们叫醒服务已经设置好。叫醒服务呢,它就是在这个地方, 它的一些具体的信息就显示在这个地方,当然你在这边呢,也可以把它关闭掉,或者运行,或者幕幕把它删除掉都可以。如何配置国内的社交软件连接 open clone 呢?比如微信,飞书,钉钉等,我们下期视频见,视频配到文档,记得评论区滴滴。

春节放假无聊,我给自己搭了个 a 阵,好用到哭。很多同学都知道二零二六年是 a 阵的风口,其实搭建一个属于自己的 ai 智能体是我很久之前的愿望了,但工作太忙,一直没动。春节放假休息直接开干。我知道很多朋友看着觉得难,全是代码怎么搞?别担心,我熬夜把整个过程 写成了一份保姆级教程,包括从环境准备到运行智能体的全部实现过程,哪怕是纯小白跟着步骤一步步来,也能亲手搭建出来。如果你也想搭建智能体,却不知如何下手,这份教程应该能帮上大忙,留下学习,双手奉上。

比方说用户是你 ai 模型,是你的男朋友,有一天我想告诉我的男朋友说我肚子疼,这句话就叫 user prompt 用户提示词。 然后你希望你的男朋友是一个温柔的,帅气的,有钱的,能够再给你买些红糖水,那么这一些人设就叫做 system prompt 系统提示词。 当然,因为大部分的男朋友都比较傻,什么都不懂,然后呢,也很人机,听不懂人话。所以这个时候呢,你们需要借助一个恋爱小工具, ai agent, 首先你告诉你男朋友,相当于你直接告诉你的恋爱小管家说,啊,我肚子疼。你的恋爱小管家非常的聪明啊, 他知道你可能想喝红糖水,他就知道你可能需要菠萝粉,那么这个时候他就会调用工具来查一查,说,我吃什么药比较好,我买哪家的红糖水怎么好?比如说他要用高德地图来查哪家药店近,比如说他会网页搜索来搜索 哪家红糖水比较喝好喝,他能用什么工具,每个工具能返回什么,他会把这个信息告诉你的 a m 模式就是男朋友,比如他告诉他说,哦,你女朋友现在肚子疼,你可以上网,你也可以问人。然后男朋友一听,哦,上网好啊,他就告诉你的恋爱小管家说, ok, 我 要上网来查一查, 好,那么你的恋爱小管家就帮助你,帮助他来查一些内容,比如说啊,这家红糖水好喝,比如说他告诉你说,啊,我要是部落分啊,我不能喝感冒灵啊这个东西,让他把这些信息再告诉你的男朋友,男朋友一听,哦,红糖水好啊,哦,部落分, ok 啊, 他大脑思索了一下,说吃药可能不太好,那我还是给他买红糖水吧。于是他就做出了角色,并且告诉你的小管家说,啊, 我告诉我的女朋友说多喝热水,然后我接下来现在马上下单说给他买红糖水,然后他再把这 ai agent, 你 的那个小管家再把这个信息返还给你,就是这个用户, 所以你发现了你跟 ai 模型之间其实是通过一个 ai agent 来进行通信,那么 ai agent 跟 tour 之间也需要一些交流, 就像人跟手机中间有一个用户,就是有一个使用手册,那么这个使用手册叫做 m c p, 在 m c p 协议下面, tour 可以 变成一个集合体叫 m c p server, 就是 告诉你说 这个接口,这个接口怎么用怎么用,然后你你的小管在这个时候就会叫做 m c p client。

很多人听到 skill, 会以为这是某种高级能力或者 agent 专属魔法,但我们先把它拉回实际。 skill 本质上就是你早就会的那件事,把一件重复发生、部署、稳定、结果、可预期的工作整理成一套可以附用的做法。 你以前可能把它叫做模板、脚本、流程、 sop、 小 工具。现在我们把这些统一叫 skill, 只是为了让 agent 也能用同样的方式来工作。 关键不是名字变了,而是你开始用可附用的模块来思考工作。如果要把 skill 编成一个摸得着的东西,我最喜欢的比喻是一个文件夹。 这个文件夹里通常会放三类东西,第一,说明书告诉你这件事要达成什么目标,输入是什么,输出长什么样。第二,材料包,比如模板、视例、参考文案、品牌规范。第三,执行方法、步骤清单、检查点,或者一段脚本和提示词。 所以 skill 不是 一句我会做,而是一套别人拿走也能做的交付物。它让能力从人的脑子里搬到一个可传递的、可附用的载体里。 skill 最关键的武器其实就是四个字,按需加载。我们做工作时也一样,你不会把所有知识同时摊在桌上,你会在某个 task 出现时拿出对应的模板、规范和工具。 skill 就是 在帮 agent 做同样的事, task 来了,再把这一小包专用知识加专用流程加载进来。这样做有两个直接好处,第一, task 边界更清晰,输出更稳定。第二,维护成本更低。你改一个 skill, 就 等于更新了一类 task 的 做法,而不是指望模型自己悟。 所以 skill 不是 让模型变聪明,而是让工作变可控。我们用一个很生活化的例子,给一家轻食店做品牌物料。如果这件事每次都从零开始,就会遇到同样的问题,文案风格不统一,视觉元素乱跑,输出物料缺东缺西, 那我们就把它做成 skill。 这个 skill 的 因素很明确,店铺定位、目标人群、主打产品价格区间以及品牌调性 keywords。 它的材料包也很明确, logo 使用规范,配色与字体,几条固定的文案与期限里,常用物料模板,比如海报、菜单、设备封面等等。 流程更像一条 assembly line, 先定一句核心主张,再扩展三条卖点,再落到不同物料的版式与文案,最后用检查清单保证一致性。结果就是,不管谁来做,产出的品牌物料都向同一家店说出来的。很多人卡在这里。我知道 skill 很好,但我没时间写 sop 整理模板,这里有个省力的方法,也手写。让 ai 帮你做 skill。 你只要提供三样东西,第一,你过去做过的几个真实案例。第二,你评判做的好的省下,比如风格和规点,常见错误。第三,你希望最终产出的格式,比如一份流程清单,一套模板,一段可附用的提示词。 ai 擅长把散的经验整理成结构化的模块,它可以帮你抽共同步骤,补缺漏,把隐性规则写清楚。你要做的不是从零写,而是审核和微调,把它校准到符合你的工作习惯与质量线。那问题来了,我到底该从哪里做 skill? 答案通常不是最酷的,而是最平凡的。你可以用一个简单的判断,这件事情上是不是经常做,是不是每次都差不多,是不是出错,代价很大,或者质量波动会让你反复返工。如果是,那它就非常适合 skill 化。 因为 skill 的 价值本质是把一次次重复的脑力劳动变成一次性的整理,然后反复服用。高频工作最容易立刻看到收益,时间省下来,质量也更稳定,你还更容易把经验交接给团队。最后,我们把 skill 压缩成一句话, skill 不是 能力本身,而是把能力模块化、可附用、可按需来加载的方式。 他把你脑子里的经验变成一个可以被调用的工作包,把不稳定的临场发挥变成可控的流程。与时单纯把每次重新想变成每次直接用。当你用这种方式组织工作,你会发现你不是在追逐更聪明的工具,而是在打造一套更稳定的生产。

做 b 端 agent 最危险的一件事是什么呢?就是产品经理活成了算法的需求,助理天天在提 agent, 天天在画 prd。 最后老板一句话,这个 agent 到底给公司带来了什么?你答不上来。那问题其实不在算法,而在于产品和算法根本没在同一张作战地图上面。 那弊端的 agent 想要做成,必须解决三个另一个问题,目标共识,能力打穿数据闭环。那我一句一句猜给你听。第一,目标共识不是做一个 agent, 而是这个 agent 的 价值怎么评估。你问算法能不能做合同解析 agent? 算法说能啊,用大模型, 那到这一步呢?实际上项目就已经满了雷,你必须拉着算法把三件事讲清楚。第一,业务的目标是什么?降本?提效?还是说风控都抵?第二,用什么指标验收准确率?召回率?还是人效提升?第三,容错率有多高,失败谁都抵。 那你们共识不清算法了蛮半年,你呢? p r d 写一堆,上线那一天,老板问一句,所以他解决了什么问题,你们都没办法回答。那第二,能力打穿 agent 项,不是说理化流程,算法型模型,而是跨层拼一整条技术链路。比如说一个智能审核的 agent, 不是 说生成总结这么简单,而是要一起拆清楚,要不要 rag, 知识怎么切?那召回策略谁设计?不确定性怎么兜底? 那规则模型上下文要怎么组合?产品要画出能力的链条,那算法呢,就要能判断每一段能不能跑通这一步,没有打穿的话, agent 呢,只是在看起来很智能的阶段。那第三,数据闭环, agent 上线不是结束,是真正工作的开始。 那产品呢,要设计结构化,反馈失败标记关键买点,那算法呢,就要负责哪些数据能进训练,哪些是噪声,怎么反向优化模型,一起判断是不是模型 base 偏了,还是说上下文缺了,还是用户场景变了,是提 bug 而是一起迭代?那总结一句话,弊 端的 agent 本质不是工具,而是持续进化的系统。那产品不懂这三点呢,一定就会被算法牵着走,懂了的话呢,你才是真正和算法并肩作战的 a ai 产品经理。那最后呢,我也是整理了一个某个大厂要求 ai 产品经理必须要学的一个文档,里面包含了整个 ai 产品的研发流程,大模型的未来发展方向,以及 ai 产品当前存在的一些问题,可以看一下。

agent 从屁都不懂到精通,我是怎么做到的?首先你要做的第一件事就是把网上那些杂乱无章的课程丢掉,真的想学就按这个学习路线走,只要不是三分钟热度,一个月的时间就能从小白进阶成 ai 工程师。首先按照这个流程制定一个学习计划,每日打卡。第一周,打基础,先掌握 agent 的 核心理论, 懂核心组建和大语言模型规划模块、记忆模块、工具级这些基础概念。第二周,吃透 agent 的 工作原理和难点解决方案,拓展学习 react, c o t 等经典 agent 的 范式。第三周,强化学习,了解多智能体协作的逻辑,掌握 prompt 调油技巧,让你的 agent 更精准的输出你想要的结果。 第四周,进行实战,结合所学知识,自己动手完成几个大模型项目,跟着走下来,你就能真正把技术接入实际业务,升职掌心不在话下。如果你还不知道从何开始,我这里整理了学习路线以及配套视频教程,留下六百六十六双手奉上。