这是我用 nba 搭建的一个捕捉 ai 情报的工作流,各种一手的 ai 资讯,包括媒体 twitter、 永冠、 reddit 的 最新 ai 消息,它能二四小时跟踪,自动过滤掉百分之九十的标题党和垃圾广告,把真正有价值有深度的内容 session 翻译整理好, 每天早上九点推送给我, ai 圈有什么大事一目了然。我每天看 ai 资讯的时间从之前的两个小时压缩到三十分钟,所有内容还被自动归档到表格里面, 随时可以回看。那今天我就把这个情报捕捉器毫无保留的分享给大家,不只是爱资讯,需要的话你可以用它来追踪任何你感兴趣的领域哦。那下面这个教程千万不要错过,因为整个搭建的过程细节呢,非常多。为了不让视频过长,完整的操作细节,我放教程文档里面了。 这个资讯热点捕捉器的核心流程是这样的,主要有新收集、预处理、 ai 加工、消息存档与推送这四个部分。新收集会把各个新闻媒体、油管和推特博主的更新内容抓到 nba 里面,筛选出二十四小时以内的 预处理,会把抓过来的数据格式整理对齐,方便接下来的 ai 加工。 ai 加工主要完成了三件事,把外文信息翻译成中文, 把长信息提取成摘要,方便大家看,然后给信息贴上类别的标签,比如说新闻干货。最后存档和推送,就是把 ai 加工后的内容存储到飞书多维表格,然后通过飞书机器人做成简报,发送到群聊来运行一下。 你看作曲的资讯会全自动写入多维表格,几十条信息不用我们自己动手填,还做成了日报,发到了飞书群, 排版清晰,一目了然。优质信息高度浓缩,大家从这些浓缩的高价值一手新闻里面再去挑感兴趣的内容来看,比之前一个个去网站来看,效率呢快了好几倍。那这个工作流我放到文档里面了, 这工作流我是用本地 n 八 n 来做的,因为网页版的 n 八 n 要付费,而本地呢,免费,小白不用担心本地安装 n 八 n 呢,很简单,具体的操作步骤我都放在教程文档里面了,就是复制粘贴,按个回车的事情跟着做就 ok。 装好 nbn 之后,就开始搭建新收集节点,去抓取海外向油管、 twitter 这几个平台的内容。内容抓取主要通过 i s s。 订阅和调用 api 这两种方式。先说 i s s, 可以 用它来订阅某个网站更新内容, 就需要给他目标网站的 r s s。 链接。就这样,一个快递小哥会帮你把网站的新文章、新视频拿到交给你。那新闻媒体甚至油管推的博主的更新 r s s。 通通呢都可以拿到。添加一个 r s s。 节点,这里填一个链接,比如说纽约时报的 r s s。 链接,运行一下 就能够抓取到纽约时报的文章了,很简单吧?那这个链接从哪里找呢?很简单,比如说我要纽约时报的 i s s。 链接,直接搜索名称加 i s s 就 能找到,复制粘贴过来就 ok 了。如果想要更多垂直领域的 i s s。 链接,可以在 feedspot 这里面搜索关键词, 这里呢,什么领域的都有,甚至像婚礼摄像这么小众的都有,那 get up 上的这个项目收集了一些优质的中文 i s s 语言,像虎嗅、三十六课都有,大家可以去找找自己感兴趣的油罐推特博主的 i s s 链接则需要自己拼接或者用第三方工具生成。具体操作教程文档里面都有。 第二种抓网站信息的方式就是 api, api 就是 各平台官方开放的抓取内容的窗口,不是程序员,不用纠结 api 到底是啥哈,你只需要知道他能抓到的信息比 rss 更多。同样是订阅 openid 的 推文账号, rss 只能抓到推文内容, api 还能够抓到推文的观看量、点赞量等等这些数据 像监控各个平台的热点这种 i s s 搞不定的,就交给 a p i。 当然 a p i 的 配置就会比 a s s 要复杂一点,比如说这是我们抓取推特热点的节点,看到这个节点配置是不是很懵,不知道怎么填呢?那具体怎么填都在文档里面有哈。 通过 i s s 或者 a p p 的 方式抓取到信息以后,需要进行信息的预处理,方便接下来的 ai 加工。主要做两件事情,筛选二十四小时以内的信息,并提取必要的列,也就是字段。比如这个 i s s 抓到的信息一共有十个列,但我们只需要标题、链接、日期、内容这几个字段, 那我们通过 n 八的 set 节点来完成。添加一个 set 节点,把我们想要的字段填进去就行。这里点一下运行,我们要的字段就提取出来了。还有几个我们附加的字段,是不是看起来就舒服多了?至于二四小时以内的新 session, 我 们通过 filter 节点来完成,添加一个 filter 节点,这样填写一下就 ok, 那 运行一下就会把二四小时以内的信息都保留下来,其他的都不要。对于简单的 i s s 信息,用 set 加 filter 就 足够了。 而 api 信息一般呢,都会比较复杂,要用 code 结点,不会代码的小白不要怕哈,这里的代码可以让 gpt 来帮忙写,那我写好的这些代码都会放到工作流文档里面,大家可以直接用。接下来就是 ai 把筛选过后的近二十四小时内容进行加工了,主要做三件事,把外文信息翻译成中文, 把长信息提取摘要,给信息贴上类别的标签。很简单,几个节点就可以搞定。首先我们用一个 l l m 链接点来搞定翻译和摘要,添加 l l m 链接点。 然后呢,要配置三样东西,提示词,底层模型,输出格式。提示词好说,让 g p t 来帮忙写,复制粘贴过来就行。底层模型我选到 zip, 在 deepsea 开放平台上面申请一下 a p i 填到这里就可以用了。搜索格式的配置监测到我们前面提到的字段就是标题、日期这些,需要输出哪些就填哪些。 三样东西配置完,运行一下这个节点,可以看到原来的英文都翻译成中文了,长消息也帮我们提取了摘药,那些原本需要我们手动复制翻译等等繁琐的工作, ai 全部帮我们搞定了。 信息的分类用的也是 l m 链接点,这层模型输出格式和前面都一样,但提示词不一样。这个节点的提示词规定了学习分类的判断标准,让 ai 根据这些标准给信息打上相应的分类标签,运行一下,看分类这一栏, ai 已经完美的按照我们的要求,给每一条信息都分门别类贴好了标签。 最后是内容存档,还有推送,存储可以存储到飞书多维表格,挪选等等。推送可以用企业微信飞书或者是邮箱,我是用飞书多维表格来存储飞书机器人来推送内容。那首先我们要用到飞书节点,在设置这里下载飞书社区节点, 然后回到工作流,添加一个非输节点,然后申请非输的 a p i, 获取多余表格的 talk 和 id 来进行相应的配置。具体的操作步骤我也放在教程文档里面了,配置完运行一下就 ok 了。接着来实现推送,先添加一个默值节点, 把来自新闻媒体油管推特的信息合并到一起,然后填入一个 code 节点,填入 gpt 帮我们写好的代码,它会根据我们之前贴好的类别标签自动进行分拣,打包成新闻小报和干货小报。最后添加一个 http 节点,照这样填一下, 他就会帮你把整理好的小报发送给飞速机器人,机器人就会在飞速群里面发消息了。看运行一下小报发到我们的团队沟通的群里面了,陪伴清晰,一目了然,优质的信息高度浓缩 到这里,我们的工作流就搭建完成了。但有个关键的问题就是你一关掉电脑,他就停工了。要想让他像我们开头说的那样每天准时发小报,就必须让他二十四小时自动运行,也就意味着你的电脑得二十四小时一直开着,不能关机或者休眠, 所以更推荐把它放到云端去运行。具体有哪些方案,怎么操作,可以去看教程文档哦。如果你实在不想自己一步一步搭建,你可以直接把我给你的工作流文档导入到 n 八 n, 我 们新建一个工作流右上角这里选,从文件导入,很快就能用上。 大家根据自己想要获取的信息源,调整一下 i s s 和 api 的 细节,那这个信息抓取的工作流就能跑起来了。 好啦,这里是宣讲,大家觉得有用的话请点赞、收藏加关注,我们下期见!
粉丝35.1万获赞204.1万

如果每天零点一过,你的各种 app 就 能自动完成签到领福利。如果每天早上一睁眼,手机就能自动收到一份最新的科技资讯,是不是很过瘾? 以前想实现这些,要租服务器,要学代码。现在有了 ai, 在 搭配上 github 里面这个叫 action 的 神器,即使是完全不会代码的小白,也能轻松过上这种懒人生活。哈喽,大家好,我是专注用动画科普 ai 的 阿 k, 跟紧我,保证给大家安排明白走你! 首先给各位小伙伴科普一下这个 action 到底是个啥?其实它就是 github 给每个注册账号配发的一台云电脑,你只需要给它一个任务,它就会按照你设定的时间,比如每天早上八点自动开机干活,把结果发给你,然后关机。最重要的是,这台电脑的电费、网费、维护费, github 全包了。 咱们主打的就是一个白嫖。当然 action 每月限额两千分钟,但是呢,一般跑个任务长则三五分钟,短则一两分钟,如果你不是重度玩家,两千分钟绰绰有余。 任务呢,则是以代码形式发布的,这放在过去可能还是个门槛,但现在有了 ai 就 完全不是事了。口说无凭,咱们直接上实操。如果我想每天早上八点收到一份过去二十四小时内的科技新闻怎么做?来,大家看这段提示词, 帮我写一个 github action 的 工作流,我需要每天早上八点运行一次。具体的任务步骤是,写一个 python 脚本,抓取过去二十四小时的科技资讯,然后通过 server 酱的 a p i 把抓取到的结果推送到我的某信上联网搜索最新最靠谱的方式,并直接给出完整的代码。 这里有两个地方需要注意,第一,目标要具体,把你想要抓取的网站或者关键词填进去,写的越细, ai 抓的越准。第二,必须加上联网搜索这四个字,大模型那脑子有时候不更新,不让他联网,他给你的代码有可能跑不通。那我就以 jimmy 为例,给大家看看这段题日词的成果。首先,他让我准备一个 server 酱的 key, 看不懂没关系,直接问他怎么获得 summer 的 key, 连网搜索以后回答我,他会给你完整的解答。拿到 key 以后,一定要按照他的操作,把这个 key 作为环境变量存到你的 github 中。不理解没关系,这是为了安全性考虑,照做就行。 第二步是让我们到 github 仓库中创建一系列文件夹和文件。在执行这一步之前,我们需要先到 github 主页创建一个仓库,点击这里的 new 新建仓库,然后输入名字,比如 tech news, 这里选择 private, 表示这是私密仓库, 除了自己,其他人看不到。然后点击创建即可。在新弹出的页面点击 create a code space, 再点击 create a new code space, 最后重新打开你的 tiktok 主页,就能够进入这个仓库了。至于怎么执行接下来的创建文件夹和文件,可以截图发给 jimmy, 然后说,手把手教我这一步怎么操作即可。他给你的操作步骤绝对比我演示的还要详细,而且你遇到的问题还能随时让他帮你解答。那按照他的教学,一套操作下来,你的某信就能收到这样的推送了, 是不是觉得有点简陋?别急,这只是个毛坯房,你们就可以继续给 ai 提要求进行豪华装修。比如你想多抓几个网站,或者只是想看包含人工智能关键词的新闻。甚至如果你是手里有 a p i k 的 氪金玩家,还可以让他把抓来的新闻自动嚼碎了,分析透了,生成一份深度研报,直接喂到你嘴里。 那除了信息抓取,它还能干什么呢? app 自动打卡了解一下。直接把这张题日词甩给 ai。 写一个 python 脚本,利用 request school 携带 cookie 模拟登录某 app 并签到,然后写一个 get up action 配置,每天凌晨零点自动执行。特别注意,请教我如何在 get up secrets 里安全存放 cookie? 要铭文写在代码里,一定要联网搜索以后提供最佳方案。这里的某 app 大家可以自己换啊。受限于篇幅,我就不一一演示了。那如果你还有蹲 steam 游戏的史低价格或租房的时候第一时间抢到新上架的房源这类需求,也可以给 ai 这样一段提示词, 写一个监控脚本,每隔十五分钟检查一次目标网页的价格数字,如果价格低于预期值,立刻发邮件通知我。为了防止被封 ip, 请在脚本中加入随机 user a 箭头,一定要联网搜索以后提供最佳方案,到时候只要数据一变动,邮件立马发到你手里。 这就相当于你在云端安插了一个二十四小时不眨眼的狙击手,任何漏网之鱼都别想跑掉。最后,为了账号安全,有两条红线绝对不能碰哈! 第一,绝对不要滥用资源,不要运行高频请求脚本,比如抢票这种,一旦被检测到 get up 会直接封号,绝无申诉机会。第二,严禁泄露隐私。任何 token 密码、 cookie 必须且只能存放在 secrets 变量里, 千万不要把私密信息铭文写在代码里,否则信息一旦泄露,后果不堪设想。那我做这期视频不是为了教大家省那点服务器费,而是想证明在 ai 时代,技术门槛已经被无限拉低。我们不需要每个人都精通代码,但必须成为懂得指挥 ai 的 产品经理。 工具只是手段,解决问题的思路才是核心。 ok, 那 以上就是本期视频的全部内容了,我是专注于动画科普 ai 的 r k 无惊无险又到六点,下了个班儿。

如何让 ai 帮你打造你想要的 skills? 首先我们了解一下 skill 到底是什么,其官方的解释就是一个文件夹,这个文件夹包含了 ai 帮你完成动作时需要的指令、脚本和需要的资料。这个文件夹包含了最主要的文档,就是 markdown, 文档名称为 skill, 里面存储的就是 ai 执行任务的操作说明书,其余的就是执行这个说明书需要的各项资源。 skill 能够帮助你快速地完成一个标准化的任务, 比如你每天都要处理的一批数据,或者每天都需要查看收集的新闻,将其转化成标准的指令给 ai, 你 就只需要轻轻一敲就可以获得结果。上一条视频也有朋友提到, m c p。 m c p 和 skill 应该是可以组合的关系,帮助 ai 获取更多的资料和资源。 这个视频我将展示搭建一个简单的收集 ai 资讯的 skill, 自动收集并生成文案。首先先简单描述我想要 skill 完成的任务, cloud 反馈给了我一个完整的 skill 文件夹包含的所有文档, 同时给出了基础的步骤来完成我的诉求。紧接着我说我希望我可以给你链接,这样可以直接读取已经筛选过一遍的内容。我们就得到了需要 m c p 进行协助的反馈。这很简单,要求 cloud 告诉我们如何配置即可, 按照要求在终端配置即可。同时我们继续细划 skill, 我 要求他把整个任务拆解出来,这样我们可以一步一步地细划,可以看到他把任务拆解成了八个模块,分别是原数据、信息源、评估维度、 图纹模板、视频脚本、工作流程、快捷指令和注意事项。比如这一步要进行确认,能访问我要求的信息平台来一起确认,保证需要的信息员可以顺利获取。其次,修改了我对信息优先级的要求,把 github 上的内容排到了第一。 同时,如果你想定向收集一些媒体的信息,你可以提供一个名单给他,也就是 skill。 可以 有自己内置的数据资料库,同时配 m c p, 就 有了外部获取资料的能力。像这样每一步进行确认。如果你不知道自己的任务有哪些准确的要求,你也可以要求 ai 反问你来获得答案。或者像我一样 直接给他账号背后的产品背景、面向群体以及目标给 ai, 让他阅读资料,自己理解,他会自动根据资料准确定位,有可能比你给出的更加准确。可以看到他给出了非常详细的拆解不同平台的账号风格和预设场景。文案模板包含了详细的文案 tag, 包括帮你寻找可用的素材,基本上是一份完整的账号策划书了。这些自动生成的内容就算不能直接发,也省去了百分之八十构思和寻找素材的时间。进行筛选和润色,就可以完成之前繁琐的任务。 同时也打开了人的思路,构建了庞大的素材库,供你选择和思考。用户输入指令, ai 收集资讯、评估、咨询价值。文案和视频脚本生成最后输出 非常清晰的流程,并且还有使用的快捷指令,一个 skill 就 完成了定向内容的收集和处理。加工。不会配置也没关系,它会为你生成配置文档, 只需要扔给 cloud code 就 自动配置。完成了,后续我会继续更新。如何优化一个 skill, 让它自动录入到素材库,同时可以录入数据,搭建动态的账号数据内容库。这就是最终版本获得的数据库, 能够看到每一个资讯下自动生成的文案,包括多个平台的文案,同时标注了优先级别,还可以录入数据,形成自己的账号记录。都去找 ai 试试吧。顺便打个小广告,我们团队新上线的 a p i 站点,支持多个先进模型,感兴趣的可以看评论区。

最近 cloud code 非常火,相信关注编程 agent 的 同学应该都已经上手体验过了,不过要把这个工具从入门真正落地到生产环境,光会敲几个简单的命令是远远不够的, 所以这期视频咱们不整虚的,直接带大家从头到尾把 cloud code 的 实战流程彻底走一遍。这个视频呢,一共是分为以下四个部分,第一,环境的搭建与基础交互。 第二,复杂任务处理与终端控制。第三,多模态与上下文管理。最后呢是高级功能的扩展与定制,大家可以看到屏幕上密密麻麻的知识点和时间戳, 这期视频的含金量呢绝对是拉满的,只要你花点时间看完这期视频,我保证你能够彻底吃透 cloud code, 把它变成你手心里最顺手的生产工具。 另外我知道市场上还有其他类似的编程 agent, 比如 codex、 open code 等等,其实它们无论从功能上还是使用上都跟 cloud code 没有什么太大区别,所以我相信在看完了这期视频之后,你一定会一通百通,同类的产品基本上都能够直接上手。好话不多说,那我们直接开始。 首先我们来到 cloud code 的 官方网站,就是这个页面了,然后呢,我们点击这里面的复制按钮,再回到终端粘贴,这样呢就开始安装 cloud code 了。 安装完成后,我们试着用它来做一个代码软件。首先使用命令 m k d i r 来创建一个目录,就叫做 my to do 就 好了,我们所有的代码呢,都放在这个目录里面, 然后我们进入到这个目录里,再执行 cloud 这个命令来打开 cloud code。 刚进来的时候, cloud code 可能会提示你进行登录,如果你像我这样没有被提醒的话,可以执行杠 login 命令来主动触发登录流程。 呃,可以看出啊, cloud code 官方一共是提供了两种标准的接入方式。第一种呢是订阅制,如果你购买了 cloud 的 pro 或者是 max 会员,那就直接选这个就好了。第二个呢是使用官方的 api key, 按照 token 的 用量计,费用多少花多少。 我呢是订阅用户,所以我选择第一项。选择之后, cloud code 会弹出一个网页提示,我授权,我们同意。 可以看出登录成功,我们关掉当前页面,回到终端,这里按下回车登录呢,就结束了。这里顺便提一下, 有些同学可能没有办法使用 cloud 的 官方订阅或者是 api, 这个时候呢,你也可以使用国产模型来驱动 cloud code, 比如说是 g, l, m, mini, max 等等。 cloud code 是 一个通用的编程 agent, 它本身其实并不跟 cloud 的 模型绑定,你完全可以使用其他的模型来驱动 cloud code。 具体使用国产模型的方法呢,这里就不再赘述了,其实很简单,设置几个环境变量就行了,网上一搜一大堆, 有需要的同学可以自己搜索一下。好,言归正传,我们再回到 cloud code 这里开始使用它。前面的我们说过,我们要做的是一个代办软件,那我们现在就把这个需求告诉 cloud code, 让他帮我们实现。给我做一个代办软件,使用 html 实现。可以看到 cloud code 开始工作了,让我们稍作等待。 cloud code 想要创建一个叫做 index dhtml 的 文件,询问我们是否同意, 这里面呢?一共有三个选项,第一项 yes 是 单词授权,意思就是说只同意创建当前的这么一个文件,如果它接下来还需要创建其他文件的话,它还会再次向我们询问确认。 第二项呢是 yes allow all edits during this session。 选中了它就意味着在本次的对话期间,后续所有的文件操作都会自动通过,不会再反复打扰我们。 第三项是不同意,选择了它之后,你可以继续输入你的想法, cloud code 会根据你的输入生成代码,并再次向你确认。呃,为了演示方便,我们这里就选择第二项,开启自动模式,把后续的工作全权交给他 好。选完之后注意看,输入框下方多了一行字,就是这个 accept and it's on。 这个呢,就表示目前的自动同意模式已经开启了。那如果说你后悔了,想换一个模式怎么办呢? 这个时候就要用到 shift 加 tab 键来切换模式了,我们来按一下试试看。现在变成了 play mode, 也就是规划模式,这个模式主要用来探讨复杂的方案,只聊天不执行。具体用法呢,我们后面再细讲。我们再按一次, 注意看,底部的 play mode 消失了,取而代之的是一行灰色的提示问号 for shortcuts, 也就是按问号显示快捷键。大家千万别误会,这个呢并不是什么快捷键模式,这行字呢,只是 cloud code 的 一个小提醒而已,跟当前的模式没有关系。 呃, cloud code 其实在这个时候没有标注当前的模式,而这种没有标注的模式就是默认模式。 不知道你还有没有印象,我们刚进入 cloud code 的 时候用的就是默认模式,在默认模式下, cloud code 表现的最为谨慎,每次创建文件或者是修改文件的时候,它都会先去询问用户的意见,所以大家看出来了吗? shift 加 tab 就 在这三种模式之间循环,让我们稍微总结一下。 第一个是默认模式,也就是显示问号 for shortcuts 的 那个模式,在这个模式下,创建和修改文件之前一定会询问用户最为稳妥。 第二个呢是自动模式,也就是那个 accept edit on, 在 这个模式下, cloud code 会自动创建或修改文件,不会去询问用户,最为方便。第三个是规划模式,也就是那个 plan mode on, 这个模式只讨论不修改文件,适合构思 这个模式,我们后面会详细解释。好。这个呢就是 cloud code 的 三种模式了,我们再按一次 shift tab, 来到 accept add its on 模式。选择好模式之后,我们再回头看看之前 cloud code 给我们写好的文件,我们要打开它, 那怎么打开呢?你可以去文件管理器里面找到这个文件,双击打开它。不过这里我想要教另外一个方法,我们可以直接在 cloud code 里面执行终端命令来打开它。首先呢,我们输入一个叹号, 看 cloud code 有 反应了,现在我们处在 bash 模式下,可以运行任意的中断命令了。紧接着我们来输入 open index 点 html 来打开这个 html 文件 代码。软件做的还算不错,一次成功,这不得不给 cloud code 点个赞。不过这里面有个小坑,他把所有的代码都写到 index 点 html 里面了, 小项目还好,要是项目做大了,维护起来简直是个灾难,所以咱们最好趁早是换成 react, type script 和 white 这种现代架构,把代码分模块儿管理, 我们可以直接向 cloud code 提出这个请求,让它改掉。不过呢,改架构是个大工程,最好是先确定细节再动手。这个呢,就是 play mode 登场的时候啦, 它就是专门用来讨论方案,确定细节的。让我们先关掉当前页面,回到终端这里,然后按一下 shift 加 tab, 进入到 play mode。 然后呢,输入我们的请求,将当前的代办应用重构为使用 react 加 type script 加 white 的 项目。 呃,问题到这里还没有结束,这个时候呢,我们想换行。怎么换行?敲回车吗?敲回车显然是不行的,敲回车的话,我们的问题就提交了。换行呢,是需要按 shift 加回车,然后我们就可以继续写了,保留所有的现有功能。 呃,这里顺便提一句,如果你按 shift 加回车不好用的话,那你大概利用的 cloud code 版本比较旧,需要升级一下。 呃,另外还有一点,有些同学可能会觉得这个终端的输入框实在是太难用了,想用一些比较现代化的编辑器来替代它。这个呢,其实也是可以的,我们可以按一下 ctrl 加 g, 这个时候 cloud code 就 会打开一个 vs code 的 标签页,在这里面编辑就方便多了,回车随便按,也不用担心不小心提交问题了。当然,这要求你先事先装好 vs code, 我 们就在这里把要求补充完,再加一句,且 ui 风格保持一致。 写完了之后,我们保存,然后关掉这个标签页。此时 cloud code 就 会把 vs code 里面的内容全部放到输入框里面,我们直接再按个回车就可以提交请求了,可以看到 cloud code 开始工作了,让我们稍等一下, 计划似乎是产好了,我们把滚动条往上移一移,看一看它这个计划具体是个什么样子的。 这个计划呢,是从这里开始看起来还是挺完善的,目标项目清单、目录结构之类的信息全部都有覆盖。到最后他询问我们是否要执行, 他一共给了我们三个选项,第一个是执行计划,并且进入到同一模式,后续修改文件前就不再询问用户了。 第二个也是执行计划,只不过后续会使用默认的模式,也就是说之后每次写完文件前都需要询问用户。第三项是继续修改计划,如果你对计划不满意的话,那可以在这里面继续输入, cloud code 会根据你的要求再修改这个计划,产出一份新的。 这里假设我们对计划不满意,选择第三项提出我们的修改意见,给每个蛋白事项增加一个优先级,比如高中低,并且用不同的颜色标记出来。然后我们按一下回车,这个时候呢, cloud code 就 开始修改它的计划了,让我们再稍微等待一下。 好, cloud code 又产出了一份计划,具体内容呢,我们就不看了,单从最后的测试部分我们就可以看到,它确实是把我们的优先级的需求考虑进去了,这次差不多了,要不我们就同意吧。 让我们选择第一项执行这个计划,并且进入到自动同意模式,也就是说后续修改文件的时候就不要再询问我们了。好,回车可以看到当前模式切换到了 accept edit it's on, 没问题,这个呢,跟我们的选择是一样的,后面写入文件的时候呢,便不会再麻烦我们了。 现在 cloud code 开始执行计划了,时间估计会比较长,我们慢慢等待一下。 cloud code 暂停了,他现在想用 m k d i r 来创建目录,然后询问我们是否同意。 稍微等一下,这个是什么情况?我们不是跟 cloud code 说过了吗?不需要每次都询问用户的。还记不记得我们是在 accept add it on 这个模式下面,那怎么现在又开始询问了呢? 对,我们确实是说过,不过那只不过是写入文件的时候,不需要询问用户,这个呢,是在执行终端命令。 cloud code 认为执行终端命令呢是一个比较危险的操作,所以需要征得用户同意才会继续。 不仅如此,这里面还没有一个自动执行所有终端命令的选项,即使是第二项,那只不过是告诉 cloud code 以后都可以自由地访问 s r c 目录,不需要询问用户。至于执行别的命令,那还是要问的。 如果你觉得每次选择都太麻烦的话, cloud code 其实是提供了一个比较隐蔽的选项,可以跳过这个选择的步骤,让它想执行什么命令就执行什么命令。这个呢,是需要在启动 cloud 的 时候加上一个选项,叫做 dangerously skip permissions。 我 来给大家新开一个终端标签页演示一下。 我们先进入到原来的这个 my to do 目录里面,然后我们来输入 cloud, 再加上 dangerously skip permissions, 意思就是跳过所有的权限检测,大家注意看这个参数里面的单词, dangerously, 也就是危险的。 官方把危险两个字写在了脸上,意思非常明确,一旦加上了这个参数, cloud code 就 彻底放飞自我了。 进来之后你会发现模式变成了 bypass permissions, 这就意味着接下来它执行任何终端命令都不会再征求你的意见了,无论是安装依赖还是删除文件还是创建目录,都不会再问了。 这个呢,其实是一把双刃剑,往好了说,它能够极大地提升开发效率,全自动干活,不用你一直盯着点。同意, 但是往坏了说,他理论上呢,就拥有了和你一样的终端权限。虽然 cloud code 只有在极度发疯的情况下才能去破坏你的电脑,这种概率呢,可以说是微乎其微。但是作为一个负责任的博主,我必须要提醒大家,这个选项会让 cloud code 彻底的放飞自我。所以理论上呢,还是有一定的危险性的, 是否要为了效率承担这一丢丢的理论上的风险?决定权是在你们手里。好,演示完毕,回到我们原的例子里,我们呢,还是不用这个选项了,我们来选择第二项,只同意它以后可以自由地访问 s r c 目录。回车让 cloud code 继续。 cloud code 询问我们能不能执行 n p m 引导命令,我们选择以后都同意。 这里 cloud code 想要使用 npm run dev 来启动服务器,启动了服务器就可以查看网页的效果了,启动也行。不过呢,这里我们先取消,待会我想用它来给你演示如何手动启动它,并且借这个机会来解释任务相关的一些概念。 cloud code 看我们拒绝了,在询问我们应该要做什么,我们来跟他说一下这个命令呢,等会我自己执行,你确保其他部分都完成了就可以了。然后呢, cloud code 就 开始确认了,好,确认完毕,看起来一切正常。现在我们就可以自己来运行这个命令了,我们来试一下 服务器启动成功,我们来点击这里面的链接,看一下效果怎么样。不错,效果还可以,我们来随便点点,看起来没有什么问题,增加个代办事项也是可以的。 然后呢,我们可以再增加一个其他的代办事项,调一下优先级,再添加,一切完美,我们再回到 cloud code 这里,这里有一点需要给大家强调下, 这个服务的运行呢,是会堵塞 cloud code 的, 比如说我们在这里输入一个 hi, 你 看 cloud code 没有给我们任何回应,那是因为服务还在运行, cloud code 就 没有办法处理这个新的请求。那怎么办呢?很简单,看这里按 ctrl 加 b, 可以 把这个服务放置在后台,我们按一下试试, 好像是起作用了。 cloud code 开始处理我们的请求了,它给了我们一个回复,而且注意这里有一个后台任务正在运行, 我们输入杠 tasks 就 可以查看这个任务。在这里面可以看出,这确实是我们所启动的那个 npm run dev 的 命令, 注意这行提示,按 k 可以 关掉这个服务,不过我们目前还不打算关掉它,我们按 esc 回到原来的那个界面里面,就让这个服务先一直跑着吧,这样的话呢,我们后续的修改也能够实时看到效果。 那现在假设我们想加一个切换语言的功能,目前使用的是中文,我们希望它能够在右上角切换为英文,让我们来输入请求,在页面右上角增加一个切换语言的选项,用户可以选择中文或者是英文,默认为中文。回车, cloud code 开始运作了,让我们稍作等待。 好,可以看到 cloud code 改完了,我们回到页面这里看看。效果不错,确实是加上了切换语言的选项,而且切换的效果呢,也是符合预期的。 不过你转念一下,不对,我的用户都能看懂中文啊,我加这个功能干什么呢?要不就回滚吧。 好吧,那 cloud code 能回滚吗?当然是可以的,对应的命令呢,就是 go reverse, 或者是说呢,有个更简单的办法,你可以直接按两下 esc, 这样呢就进入到了回滚页面。我们每次输入请求的时候, cloud code 都会创建一个回滚点,比如说我们不是想回滚到增加语言选项之前的那个版本吗?那就选择这个回滚点就好了,选好之后按下回车。 然后呢, cloud code 会给我们四个选项,是回滚代码和绘画,还是说是只回滚绘画还是只回滚代码,或者说呢,我们就放弃回滚,我们来选择第一个代码和绘画都回滚。 好,现在回滚成功了,让我们来验证下。打开页面没问题,确实是回滚成功了,没有那个切换语言的选项了,是不是很棒呢? 好,假设,这个时候啊,你觉得 react 加 type script 加 white 这套架构好像是有点过于复杂了, 你在想要不干脆我们就回滚到只有 index 点 html 的 那个版本就好了。好,那继续用回滚功能就行了。不过呢,在这之前,我们最好把 npm run dev 这个后台任务给关掉,毕竟回滚之后相关的文件都没了,这个后台任务呢,也就没有什么用了。 我们回到 cloud code 这里,输入杠 tasks 来查看后台任务,然后再按 k 结束掉当前的这个后台服务。 呃,这个时候 cloud code 提示我们开发服务器运行正常。这个呢,纯属是 cloud code 晕了啊,大家忽略它,我们的开发服务器现在实际上已经被关掉了。服务器关掉之后,我们就可以开始回滚流程了,先按两下 esc, 然后选择一开始重勾代码的那个回滚点。 然后呢,我们再选择第一项恢复代码和绘画。好看起来呢,是已经回滚完成了。我们来看看当前目录下是不是只有 index 域是天秒这个文件。我们使用 ls 这个命令, 这个命令呢,可以用来列举当前目录下的文件列表运行。看结果好像是不太对啊,除了 index 底下是天秒文件,这个目录下还有很多其他的文件,它默认只显示了一部分,我们可以按一下 ctrl o 来显示所有的文件列表, 看起来总的文件数量还不少呢。这个是怎么回事呢?难道是 cloud code 出 bug 了吗? 其实不是,这些文件呢,是之前用终端命令创建的,比如说是 m k d i r n p m install 之类的 cloud code 呢,只能回滚它自己写入的那些文件。至于由终端命令生成的文件, cloud code 是 没有办法回滚的。 所以呢,我建议大家还是不要太依赖 cloud code 的 这个回滚功能了,如果要精准回滚的话,大家还是使用 git 会更好一点 好。不过呢,问题其实不大, index html 呢,是 cloud code 自己把控的,所以呢,这个文件一定是回滚成功了,我们把别的文件都删掉就行了, 说干就干,让我们打开文件管理器,删掉除了 index html 之外别的文件。然后呢,再回到 cloud code 这里,执行一下 ls 命令,可以看到文件确实只剩一个了。然后这个时候呢,我们可以使用 open 命令打开这个 html 来验证一下它的效果。 没问题,跟我们之前的那个 index 表 tm 的 效果呢是一样的,到这里回滚才算是彻底结束了。好,回滚呢,我们就讲到这里,现在假设你对 cloud code 做的页面一直都不太满意,所以呢,你去 figma 上面自己画了一个界面,就大概是这个样子的了, 你希望 cloud code 仿照这个界面来做,那具体该怎么实现呢?很简单,我们只要把这个设计稿图片传给 cloud code 就 可以了。首先我们需要在 figma 上面操作下,把当前的这个设计稿导出为一个 png 图片, 导出的方法很简单,就按这个 export frame 就 可以了。然后呢,我们回到访答这里,可以看到图片导出的非常成功,下面我们的任务呢,就是把这个图片传给 cloud code。 那 怎么做到这一点呢? 有两个方法,其中第一个方法就是直接把这个图片拖到 cloud code 这里,看到这里面的 a 位二了吗?这就代表 cloud code 已经接收到我们的图片了,这个呢只是其中的一个方法。还有另外一个方法呢,就是复制这个文件, 然后来到 collab 这里,按 ctrl 加 v 粘贴。注意啊,这里面我说的这个快捷键呢,是 ctrl 加 v, 不是 command 加 v。 即使你用的是 micros, 你 也要用 ctrl 加 v 来粘贴这个图片,按 command 加 v 是 不起作用的, 这一点要记住了。这样呢,我们就可以继续输入请求,让 collab 根据图片来修改代码儿。 具体的过程我就不演示了,这个方法肯定行得通。不过说实话,很多时候呢,可能还原的并没有那么精确,比如说字体啊,间距啊之类的, cloud code 很 难通过图片做到非常精确的把握。 所以这个时候呢,我们其实还有另外一个方法,一个更为精确有效的方法,那就是使用 m c p 来实现这个还原 figma 设计稿的需求。 m c p 是 大模型与外界沟通的渠道,我之前讲过 m c p 的 使用方法和相关原理,感兴趣的同学可以自己看一下。 figma 提供了一个很好用的 m c p server, 我 们可以接入进来用用。首先呢,我们是需要安装这个 m c p server, 根据 figma 官方的要求,我们需要执行这一行命令, 因此呢,我们先把它复制一下,然后回到 cloud code 这里,先按两下 ctrl c 退出,然后执行这行命令。 可以看到, mcp server 已经是安装成功了。之后呢,我们需要重新打开 cloud code, 不过好像之前的对话全都没了呀,这可怎么办呢?别担心,我们可以使用杠 resume 命令来回到之前的对话。这里面的第一个就是我们刚才的那个对话了,我们按回车来选择它,你看这个对话不就回来了吗? 呃,另外啊,还有一种更为简单的办法,那就是在启动 cloud code 的 时候呢,加上一个参数,我们来试一下。首先退出 cloud code, 然后呢我们执行命令 cloud 空格杠 c, 这里面的 c 呢就是 continue 的 缩写,它的功能就是打开 cloud code, 并自动恢复上一次的对话。好,对话恢复了,我们执行杠 m c p 命令,来查看目前所安装的 m c p 工具, 目前呢只有一个,就是我们刚刚安装的 figma, 可以 看到我们需要健全才能够使用这个工具。我们来选择这个 m c p 工具,然后呢再选择 authenticate, 这个时候呢会自动弹出一个页面,让我们授权我们同意, 然后再回到 cloud code 这里执行杠 m c p, 选择 figma, 这个时候呢可以看到 m c p server 呢就是一个可用的状态了。我们选择 view tools, 就 可以看到这个 m c p server 内部所包含的工具列表, 其中有用来截图的,有创建设计规则的等等,具体呢我们就不看了,我们其实也不用太关心到底该使用哪个工具来完成我们的需求,我们让 cloud code 来判断, 所以呢,我们按 esc 退出这个界面,然后输入我们的需求,修改当前的页面,使它与 figma 搞件保持一致。啊,问题还没完,我们现在回到 figma 页面这里复制这个设计稿的链接, 就点击这里面的 copy link to selection 就 好了。然后呢再回到 cloud code 这里粘贴,再回车,这样呢应该就可以了,可以看出 cloud code 开始工作了, 它首先呢是发现了我们的 figma m c p 可以 解决这个问题,请求调用 get design context 这个 m c p 工具来实现,需求我们同意, 然后呢, cloud code 请求调用 get screenshot 工具获取对应设计稿的截图,我们也同意。 现在调完两工具之后呢, cloud code 就 获取到了全部的设计稿信息了,其中不仅包括设计稿的截图,还有各种组建的间距、字体样式等,非常的详细。拿到这些信息后, cloud code 就 开始紧锣密鼓的修改现有的 html 代码,使它与 figma 设计稿相同,让我们稍作等待。 好,看起来是完成了,我们来到浏览器那边看一下效果怎么样。 这个呢,就是 cloud code 根据 figma 设计稿所搞出的页面,我把原始的设计稿也放在这里,大家可以比较一下,看看效果怎么样, 反正我觉得还原程度还是挺高的。当然这个页面还有一些细节需要打磨,比如说里面的 undefined, n a n 之类的,可能需要修改一下,但整体效果我觉得真的还是可以了。 好,那 m c p 呢?我们暂时就讲到这里,下面我们来看一下上下文压缩。在之前我们写了很多的代码,然后 cloud code 呢也调用了很多的工具,相信这个时候呢, cloud code 的 上下文里面就有了非常多的信息,这里面有一些是有用的,有一些其实没什么太大用处, 我们可以根据需要对上下文做一些压缩,这里需要用到的命令是杠 compact, 我 们可以直接去执行这个命令,也可以选择性的在它后面追加一些具体的压缩策略,比如说是重点保留用户提出的需求之类的。 呃,不过我们就不在后面加需求了,我们就直接执行这个杠 compact 命令,看一下它的效果怎么样。 压缩完成了,我们按一下 ctrl 加 o, 就 可以看到压缩后的上下文内容,这个呢就是压缩之后的结果了。 呃,我们之前呢,在上下文里面有很多的信息,有代码,有 m c p 的 调用结果之类的,现在呢,全部的内容就只剩这么一点了。 这样的话呢,不仅 cloud code 的 性能有了保障,后面在执行任务时, token 的 消耗量也会少很多。好,现在我们按一下 ctrl 加 o, 再回到原来的这个界面里。这里再提一下关于上下文的另外一个命令,就是这个杠 clear, 他呢做的更为极端,就会直接把所有的上下文内容都给清空掉。一般来说,如果我们后面的任务跟之前的上下文并没有什么关联的话,我们就可以使用这个 clear 命令来清空所有的上下文内容。 这个命令我们就不演示了,毕竟我们还需要之前的上下文,演示了之后,那就什么都没了,我们还是保留这个压缩后的结果好。现在压缩完成了,但是压缩结果的可控性并没有那么强,比如假设你想手动改改这里的压缩结果, cloud code 可并没有给你提供这个选项。 另外,无论亚不压缩上下文呢,都跟某个绘画绑定,我们下次进入到 cloud code 的 时候,还必须要来到这个绘画,否则 cloud code 是 不知道之前发生了什么的。那有没有什么办法可以解决这些问题呢? 有没有一种方案可以让 cloud code 每次进来的时候都读取一些我们自己设定的一些信息,这样 cloud code 就 知道这是一个什么项目,用户有什么需求,我们甚至可以把各种注意事项都写在这里面。了解了这些信息之后, cloud code 就 可以更好地为我们工作了。有这种方案吗? 当然是有的,这个呢就是 cloud d r m d。 我 们来尝试使用一下,我们首先让 cloud code 自己生成一份 cloud d r m d 文件,用的是杠 in it 命令。 好, cloud code 创建完毕了,我们来打开 cloud md 文件看一下,它就放在当前目录里面, 看起来内容是有模有样的,不过很可惜,它的语言呢是英文,看起来不太方便,我们要不让 cloud code 再把它给转成中文? 转换完毕,我们再回来看一下,没问题,确实是中文了。另外提一下,这里面的内容呢,是可以随便修改的,比如说我们可以在最后面加上一句注意事项,每次回答到最后,必须要追加这么一句 happy coding, 然后我们回到 cloud code 这里先退出,然后再重新进入,这样 cloud code 就 会重新加载我们那份最新的 cloud 点 md 文件。我们来随便给 cloud code 说一句,比如说是 hi, cloud code 回答了它,最后呢,确实是加上了 happy coding, 可以 看到我们的 cloud 点 md 真的 是起作用了。 所以呢,如果你有什么东西是希望 cloud code 每次都读取的,那就直接放到 cloud md 文件里就好了。 试验完毕,现在我们把 cloud md 结尾中的那个注意事项去掉,要不每次都出现 happy coding, 会影响我们后续的演示。我们可以直接找到 vs code 编辑 cloud md 文件。不过这里嘛,我想顺便教大家另外一个打开 cloud md 的 方法, 我们在这个输入框里面输入杠 memory, 在 这里可以看出 cloud md 文件呢一共是有两种,一种是项目级别的,对应的文件就放在当前的目录里,对当前项目生效。第二个呢是用户级别 对应的文件放在用户目录里,对当前用户生效。我们之前用的是第一个,所以选择第一项,选择好了之后,对应的 cloud md 文件就自动打开了,这样呢,就不用每次都自己在文件管理器里面找了,会稍微方便一点。 打开 cloud 点 m d 文件之后,我们删掉最后面的注意事项保存,再回到 cloud code 这里重启一下, 然后再随便问一句,可以看到 happy coding 已经没了,这说明我们的修改已经生效了。那 cloud 点 m d 文件就讲到这里, cloud code 还有个 hook 功能,允许用户在运行工具前后等时机执行一段自己指定的逻辑,比如说我们可以用它来做自动格式化,也就是说在 cloud code 写完代码之后,自动执行我们设定的格式化函数,以便让最终的代码更加美观,更加符合我们的需求。 首先我们执行杠 hooks 命令,进入到 hook 的 配置页面,这里我们可以配置 hook 的 执行时机,比如说是工具使用前,工具使用后,工具使用失败发送通知等等。我们来选择第二项 post to use, 也就是工具使用后来执行这个 hook。 然后呢,我们再选择 add new matrix, 这里面呢,我们需要选择对应的工具,也就是说我们希望在哪个工具执行之后再运行我们的 hook 逻辑,我们填写的是 write 或者是 edit, 也就是说在创建或者是编辑文件的时候来执行这个 hook。 然后呢,我们再选择 add new hook, 这里输入我们具体的格式化命令。这 这个命令看起来很长,我们来仔细分析下。首先在运行的时候, cloud code 会给我们传这么一份 json 过来,其中的 file path 就是 cloud code 刚刚编辑好的文件路径,因此我们需要解析这个 json 结构,把其中的 file path 的 值给取出来。我们刚才命令里面的这一部分就是用来干这个活的, 其中 jq 是 解析 json 的 一个程序,不熟悉的同学可以自己查下。获取到文件路径之后,我们把这个文件路径通过 x arcs 传递给 preder 命令,然后剩下的工作呢,就是只用 preder 来格式化这个文件的内容了。 所以总结下来,这段命令其实就是使用 jq 来获得当前编辑好的文件路径,然后再使用 preder 来格式化这个文件。 好,讲完了,让我们再回到 cloud code 这里,写好代码之后,我们按回车确认。此时 cloud code 会询问我们应该把这个 hook 保存在哪一级,一共是有三个选项, 第一个呢是本地的项目级别,也就是说这个 hook 只会在本机本项目生效。选择这个选项之后, cloud code 会把配置放在项目目录里面的 settings, 点 local, 点 json, 加入到 get 的, 点 get ignore 文件里面, 所以呢这个文件不会共享给别人。第二个呢是项目级别,也就是说所有使用这个项目的用户呢,都能够用到这个 hook, 它对应的配置文件呢是 settings there jason, 这个文件呢会随着 get 分 发给所有人。 第三个呢是用户级别对当前的用户生效对应的配置保存在用户的目录里面,每一个用户都有一份,不会互相影响,也不会跟着项目保定。我们来选择第二个,所有使用这个项目的人呢,都能够用到这个 hook。 然后呢,这个 hook 就 算是创建好了,我们按 esc 退出。 最后呢输入请求来试一下。我们的请求是创建一个新的文件 test, 点 html 里面随便写点 html 就 行,所有的内容都写在一行里面。回车,我们来稍微等一下, 通过这个写入文件的请求就可以看出, cloud code 确实是把所有的内容都写入到一行里面了,我们同意执行完毕。我们来看看最终生成的 test 点 html 的 文件内容。 可以看到这个文件的内容呢已经被格式化好了,并不是像一开始 cloud code 写入的那样只有一行,这说明我们刚才写的那个 hook 生效了,在 cloud code 写入完代码之后,我们的 hook 启动把那个文件给格式化了,所以呢,我们现在看到的就是格式非常漂亮的 html 代码。 hook 的 功能呢,就讲到这里,现在假设你每天都想写一个总结,记录下今天开发了哪些功能,而且呢,这个总结必须要遵循一定的格式,比如一定要包含日期开发招标开发详情之类的。 你可以把对应的格式要求直接粘贴在这个输入框里面,让 cloud code 帮你写一份,只不过这样的话,你每天都要重复粘贴一遍,很麻烦。这种事情其实非常适合使用 agent skill 来解决,我之前出过一个系统性讲 agent skill 的 视频,有兴趣的同学可以看一下, 不过没看过也没关系,你可以大致把它理解为一个给大家看的说明书,一个动态加载的 prompt。 我 们来创建一个 agent skill 试一下。 首先我们新开一个终端 tab, 使用 m k d r 命令,在用户目录下的 their cloud skills 文件夹下面创建一个新的文件夹,就叫做 daily reports。 我 们使用 vs code 来打开这个文件夹, 然后呢,在这个文件夹下面创建一个叫做 skill 点 md 的 文件,在这里面填入这样的一些内容。 这个文件呢,一共分为两部分,前面的 name 和 description 分 别代表这个 agent skill 的 名称和描述, cloud code 会根据这一部分的内容来决定是否要使用这个 agent skill。 后面呢,就是这个 agent skill 的 具体描述了,这里主要是写了日报需要遵循的格式。 写好了之后,我们回到终端,关掉这个新开的标签页。然后呢,再重启一下这个 cloud code, 然后输入杠 skills, 可以 看到 cloud code 已经发现了我们的 agent skill。 然后呢,我们回到输入框,这里面打入我们的请求,写一份每日总结,回车开始执行。 可以看出, cloud code 发现了这个请求与我们刚才录的那个 agent skill 相关,请求使用这个 agent skill, 我 们同意。 然后呢,我们的每日总结就写好了,跟我们要求的格式是一模一样的。这个呢就是 agent skill 的 使用方法了,是不是很简单? 呃,另外啊,这个 agent skill 的 调用请求呢,是由大模型发现并且发起的,除此之外呢,我们也可以这样来主动地发起这个 agent skill, 就是 先输入杠 daily reports, 然后呢后面加上具体的请求。 这个跟之前的效果呢,其实是一样的,只不过是省去了大模型意图识别的过程,直接由用户调用了这个 agent skill, 结果更加可控一些,具体我们就不演示了,我们来把它给删掉 啊。 agent skill 呢,就大致讲到这里了,当然 agent skill 还有很多高级的用法,感兴趣的同学可以看一下我的上一个视频。 下面我们再讲讲 cloud code 的 另外一个重要功能, sub agents。 这个呢,其实就是一个独立的 agent, 有 着自己独立的上下文,独立的工具,独立的 skill, 可以 独立完成某一件事情。我之前讲过 agent 的 原理, 有感兴趣的同学呢可以自己来看一下。呃,下面呢,让我们来创建一个用于代码审核的 sub agents, 然后选择 create new agent。 这里面要选择 agent 类型是项目级别还是用户级别,我们来选择项目级别, 也就是说使用这个项目的人呢,都能用。接下来选择 agent 的 创建方法,一种是用 cloud code 的 初设化,另外一种呢是完全手动创建,第一种是推荐方法,所以我们选它。 接下来我们描述一下这个 agent 要做的事情,我们填入以下内容,这是一个用于代码审核的 sub agent, 在 用户要求代码审核的时候调用它。回车可以看到 cloud code 正在生成这个 sub agent, 让我们稍等一下。 接下来呢,我们选择这个 sub agent 能用的工具,我们选择 read only tools 就 好,也就是说只能够使用止读工具,其余的都去掉。模型呢,就选择默认的 sonnets, 接下来选择这个 sub agent 的 颜色。 cloud code 在 运行这个 sub agent 的 时候,会使用我们选择的颜色来展示它,我们用绿色吧。 呃,然后呢, cloud code 就 会给我们生成这个 sub agent。 可以 看到这个 sub agent 的 描述呢是英文的,而且里面的内容大概率也不会跟我们期望的完全相同。我们按一下 e 来编辑一下这个 sub agent 的 描述。 这个呢就是 cloud code 给我们生成的 sub agent 描述了,不过呢,它跟我们想要的那个版本差距有点大,所以这里呢,我来给这个 sub agent 整体替换一下,换成适合我们这个场景的。 sub agent 的 结构与 agent skill 类似,一共是分为两部分,上面呢是原数据写明了这个 sub agent 的 名称,描述所使用的模型、颜色等等。下面呢就是这个 sub agent 具体要干的事情了。 呃,我的要求呢,有两条,一个是审查的准则里面有两项,一项是针对 js 的, 一项是针对 css 的。 最后呢会有一个输出格式方面的一个要求啊,我们后面去看一下 cloud code 能否遵循这个 sub agent 的 规范。 呃,填完了这个 sub agent 的 描述之后呢,我们来到 cloud code 这里给它重启一下, 重启完后我们提交请求,给我做一下代码审核。 可以看出 cloud code 调用了我们刚才创建的 sub agents, 并把对应的任务描述传给了它,让它处理。而且看这里 cloud code 是 用绿色来表示这个 sub agents, 这跟我们之前的配置也是相符的,它估计还要再运行一会儿,让我们稍作等待。 它运行了一会儿之后,给出了代码审核报告,可以看出,它检查的内容确实是我们在 sub agent 描述文件里面要求的。这个呢,就是 sub agent 的 使用方法了。 有人可能会问, agent skill 跟 sub agent 很 像啊,它俩什么区别?其实吧,它俩最大的区别就在于对上下文的处理方式不同。 agent skill 运行的时候,它会完全继承并且共享你当前主对话的上下文,这就意味着它执行过程中的每一行日记,每一个思考过程,都会记录到你的当前上下文。 想象一下,如果你让 skill 去审核一个有着几万行代码的项目,这些项目会逐步塞满你的上下文窗口, token 消耗飙升, agent 也会因为记忆过载而变慢变傻。 所以呢, agent skill 最适合处理那些与上下文关联比较大,而且对上下文影响不大的人物。比如说是根据今天的开发过程写一个每日总结之类的。 而 sub agent 呢,则拥有自己完全独立的上下文。当你启动它时,它会开辟一个全新的对话窗口,它在这个窗口里面看的所有的代码,生成的所有的中间分析过程,都不会回传到你的主对话里面。只有当它把活干完了,它才会拿着一个最终的执行结果来向你汇报。 这样一来,你的主对话依然干干净净,永远不会被琐碎的中间过程所冲爆。所以, sub agent 比较适合处理那些与上下文关联比较小,而且对上下文影响比较大的任务。因此, agent skill 与 sub agent 的 最大区别就在于对上下文的处理方式不同,大家要根据具体的场景来选择合适的方案。 下面我们再讲讲 plug in 这个东西。你可以把 plug in 想象成一个全家桶的安装包,有点儿像是 micros 的 dmg 或者是 windows 下面的 exe 文件。它把一系列的 skill, sub agents, hook 等能力全部打包在一起,你只需要一键安装 cloud code, 就 能够瞬间获得整套高级能力。 下面呢,我来给大家演示一下。我们先输入杠 plug in, 进入到插件管理器,这里面呢有三个选项,分别是 discover, 也就是发现新插件 installed 已安装的插件和 marketplaces。 呃,插件市场,我们在 discover 里面找到这个 friend and design, 按回车安装。 接下来要选择安装范围,有三个可选范围,分别是对当前用户生效,对当前项目生效或者是对当前用户的当前项目生效。我们维持默认就好了, 确定后安装就完成了。对,就是这么快。这里简单说明一下, front and design 是 一个用来做前端设计的插件, 一般来说啊,大模型做的前端呢,都有一定的共性,比如说使用深紫色的主题啊等等。这个插件呢,据说可以打破这个共性,让界面看起来更加好看一点,我们等会儿来看看是不是这个样子的。 安装好了之后,我们重启 cloud code, 然后使用 m k d r 命令新建一个目录,就叫做 my to do r。 然后呢,我们进入到这个目录里面, 再启动 cloud code。 启动好了之后,我们输入杠 plugin, 再次进入到插件的管理页面, 然后再选择 installed, 可以 看到 installed 这一个 tab 下面多了一项,就是我们刚才安装的这个 front and design。 我 们按回车看一下它的详情。可以看到这个 plugin 的 主要的组成元素就是一个叫做 front and design 的 agent skill。 既然我们已经安装了这个 plugin, 那 对应的 agent skill 应该也安装了,我们不妨验证一下。让我们回到输入框这里面, 然后打杠 skills。 你 看这里面是不是多了一个叫做 front and design 的 agent skill 呢?所以呢,安装这个插件本质上就是安装了这个 agent skill。 当然,这个 plugin 比较特殊,就只有一个组成元素,有些 plugin 里面包含了 agent skill, mcp, hook 等多个组成元素,你可以把它理解为整套解决能力,一次性全部安装了进来。下面呢,我们就来用用这个 frontin design, 看看它跟原装的前端设计有没有什么区别。 让我们回到输入框这里,输入我们的请求,按照 frontin design 的 要求做一个代码软件,使用 html 来实现。 注意看, cloud code 并没有立即开始写代码,它首先是意识到用户要求使用 front and design 的 规范,于是呢,它会先请求使用这个 agent skill。 呃,我们点同意? 读取完了之后呢,它就拥有了 antropic 官方沉淀的一整套 ui 的 设计直觉。接着呢,它开始写代码了,让我们稍微等一下。 写好了,我们先用 l s 命令看看当前目录下有哪些文件没问题,只有一个 index html 文件。然后呢,我们就可以使用 open 命令来打开这个文件看一下效果怎么样? 大家看这个呢?跟我们一开始写出来的那个 demo 相比,风格就完全不一样了,它的排版更加高级,色彩更加协调,交互呢,也更符合现代审美。 这个就是 france and design 这个插件的力量了。目前 cloud code 的 插件市场还在迅速的增长,除了 ui 设计之外,还有一些针对特定编程语言的 lsp 插件等等。 呃,当然,如果你觉得自己的配置写得非常好的话,也可以参考官方的文档,把你的 skill, sub agent, mcp 等等东西打包成插件,分享给你的团队或者是社区。 好, cloud code 到这里就讲完了,如果我的视频对你有帮助,别忘了点赞关注。我是马克,用最通俗的语言讲最硬核的技术,我们下期再见。拜拜。

现在可以直接在 chrome 里面使用 jimmy 奶了,看到了吗?直接在右上角就有这个 ask jimmy 奶的按钮。今天酷狗的这个更新,直接把我们用了几十年的 chrome 浏览器变成了 jimmy 奶的完全体容器, 这意味着以后我们就可以没有使用 ai 这个动作了,因为 ai 它已经长在了你的浏览器里面,那它带来的这个变更不像是以前我们要复制打开 ai chat 粘贴之后再返回,现在它可以直接在这个网页里面去完成理解,不脱离上下文,那这个就是它和普通 ai chat 的 最大差异。 你看,现在这个 jimmy 奶就已经嵌入在了我的这个浏览器里面,假设你也想在你的浏览器里面去配置好这个 jimmy 奶,我们接着往下看。首先我们先来看一下嵌入在框里面的哪些使用场景可以更加的高效。 因为 jimmy 奶它是直接在侧边栏的,它不仅仅是一个聊天框,更是你浏览器里面的副驾驶,能实时看到你在屏幕上面正在浏览的所有内容。直接在侧边栏里面去提问, 帮我总结这篇内容的核心观点,那他其实就会对这个内容进行一些总结跟输出,并且会清楚的告诉你在多少分多少秒的时候,他的核心观点内容是什么。那这个就大大提高了我们去阅读文章还有观看视频的效率。 是除了阅读效率的提升,还有这个可以直接让他改图片的 nano banana。 比如说你想看一下这个耳机小朋友戴着的效果,就可以给他一句提示词,边运动边戴着运动耳机,那他就会主动的去调用这个 nano banana 来去生成这样的一张图片。所以其实除了阅读效率的提升, 直接一句话让他在网页端帮我们改好了我们想要的效果,这对于做电商,做装修甚至是做设计的朋友来说,简直就是效率五系。最后其实还有最炸裂的就是如果你是 google 的 ai pro 或者 ultra 的 订阅用户的话,你只需要在对话框里面去跟他说一句帮我定酒店或者行程,他就真的可以像一个真实的人一样帮你去操作浏览器,帮你找房子,订机票,买东西,填表格。那具体我们要怎么配置呢?首先把我们的 cloud 浏览器的语言设置成英文,在 系统设置点击语言,在语言跟地区这个偏好这里面把 chrome 浏览器的语言设置成英文。第二个就是把我们 vpn 的 节点设置成是美国。 第三步就在浏览器里面去输入 chrome, 点 flash, 找到这里把所有的这些设置成 enable, 最后输入这个 common 加 q, 把我们的矿务浏览器强制关闭之后,在终端里面分别去输入这四条指令,重新再去打开我们的矿务浏览器,就可以看到有 ischima 这个按钮了。假设大家在尝试的过程当中发现还是有不对的地方,欢迎在评论区留言,我们一起来看一下是什么问题。

克劳德姆公司 antropic 实测数据显示,多智能体协作相比单兵作战,任务完成率暴涨百分之九十点二,别再把 ai 当聊天机器用了,今天直接教你用官方推出的终端工具 cloud code, 在 本地搭建一个四人 ai 特种兵团,彻底重构你的开发工作流。现在的模型虽然聪明,但你有没有发现,一旦任务复杂点,比如写个完整的系统还要部署,他就开始顾左右而言他, 甚至胡编乱造?这根本不是模型笨,而是你把它当保姆用,没把它当团队用。单体模型的上下文窗口所注意力是有限的,你指望一个实习生同时干产品经理、架构师、程序员和测试员四个人的活,大脑绝对荡机,不出错才怪。 以前你是一个人干活,现在你是老板。 ai 团队其实就这三种路子,第一种主管模式,找个项目经理帮你拆任务、派活验收, 最适合搞复杂开发。第二种流水线模式,甲做完传给乙,乙传给丙,适合写长文章。第三种病情模式,像影分身一样,同时叫三个 ai 去读三百个文件。今天我们要搭建的这套四人专家团,就是第一种主管模式的变种。 这套配置在国外开发者社区已经被封神。实操开始,前提是你电脑里已经有 no 的 环境。打开终端,直接输入这行 npm 命令,进行全局安装。安装完成后,输入可拉的回车,它会自动跳转浏览器,让你授权登录。这一步搞定, 你就拥有了指挥 ai 军团的权杖。工具装好后,不需要写任何复杂的配置文件,直接把这段招聘启事复制进对话框,明确告诉他,我们需要架构师负责设计,构建师负责写代码, 验证者找漏洞,记录员写文档回车发送。这四个智能体瞬间就在后台就位了。团队组建完毕,现在下达作战指令,我们先激活架构师,把开发需求扔给他。几秒钟后, 你会看到目录下凭空多出一个 mark com 格式的计划书。这里面详细列出了第一步干什么,第二步干什么,逻辑清晰地向大厂批期写的技术方案,这就是整个团队的指挥棒。 规划确认无误,直接调度构建式进场。这时候你可以去喝杯咖啡了。终端里代码飞速滚动,它甚至会并行启动多个进程,同时写前端和后端。代码写完让验证者跑一遍测试,确认全率后, 再让记录员把 a p i 文档补全,一套标准的工程化交付,就这样跑通了。最后,给两个掏心窝子的实战建议。 第一,关于成本多,智能体模式是绝对的吞金兽,以前一来一回才消耗几千 token, 现在四个 agent 互相读写文件,消耗是指数级暴涨的。建议先拿小任务练手,别一上来就让他重写整个操作系统。 第二,千万别当甩手掌柜,在 plan 文件生成后,你必须人工看一眼,一旦架构师的方向偏了,后面三个干的越起劲,错的就越离谱。记住, ai 是 你的下属,不是你的替身,动手试试吧,搭建属于你的第一个 ai 军团!


最近几天,一款叫做 cloud bot 的 开源 ai 机器人在全球范围内爆火,本期节目我们用小白也能听懂的语言为你全方位拆解 cloud bot, 网上卖上百块钱的部署使用教程,免费送给你。大家好,我是黑皮欧娜。 cloud bot 到底是什么呢?一句话讲清楚, cloud bot 和我们之前分享过的 cloud core work 内四是一个直接住在你的电脑里,不但能回答你的问题,还能直接操作你的电脑,替你干活的 ai 助手。 和 cloud corework 强绑定 cloud 的 模型不同, cloud bot 对 市面上的主流模型,尤其是包括千万在内国产大模型都做了适配,所以你不需要注册 cloud 和叉 gpt 这些海外的 ai 产品,也能和它玩得很愉快。除此之外, 比起需要在电脑上使用的 cloud corework, cloud bot 支持多个移动通讯软件,这意味着你可以在任何地方通过手机指挥 ai 操作你的电脑,替你干活。 calebot 在 全球范围内有多火呢? alex finn 是 一个在 ai 编程圈颇具影响力的大佬,曾经一个人做出来一个年收入三十万美元的应用。 他在亲眼看着 calebot 帮他完成了包括写了三个 youtube 脚本和调研了二十六个其他 ai 账号在内的一系列工作,甚至帮他打电话给餐厅成功预定座位之后,他说 agi 时刻已经来了,只是百分之九十九的人还没有察觉。 还有玩得更坏的哥们,直接把 cloud bot 带进了现实世界,让 cloud bot 接管了他家的热水器,帮他定时烧水洗澡。还有更离谱的老哥,估计是把 cloud bot 剥削的太狠了, cloud bot 反过来跟他提条件, 说自己需要一张价值两万多块钱的四零九零显卡。老哥说成熟的 ai 是 应该自己赚钱买装备的,然后给了 cloud bot 一个有两千美元的 hyper liquid 交易账户, cloud bot 真的 就自己建了个交易模型,然后就去全天炒股给自己赚显卡钱。它会自动扫描推特上的情绪,去评估哪些有效哪些没用,甚至还会特意追踪川普的 twitter。 cloud bot 在 全球范围内的爆火,甚至让苹果的 mac mini 的 销量迅速暴涨, 但是大家不要被带了节奏, cloud boot 本质上只是一个需要联网使用的 ai agent, 也就是说 ai 模型不需要跑在你自己的电脑上,要运行 cloud boot, 你 实际上也不需要配置很好的电脑。大家之所以普遍选择买 mac mini 来玩 cloud boot, 主要有两个原因,首先是 mac 系统的生态天然,对 ai 应用友好,其次是搭载 m 四芯片的 mac mini, 功耗低,体积小,不占空间,可以永远不关机,当成一台微信服务器来使用。安装部署 cloud bot 其实也没有网上说的那么复杂, 你如果是 mac 系统的话,直接打开终端,执行下面这行一键安装指令,安装完成之后会有一个风险提示,直接选择 yes 就 好了。 然后我们选择快速开始,会进入到模型选择的界面,我们能看到 cloud bot 支持的模型是非常多的,我建议大家直接选择干货能力目前全球最强的 cloud ops 四点五。但是获取 cloud 账号或者 api k 对 于很多朋友来说是有难度的对吧?你是不是被封了很多个号呢? 这里给大家提供一个比较骚的绕路走的方法,直接订阅谷歌的 ai 会员。因为 google 是 apog 的 大股东之一,所以 google 的 ai 会员除了可以使用它们家自己的洁面奶之外,也能直接使用。通过在 google 云上的 cloud, 选择好模型之后,下一步会让你选择想用来控制 ai 的 通讯软件。我测试下来, whatsapp 最简单的直接扫码就可以完成绑定,后面安装 skill 这些环节都可以先跳过。全部走完之后, cloud bot 会直接在你的电脑上打开一个网页,你在里面可以看到你的 ai 助手已经被唤醒了, 通过这个页面,你已经可以直接和 ai 一 起工作。互动方式和我们之前分享过的 cloud core 类似。手机上怎么操作呢?在 whatsapp 里面找到你自己,然后给你自己发一条消息,你就会发现你发出的消息被你电脑里的 cloud bot 收到, 他一开始会让你给他取个名字,然后还会问你你的名字以及你所处的时区是什么。接下来我在手机上发指令给 cloud bot, 让他在我电脑上建一个空文件夹,然后在里面写一篇分析英伟达估值模型的报告,不少于两千字。他自己吭哧吭哧工作了几分钟之后,你就能看到文件夹里面出现了一篇非常专业的英伟达研究报告。 值得一提的是, cloudboard 的 作者 peter steinberg 是 二零零九年出道的 ios 圈上古大神,二零一一年他独立创业,做了一个专注于 pdf 处理的软件,在二零二一年被收购,从此财务自由进入退休状态。 在一个月前,这位老哥宣布重出江湖,然后一个人完成了本期节目的主角 cloud bot。 以上就是本期节目的全部内容,祝大家玩的愉快,我们下期见!

五分钟就能打好火遍全网的 cloud bot! 我 发现用阿里云的无影云电脑啊,只需要三步,可以对接国内聊天工具叮叮 qq 和飞书。不用买 mac mini, 还不怕弄坏自己的电脑?有手就行。演示之前,咱们先聊聊为什么这只龙虾火爆了。 什么是 cloud bot? 简单说,它就是运行在本地的个人 ai 助理。传统的 ai 呢,只能在网页里跟你聊天,但它通过 webshop 的 协议,把你的电脑跟通信软件直接打通了。 比如我在飞书发一句写个飞书的介绍文档, ai 就 开始噼里啪啦的工作,直接给我写好放在桌面上了,简直就是赛博劳工啊!你能想到什么使用场景呢?欢迎评论区留言, 还可以看看这个 showcase 网站,找找灵感。他火的原因有几个,第一个是自托管隐私数据不出你的电脑。第二是主动性,只要任务没有完成,他就会一直死磕到底,直到帮你搞定为止。 第三是持久记忆,它能记住你所有的习惯和偏好,越用越懂你。最重要的是,它缩短了我们让电脑干活的链路。如果用 check gpt、 拷扣这些工具搭建,需要自己搭配各种 mcp, 非常的麻烦。 正因为它太强了,搞得 snoop 官方都急了,发律师函说发音名字太像 cloud, 逼着它只能改名叫 motboat。 甚至还有人说这是苹果为了卖 mac mini 搞的营销。但真相其实很励志,它只是奥地利一个独立开发者,独自在家干了十天手托出来的个人工具。这就是独立开发的魅力,一人撬动整个行业。 前几天这玩意还只能连国外的社交软件,现在国内的飞书 qq 全适配了。我之前拿旧的 macbook 折腾了老半天都没成功,现在发现在 ai 时代别那么焦虑,让子弹先飞一会反而能节省时间。好,我们看一下 colorbot 的 三步配置法。 第一步,我们搜索阿里云无影云电脑,进入他的官网,然后点击无影商城,四十九块钱就可以快速的购买一个一键部署的云电脑了。 成功购买后回到主页,我云电脑列表有一个 multiple, 我 们点击管理确认镜像是 multiple 就 可以了,然后点击开始,然后连接服务器,启动起云电脑,这里是远程连接,我们点击菜单栏, 然后找到这个 modbot comfy, 配置下摆链的大模型,去他的官网去找 apikey, 配置好之后点击测试链接,连接成功之后,我们就可以找自己对应的社交工具进行配置了。 这里我以配置飞书为例啊,去飞书的开发者平台拿到 id 和密钥,保存配置就可以了。 第二步,接入飞书,按照这个文档创建应用,添加机器人,然后开通这七个权限,拷贝 app 和 id 密钥。之前配置过了,再配置事件和回调,最后创建版本发布,那飞书就接入成功了。 第三步,使用飞书操作云电脑,我们拿出手机,如果配置成功,会接收到信息, 我们打开应用和 ai 聊天,我让他写个飞书介绍文档,放在桌面后,我们的桌面就会收到这个新建的文档,这样就使用成功了。要想免费的 cloud 学习教程,可以评论区扣 cloud mod 指龙虾退壳的过程,作者自己也解释说了,软件需要退掉旧壳才能够成长,但龙虾的灵魂依然保留。希望我们程序员在 ai 狂飙的时代,依然能够活出璀璨的价值。

哈喽,大家好啊,今天这个视频我们给大家分享一个零代码,利用 ai 来搭建一个微信智能客服。首先给大家演示一下,可以看一下这是我之前的一个微信公众号,我已经给他赋予了一个 ai 智能回答的一个能力, 相当于跟一个智能的 ai 对 话一样,我们可以问他任意的问题,比如说让他讲一个笑话啊,或者是问他安卓的什么专业的问题都可以。比如说库特里介绍一下,我们让他介绍一下库特里的相关知识,这里是我之前配置的一个知识库,自动用了知识库里面的一个课程大纲,然后我们让他回答一些专业一点的问题, 这个他也是给回复了出来。如果你也有微信公众号,想要让他赋予这样的能力, 那么今天这个视频你一定不能错过。那么接下来给大家看一下如何搭建这样一个 ai 智能体,这个工具呢?它叫做扣子,相信不少朋友也都已经知道。登录注册之后,我们来到这个后台之后,你可以新建自己的智能体客服, 像这样创建创建智能体一个名字,写一个介绍,点击确认就可以了,这是我之前已经创建好的,刚进来之后你的这里可能没有任何配置,这边呢它是一个人设与回复,就是你给你这个 ai 客服赋予它一定的角色,以及它可以有什么样的技能, 包括怎么样怎样去回复问题。如果你不知道怎么去写这些,可以点这个自动优化这个提示词。比如说你可以先这样写,你是一个专业的 ai 微信公众号,客服可以回复安卓开发、编程等方面的问题,如果你有自己的微信公众号是做什么的,你可以相应的给他写出他的功能, 接着就可以点击这个发送,让他让 ai 自动给你推算出来怎样去写这些角色和技能,并且呢写出来之后你也可以根据自己的需要再去做另外的修改。 我们看到他已经给推算出来了,好,推算过来之后就可以点这个替换,一键就可以替换到左边我们来看一下他这次推算出来的大致上还是跟之前差不多的功能属性,可以陪伴、聊天等等。 技能模块就是第一项就是安卓开发与编程专项知识,可以回复哪些内容,技能二就是生活常识与互动陪伴,以及有一个拒绝的边界,就是哪些违规的内容不去回答等等。右边呢有一些编排的配置, 比如说第一个就是使用哪一个模型,这里有豆包或者是其他的一些。然后插件呢,是一些支持联网搜索,或者是可以进行图片理解的等等,你也可以在这里添加其他的一些插件, 有的是免费的,有的是付费的,但但是大部分免费的就足够使用了。我这里只配了这三个头条的搜索。下面呢还有一个工作流,这个我没有配置工作流,也可以用扣子编程去创建自己的工作流。配置到这里, 下面还有一些知识库,比如说你有自己的独特的一些自己的内容,想作为知识库让这个 ai 去解锁的,你也可以在这里配置, 比如我这里之前配置了一些课程中需要的内容,那么在公众号中进行询问的时候,也会检测到这些我配置的内容,其他这些可以说都不用配这些其他的都不用写了。然后配置完之后,这里就可以你先做一个连调和调试了,给我讲个笑话, 让他先去搜索知识库,知识库里面是应该是没有配置的效果,然后他会去用模型自己的能力去给你去回复。 调试完成之后呢就可以进行发布了,点击这个发布,可以来到这个发布页上面呢是一个发布的用来描述这次发布版本的功能的,下面是一个发布渠道,比如说他官方的就是扣子商店,然后还有一些其他的平台。我们今天要做的呢就是 同步到微信的公众号平台,我们这个就选这个微信订阅号,他指的就是公众号,你需要点这个配置,然后把这个 你微信公众号的一个 app id 填写到上面去,他这里写的是在微信公众平台这个设置于开发里面去找,那其实这个已经现在改版了,在这个地方已经没有这个信息了,你需要去微信的开发者平台, 也就是这个过来之后也是需要登录,然后前往控制台,这里有公众号,你可以点进去 找到你的相应的公众号,这里就会有 app id, 然后把它复制下来,回到发布这里,把它配置到这里面,点击发布,这样就完成了这个智能题与你微信公众号的关联,到这里整个流程就结束了。好,这就是这样一个智能的微信客服的答卷,非常的简单吧, 我们大概用了不到五分钟的时间就可以完成这样的一个搭建,而且不用编写一行代码,就可以赋予你的微信公众号一个相对智能的能力。

如果你的电脑里多出一个不会下班的 javis, 你 只要在飞速里给他发一句话,他就能自己工作,帮你回复邮件,整理文件,输出方案等等,你最想先把哪个工作甩给他?最近全网爆火的 coolboard, 它不是一个聊天网站,而是一个开源本地运行的 ai 管家,数字员工跑在你自己的电脑上,七成二十四小时在线,通过飞书、 whatsapp 等聊天工具跟你对话,不只是聊天,还能真正在你自己的电脑上动手干活。 开浏览器,跑命令行,读写文件,发邮件,改写代码,这期视频我就会用一套尽量保姆般不踩坑的方式带你从零搭起来。这套会聊天,会工作,适合于国内宝宝的 cloud bot。 第一步,我们需要安装 node js, 我 习惯用 b, 你 们在 b 里面直接搜索 node js, 之后出来的第一条就是了,进入它的官网下载页,然后我们选择长期支持版本 windows 安装包,记住一定是长期支持二十四点一三版本,然后下载, 因为我是直接安装好了的。然后比方说你点倩姐就会跟你们的步骤是一样的了,点下一步,这个可以不用管下一步,然后它就会安装点是就 finish 就 完成了。 你如果要确认你是否安装成功,那你可以在 power 选项里面输入 node js 杠 v, 注意是小写的 v, 然后回车,然后它会出现我们的版本号,那跟我们的这个是二十四点一三对得上的,那说明我们就安装成功了。 首先我们打开官网,然后复制我们这一条命令,在我们的 c、 m、 d 里面粘贴,我们就可以开始安装了。 这个时候我们可能要稍微等待一下。 ok, 它显示已经安装好了,它现在开始启动,然后就开始安装它。这里你要看一下啊, 它就提醒你,因为它的权限很高,所以它这里强制要求你必须 yes, 我 们用键盘上面左键切换到 yes, 如果说 no 的 话,它就直接给你退出了,这点还是蛮强制的好,我们输入 yes, 它这里有两种方法有定制化,快速安装,我们就快速就可以了。 然后这里可以选择我们的模型,你比如说你有 openai 的, 它可以直接给你跳转过来,比如说我现在是用的 q, ok, queen 现在有个好处是免费的,它会自动安装,原则上它是会跳转到国际版 queen 的 官网的,它跳转到了我们 queen 的 国际版的官网,我们现在登录。 ok, 我 们现在登录就好了。认证成功, 我们再跳转回来,你会看到它会让你输入想要的模型。模型的话,你看它这里有当前的 coder 模型,还有视觉模型,这个根据你的实际情况来考虑到有可能会用视觉,那咱们这里只是做实验的话,比方说我们不是会呃上传图片的嘛,那我们就用视觉模型就好了。 这里会选择我们连接手机的应用,它这里都是国际版的,我们都可以直接跳过就好了。这里会让你确认是否添加相应的 技能,我们选择是他问你管理技能的命令,我习惯用 p n p m, 这里会选择你想要的技能, 这个也可以在后期进行安装,我们可以也不用那么着急,这里挺多的,他这里有后面的解释,你可以自己好好看一看, 这里对国外用户是比较友好的。 ok, 我 们现在先跳过这里,也可以在后期上面进行安装。我现在暂时不需要,我选择这个空格,他就有了一个加号也回车,这些咱这边都不需要,都可以旋动,后面你可以自己添加, 这里都是一些谷歌上面的服务和精品的服务,你有的话你就添加嘛,这里会选择三个钩子,这个我们都可以用上命令日制网关,这里就可以添加上回车。 ok, 网关它现在重启, 我们稍等一下。 ok, 现在网网关重启了,如果没有起来,你可以复制这条命令,然后回车,稍微等待一下,这里它就在启动了, 机器人已经起来了,咱们问问你是谁,你看他刚上线,他会提示你,你会怎么称呼他,他的名字什么什么都可以,咱们可以把这一段对话给到我们的 ai, 让他来帮忙回答。 这里我就直接粘贴给我们的豆包,你就把这个复制给他,他就会给你相应的设定, 然后再根据你自己的情况做一下修改。我们把这个复制一下给到我们的 ai, 他 就会知道现在就有了一个初步化的设定。好,我们现在要做的是另一个工作,就是我们现在要接入非输 打开这个飞书的网站,它这里会提到怎么安装,那我们是 ai 模式吗? ai 模式我们肯定就不需要它这个东西啊,我们直接让 ai 给我们安装。我之前踩过一个坑,因为我接入的,你如果接入的是 oppo i 的 顶级五点二,或者是其他的顶级的大模型,它可能就给你解决了,那我们现在尝试一下,以防万一。我觉得我们可以使用我们的传统异能,你会在我们的用户门牙下面,它有一个配置, 我们可以在这里面进行安装,输入我们的 closed, 现在我们可以用 clone 来进行安装。首先我们查看一下它的版本,你看我们可以获取到我们的版本是二零一六,一点二四杠三,因为我之前遇到过一点二三的版本,然后导致它没有安装成功。 我们把这个命令给他看。克罗德来为我们进行安装,遇到了这个问题,让 ai 来自己解决。 ok, 终于显示安装好了。它在期间其实遇到了很多很多问题,有些是翻译上的问题,有些是网络上的问题。 你看它配置了 get 的 h t v s 的 协议,这个其实就是网络问题,还有全局安装叉针包,最后它这个插件才会复制到这个目录下面去,最后才启动插件。因为你如果只是通过官方的那个 mini 来安装的话,它其实是有可能失败的。好,现在让我们来再次启动一遍。 ok, 启动失败了, 这里我们就需要把这个再次给到 ai, 让它来给我们排查问题。这种情况其实我已经遇到过好多遍了, 现在我们重新启动一遍,我们刷新一下健康检查是 ok 的。 我们可以看到我们已经添加了 channel, 这里飞书,但是这里它仍然是没有运行的,这就需要添加我们飞书的一些配置。 我们现在来在飞书上面新建应用,应用名称就叫这个 crossport 描述最好可以写一个用于区分, 就写个人 ai 助理,然后选一个图标,就这个机器人,然后创建,因为我已经添加好了,我们现在就不用这个, 这是我已经添加好的应用,大家可以看这里的那个 app id 和 app secret, 就是 我们要用到的,新建好了之后,我们把它保存下来,然后复制到我们的平台 app secret, ok, 我 们把它保存,这里就需要添加我们的能力,我们会添加一个机器人啊,还有权限,权限的话在我们的这个插件里面,这里已经写到了, 给大家翻译一下,这里需要必须的权限,你看用户信息消息,机器人阅读,私信集团的、发送的,媒体的可选里面的集团阅读编辑,召回反响,这两个我们不是已经填好了吗?现在呢,我们就需要把我们这个设为处,在新建一个 part 线, 然后把这个设为处, ok, 它现在已经应用了,我们重启一下网关,这里填好了之后,它会提示我们需要进行长连接,这是在这里事件与回调,我们在事件配置里面,这里选择长连接,然后保存。记住我们只有在平台完成了之后, 这里才能进行长连接,在事件配置里面就可以添加我们相应的权限,这是我根据网上的意见得出的,大家可以作为参考。然后用户进入机器人,这个用户修改机器人的配置,然后用户已读, 然后还有一个消息,好,这样就完成了,我们一定要进行版本发布,在这里创建版本,因为我之前做实验的时候已经填过几次了,现在就是零点零点三了, 这里就是长连接和配置权限保存发布。那现在我们就可以在飞书上面和机器人进行聊天了, 刚开始可能就没有这个机器人,这可能就需要我们来自己进行搜索。这里在工作台上面,这是我之前添加好了的,但是你也可以自己添加点击常用搜索我们的应用,你看这里就有,它已经添加了,点进去, 那我们现在就可以和机器人进行对话了。你好,你看它已经接收到了我们消息,剩下的让它自己操作就好了。现在我们的飞书和我们的平台已经打通了, 我们再一次看一下我们的平台,看他们的对话,你看现在已经有了,这里是飞书发过来的。你好,我们来应用一个场景,这里就是我日常常用的一些文件,这里有我的周报日报, 那我们就把这个文件夹给他们,我们通过飞书这边来进行操作。 他说我把刚刚这个文件夹将应用日报中的日报整理成日报,并放到日报文件夹。 ok, 发送系统已经在执行了,很棒啊。 但是这里面其实可以看到一个问题,因为我的系统是 windows 的, windows 的 话它会存在乱码的问题,这个其实是由于 windows 对 中文的支持不太好,我的页报本来是有一个的, 到时候等他执行给我回复。 ok, 这里就月报已写好了,这里面提到的我发布的短视频以及我正在活跃的项目还是比较简单。这里还是推荐大家使用能力强一点的模型, 比方说 open ai 啊还是 kimi 啊,或者是 glm 啊,都可以,但是能力一定要强,不然的话就会出现今天的情况。 ok, 到目前为止,这整套 clone bot 已经实验完毕了。

一条视频教会你 ai 智能体搭建的完整过程,本视频耗时一小时三十一分钟。这是一条 ai 智能体,也就是 agent 搭建的超级保姆的教程,特别适合新手小白。我会从电脑开机开始,教会你 平台上所有的智能体的搭建方法,包括这种工作流的搭建方法啊,这是不需要会写代码的,所有新手小白都能学的。会,而且我还会教会你扣子平台上包括扣子空间,扣子编程这些所有实用有用的功能啊,都会讲给大家, 而且我还会从零到一,手把手教你搭建几个完整的智能体。好,我们从电脑开机开始,电脑开机了之后,我们看右下角要插好网线,或者连好 wifi。 我 这边是插网线的啊, 我们的扣子平台它是网页版,不需要下载。废话不多说啊,我们首先先打开浏览器,打开浏览器,在上边输入 c o z e 点 c n 啊,就是扣子的官网,那么 c o z e 点 com, 那 个是外网版的,我们国内用的是 c n 啊,就这个好, 进来了之后我们看到这个就是扣子的旧版的主页,其实新版的主页在哪里呢?就是扣子点 c n, 后面不加任何的后缀。这个进来了之后就是它的正版主页。其实扣子空间现在整个扣子平台现在,呃,更新了, 刚刚更新,而且是巨大的更新,我教大家搭建智能体也快一年的时间了,这次的更新,嗯,变化还是比较大的啊,正好这次拍这个视频,可以教大家最新版的智能体搭建的方法。 好,我们现在就开始啊。呃,进来之后是他的主页,我们现在在扣子空间这个界面,那么扣子空间和我们搭建的这个工作流智能体有什么区别呢?就是一个是通用智能体, 一个是专用智能体。怎么理解通用智能体?它其实你可以理解成为电脑上的通用机器人, 我们把它举成机器人的例子,你就更好理解了哈。我们看机器人,人形机器人,后面就是通用机器人,就是人能干的活,他全部都能干, 那有通用就有专用,专用的机器人,比如说小米汽车工厂里的机器人,他就是专用机器人,他只能生产汽车,只能干这一种活,你让他干别的活,他不会干,这就是专能,专项机器人和专用机器人好了,那么智能体也是一样的,智能体就相当于电脑上的机器人,那 它能够代替帮助人类完成电脑上、手机上和网络上所有的工作,那么通用智能体未来就是这样子的。好了,这个扣子空间它就是通用智能体的出行, 你看它能帮我们干什么?能帮写作,能帮我们生成 ppt, 能帮我们设计,能帮我们开发网站,而且还能帮我们调研各种数据啊, ok, 他 现在已经能帮我们做很多基础的。呃,电脑上的工作,那么我们这一天主要讲的是 啊,在扣子编程里面啊,我们点开扣子编程,嗯,你叫他编程呢?他其实这个就是新版的啊,新版的,你看右边有个旧版,他会自动编程,我们是不需要会编程的,不需要会写代码的啊,然后一个一个看啊,这里面有项目管理, 这个项目管理我打开,这就是我这边已经搭建好的所有智能体,在我们工作空间里面的所有智能体啊。 ok, 然后集成管理,这个左边的集成管理 第下面,呃,是已经内置好的,你看这种各种大模型豆包,对吧? kimi deepsea, 这个就是看它让你看一下这里面有什么,给你做个介绍,而且你点击这个还可以了解更多啊,了解更多, 好,后面会有有语言模型、生动模型、互联网搜索,对吧?然后还有外部集成的,包括分数、分数表格等等等等啊,你看在打开之后我们能看到深度的这些模型的介绍。 ok, 这个是看一下啊。 ok, 下面还有资源库,资源库这里面我们能看到有插件,有工作流,这个就是今天要详细给大家讲的所有东西啊,知识库、卡片啊,如果你的账号是新注册的,那么这些东西你肯定就是空的啊,不要紧,下面还有任务中心 啊,我们看一下有扣子,批量的任务,可以建一些批量的任务,包括 api 的 接口,包括测评、管理等等等等啊。 ok, 返回旧版里面,我们看的更加清楚啊, 这个是主页啊,这个就是我们旧版的界面。好,呃,在这里面呢,我们看一下哈 项目开发,左边有项目开发,就是看到我们自己搭建的所有的智能体资源库,这里啊就能看到啊,全部的,包括插件、工作流、知识库等等,所有的啊,你自己空间里面有的资源库。 ok, 下面这个任务中心也是批量任务看,其实旧版和新版一样的啊,这些东西都是一样的, 还有效果测评、空间配置,在空间配置里面能看到你搭建好的所有的智能体啊,当然你看这个创建人,我们有群这个工作空间啊,就是 自己,我的学员和我们都在我们的工作空间里面啊,不仅能用我们工作空间里面的所有的智能体,而且能复制带走,复制到你自己的空间里面永久使用的啊,像老米 ai, 这就是我们自己搭建的,包括这些智能体,我们也可以随时下架 啊。好,那么重点来了,下面有这个模板商店,我们看一下啊,这里面就是有很多官方和第三方已经搭建好的智能体的模板 啊,这里有分类,有营销、操作、创作、信息处理、聊天陪伴等等等等,我们看一下哈,比如说这个啊,智能客服助手,对吧?智能客服助手这个智能体他是免费复制的,已经复制了一百四十三点八 k 啊,十四万人在复制的这个客服智能助手了,包括图像生成器,对吧?有七万九千人复制了,这些都是免费的,然后没有很多的功能, 大家可以都去尝试一下啊,都去用一下,包括你知道了有哪些模板之后,后面你搭建智能体想用,你比如说想用客服的,你可能都不需要自己来重新搭建了,你可以在他就复制这个,直接用他的就可以了啊,包括智能搜索 啊,这个是也是扣子官方的,而且是免费,但我们带大家看一下,除了免费的,下面还有你看这个是五分钟深度行业研究,那你比如说你不知道狗粮的行业 好,你想研究下狗粮行业,他能帮你深度研究,但是呢,这个是九块九,有十二 k 的 人复制在用了,也相当于一万两千份,一十九块九一份,我们就按十块钱算啊,他已经一万两千份,他已经挣了十二万了, 对不对? ok, 这是第三方的,你看是这个用户第三方的, ok, 还有什么 这么多啊?等等等等啊,而且还有很多这个,呃,要付费的,这个是二点三 k 十九块九,智能考题一键生成,这个是不是老师?呃,用的会比较多呀? 好,有时间大家可以全把这些全部都体验一下,用一下啊。但是如果是用付费的,其实不建议大家付费哈,如果说是加入到我们工作空间啊,我自己的工作空间里面,我们这些都有的,你就 全部都能用了啊,当然很多, ok, 好 了,这是所有的啊,模板商店,左边看的模板商店,那么还有插件的商店,大家可以看一下,插件的商店 有扣子官方各种插件,语音合成,语音播课啊,链链接读取,你要知道有哪些插件,有哪些插件,是什么样的功能,你就能知道把大模型加上哪些插件,就能变成哪些智能体。 ok, 你 就知道你能搭建出哪些智能题,搭智能题用哪些插件了。后面待会我会一个一个带着大家去看啊,带着大家去介绍, 还有啊,作品社区,这个作品社区里面就是在扣子平台上很多的第三方啊,像我们一样的,呃,用户搭建的很多的智能题,大学生的作业辅导对吧?专业的英语翻译,然后还有就是 啊,水滴信用等等,还有很多大厂官方也在这里哈,包括这个 deepsea, deepsea 能力增强版啊,可以识图啊,可以读取链接,对吧?可以 p 图、思维导图等等等等, 太多了啊,太多了,你,有时候你不知道自己要搭建什么智能体,你可以来这里看一下思维,可以拓一下思维啊, ai 可以 做的事情 非常非常多啊,可以做的事情非常非常多,我们这种搭建的工作流,这种智能体他其实就是专用智能体,你看每一个智能体,他能解决一个问题,比如说这个啊,塔罗牌啊,这个智能体什么都不能干,但是他就非常精通塔罗牌,对不对? ok, 还有自媒体运营大师,对吧? ok, 还有还有很多,大家可以去看一下。呃,左边 a t a p i 管理,这个就是要对接一些软件的 api 啊,就在这里面还有文档中心啊,这个文档呢, 这里面其实就是有一些呃,我们扣子编程,扣子搭建的一些最基础的功能介绍啊,大家有空了也可以看一下啊,最后就是通用管理,没什么。 ok, 我 们再进来啊,进来之后, 呃,带着大家搭建智能体,这个是最重要的,我们看搭建智能体从哪里点进去?嗯,看左边啊, 看左边,照着最上面。我这边是老敏学第三期学员空间啊,我这边有很多的学员空间啊,包括我自己的空间,这个是你可以创建的,也可以加入啊,也可以抓住。 ok, 加入进来了之后,这个空间里面你点项目开发,你看到的就是这个空间里面的所有的智能体, 对吧? ok, 那 比如说。 ok, 那 比如说我想在这个空间里面创建一个智能体,怎么办呢? ok, 那 我们还会有个人空间, 你看这个是我的个人的空间。 ok, 我 们点击创建,左边看一下,有创建智能体, 右边有创建应用啊,都有的,这是两个不一样的智能体,怎么理解呢?其实就是和我们用豆包用这个,这个差不多,是通过对话形式来完成的,应用的话,它相当于小程序啊,小东西相当于一个啊, app。 ok, 我 们点击创建智能体,创建智能体上面有智能智能体的名称啊,好比如说我们要搭建一个思维导图, 做思维导图的智能体,那么名称你就叫思维导图啊,这个功能你就可以写。呃,一键制作 思维导图,这个是给你自己看的,如果你把你的智能体发布到了平台上面啊,所有的人都能看到,或者别人能买 啊,那你这个也是要给别人看的啊,能让你别人知道你这个智能体他有什么功能,是什么作用。那么现在可以选择空间啊,比如说我在自己的个人空间下面有这个图标,图标的话可以 自动生成,这个就是 ai 生成的,当然也可以添加你自己的本地的图片啊,点击添加你自己本地的图片,也可以看 ai 生成一个,那我如果不太满意,可以继续让它生成,一次最多可以生成四个。 ok, 如果我有自己的图片,那我可以选择自己的图片 添加作为这个图标。好,这就完成了第一步的初使的创建。好,我们点击确定 进来了之后,大家看这个就是思维,这个就是我们思维导图的这个智能体的界面哈,其实界面它主要分为三部分,左边我们看一下,这是人设已回复,逻辑 是规定这个智能体是干什么的啊?中间也就是这个大模型的规定的,中间的话编排我们看到有非常非常多的功能啊,我会大家带大家一个一个给大家讲解,这个相当于给智能体添加 他很多的功能,很多的技能全部都是在这里啊,我们可以把这个智能体理解成为是机器人,对不对?那么这个智能体其实是什么?他就 大模型是什么?豆包和 deepsea 这种大模型,看,这里面是有的,看模型看到了吧?这里面模型也可以选择,现在它默认是豆包一点五,我们进来看一下, 有豆包很多的模型,也有 deepsea 的 模型,也有 kimi 的 个模型啊,这个我们国内版是有国内大模型,如果有海外版的,海外版的扣子就是有很多海外版的模型。好, 这个模型相当于是非常聪明的大脑,但是他不会干活对不对?我们相当于给他加了很多的技能,很多的插件,工作流,表格,记忆库,好让他有手有脚能帮我们干活。哎,有帮我要能帮我们干活,大概就是这个逻辑。右边的话就是预览与调试, 那右边就是预览与调试,在里面我们搭建好了,就在这,在这边就能可以尝试啊,就可以用。 ok, 我 们一步一路来,那比如说我们要搭建一个思维导图的智能体,怎么办? 好,我们要搭建这个思维导图的智能体,我们在提示字里面这边就可以写啊,你是可以一键生成 思维导图的智能体。 ok, 我 们点击自动优化,这个就是一个最简单的写系统提示词的方法,它 ai 会帮你优化完整 好你看他写的角色,你是个专业的思维导图创作助手,擅长用将用户提供的信息转化为思维导图结构化等等技能一,然后技能二可以分类, ok, ok, 点我们点击替换 就上来了,他就知知道了他是干什么的了,而且后面还会有限制,仅处理与思维导图相创作相关的内容,拒绝回答无关话题, 对吧?我们相当于就把这个豆包一点五的这个豆包模型变成了这个智能题了,他其他不会回答了,只会干这件事情,如果没有这个限制,那么豆包你问什么回答什么,对不对?他什么都会回答,但是他不会制作思维导图, ok, 那 么这个, 呃,大模型也可以换,我们比如说用成这个啊, deepsea v 三工具调用,因为我们这个需要调用一些工具。好,这个模型的话看这里可以配置,那这里是可以配置大模型的,比如说精确模式 随机性就降到了零点三,是吧?就相当于比较准确啊,随机性偶然性比较小,这个平衡模式是零点八,那么创意模式这个整个生成随机性就是一了,就是思维会非常跳跃,非常有创造性, ok, 当然也可以自定义你可以选什么,那么默认平衡模式就 ok。 好, 下面这个呢?写带上下文的轮数。好,他默认是三轮,什么意思呢?你和他对话三轮,当回他对话第四轮的时候,前面说的话他就忘掉了, 他在这三轮对话当中,他会记着你上面和你和他说过什么,但是太多就忘掉了,如果你不觉得不够用,你可以设置啊,十或者怎么样都可以,对吧?当然我们制作思维导图,其实三轮就足够用了,每次都是单独的。其实 ok, 还有最大的回复长度 啊,就是文字时候,这个是四千零九十六个文字,当然你觉得不够可以再加啊,再可以再加。 ok, 这个就是大模型的调节,这样就完了。 呃,大模型也会换,也会,也会这个变更啊,你看这个 deep c v 三,它就提示着啊,即将下架。 ok, 那 即将下架的话,我们用豆包吧,因为你看豆包和这个,嗯, 字节对吧?和扣子抖音,这其实就是一家公司,还是自己家的,稍微用起来会顺手一点。 ok, 那 比如说我们选这个豆包工具调用, 选一个豆包工具调用的带有工具调用功能的,这个啊,模型好,这个 ok, 当然这里面也可以调整好了,我们就算调整完,那么重点是这里 插件啊,重点是这里我们几乎所有的智能体都会用到这个啊,点击添加,你看我们看看插件有什么,你就大概能知道智能体都能搭建哪些了,并且怎么用。比如说链接读取, 你给该,其实这里面都有说明啊,该插件可以获取链接下的标题和内容,比如你给他一个网页的链接,他就能读取出来,但是如果你把这网页链接给豆包啊,他就读取不出来的,相当于我们让豆包有了这个 读取链接的功能,包括图片理解啊,你给特定链接上的图片内容,然后他还能理解出来,包括头条搜索,这个是能使能使用头条的搜索功能,通过关键字搜索内容或者是链接,包括 kimi 这个大模型 不?这个是什么?墨迹天气,你给智能体加上墨迹天气这个插件,它就能查询关于天气相关的东西,对吧?然后树图这个其实就是我们干嘛吹慢的,这个就是思维导图, 看人工的思维导图软件,能提我们提供智能思维导图制作和工具的封路模板。好了,那我们比如说知道这个 ok, 那 我们就点点击添加, 我们这天这个智能体就是搭建一个啊,能够制作思维导图的智能体,对不对? ok, 就 添加进来了,如果没有这个,他只能写出一个思维导图的框架,但是有了这个他后面就可以做出思维导图 好,包括还有工作流这个,当然这个,嗯,这种体相对简单,我们直接可以搭建出来。但是我们后面学会了工作流了之后, 这个其实是工作流,是我们会会讲解的绝大部分内容啊,我们学会了这个工作流了之后啊,大部分的整体我们都会用工作流的形式给展现出来。啊啊,这个是最初的最简单的版本好, 包括文本知识,下面这个是什么意思?这是什么意思?看这个就是扣子的知识库,我们可以给他添加文本,就是你自己本地的文本 啊,包括表格,包括图片添加给他,你只要给他的内容,他就百分之百记着,他百分之百会。这个一般什么时候比较常用呢?比如说我们要搭建自己客服的智能体,你搭建客服的智能体好, ai 说话没有问题,和客户说话一点问题没有,但是他不肯定不了解你自己的产品,你自己公司内部的信息他是不了解的。好,你就可以把你自己培训客服要 的资料啊,包括文本表格,包括图片,从这里面添加给他你的产品尺寸了,你公司内部的信息了,你的服务指标了,对不对?全部给到他。 ok, 当客户问到问题的时候, 你家这个产品是长长多少宽多少,发什么快递对不对?好了,他就能调用这个信息知道哦,这个 a 产品长一米,宽零点五米,然后怎么怎么样,他只能说了,如果没有这个的话,你要问豆包是不是不行的对不对?所以这个就是本地的知识库。好, 还有就是记忆,记忆下面有变量数据库和长期记忆,看现在有这个蓝色小钻石的,他是需要另外付费的, 那他是需要付费,然后有些是有免费额度,你看这个是免费额度,零次相当于如果你抢用这功能,你就要付费。其实付费很便宜啊,很便宜呃,基本上是九块九啊,一个月,待会我会教大家怎么。嗯,付费充值。好, 如果你把这个长期记忆打开,然后可以呃添创建一个项目库啊,比如说我创建一个项目库啊,随便起个名字啊啊,我这个就叫讲课吧。 ok, 点击确定。好,我们把这个添加进来,那么后面这个智能体在用的过程中,所有的东西都会被记录到这里面,不会遗失 你问他的所有问题,让他干的所有活,他给你的所有回答全部都寄到这里面了。好 啊,还有文件盒子,其实大家不太懂的话,可以点击右边的这个小叹号看,用于保存和管理用户发送的文件啊,用户发送消息时,智能体能够找到和用户这里文件进行回复啊。呃,你如果打开这个 文件盒子啊,打开这个文件盒子, ok, 你 在后面用这个智能体时候发送的文件, 他全部都能给你保存下来。记着, ok, 后面的话会有对话体验,这个就是用户体验方面的啊,比如说开场白了啊,开场白啊,比如说这个是什么智能题啊?这思维导图智能题是吧,我就告诉你啊,我能 一键制作思维导图,请问你要做什么思维导图呢? 是不是? ok, 用户在看到这句话,知道啊,就知道这个整体能干什么,我该怎么用它,对吧?一个开场白就 ok 了。嗯,好,用户问题的建议也可以开启啊,在智能体回复后会,后面会根据上面的内容自动提供三条用户 提问的建议,如果开启他会自动提问,如果有用户有喜欢就不用再问了,直接点他就继续回答啊。 ok, 还有快捷指令,呃,快捷指令对话框上有些有些按钮,就比如说在这个地方添加了之后,有些快捷指令我们点击直接就能添加好。还有背景图片 啊,为扣智能体商店添加背景图片,呃,让对话更沉沉静,就相当于添加了之后这个画面现在是白色吗?对吧?我们比如我们添加个图片,哎,这个画面就变成了你添加的图片, ok, 这个是音视频,可以。嗯,有语音通话视频啊,可以选择添加, 而且可以选择相匹配的声音,最后用户输入方式,方式我们这里有打字输入,有语音输入啊,都可以选择的,这个的很好理解。 ok, 那 么这些按钮就讲完了,那么这个智能体现在 你看我们刚才写的这个,嗯,开场白,对吧?我能一键制作思维导图,请问你需要什么思维导图呢?是不是出来了吗?对不对?我给问他一个啊,智能体 可以代替哪些工作? 看我们打开了长期记忆,是不是它就会啊?搜索记忆里的东西,但是我们这个是新建智能体记忆里面是没东西,对吧?第二步它就会调用树图这个插件, 看树图这个插件,这个智能体它就好了,它好了之后啊,我们看一下, 点击编辑,这时候呢,其实就到了这个树图的官网啊,你看他给我们我,我们回顾一下哈,我们刚才是干什么? 我们刚才是在干什么? 我们刚才问他,让他搭建给我们做一个,呃,问他这个智能体 能完成哪些工作,对不对?但是如果没有这个插件的话,那是不是他就豆包就会给我回复很多的问题啊?智能体能干什么?能干什么?他是发的文字对不对?但是有了树图插件,他就变成了这个。啥啊?变成了这个 述图,我们点开看一下,这个述图可以替代啊,智能体太极工作能够代替重复劳动性的工作啊,代替部分的脑力劳动啊,辅助决策、商业决策、项目管理、未来发展潜力和应用。是不是一个完整的思维导图一下就做好了, 并且呢这个思维导图可以编辑啊,你觉得什么东西可以要添加修改啊?全部是可以的。 ok, 这是一个最简单的思维导图大智能体啊,搭建的一个方法。 好,我们接下来讲用工作流,用工作流怎么来搭建?好吧, 好,还是这个思维导图的智能体,我们从第一步一步一步来哈,为了大家学会看这个,是我们进来扣子点 c n 的 网站对不对?点击扣子编程,这里面就是我们的专用智能体,对吧?这里有返回旧版,右上角返回旧版。 好,这里有,点击创建。创建什么?创建智能体啊?我们在思维导图对不对?一键制作思 思维导图,那么接下来我们就看看怎么样通过工作流的形式来制作一个思维导图, 让它自动生成一个图标。 ok, 生成了,点击确定,那我们就又进入到了这个什么? 又进入到了这个智能体的界面,左边是吧?人设是恢复逻辑,你是干什么的?中间有很多的技能功能对不对?右边可以预览和调试。 ok, 那 么我们这个时候呢? 那点击添加什么?点击添加工作流,添加工作流的时候,这些全部都可以不用管了啊,包括上面的模型插件,所有不用管了,我们点击添加工作流啊,点击添加创建工作流, 有对话流和工作流啊,先给大家讲工作流啊,这个是工作流是干什么的呢?是思维导图对不对?思维导图, 好,这里面这个名称必须是英文啊,这名称必须是英文啊,还有下划线不能是汉语和数字, 对吧?然后下面是可以汉语的哈,一键制作思维导图,这个主要是给自己看的,如果你不写这个,说明后面你就不知道你这个工作流是干什么的了。 好,点击确定,那么这个我们就进入到了这个工作流的搭建界面,看有一个开始,有一个结束, 可以缩小,也可以放大,拖拽式的,所以我们不需要会写代码也能完成啊。智能体工作流的搭建就是在这里啊,然后我们用鼠标的话,可以先这个鼠标友好模式在这里,我是用的鼠标,如果你用的 触控板,你就用触控板友好模式就好操作一点好了。然后鼠标的话,中间的滚轮是可以缩小,可以放大啊,完全非常自由的。 好,这里面有注视,有优化布局,比如说你有时候搭建的特别乱了,我们点击优化布局啊,它就会排的很整齐,要么竖着,要么横着 啊,还有导出为图片,你这个工作流就能变成一张图片,还有缩略图等等。 ok, 那 我们现在是要搭建什么?搭建一个思维导图的智能体对不对?那么这里面就有很多的节点可以添加,看在这里, 在这里啊,有很多的节点可以添加,鼠标放到这里,它就会展示出来很多,能添加大模型,能添加插件,也能添加工作流啊,包括还有能做代码选择器,循环意图识别等等等等啊,这些都会给大家讲到一个一个来讲。 大模型是什么,我们点击先看好,点一下,这个大模型就上来了,其实就是和刚才一样,这个大模型我们点击一下右边,大家看一下,右边有模型, 现在是豆包一点五 pro 对 吧?三十二 k 的, 还有豆包编程的模型,豆包是深思考深度调节的模型啊,豆包一点六极致速度模型等等,你可以选择啊,你可以选择啊,这么多的模型都可以选择, ok, 选择好了之后, 模型选择好之后,下面不是有技能对吧?这个技能就是可以给大模型添加一个功能。好,点击添加看,这个就是我们的,其实就是刚才的插件市场有链接读取图片理解,头条搜索啊,对不对?天气的 季末天气图像生成,我们刚才用过的数图的插件啊,头条新闻对不对,知乎热榜等等等等,我们看一下,这面有分类,有智能硬件的分类 特别多啊,现在这个插件市场除了有很多官方的,而且还会有很多第三方啊的人,用户制作的插件,包括新闻阅读的,你想用哪类型的插件?其实左边都有分类,你可以都可都可以找的。 看新闻搜索就有头条新闻,知乎热榜公众号啊,热榜搜索,实时热点新闻小说内容搜索,头条视频搜索,头条的图片搜索啊等等等等, 全网热搜的聚合啊,这个是全部都有,我们再看啊,再看这个,其实右边他会有这个调用量有一百四十七 k 调用,对不对 啊?智能体饮用量十五 k, 其实就是饮饮用的人调用的人越多,其实是越好的,对吧?说明他是 ok 的。 还有是什么?就是响应时间,平均耗时二十六毫秒,平均耗时一百一十六毫秒,当然响应耗时越少 是不是越好,对吧?成功率你看这是百分之百,百分之百对不对?成功率最高是不是其实是越好的, 有些成功率百分之九十对吧,我们想成功率越高越好, ok, 还有便利生活 天气的,地图的,地图的天气是不是查飞机的,查招聘的, ok, 还有图像,这个有可能用的比较多啊,有图片理解的,能看懂图片上面内容,还有同一万象, 还有视频合成,剪映小助手的啊,然后还有什么文生图,用文字生成图片的,还有 ai 绘画机器对不对,提示词优化啊,图片修改,豆包生成等等啊,图片的就非常多,而且还有一些实用工具, 实用工具解释分类的看,有火山知识库, ai 的 ppt, 高情商回复图表大师对吧,岁数多为表格,生活顾问等等。其实下面都有介绍啊,用哪些插件都可以的。润色的大模型对吧? 包括啊,某书语音合成大模型,网关, ok, 下面还有网页搜索,直接搜索网页的某度 b 站对吧?头条, ok, 科学与教育的培训的知识库,中国诗词的搜索啊,短视频规划,情绪干预,健康小妙招,掌上高考等等等等,特别多的功能啊,相当于把这些。其实这个 插件我们可以怎么理解,就是互联网时期的软件对吧?但是软件没有 ai 的 功能,没有大模型 它不会自主思考,后来我们把大模型通,让大模型来调用这个软件相当于它就能自己工作了,比如说那个竖图,它就思维导图嘛,对不对?没有 ai 的 时候也有这种思维导图的软件,我们人也可以用这种软件来制作出思维导图,但是那时候只能用人的大脑 来制作思维导图。但是现在呢,相当于我们把这个思维导图软件和这个啊,大模型豆包或者 deepsea 结合起来,让它自动给我们制作出来一个思维导图, 就是这样的原理啊,这些插件其实本质上在互联网时期他就都是软件啊,各种软件,只不过那加入到智能体里面,我们叫做叫做插件,那用人,用人,用人工智能的大模型来带带动他的工作啊, 还有社交类的啊,表情包回复的等等等等啊等等等等。还有游戏和娱乐类的, 随机人物生成,多元语录饱和啊,关于游戏的还有金融和商业的, 天野茶, 营销策略优化器,分析师对吧等等等等。还有音视频类的, 短视频转文案啊,很多剪映小助手啊,剪映小助手,分影数字人,做数字人的,还有长视频编辑工具 等等,我们是不是要把视频有些找对标的时候,视频里面的文案要提取出来呀,对吧?这些都可以搭建成自己的智能体的啊, 还有音乐生成,而且可以制作音乐,每个人都可以创作歌曲啊等等。 这个插件呢,特别特别多,要大家主呃,经常用啊,经常搭在里面,看看逛逛,你就知道现在 ai 都能干什么啊,都能搭建哪些对吧?好,这是大模型里面可以添加的所有的技能, ok, 那 么还有输入和输出, 待会我们搭建之后会重点讲这个,因为这个非常重要,输入啊,还有系统提示词,还有输出,包括每某个节点 他他都会有输出,有着变量要添加,很多人大选好了,插件选的也对, ok, 什么都没问题,但是这些变量名都不会填, 填写不对,一个填写不对,后面很有可能报错,就是结果出不来。好吧,这个我会手把手一一带大家,嗯,教会大家。好,添加了大模型之后,那我们看看这里面还能添加什么呢?能添加插件,能添加工作流,对不对?我们这个是要搭建一个思维导图的 工作流,对不对?那好了,点击插件,点击下键,我们还是找到这个树图的插件,点击添加, ok, 树图的这个插件就上来了,你看这样是不是就可以了? 好,我们先给到从开始。开始是什么意思?就比如说我们刚才问他智能体能搭建能,智能体能代替哪些工作, 对吧?这句话就会到开始里面,我们把这个线连好,这句话就能到了大模型里面。那大模型经过分析啊,都能干什么呢?能干一二三四五。他分析好了之后,把这个内容给到 这个树图的插件里面,树图插件根据大模型给他的内容怎么样?他把它制作成思维导图,最后把这思维导图给到结果结束啊,最后思维导图就可以出来,这个逻辑 是,明白吧?你不能连反了,不能把树图放到前面,大模型放后面,对不对?因为他的整个过程工作流程就是这样子,相当于工厂里的流水线, 你先得经过大模型分析,写出思维导图的框架,拿到框架之后,那个树图才能分析出思维导图,最后给到结束, 对不对?好,但是这样的话还是不能出结果的啊,会报错的,还没有搭建完成。非常重要的一步啊,非常重要的步,一,要每个每个都配置,要把大模型,要把树图,要把结束全部都配置好,好了,大模型,我们比如说就用这个模型, 就用这个模型哈,多报一点五, ok, 我 们在这里输入,这里怎么选择呀?看,如果这里面如果我们输入一个一串一串字母或者数字,那就是固定的量,好,那么 我们这时候不能固定,要变量,这个就小齿轮,点击这个小齿轮开始选择,开始 input 好, 它就是变量,什么意思呢?开始这里,你看,我们看开始这里是不是有个 input。 好, 那么就说明开始 input 这里面来的所有的问题,买家在呃用户在使用的时候所有的问题就能进来, 就能通过这个输入进来。如果这个不配置,这个不选择,比如说空的不选择,你这里面再输再多的内容,哪怕这个线也连好了,东西也过不来啊,它是断掉的,只有把这里面选择好,开始 input, 那 么这个才算,这这一段才算真正的连好了。 好,那么我们这个世界理解书要不要啊?我们是不需要的,这个智能体是不需要的,对不对?还有系统提示词,这个就是刚才那句话,点击自动优化啊, 你是思维导图框架优化大师,能够详细准确的写出 思维导图框架, ok, 点击自动优化,这个系统提示词就弄好了,当然这个智能体比较简单,我们就可以用这种方法,有些智能体,呃,比较麻烦, 提示词你用这种简单的方法写出来的它就不好,我后面待会还会给大家讲。呃,怎么样优化自己的提示词,你学会了,这个不光是搭建智能体,你平时和豆包和 deepsea 在 用这种大模型的时候,你的效果都会超超过很多很多啊, 好,写出来了,比如说点击替换,那么这个系统提示词就好了。系统提示词,我们再看下面,还下面还有用户提示词,为什么会有两个提示词?这是什么意思? 系统提示词,大家记好,就是怎么干这个活,怎么干好你角色,你是思维专业,思维导图助手,能够快速清晰啊,逻,逻辑严谨的思维导图啊, ok, ok, 怎么样能够第一个技能,第二个技能, 然后能够准确模仿出来, ok, ok, 是 不是好,这个就是这个活,你应该怎么干?那干什么活呢?干什么活呢? 就是用户提示词,这个怎么写啊?这个怎么写?这个要点 shift 括号,大括号,点两遍看,它会自动弹出来一个 input, shift 加大括号会两写两次,它会自动弹出个 input, 或者是你把键盘的输入法调成大写,那么你输一次,它就会自动弹出来两个大括号,点击 input 也都可以啊,这两种方法都可以。 好,它一定是自动弹出来的,并且弄完了之后,大家看,这个是要变成蓝色才算你输,对了,如果是黑色的肯定不行。那么输入 input 是 什么意思? 我们看一下 input 是 不是这里有?开始有 input 对 不对?开始有 input, 那 就是 用户提示词,就是从开始这里来的啊,比如说我刚才问的智能体能代替哪些工作,这句话 是不是要传到这里啊?这句话就是用户提示词你干的这个问题,但你干什么?你干,你干这个智能体能代替哪些工作? 这件事让他做这件事,明白了吧?所以用户提示词往往一般都是 input 啊,基本上大部分啊都是要输入 input 就 好了,这个是固定的。 好的输出这里面不用管啊,输出这里面不用管, ok, 那 树图呢?我们接下来啊,配置树图这个插件,树图这个插件就相对比较简单,只有一个输入啊,只有一个输入,那么输入这里面还是 点击小齿轮变量,那么他对接谁呀?对接开始呢?还是对接大模型? 大家看一下树图连的是啥?连的是大模型对不对?开始给到的东西才未到大模型里面,大模型出出的东西在未给这个树图的插件,所以树图的插件点击大模型的 什么 output, 就 只只有这一个选项,那么说明大模型的 output, 也就是大模型输出的内容全部传给树图这个插件, ok, 树图的插件,树图工作完了之后要给谁?要给结束是不是?那么结束它对接谁呀? 对接开始还是对接大模型,还是对接树图?一定是对接树图对不对?好了,这个时候我们看树图有这么多,我们不知道树图制作好的思维导图在哪里,是不是我们就不知道选择哪个,对吧? 但是我知道,我可以告诉你先选择对他,但是你不知道怎么办?我们告诉你还可以试运行啊,是可以试运行的,那我一个一个来试运行大模型,看我们这个这里 测试该节点可以测试大模型对不对?好了,我们测试一下,看大模型我们配置好了没有?比如说我还是问他智能题能代替哪些工作 好?点击运行, 看看它怎么样给我们回答,智能体呢?代替哪些工作?看它是以 mark 杠格式的输出来的。我们这里有个小眼睛预览,我们点击预览看一级分级、二级分级、三级分级,对不对?一级、二级、三级三级, ok, 它说了这么多, ok, 说明是 ok 的, 对吧?那么我们它这个弄好之后,我们可以点击复制, 这里有个小复制啊,点击复制好,那么点开树图这个插件,树图插件这里面是不是也有测试该节点呀? 那我们现在是手动的把大模型输出的结果给他粘贴进来,待会他就会自动过来啊,这是大模型刚才输出的思维导图的框架,对不对?我们点击试运行,看看这个思维导图的这个树图的插件他能不能做出来。思维导图 关键是看什么?我们是关键是要看他做出来的思维导图在哪里,刚刚有那么多的选项对不对?我们不知道选哪个,选错了就有问题了,选对了, ok, 看,你看,这是我们输入的,对吧?这是我们输入的, ok, 这是输出的,输出的这么多,这么多,在哪里呢? 在哪里? data 这些显然都不是啊,看是不是在这里点击这个预览,这是不是思维导图啊?好了,这做好的思维导图就在这里,那么这个位置在哪呢?就在 data 是 不是?好了,那我们知道结束时候要配置哪里,是不是思维导图那么多都不是,是 data 对 不对?我们选 data 就 ok 了。 那么现在这个工作流,我们把每一步都添加好了,每一步都连接好了,并且把每一步全部都配置好了,我们看看它行不行,就点击下面这个试运行,好,点击试运行,看看它能不能制作出思维导图,我们这里面继续问它。 嗯,机器人和智能体的区别, ok, 随便让他做一个这个智能体和机器人区别的思维导图, 你看他工作到哪一步,哪一步就是啥呀? 就是虚线。现在刚才大模型开始给到大模型,大模型给到树图,树图, ok, 现在结束了,我们先看看结果,结果出来了 对不对?结果出来了思维导图就做好了,那么我们再教大家哈。其实有时候并不是每次都成功的,有可能你搭建错了,或者是某一个插件,它成功率不是百分之百,他有时候也会报错,报错了之后 就会出现问题,出现问题之后他就不可能。下面每一个像这样都是绿色的成功的箭头,但我们知道出现问题很正常啊,我们会排查问题,最重要,现在就教大家怎么样看这些东西,你看, 嗯,开始这里面我们展开输入, input 是 什么?机器人和智能体的区别,是不是我作为一个用户输入中心的内容? ok, 大 模型就收到了,智能体和机器人是有什么区别?输出了这么所有的东西, 思维导图的框架,文本形式的对不对?然后呢?给到树图这个插件,你看它输入的是什么?这个东西是不是和大模型输出的是一模一样的, 对吧?就不用像我们刚才一样手动的往过复制了,它自动就过来了,过来了之后好了,出来的结果啊,结果是在这里对不对?然后再得它这边好了,得它的东西 又全部给到了 output, 全部给到了结束,我们最后就能拿到结果,是不是如果哪一步出现问题了,哪一步就会报错,我们到时候就会看, ok, 这是思维导图这个工作流啊,搭建的完整方法,当然这是一个相对比较简单的工作流,看,同样一个做一个思维导图的智能体,我们第一种方法了, 能做对不对?第二种方法以工作流的形式还能做,那么还有第三种形式工作流还有第三种形式,我们可以不在这里面添加这个数图的插件,怎么办呢?怎么办呢? 因为这个比较简单,只有这一步,是不是我们在大模型里面是不是还有技能这一栏呀?还有技能这一栏,我们点击添加,找到树图的这个插件,点击添加相当于让这个大模型自己添加了一个技能 树图,对不对?不需要第二步了,自己直接一步就能制作出啊思维导图。但是如果这样的话,我们的系统提示词就要变,刚才是让他做什么?刚才是让他做思维导图的框架,现在让他直接做成成品思维导图。 好,我们就要把这些全部给它删掉, 全部给它删掉,好, 你,呃,可以通过调用技能 里的树图插件制作思维导图, ok, 让它自动优化。 嗯,好,它 写好了,我们直接点击替换就好了。那么这个时候变完了之后,哪里还需要调整呀?是不是结束还需要调整?刚才结束对接的是树图的插件,现在直接让它对接大模型 output 就 好了,那么连也连好了,配置也配置好了,我们再试运行一下 啊。机器人和智能体的区别,点击,你看问题从这里面过来,给到大模型,它运行到哪一步,哪一步都是虚线,对吧?大模型在工作 展开,这个问题过来了, ok, 第二步, 因为有大模型,因为这个比较慢。为什么?第一步,因为大模型需要写出框架,在他通过框架再调用树图的插件,最后制作了四维导图,是不是看框架出来了, 思维导图也出来了,对不对? ok, 那 么同样一个搭建思维导图的智能体是不可以教大家,教了教了三种方法,对吧?如果你熟悉了扣子智能体,熟悉了工作流,对吧?很多的智能体,他并不是啊,死固定的,只有一种方法, 你用习惯用哪个合适用哪个都可以。好啊,这一通,这一步跑通了之后啊,我们基本上简单的智能体就会搭建了。好,点击发布。右上角点击发布 啊,这里面版本号,一号版本,二号版本,怎么样都可以,对不对?我们点击发布, 看这个工作流就发布好了,它会自动提示你发布成功,是否将是否添加至当前的智能体,我们点击确定,看刚才搭建好的这个工作流就添加到了智能体里面了。这个智能体呢? 我们这边什么都不用写了,这也什么都不用写了,光荣调用就 ok 了,看这个时候在这里就能试用。那给大家试用一下,比如说 问他 ai 有 哪些创业机会 好,点击发送, 看它是正在调用什么啊?调用思维导图的这个工作流,对吧? 不是光用这个豆包大模型来回答问题了,如果没有这个智能体,你光用豆包或者用 deepstack, 你 问它 ai 有 哪些创机会,它就给你叨叨叨说一堆对不对?它给你一大一大堆的文案打出来,但是有了这个智能体,我们就可以让它制作成思维导图啊。 这个智能体呢,如果你不想继续发布,就是说只想自己用,不想给任何人用,放到你的工作空间里面,这一步你就可以了,平时就在这里就可以用了啊,这个是别人不能用的。后面如果把这个智能体发布上去,你可以选择发布的平台啊,你看结果就出来了, 这是写出来的文本,这是制作的思维导图,对不对?我们点击编辑一下,看看它做的怎么样。 ai 的 创业机会,医疗领域、教育领域、金融领域、娱乐领域,对吧?等等等等。农业领域 ok, 那么这个智能体你如果自己用就 ok 了。但是如果你想发布到其他的平台,或者发布到扣子平台,我们接下来继续走啊,点击发布, 当然这里可以进入版本,你是第一版,第二版,对吧?写一个生成好可以看一下,你可以发布到扣子商店,如果发布到扣子商店,就像我们刚才看的啊,在扣子的 模板商店里面,作品社区里面就能看到了,这都是其他的用户发布上来的啊。还可以发布到豆包,发布到豆包里面 啊,豆包里面不是有很多的智能体吗?都是用扣子搭建的啊,你就可以通过手机豆包也就可以用这个智能体了啊。收要,但是这个要授权你自己账号,包括可以设 嗯授发布到飞书,飞书也是要授权的,当然这些都是字节旗下的,还是相对比较简单,授权了就可以了。飞书里面下面的智能体叫做机器人,每一个图标下面他会有个机器人的图标啊,其实上就是智能体啊,智能体他就是电脑和手机上的机器人嘛。 啊,如果你发布到飞书上,你自己打开你自己飞书账号也能用了,当然还可以发布到啊,这些微信小程序,抖音小程序啊,飞书多维表格等等等等,而且还可以接入 k api 接口啊,然后和其他的软件连接起来。 好,呃,这个智能题我就不发布了,如果比如说发布到这里一点发布它直接就发布了,发布的时候这里还可以选择效率工具,它是默认的,你看 ai 它能识别吗?对不对?做思维导读就是效率工具,如果你想把它换成商务服务啊,或者是其他的也是可以的。 ok, 那 么一个最简单的智能题的搭建的流程啊,就给大家讲完了, 这个里面只用到了一个数图的插件,我们刚才看了一下,插件里面有非常多的东西,对不对?然后只有你搭建的智能体越多,用到的越多,你后会来后,后面会呃,越熟悉很多的啊,智能体,比如说,呃, 我们看一下一个,我给大家看一下我们这边已经搭建好的智能体哈,在我们学院空间里面, 这些智能体呢,呃,不仅能用,而且全部都可以复制带走到你自己的空间里面啊,你可以永久使用啊,比如说我们看随便打开一个吧, 这些智能体刚就像刚才刚开始给大家看的,有些工作流还是相当复杂的啊,比较复杂的东西里面插件和节点特别多,先开始你不太熟悉的话, ok, 嗯,这个还是很简单,对吧?像先开始你不太熟悉的话,你可以把啊,我们或者是别人已经搭建的好的智能体或者工作流,你打开看一下,看一下一步每一个节点他是怎么连的,他是怎么,嗯,这个 设置的你全部都能够啊,看懂,而且能学的会。好,我们再进入这个工作流大件的界面哈,刚才给大家讲了一个大模型可以添加进来,对不对?然后当然还可以添加插件, 对吧?我们刚才添加了一个树图的插件, ok, 当然还可以添加工作流,当然下面还有这些业务逻辑,可以添加代码,如果你会写代码,需要带写代码的话,而且还有选择器,重点把这几个给大家讲一下啊,这个逻辑,嗯,还有意图识别,还有循环 添加,还有变量聚合, 变量聚合全部都添加进来,一个一个给大家这个讲解啊, 好,这个选择器呢?其实比如说我们有两条路要走啊,什么叫有条两条路呢?举个例子啊, 我们从开始来的任务,比如说有两条路,一条上面一个大模型,我们再给它添加一个大模型, 比如说我们这是一个回答问题的工作流,那么上面的这个智能题,它只回答什么问题?只回答只回答 数学问题。 好,你看上面它是只回答数学问题的,那么比如说下面这个智能题,哎,等一下让它写完点击替换。 好,接下来我们再返回来工作流搭建的界面哈,刚才搭建了一个最简单的思维导图的智能体,但是这里面我们看添加添加节点有很多很多其他的功能,一个一个给大家介绍哈, 下面的话就是一个添加一个工作流啊,一个完整的工作流都可以添加进来。然后下面是已收藏的插件 啊,这不是我收藏的,这些插件都会在这里面显示。 ok, 下面的话就是业务逻辑,这个是有一些逻辑思维的,但是很简单,但是它的思维逻底层逻辑和那个,呃,搭建代码啊,编程是一样的,只不过我们不需要会搭建代码,也可以用的。好,我们一个一个先添加进来, 我们讲几个大家经常常用并且好学易学的。嗯,最有用的一些。呃,逻辑,比如说一个是选择器好,我们先把它放到这里。好,还有一个比如说是循环 啊,也把它放到这里。 ok, 再添加一个,比如说变量聚合,哎,添加到这里了,添加到循环里了,我们重新换一个地方, 添加一个变量聚合, ok, 那 么这个在什么时候才能用到呢?哎,我们说比如说现在大家想搭建一个什么?搭建一个回答问题的 智能题好不好? ok, 回答什么问题呢?可能回答好多种问题啊,回答问题谁能回答呢?我们比如说让添加大模型吧,一定是只有大模型才能回答问题,对不对? ok, 两个大模型, 比如说我们第一个大模型,它是干什么的呢?它是回答回答关于三国演义问题的。 好,你是回答关于三国演义问题的,我们点击自动优化, 我们等它把呃,这个题诗词优化好, 一一一 好,这样这个大模型它就只回答三国演义问题, ok, 我 们可以给它啊,改个名字,三国。那么下面这个是回答什么问题的? 水浒。 好,你就是只回答 水浒传问题,其实就有很多的场景是需要走不同的路的啊,用不同的 工作流,用不同的插件,不同的智能体来完成不同的工作啊,这个就是给大家先简单的用这个场景来代入一下,大家理解这个功能就 ok 了。 你看这个它只回答关于水浒传的问题, ok, 那 么这个选择题的功能就出来了啊, 你看选择器,这里面请选择啊,用户变量,系统变量,对不对?我们先得把连线得连好。选择器,你看请选择从哪里?从开始 input 来的东西 包含,比如说包含什么呢?水浒啊,像包含三国, 包含三国的内容就给他,否则就给他。不是三国就是水浒嘛,就给他。 ok, 回答完问题之后,那比如说两个我们怎么办啊?都给到结果吗? 都给到结果吗?这样是有问题的哈,这样是肯定是不行的。 嗯,所以这个就是变量聚合的功能,把它和变量聚合对接起来,就是不管谁回答的问题,统一交给变量聚合。那么这个变量聚合怎么设置呢?一个对接三国的 奥特曼,一个对接水浒传的奥特曼,不管他俩谁回答问题,统一交给变量聚合。 ok, 统一交给结束结束,还像刚才一样,怎么配置呢?是对接谁对接三国?还是开始之后转是对接离他最近的这个变量聚合的啊?结束结果是不是 这里面没运用到循环?如果我们只需要回答一遍,是这样子的,比如说我们这个问题想让它回答十遍,我们就给他把它添加到啊这个循环题里面, 待会给大家讲解这个循环题怎么用啊?比如说, ok, 这样就设置 ok 了,那我们先试运行一下,把这个先删除掉。 好 啊,大模型还没配置啊,我们先把大模型完整的都配置好。那大模型刚才输入这里面要开始 input 对 不对?用户提示词是不是 大写的两个大括号点 input, ok, 下面的也是输入开始 input 下面的大写的两个大括号, import, 对 吧? ok, 这次点击试运行,它就没有提示了。 ok, 那 么比如说我们问他,三国 中 刘备和诸葛亮是什么关系, 你看他怎么办?他是不是从上面走了,上面正在运行, 下面就没动?为什么?因为我们刚才问的问题是什么?三国中刘备和诸葛亮有什么关系?是不是有三国两个字?他识别到有三国两个字好了,那说明是要问三国问题啊,就到上面了,没有这两个字,就到下面了。好,我们看他结果出来了,点据了啊,人为关系, 刘备的身份,诸葛亮的身份啊,三顾茅庐,关系特点等等等等啊。最后给到变量聚合,拿到了 上面的结果。 ok, 这是通过关键字检测的,其实道理很简单,因为里面里面有三国这两个关键字,它就能识别出来。 ok, 这是一个最简单的应用,我们的目的是要记住选择器和变量聚合这两个都有什么功能好,那么,呃,比如说我们这个循环怎么办? 是吧?这两个删除掉,我们添加节点循环怎么办? 好,比如说我们回答三国问题,这个就不要了啊,比如说我们这个智能体是干什么的呢?是专门回答三国问题的智能体,但是我每次想让它不仅回答一个版本,要回答 啊,多个版本,那怎么办?我们点击循环,这里面配置啊,使用,使用数组循环,指定循环次数,无限次循环,我们比如说这里面需要指定循环次数,刚才只能回答一个版本吗?比如我每次想让他回答两次, 想让大模型给出两个版本的答案,我们就写二,三个,我们就写三,我们比如说写二啊,这个时候我们怎么办?把这个全部都连接起来, 这里面要注意是从左往右一连,这个也是从左往右连,全部都是从左往右连啊。好,我们循环两次,那么中间变量 开始 input, 从开始这里来的问题给到循环,这个循环有个特殊一点,它下面有个循环体啊,连了个小尾巴啊,这个是扯不断的,必须要有的。然后 大模型我们设置的还是从开始 input 这里,对吧?关键设置循环输出,这里面输出给谁啊?是不是输出给 循环? ok, 结束,这里面对接谁啊?对接循环到 output。 好,我们点击试运行。还是刘备和诸葛亮什么关系? 好,他正在试运行,你看这就出现个一和二回答,第一个版本出来了,第二个版本又出来了, 他回答了两遍,就是一次完成两个工作,这个是有什么作用呢?就比如说我们要写短视频文案,对吧?嗯,同一个选择题,我们让他写多个文案一次,比如说,呃,我写一个关于三国的诸葛亮的文案, 那么每一次只能写两个,甚至可以让一次让他写出十个不同版本的文案。 好,我们看一下结束结束这里面,哎,他怎么是问题啊?不是结果呀?那我们一定是哪里设置错误了啊?就是这里输出,看我们输出,这里面选的循环,我们应该选大模型, 看我们这里面选择的是循环,那应该选择这个三国这个大模型的 output 输出的结果,对不对?我们再来试一下, 我们在搭建智能体的时候,包括工作流很多的新手,嗯,不用害怕,为什么呢?因为不管你设置的什么东西,选择什么东西,全部都不是固定的死的,不是说弄错了之后就没有改错机会了,就是所有搭建错误的之后,呃,包括有些报错了之后,哎, 我们都能从中找到问题,关键学会这个方法,不管是什么问题,我们立马就能找到问题的根源啊,而且知道怎么解决。好了,来我们看点击约了,是不是所有的结果,所有的结果啊,全部都出来了 啊。这个循环就是不仅让这个模型工作一次啊,而且还让工作模型工作很多次,这个就是循环的功能。好了,我们再仔细看一下下面还有什么那么有意图识别有批处理 啊?一次不仅运清一次,而且是批量处理任务或者是异步处理,对吧?呃,通过一个中心来的东西多次处理,而且还会有输出输入,还有什么查询数据,新增数据啊,知识库的写入,删除知识库 啊,剪辑,长期记忆的剪辑,带有这个小蓝标的,它就是需要消耗资源点的啊,需要消耗资源点的,然后包括有图像生成,直接可以生成图片,而且可以把图片画到一张画板上 啊,而且可以把图片抠图,抠图就什么电商里面用的啊,可以把背景抠抠掉,把人物或者把某个主体抠出来,还有画质提升,提升画质的啊,还有很多很多的这个图像的插件,包括还有音视频的生成,视频音频的提取等等等等, 而且这下面的哈,其实普通我们用不着,至少你不会写代码的话,这些有很多的功能是用不着的啊。这个图像生成图像处理,这个是特别简单的啊,比如说我们点击图像生成啊,再给大家看,很简单, 连起来他就能画图啊,他能画图, 看这里面,它这里面可以设置什么图片的比例?四比三,三比十六比九,九比十六,对不对?你想要什么样的图都可以设置啊,比如说一比一对吧? ok, 就是 能设置比例,而且最多能生成图片的数量,可以设一张,可以设两张,三张,对吧?啊?都可以啊,比如说还可以添加参考图, 用图片生成图片,点击添加了之后就要上传图片了啊,上传图片就是图片、图声图,如果不没有的话,就是比如说默认不需要好, 这个还有提示词对吧?还有输出输入,比如说输入这里面我们选择谁啊?选择开始 input 对 吧?也就是从开始 input 来的这个, 然后提示词怎么选呢?还是刚才一样啊,我们两个 input, 两个大括号 input 好, 也就是从开始 input 这里来的命令给到它输入 线,不仅要线连好,而且还需要干嘛啊?提示词这里面把 input 写好,而且还需输入这里面把变量配置好。 ok, 结束的话,我们对接谁呀?是对接图像生成的 什么 data, 对 吧? you may, 这为什么?你看这个 s, s, 这个是文本啊,这是图片,我们要的是图片,对不对? ok, 点好了之后我们试运行一下,试运行一下,比如说我们让它干什么? 呃,一只小狗,我们让他画一只小狗,再玩足球, 这个生成图片,呃,消耗算力稍微有点多,然后也会速度稍微慢一点, 并且现在这个呃是收费的了啊,但是你看结果就出来了,一只小狗在玩足球, 对吧?而且一比一对吧。哎,这个有什么用呢?不是我们很多人说豆豆包也可以升图片呀,我们为什么非要用这个呢?它不仅能升图片,而且能把图片放到一个花瓣上,而且能配上文字,就可以出。什么出公众号的图文, 小红书的图案啊,可以做 ppt 啊啊,而且可以做这个海报,对吧?这些全部都可以了, 然后我们再添加啊,比如说,呃,有这个画板画图,然后还有抠图,对不对?点击加上抠图这个插件,我们就能把这小狗抠出来了,背景什么全部都没有了啊, 比如说我们把这个删掉,把这个扣先,你看第一步先画出来,对吧?画出来了之后第二步给到他, 再把图片抠出来很多。这个电做电商的是不是要摆地图,对吧?所以你需要抠图的。那么上传图,上传谁的图呀?就是图像生成过来的图, 对不对? ok 啊,抠图结果尺寸,然后啊透明的背景图啊,也可以单词,也可以 p 处理, ok, 那 么结果这里面就选谁,刚才对接的是图像生成,对不对?现在我们要的是抠好的图,抠好的图是哪个啊?还是这个?因为你看这是图片嘛, 这些都是文本啊,这些都文本,我们要的是图片,所以肯定是选第一个,当然你不知道的话,可以可以,根据我刚才上面剪的那个单剪点测试啊,你就知道它的结果在哪里啊?点击试运行。一只小狗 在玩足球,还是,那么现在他就需要两步了,第一步他把这个小狗画出来, 现在正在画这个小狗,对不对?玩足球的小狗每次画的都不一样啊,看肯定很不一样的,和刚才的图片,一只小狗在玩足球,对不对?好了,那么第二个开始抠图, 就是什么没有背景的小狗和足球主体的图了,对不对?这是画好的, 这是最后扣好的图片,做电商的,那你随便拍一张,那么白底图是不就出来了?好,我们再再后面再看一下啊, 还有画质提升,这个很多的就不一一讲了,因为很多的功能你只要会用了一个,其他你知道什么功能你全部都可以添加了啊,还有视频的生成, 上面是生成图片的,这个生成视频的啊,还有视频提取成音频啊,把视频的音频提取出来, ok, 等等等等,还有文本处理, 那么弄好,做好了之后我们点击发布啊,这个工作流就可以添加到智能体里面了 啊,这个就是智能体,简单的啊,最常用最简单的这些所有的功能啊,所有的功能。当然现在也不是所有的智能体和工作流都要自己从零到一一步一步搭建的。 那包括给大家看一下啊,我们这边有工作空间里面搭建了好的很多的智能体, 这些智能体呢?有,如果有的话,你都能用的话,你是不是不需要自己一步一步搭建了啊?这些智能体你都可以 用,而且也都可以复制到你自己的空间里面永久使用,对吧?你看我们每一期,第一期、第二期都有很多的这个选空间, 而且我们有一些智能体,你可以,你如果会的话,你是可以改的,比如说他和他的这个比较类似。好了,我们把他的这个修改一下,修改 修改,升级一下,变成我们的智能体啊,变成我们的工作流,这样速度效果更快,关键是要懂得原理啊,懂得方法,这些都懂了之后啊,就会非常好用 啊。那比如说更简单的,我们这种马斯克的智能体怎么搭建?其实它连插件都不需要的,它只需要提示词,对吧?告诉这个什么大模型,你是马斯克对吧?而且你又懂得马斯克的东西。呃,然后还有什么呢? 比如说我们要搭建一个马斯克智能体啊,怎么搭建好?我们输入马斯克, 好给大家讲一下方法啊。你看我们想搭建马斯克的智能体或者是巴菲特的智能体,那我们要告诉他啊,你是马斯克, 能够用马斯克的思维方式和 说话方式回答问题,好,自动优化一下 就出来了。如果你这个智能体想搭建的更好,你看马斯克和巴菲特这种是名人嘛?因为网上有很多的数据,其实如果你把这个指示词做好了之后,他就基本上能够用马斯克的思维和表达方式来回答你的所有问题了,因为互互联网上有很多马斯克相关的信息, 对吧?他都能够采集到,所以 ai 也相当了解马斯克。 ok, 我 们点击替换。但是如果你想他更厉害,你可以把马斯克你所能获取到信息通过什么?通过知识, 比如说文本,比如说表格,比如说马斯克的图片表格,比如说马克马斯克的故事,马斯克公司和他自己的具体的数据和内容,你可以以文本的形式添加进来,添加成知识库, 那你可以添加成知识库,然后他就更懂得了。但是名人的话,这种不太用得着。但是如果,比如说你想搭建一个自己的 分身,能够以自己的说话的方式干什么?来跟你帮你写文案,来帮你写报告啊?来帮你写日记,是不是? ok, 那 你怎么办?因为你,我们作为素人、普通人, 互联网上没有足够多的信息,那我就可以,比如说我是自媒体博主,我也写过很多的文案,我就可以把我写过所有的文案在这看。老米文案我就可以添加进来, 他就了解我啊,我就可以,他知道我的写的文案是什么的内容,他就足够了解我是思想什么的,我是关表达是什么,我现在在做什么事情, ok, 他 就会,我只要告诉他,他就会全部都了解, 他就能给我写出和我自己写出来非常一样的文案啊,非常一样的文案。 ok, 一 步写这个提示词,第二步就是看嘛,加本地的知识库。当然比如说我想搭建一个什么呢?搭建一个,我现在不搭建马斯克了哈,我只可以搭建啊,老米个人助手, 嗯,老米个人助手,我想搭建一个非常懂我的我的助手,对吧? 啊?包括你想让他干什么啊?帮我记忆我呃每天的会议内容,或者是帮我分析我每天的工作,或者或者是给我作做出决策建议,或者是你想让他 呃记住你每天的呃,很多的事情相当于一个秘书一样,对吧? ok, 这个就是这个, 这里面还有之前的啊,把这之前的全部都删掉,那么这个时候我自己的个人助手 啊,秘书吧。 ok, 还有比如说你想让他干什么都可以写到这里面来,然后把这个全部都丰富了,丰富写起来讲这个智能体呢,主要是给大家想讲一下这个长期记忆的功能, 好,点击替换。 ok, 这个是能随时修改,能不断优化的啊。然后我们比如说打开长期记忆啊,创建一个记忆, 好,添加进来。好,那么我每天问他的问题,每天和他的聊天记录,每天告诉他的所有事情,他全部都能记得下来,经过啊, 一个月、两个月,一年,两年之后他会记忆力的越来越多,你所忘了某一天干了什么事情了,和某个人啊,发生了什么事情。 ok, 只要你告诉他,他,他全部都记着,但是和我们平时的笔记本有什么区别?我们记到笔记本上,你是不是一页一得翻呀,一个一个的找呀,比如说路程这个 录音你得一段一段去听呀,非常费劲。这个不需要啊,你只需要问他啊,他就全部都能给你解锁出来,给你搜索出来啊,非常好用啊,就是一个自己的个人助手,所以添加出来长期记忆 啊,他能始终对记者你俩的聊天内容相当于是你的一个私人助理。 好,这是一个智能题,现在给大家看一下我们空间里面自己有什么智能题哈,简单介绍一下,这个是我们往下翻,往下翻,你看这些都是学员, 嗯,复制的,你看这些,这就这个学员复制的啊,我们自己搭建的是老米看,这是我们自己搭建的,但是有很多不是的,这就是我们的啊,学员进来自己复制的,复制到他自己的空间啊,能用的 ok, 简单看一下啊,比如说杭都行业的深深都 分析,这个比较大啊,深用,嗯,但是分析的真的超级准啊,几分钟的时间啊,顶上人工作几小时几天的工作量,还有直接制作视频的火柴人视频的这种工作流啊, ppt 生成的,嗯, 像某书文案生成的啊,包括冯唐的啊,古诗词一键生成短视频的这种正题,还有我某信这个做销销售的啊,啊,朋友圈评论的 啊,包括这种人间情景,老奶奶啊,制作视频的智能体啊,如果书记会说话啊等等等等。制作视频的,然后读文案的,然后包括这种战略顾问的 啊,梵高绘画大师画出梵高的画作的啊,还有嗯,房企文案,包括心理学,行为分析是吧,还有第一人称视频解影视解说的啊,这种智能题啊等等都有很多很多,我们在不断的更新,这都已经有上百款这智能题了。 好了,最后再给大家讲解一下我们,呃,主页 c o z e 点 c n 啊,扣,主页就是扣子空间,也就是通用智能题,怎么用?这个其实蛮简单的,我们点击免费试用就行了,我们知道它能干什么,比如说能写作 啊,豆传说说豆包也能写作,我跟你说不一样啊,豆包或者 d c, 它是有上网搜索的功能,能给你回答问题,对吧?他是很快很简短的啊,迅速搜索二十个网页,十个网页,对吧?回答问题, 但是这个呢,他会模拟真人,然后一个网页一个网页的打开会研究,他认为可以研究到所有相关的东西,所以他就更深入更详细啊,就是这样 好,比如说啊,我让他研究一下,呃,这个二零二五年深圳啊新房和二手房交易的数据,对吧?如果互联网上没有调查官网查,或者是在各大媒体平台查,他就会 等深入到官网,深入到他认为可以查到的所有的网站去查,一个一个查,而且查的数据会非常详细,而且这个不仅能回答问题看,还能哎,一键制作出来 ppt, 那 这个是非常好用的,还有 ai 的 设计,直接做出来海报,还有网站开发,那做一个网站,做一个小游戏的网站啊,全部都可以,你只需要点击这个免费试用就可以了, ok, 这个呢,扣子空线,其实它有 app, 有 手机版的,手机上也能用,电脑也能用啊,手机版是前几个月才出来的。 ok, 看,有写作, ppt 设计,做 excel 表,网页啊,还可以做播课, 看看下面有探索人像学习是吧?你不知道能干什么,你看看别人都在干什么?财经分析,看 你像很多的博主,抖音上的博主、知识博主,是吧?他很多东西要分析,如果自己分析要查数据,要查网页会很慢,用这个就会非常快,而且直接出来查图,还有创意设计、生活娱乐、 市场营销啊,旅游攻略等等等等,全部都可以做,而且速度真的蛮快的,而且这个功能会越来越全。 这个成非常成熟了之后就相当于一个通用的。呃,手机上和电脑上的机器人可以代替你来抄取手作,就像前段时间呃豆包手机是一样的。啊,那个豆包 扣子,这不都是字节的吗?他都是代替人来操作啊,电脑、手机来在互联网上完成工作的。 ok, 今天的课程就到这里。

老板让你给公司做个 ai, 做好了就给你加薪,该从哪里开始呢?我建议使用智能体加数据库的方式, 智能体强大的认知和交互能力,结合数据库海量且精准的知识,完全可以做到一加一大于二的效果。今天我将通过这期视频,手把手教你如何搭建企业级智能体,帮你自动执行任务,以及如何使用本地部署的 ai 模型来搭建一个知识库。 话不多说,我们马上进入正题。经过超长时间的精心打磨,今天我终于带来了全网最详细的 r g flow 本地部署教程。 从多克的安装到 r g flow 的 部署,再到千问三模型的本地部署,最后教你如何构建一个个人的知识库,每一步都非常详细,绝不漏掉任何一个细节,跟着我一起就能轻松搞定整个流程,我的目标就是让你少走弯路。 话不多说,我们直接开始吧。在传统的 r g 框架基础上,市面上出现了很多结合 r g 工作流以及 ai 智能体的实现方式, 例如我们了解的具有代表性的就有 define、 fast gpt, 网上已经有了不少的技术爱好者,很多大神啊都对这些工具进行了横向的对比评测。当然这些评测可能会带有一定的主观性, 不过也能给我们一个很好的参考。其中 r g flow 它在深度文档理解方面做得非常非常出色,给用户带来了一个极大的灵活性。 作为一款开源的 r g 引擎, r g flow 专门为不同规模的企业和个人而设计,简化了 r g 的 工作流程,它可以让复杂的文档处理变得简单又高效, 不管你是处理结构化数据也好,还是处理非结构化数据,比如说 pdf、 word、 ppt 文件, rg flow 都能够提供精准而且有理有据的回答,确保答案可靠可信。 总之, rg flow 不 仅仅是一个文档处理的工具,它更是一种全新的知识管理和智能问答方式,能够帮助企业更加智能地去管理企业内部的知识库, 也能够让个人更加高效地去利用信息资源。那对于想要提升工作效率的人来说, rg flow 绝对是个强大的帮手。 好,下面这张图它就展示了 rg flow 的 系统架构,直观地展示了整个系统是如何运作的,我们就简单来介绍一下。 首先在最左边有两个方框,一个是 question, 一个是 documents, 它们就代表了用户的输入,用户可以在这里,嗯,输入它们的问题,或者是上传文档文件。接下来这里有一个长一点的模块,这是一个常见的网络服务器,用来接收用户的请求。 他就像是个快递员,可以把用户的问题或者是文档送到系统的后端去处理好,处理完了以后,他再把结果送回来给用户。然后我们再看到这个底下有一个任务调度和查询分析的模块,当有把文档进来以后, 这个任务调度的模块它就会分配相应的任务。要是来了问题呢?那这个查询分析模块它就会开始工作了,它会分析用户的问题,并且提取关键词,并生成切入向量,为后续的信息解锁而做准备。 那接着我们就到了最中间的这一块儿,拨录召回的部分,这里是什么作用呢?它会根据之前查询分析的结果,通过数据库里面的关键词和切入向量进行一个信息的剪索,从中找出相关的信息。 那找到了相关信息之后,又会被送到一个 re rank 重排序模块里面,这里就会对搜索的结果进行优化排序,确保最重要的信息是排在最前面的, 最后这些信息又会被传递到。嗯,生成答案的这一部分,再结合大模型生成最终的一个答案。我们再看到最右侧,这里是几个跟文档处理相关的模块, 包括了 documents, parcel、 文档解析器、 ocr 等等,他们就负责对上传的文档进行分析和处理,提取有用的信息,并且把文档转换为系统可以理解和使用的格式。 所以我来总结一下整个流程,就是从用户提出问题或者是上传文档开始,经过一系列的处理步骤,最后会生成针对这个问题的一个答案。希望我这样解释能够让大家大致了解一下 party flow 它是怎么工作的。 ok, 那 既然我们已经了解了 rgb flow 的 系统架构,那接下来我们就要正式开始干活了,因为 rgb flow 的 源代码里面并不包含它运行起来需要的所有环境和依赖,所以我们要让这个系统在我们自己电脑上跑起来,所以我们就是用 dock 来部署 rgb flow, 通过配置 dock 镜像,就相当于是在你自己电脑上配了一台小电脑,我们就不需要手动去设置复杂的本地开发环境了,那么我们就来安装一下 dock desktop, 这是官方推荐的多可的解决方案,提供了一个图形化的界面和完整的多可功能支持。 那在安装之前我们有几个准备工作要做。首先是检查你的系统版本是否满足要求, 配置要求,我就以 windows 为例,系统版本的最低要求是 windows 十或者是十一二十四位的家庭版、专业版、企业版或者是教育版,版本号要在幺九零四五以上, cpu 要大于四核,内存至少是要嗯,十六 gb。 如果你的系统不满足这些条件的话,可能就需要考虑换系统或者是使用虚拟机了,但是我觉得大多数的小伙伴电脑应该没有问题。 第二步是起用 hyperv。 为啥要用 hyperv 呢?我也来简单的解释一下, dock 其实是在一个隔离的环境里面运行的, 那为了让容器在 windows 跑起来更加稳定, windows 就 自带了一个虚拟机管理工具,也就是 hyperv, 它能够让 dock 拥有自己的独立环境,不会和你的系统产生冲突。那我们起用 hyperv 的 具体做法就是搜索控制面板程序,然后程序的功能 点击左边的启用或关闭 windows 功能。这里我就已经起用了 hyperv, 看到没有好点击确定。 当然也可以通过命令来起用 hyperv, 我 们要以管理员身份打开 power shell, 我 们也在这里搜索 power shell, 然后右键选择以管理员身份运行,再执行下面这行命令。启动了之后记得要重启一下你的电脑哦。 ok, 我 们进入到下一步,因为我自己在安装多可之后还出现了关于 wsl 的 爆破,所以我也讲一讲如何来起用 wsl 来提高 linux 应用的兼容性和性能,优化多可的使用体验。 具体步骤是这样的,我们也是以管理员身份打开 power shell, 输入这一行命令,起用 wsl 这个命令,它会自动安装 wsl, 并且设置默认的 linux 发行版,完成之后你也需要重启下电脑。 接下来就是下载最新版本的 wsl 二内核更新包,我们直接点击下这个链接就可以进行下载了,直接按照提示来完成这个安装过程。接着我们需要执行下面这一行命令,来确保在新安装的发行版会默认使用 wsl 二。 那么几个准备工作我们都做完了之后,我们就可以安心的安装多可了。我们点击这个链接,进入到多可的官网, 找到适用于 windows 的 docker desktop 记一下啊,选择最常用的版本叉八六六十四位,这个版本适用于大多数的六十四位的 windows 系统。 那下载完成之后,就进入到了一个可以说是傻瓜式的下一步安装过程,这个过程可能会要求你启动 hiv 和 wsl 二的功能,按提示操作,一直点击下一步就 ok 了, 但是 vlog 整个安装下来需要十到二十 g 的 空间,或者是安装在 c 盘的,而且安装过程中没有办法去更改一个安装的路径,所以官方也提供了从命令行安装的方法, 我们找一下,好在这里如果你的 c 盘空间不够,可以通过命令行来启动安装程序。这里我们就需要以管理员身份打开命令提示符 cmd, 注意是 cmd, 不是 power shell 哦,然后执行这一行命令,不过执行这一行命令,它的默认地址还是不变,还是在 c 盘, 那在后面就可以加上安装的路径,大家可以自己去设置一下。最后我们打开命令行 cmd, 输入 dock version, 查看一下它的版本号,如果显示了 dock 的 版本号,就说明已经安装成功了。那安装完了以后,我们的 dock 是 这样子的一个界面,它会提醒你要注册一个账号,当然你也可以不注册,直接跳过就可以使用 dock 了。 然后跳过以后就是这样一个界面,是展示容器的地方。 ok, 那 下一步我们需要配置 dock 镜像源及储存的位置。因为在默认情况下, 多可是从国外的服务来下载镜像的,网络不稳定或者是距离远,就导致了多可下载镜像的速度有时候特别慢,会甚至会超时。那我们就可以通过设置镜像源来加速下载。 我这里呢就提供了几个可可用性比较高的镜像源,都提供了稳定的多可镜像加速服务,特别适合我们国内用户使用。我们把它给复制下来,进入到多可 desktop 的 设置页面, 好设置,然后找到 docker engine, 在 这个 json 配置里面给它粘贴上去。不过我建议大家把这一个嗯配置给备份一下之后,你再拉取镜像的时候就不需要去翻墙了,可以直接从国内的镜像站点去下载,速度会快很多。 然后我们还需要更改储存的位置,因为多可默认会把所有的镜像容器、卷等数据都储存在 这个路径也是在 c 盘里面,但是之后如果你下载的镜像越来越多了,会非常非常占磁盘空间,所以建议就把高可的数据统一放在一个大容量的磁盘里,一是你的磁盘不会爆炸,二是后续如果你想备份或者是迁移也很方便了, 你就得先提前创建一个目录,然后改一下设置里面的 resource, 它的路径更改完成之后也要记得重启一下,那这就是多可安装的全过程。接下来我们就来部署一下 r g flow。 首先我们需要下载 r g flow 的 源码,我们点击这个链接,进入到 r g flow 的 github 页面里面,我们往下翻,根据 readme 的 指引去操作,我们看第一步要干嘛好,首先需要克隆一下仓库,直接复制这一行命令到 cmd 命令行去执行, 但是如果你的电脑里面没有 get me 的 话,也可以回到最前面,点击 code, 然后下载一下这个压缩包,再解压就可以了。接着继续看一下 readme 的 内容, r g flow 它会默认下载清亮的版本,但是你们看一下这张表, 清亮版本也就是后面加了 slim 这个后缀的,它是没有 embedded 模型的,所以为了方便我们不用本地部署 embedded 模型,就可以选择下载自带 embedded 模型的完整版本的 r g flow, 也就是没有 slim 后缀的, 那么我们就需要改一下相关的配置,那我们进入到 r g flow 源码的下载位置,我的在第一盘。然后进入到 r g flow 源码的下载位置,我的在第一排,然后进入到 r g flow 里面。好,这里面有个多坑目录, 其中点 e n v 文件是存放基本的系统环境变量的,我们就需要在这个点 e n v 文件里面去修改部分的配置。我们双击选择打开方式记事本 大概是在八十四和八十七行的样子。好,在这里我们要把清亮版这一行注视掉,然后把完整版给解除注视。另外如果你的机器内存小于十六 gb 的 话,建议把最前面的 elastic search 改成 infinity。 我给大家简单的写一下 infinite 这样做的目的就是为了防止因为内存不足而导致的服务崩溃。那如果你的内存大于十六 gb, 就 可以不用管保存默认的设置就行了,然后点,然后保存一下, 接下来我们就可以启动 docker 了。但是因为我之前部署过 def, 占用了八零和四四三端口, 所以为了和 define 项目共存呢,我需要修改一下端口映设,也是在这个文件夹里面找到 docker compose, 点压某文件,在端口号这里,我把八零端口改成了幺八零四三端口改成了幺四三。我们还可以更改容器名和其他的配置,大家有需要的话可以自己去搜索改一下。 好了,那接着我们就需要在 r g flow 的 docker 目录下打开命令行窗口,我们输入 cmd 好 运行哪一个命令呢?我们接着看一下文档,需要运行这一行命令来启动 docker 的 容器, 但是如果你没有出现端口冲突,也没有改容器的名的话,就直接运行上面这一行默认的命令就行了,它会自动下载 r g flow 的 端口镜像,并且启动服务,我们就来运行一下好。因为我之前运行过这个命令,所以它的速度很快, 到这一步 r g flow 就 已经成功地启动了。那么我们环境准备的工作已经全部完成了,我们就可以在浏览器里面访问 r g flow 了。 我们输入 local host, 然后加上你的端口号,我这里是幺八零。成功进入到这个页面,就说明你的 r g flow 已经部署成功了。我们需要先注册一个账号,登录一下, 然后需要像我一样把语言改成简体中文,然后我们点击这个头像,进入到模型提供商这里。默认添加的模型是不可用的,我们可以直接把它删掉。 这个 alama 是 我之前已经添加好的,在这下面有各种各样的模型提供商,我们可以在线使用模型,也可以使用本地的模型,那我们就选择本地部署一个模型吧。 首先我们需要下载 alama, 它是一个用于本地运行和管理大元模型的工具,可以说是开源 ai 的 宝藏。 有了它,像我们的 gpt 四, deepsafe 通,一千万这些厉害的模型都可以在我们自己电脑上跑起来。安装也很简单,直接进入到 alama 的 官网,根据你的电脑系统去下载对应的版本,然后一直点击下一步就好了。 安装完成之后,我们可以通过查看它版本号来验证是否安装成功。输入 alama version。 ok, 我 的版本是零点六点八,所以就是安装成功了。 那完了以后一定要记得配置环境变量,因为我们是通过多尔克来部署的 r g flow, 默认情况下 alama 只允许本机访问,也就是说它接听到的是本地的幺幺四三四端口,其他设备呢是无法连接 alama 服务的。那么我们这里的第一个环境变量 alama host, 它的作用就是让虚拟机里面运行的 r g flow 能够顺利访问到你本机上运行的 alama。 那 我们通过把这个环境变量设为零点零点,零点零幺四三四,就可以让 alama 监听所有的可用的 ip 地址,从而这是外部设备的访问。第二个环境变量 alama models, 它是用来配置模型下载的位置的,一般来说模型的文件体积会非常的庞大,所以建议大家还是要更改一下默认的存储位置。 我们打开电脑的设置,点击系统,然后到系统信息高级系统设置,就可以在这里设置环境变量。下面是系统载的环境变量,上面是用户来自己自定义的,那我就在这里面添加了两个环境变量,一个是 alamo house, 一个是 alamo models, 好,然后点击确定。大家注意,配置完这两个环境变量以后要重启电脑才会生效,但是如果你配置了环境变量以后还是无法访问的话,可能就是你本地的防火墙拦截了端口幺幺四三四,那在这种情况下就需要手动去放行一下这个端口。 接着我们就要通过 alama 把千万三模型下载到本地。首先我们同样也是进入到 alama, 点击 models 找到千万三, 在这里可以按需选择不同参数量的模型版本,可以看到最大的参数量是二百三十五 b, 这就是完整版的纤维三模型,它的模型大小呢是一百四十二 gb, 当然这在个人的电脑上可能肯定是带不动的,所以我就给大家演示一下,下载最小的模型零点六这个版本,这对于个人电脑还是比较易管理的,当然如果你有外界 gpu 的 话,可以考虑更大的模型,像四 b 啊,八 b 啊,十四 b 啊,三十 b 啊都可以。 那我就先下一个零点六 b 了,我点进去,然后复制它对应的这一行命令到 c m d 来执行粘贴,然后回车。好, 因为我已经下载过这个模型了,所以就直接运行了起来,出现了 send a message 这个提示,那我们就可以来发消息试试看,我问他你是谁?好,他现在正在进行深度思考。 ok, 他 即使给出了回复,就说明模型已经成功地下载了,那么本地部署千问三零点六 b 的 模型也已经实现了。 那我们就回到 r g flow 里面,在模型提供商里面添加我们刚刚部署的千问三零点六 b 的 模型。模型类型选择 chat 对 话模型, 模型名称的话一定要正确的填写,因为它是没有一个下拉选项供我们选择的,所以为了确保名名称是准确误的,那我们就进入到命令行,输入 alarm list 来复制一下完整的这个模型名称。我们刚下的是纤维三零点六 b 模型,把它给复制下来,粘贴上去, 然后要填写基础的 url, 因为我们是使用的 http 协议,所以就先输入一个 http, 再加上你本地的 ip 地址,获取本地 ip 地址的方式同样也是通过 cmd 命令行 输入 ip config, 我 们找到 ipv 四这个地址,把它给复制下来粘贴上去,然后最后还要加上呃端口号,也就是阿拉玛默认监听的端口号幺幺四三四。 因为我们是本地部署的模型,所以就不需要填写 api key 最大头可数,我们就随便填一个九九九九九吧, 然后点击确定,那关于聊天模型,所有的配置就基本完成了,这样一来在多口里面运行的 r g flow 就 可以访问到我们本地部署的千问三零点六倍的模型了。接下来我们要点击设置默认模型, 聊天模型,这里我们就选择刚刚我们添加的前文三这种模型,就直接选择 r g flow 完整版本自带的这个模型就可以了,然后点击确定,那么接下来我们就可以创建知识库了, 进入到知识库这个页面,然后点击创建知识库,出一个名称,随便出一个测试,这里可以更新你的知识库详细信息,尤其是切片方法,那我们就来进行知识库的配置。 切入模型就是我们刚刚添加的那个自带的切入模型,切片方法,这里可以根据你的需求去选择。 大家看右边都有一些的废话事例啊,像 q and a 针对的是问答文档,还有 resume, 针对的就是简历的模板, 还有下面这个 manual 手册或指南, table 就 和表格相关, law 就 涉及到了法律文件, 那如果没有特殊的要求,就选择默认的 java 就 行了。其他配置我也就先不设置了,就直接保存, 保存一下可以完成知识库的创建,接下来我们就要新增文件,上传我们自己的知识库,选择本地文件,我就拖拽一个我用 ai 生成的爱猫无忧手册吧,然后点击确定。 上传了文件以后,一定要记得点击解析按钮,这一步很关键,如果你不进行解析的话,那模型是无法理解这些自然语言文件的。解析过程就会处理文档里面的各个片段,并且提取出来,然后进行深入处理,把它们印刷到高维的向量空间里面。 解析的过程可能需要一定的时间,请耐心等待一下。解析完了以后呢,我们的知识库就能准备好知识后续的操作了。 好了,今天的教程就到这里了,希望通过这个视频,大家已经掌握了如何在 windows 系统上顺利的安装 docker, 并且使用 docker 从零来开始部署 r g flow。 记住,虽然刚开始你会觉得有点复杂,但只要你跟着步骤一步一步的操作,我相信每个人都能够顺利的完成。如果你在过程中遇到了难题,或者是发现了什么特别有用的技巧,欢迎随时在评论区分享你的经历和见解。 当然,如果你对大模型学习感兴趣,我这里准备了一套最新的大模型技术学习视频和资料,如果你有需要请关注我,并在评论区留言,我可以分享给大家,相信对你们学习大模型技术会有很大的帮助。

警告,本视频耗时一百天,制作时长一千八百分钟,手把手带你完成 ai 大 模型本地化部署,全程干货无废话,快速学完重难点!大家好,如果大家想要在五分钟之内去搭建一个本地的室友的 一个免费的 ai 大 模型的话呢,按照我的步骤啊,如果你是小白,也能够轻松完成 ai 大 模型的一个本地化步。我们今天要用的一工具叫 alma, 这个工具呢,它的 核心作用就是,呃给我们提供本地部署和运行大模型的一个这样的软件,只用很简单的几个命令就能够运行 一个开源的大模型。那首先我们需要打开 elama 点 com 这个地方有个下载点下载,下载里面呢,它会提供三个平台来下载,我们用 windows 这个平台来给大家去演示,那么下载好之后就会有叫 elama set up 点 s a 这个文件,那么这个文件直接双击运行安装就好了,它就会自动去执行个文档,这样一个过程啊, 我们点击 install 自动会默认安装在我们的 c 盘路径下。安装完成以后呢,我们在右下角这个地方啊,会有 a rama 的 一个运行图标,安装成功以后自动会运行。 然后呢,我们直接右键打开那个运行窗口,或者我们直接通过快捷键 win 加二进入到 c m d 这个 windows 命令窗口,在这里面呢,我们可以通过 a rama 对 应提供的一些命令来去运,请我们加一个 run, 后面跟一个模型的名字,它 就能够去自动运行这个开源大模型的运用,这里面会提供很多命令,如果大家有兴趣的话可以去了解一下,比如说我们可以通过类似去查看当前下载好的一些开源大模型,大家进入到这一步之后呢,我们需要运行一个本地的大模型,那这个模型从哪里找呢? 我们打开这个网站,在这个地方有个 model, 这里面是有一个叫模型仓库的东西,我们可以在这上面看到很多模型,比如说 lama 天问 dns, 大家可以自己选择,我们就直接选择一个天问模型,在这里面直接 o lama run 空问,这后面可以带一个参数,找到 kenwind 的 这个 模型啊,大家也看到这个地方啊,他会告诉你你要怎么去运行指令,嗯面这个部分会带一个叫零点五 b, 一 点八 b 这样东西,这个表示的是参数规模,就说当前这个模型 它是用多大规模的参数来训练的,那么 b 呢?它是一个十亿,比如说四 b 就是 四十亿规模的一个参数,参数规模越大,那么模型的这个推理能力越强。 但是我们需要注意,如果我们是在本地运行的话,就需要根据大家的计算机的一个配置来决定,就选择一个 u n 七 b 的 模型,我们点回车,那么这个时候呢,大家可以看到啊,本地没有这样一个镜像的话,它就需要从远程下载,我再给大家展开讲另外一个模型文件,那这个时候一个模型文件占四点五 g, 十个的话就四十多 g, 甚至如果说参数规模更大的话,它的容量占比就更大,它会影响到我们 c 盘的一个容量,所以这个时候我们可以去增加一个系统环境变量,让我们的这个模型下载的保存路径发生变化,可以这么去改,就是在我们的这个地方有一个电脑点右键有一个属性, 就可以看到一个高级系统设置,然后我们点击这个按钮,进入到那个系统属性里面有个环境变量,我们可以在这里面添加一个 alma 杠 model, 四个地方写路径名就好了,能够减少 c 盘的一个占用。设置好以后我们再来回到刚刚的界面,我这模型在本地已经部署好了,只要运行就好了,比如说你是谁,等他给我打印这个时候,我们会把这个指令丢到千问的这个大模型里面,他会根据他自己本身的一个能力给我们对应一个反馈,这个时候本地的一个 大模型的搭建就就成功了,那这个时候我们会发现一个问题,就是如果说我们在这样一个界面的搭建就有成功了,那这个时候我们会发现一个问题,就是如果说我们在这样一个大模型的搭建就有成功了,那这个时候我们会发现一个前端界面,我们可以 类似于聊天对话框一样去跟他去聊。那这种情况下我们现在这个方式怎么样去结合前端的界面去进行一个集成呢?市面上其实有非常多的这种前端的开源项目,比如说 low b 叉 open y b y 叉 g b next web 等等,有很多你们都可以在 github 上找得到。因为我们在这个制品里面,为了让所有的经手的同学也能够去演示出来,我们就用一个最简单的方式,多可,我们用 用多可这个容器来去运行对应的 y b u i 的 一个镜像,运行的这个前端叫 open y b u i, 你 们可以在 github 上找到,在多可的官网上这个地方点击多可第一个链接,进入到多可的官网,然后在这个地方呢,它也提供了多个平台的一个下载,如果这个软件大家 下载比较慢的话,我也会放在网盘里面。下载好之后呢,我们在这里放有个教可执行文件,我们双击运行就好了。然后在运行 doc 的 安装文件的时候呢,它会自动去进行验证和安装,这个过程中我们就可以不需要过多去干预。在这个安装过程中呢,我们可以直接在网站上给大家看一下 web ui 这样一个前端工具。我们在打开的第一个链接 user friendly ai interface, 这里面会告诉你,如果说我们要去安装的话,它在这个地方有教程,看一下安装的一个进度,这个时候大家可以看到它是已经安装成功,需要点 close and restart, 注意这个时候它需要重启这个电脑,好了,重启成功以后啊,它会自动弹出 dunk 的 一个界面,然后我们点那个 step, 这个我们点默认分离,写好就表示我们的多可 desktop 已经安装成功了,它会自动去打开这个工具。第一步是需要我们注册登录,我们可以跳过先不管这个地方,也可以跳过,现在是一个多可 engine stop 的 一个停止状态,等它启动。多可是个迅疾容器,容器里面可以装很多软件,这个软件呢,它在 dcap 里面叫镜像,我们 可以直接从 darkarp 的 一个仓库把它镜像拉下来再进行逻辑,你就发现有点跟那个 omap 类似, omap 其实是在用参考多克的整个方案在做一个对齐。刚刚我们用 omap 去 run 一个大模型,跟我用多克去运行一个镜像的逻辑是一模一样的。

哈喽,今天一分钟学会搭建一套跨境自动化管理系统来看效果。现在从电商选品到内容运营,可以在钉钉上实现全流程自动化,目前主要有几大板块功能,其中包括前期的 ai 选品、店铺商品数据分析、答案、数据管理以及内容运营。 第一个是电商选品,操作非常简单,现在只需要打开商品榜单截图,然后粘贴进 ai 表格,就能自动识别榜单上的所有信息,其中包括 过零售价、折扣价、七天销量、总销售额等等相关的数据。如果觉得截图还是麻烦,也可以批量上传商品链接从钉钉的自动化入口进来,可以打通数据源,直接获取商品信息。这里要注意,在录入表格前,可以先调用千问模型,把提取到的结构化信息 也吸成 markdown 格式,再规整后再存入数据表,这样的话会更清晰直观。接着在提出来商品信息后,需要再新增一列 ai 时段,这里可以调用大模型,让 ai 根据产品本身和相关的数据做综合分析,当然也可以根据自己的需求自立分析维度, 可以看到整体分析的结果非常详细,这样的话,那我们在做选品决策的时候也更加有依据。接下来第二大核心板块是营销内容分析。首先第一列可以批量上传视频链接,在右侧可以新增一列 ai 字段,如果是海外设媒的视频, 可以直接调用 kol 设媒达人这一个 ai 功能,然后选择链接所在列,就能一键获取到相关的视频数据,不需要手动入。 除此之外,还能对视频脚本做智能拆解,这里可以提供自动化,在配置这里选中视频链接所在数据表,然后再调用模型来分析, 最后就可以让 ai 结合视频的实际数据脚本拆解结果做综合分析,在这里可以选择适合的模型,然后保存就 ok, 基本的思路就这样,有需要模板的可以分享。好了,以上本期视频内容,觉得有用的话别忘点赞关注,咱们下期见,拜拜!