如果你在开发过程中觉得现在 agent 总是出现大模型幻觉,那不妨尝试下 agent skills。 mcp 为智能体提供了工具箱和数据库的能力,而 agent skills 则是指导智能体如何运用这些工具解决问题的流程手册。接下来我们看看如何获取它。 大部分优质的 agent skill 都开源在 github 上,或者如果你熟悉 git, 直接使用 git 克隆命令克隆仓库会更方便后续更新。如画面所示,我们找到官方开源的这个项目,输入 android pocket, 目前已经收获了五十六点一 k stars。 这里面的 skill 富含多种类型,比如创意设计、开发技术,以及最实用的文档生产类。我们找到自己需要的,保存到本地即可。 由于可 sircados 等对国内的朋友使用门槛较高,所以主报将用这为大家演示如何部署。我们在区中打开设置, 然后找到规则与技能这个选项,点击创建新技能,将我们的 skill 三 b 文件导入。 当然还有更适合小白的方法,主包在此不做演示。我们来总结一下, agent skill 是 ai 的 魔土化技能 贴套,不是宝库,在脆中使用只需三步,下载,放置配置。如果你有更好的 still 推荐,欢迎在评论区分享,别忘了点赞和订阅,我们下期再见!
粉丝74获赞976

哈喽啊, chu 友们,这个和这个是我用 solo 加同一段 prom 做出的头像生成器网页,我们对比一下,看一看是不是右边的这个整个 ui 上看着更精致更高级。其实做它俩时的唯一区别就是我在开发右边这个网页的时候加了 skills。 是 的, chu 现在已经支持 skills 了。 skills 是 基于高标准的重复工作沉淀的可复用技能包,可以持续稳定地按照你的要求输出高质量的产物。 那么如何在 tree 里创建 skills 呢?有两种方式,第一种,直接在对话中描述你的需求,比如我这里对 ai 说创建一份能审查我的代码效果问题的 skill, 你 看 ai 会直接帮我写一个 markdown 文档,然后放在 tree skills 下面的对应文件夹中。第二种,从设置中创建, 点击设置按钮,进入规则和技能页面,在技能模块处点击创建。这里你可以直接导入现成的 skill 文件进行智能解析。因为 tree skills 是 基于开放的 agent skills 标准构建的,完全兼容社区生态。 当然,你也可以手动输入技能名称描述和指令,添加更符合你需求的工作流及工具调用。现在我添加好了一个前端设计的 skill, 我们在做图像生成器的时候就可以用到它了。你看在 ai 对 话流中可以看到它自动调用了这个前端设计 skill。 如果你的任务比较复杂或者需要持续稳定输出的时候,你也可以在 prompt 中明确告诉 ai 要用哪个 skill, 这样你就可以更精准的控制输出结果了。就像这个网页前端设计的优化一样, 使用 skills 是 可以帮你稳定地按照你的标准输出高质量结果的。除此之外呢,还可以自动化你的重复性工作流,甚至成为专业能力规范知识进行沉淀和分享的方式。所以快去吹 solo 中试试吧!中国版和国际版都有哦!

ok, 那 么回到这个去啊,去他有两种方式,一个是 i d e 模式啊,一个是 solo 模式,那么这个 solo 模式是我们可以添加这个智能体的啊,添加智能体,那智能体如果我们使用过这个呃,围巾或者是纤维,我们知道它是可以添加智能体的,那智能体其实就是我们 比喻成一个一个合理的比喻,是把它可以把它比作为员工,比方说我们在去这里我们可以添加两个智能体,或者说三个智能体,我们可以添加一个智能体,给他一个身份啊,把它叫做这个前端啊。另外一个智能体我们可以把它叫做这个后端,我们这里画一下吧,我们这里画一下, 然后呢?接下来一个智能题,这个叫前端啊,这个叫前端前端呃, agent agent, 它是智能题的一个翻译啊,这个是前端 agent, 然后这里是后端 agent, 后端 agent, 让我们再来一个吧,再来一个叫做测试 agent, 那么我们我们只需要给出需求啊,给出一需求,比方说我们给一个需求,就是呃,让呃,或者说开发一个,开发一个后台管理系统。那么这些 a 诊 啊,他就会自己去开发了啊,他会自己去开发,前端会生成代码,后端也会生成代码,测试会去测试前端跟后端生成的代码, 完全不需要我们写任何一个呃,一个提示词啊,他们会自己开发前端,开发的时候他会去阅读这个后端生成代码啊,根据后端的代码去生成前端对应的内容。 后端开发它也会根据后端的这个 agent, 它也会根据前端的这个 agent 去生成合适的格式,合适的格式,这种比方说 json 格式或者数值格式,这个我们会不会会讲这个单位啊?根据数值或者说 啊,这个 jason, 我 们说一下这个或者说对象,对象吧这些东西根据这个展示的, 展示的这种形式去给前端啊,返回内容,给前端返回内容,然后这个测试啊,测试就会同时测试这个 a 层是深圳的代码啊,测试这个后端深圳的代码啊,完全不需要我们写任何东西,那么这个就是 solo 模式,我们说的这个 solo 模式, solo 模式啊,能够调用 a 帧,那么这个 a 帧啊非常重要。后面我们有机会再去说一下这个 a 帧, ok。 但是现在有一个问题,就是有不少不少的开发者,他反馈说啊,当我们同时调用四五个 a 帧的时候啊,他可能会出现一些 bug 啊,可能可能会出现一些意想不到的问题,所以说这就啊有好有坏吧。 如果我们项目比较简单的话,那我们可以通过这个呃去创建三个 a 组,比方说前头 a 组、后头 a 组,测试 a 组去完成一个小的项目,但是如果非常大的一个项目的话,那么他可能有这个上下文的一个局限的话, 他就会可能出现问题啊,所以说这个我们要做一个取舍啊。但是我们说,呃,这个 i d e 模式就是我们问答的模式啊,我们通过这个问答的模式更好,还是说通过这个 a j 的 模式更好啊?这个没有一个更好更快的一个情况啊,要不然的话,他为什么呃,不 单单,他为什么不就单单一个模式就好呢?啊?为什么他要设立出一个 i d e 模式跟一个 solo 模式啊?所以说这个没有更好 啊,需要根据自己的这个喜好来去选择。 ok, 那 么后面,呃,我们去讲复杂的项目的时候,我们也会去通过这个 solo 模式去实现啊,那么现在我们这个 do do list 非常简单,我们就通过这个 it 的 模式来去呃,讲解啊,讲解这里生成的代码,我们后面几节会讲这个生成的代码。 好,那么这个是我们说的这个 solo 跟 age 模式那么对比。 cos, 我 们说,呃,国外的这个 cos 啊,这里我们说一下这个 solo 单词的一个翻译啊, solo 叫做独奏啊, solo 叫独奏, solo 模式我们可以调用这个 h 就 能听。 然后我们如果打游戏的话,比方说我们打王者荣耀,或者说啊这个英雄联盟,我们会经常听听到这个单词 solo 啊,那他的意思是单挑,比方说我们我们要跟谁单挑?我们可以说来一来一场 solo 啊,来一场 solo, 那 么这个 单词也是比较好记啊, ok 啊,那么 tree 的 id 跟 solo 模式哪个好?没有绝对啊,没有绝对,这个 q 是 question 问题的意思, a 是 answer 回答的意思啊,这这两个单词我们应该应该也是非常的常见。好,那么回到这个 close, 这里也打开了这个 close, 我 们可以看一下它的一个界面, 那么这个最左边啊,它是可以新增这个智能题,我们可以看到啊, new age, 然后这这一个区域是我们聊天的区域 啊,这里是展示这个展示这个终端了,然后最左最右边他是一个文件目录,那其实可以看到这个扣子跟我们这个区他是布局上是稍有区别,但是功能完全一致啊。我们是最左边 是这个文件管理器啊,中间是代码展示区域,然后最啊最右边是这个聊天的区域,然后最下面有一个终端在这里啊,我把终端隐藏在这里啊,我把终端放在这里啊,所以四个区域都是一样的 啊,无论是这个 android, 包括,呃,国内的,国内这个 qq 的, qq 的, 我这边也是,我这边也是下载了,但是没有去打开它啊,这个我先关掉 啊,就是这个啊,这个 q o 的 我也是打开了啊,我也是下载了,但是没有没有去用啊,因为工具太多了。好,那其实内容都是一样的,基本上无论是国内国外这些 ai id, 它的布局基本上都是差不多的啊,这个功能都是差不多的,包括我们来去看他的文档啊,这个非常重要。

从零到一,手把手教大家搭建一个抖音提取文案的智能体,这个智能体可以将我们提取的口播文案进行新标题的生成和文案而创,同时呢,可以将我们提取的文案生成新的提字时,并调用香蕉模型生成这种可爱风格的手绘图。 最后呢,将标题文案标签和封面图帮我一键写入到非书多余表格。那咱们今天呢,话不多说,直接带大家上实操。哈喽,大家好啊,我是华仔,今天教大家呢,用扣子搭建一个非常实用的整体体, 而这个真人体验,他帮我能实现怎样的功能呢?他,首先啊,他可以去帮我提取啊该博主的一个口播文案。接着呢,他会帮我进行一个啊文案的二创,包括标题的生成,文案的二创吧,标签也帮我做好了,对吧?然后下面呢,他会把我们口播文案啊 进行一进一步优化,优化成提示词,转变成我们这种啊旅游攻略,因为我今天呢提取的是一个旅游博主的文案,所以说他的是关于旅游方面的,对不对?大家可以看下这个图,我觉得做的是效果还是比较 ok 的, 对吧?这个图呢,就是要用咱们的香蕉二大模型去做的,有攻略图,有咱们的注意事项图啊,大家可以看一下,都有, 对吧?然后呢,他最后啊,最后会帮我输出哪里来呢?写入到我的飞书多维表格。大家来打开我们的飞书多维表格来看一下这个飞书多维表格呢,他会把标题文案标签,对吧?还有旅游攻略图的详情图,帮我一张一张的 直接一键写到我的飞书多维表格当中去吧,方便我们去管理,方便我们下步去使用,都是比较 ok 的。 所以说呢,我觉得今天这个智能题啊,对于咱们很多同学还是比较实用的,而我们这个智能题他运行的背后其实就是调用的我们其中的一条工作流,而这条工作流也非常简单,第一点啊,我们需要一个插件帮我去提取链接,然后第二点呢,需要,需要音频转文案,好,对吧?好。第三个就需要啊,大模型,两个大模型,一个大模型来帮我处理 二创的问题,一个大模型呢是帮我生成提示词的问题,对吧?然后下面呢就调用咱们香蕉的这个大模型来帮我做图,做图。 然后呢我们最后呢就需要去写送到飞速多表格,在写之前呢,我们得穿插一个代码节点,这个代码节点呢就相当于要帮我进行一个什么呢?呃,资源的整合吧,对吧?数据的处理,数据, 呃处理就是我们得把,呃,大家可以来看,就是咱们这个飞速多的表格里面他有标题文案标签,旅游攻略图,对不对?等等,那东西都是需要我们去处理的, 处理完了他才能写入到我们的飞出多表格当中去。好吧,那咱们现在就录制这么多,接下来我们就直接带着大家一步一步去实操,然后我们呢在第一步啊,咱们还是一样老规矩,在我们这个浏览器上搜索扣子的时间,你们自己进入 吧,在这里呢有一个扣子编程,这是我们扣子也是更新了二点零版本的啊,对吧?自己搜索扣子,然后呢打开扣子编程,如果说大家对这个新的界面不太熟悉的同学在这里呢,他有一个回到旧版,咱们直接可以点回到旧版, 对吧?啊?然后呢,怎么去创建智能体啊?我带大家去创建一个,比如说在这里点击这个创建啊,然后点击创建,对吧?那这里呢就是一个智能体名,比如说就是旅游啊,旅游攻略图二创,对吧?好,咱们点击确定啊, 点击之后呢,他就会来到我们的一个界面啊,这是我们智能体的一个界面啊,今天我就不教大家怎么去写其实词了,主要是在这里有一个工作流,我说了咱们智能体运行的内核,他就是工作流,对不对?所以说呢,在这里呢,我们首先我们自己得去搭一条工作流,也就是我们刚才给大家展示的这条工作流,我们得搭出来,对吧?好,咱们就直接在这里呢, 好,然后咱们直接在这里啊,点击添加工作流,在这里创建啊,点击创建就行了,还是一样在这里呢?首先这第一点啊,我们需要给工作流取个名字,比如说这边就是旅游, 呃,啊,对吧?旅游,然后测试就行了, ok, 然后下面呢就是工作流的描述,就是旅游攻略图, 好,咱们点确定啊,点确定过后,他就会来到我们搭建工作流的界面,大家没看到他有一个开始和一个结束这两个节点呢,我就不给大家赘述了啊,咱们直接就开始实操了,对吧? 那么首先第一点啊,我们今天我们是,既然我们今天是提取别人的链接,那么在第一点呢,我们就不用改了,在这里呢,其实大家可以输入一个 u r 都可以啊, 输入一个 ur 都行,因为我们提取的是一个链接,对吧?也就是 s u ur 是 吧?好,然后我们重要的一步来了, ur 就 行了。然后今天呢我给大家讲,就是我们这里的这个输出啊,输出我就不给大家讲了, 输出的东西就是作为一个自人体交互用的,大家可以看一下,在这里呢,这些东西都是我的输出在帮我完成的,就是他可以给用户一个交互,就是让用户不是那么默默的等待,对吧?等待当中一定是有个反馈的。呃,这个东西呢,我后面会教大家,今天呢我就把这些环节给大家省掉了,就直接的把一些主要的这些东西给搭转 主要东西拉出来。好吧,那咱们就直接在这里啊,我们点击开始,我首先需要一个插件来帮我去提取链接,对不对?所以在这里呢,我们就直接在这里找到插件,咱们自己在插件市场来搜索,搜索呢,这里有一个叫做抖音视频获取,你找到对应的插件就行了,然后咱们点开它, 下面呢有一个获取短视频的详情信息,咱们选择这个插件,我看怎么点他好。然后进来过后,我们首先第一件事给他重命名一下,他就帮我干啥,他就相当于是一个一号对一号,员工呢,帮我干啥呢?呃,提取啊,抖音 音频的,提取抖音信息的是吧?提取抖音信息吧,然后首先第一个就是它的一个 k 啊,所以在这开始这里呢,我需要给它准备一个 k, 因为我们这里面要调用到第三方的插件,所以说我们需要准备一个 api k。 好, 首先我就把 api k 拿过来啊,配给他就行了, 对吧?其实呢下面就是他的一个令刻,这个令刻呢就是我们短视频的一个链接嘛,所以说我就直接把这个 u r 给他行了。好,这边我们重点拿的什么呢?拿的就是这个 audio u r, 就是 他的音频口播文案,好吧,就是把他的音频转弯,所以我们在下一步呢就需要去添加一个啊音频转文的插件,对不对?在这里呢搜索一个语音 语音识别,语音语音语音识别,好找,找到,然后呢往下滑,这里有一个大模型语音识别,咱们点开它把它给我添加进来,对吧? 好,它就是可以帮我们把提取到的音频文案转成啊这个字幕,对吧?所以在这里呢就相当于是音频转文案的啊,音, 音频音频音频转音频转文案。好,咱们首先第一步啊,我需要点击它,在这里呢,我们首先第一个就需要把上一个节点的这个音频链接给拿过来,就在这里头就找到一号连公,找到哪一个呢?这里有一个, 呃, audio u r, 把音频链接拿过来就行了,它输出的一个就是这个东西啊, t s t 一个文本,对吧?好,首先呢 我们要走两条线,第一条线呢是要去帮我去二创,对吧?然后还有一条线是帮我干哈,还有一条线是帮我去做图,所以首先我们走第一条线就行了,先把第一条线做好,在这里呢我就需要一个大模型,他能帮我干啥呢?就是二创 啊,标题和文案。好,首先我们就点一下,点开过后呢,首先第一个就是他的一个模型的选择,这边模型啊,咱们就默认都包一点五就可以了啊,就不用改了,对吧?接着咱们往下走,来到这边的输入, 这边的输入啊就是要一定要把上有一点的文案,我们得拿过来,对不对?所以说我在这里啊,就把上有啊,咱们音频转弯的这个 tst 得拿过来,把他的文案得拿过来。好,直接拿过来。好,接着咱们往下走,下面呢就是咱们的系统提示词,这个系统提示其实也很好写啊,很好写, 然后我这边直接就给他复制过来就行了啊,这个提示词也就是我给他说了几句话而已,你看第一句话,这个就是我纯手动, 然后呢把别人那些案例丢给他,让他帮我生成, ai 都没帮我生成,我就直接告诉他,你是一个文案,二创的大师,对吧?你可以通过用户提供的文案给我总结成一个标题, 加上一段小红书风格以及标签,是吧?要求呢?我的这个文案必须有什么啊?必须有啊,这个表情包是吧?必须有表情包是吧?你看就按照我这样的,我就会给他一个案例,看标题也给他案例了,也就是我们的,呃,文案也给他案例了,对不对?他就会参照这个案例帮我生成同样的东西。 好,下面呢就是他的一个标签,这个标签呢也是我从别人那发过来的,所以说大模型真的很聪明,你们只要给他对应的这个模板,他就会参照这个模板帮你做同样的事。好,这个就是系统提示,然后下面呢就是咱们的用户提示,这边我就不给他注注了啊,就是我们需要把我们刚才输入的变量的值给调用下来, 也就是这个 tst 吗?调用它就行了,在这里其实也可以不用调用,因为我们刚才在这里已经调用了,对吧?咱们调用一下也行,对吧?好,最后输出了有三个东西,我们说了有啥东西,有标题,还有什么?还有咱们的文案, 对不对?还有咱们的标签,有三个东西需要输出,所以在这里呢,我就给他换成一个对象的形式,这个,这个对象形式呢,咱们下面新增三个指向, 一个是什么 keto, 就是 咱们的标题,我还有个什么 content, 咱们的标签好,然后还有一个呢,就是咱们的标签好,就这三个东西,最后我就让他帮我输出这三个东西就行了, 好,然后他的主要作用就是帮我去二创标题文案,对不对?还有标签的最后呢,我们是需要把它哈写入到我的非猪多维表格,对不对?所以在写之前啊,我在这里呢提前要加一个代码节点,我需要把这些数据进行整理,进行整理的,好吧?进行整理的, 然后这代码今天我们先暂停一下,因为我们刚才说了,我们还要做图一会呢,把文案和图都得传输到代码去,让他做一个资源整合。所以呢,在这一步啊,我还是得先去把咱们的什么提示词做出来,因为我们调用的是香蕉的大模型,我们是要做这样的图的,对不对?我们是要做这种图的, 做这种图肯定得写提示词啊,对,我所以说在这里啊,就需要一个大伙先来写提示词嘛,就这么简单,这种就相当于是一个香啊香蕉。二来帮我去写提示词的图片的提示词是不是?好,咱们点一下,那首先第一个呢,也就是咱们的模型,我就不要讲了,这里不用选啊,还是一样 输入啊,拿到的就是我们刚才他传输的一个文案啊,他拿过来就行了。好,然后下面的提示词啊,我这边已经写好了,给大家直接复制过来就行了。 这篇提示词也是啊,我整理了也差不多几分钟就整理完了,就是我把别人的一个案例直接丢给咱们的豆包,让他帮我生成一个提示,我简单的做一个修改啊,这个提示到时候呢也可以给大家做一个参考啊,可以给大家做一个参考的。 好,咱们往下走啊,往下走好,然后咱们接下来就往下走。这里呢我就直接把这个刚才这个 t s c 的 变量啊转过来,然后下面的输出呢,就是他要把我把一个提示词做出来吗? 所以下面呢就是咱们的一个泡沫啊,其实好他的变类型啊,我需要给他改一下,改成什么?改成一个竖图,因为我们是要做两张图的,而不是做一张图,对不对?大家可以看一下,我这边给了他两个案例的, 一个是把咱们旅游攻略图做出来,还有一个是咱们的注意事项图做出来,我们做的是两张图,所以我这边啊就不能选这幅图,我得改成竖图类型。这边就不给他过多的解释一个变类型了啊,我,我往期的课程都会教这些东西的 好,然后呢,现在有了提示,现在我就要做图了,对不对?好,所以说我在这里头就需要找到一个能做图的插件,好,直接在这里呢搜索拉多二就行了,找到这个插件啊,然后找到他,把它点击添加进去。 呃,但是呢,我朋友们,我们要思考一个问题啊,我这边我说了,刚才我说了做的是不是一张图,做的是两张图,对不对?所以在这里呢,我们不能直接拉一个来做,所以说得拉得拉一个,什么得拉一个循环 啊?因为我要批量来做的,我需要通过给他传出一个提示,他能帮我做一张,传出一个提示能帮我做一张,因为是有两道提示的,所以说给他一个循环出来,帮我批量来做。在这里呢,首先我们还是一样在这里把他的线给他连好,这边呢,他就是去相当于就做图吧,简单一点,做图 好,作图好,首先第一个就是咱们的循环,我需要把什么来类型啊?咱们就不用变了,就是速度循环,因为我们刚才拿到的又是一个速好。然后下面呢就是他的一个循环速度,也是把我们刚才啊呃,拉罗尔他生成的一个,其实直接拿过来啊,直接把它传输过来就行了,他拿过来 好,然后下面呢就它输出,输出呢,我们需要先把这个啊作图的插件先给它配置好。首先第一个就是咱们的 a p i k, 好, 把 k 先拿过来啊,然后下面呢就是它的一个 promontor 啊,因为刚才循环已经拿到了,其实是对不对?所以直接找到循环,找到这个艾特蒙啊,拿的是这个艾特蒙啊, 好,然后下面呢就是咱们的一个比例啊,比例,还有一个咱们模型的选择,一般我们在这里就选择一个九比,呃,九比十六,对吧?九比十六,然后下面呢就相当于有一个咱们的这个清晰度的选择啊,咱们就选一个二 k 吧,啊,都行, ok, 好 了,下一步呢就是循环的输出,循环的输出也就是找到我们这个员工他做的图,然后把他的这个结果拿过来。好,就是几张几张图吗?现在呢我们有了文案了,有了图了,接下来我们就需要把这些文案呢标题啊写出到我们的非主流表格,那么接下来的内容就比较重要了吧, 在这里呢我们就需要干啥呢啊?我们需要把这个线连好,在这里呢,这个代码机呢,其实就是做一个数据整理,数据整理的啊,数据整理的好,然后咱们首先点击它,第一个 就是咱们的输入。好,首先第一个呢我们就需要把刚才我们二创文案的这个啊大模型的结果再拿过来,所以说这边呢就是首先第一个也就是他的一个什么一些文本啊,标题啊,对不对?还有咱们的标签再拿过来。还有第二个就是咱们刚才循环所做的一些图啊,也就是咱们的一个编辑,呃, u r 对 吧? s 对 吧?一个数组提示嘛,然后下面呢就是重点一个代码,这个代码啊,我之前也教过大家怎么去用这个代码节点,对吧?包括怎么用 ai 去编程,我都教大家了,今天就不着重讲怎么去写代码了,这东西都能用 ai 帮你去做,好吧?我的这个主页的课程当中都讲过这些东西。 首先第一个我们需要去编辑,就找到 id 编辑,然后他的语言呢,我们就直接选择拍摄啊,选拍摄,然后这边已经给大家写好了,咱们直接通过这边直接给他复制过来就行,首先粘贴复制过来。好,大家可以来看一下啊,这里面有几个重点,你们主要看这几个重点,他输出的这个东西, 他输出的这个东西啊,在我们的什么东西,在我们的飞书当中一定要跟他吻合,就是我们得有标题,有文案, 大家可以看啊,是标题,文案标签一个字不能错。还有什么注意,摄像头这东西你都要和他吻合,包括日期状态都有,对不对?所以说我们最终输出的结果一定是按照这个东西来输出的,他就是要帮我把一些刚才我们,对吧 他传输的数据和他传输的数据得进行整理,整理成这这几个形式,整理成这种形式,然后写到我们的分数表格,对吧?好,然后下面呢就是他的输出,咱们直接就看这里啊,这里有一个 rate out put 啊,这个就是他返回的一个结果啊,直接把他直接给我复制过来 啊,把没用的东西先删掉啊。他的类型是什么呢?他的类型是一个,大家可以看一下他是一个宿主对象,对不对?所以我们就直接把它换成一个 or 或者新的一个指向,这个指向里面呢还有一个变量,对吧?我 为什么要选这个东西?因为我们刚才说了,我们需要把这些元素写出到非输的多一表格,对不对?所以我在这里呢要穿插一个非输的多一表格啊,这里呢就有一个插件搜索非输 啊,第一个就是飞速多维表格,咱们找它,在这里呢有一个什么呢?在多维表格当中新增多条数据,对吧?咱们直接点击它,这就是选择它。大家可以先看一下,咱们点击它第一个 app token 啊,也就是我们的一个,呃,什么呢?飞速的啥啊?接下来我点击分享, 然后呢在这里找到啊互联网获取的人,然后点击复制这个链接,就是他的一个什么 app token, 直接粘贴过来就行了,好吧,然后下面啊,你看,大家可以看这个值,是不是就是我们刚才要输的这个值,输出的这个值,它输出这个值就是这个东西。 对,大家可以看一下来四个数数,就这个纸,因为我们要把这个纸拿过来传给他,咱们也可以看一下这边的实力,大家可以看一下,对吧?重点就是这个东西我要传给他,其他的都是没有重要性的东西,就是我需要把整理的数据一定要和他的格式进行匹配, 大家可以看一下,是不是跟我刚才看到的这个格式是一模一样东西。所以在这里啊,我就直接把它给我调过来,找到数据整理,找到他呢,找到他点下去了,对,好,然后这个时候呢基本上就没啥问题了,然后咱们的话就直接把结束连起来。 好,然后呢咱们整条工作啊,就基本上就搭完了。然后呢我今天啊也没有把一些啊,刚才给大家看了,就是我们这里面还有穿在一些选择器啊,因为选择器这个东西我上之前的一些课里面讲过,选择器现在就不过度对数这个东西,包括变量集合,这也是很简单的东西,对吧?还有这个输出,这个输出我说了就是放在咱们整体作为交互用的, 所以我今天呢主是主要是把今天要用到的重点几个节点全给大家讲到了。好,然后我们现在就直接来跑遍,让现场来跑遍。 首先第一个我们点击试运行,首先呢我需要把 key 传出它,这个 key 呢大家自己用自己的好吧?然后下面呢就是咱们的 u r, 这个 u r 呢,我们就是提取一个博主链接放在它就行了,所以我们今天就随便找一个,比如我就随便找一个什么, 再找一个武汉的行不行?我们再找一个武汉的,随便一个就行,我们随便找就行。就这个高效旅游计划之行, 武汉江城虽大,但核心景点啊就需要这个吧,那咱们直接把它链接给我复制下来,过来过呢,我们直接把它粘贴过来是吧?我们点击进行,看他最后呢能不能把结果啊,给我们直接生成到我们的飞速多表格当中去,好吧? 然后咱们这边呢就稍微快进一下,好,然后这个时候就已经帮我们设置好了,咱们来看一下这个效果怎么样是吧?看他有没有写到咱们飞速多表格啊,这个就代表成功了,咱们打开我们的飞速,对吧? 来我们看一下,刚才应该是做的是条武汉的对不对?来武汉两天一夜高文啊,高效游玩的攻略,对吧?我们来看一下整体的一个效果啊,来,同学们看图片一张一张的帮我做好,对不对?来,图片做好了, 来我们看一下效果啊,图片一张一张的帮我们做好啊!第一天啊打卡古德市什么什么什么样,对吧?机尾期骑行怎么每次来我们看下这个视频, 准备按照别人的视频帮我去做,主要集中在汉口武昌两区,不用花太多时间在路上,今天这期视频带你精准打卡两天一夜玩转武汉第一天就宿选在荀岭门地铁站附近,靠近市中心,交通便利,第一站直冲谷德寺打卡具有啊,打卡欧亚建筑的寺庙,对吧?没毛病,就是这两谷德寺对吧?然后第二天应该啊, 好欧亚建筑风格的寺庙热门打卡机位一,广场长椅二,观音殿二楼拱窗三、 very good 路牌早上光线柔和,拍照具出片接着骑行十五分钟到山海关路啊,骑行对吧? 骑行到山海关路是每次 ok, 说明他就是按照我们刚才这个视频啊,原封不动的,他注意摄像头也帮我们做出来了,可以看下这个效果,我觉得还是挺 ok 的, 对吧?这个就是香蕉二大模型他做出来的效果,我觉得做的还是挺好的,对吧? 来,我们看刚才是不是刚才发布的啊,呃,将才的五点零三分,对吧,就是我们刚才做好的 ok, 整体啊就没什么问题了,对吧?然后如果说我们需要发布到我们的智能体当中去怎么办啊?我们就需要去发布啊,在这里呢,有右上角一定要去发布,点击发布啊,朋友们,在这里呢,我就选择一个一点零点击发布就行了。 点击发布过后呢,我们怎么配置我们智能体啊?你看他自动的就帮我添加了,因为我们是直接从智能体里面创建的,对不对?看,然后下面呢,他有一个这个未授权,未授权的东西就是我们一个非说勾标需要再授权,我这边就不给大家再授权了,对吧?你点击自己授权自己的就行了, 对吧?把它配置进来过后啊,你需要去做一个怎样的调整啊?直接告诉他做怎样读,对吧就行。像咱们华仔这边,你看我给他一个 啊,我直接给他说,你看我就直接给他说做封面图,然后把他的链接丢给他,他会自动的帮我去啊,这些交付,这些交付我说了就是输出节点帮我输出交付的,然后下面呢帮我什么文案二创啊,都帮我创建好了。那我们看刚才他做的这个文案,这个详情啊,标题文案是不是都帮我们二创了? 软件及这个详情图全部帮做好,所以这个就是非常方便,非常实用的工具啊,这个适用于任何一个行业。好吧,好,然后咱们今天的这堂课呢,就到这里就结束了啊,感谢大家支持啊,咱们下期再见,拜拜。

如何让 gmail 三点零在三十秒内交付一份符合 rufus 实时解锁逻辑,避开违规词雷区,并且能够直击进行痛点的专家极力性呢?今天一条视频给大家讲清楚 gmail 三点零搭建 rufus 极力性拷写智能题的保姆级流程。首先呢,我们打开 google gmail, 然后点击左侧的探索 gem, 打开 gem 管理器。并且呢新建 gem 智能体,由四个部分组成,包括了名称说明,指令、知识库。然后呢,我们就要开始去设置智能体了,点好这里的名称和说明,并且呢输入核心指令,包含了竞品的出单词分析, a b a 数据,竞品分析、属性提取四个维度, 具体的指令内容呢,可以参考这里。下一步呢,我们就需要去填充知识库, ai 文案呢,有可能会触碰合规边界,我们呢可以去建立一个合规文档上传的知识库,用来规范 ai 生成的内容。最后呢,点击保存,我们就获得了一个专家级的 listening 解析智能题了, 想要让它工作的话呢,准备好产品的这四个文档,就可以获取相应的结果。如果不清楚的话呢,我将整个搭建流程和指令内容都梳理好,到这里了,关注我三个六,分享给大家。

警告,本视频耗时一百天,制作时长一千八百分钟,手把手带你搭建自己的 ai agent, 全程干货无废话,快速学完重难点!各位屏幕前的小伙伴大家好,我是孤豹科技的联合创始人迈克,今天花十分钟时间给大家分享一下目前行业最火的 ai agent 到底是什么,以及呢?我们怎么去搭建自己的 ai agent? 如果大家关注过 ai 大 模型的行业新闻,就不能发现啊,其实在今年二零二四年这一年很多的行业的大佬都在发布一个共同观点,就是 ai a 点呢,是 ai 大 模型最佳的落地形态, 大家可以简我简单罗列了一些呃,大家可能都知道的一些行业大佬在公共场合发表了一些观点啊,包括像李彦宏啊,比尔盖茨啊,包括知乎 ai 的 ceo, 对吧?大家都在做这个事,说这个事情,而且大家能够发,而且你会发现他并不是只在说,而在做,而且,而且你会发现他并不是只在说,而且同步在做。比如说你们可以看这样一篇文章,就是到了下半年,几乎人人都在谈 ai 智能的, 甚至国内的很多企业,包括国外的企业都在去做这样的 ai 智能的这样一个智能体的平台和解决方案。 那么什么是 ai 智能?为什么大家会认为 ai 智能很重要?为什么是未来?所以要了解 ai 智能的,我们需要去 简单通过一个就是大家可能会比较深意的概念去讲一下,就是比如说大家在网上会看到像 ai 智能,而是一种能够感知环境及其决策和执行动作的智能实体,它跟传统人工智能不一样, ai 智能具备通过独立思考、调用工具去逐步完成给定目标的一个能力。 那我这里用了一个贾维斯的图片,大家应该看过钢铁侠这部电影,在这部电影里面有一个很牛逼的这个,这个叫科幻的一个智能体啊,它能够跟人一样去解决很复杂的问题。那么如果说大家对 ai 智能没有一个很清晰认识,那么你就可以把它当成是贾维斯或者是未来版本的贾维斯。 当然我们今天的 ai 技能离贾维斯还远,还还还有还很远,当然我们今天的 ai 技能离贾维斯还差得很远,但是它确实是一个可行的方向。 那这里面对于这个概念,大家可能会有点点就是生硬,对吧?那我想从一个底层逻辑去给大家讲一下,就是 ai 技能为什么是未来,也就说到底什么是 ai 技能, 我想从 ai 大 模型的出现开始给大家讲,因为其实从二零二二年的十月三十号 gpd 模基于 gpd 大 模型开发了基于 gpd 大 模型发布的一款 chat gpd 应用, 二零二二年时就基于 gp 大 魔性开发的一款对话的应用 cash gp 发布以后其实引发了国内各大企业的关注,行业震动。就上线五天时间,这个应用呢,用户数过百万,两个月吸引的活跃用户,两个月吸引的红,两个月吸引的活跃用户数过亿, 两个月吸引的活跃用户数过亿,这个数据已经是刷新了历史上增长最快的所有应用。 为什么这么火呢?因为 qq 虽然是一款智能聊天机器人,但是他的智能化程度水平很高,特别是在文学创作领域,表现出来的语言组织能力、逻辑能力,完全不像是一个机器人,甚至连马斯克都在公共场合去表,甚至连马斯克, 甚至甚至连马斯克都忍不住发推表示啊,说这个我们离危险强大的人工智能不远了。甚至有不少的同学开始担心说,哎,欠 tbd 会不会取代我们的工作,自己呢?会不会失业啊?这个当然是我们对于未来的这个畅想,可能当然是, 甚至有人不少,甚至有人会担心说, chat 机 b 会不会,甚至有人会担心说 chat 机 b 会不会取代他们自己即将面临失业的风险。但是呢,大家当,但是当大家冷静下来以后发现就,如果 ai 大 模型要做商业化应用, 但是当大家冷静以后发现,如果要把 ai 大 模型去结合现有的商业应用去做结合,还有很大的局限性。因为切尔机 b 的 优势在于它的逻辑推理,但是它缺乏真正的思考能力,它的认知啊,是建立在虚拟训练文本上的。 同样呢,他比较依赖于数据库的内容,所以他的本身呢?所以他本身并不具备,所以他本身并不具备对复杂和抽象系统的理解能力。换句话说呢,区块链所掌握的知识范围是被限定的,他无法预测没有发生过的事情,也无法去分清楚真实和虚拟, 对吧?所以,尤其是对一些文化常识问题,确实 gba 在 回答,尤其是对一些文化常识问题,确实 gba 的 回答往往是大段长段的过于笼常,看似逻辑至洽,但看似逻辑至洽,但是你会发现它存在很多漏洞, 比如我们经常看到一些幻觉的一些问题,所以为了让大模型变得更加智能,其实各大企业都在想办法进行优化。具体来说有两个方面。第一个呢就是通过不断增加参数规模,比如说 g p 三, 比如说 g p 三的一千七百五十亿参数规模到 g p 四的万亿参数规模。确实你会发现 g p 四发布之后,它的智能化程度比三点五要 强大很多,会更智能,对不对?所以这是一个方向。第二个方向就是增加大文本的处理能力,也就是提高我们上下文的处理的文本数量。比如说我们在 g p t 三点五的时候,提供的是四 k 和十六 k 两个类型的模型, 比如说在 g p 三点五里面提供了四 k 和十六 k 两大类模型,但是 g p 四里面提供了八 k 和三十二 k 两大类模型,也就是说它的整个文本处理的容量 比原来更大了。在 g p 四里面,我们能够把一本哈利波特的书籍丢给大模型,它能够去全部理解完,所以这是我们在 优化大模型智能化的一个层面上做的一些事情。但是围绕大模型本身的能力提升,依然存在一些技术能力的瓶颈,这个呢,也许我们短期内突破不了,但是 如果这个瓶颈影响到了我们在大模型,在商业应用,但是如果这个却但是这样的一个瓶颈影响到了我们在于但是这样的, 但是围绕大模型本身的能力提升呢,依然存在,但是围绕大模型本身的能力提升依然存在很大的技术瓶颈,这个瓶颈呢,不是短期人类可以 影响到 ai 大 模型商业化之路呢? 于是大家开始去思考一个问题,就是如果我的大模型能力无法去有一个很大的质的飞跃, 那我能不能够用好现在的一个能力,然后通过外部手段让他去更好的匹配企业的一个商业化需求呢?所以在二零二四年的六月份的时候呢, 这个 open ai 的 safety 团队的一个负责人叫李连文,这个人啊,他发表了一篇这样的文章,然后在这个文章里面呢,详细介绍了基于 l l m 的 一个 ai agent 的。 简单来说呢,其实就是用了这篇公式,就是 agent 呢,等于 l l m 加 memory 加 planning, skill 加 touruse。 就是他会认为说这个大模型如果要做一个通用的解决方案,他认为呢,就是如果大模型要做一个通用解决方案,那么 a i a 点是一个很好的土落地。就他认为呢,就是如果 a l m, 他认为呢,如果大模型要做一个通控解决方案,那么 agent 呢,是一个很好的落脚点,他把 agent 定义成了像 memory, planning, action to 这四个部分,其中呢,大模型作为整个 agent 的 一个大脑, 那这些是作为支撑大脑去解决更复杂问题的一些工具。从整个的这个图里面不难看出,就是我们其实所谓的 a 技能是通过控制大模型来去解决更加复杂的问题, 我不知道大家能理解,但这里面有很多概念,我这里先不展开,就是你们想一想,就是如果是一个机器人,你机器人最核心的能力是什么?是来自于什么?来自于大模型, 对吧?所以我们在 agent 里面,因为有了大模型这样一个大脑存在,所以我可以让他去指挥更多的,所以我可以让他去解决更复杂的问题。通俗理解是这样的,就是你们想想人在做决策,去做一个感知,做一个这个决策,做一个这个工作动作的时候,他是怎么做的? 从这文章中不难看出呢?从从这样一个图片中我们不难看出,其实 a i a 的 本质其实是控制 a i a m 来解决更复杂问题的一个代理系统, 对吧?我们知道大模型它的核心能力是意图理解和文本生成,但其实本质上说,如果我把这个能力抽象一下,它就是一个决策能力,那如果说我有给他这个 大脑提供更多的工具,去让它变得更加全面,是不是意味着有可能变成一个全能助手,去解决更加复杂的人类的一些问题? 所以就相当于说我们刚刚讲的贾维斯。贾维斯之所以能够解决复杂问题,是因为它智能化程度足够高,当然我们今天的人类的科技水平能不能达到这个层面可能还有点距离,但是至少这是一个方向,所以这是我们今天说 ai 技术是一个很好落脚点的, 所以这就是为什么我们今天说 a i a 点的是一个很好落脚点的原因。其次呢,我们可以通过人的角度来去理解 a i a 点的,你想一想,一个人再去感知到一个事情,去做一个决策,做一个行为的时候他怎么做的? 我们通过这样一个图给大家简单讲的是解解释一下。比如说你看我们会通过一个感知系统,通过比如说听觉或者视觉感知到一些信息之后呢,我们再 根据的信息啊做出一个判断和决策,然后再触发个行为。举个例子,比如说我今天看一个美食节目,然后这个时候我,我发现,哎,这个 看起来很好吃,对不对?然后我就我,我就身体就感受了一个信号,觉得有点饿了,然后我就这个时候可能会去点个外卖,那这个地方就会有个叫,看到这个视频,看到这样一个画面去触发了一个什么决策,就是我觉得我想去吃一个东西,那么我就会去点个外卖,这是 决策,然后决策以后触发了一个行为,行为就是我会打开 app 来去点一个我想吃的东西,然后整个的过程中感知系统、决策系统、行动系统, 最后就是整个过程形成的一些记忆的一些载体,然后我们用通过一个海马体来进行存储。然后如果说我们把这样一个人的行为通过一个数字映射来去完成,是不是意味着我们对于呃人工智能的所谓的未来的一个畅想,它真的可以落地, 对吧?所以我们把这个部分通过一个智能体来实现,他就变成了这样一个情况,就比如说我假设已经有了个智能体,对吧?你先不管智能体怎么搭建的,假设有这样一个智能体,对吧?那作为一个用户来说,我使用智能体我想做什么呢?我拍一个照片给到智能体,我问你这个智能体 告诉我一下这个天气怎么样?然后呢?如果你认为明天可能会下雨的话,你给我一下这个天气怎么样?然后呢?如果你认为明天可能会下雨的话,你给我一下这个天气怎么样?然后呢?如果你认为明天可能会下雨的话,这个天气怎么样?你想一想, 通过大模型能不能解决?解决不了,对吧?大模型是一个静态模型,他能做决策,但这中间还有很多行为,对不对?那通过一个机器人能不能解决?机器人也不一定能解决,因为他理解不了这么复杂指令,但是 a 键的他怎么做呢? a 键这样的,就是我们刚刚说 a 键的核心是大模型,那么我可以把这个指令给到大模型。大模型读完这个文本,识别完这个图片以后,他会 发现这个图片上确实是一个阴雨天气,那么有可能会下雨,对吧?然后再为了确保我的这个结论的准确性,他会去使用工具,那我掉落一个第三方工具啊,比如说查询一下天气预报的一个 api, 获取一下明天的天气信息。好,那么通过获取了第三方信息,整合到我的这个大模型的那个上下文里面以后呢?那我就可以得到一个结论,就是明天一定会下雨,对吧? 好,那么做了这个行为之后,我其实其实是决策加行为两个部分构成了整体的一个流程,对吧?好,然后 我有了这个步骤以后,我第二个问题是,你如果,如果下雨,你会给我把伞,对吧?那他会再发送一个指令,就做一个正题来说,发一个指令给到一个机器人, 惊人去取一把伞,给到这个用户。所以整体来说对于这个复杂整体来说他会分为三个流程。第一个就是图片解析和这个,呃,整体来说会分为这几个流程。第一个就是 整体来说会分,整体来说会分成几个字。对于这样一个问题来说,对于智能,对于这个问题来说,智能体接受这个问题来说,整体来说会执行三,所以整体来说智能体接受这个动作。 整,所以整体来说智能体在接受这个指令之后呢,它会执行几个动作?第一个识别图片上的天气信息,给出判断结果。第二个调用第三方天气预报的 a、 p、 i 获取明天的天气信息。第三个 l、 l、 m 结合这些信息得到一个综合评估的结果给到用户。第四个 触发一个指令,触,第四个给机器人发送一个送雨伞的指令,所以你会发现这是一个复杂的流程化的一个问题,而作为大模型来说本身解决不了,对不对?所以解大模型只能做一个决策。所以今天我们把工具的使用, 把那个外部的感知,把这个大脑的决策过程,对吧?包括把规划能力全部赋于给到这个大模型,结合在一起就形成了一个类似于我们真正意义上的这个人工智能的代理,或者一个机器人的一个决策。 我不知道大家是不是在这里面有一个清晰的理解,所以我们再回到这里面,如如果让它这个智能体能够落地,那么意味着你看我们就需要有这几个能力,第一个叫 memory, 第三个 torch, 第四个叫 action, 那 么我 简单给大家去讲一下这四个部分,这样的话大家会更清晰一点。那么 memory 是 什么 memory? 我 们叫记忆,对吧?记忆分为短期和长期,对于 大模型来说,其实本身来说它是不具备记忆能力的,它的短期记忆其实是由上下文来去构建的,所以我们如果想让让大模型去解决, 就是使用过程中能够更加记住我们常规的一些对话或者一些习惯,那么它是不是能够更好的理解 跟我这个主人,或者跟我这个人的一个一个一个交流呢?所以如果说我让它具备一个长期记忆,是不是意味着它能够去解决更复杂的问题后,意味着它更好用,对吧?所以我们可以通过一个叫 reg 的 机制去给它 挂在外部之库,去把一些长期的记忆存在外部的数据库里面,或者我可以去把外部的信息通过 reg 来输给大摩羯,这是一种记忆的直接部分。 第二个呢就就规划,规划是 a i a 的 最重要的一个部分,就像刚刚说的一个逻,一个逻辑啊,就是你接收这个信号之后,它里面分为四个部分,这四个步骤其实就是一个规划能力,就像说,比如说人饿了 啊,你,你比如你饿了,那么你你会触发一个什么行为呢?你会打开手机 app 点外卖支付,然后等到这个外卖过来以后吃,对吧?这几个流程,这是人的一个行为,这个人的行为对于大模型来说,大模型本身是不具备规划能力的,所以我们需要通过一些外部的手段去让它能够去把 这个复杂问题进行一个拆解,变成一二三四四个步骤。所以它里面会有什么反思,自我反思,包括思维链和子任务拆解这些能力啊,这些方式可以让他具备规划能力。那么这里面其实有个叫思维链,我简单给大家讲一下什么叫思维链?就是思维链,就是说 我正常来说我提个问题过去,对吧?我发一个 problem 提的词过去,那么他会围绕你这个提的词给你一个反馈,但是很多时候大模型再去呃,给你这个答案的时候,他因为我们的这个文本可能会比较复杂啊,有上下文,那么他就没有办法 好。第二个我们来讲一下 planning, planning 呢是 aia 等中最重要的一个部分,它是相对于说我把一个复杂的问题,然后通过一二三四的方式去形成一个规划,就是把我的复杂指令进行, 然后第二个我们来了解。第二个我们来讲一下那个 planning planning 呢,是 a i a 这种最重要的一部分,也就是它对一个复杂的目标 a i a 这种呢可以把我的这个通过一个 planning 机制去把这个任务进行一个拆解,最终达成目标。像我们前面讲这个逻,就 就像前面讲这个案例,就这个案例没有刚刚说呃,用户发起这个指令,发起这个问题之后呢,其实它会涉及四个步骤,那么这个四个步骤的规划其实是需要一二三四去拆解的, 但是大模型本身不具备规划能力,所以我们需要通过一些手段去让他进行对我的复杂问题进行一个拆解和规划,那么这里面有反射啊,有反思自我反思思维链和这个子目,子目标有子目标拆解, 那么这里面我举个例子叫思维链啊。什么什么叫思维链呢?这里面我们来给大家讲一下,就是这个罗,看这个图啊,就是, 嗯,比如说我们正常来说发一个这样的问题,给到提示词啊,发一个这样的问题给到大模型,大模型其实收到的是一个带有样本的提示词,对吧?那我就提一个问题,给你个答案,提个问题,那这个时候大模型应该告诉我一个叫 the answer is 多少。但是对于这种相对复杂的问题,有的时候大模型不具备这种,就是它的推理能力有限,那么它有可能理解不了,就会给你一个错误答案,那为了去让它能够去更好的思考, 所以我们在样本提示里面会把我们的思考过程拆解成三个步骤,就是蓝色部分,比如说对于这个问题我是这么去解决的,那么同样我问你这个问题的时候,你也按照我的思路去解答, 那么这个时候他的这个答案就会更贴近我们需要,所以这就是我们所谓的思维链的方式,去让大模型按我的步骤一步一步去处理,当然同时也可以去通过多思维链的方式,就这是当然,我们除了单,这当然这是一种方式,我们除了单思维链还有多种思维链,比如说多思维, 但这是一种思维,但这是思维链的一种,但这就这就相对于我们通过这种思维的方式让大模型具备了一个规划能力,这就是一个简单的一个案例啊。 当然除了这种以外,我们其实有很有有衍生的很多不同的思维链,比如说像这个多思维链的方式啊,就是生成多个答案,思,多个思考,然后我们从这个大于过半的结果结果里面去找到那个 符合要求的答案,然后包括这个四位数等等啊,这个是我们所说的第二个部分叫规划,嗯,如后续我会通过案例来去讲解,所以这个东西大家如果有很多细节不清楚,没有关系啊,你就有个印象就好了。然后第三个就是 action 和 tour, 其实 呃 x 和做这两个其实应该放在一块,所以你看有个虚拟的一个线条,因为你的行为会,比如说你你你你饿了,你要点外卖,点外卖是使用工具,而行为是去触发想点外卖的这个动作,对吧?所以他们应该是放在一起, 所以像我们刚刚这个图里面也是一样,就是你看我们的这个这个指令过来之后,你的行为,你的动作是放在一起的,对不对?所以这是我们说的一个一个一个一个一个逻。第三个版,呃呃,对对,这就我们说的第三个板块叫 action 和 tour。 那么拓什么拓?就相当于说我让大模型去使用工具,像刚刚这个场景里面,大模型是无法去预测天气的,但是我可以让他去调用外部的工具来获取天气信息, 对吧?有了这个能力,那么是不是意味着我刚刚说的知识库的滞后性也好,还是说大模型的那个什么这个部分领域的知识缺失也好,他都能够通过这样一个方式去获取呢, 对吧?所以这是我们的这个整个 a 件的一个流,一个一个逻辑,我不知道大家有没有一个全面的理解啊?就是再总结一下, 最开始我们在讲这个大模型的这个过程中,就是我们了解了一下 a a 件的一个智能体,对吧?但是智能体它的这概念其实呃比较偏向于表层,所以我们想从底层去了解一下,为什么用 a a 件呢?所以给它讲到了关于, 呃区块链的发布以及带来一些影响。但是从这个影响过程中我们发现了如果大模型要做商业化,它其实有局限性,所以在这个局限性的基础上,我们思考的问题就是怎么去优化,对吧?提升参数规模,增加大我们的处理能力,但是这个事情其实带来的 这个效果有限,呃,因为它有个技术瓶颈好,包括我们现在的这个算力瓶颈也好,还是说这个,呃, 当我们的文本,当我们的参数规模不断增加的时候,是不是会产生一个衰减,对吗?这些东西都是一些问题,所以在这个基础上我们思考就是如何用现有的大模型能力做一些 更大的事情,所以 a 点呢,就是一个这样的一一个产物,就是我把大模型结合内存加 planning 能力加 tool use, 能够去让它解决更复杂问题。所以通过这样一个逻辑图啊,通过这个流程图,我们就会更可以看到 agent 的 它, 呃作为一个整体的智能体去去去构建一个,呃,就通过这,所以我们通过这一个图就可以看到 agent 利用大模型,再结合工具,再结合这个整体的一个决策能力和感知能力,那么它就可以去呃应对更复杂的指令的一个需求,这就是我们所说的 agent 的。 然后涉及到的 memory 也好, planning 也好, action 也好, tour 也好,这些都是 构建 agent 的 核心组成板块。好吧?好,这个是对于 agent 的 一个基础的理解,然后呢?呃,我们再从这个实际层面去了解一下,就怎么去构建 agent 的, 好吧, 那么构建 agent 的 呢?其实有很多,就是你如构建 agent 呢?其实国内有很多低代码平台,就是你不懂代码, 你没有关系,你可以去用这种低代码平台去拖拉拽的方式去实现你的智能体。国内其实有很多,像,呃,比如说这个文星智能体平台,呃,像那个 coach 啊,字节的,然后呢?这个是智普啊, g m 啊,那个智普清颜的这个, 呃平台,然后呢?像那个腾讯的元气,还有像那个,诶,文星智能体,我应该列过了啊,就这样一些平台, 呃,然后像腾讯元气啊这些,呃,只是我们今天看到的一些头部的,呃,智能体平台,呃,智能体的 demo 平台,当然还有很多,其他的我就不展示了, 那这今天我们这堂课呢,我就给大家去,那今天这个视频呢,我就给大家分享一下,用 pos 来去搭建一个智能体很简单。好,然后你们可以打开一个网站叫 code 点 cn, 然后登录注册一个账号,登录上去以后你们在这个地方有个叫工作空间,然后这里有个叫项目开发好,这个项目开发里面我已经开发两个项目,对吧?然后我们在这里面点创建, 创建,有一个叫创建智能体,看到没?点创建好,然后比如说我们叫给给一个名字叫文案优化助手啊,我们就随便取个名字,好吧?然后这个文案优化助手,文案优化助手专门负责短视频文案优化的动作, 我在接一下那个手机的支架, 嗯,没在我这里吧?你自己的那个,这个我不要。 然后我们在这个地方点击创建按钮,就可以去创建一个智能体。点创建,然后这里输入一个名字啊,名字可以随便取,但是可以 根据你的这个需求来去,或者这个智能体的一个功能来去定义啊。比如说短视频文案优化助手啊。好,这里面的介绍我就可以先不写了啊,图标可以自己定义,然后点啊,比如说我随便换一个啊,你看 有点慢,就你可以换一个,也可以自己上传一个图标。好,这个图标后面在你的那个智能体商城里面会可以看得到啊,点确认 好,你看智能体就创建好了,很简单,对吧?但是这里面我们要注意一个点,就是,呃,刚刚 在这个图片里面我们讲的一个东西就智能体,它其实是由几个部分组成,一个是规划,一个是内记忆,一个是工具和行为,对吧?那么它的核心是智能,是它的大模型,我们看这里面我默认这个地方我用的是那个豆包的三十二 k 的 大模型 呐,用了豆包的这个大模型,然后右边这个地方的窗口其实就是直接你,那你是谁?就是你直接是调用的是豆包这个模型,看到没? 好,此时呢?我们现在这边用的是一个裸模型,就是它是一个,比如说你的知识库停留在哪一天,你看啊,它是一个,呃,过去训练好的, 对吧?过去训练好的二零二三年之前的数据的这个,这个训练出来的一个智能体啊,这一个大模型,那么这个模型叫裸模型,对吧?那我现在说,呃,想让他去 去解决一些这个变成一个智能体,对吧?那我就在左边这个地方可以添加很多的能力,比如说工作流, 工作流就是我能够去让他按照我的流程来执行,也就我们刚说的流程规划,或者我们叫 planning, 对 吧?然后第二个我们在这里面可以去插入我们的插件,就是比如说我现在问他天气啊,明天,呃,上海的天气 怎么样?他肯定不知道对不对?但是我可以让他去,因为大模型问这个天气的时候,他其实知道我在做什么,对吧?那他可以去做出一个行为,就是如果我给他一个工具,他就可以做出行为。比如说我添加一个墨迹天气, 你看我把这工具添加过来,你看我添加这工具之后,他再你再问他这个问题的时候,因为大模型具备决策和规划能力,对不对?所以他会去找到我插件里面写的这个工具,然后我会触发一个天气的查询 啊,这个就是我们说通过这个手段去给他赋能的一个方式,你看他明天天气就有了,这就是变成了一个智能体 啊,不知道大家清楚了没有?好,然后这里面我们还可以去添加知识。什么叫知识呢?就比如说我可以去呃呃,因为他现在,比如说他知识库是在二零二三年七月份,如果我想去,那让他具备最新的知识内容 怎么办呢?我比如说我想把公司内部的一些文档,呃,可能因为内部有些,比如说这个,呃资料他是不开放的,所以原来的这个大模型训练的时候是急于公开数据训练,所以他拿不到这内容怎么办呢?我可以把我的内容, 比如说以文本表格、照片的方式上传上去,那么此时那你比如你添加上去,那么此时我们在问这个问题的时候,他就会去我的知识库去找。这个也是我们前面啊,上一次,呃,我拍过视频叫 reg, 也就是一个 reg 的 机制,他会从这里面解锁相关内容,去给我整合一个回答,这是一个叫 叫叫叫叫知识部分。然后呢记忆部分,就刚刚说 memory 啊, memory 它有长期记忆,还有这个,呃,短期记忆的话是本身就具备的一个上下文,然后记忆里面我们可以用数据库来存储一些数据啊,长期记忆我们可以开启。好,这个呢,我们 就不不展开给大家讲,这个大家可以去摸索,很简单。然后对话这个体验就是开场白,就是我打开的这个界面之后,比如说用户在我的,比如说 codes 点 c n 在 这个商,就你把这个整体发布以后有个商店,对不对?然后这个商店里面你点击以后它的这个对开对话的开场白是什么呢?这个就是开场白。好,然后你可以定制你的这个 背景图片,你看它这个背景图片很漂亮,对吧?好,然后包括指令的快就快捷指令,对吧?啊,这个东西你可以自己定义的啊,用户提问的建议等等,那么这些就是对话体验这部分的,包括角色,角色的话你可以, 嗯,去添加这个语音,然后语音的话你可以添加你自己的一些声音,比如你看添加语音啊,比如说添加音色, 是吧?好,这个,比如说中文啊,音色啊,可以添加这种效果啊,因为这样的话你,你后面再给你的一个回答里面可以转换成语音的方式去进行一个输出。好,这个就是智能型的搭建,其实你会发现特别简单,但是这里面有个很重要的东西, 呃,是很有价值的。什么东西呢?叫工作流。什么叫工作流呢?就是比如说我问他,我,我问你,就是,呃,我问他一个复杂问题,比如说,呃呃,我,我给他一个抖音的一个短视频地址啊,我,我找一个。 就这里面工作流是一个很核心的部分啊,就这里面啊,大家注意就是这些东西大家都都可以简单去上手,但是这里面最核心部分是工作流,就是什么叫工作流?就我刚刚说的就遇到一个复杂问题的时候,他怎么去进行执行,怎么去做规划, 什么意思啊?就举举个例子,比如说我问我,我丢一个这样的链接过去说,哎,你帮我把这个抖音的视频的这个链接的文案扒下来,然后帮我做优化,那这个事情对于大魔性来说肯定不具备,对吧?这短短抖音短视频链接,短视频, 抖音视频文案优化,你看这个时候他肯定不具备这个能力,他做不到,对不对? 你看乱说的,对不对?就是它根据过往的内容乱说的。所以我们在这里面可以怎么去搭建这个优化流程呢?在这里面点添加工作流, 那创建工作流,比如说我们叫文案,叫,呃,这个 text, 叫,呃,抖音啊, 呃,这个 tax 啊, opting, 对 吧?就负,就是负责,负责抖音短,注意啊,这里面有个工作的描述啊,这个描述很重要,很重要,为什么呢? 因为大模型,呃,在接受这个指令的时候,他为什么要调用这个流程?我得告告诉他清楚,就你看,请输入描述,让大模型理解什么情况下应该调用工作流,就是如果, 如果用户提,如果这个用户提,呃,这个发起就是提交了这个一个抖音短视频 短视频链接地址啊,需要你对这个链接内内的文案做呃,提取和优化,可以就可以触发这个工作流。好,我们我点确认 好工作流创建好了,那这里面就是一个拖拉拽的方式,非常简单,所有普通人都可以上手, 就是这里面可以添,就是我给你讲一下啊,就是这个地方是流程,注意啊,这个流程就是你规划好这个流程之后,你看,比如说你添加好这个流程,你通过线条画起来,但是这个流程是怎么是,是怎么做呢?就是比如说刚刚我问的是一个抖音的短视频地址的优化 啊,短音抖音短,知名的这个文案优化,那么这个文案优化你,你需要怎么做?你,你作为一个人来说,你设想一下你怎么做?你是不是需要提取这个文案地址,对吧? 提取文案地址,但是你,你注意一个点,就是他刚刚问的一个问题,是什么是丢一个这个东西过去,那么你首先你得先拿到地址,然后在这个地址面再拿到这个文本内容,对不对? 对吧?这个我大家能不能理解?所以我在这里面是不是需要先?呃呃,谁能帮我去从这个文本里面找到这个视频链接啊?找到这个短短视频的地址, 只有大模型能做这个事情,所以我可以添加个大模型过来,哎,大模型好,就是我这边可以输入一个内容,对吧?就是你在这边啊,啊,比如说你这个地方有一个这个添加一个输入啊,输入叫什么呢?叫这个 url, 对吧?好,你这边输入了一个 url, 但是它并不是一个 url, 它是一个 string 嘛?对不对?它说的 string 类型,所以它是一个这样的内容,那么这个内容过来以后,我肯定是要需要他帮我去找到这个链接地址,对不对?所以我在这里面直接告诉他,哎,你帮我识别啊,在这里面啊, 识别,识别啊, input, 注意啊,识别 input, 识别 input 中的链接,对吧?限制一下,这是提示词的一个键啊,只输出网址叫只 输指输出网址,好,这是一个提示词,对吧?好,让大模型做这个事情很简单,然后这个 input 是 表示的是我的输入,输入是来自哪里输入的?是开始用户在那个对话窗口输入的这个内容,所以我把这个内容提过来,来, 我把这个内容绑定过来,也就是说用户把这个地址丢过来之后,我触发的一个流程就是这样,就是自动触发这个流程到这一步,这一步里面他把这个输入地址作为一个音符的输入过来以后,我再通过提示持续优化。优化以后,然后我再,你看 我,我可以直接输出啊,你看我,我再把他这个这个大模型的输出做弄出来,你看我给你测试一下啊, 我给你试用一下,比如说你看丢过丢过去运行很简单的,你看这个短视频的地址就提炼出来了。 好吧,那提炼出来以后我接下来做什么?接下来做什么?我是不是需要去拿到这个文案,对不对?那么这里面我可以添加个节点,就是什么呢?添加个插件, 有一个插件是专门去获取链接内容的,你看有个叫链接获取,看到没?当你需要获取网页、 pdf、 抖音视频内容的时候,可以使用这个工具,所以你点击这个添加。 ok, 好, 你把这个链接添加这个卡片添加过来。呃,这个工具添加过来,然后你再画条线连起来,是不是很简单?好,这个工具它能提取这个视频的链接的中的一个内容,对吧?我就把 输入的内容很简单,就是上一步提炼出来地址,我把它绑定一下,就大模型输出的一个这个地址。好,我添加过来以后呢? 我这个时候就有了一个地址,我中间的有四个参数,这四个参数里面有这个可选项,我可以先不管, 我可以先不管啊,然后我们在拿到这个输入之后,我们这里面会得到一个输出,然后你看一个案例啊,就如果你不知道怎么写呐,输出的是一个 data, contact 是 你的内容, title 是 你的标题 内容和标题。好,那么也就是说我把这个地址传到这个插件之后,它会给我一个返回的格,节省格式的数据,然后有个 content 是 我们的内容标题。好,然后我拿到内容以后需要做什么?我需要做什么? 大家想一下,我需要做什么?我需要做优化,对不对?那优化的时候我需要干嘛呢?我需要去进行文本的一些这个格式化,所以这里面如果大家懂代码的话,可以加一个代码,就是在这里面通过一个代码的文档去做什么呢?我可以把 上一步的这个内容叫 content, 呐,我把这个 content 这个内容看到没,这个内容通过一个脚本,通过一个 python 脚本去对这个内容做拆分。好,我们点保存这个代码,你不知道写什么?没关系,你用 大服务器可以帮你生成啊,就是按照这个换行符啊,通过这个方式来进行一个分割,分割以后呢?呃,我们得到了这样一个这个输出,输出什么呢?输出两个部分,一个是抬头,一个是内容,对吧?我们把它定,把这个输出的, 呃,变量名变成两个啊, out put 一, out put 二,就是通过这个脚本以后,把把前面的提取的文本去进行一个拆分,得到两个字母串。 好,大家可以每一步都可以测试一下,就是这个字母串是什么?我可以给大家看一下啊,你看我可以把他的这个,我这个地方会写的有点快啊,你看我可以把他的这个我这个地方会写的有点快啊,你看我可以把他的这个,我可以自己去 呃,自己操练一下,操练的过程中如果有问题的话,你再再再看我的这个视频,好吧?你看我在这一段里面是不是得到一个 content, 对 不对?然后我再通过一个代码去提取,做一个什么叫 内容的一个提取,对吧?然后做一个分割,分割完以后得到一个两个输出,然后你不知道这个东西是什么,对不对?你可以看一下,你看比如说我运行,运行以后再跑过去,他每一步都可以测试啊,测试完以后你看 output 是 标题, output 二是内容, 哎,这个就很有意思了,对吧?我为什么这么切割?大家明白了吗?因为他是一个视频,视频里面没有明确的标题和什么内容,所以他是把这个标题跟内容放在一起的,所以我,我是从那个 content 里面呐去猜出来,猜出来以后我就可以把这个,你看 你,他就可以把我的视频里面的这个标题和内容提取出来,对不对?好,这是我们的内容提取,但是我的目的是什么呢?我的目的是需要让他对文案做一个优化,那么文案优化是谁来做? 文案优化出来做,想想是不是大模型能做?所以我在这里面一定要添加一个什么,添加个大模型大脑来做决策啊,大脑来做决策,所以我这个大脑 可以去帮我做内容优化,但是这个内容怎么优化?首先我需要的是什么?我需要的是你,你你你,你把上一步的这个内容给我,对吧?比如说我的这个上一步的 out 不 离,你把内容给我, 好,这个内容给我之后,我怎么优化?是不是需要让大伙去知道怎么优化?所以这里面有一个非常重要的东西叫提示词,就是你得告诉他你拿到这个文本以后,你怎么去优化,那么这里面我直接我自己提前弄好了,所以我就不写了。提示这个部分呢,大家给自己去研究复制一下。 好,这个时候我们通过提示构建好以后,那么它就可以输出一个 output, 对 不对?好,然后我们再把这个线条放连过来,好,再把这个这个改删掉,把它改成,呃,大模型一的一个输出。好,我们再运行一下, 就是我把上一步的切割出来的内容通过大模型优化,优化完以后,你看输出的这个标签上, 啊,啊,不能在这是不是很清晰吧?好,优化出来的这个标题他是这样带带换行符的,这个地方呢,因为他没有格式的一个渲染,所以你看一下很乱。好,我们就相对这个流程就完成了。好,那我把这个流程 发布一下,注意啊,发布一下。好,发布完了以后,确认这个时候我们就有了一个这样的工作流了。那于是我再问他这个问题的时候,大家看, 你看他会调用我创建的工作流,然后相当于我刚刚在测试过程中的这个流程,在这里面会跑出来看它结果啊,以下是十个优化后的标题,你看 包括正文, 是不是?这就是我们说的智能体 啊?这就是我们说的工作流。所以为什么工作流很重要?因为工作流它其实是对于一个复杂场景的一个流程拆解,这里面不止添加一个,可以,可以添加很多啊,你可以添加很多工作流,然后你添加进来以后,你就可以让它解决不同的复杂问题, 然后你这个流程的核心就是什么?对一个复杂指令的一个拆解,对吧?对,一个复杂指令拆解一二三四干嘛,对吧?好,这这是关于智能体的搭建,就大家可以在听完这个视频之后,自己在课后去利用这种扣子平台去搭建一下,非常简单。 好吧?好,这就是我今天要分享的内容,如果大家对于这个内容还有其他问题的话,可以在我的评论区留言,我是麦克,感谢大家的一个学习,我们下次再见。拜拜。

一条视频教会你扣子工作流搭建的完整视频,本视频共计三十七分钟。在百度里头我们去搜索扣子两个字,我们搜到第一个就是我们把这个功能拉到最右侧,我们可以看到这个有三个功能,一个是扣子空间,是扣子 推出来的通用智能题,扣子编程对应的之前呢扣子的开发的平台,他这个名字改掉了对这个扣子的罗盘,那我们主要是用到扣子编程,也就是扣子开发平台。第二个功能好,我们直接打开扣子编程好, 点进去之后,我们直接就来到了什么扣子开发平台的一个界面,我们直接在这个页面,我们直接打开左侧这个菜单,资源库这个菜单。 好,在这里大家可以看到这都是我们之前创建好的一些工这个工作流的一些列表,当然这里边不单单有这个工作流,你还可以有这个插件,包括知识库,这个提示词以及数据库等等,总之是各种各样的资源全部在这个资源库里边。 好,那我们接下来我们就在资源库页面的右上角,这有一个资源的按钮,我们直接点击把它打开,这里边有各种各样的,你可以创建插件,工作流、对话流等等知识库。好,在这里我们是创建一个工作流。好,我们直接点击它。 好,那在创建之前给他起个名字。好,那我们今天就给大家以自媒体这个行业为例,这个名字没有什么特别的要求,比如说我们就用汉语拼音,有些朋友说我这个英文不太好,那就用汉语拼音,你看我就起的是自媒体这三个字的这个拼音。好, 没问题,我们加一个工作流。好,这个名字就大概就这样就行了啊,当然不能,不能是中文的好,工作流的描述,你这个工作流是干什么的,你就用你的大白话把它说清楚,说清楚就可以了。好,在这里我们的工作流就是我们想根据用户输入的主题, 也就是说用户输入什么主题,我们来去生成相应的文案,因为我们是做自媒体的内容啊,以及这个图片和什么 和相应的这个视频。好,那我们是今天去做生成自媒体素材内容的这么一个工作流。好,那这样我们的名称跟描述就写好了。之后我们直接点击右下角确认的按钮,我们直接点击右下角确认的按钮。好, 来到这一步,来,咱们直播间的各位朋友有没有问题?这样我们就直接进入到了对创建搭建这个工作流的页面这个界面了。好,大家可以看到这里有有,只有开始和结束这两个默认的一个节点, 到这步我相信大家应该都没有问题。来,大家有没有问题,我们把我这个工作流,大家可能不太好理解,你就把它想象成咱们工厂的流水线。好,我们去扮演工厂的厂长, 你要做的任务是什么?来,去招人,雇这个员工来为你去干活。把人雇进来之后,你要给他培训,再去给他分配任务, 你这些招进来的员工都是你的 ai 的 员工,让 ai 来为我们来进行干嘛?帮我们来自动化的去干活,替我们去干活。既然是这样,那我们就可以根据我们的今天的这个需求是什么? 首先我们去要去创建一个什么,对,创建一个这个我们是讲根据这个主题,我们根据这个主题去生成相应的什么 文案、图片以及视频。好,那我们就去先去添加一个什么帮我们去写文案的这么一个员工, ai 的 员工,好,那我们 大家可能去想到写文案,是不是我们要去添加这个,比如像大模型 deepsea, 我 们就把大模型的节点添加进来, 这个大模型的节点就是帮我们去生成文字的内容,也就是我们今天的一号员工,我们来给他稍微编排一下,改个名字,点击这个三个点,在这重命名一下,他就是今天的一号员工。把,我们是干嘛的?把,我们去 对写文案的生成文案。好,我们先不着急来对他进行一个配置,作为厂长,我们先把所需要的岗位,这个员工我们都先招进来。 好,那我们接下来我们要去招什么?我们是不是要招第二个我们的员工就帮我们去生成图片了,那怎么去招?我们在一号跟结束的节点这个连线的中间,我们这他是不是有一个加号的按钮? 我们点击这个加号的按钮。好,他是不是又弹出这个界面了?那这个你可以把它想象成就是一个工具箱扣子给我们提供的各种各样的工具模块节点都在这个工具箱里边。好,那我们往下滑,我们既然要去升图片,我们在这里是不是有一个图像生成的 这个功能?好,我们直接把这个图像生成对这个节点来给他添加进来,那他就是我们今天的什么,相当于是我们二号机器人的一个员工,就是我们的,我们同样给他改个名字,他就是我们的今天招进的二号员工,好,那就是帮我们去生成图片, 那接下来我们是吧?我们第三个需求是什么来的?我们第三个需求有了这个文案,有了这个图片,第三个是我们要去生成一个视频,最终的视频。所以在我们二号员工跟结束的节点中间,我们再去干嘛?再去添加一个员工,帮我们专门去生成视频。好,我们直接点击加号按钮, 又弹出这个界面了,所以大家看到没有,你,你,你如果只需要去添加各种要去加,去添加 ai 的 员工帮你去干活,你都是需要跟这个界面去打交道,这里边有各种各样的, 我们都可以认为它是,你认为它是工具也好,或者说功能模块也好,我们 ai 的 员工,好,那在这里我们就找到在音频视频处理这个区域。好,这有个生成视频的这么一个员工,我们把它添加进来。好,点击你的鼠标左键。好, 那这样我们就把他加进来了,我们就给他改个名字。好,我们继续,这个就是我们的三号。等员工。好,帮我们去生成什么生成视频的。 好,那到这你作为厂长觉得就是我们的这个人今天着齐了。好,接下来你要干嘛了?对,接下来你要去对他进行培训,分配任务,给他 进行一个执行,帮你去完成最终的一个任务,这样我们整个的工作流他就可以帮我们去自动干活了,我们最终为了达到这么一个目的,最终的目的就是能够帮我们自动干活,帮我们去自动去根据用户的主题去写完啊,生成图片,生成相应的视频。 那接下来我们就要对他来进行训培训,就跟我们这个公司招人之后,给他培训之后才能上岗一样的道理。好,那我首先我们就来对我们的第一个 爱的员工来进一个培训,我们选中打开它之后,这是它的整个大模型的一个配置界面,我们简单的来看一下,大家都知道大模型是什么?大模型,包括我们今天的搭的智能体工作流来,大家有知道的吗?有不知道的扣零好不好?知道的扣一, 那我就快速的去过一下给大家。大模型是什么?大模型就是我们用的这个像豆包、 d、 p、 c, 什么 k 密,包括大漂亮的 g、 b、 t, 这个都属于大模型。 那大模型它主要的工作主要是帮我们干嘛?帮我们去生成文字的一些内容,比如说你去写个文案,写个短视频脚本啊,去写个报告,写个总结,它主要是帮我们去做文字方面的一些工作。好,那我们的智能体是什么?智能体 它就不一样了,智能体你可以把它想象成既有这个大脑,又有这个手和脚,那大脑就是我们刚刚说的大模型,就可以充当为它的大脑, 那手和脚就能帮助我们来把这些具体的一些问题进行落地。比如说你要去写一个,生成一个具体的 ppt, 或者说需要剪辑某些视频,或者你要生成一个表格文件,什么 word 文件,像类似的这种的好, 那我们就可以通过这样的一个智能体来帮我们去实现,帮我们去生成这样类似的一个文件。当然我只是捡了一些简单的一些例子,当然他智能可以帮我们做很多事情,而且在各行各业,在各种各种场景都可以帮我们去完成相应的一些解决,我们完成相应的一些工作,帮我们解决一些问题。 说到大模型智能体,那工作流又是什么?工作流,我刚才说了工作流,我们现在搭建的就是工作流,工作流就是你的业务的核心逻辑,都是搭在工作流里边, 有了这个工作流,你好比是什么?就是帮助咱们的智能体去实现一个具体去解决这个问题。来去就说为什么 大家总说大模型不能去落地,他能给你很好的创意,给你很好的一些点子,但是你要想让他去生成,比如说某一个文件, ppt 文件他是不是做不到?或者说把你想生成某一个 某一个 word 文件等等,是不是做不到?他只能把你先生成文字的内容?好,你要生成 ppt 文件这种的好,那就需要我们干嘛对第三方的一个去搭建这样的一个工作流来实现。 好,那以上给大家就是简单的介绍了一下这个智能体大模型,包括工作流的它的概念,那我们还是回归到我们的正题这块,我们的这个大模型的一个配置,那我们在这里其实大家 来看这里边有很多模型的选择,豆包的,包括 deepsea 的 豆包的,大家都知道豆包的也是我们自结旗下的,扣子就是自结旗下的,它是一个生态的系统。好,那我们如果选用, 比如说你要豆包,其实我们用豆包一点五三十二 k 这个 pro 三十二 k, 它这个啊其实挺好用的,而且它的速度很快,我一般演示都会去用它。好,如果你想想写的更好一点的一些文案,你可以用一些深度思考的一些这个模型,像豆包的一点六这种的深度思考,或者说 deepsafe 有 r 一 的模型, 都是一些深度思考的一些模型,包括第四个 v 三点一这种的都是深度思考的。好,那我们就用这个一点五 pro 三十二 k 足够用了。好,那接下来我们再去配置一下这个输入。好,输入是什么呢?大家注意看好输入,包括还有这个输出, 我们添加的这些模块与这些节点,所有的 ai 的 这些员工啊,都有输入和输出,看到没有?好,包括我们的三号员工也是有输入输出,所以我们的每一个 ai 的 员工啊,输入和输出是 共同的一个特点。好,那大家可能对于输入输出啊,没有学过基础的,或者说没有搞过这些可能不太好理解。确实,那我们怎么去理解他。好, 我在这给大家举个简单的例子,比如说我们把输入这里,我们就把它想象成是输入的这个材料通过我们加工, 加工之后输出的是什么,输出的就是他的一个成品。那我们在这里,比如你现在要做一个蛋糕,我们在这里输入的蛋糕的这个原材料,包括有这个蛋糕的批子,什么牛奶、奶酪,还有水果等等,这些就属于我输入的这个变量,你就把这个变量 底座是我要输入的一个原材料,因为你去想这个变量不太好理解。好,那我们输出的是什么?输出的就是我这个蛋糕做出来一个这个蛋糕。好, 我相信大家这样答案应该就很好理解了。那我们在这里输入的就是什么,我们打开我们的这个小齿轮配置按钮,然后在这里开始这个节点,有一个,你会看到有一个 input 输这个变量。 好,当然这个音符的变量就是我们开始节点的这个变量,你可以给他改个名字,咱们刚才忘了改名字,这个名字是可以改的, 你可以用汉语拼音,比如说我这里是接收到用户输入的这个主题,对不对?好,那这个主题我给他改了一个汉语拼的名字,这不是英文单词,就是主题汉语拼音。好,我们又回到一号员工,我们再去打开输入的配置,再开始这个节点,你就会看到是不是不是有一个主题的变量? 好,那我们直接把它配置进来,点击你的鼠标左键,把这个变量的名字,我们同样可以改成汉语拼音这个主题。没关系,我们不懂英文也可以去学,因为很多确实英文基础不好。他说你这个能不能写,其实这个名字真的没有那么重要,你哪怕就写一个 a 也行,能理解吗?你就写一个 a、 a、 b、 c、 d 都可以,你只要说你能够知道它是代表什么意思就可以了。那我们现在有了输入的主题,因为我们现在就一个,对不对?就一个主题,就是用户输入的这个主题我们已经配置好了,当然如果你有多个这个变量,也就是说你要输入多个原材料的时候,你就可以呢 添加多个这个变量,答案能理解好,当然我们现在就一个,接下来我们就来到了我们的提示词的一个书写, 我们就来到了一个提示词的书写好,那提示词在这里我想跟大家说一下,非常重要。如果你说整个的我们工作流这些工作模块,大模型这个节点可以说是所有这个模块里头最重要的,对不对? 大模型就是我们用的 deepsea 豆包好,那我们的提示词可以说是重中之重,为什么?因为你看你不管你在用这个 deepsea, 也要用豆包也好,你在平时在网页当去用,或者说你下载到手机里的 app 去用的时候,你是不是要去提问 好?你提的这个问题其实就是在写这个提示词,也就是说你你提问的这个好坏,你也就说你写这个提示词的好坏,决定了什么?决定了这些大模型,决定了 deepsea 也好,豆包也好,给你输出的一个答案的质量的高低好坏, 大家能理解。所以那有些朋友就说我用 deepsea, 用豆包舀,或者说用用用,用国外的那些也好,我为什么同样的这个大模型,我为什么有的别人为什么能输出很好的一个结果?我用起来为什么总感觉它傻傻的,或者说不好用? 你要去审视一下是不是你写的这个问题,写的这个提示词,提问的这个问题不是很好,所以对不对? 所以他给你出来的结果也就天差地别了,这个就差距非常大,模型是一样的模型,但是你提问的好坏这个非常重要。好,那接下来我来带着大家去简单的手搓一个提示词。 首先你写这个提示词,你可以给他先定一个角色,你是谁?你扮演一个什么角色好,要干什么?要干什么?好,达到什么目的? 整个有什么要求?好,把这个两点写清楚就可以了。这个其实就是对大家去提问的一个简单的一个要求,当然有时候你,你扮演什么角色都可以忽略掉。好,那比如我现在跟大家去说一下,比如说我现在告诉大家,你是一个告诉大魔镜,你是一个优秀的 文案写作专家。好,你需要帮我去用户输入的主题,是不是用户输的主题?帮我 根据用户输入的主机去写生成文案。什么生成文案和什么?对,和,我们需要生成图片,但是是不是大模型不能直接给你生成图片?打 excel 包括这个,他能给你生成图片吗?不能吧?好,那我们再生成图片,我们需要让大模型生成。什么 生成叫做帮我去生成图片的描述提示词,对不对?好,提示词好,和什么?和我们对吧? 三号员工,我们需要的是什么?视频的什么动作提示词好,视频的动作提示词 好,他,对吧?你,你们就记住大模型,他可以帮你生成各种文字的内容,各种文字的内容,对吧?好,就是你,你去让他帮你去做。好,那这里你看我这么一句话,是不是 这么一句话,是不是交代了你是谁?然后呢?要干什么?帮我去干什么,对吧?说,说的很清楚,就通过这一句大白话就可以了。好,我把他删掉,那在这里,其实这个题的词他就能够帮你去做这件事了。 已经可以了,但是有些有些同学这个也太简单了吧,对吧?太简单了。好,然后有些同学说,我能不能让他优化一下变得更好呢?当然可以。好,怎么去做?怎么去做。 各位啊,很简单,很简单。来,我们稍微看一下,我往这边挪一点。好,你们可以看到,其实扣子给我们已经提供了,在这里是不是有一个这个什么? 有一个什么,对吧?在这最右侧有一个按钮,叫做可以优化这个提示词。可以优化。好,我们直接点击这个按钮,自动优化提示词,他就会针对我们写的这段什么这段提示词来进行一个优化。好, 你看我们就点击第一个。好,我们稍微等一下,你看。所以大家你看到没有?你需要做到的就是把你这个想要干什么表达清楚了,你不会优化,没有关系,交给 ai, 让 ai 帮你去优化,帮你去写。 已经写完了,大家看没有?我们来看一下他优化的一个结果。好,这个就是角色,你是一位,对吧?专业的多类型内容生成专家,看到没有?他帮我改了, 我刚才说的是文案生成专家,为什么他现在改掉了呢?你看他把我就优化了。多内容生成专家,因为他不光光是帮我们去写文案,他还要帮我们去生成提示词,对不对?生成图片的那个描述提示词和和什么?和视频的动作提示词,对吧?好, 你看没有,根据用户书的这个具体主题精准生成文案、图片提示词以及视频的动作提示词,对吧?擅长结合不同的场景需求来调整内容的这个风格和细节。好,这就是一个角色比我写的好,对吧?优化的比我写的好,对吧?好,来,技能,你看 三个技能应该对应的就是文案生成,第二个技能在哪?图片的一个提示词生成,对吧?在这里,然后呢?第三个是什么?视频的动作提示词?这么长,看到没有?好,最后是限制好, 我觉得写的非常不错啊,我们直接点击你,你觉得不错,你直接只需要去点击这个替换的按钮,好,他就会帮你,对吧?把原来的那个替换掉用,对吧?用他帮你生成的一个提示词,看到没有?我们两句话,人家给我优化生成了这么长的一段提示词,够不够专业?各位, 所以大家一定要擅长利用 ai 帮你去做事,对吧?你只需要把你的需求提出来,用大白话讲,讲清楚,一定要讲清楚,好,让 ai 帮你去优化,大家一定要擅长去做这件事,对,好, 没问题吧?好,那我们这个第一个,大家看到我们的这个系统提示词,我们就写完了。好,那用户提示词又是什么呢?用户提示词其实很简单,其实就是这个用书的这个变量,也就是我们输入的这个原材料,对吧?输入这个原材料,你把它写进去,写到哪呢?写到这里, 好,怎么写?摁住键盘的 shift 键,在键盘的左下角,左下角,好,然后打出大括号,它就会自动弹出这个变量,然后呢,你去点击左键,好,这样我们就引用成功了,就引用成功了,当然我们还要跟大家说一下, 其实用户的这个提示词,你可以把这个变量这个主题可以放到系统提示里边,这个是都是可以的,对吧?都是没有问题的,你这里用户提示词可以是空的,当然我们放到这里我们这样写是一个比较规范的标准的一个写法。好吧? 好,那我们这样就整个的我们的这个提示词就配置完了。好,接下来我们整个大模型的配置还没有完,还没有完。好,我们对,我们来到了我们的什么? 对,输出这部分,输出这部分。好,你既然,对吧?你,你输入有了中间加工,其实提着词就是来去帮你加工的,对吧?帮你去加工的整个过程就是提着词的一个能力。好,最后输出的结果是在哪?在这你要把你加工, 对吧?把这个原材料加工之后的一个成品产品输出出来。好在这大家是不是这样的话,是不是就通俗易懂了?我相信大家应该就能够很好的去理解这件事了。好,我们怎么输出呢? 大家记住,你看我们这里边是不是有三个不同的技能,也就是三个不同的任务,所以你输出的结果他一定是三个,哪三个呢?文案 对吧?然后这个是什么图片提示词,这个是什么视频的动作提示词。好,是不是这三个?那因此我们输出的结果他也是三个,他也是三个。好,我们点击这个加号的按钮, 我们点击这个加号的按钮,来再去添加两个变量。好,是不是添加了一共三个输出的一个变量,三个一个输出的变量, 好吧?好,来,我们来给他进行一个命名,这个名字输入变量其实也是跟你的输入那个名字输入输入变量去写输入变量,这个名字的规则是一样的,对吧?英文的字母或者是什么, 对,或者是这个汉语拼音就可以,好,那我们第一个就写文案,大家发现没有?我全是写的什么,我全是写的这个,这个,这个汉语拼音,汉语拼音,所以大家这个不要担心说我不懂英文,能不能去学,可以,对吧?没问题吧? ok, 好, 来,然后呢我们备注一下啊,点开这个箭头按钮,我们在这里要去添加一个备注什么呢?这就是我们的文案, 然后呢在这我们去写一个什么呢?第二个输出的边上就是我们的什么图片提示词,图片, 对吧?图片提示词,好,那这个就是我们的图片提示词,对吧?图片提示词,好。第三个就是我们的视频,对吧?我们照样还是写的是汉语拼音,好,那这个就是我们的视频提示词, ok, 好,到这里我们的三个输出变量我们就搞定了,就搞定了整个整个我们一号员工大模型这个员工我们就配置完了,一号员工我们就培训完了,我们花了将近半个小时的时间在这个上面, 为什么?因为我我们觉得整个的工作流的搭建,智能体的搭建,其实我们最需要去研究的,最需要琢磨的就是大模型,我们应该花更多的这个精力在上面去好好研究它, 对吧?因为你们很多的结果都是跟他的输出的结果是相关的,对吧?你后面比如说你的提示词,你生成的图片的好坏,包括生成视频的好坏,都是跟你的大模型输出的这个结果息息相关, 大家能理解吧?对吧?因为你,你,你后面不管生成图片是根据你的这个提示词,对吧?你提示词生成的好坏,对吧?决定了你视频生成的一个好坏, 大家能理解了吧?所以你看没有他,他这个他的这个重要性不言而喻,所以我们花的时间就比较久一点,我们讲的细一点,让大家能够更清楚, 来,我们继续,那我们现在有了,对吧?一号这个大模型的这个员工,有了一号大模型的这个员工之后,接下来我们来进行,对吧?我们,对吧?第二个员工就是我们的这个生成图片,生成图片 我们直接打开选中我们的二号员工,我们来对他来进一个配置,来对他进一个配置。好,大家会发现,那我们的二号员工就是我们的生图的,首先我们去选择我们的生图模型,首先我们去选择我们的生图模型。 啊,那我们的这个深图模型,那个墨雨,墨雨,墨雨爱这个伙伴,刚才我说这个大模型这块能,这个就把你刚才没有看到,能理解吧,对吧?就是你,你这么长的这一段话怎么来的?应该能理解了吧? 点这个自动优化提示词帮你去转化的,你,你首先得得要把你那个,对吧?你想干什么表达清楚了,说明白了,然后呢去优化一下就可以了,好吧?来, 好,那我们首先去选择一个生图的模型,那在这里呢?这里头这个模型跟我们这个刚刚一号员工的那个大圆模型就不太一样了,刚刚是 deepsea 豆包是什么?对,是帮我们去生成文字类的这些模型,对不对? 好,那我们在这里这一个是什么?这个是帮我们去生成这个图片的生成图片的,所以这些都是生图的模型,我这里我一般就是用这个通用 pro, 我 一般比较喜欢用通用 pro, 一个是它生成的效果 还非常不错,而且它的性价比非常好,价,价格比较低,对吧?好,我们就选用它,然后呢我们再去这个选一个比例,我们就选一个九比十六吧,对吧?这种竖屏的一个比例,如果你要选横屏的,你要选横屏,你就,你就用这个十六比九,用十六比九,好吗?对, 好,我们这里选择一个九比十六,然后呢把生成的这个质量拉高一点,拉高一点。好,好, 对,拉的越高,你生成的这个图片质量肯定会越高,肯定会越高,对吧?当然你生成那个时间也会也会变长, 好吧,好,那在这里呢,我们继续往下配置参考图,这里我们没有用到,我们没有参考图,就是说什么呢?就是说你添加就把根据你你的这个图片来去生成另外一张图片,就是图身图的一个功能,我们这里没有用到,我们用的是什么纹身图,对吧? 好,通过输入的文字来去生成图片,所以我们在这里输入这块,对吧?我们要添加一个什么?点击这个加号的按钮去添加一个, 对吧?添加这么一个变量,那这个变量就是我刚刚说的,对吧?输入的这个原材料,对吧?输入的这个原材料,我们来对它进行一个配置,我们来对它进行一个配置。好,怎么配? 很简单,点击这个小齿轮的按钮,点击这个小齿轮的按钮,好,我们对吧?可以看到开始和几这个一号员工,我们直接打开我们的一号员工的什么这个, 对吧?你可以看到有三个输出的这个输出的这个这个变量,一个是什么文案,然后第二个是图片的提示词,对吧?第三个是什么视频的这个动作提示词。好,来大家这个跟我互动一下,来,我们这里需要配置哪个? 需要配置哪个?可以在公屏上打出来配置哪个,是不是配置第二个呀?图片的提示, ok, 好, 我们直接选中我们的二号,这样我们就拿到了这个,对吧?拿到了这个图片提示词, 我们直接在这里进行一个引用,在正向提示词这里进行一个引用。好,怎么引用?好?摁住 shift 键, 然后呢?是不是就打弹出这个大括号了,摁住 shift 键打这个大括号,就会弹出这个变量。好,我们把这个对吧弹出的这个图片这个给他引用到这里,点击左键,好,那我们就这里就拿到了,对吧?就拿到了这个图片的提着词, 好,然后他就可以,对吧按着这个提着词,根据这个对吧给到大模型,让大模型按着这个提着词去生成图片了,就生成图片了。好, 到这里来到这里咱们的整个的深图的配置就搞定了,我们继续,我们来对我们的三号员工,帮我们深视频的这个员工来进行一个什么呢?来进一个配置了。好,大家可以看到这个就是我们的这个深视频的一个员工,对吧? 你会发现三号的这个圆框有两个,一个是什么?一个是这个两个一个是纹身视频,一个是图身视频,对吧?好,纹身视频什么意思?顾名思义,通过文字的描述,对吧?来直接去生成视频,好,那它的优点就是因为 文字描述他都是比较什么比较随意,就比较有创意,对吧?比较有创意,所以他能够生成一些非常有创意的一些视频,对吧?非常这个天马行空的一些这个视频,这是他的一个优点,但是他的缺点是什么呢?他的缺点就是你可能需要通过大量的什么,大量的这个抽卡, 对吧?然后呢他会,对吧?因为因为什么呢?因为你生成这个你的文字的描述,他一定是这样的,他他 不稳定,对吧?好,对,你的这个文字的这个要求就会比较高,提示词的这个要求就会比较高。好,那我们的这个第二个图声视频呢?图声视频是干嘛的? 对,图声视频就是通过图片去生成这个相应的一个视频,那他就相对比较稳定,不需要你大量的抽卡,对不对?好,那我们尤其对于我们的这个新手,对吧?初学者来说,我们一般我们就直接选用图声视频, 这样的话会减少你大量的一个抽卡,对吧?它的概率就会大大提高。好,那我们选图中视频,我们来对它简单的一个配置。好,首先你看这是什么视频的生成模型, 对吧?我们直接打开它,好,这个模型又跟我们之前的那个又不太一样了,跟 deepsea 跟豆包,对吧?那是大语言模型,我们的二号员工是什么呢?生成图片,我们选择的那叫什么?那叫生图的模型。好,这里我们选择的是什么?我们选择的叫做视频生成模型,对吧?好,那它这个就简单,就两个, 就两个你需要做的,对吧?你就选其中一个,那这个是 light, 对 吧? light 模型,这个是什么? pro 模型,那这个就是 相对便宜点,对吧?那这个就是贵一点,深层的效果会比它好一点,这里我选择这个便宜点的。好,主要是给大家去演示啊,然后分辨率三个分辨率最高的幺零八零 p, 现在目前这块它最高就幺零八零 p, 然后四八零,对吧?七二零。好, 然后时常是一个只有两个,一个是五秒的,生成五秒的一个视频还有一个十秒的。好,来讲到这里呢,我给大家看一下我们官方升视频这个插件的这个成本是多少?然后大家自己去生成视频的时候,大家心里也有个数啊,你们去看一下他的一个升视频的一个成本还是比较, 对吧?高的生成幺零八零 p, 五秒钟的一个视频, light 模型是二十五万的一个 talk, 相当于多少呢?相当于是两块五,那 pro 模型相当于多少?三百六千三千六百个字样点就相当于三块六, 好吧,这是他的一个生成视频的一个成本。好,那我们现在选的这个,对吧?最低的这个要要求的一个最低的一个大概的成本是在五毛钱左右,五毛钱左右。 好,那我们这个就选完了之后我们来配置这个参考图片啊,参考图片,参考图片在这里呢,来,大家注意看我们的手帧图片,我们点开这个小齿轮的配置按钮,我们,对吧?我们去选择一下我们的二号员工,二号员工是什么呢?在这,对吧? 对,这个 date 就是 存的什么放的就是我们的这个,这个,这个,这个图片图片,对吧?好,我们把它配置给他。好,那这里呢?伪真跟参考图,对吧?咱没有,因为咱们就一个二号员工申图的,对吧? 好,所以我们这里没关系,我们这里可以不用去配,他,照样可以生成视频。当然如果你想进一个控制想生成的整个视频的这个生成的一个 结果,是按照你手针跟尾针去生成的一个这样的一个结果,你需要去这么控制的吗?你需要给他一个尾针的图片,对吧?那我们在这里有个手针就可以去生成了,让他让他去去根据自己的一个 大模型生成这个视视,生成视频,生成模型自己去发挥去生成,好吧?好,那 我们这个图片就配置完了,接下来我们要添加输入,这个输入是什么?对,输入的就是我们的视频的这个动作,也就是我们常说的运镜,你要让这个图片怎么动起来,怎么动?好,所以我们在这里添加一个输入,输入的就是我们说的什么运镜动作,提示词在哪? 从哪去拿,是不是我们的一号员工,对吧?我们的一号员工这里都有三个变量,前面两个我们已经用过了,对吧?一个是写文案的,一个是帮我们去生成图片体式词的。好,第三个是什么? 第三个就是我们需要的这个视频的动作体式词,也就是我们的这个运镜,对吧?让图片怎么去动?变成一个视频,好,我们去把它进一个配置。 ok, 好,我们点击左键给它进一个配置。好,那这样我们就拿到了什么?拿到了这个运镜,拿到了这个视频提示词,然后我们在哪?好,我们在哪?我们在这个提示词这个部分,我们在提示词这个部分, 我们直接把它引用进来。怎么引用?摁住 shift 键打出大括号,它就会自动弹出这个变量。好,我们把它引用到这里。好, ok, 把它引用到这里。好,这样我们就拿到了,我们就拿到了这个视频的这个动作提示词。好,他就会干嘛?就会结合这个图片给到这个生成视频的这个模型,帮我们去生成视频了, 帮我们去生成视频这个就是他整个配置的这些这些参数我们就配置完了,好吧?输出,输出这里我们不要配,不用配置了,输出他这有一个默认的固定的一个什么微丢的一个输出,他就是输出的是一个视频的一个 ui 地址,对吧?你点开他,你点开他就是你的这个视频了。 好,那这样我们整个的视频我们三号就配置完了。好,来,大家有问题,我们先跑一下吧,跑的过程当中我给大家回答一下大家的问题,好不好?来,因为跑正好需要这个工作,需要这个时间,我们正好边边边跑这个工作流,边给 边这个回答一下大家的问题。来结束的这个节点我们来配置一下,我们去比如说你要输出这个一号的这个文案,对吧? 然后呢你还可以输出其他的一些这个,比如说这个图片,你想输入出来,或者说最后的一个视频,你想输入视频这个微调,就是这个这个地址,视频的这个地址,好,这样我们整个的这个工作流就生成完了,就就就就就搭建完了啊,就搭建完了,好吧?好,我们搭建了,我们搭建了 快一个小时了,当然你如果真的自己去搭的话,可能五分钟,对吧?十分钟就搞定了,那我们主要给大家,对吧? 把中间的一些细节给大家讲的非常细。好,我们直接点击这个试运行来打给我一个主题,给我一个主题,我们让他,我们来跑一跑,对吧?我们搭了半天的工作轮,我们来跑一跑,看一下效果。然后呢对跑的过程当中我来给大家回答一下大家的问题, 大家有问题的可以把你们问题打在公屏上,我一会来给大家统一的去回复一下,来给我一个主题,有没有的?我们去生成一下看下结果。大家给我一个主题,有没有主题,随便随便,因为我们这个,我们这个不调不调,没有,是吧?没有,我自己写了一个,比如说这个 跳舞的古代,好,我们我们就这样,我们直接点击视频,行,我们来跑一下,好,跑的过程当中,然后大家这个我来回答一下大家的问题, 好,我们来看一下是不是一个一个,这个我写的是一个跳舞的女女子,对吧?这是一个跳舞的女子一个场景,他怎么为什么是这样的一个场景呢? 他一定是根据我的提词词走的,我们来看看一下他的提词词是什么就知道了。在这里是不是根据你的提词词去走的? 风格是国风,写实的风,对吧?主体一位穿着红色古装翩翩起舞的古代女子,对吧?场景是在古代的庭院中,石桌旁边,周围有盛开的花朵和随风摇曳的柳枝,是不是这个场景 是吧?好细节,女子的发丝随风飘动,群摆这个,这个飞扬。好,这是细节的一个描述啊。你再去看这张图片,是不是按照我们的提示词去生成的,没问题吧?一定是这样的,一定是这样的, 我们再来看一下视频。好,视频在哪?在这,我们再去看一下,点击他,然后呢去播放一下,看一下效果。五秒钟的,五秒钟的一个视频帮我们切了三个,三到四个这个分镜头,三到四个分镜头,所以 你看没有,他一定是根据你的这个运镜走的。视频的,这个提示词在哪?我们再去看一下。呃,他这个确实有点多了,在哪?在这 四个镜头跟我说的没错了,四个镜头,其实你这里可以给他限制一下,在你生成视频动作提置词的时候,你就说跟他说,对吧?五秒钟的这个视频,你就帮我生成两个分镜就行了,因为四个分镜明显的感觉到这个,你说五秒钟的这个切的太快了,大家能理解吧, 对吧?切的太快了,所以我们五秒钟要两个镜头就行了,两个镜头足够了,这个四个镜头就太快了,你看第一个镜头对吧?你看一下他运镜怎么走的?推,镜头从古代庭院大门推进,展现整个庭院的景色,最后聚焦在跳舞的这个女子身上, 是不是?大家回忆一下,是这样的,好。然后呢?镜头二是平移镜头跟女子这个舞动,展示他全身的一个动作和优美的舞姿,对吧?好。第三个镜头是固定的镜头,拍摄女子灵动的眼神和精致的妆容,对吧?好。第五四个镜头是 镜头拉远了,展示女子和周围环境的一个融合,最后定格的一个画面,画面定格好,我们来再看一下这个视频,对吧?我们再来看一下这个视频的一个效果,你们再去结合他的一个刚才的一个运镜,是不是?是不是按照我们的这个运镜啊?这这个四个运镜去生成的,你们去看一下,你看 是吧?特写,然后拉远定格,对吧?没,没问题吧?虽然他很快,他的这个效果很快,因为他就是这样吗?我他四个镜头吗?切的太快了,但是他是完全遵循什么? 遵循我们的这个提示词去生成的,对吧?生成自媒体这个素材内容的一个完整的,对吧?完整的一个工作流就答完了,大家不要看他简单,你把这几个模块学明白了,你后面做很多的一些这个这个自媒体生成自媒体内容的,其实 说白了什么呢?你就可以举一反三了,对吧?你就可以拿它来举一反三,或者说拿它来照猫画虎了。你把这个搭完了之后,你可以延伸出做很多很多其他的一些这个这些这些内容,可以的,好吧?比如说你在这个基础上, 对吧?你要,你要去加声音,加字幕,对吧?加其他各种什么元素可以了?好,这个视频,这个整个的工作流就给大家讲到这。

二零二六年之后的亚马逊卖家只会划分为两种,一种是会 ai 的, 另一种是不会 ai 的。 这可不是大放厥词,就拿现在的 jimmy 三来说, 深圳有家大卖公司已经拿它充当核心生产地了,并且已经得到了数据验证。大致的玩法思路就是搭建 jimmy 三、智能企业 通过特定的指令投喂并训练,让其能够真正理解目前亚马逊搜索算法 cosm 与推荐流量入口 lufos 的 核心机制。我拿到了这份亚马逊大麦内部的智能体搭建 sop, 先是彻底拆解 a 九、 cosm、 lufos 三大算法的核心,再是分布讲解如何搭建智能体,接着设置你的智能体, 最后教你如何把控 ai 合规边界。这份机迷你三、智能体搭建 sop 我 都整理好了,里面不仅有详细的搭建步骤,还有整套能直接落地的指令池,搭建成功后三十秒就能生成一套直击痛点、合规又懂算法的 listing。

相较于像 cursor, anti gravity, 甚至 kynda 还有其他的一些 ide 编程工具的话呢, chris 国内版确实是弱了一些,但是人家不收费啊,而且这半年进化还是蛮快的,整合了像,呃, g m 四点七啊, mini max 二点一啊,甚至呢,还增加了这个 solo 的 solo 模式。 所以整体来说,翠开发一些中小型的应用是足够的。有一些朋友说,翠呢,刚开始是正常的,然后呢,越改越乱,改到最后项目都被废掉了。 呃,实际上这里边呢,其实多方面的原因啊,我总结,比如说你有没有配置智能体啊?呃,再一个,比如说,你 打假如需要云端开发环境,甚至对数据库与函数进行配置的时候,你有没有去配置这个 m c p 啊?还有就是像我们的一些个人规则和项目规则,你有没有去制定啊? 那这些都是约束呃, ai 在 开发过程当中的一些原则性问题的,它能够有效地改善你的开发错误率,甚至呢,现在我们还可以给它创建这个 skill, 就是 能够节省你的 talk 使用量,甚至让整个开发的效率更高。 翠的国内版的这个 solo 模式其实挺好用的,比如说你已经开发完的一个项目,那么你可以给他制定若干个任务,比如说对页面的一个优化呀, 对数据结构的优化呀,甚至包括对其他的一些体验感的一个优化呀,甚至包括 api 接口的一个调试啊,通过通过它都可以完成。而且呢, solo 模式在这里是可以同时调用好多个智能体来联动的,效果非常好。 总之啊,翠目前是不收费的,相较于其他的动不动一个月二十甚至六十美金的一些 id 工具来说,我认为他满足一些中小型的应用开发已经足够了。 那像网上有一些人一个月交二十美金,甚至说是五十美金,你用完之后你会发现一个问题,就是你的使用量会超的,那超了之后怎么办呢?其实你还是要继续交费, 如果是公司付费的一些项目呢?当然没有问题啊。如果是对个人来说,在你没有接到一些收费比较高的项目,或者说没有项目的情况下,仅仅是学习阶段的时候,每个月付几十上百美金其实没什么必要。 这个界面呢,是 pixel 制作完的一个 ui 界面,我转译过来的,然后我们现在给吹一段提示词,看它 优化的结果如何。然后在这里大模型呢,我选择这个 auto, 因为这里边其实你看有 g m 四点七和 mini max 二点一,都是在全球排名比较靠前的一些大模型了, 很快它就完成了这个修复。啊,那我们现在重新点击一下这个编辑,你看 整个页面的布局和细节,他都做了一些调整,甚至包括按钮的位置都给你重新的排放了,然后这里的调用地图也也完整的解决了。所以 我不知道为什么很多人说用这个翠感觉很不爽我,反正我开发很多项目,我觉得还可以,确实是效率上要比其他的一些国外的这个 id 工具确实差了一些,但是总体上满足一些日常的小项目的需求来说是绰绰有余了。 在视频的最后呢,回答上一期视频粉丝们比较关心的一个技术问题就是如何把在 pixel 里边设计好的一个 ui 界面导入到项目里面进行开发。 首先一点呢,我是建议啊,大家在这里选择 react 模式,而不是选择 html, 因为 react 生成的这个界面的结果它是加了交互的。 生成完成之后呢,我们在预览这个界面啊,实际上还有一个代码模式啊,然后在代码模式的这个位置有一个下载按钮,我们登录, 登录完之后呢,我们要把这个下载下来的文件包解压,解压之后呢,把它导入到这个项目的根目录下, 然后呢,我们把这个文件夹直接的拖动到这个对话框当中,然后再给他写一段提示词啊,当然你后面还可以要求他的风格,比如说 td design 啊,或者说微信小程序的一些原声的一些规范要求啊等等。 这样的话呢,你再去点执行它最后生成出来的可运行的这个交互界面呢,离你设计的界面来说大概有百分之八十到九十的一个接近度。 然后你再去网上找一些 icon, 然后替换掉页面中缺失的一些图标,甚至包括一些颜色的搭配。 呃,用不了多长时间就可以把整个页面的构建工作给完成了,这是我在 pixel 设计的,然后这是在 那个 tree 里面生成的啊,其实除了我自己添加的一些修改之外,本质上没有什么太大的一个区别。好,这一期视频就是这些问题,然后有任何的建议想法需要交流的都可以在评论区留言。

二零二六年全网爆火的 ai agent 的 skills 最全操作文档,从 cloud skills 到 open ai skills, 再到 tree skills, 再到扣子 skills, 从收费的到免费的,从配置网络环境,再到一键操作使用,所有的操作步骤我全部都写在这个飞书文档了, 需要的兄弟们说一下,直接拿去来我们看一下我们这个操作文档,从 agent skills 方法论,再到 agent skills 的 配置环境,再到跨平台需要专线上网,再到 吹 skills 免费版,再到扣子 skills, 这个叫傻瓜式一键操作,全部都总结处理好了,现在呢,我们一个一个的来看。 首先这个 a g 的 skills 是 什么?全网都在吹这个 skills, 其实一句话总结,所谓的一个 skills 就是 一个技能, 一个技能呢,其实它就代表了一个智能体,然后呢,我们可以把多个智能体,也就是技能放在一个对话框里来同时调用,而且都是自然语言调用, 就特别方便。以前就比如说我们是润色文案,一个智能体,写爆款标题,一个智能体, 封面文字一个智能体,现在呢,只需要一个对话框,这三个技能呢同时调用,这是它的最牛逼之处。还有一点最强的就是它同时调用 python 脚本, 把外部的事实数据,不管你公司,比如说你如果是官方客服,你做一个 ai agent skills, 有 用户咨询你的货源,那你的仓库事实数据呢,就可以让这个 agent skills 事实调取特别方便。 它呢可以说是集合了以前的 prompt 提示词,再加上 m 四 p, 再加上 api 调用,脚本调用,这样一把它封装成一个一个的技能,让 ai 呢,就是在我们规定的范围内,自然语言一步到位 输出来,我们直接先看效果,你看我们左边这里,这做了三个 技能,第一个技能呢就是 news hotspot, 就是 新闻热点实时抓取的一个技能,然后抓取完之后呢, 再把它新闻热点提炼,提炼完之后,你看下面这个技能呢,根据新闻热点,润色文案,再写爆款标题。这是三个技能,但是呢,我这里是同时一个对话框就可以完成了。以前你的一个智能体,他只能干一件事,现在呢, 直接三件事,一步到位。看这里就一句话,让他帮我总结搜索最近 ai 领域热点新闻,然后提炼总结,生成一篇爆款短视频文案,以及三条爆款标题。 首先先调用了这个热点搜索的这个技能,他实时抓取热点,然后呢,搜索总结完之后呢,再写 润色文案,再写标题,就是三个技能,他会就是一步完成。你看,根据要求,已搜索二零二六年一月 ai 领域的最新热点新闻,并严格按照 这三个技能规范来生成内容。你看 ai 劲的革命爆发,二零二六年被定义为主动智能体元年,下面写的爆款短视频文案 以及爆款标题,要想搞清楚这个 skills 具体怎么来操作,怎么玩转它,我的文档呢,详细总结了 skills 的 一规范和特性, 你看它的方法论。首先呢,它就是比以前的单个智能体呢更省 talk, 也是更省钱了,说白了还有它架构模型,三层原数据 指令,包括它的资源,它包括它生态位对比、 skills 提示词和 m 四 p 工具调用、 ai 交互, 这三者的关系总结的非常清楚,其实最核心的就是它的一个原数据,一个是它的指令,那它这个指令呢?可以理解为就是我们现在的提示词。然后这个资源呢, 可以理解为他的参考文档,他的素材,他的脚本。比如之前我们润色文案的时候,里面要写开头勾子对不对?中间勾子,结尾勾子,那这些东西呢?以前直接写在一个提示词内容里面,他就非常费滔肯,现在呢, 它就把这个提示词给分层了,这一部分分层之后呢, ai 它调用的时候只调用一部分,它不会全部调用。还有一个最重要的更新就是这个脚本,有了这个脚本呢,它就可以打通和外界的数据沟通。就像刚才 我们看到这个例子,他实时抓取 ai 新闻并总结,然后写文案。当然同样道理,如果你是智能客服,问某一个商品库存还有没有剩多少,那他就可以实时抓取到你公司的后台的 erp 系统, 实时调用真实的库存,然后来回答用户的问题,就真正的做到了放手让 ai 去帮你干活。而且你这个技能呢,从指令到参考文档到素材到脚本, 它是一个标准化的封装程序,就像 cos 工作流一样,它是严格按照你这个执行的, 他不会有任何偏差,这就是 ai 进的真真正正的落地的最后一公里,你看适用场景,高频重复,每天每周都要执行的固定流程,多步骤操作是获取信息、处理信息、输出结果和发送通知, 多步骤闭环任务,还有专业的特定的行业标准,如财务分析指标这些等等,包括避坑指南,也给大家总结好了,只要按着操作就行了, 因为当你真正去涉及到一波技能调用的时候呢,它有些可能调用不上去,或者调用了之后呢,它里面规范的技能呢, 它没有完全执行,那这个时候呢,就需要一些约束条件,严格按照你的 skills 的 技能规范来执行。 下面呢,第二部分呢,这个就是 cloud skills 的 需要专线上网,因为这国外的环境配置,具体怎么操作我就不这里就不详细展开了,要有一定代码基础的人才能操作轻松一点呢,一个是扣子,这个是傻瓜式操作,还有一个就是 tree, 这个是安装在本地部署的,本地部署呢,需要一些代码基础才能搞定,要求呢稍微高一点点, 当然也不用担心,我这个文档呢,也详细总结了,操作步骤流程都在这里,包括你如何使用别人的 skills, 比如这个 get 仓库,这代码人员的天堂, 直接从这里面怎么去找官方的 skills, 然后怎么下载,然后怎么部署到你的本地,就这个翠详细的操作文档都在这里 下面呢,我们来说一下这个扣子,你看这里我总结了一个文案润色的技能,你直接一句话跟他说就行了, 根据用户输入的话题,或者对标的文案或者新闻热点进行文案润色,二创成一篇爆款短视频文案扣子,他就会自动给你生成一个 skui 技能,然后这个技能呢,你可以去测试,如果你觉得它测试的不够好呢?你看比如这里开头钩子不够好优化开头钩子爆款短视频文案 最重要的标准就是看开头有没有开好,开好了就成功一半,就是一点点的去 优化你这个技能的输出结果。那具体这个怎么去跟它优化呢?其实我们这里也有一套完整的 sop 流程,都在这个文档里面 写的很详细了,这里我就不展开了。想深入使用的话,扣子平台的 skills 呢,他只能用豆包模型,大家懂的都懂对吧?那想要效果好, 那你必须要懂一点代码技术,可以使用最牛逼的大模型,后边我会出一系列的 skills 具体应用场景的教程。其实 skills 核心就是提示词加脚本, 就是解决了以前的智能体只能处理文案, minus 呢,只能调取数据,这里呢,他直接把这个两方面给结合了,更高效、更规范、更落地。然后需要这个详细操作文档的说一下。

警告!本视频带你一口气搞懂智能体!带你从零到精通的搭建企业级智能体,让你无痛入门智能体! i think the one biggest benefit of agentac workflows is that allows you to do many tasks effectively that just pcu were not possible, but there are other benefits as well including paralysis that lets you do certain things quite fast as well as modularity that lets you combine the best of re components from many different places to build an effective workflow to stick a look my team collected some data on a coding benchmark that tests the ability of different oms to write code to carry out certain tasks the benchmark news in this case is called human yval and it turns out that g p 3.5 this is a model that the first hopefully available version of chat g p was based on if asked to write the code directly to just type out of computer program gets forty percent right on this benchmark this is a positive metric gpd four is a much better model this performance leaves the sixty seven percent with this also non agnetic workflow, but it turns out that as large as the improvement was from gpd three point five to gpd four that improvement is taught by what you can achieve by wrapping gpd three point five within an ajax workflow using different ajax techniques which you learn about agent's course you can prompt gpd 3.5 to write code and it may be perfect on the code and figure out you can improve it and using techniques like that you can actually get gpd 3.5 to get much higher levels of performance and similarly gpd 4 used in the context of an ajax workflow also does much better so even with today's best lms and ajax workflow lets you get much better performance and in fact what we saw in this example was the improvement from one generation of model to another which is huge is still not as big a difference as implementing an agented workflow on the previous generation of model another benefit of using agented workflows is that they can paralyze some tasks and thus do certain things much faster than a human for example if you ask an agent to workflow to write an essay about black holes you might be able to have the oms run in parallel to generate ideas for web search terms to type into search engine based on the first web search it may identify say three top results to fetch and based on the second web search should be identify a second set of web pages to fetch and so on and it turns out that whereas a human doing this research would have to read these nine web pages sequentially or one at a time when you're using an agent work though you can actually paralyze all nine web page downloads and then finally feed all these things into an envelope to write an essay so even though agent work those do take longer than truly non organic workflows or by direct generation by just prompting a single time if you were to compare this type of organic workflow to how a human would have to go about the task the ability to paralyze downloading lots of web pages can actually let it do certain tasks much faster than the non parallel sequential way that a single human might process this data to build on this example it turns out one of the things i often do when building agent workflows is look at the individual components like the lm and add or swap out components so for example maybe i look at the web search engine i use up here and i may decide that i want to swap in a new web search engine when golden agent workflows are actually multiple web search engines including google which can access by serpher as well as others like bing dot go to village u com there are actually quite a lot of options for web search engines designed for arms to use or maybe instead of just doing three web searches maybe on this step, we can swap in a new news search engine so they can find out what's the latest news on recent breakthroughs on black hole science and lastly instead of using the same l on for all of the different steps i will often try out different large language models and maybe try out different l on providers to see which one gives the best result for different steps of this system so to summarize the main reason i use agent workflows is to just give much better performance on many different applications, but in addition it can also paralyze some tasks that humans will otherwise have to do sequentially and the modular design of many agent workflows also lets us add update tools and sometimes swap out models we talked a lot about the key components of building agent workflows let's now take a look at a range of agent ai applications to give you a sense of the sorts of things people are already building and the sorts of things you build a build yourself let's go on to the next video。 然后呢?我还要说一说啊,就是现在我们要用这些 agent, 是 不是咱们得去准备一些跟框架相关的东西啊,那框架这个东西该怎么去理解呢?其实啊,就是他咱们自己做事的时候啊,就是更多的时候我们是用人家的现成的。那 给他举个例子啊,就人家现成这些框架啊,比如说 auto gpt 啊,什么什么各种 gpts 之类的啊,现在框架我给大家这么说吧,就现在这个框架,我先简单多啰嗦两句啊,就框架好像用的比较多, 整体感觉就是大同小异,就是都是你说它好吧,它反正这块儿缺点东西,你说那个好吧,那块儿缺点东西还真没有一个就完全意义上我觉得非常好的,但是下期大家用的最多的就还是这个 auto gbt, 或者是这个呃,美团 gbt 之类的,这些就 get 它的 star 数是比较比较多的,而且就是大家用起来相对来说也是比较容易的,后续我们会给大家去讲啊, 然后再但是我给大家说一说感受,就是你不要觉得现在这些个开源项目这些框架哇,他就无敌了,他就是个 a 领,能解决的问题是很多的,即便现在啊就最强的,做的最好。这些框架我跟大家说一句实话,就是他能解决问题非常局限,他能把这件事做出来的可能性非常低。 就是说 a 领这东西啊,他还在一个发展的状态当中,他还是持续的迭代和更新的,他现在想让你去真的就是自动化的完成个东西, 大概率得到的结果是不那么尽如人意的,这点我希望大家清楚,还能说是不是因为套事你讲的不行,这玩意跟我讲没关系,这东西就是现在啊,人家做什么东西,我们没能力自己去开发你的基作模型,也没能力去涉及一些底层的架构,底层的工具去调用啊,就要用这些动作,然后怎么去处理这记忆,这 东西其实都不是我们去做的,我们是做一个使用者,怎么在人家的框架基础上啊?比如说新创建一个角色,新创建一种动作,添加一个 api 电话方式,我们是在人家基础上做一些增删改查的,但是现在说心里话没有一个框架我觉得真的是能满意的,真是要用起来的,无论是就是付费的也有啊,付费的那玩意我用了,我选了几家,我本来想讲的,但是我不说哪不说哪一家了啊,就是用起来 就这个免费的,就跟这个开源的我觉得没啥太大的区别啊,所以说框架啊,嗯,咱们就这么说吧,对我们来说就是个学习理解他们任务当中的一个流程,熟悉他,哎,是怎么定义的,逻辑上怎么去做的,好让我们知道 a j 的 整体的框架,咱们从一个输入到我一个输出,它具体流程怎么走啊?咱们理解这些个事,我觉得赞成足够了。为什么?因为我觉得工具这个东西啊, ai 这里面现在更新换代的非常非常快,你现在就是即便你把这什么 auto gbt, 没 gbt 你 熟练掌握了,可能用不了半年,一个新的框架又出来了,一个新的框架可能又是一个颠覆性的超越,又完全碾压了前面这些框架。这些事是都有可能的,因为我每天都在看新闻,每天有都有朋友问我老师新出的框架我要学,新出的东西我要看, 给我的感觉我快麻木了,就是框架实在太多了,咱们去理解去用就行啊。但是我估计后续肯定这玩意早晚都会被更新换代,早晚都会被替代掉的啊。然后我们来说一说框架当中啊,它其实这些东西啊,它帮我们实现了什么?这些东西啊,就是无论你用哪个框架,咱们都少不了一个东西,就是你得有这个 key, 咱们都得有这个 key 才是可以的。什么叫做一个 key 呢?我给大家举个例子,就是我们要调用一些基作模型,是不是啊?就是你要调用基作模型,这都不用想了,一般来讲就是 g、 b、 d 四啊,这个是最好的,基本上现在所有的这个框架都是要不三点五,要不就是四,反正就是 t、 k 的 价格有点区别啊。 那这边他可能说我换别的行不行,换别的还真不行,就是我我自己没尝试啊,但是我问了几个哥们,他们搞这些本地化的一些自由 a 阵的啊,他们他们给我的反馈就是在自己专业领域当中,他的这些能力 其实是本身具备的。你得这么理解,就是我是让啊,这个大模型做专门的一个医疗领域,做专门的一个什么法律,什么金融领域啊,就是个领域,我这个数据都问给他了, 但是他还是做不好,为什么?因为感知、思考、动作还有记忆这些个能力,是在这个大模型训练的时候他的一些基础能力,而不是说他下游应用的一些能力。 他如果说你的模型都不具备这些个基础能力,你怎么去做微调,怎么去下回任务是都不行的。所以这条路我估计大家可以把这条心死了,不要想着我自己去训练一个私有化场景,然后我用这个 a 神怎么样的?我问过好多人,这条路是都行不通的,都是比较差的。所以说业界啊,通常解决的是什么?就是花钱, 最佳撩发就是花钱,而且,而且咱们说这个,这个价格啊,这个价格你可想而知是非常非常昂贵的一件事。那这个框架当中它都帮我们去做了什么呢?其实就是这里边啊,我觉得这个框架当中啊,它都帮我们实现这个东西,就是啊角色,然后交互,然后还有这个 api 调用。我觉得就这几点, 一个框架当中,比如说 auto 或者 maggbt 里边,他会给你预定一些角色啊,比如说你现在是一个程序员,你的角色是什么?你现在是一个医生,你的角色是什么?你要做什么事?根据你不同指令,他会给你写很多例子的啊,在这个例子当中角色该怎么去定义 好?那就是交互,交互,就比如说你为了完成这件事啊,你应该跟谁做交互?程序员跟产品经理这样做交互,程序员啊,程序员就只跟他交互,产品经理跟谁交互,你的角色可以跟谁交互?那最关键的就是我认为框架啊,最大的一个核心,最大优势是什么?就是工具是现成的, 就比如这里边现在所有的工具给我的感觉都是这样哇,都是一个,就像个百宝箱一样,就是反正啥一遍都能用,我让他问天气也能,然后浏览网页就不用说了,用各种浏览器和浏览网页,用各种缩影器,他都能的。 所以说就用这些框架啊,是用人家给我们设计好的这些个 api, 这 api 有 多少种呢?嗯,咱不夸张的说啊,就上百种,肯定是打不住的。因为你要,比如说你要访问一些公众号啊,访问一些微信上的接口,那这个微信,这个公众号,那 api 多少个了?孩子去了,是不是你要你要再去查一些什么企业的信息啊?什么个人的信息,那这每个地方都有 api, 这些框架就帮我们写好了很多这样的例子,怎么去掉这 api? 说白了他再去执行这些个动作,就这里边啊,就是他把角色定好了,然后角色教会定好了,然后 api 调用给你了。那其实对我们来说就是现成的模板,咱可以直接用了,但是更多的啊,其实我觉着啊,还是希望大家怎么样?就是要这样 熟悉流程,然后我们肯定要做自己的事,你做的事,你不一定是开软件公司的吧?你肯定是有你的一系列人员,然后你们这些人他们做什么, 我们可以去模仿他们角色定义的方式,他们怎么交互的,以及人家这块是要列 a p i, 那 在我的任务当中,我可能会涉及到哪些个 a p i 呢?要把这些 a p i 的 一些更多方式我们给它加进来。其实这个东西啊,我觉着你觉得这个框架当中啊,咱们再理解说特别难吗? 我,我讲的课比较多,我讲算法、讲论文,讲项目、讲圆满,其实我都会觉得难度挺大的,但是这个框架吧,他这个难度还真不大,因为就是整体逻辑是比较简单的,所有东西都是调大模型生成的,他可能并没有太多跟算法跟数学啊,跟概概念相关的东西,其实都是什么,都是流程, 第一步干什么,第二步干什么,第三步干什么啊,都是流程怎么调 api, 然后反正调 api 也是现成的。反对我来说我,我就觉着啊,如果说我要用这些框架, 我无外乎就是盯好我的角色啊,然后我把我需要用的 api 给它加入进来,就相当于我可能不仅仅只有这些动作,我可能只有点特殊动作啊,我要这什么动作 把这些整理好,其实它的流程我觉得来说是非常类似的,所有里边核心操作都是把啊,就是通过你的角色获取到你这个人基础的一些啊,就就基础的一个命令和基础属性。然后呢去啊,根据你的命令当做提示调大模型,然 调好 a p a 之后呢,把 a p a 返回结果啊,建一个模型,然后生成一些记忆,然后再根据记忆再决定下一步怎么去走啊。这里我来说,我觉得就这几点吧,框架来说,嗯,就是特别多啊,这个这个到时候大家任选,你想要什么框架都行。我终于给大家列出来是我觉得 k 二 pro 当中输出比较高的,也是现在大家呼声比较高的,用的比较多的,我用了一下,我真觉得就是区别不是特别大,而且这东西安装起来比较简单, 但是大家发现一件事,就现在这些框架都是极简的,它不像是你几年前啊,你想跑个看像不?哎呦我天呐,几年前想跑看像不?你配个环境,你没个没个,两三天你配不出来,还得编一个整,这贼麻烦。但是现在呢?这里边 啊,你的配置极简单,就是我估计用不了半个小时的,一个时间你就可以把它给它配置起来,只要你有这个 key, 你 就可以很快上手,很快去理解它的流程啊,它的任务是怎么做的啊?反正这个框架我觉得用起来都不难啊。 a, 这当中都帮我把这件事做了一个简化,极简,你就可以把这东西用起。

兄弟们,现在是凌晨快四点钟,我用扣子结合目前最强的生图模型 banana, 搭建了一个智能 t, 能低成本的高效的生成电商主图和详情页,预估每年能帮我省二十万左右的人工成本, 电商不易,我也分享给大家这个视频,我会从零到一分享搭建的底层逻辑。 ok, 先给大家看一下我们这个工作流深层图的案例,这是第一个我一个手工编腾的一个产品百货里面的,还有这个是服装里面的, 都会非常的真实,还有这个是夏,就是夏天的纯亚麻短裤,还会出立体图,一次性也保持的非常的好。 然后跟着老邓的节奏,自己也能搭建出自己的工作流,因为老邓会讲的非常的细, 包括底层逻辑。我先给大家讲清楚,我们要根据这个底层逻辑去搭建,第一步做什么?第二步做第三步做什么?第四步做什么?第五步做什么?还有这每一步 为什么我们要去做?老邓在接下的视频都会讲的非常的详细,如果一遍新手一遍没看懂的多看几遍,自己打开电脑跟着老邓的节奏去,一定能搭建出自己的工作流。每一个节点我给大家都已经把提示词都优化迭代好了, 这是我优化的提示时,其实大家自己也可以去优化,老邓在后面的视频也会讲的很清楚。 ok, 咱们废话不多说,开始给大家进行一个实操,零到一,教大家怎么去搭建这个工作流。我们先打开百度搜索扣子, coc 一 扣子,然后百度一下, 这个就是我们最新的一个扣子官方平台,咱们点进去,现在扣子更新到了二点零,所以他扣子这个平台也在进化,我们用的智能体大模型都会越来越优化的更好。然后找到这个产品,选择扣子编程, 然后找资源库添加资源,这个地方我们添加工作流 名称,工作里的名称只能用拼音或者英文,我们直接就直接输入英文详情页制作,然后工作里的描述可以用汉语电电商 产品详情页 制作。 ok, 我 们点确认, 咱们就直接进入到了一个扣子的一个开发平台,这个平台是一个搭建平台,就是搭建智能体的平台,但是他不涉及到任何的代码,只需要你把每个节点捋清楚,整个业务逻辑捋清楚就行了。老邓也不是代码出身的,老邓是做电商的, 所以做了很多跟电商相关的智能体,然后这今天我们要做的是详情页,所以老邓已经提前在这文档把这个业务逻辑搭建的逻辑要怎么去搭建,一步一步老邓已经做出来了,我直接复制过来, 咱们把它加粗一点,方便大家看的更清楚。 ok, 我 把这个业务逻辑已经放过来,放在这个智能这个工作流里面。 第一步我们要去做一个详情页的一个提示词的一个设计,第二步就是专业提示词的优化,就是你是卖服装的还是卖汽车的,还是卖百货的, 然后我们再把它设计一个提示值的专家,把这个提示词给它优化好,更加适配这个 banana 插件去识别,去深图,主要是这四步。然后这个第四有一个这个地方,我在讲解工作流的中间,我会告诉大家为什么需要用到这一步。 ok, 咱们开始 第一步输入这个地方,我们只需要两个东西,第一个是标题,这个产品你要告诉大模型你这个是什么东西。第二步是图片, 然后这个地方大家注意一下,这个变量名只能用英文或者拼音,不能用汉文。这个地方还要注意一下,因为我们每一次去生成图片,我们要从多个角度对 产品进行一个拍摄,我不是给他一张图,我要给他多张图,所以要给他一个图片的一个树组,就要 arrange 树组,然后 file 里面找到图片, 这是两个必填的像,好, ok, 我 们第二步开始,我们拉一个大模型出来,这个大模型就是我们的一号员工。 ok, 我 们这个时候拉一个大模型出来, 这个大模型就是我们的一号员工,我们直接把这个给他复制过来,这个大模型他负责做什么?就是我给了他图,我给了他标题,对吧?他要把我生成详情页设计的提示词,他就是一个设计师。 ok, 我 们现在要给他进行一个技能的一个匹配。 首先我模型这个地方我们要选择视觉处理,要豆包一点六的视觉模型,豆包一点六他可以一,他可以识别图片信息,因为我们要给他上传很多张图片,不仅仅是标题,还要给他上张图片,对吧?然后输入这个地方,我们直接引用标题, 第一是产品名标题,对吧?第二是什么?就是我们的图片前面给他上传了这些图片,在这个地方给他引用进来,然后最关键的地方大家一定要注意系统提示时他是干什么的?我给大家在这解释一下,系统提示时他是 给这个大模型去做一个定位,就是你这个员工的只能是什么,对吧?第一,只能是什么?第二他的有哪些技能,对吧?第三 还要告诉他输出的内容要按我的格式,要让我看得懂。第四, 第四个就是他不能做什么,我们要给他一个员工守则,就是员工守则的意思,这就是系统提示词, 百分之九十以上的系统提示词都是从这四个维度去写, ok, 这个地方我已经把系统提示词已经是写好的,我已经优化迭代了很多次才写出来这个系统提示词,老邓就直接复制过来,在我那个文档里面, 你看我这个提示词,他是不是从这四个维度给大家看一下。第一,角色定位他是谁?他是一个电商详情页的设计师,对吧?第二, 他的核心技能是什么?是不是每一个技能都给他写好?第三,他输出的格式模板,要让我的模板,要让我能看得懂的模板给我输出出来。 第四,他的限制就是他的员工守则,对吧?然后这就是写提示词的四要素, ok, 接下来用户提示词,用户提示词,用户提示词就是一个资料, 你这个设计师他要根据什么去做设计,根据哪些内容去做设计,对吧?这个是用户提示词,然后我们只需要给他引用一下就行了,用户提示词把资料给到他,我们现在就两个资料, ok, 还有就输出这个地方我们一定要注意,我们是给了他多张图,第二我们要让他生成十二张图片的提示词,因为我每次生成图片不可能说只生成一张,那很浪费时间,我详情页我要很多张批 量化的给我去产生这个详情页,所以我一定要选 allure 矩阵的数组格式给我输出,然后异常处理,这个地方我们最好也是设计 六百秒,因为这种文字处理它时间会比较长一点,以免出现报错。 ok, 第一步的设计师已经就位,已经搭建好了。第二步, 我们需要一个专业提示词的优化,就说人话,就是我们需要一个某个行业的专家帮我再去优化这个提示词,所有的文案的处理,文字的处理,我们都需要用大模型, 这个地方我们命名二号员工,某行业专业 提示词专家,他也是一样的,这个模型我们也要用到大豆包的一点六的大模型视觉理解,然后输入这个地方上一个员工的输出给他拿过来, 再加上标题, 然后图片这个地方还是一样的,要用开始节点的图片,我们一开始上传的图片,然后这个提示词就稍微简单一点,老邓也是做好了,放在文档里面, 某行业专业优化提示词,然后复制过来。 这个地方大家一定要注意一下系统提示词的引用一定要是跟这个变量值一定要是一致的,要保持一致才能引用成功。所以我们这个地方稍微改动一下 标题,就是名字,然后这个地方也给它改动成标题,这个就是图片,然后结合标题。 ok, 提示词已经写好,然后我们引用进来,把前面的资料,这前面都跟大家说了,用户提示词就是给大模型的喂给他的资料。 ok, 输出这个地方还是一样的,我们是要批量生产图片,所以 array 要 string 异常处理,一样的道理,六百秒,以免工作流,他跑的时间太短,他就会导致报错。所以第二号员工,某行业专业的提示词专家,我们也已经设计好,接下来我们就要配置三号员工把提示词进行一个优化,他是一个提示词专家, 就是他懂大模型,懂插件,懂深深图的插件,深图的大模型需要什么样的提示词,所以这个地方提示词只要这个提示词,我们还是要用到大模型。 三号员工,提示词专家 专门把前面两个员工优化出来的提示词,再进行一个 简化,再进行一个优化,适合后面的插件去输入,所以这个地方我们就不需要再选择视觉大冒险,直接普通的文字理解的模型就行,所以这个地方输入,我们只需要从二号这个庄家这个地方把他的输出拿过来就行, 然后提示词这一块也比较简单,我直接复制过来就行。 ok, 然后用户提示词我们直接给他的资料,只给他这个资料就行了, 然后输出格式一样的,还是 orange 异常处理,因为文字工作它比较量比较大,所以一定要六百秒。 ok, 现在提示词已经通过层层的优化,用大模型去给它优化,已经准备好了,接下来 我们就要请出我们的主角 banana 去帮我们生成我们想要的详情页。 ok, 这个这个时候我们在这个地方直接给他拉出用到插件, 然后我这个地方把 banana 的 插件已经收藏在这个地方,没有的兄弟们可以在这个地方直接搜索这个 n a r 图片生成就是 banana 的 插件,我们直接把它拿出来,我们改下名字,五号员工, 真诚,图片, ok, 员工已经请出来,我们需要给他做一个配置,输入 key, 插件的 key 就是 米和 api 的 key, 然后每个人都有一个自己的 key, 然后提示词我们是要用它优化好的,就是提示词专家最后输入的提示词,对吧?然后图片我们要用一开始的图片,对吧?然后 它的图片的尺寸我们就选竖屏九比十六,然后它的分辨率我们就选二 k, 好,这个地方大家发现问题,这个显黄对不对?这就是报错,为什么报错?我们把鼠标悬浮在上面就能看到他这个提示词,他只接受讯,证明他每一次他只能接受一条提示词, 这个图片他要接收的是 arraystring, 他 只能接收链接形式的图片,他不接收 jpg 的 图片,他识别不了。所以这个地方我们先解决这个问题, 所以这个地方我们在这个地方要给他加一个大模型,要把图片转化为链接,转化为图片链接,让这个插件能够生成。所以咱们这第四步,这个地方为什么要加这第四步,就是这个原因,这就是脑邓 给大家去搭建这个工作流讲的非常细的原因,每一个节点都有它存在的价值,而不是说我凭空给他安插一个大模型放这里,好,我们直接在这里加一个模型, 这就是我们的四号 参考图转链接, 因为我们要让这个生图模型啊,这个生图模型去生图是一定要给他他图片的,你不给他图片,他是凭空去想象生成的图片,你绝对是不合适的,你绝对用不了。所以我们要先给他一个参考图, 给他个产品的图片是什么样子,细节什么样子,他才能够去把我们生成。最后我们需要的详情页图片和图图图片。 好,这个地方我们把四号员工再进行一个配置一下,也是一个文字处理,很简单,我们直接把图片给他扔进来,输入进来,然后提示词这个地方我直接已经叠带几遍,已经写好的提示词 也是在我的文档里面,我们直接复制过来。参考图片链接,提示词我们直接复制过来, ok, 然后用户提示词引用的资料还是这个,然后这个输出这个地方我们还是一样的要用 origin, 因为他只能接受这个 origin, 明白吧? ok, 好, 现在我们整个工作流已经完成了百分之八十,然后发现这里还有一个问题没有解决,提示词他也要 origin, 对 吧? 但是我不可能说你让这个插件一口气吃成胖子,我一次性给他十二条提示词,直接一口气给他,他做不到,他必须是你一条词一条词的给他他一张图片,一张图片的生成出来,然后再聚合变量里面一起把给到你。 所以这个地方我们要引出一个新的知识点,叫循环节点, 这个循环节点他就是一次一次把一条一条的提示词分批次的给到这个五号员工,让他去一次一次的生成图片, 他就是这样的工作原理,我们按住 ctrl, 然后鼠标点进来,把它拉到这个循环体这个框里面去, ok, 然后现在我们连线就要连循环,把它都连上,然后配置一下, ok, 你 看现在这个地方提示时它就不会显示报错,它是从循环里面处理的,因为循环先把那个提示词分成十二条,然后十二条一条一条的给到它,然后让它去生成,对吧? 然后 ok, 现在我们还要做一些尾部的工作,因为这个插件它是一个 api 接口,这个 banana 这个服务器不在我们国内,所以它会存在一点报错的概率, 所以这个地方我们要加一个选择器,他如果错了怎么办?如果对的又是怎么办?所以这个地方我们要加个选择器,如果我们把这个选择器配置一下,如果他输出的变量数据 为空,对吧?那我们这个地方要还要给他加一个备用元空,还是这个图片生成, 这个就是我们的六号员工备用深图员工 一样的给它配置一下 key, 还是用到我们之前的礼盒的 key, 要这个 key 的 兄弟们到我文档里面也有会告诉大家怎么获取 提示词,这个地方我们就要用到循环节点,还是一样的,循环节点和提示词图片还是用参考链接的图片,然后这个地方都是一样的,就是让他再工作一遍,就这个意思,如果报错的话就让他工作一遍, 好, ok, 那 如果这个选择器,否则就是他不为空,证明他有数据,对吧?就如果他有数据,我们就把它拿出来,就用到把它把这个数据啊全部整合一起, 包括备用员工,他最后生成数据,我们也要整合到这里面来,然后配置一下 这地方,我们直接把他的链接拿过来,整合过来六号的和五号的链接,只要他们生成的链接就证明有数据生成成功了,然后就全给他拿过来。 ok, 好。 循环体这个地方输出,我们就直接 用聚合变量的输出就行了。到这个地方其实这个智能体已经搭建完成了,但是我们还需要做一个事情, 做一个数据的去空,就是空数据,他报错的空数据,没有数据的我要去掉,方便我智能体给我反馈的都是实打实的数据,而不是说第一行有第二行没有,第三行有第四行没有这样的排列,我们看着会很不舒服,很浪费我们的时间。我们现在直接加一个 去空的一个插件就行了,用这个常用代码块,没有这个的兄弟们,直接这个地方插件这里收常用代码块就行了,我这个是已经保存的,然后用这个 list 去空的。 ok, 这个资料员我们把他的数输入数据,循环输出的就给到他,资料员帮我把资料再给我整合一下,对吧?然后到这个为止,我们整个工作流都已经搭建完成, 要结束这个节点,我们给他连上去,然后资料员给到我的数据, ok, 整个工作流兄弟们已经搭建完成,应该不难吧?兄弟们, 如果还有没有看懂的兄弟们,可以多看几遍我的视频,你一定会有收获。不仅仅搭建这一种工作流,你后面的工作流你用这个逻辑去搭建,你都能够自己得心应手的去搭建。 ok, 现在我们试运行一下我们的工作流,刚刚搭建好的, 然后用我们的菜篮子同时上传就行。标题,菜篮子, 然后点是运行,你看就他开始一个一个去跑,一个模型一个模型的去跑。 ok, 已经运行成功了,给大家看一下,他最后会在这个结束这个地方输出出来,我们点一下是不是效果非常的好, 是不是效果非常的好,兄弟们, 而且一次性保持的很好,我只是几张简单的白底图,在这地方给他输入的是两张简单的图,非常简单的图, 包括细节都给了他,他就给我生成这样的图片,这个生成时间只需要几分钟的时间就可以给你生成,而不是需要你花大量的时间和精力成本,还有金钱成本去做图。所以说为什么 现在 ai 真的 能实现降本增效? ok, 今天的视频内容就到这里,还没学会的兄弟们自己把视频来回看两遍,你一定会搭建的,这个是零代码基础就可以学会的东西。老邓也不是一个代码专业出身的人,老邓是以前干电商的, 然后现在通过这些 ai 智能体把我的电商业务很多成本都降下去,现在电商确实难做,这一点不可否认。那只能怎么办?现在市场这么卷,我只能把成本降到更低,才能实现那么一点点的利润, 我后续还会出更多的跟电商有关的智能体给大家分享。记得关注老邓,下期再见。

一条视频教会你 ai 智能体搭建教学,本视频共计一个小时四十六分钟,一口气把所有按钮详细解读给你, 这是一个超级保姆的扣子智能体教程,特别适合零基础的小白。一个视频教会你我们第一步先开机,开机之后给你的电脑连上网络或者 wifi, 我这里用的是苹果电脑演示啊,当然 windows 也是可以的。我们第一步先打开浏览器,如果没有浏览器的话,给自己的电脑先下载一个浏览器,我们最好用谷歌浏览器打开浏览器,在这里搜索扣子, 我们会看到有一个扣子点 cn 进去之后,这就是扣子的一个自媒体开发平台的一个网页啊, 从这个网站上我们能看到什么呢?这里空间扣子编程调试工具,代代码开源以及客户案例。我们主要用的就是两部分,一部分是扣子空间,一部分是扣子编程,如果是智能体工作流的话,我们主要使用扣子编程。里面 我们第一步打开扣子编程,在这里给大家介绍一下扣子啊,扣子的话它是字节跳动公司的,就是适合零基础搭建智能体的小白, 我们这里不需要学习编程啊,直接可以上手。我们看这边,这就是扣子的一个开发平台的一个界面,扣子编程这里我们暂时用不到,因为它现在是一个等于是在攻克,这也等于是在公的公开测试啊,就是效果还不是太好。 这个界面的话我们可以熟练一下,或者是直接返回旧版,回到旧版的话,这个界面就更加直观一点,主要是扣子 这边是扣子的各个空间,然后下面是一些按钮。第一个是主页,主页的话我们可以看一下这边,比如说你关注了一些大 v 的 话,都会在这边显示出来,以它的一个状态更新。 然后第二个是项目开发,这里面呢?第二个是项目开发,这里面的话就有很多智能体啊,如果你没有的话这边是空的啊。我们再看第三个,第三个是资源库,资源库的话就是一些工作流,工作流自助库、卡片提字词数据库、音色记忆库这些, 我们重点用到的是工作流,这里面会你搭建的各种工作流会在这里面显现出来,把工作流合成智能体之后,就会在项目开挖里面出来这些,这些就是搭建好的智能体, 我们再看任务中心这边的话就不用管啊,还有这个效果测评也是用不到的。下面是空间配置,这里的话就是我们新建的空间可以邀请不同的成员进了啊,比如说你把公司的一些团队都可以把他们邀请进了, 这样的话他们又可以在这个空间里面使用你的一个智能体。 我们再往下看有个模板商店,这里面的话有一些固定官方搭建好的模板,这里面可以直接使用啊,可以复制到自己的空间或者是什么呢?有些是付费的,付费的话我们就要打开之后他会显示你购买,比如说像这个, 这个卖了五千,然后三十九块九一个,就是你搭建好的这种体,可以在模板商店里面进行出售。 我们再往下看有个插件商店,插件商店就是我们用到会比较多的,比如说一些生图的插件,对吧?一些视频的插件,剪辑的一些插件,还有一些是呢思维导图的插件,新闻的插件, 我们最下面的话是一个,我们再看一下,最下面是一些作品社区,这里面有一些可以用啊,其实就是可以看一下,没有多大的用途。 下面呢下面一个是作品社区,我们可以进去看一下,这里面有一些搭建好的这种体,我们都可以去试用,比如说我们随便点开一个,你可以到里面看一下这些这种体该怎么使用啊? 右边的话就下面是作品社区,我们在社区里面可以看到一些搭建好的智能体,当然有些的话用途不大, 咱是从零代,大家怎么搭建这个智能体?我们现在点开这个创建,那这里是不是有个创建,创建里面是不是有两种,一种是创建智能体,一个是创建应用, 这两个有什么区别呢?智能体的话我们比如说可以发布到飞书,发布到豆包或者发布到,嗯, 创建智能体这个有什么作用呢?比如说我们可以把它创建好的智能体发布到飞书上使用,或者发布到豆包上使用。创建应用的话,它就是可以封装成微信小程序,比如说封装成把你的智能体封装成网页或者是小程序,都可以在上面使用。 那么熟练了这些之后,我们就开始带着大家开始实操怎么搭建第一个智能体, 第一个智能体我们点击创建,这边是不是有个创建,我们在创建这里可以看创建智能体点进去之后这里面有几个按钮,第一部分是 智能体名称,第二部分智能体功能介绍,第三部分是你的空间,第四个是图标, 然后这边的话有个 ai 创建,这点话就做一个参考使用啊,靠 ai 创建的话还是不行,现在达不到那个效果。我们点开标准创建,比如说给智能体取一个名字,我们来一个最基础的,比如说我现在要搭建一个纹身图,智能体 这里没有输入法的话,可以下载一个输入法纹身图,根据用户提供的文字生成图片。 智能体的功能介绍,那么我们再往下滑,你发布到哪个空间?如果空间多的话可以选一个啊,咱们象牙课的空间比较多,这好多都是咱们象牙课的学员的一些空间,还有一些我们给其他第三方的一些项目给他们搭建了一些空间啊, 好比如说我现在把它发布到个人空间这里的话,图标你可以上传,也可以点这边有个十字星,点击的话会随机生成一个图标,一个图标啊, 哎,我们现在就可以进去了啊,再过一下啊,这种铁的名称,这种铁的介绍空间图标,好,我们现在下一步就可以确认了。 到了这个界面的话,这就是一个智能铁的一个界面啊,我们到这个界面里面可以看一下,左边是颜色与回复逻辑,中间是智能铁的编排,右边是预览与调试,一共分为三部分, 那么我们中最常用的是哪里呢?是这里工作流, 工作流是对我们这一个智能体,这个智能体就是这个固,就由工作流组成的,我们再看工作流这边 工作流支持通过格式化的方式对插件、大模型以及代码等功能进行组合,从而实现复杂稳定的业务流程编排,例如旅行规划、报道分析。那么在这里的话,我们点击这边可以添加工作流, 这里分成两部分啊,我们点击这个加号,一是你可以添加已经创建好的工作流,还有一种是可以去新建工作流,我们点击创建工作流, 工作流里面我们会看到这里有一个创建工作流,一个创建对话流,这两个其实还是不一样的, 对话流的话偏向于一些客服互动里边,我们现在创建工作流,工作流 请输入工作流的名称,那么工作流的名称这里主要是拼音或者是英文啊,不能用汉字,比如说我打一个汉字会提示你工作工作流的名称只允许字母数字下划线,并以字母开头,不行那么我们就要改头,比如说文生普 工作工作流的描述,这里的话请输入描述,让大模型理解什么情况下运用应该调用此工作流。有了一个解释说明,当用户 发出文字口令时,文字口令的时候调用工作流。 好,我们下一步开始确认, 点开之后我们看到这里啊,这里给大家介绍一下,这是一个工作流的一个界面啊,它分成两部分,一个是开始,一个是结束,那么中间的话就需要我们自己在这里面去做一些添加。 再往下看,这边有一个小按钮,第一个按钮分分成两种啊,一个是触控版友好模式,一个是鼠标友好模式,这个看自己的一个需求啊。 交互模式的话,比如说我经常用触控版,不用鼠标,那么我就可以选择触控版友好模式,如果你用鼠标的话,你就点击这个鼠标友好模式, 这里有一个画布的尺寸啊。然后第三个是注视,注视什么意思呢?就比如说我点击一下注视,相当于一个贴图,我在这里可以输入一些东西, 做一个解释说明,再往下看,注视旁边有个优化布局,你点一下,它会对你的这个工作流的界面会进行调整。还有一个导出图片,把工作流变成图片啊,这个用不到, 我们最常用的就是这个注视啊。然后再看这边有个添加节点,这是工作流最常用的一部分啊,因为工作流是由不同的节点组成的, 我现在点击添加节点,你看鼠标放这里,你会发现这里有好多,对吧?然后这上面的话有三部分啊,大模型插件和工作流插件里面比较多啊。 点击插件你会看到这里有个插件市场,这里面有各种各样的插件啊,这就要根据我们自己的平时的一个需求,然后你搭建的工作流要实现什么功能,然后去采用不同的一些插件, 我们往下划,比如智能硬件、新闻阅读便利、生活图像使用工具、网页搜索,对吧?他的里面的插件比较多啊,这个就按需来选,我们再看这上面, 这里面我们可以看一下是不是有付费的,免费的啊?然后有官方的,有第三方的, 你点全部可以看到官方的和第三方的一些插件工具的类型,还有一些排序,比如说我们可以选择最受欢迎的,对吧?有可以选择最近发布的,有没有一些新的,然后每个工作留在下面, 有他的发布时间,然后发布的用户调用量,智能体的引用量,平时耗时,比如这个工作人员的时候耗的时长二十九秒,然后他的成功率,那么我们一般选择成功率大一点的啊, 越大他越稳定嘛,对吧?好,我们现在进去之后,进去之后这里再往下滑看,这里有你平时收藏的一些插件, 业务逻辑输入输出数据库,然后知识库,图像处理,音频处理,组建绘画, 绘画历史消息。那它下面的字比较多的啊,这个怎么说呢?最好的话还是就是我们先一步一步的熟悉啊,不要着急,其实用起来就比较简单,比如说我们现在刚说的要建什么?是不是要建一个纹身图的智能体,我们需要什么? 这是不是文文字,对吧?开始我们要输入一段文字, 根据这个文字是不是来生成主题,哎,你看到这里开始节点旁边有个蓝色的小标,鼠标往那一按一点,是不是就可以添加插件了?那么哎,我们现在知道我要选择纹身图的,对不对?那么纹身图我们看这里 图像处理里面是不是有个图像生成,通过文字描述参添加参考图生成图片,你看这里旁边有个小小钻石,蓝色钻石的话是收费的, 这个是要充值会员啊,充了会员才能使用这个会员怎么充值呢?我带着大家再看一下啊,我们点击注册完自己的一个账号啊,在账号的下面,这里 是不是有个扣子资源点,我们点开资源点,这里可以看到这里有付费套餐,这边有个个人进阶版是九块九,那么我们充值这个九块九,你一个月有三万资源点,也就是算力啊, 你可以看空间数量,可以建十个空间零售,每个空间是一百元,然后置物库的这些是不是全都有? 我们平时买这个九块九的就够了啊,因为买了之后像这些你才能使用啊,但是这些蓝色的必须是会员啊,就是九块九的会员,最基本的会员就可以。那么好,我们现在有图像生成了,对吧?我现在点击图像生成, 他这里是不是有不同的大模型啊?纹身图豆包,三点零四点零,比如这个是两毛钱一张,这个是两毛五一张,这个呢是零点二五啊,哎,这个就比较便宜,是不是 两分啊?两分五一次,而且可以免费三十次,那么我们就选第一个啊,但是他的越贵效果就越好,毕竟超能力嘛。 哎,看到了,这是不是添加完之后,这边又有一个蓝色的小圆点又在闪啊?我们按着这个小圆点把结束连起来,这个是不是就是一个工作流了? 有了文本,用文本哎,生成图片,生成图片之后到结束输出,对吧?好,我们点这个中间有个优化布局,点完之后在这里我们可以看一下啊。 优化布局怎么使用呢?比如说我随便拉,拉完之后点一下优化布局,它就变得很完整了啊。好,我现在点击 开始节点,开始节点这里我们是不是把变量名改成了文字啊?什么是变量名呢?就是每一次我们让它生成的内容不一样,比如说给我生成一个美女,给我生成一个帅哥,或者给我生成一个小狗, 这是不是就是每次都不一样,所以叫变量啊?我们用文字来替代,再看旁边这里有两个箭头,点开之后默认值,就说一个现代美女, 哎,通过这里是不是默认的让他给我们生成一个一个现代美女?先描述,帮助大模型准确了解参数的作用,这里什么呢?就是用户要生成, 要生成图片的主题, 这里也就是自然语言,对吧?好,我们再看。开始配置完了我们再看图像管理这里图像管理这里大模型已经选了啊,比较多,比如说我选这个四点零, 然后下面什么宽高比例啊,分辨率,那么我们一般的话选左边的这个宽高,自定义里面看十六比九,九比十六,横竖都有啊,比如说这里我选择一个九比十六的吧, 然后水印,我这里不要啊,这里不重要啊,这个同样生成数量没有用啊,你写个二,他也不会给你生成两张, 我们这里可以测试一下啊。参考图这里,比如说你在参考图这里面你要用什么风格的?是不是在这里可以上传一张图片,比如说我让他给我上传一张蓝色风格的,也可以啊, 那么我们就这里不要它了,不用参考图输入了什么呢?用于配置输入参数,用于提示词的引用。好,这里的话我们可以添加一个输入,就是让这个图案生成,我们把它当成一个员工,员工 负责做图。 好,这个员工负责做图,但是他要受到命令。做什么图啊,对不对?他是我的员工哎,那老板现在给他安排了给我做图。做什么图呢? 我们选择开始变量,每次的口令都不一样嘛,对吧?比如说一个现代美女,一个古代帅哥啊,或者是一个海报图,对吧? 好,我们往下滑变量引用就可以了,哎,再看提示词,这里编辑图像模型的提示词与生成内容,用于配置图像生成的提示词。你可以用两个大括号的方式引用输入参数中的变量。 我们是不是要引用这个输入参数中的变量?怎么引用呢?大括号啊,两个大括号,它大括号怎么来的呢?我们在这里有个知识点啊,按住 shift 加 第一步,先切换大写,第二,按住 shift 加大括号, s 是 不是就出现了, 你发现没,是不是变成了蓝色了,我删除一个大框,是不是它就变成黑色了?只有我在蓝色状态下才及时引用啊,这是一个知识点啊,这里给大家写一下啊。 做工作流,这个是必须要掌握的啊,就是每个工作流基本上都会用到的。 shift, shift 加大括号,有条件啊, 大些,请问大些模式下就是你一定要把它 给切换到大写,这时候你才按住按 shift 和打括号才有用啊, 不然的话,我们按到 shift 它是不出来的啊。 shift 打括号,好,这里有了引用了贴纸词,我们到结束阶段再来看一下 返回变量和返回文本有两个啊,我们先看返回变量,工作流的最终最终节点,用于返回工作运行后的结果信息。返回变量,哎, 这里是不是橘色的? output 的 输出是什么?橘色的呢?就是没有配置的话都是橘色了,我们在橘色状状态下点击试音响,你会发现错误啊,运行错误,引用变量不存在。 好,我们现在把它配置一下。引用变量,引用哪个变量的?开始给它口令啊?让一个员工给我做一张什么样的图,哎,做完图之后是不是把这个图的结果要要给你了? 那这个图的结果我们应该怎么选呢?是不是应该选上一个员工的员工?下面有两个啊,有两个什么呢?一个 emoji, 一个 string, 哎, 我们看第一个 data 数数据啊, data 数据里面是图片,还一个死菌啊,一个制服,那么我们不知道的话可以单节点测试啊,我知道的话,哎,图片,那么我要的是图片,对吧?那么我直接就选择这个 data 就 行了。 想完之后再结束节点,这里是不是就完了?我现在点击碎音箱,哎,他都不提示我错误了,对吧?还有这里啊,你看我连上了,如果你忘了连的话,我现在点击碎音箱, 哎,引用变量不存在,是不是没有把它们连起来?连完之后我们再点击碎音箱,哎,这又是不是就可以了?你看这里为什么直接就出现了一个现代美女, 就是一个变量,对吧?可以改了,我们不一定有兄长美女啊,我们这个怎么来的呢?再复习一下,点击开始节点,这里有个两个箭头,下面是不是有个默认值?好,我们现在开始运行这个工作流,这个工作流等于就完成了,点击思云祥, 好,这个工作流程呢就运营起来了,我们可以看一下做的图,怎么样啊?嗯,出来了, 我们可以点击这个玉兰啊,一个现代美女啊,还有一个网址,点开这个网址,是不是这张图片就出来了,可以下载啊, 当然这个题的时候给的比较简单,对吧?一个现代美女,那比如说你要穿的什么衣服,对吧?什么样子的短发长发啊,什么头发的颜色?对,有没有戴帽子或者什么场景?比如说我们再来一个,一个现代美女穿着 穿着紫色裙子,为什么裙子是紫色了呢? 因为许嵩是。哎,为什么他的裙子是紫色呢?是不是那个许嵩说过啊,紫色最有韵味啊,好。在海边戴着太阳帽。 一个现代美女穿着紫色裙子,在海边戴着太阳帽,他干啥呢?拿着手机, 手机自拍,哎,这个咋样?一个现代美女,穿着紫色裙子,在海边戴着太阳帽,拿着手机自拍,什么心情呢?但不能哭啊, 很开心。好,我现在点击四云祥看一下 来,出来了,我们看一下效果啊。一个现代美女,穿着紫色裙子,在海边戴着太阳帽,拿着手机自拍,很开心。哎呀,用的这还是苹果,苹果十六啊, 好,这里面我们发现了什么?是不是你的提示词决定了你的一个输出的一个结果,对吧?那么这图片是不是直接可以下载下来? 哎,我们可以再看一下这工作流啊, 搭建工作流,运营起来很丝滑,但是它要需要什么呢?就是我们要对这个 插件的一个熟悉啊,里面的插件太多,我们不知道我们的场景,我要用到哪些插件,你是不是把这些工具熟悉了,你才能知道,对吧? 就像你到了一个厨房,这厨房里的各种调料,各种原材料比较多,对吧?我应该用哪一个做哪道菜呢?是不是不一样的?有酸的、甜的、辣的, 所以要先熟悉这些啊。哎,我们再回到这里啊,看一下最多生成图片数量是不是一,那么我现在把它变成二,我们再看一下啊,会不会生成两张,点击试运行 在这里,然后看到什么,是不是还是一张图片,对吧? 它的输出结果还是一张,哎,没刷出来,但是从结果里一看,我们只有一个图片网址,那么还是一张,所以说这里是没有什么用的啊, 但是有没有什么方法可以一次生成多张图片? 这里我们就会用到其他的一些工具,比如说添加节点里面啊,你看这里有没有什么循环啊,批量啊,每一个的意思是不一样,比如我们看循环, 通过设定循环四组逻辑重复之想,哎,那是不是生成一张又一张批处理,是不是也可以批量处理工作?那是不是都可以会用到? 怎么用呢?我们这边会慢慢地讲啊,好,贴日词有了,然后生成的图片有了,哎,这里面。 但如果有些同学可能会说,哎,我这些贴日词我不会写啊,可不可以优优让我也帮我生成啊,给我优化一下呀,哎,可以的,我们看这里 添加节点下面这一个什么?五个,诶,提示词优化,是不是可以用它智能优化图像提示词, 提示词优化,我们把它名字改掉,优化提示词 它应该放到哪里?是不是把贴纸给它加工一下,中转站加工完之后再给出图,那么我们试一下 来欸,这样就可以了,可以的话我们看一下贴纸词欸,这里橘色的欸,有橘色的都是要配置,对吧?好,点开这里看,这里输入 输入贴字词,哎,我们是不是应该这里有个小齿轮啊?输入或者引用参数值,应该引用谁?是不是引用开始节点吧, 贴字词传给他了,他优化完之后,你是不是要给这个员工?那这位员工收到的应该是谁的? 它不能收到开始的啊,你应该收到优化之后,那么我们是不是要改一下,怎么改呢?它这里有一个叉,这里有个叉,我们点这个叉也可以删除,点那个叉也可以删除,我们点击添加好输入节点应该选择谁?是不是优化过后的贴住词? 嗯,优化贴字词,我们现在想了,对吧?开始节点有的,他把贴字词传给优化贴字词,优化贴字词,优化好的,传给这个员工作图的。哎,这里有没有鼠呀,故意的,我们玩一下滑啊,看,这里 事务节点变了啊,优化过后的体字词,不,不叫文字的啊,文字是最开始的命令啊,最基本的体字词加工之前的,那么亲爱的,加工之后的这里该怎么办呢?我们鼠标放这里啊, 它是不是要引用这个帖子?引用的话有两种,这里一种是我们把这个删除大写模式, shift 加大括号,直接引用这个 data 是 不是可以,是不是就引用了?那么这里是不是也可以改文字? 改完之后你发现这里就变成了黑色就不行了啊,把它删掉, shift 加大括号文字,欸,是不是就被引用了?只要是蓝色的就说明被引用了啊?那么这里我们改了,还有没有要改的? 结束结束引用的,谁结束图片生成做完的图。诶,这个没问题啊。好,这里鱼虾开始节俭,这里给他下命令,让他作图, 然后这个员工负责优化,把你的命令给优化一下,提示词,优化完之后再传给这个员工,这个员工开始给你优化过的提示词,给你升图,升完图之后拿给老板。好,我们现在点击这里再优化一下,布局排整齐一点,点击试运行。 嗯,一个现代美女,这个的话我们改一下吧。改成什么呢?改成一个穿着白色的,穿紫色的。 好,我们点击试运行,这里的话我们可以看一下啊, 这里给大家讲一下,看这里是不是有个虚线在往前啊,这就是工作流在运行了啊,搭建的是工作流,每一步工作流都会有一个运行的过程,每个过程用的多长时间?看这里一秒十四秒啊。结束,我们再看这上面, 这里运行完成十六秒,这里一共运行了十六秒,我们运行了之后,是不是我们可以看到每一个节点下面都有一个运行成功,如果工作流卡到哪一步失败了,那么我们就可以通过这里去检查一下失败在哪里了。 好,我们现在看这个结果出象了一个现代美女啊,这一次变成好像是有点歪过来呀, 那一个亚度呢? 我们再看一下,哎,你看一句话题,这里是不是给你变成了英文了? 嗯,还是中国的美女看的好看一点。我们再看这里优化了的贴纸纸,白色的 quality, 最好的质量四 k 啊,真实的现实照片, happy 啊,亚洲 woman 穿着 white dress, sun heart 太阳帽啊,这里是不是给你进行了架构优化, 效果会不会更好一点呢?好,这里就是一个文生图的一个工作流了,那么这个工作流就可以完成了,那么是不是要发布了?最上面看这里是不是有个发布,这里常来引用关系, 引用帖子词,哎,这也不重要,查看历史每一个板块啊,然后这里 多人协助升级团队版,一个月啊,一百七十八,没憋。再看旁边有个发布,这里是不是我们要发布这个工作流了?版本零一,这个就不用变啊,版本描述,比如说第一版, 好点击发布,工作流一定要发布啊,发布,发布完的工作流才能会加到这个智能体里面看,哎,工作流发布成功,是否添加到当年智能体?指定。 哎,有了,我们现在是不是这个工作流里面有了这个智能体里面有了这个工作流啊?我们再往下划看,这里还有好多东西, 魔响插件,这里可以添加插件工作流数据库,但是这里我们用不到数据库。数据库在什么情况使用呢?比如说你搭建有个人特色的, 或者有本地的客服类的,你需要你的产品,对吧?你的产品,比如说卖多少钱,产品有什么功能?产品发什么快递,产品从哪发货?这些固定的东西,这个 ai 不知道,对吧?那么需要,你是不是又准备这些数据 好变量数据库,然后对话体验啊,开场白,用户问题,质量,这些东西一般都用不到啊, 就是大家有时间好自己摸索一下这些就可以了,我们还是挑重点啊,再看这里 是不是工作流可以运行了,我们可以试一下啊,一只,一只小狗在海边玩火。 好,可以看一下,用户输入了一个文字描述,而正在调用这个工作流。纹身图的工作流,然后会生成一个什么样的图片呢?可以看一下啊, 哎,有了一个图片链接啊,那么打开这个图片链接,看一下深调的图片效果,嗯,一只小狗在海边在玩火啊,还很真实的啊,看这些啊, 胡子是不是很清晰啊? 这儿几个纹身图的工作流,然后封装到自主体里边完成了,我们来看右边有个发布,哎,这个工作流发布完之后在哪用呢?我们点击发布看一下这里,不用管啊,直接跳过就行。 看,这里有扣子商店,有豆包,有飞书啊,有微信,微信小程序,看看这里。哎,我们是不是在豆包上看到过好多这种题或者飞书上,那么它是不是就是通过扣子搭建好,直接发布到豆包上,这样的话,你在个人的豆包 或者在你个人的飞书上都能看到啊啊,还有这个扣子商店,觉得商店里也可以看到你搭建的智能机,你不想让别人砍你就可以不发了,飞书的话只有你自己能看到。 我们王亚华,你只有,还有微信小程序客服,微信客服,抖音小程序,买,随便点一个点去发布, 这样的话就会到飞书上,那么在你自己,然后飞书账号上都可以使用了。 好,已经提交啊,成功了,你点击完成,然后你看这里是不是有一个对号了,我们返回 这边是不是项目开发啊?库子的主页下面有个项目开发,项目开发里面第一个是不是一个纹身图,这是不是我们刚刚新建了一个智能体,对吧?纹身图的智能体, 那么怎么平时怎么修改呢?也是一样的,这样我们还是点击这个智能体,这是不是就你搭建了你的第一个智能体?点击这个智能体进去之后,回到了这个界面熟悉的界面,那么我现在点击这个文胸图进去, 在这个纹身图里面是不是就可以去修改了啊?感觉哪里要修改的话,就可以在这里面去做一些修改,比如说尺寸了,对吧?比例了,你要改什么样子的,那么都可以在这里去进行实现啊。 好,第一个就完成了,那么再给大家再介绍一下啊, 这个智能体的话,里面是会有一个插件市场,你刚刚已经看到这个智能体了,工作流里面有个插件市场,那么不同的插件是不是可以组合不一样的? 这是不是就像搭积木一样,对吧?不同的积木可以搭出各种图形,那么智能体也是一样,你选择不同的插件,你搭出的整体的功能是不一样的, 这就要看你平时的日常需求啊,你需要以海报的话,你可以搭建文生土类的,那么需要啊,写文字了,对吧?文字处理了,或者是数据处理了,表格处理了,或者是申种视频了,对吧?这些都可以实现。 那比如说我们现在在搭建一个呃,思维导图的,那我是不是继续新建找思维导图的插件,对吧?然后点,你看这个节点里面有没有点击插件,插件里面有没有思维导图, 哎,你看有些思维导图的,对吧?哎,都不是官方的,但是我们那成功率有九十八的,有九十九点八的,是不是也可以用啊?或者是什么速图? 嗯,这个扣子官方的,这个九十七,那么是不是也可以用啊?看,给我们提供 智能思维导图制作工具和丰富的魔法支持,脑图、逻辑图、塑形图。哎,各种都可以啊,图片内容怎么展示?只支持中了。那更合适啊,好,比如说我现在要再打剪一个思维导图的,就怎么搭建的,我们再返回到这个界面, 这个界面新建还是新建啊?新建。这里是不是有个创建智能体?创建智能体,比如说这里输入思维导图, 一键生成思维导图的智能体,好给它 这个思维导图,现在点击确认。 嗯,这里的话看空的啊。思维导图这边咱们是不是一样的?来添加工作流就可以了? 工作流,创建工作流,那么这个是思维导图,思维导图,嗯,或者说英文啊,思维导图拼音 哦,不能输汉字啊。拼音英文也是可以的,一键生成思维导图,工作流, 工作就能描述。嗯,这样写也可以,或者是你就更严谨一点啊,根据用户提供的文字调用工作流, 进来之后还是这个界面,哎,对吧?嗯,没刷新过来,把它先关掉。 嗯,好,开始和结束两个节点,那么到这里思维导图,对吧?那么我是不是应该添加,添加啥呢?添加思维导图啊, 增加四维导图。我们先捋一下这个顺序,好吧,这个顺序什么意思呢?那么我们再巴结一个什么样的一个工作流呢?嗯,这个工作流具备什么功能? 一、写文案 就说给他一个主题,可以给张院长拿给我写一张文案出来。二、上网,他会上网搜索一些网站的消息,对吧?第三,他还会干啥?整理成思维导图。 嗯,好,我们要发现一个这样的话,先要明确自己的一个需求,我们要根据自己的需求来,而那么这个需求现在有了,我们就要考虑该怎么实现。写文案,谁来写文啊? 我们平时用到的那个豆包, dooseek, 这些是不都可以?可以写文案?那么它们属于什么?我们再看一下啊,点击这个添加节点,这里看到大模型插件工作流, 再输入一个大模型,那么调用大语言模型,使用变量和帖子子生成回复。欸,大模型是不是就是个大脑,可以让它来写文案?好,点完之后到这里, 插件就等于工具啊,大模型它就可以选择 cd 位。好,那这里的话我就可以。它是谁?它是不写文案的。 嗯,好,有写文案的了,那么这里的话,开始剪它干啥?我给他一个主题好不好?给他一个主题,给写文案的负责写文案, 写好的文案。诶,写好文案要干啥呢?写好的文案,对于我整理一下。谁会整理 大冒险,大冒险不要抄语吗?要员工一, 员工一写文案。那么第二个员工二, 员工二干啥?整理成整理思维导图格式。 那么员工三,哎,还用到了吗?用不到了,我看下我们的需求啊,写文案有了,上网,哦,对,然后整理成思维导图格式,最后的话 到结束,哎,整理成思维导图格式,这里是不是要用了工具了要,刚我们纹身图一样用到了一个生图的,那么这里应该用哪一个呢?刚展哥说了,搜思维导图或者搜索速图,对吧?我一般喜欢用官方的啊,有的都要抠图官方的速图,那么我现在就可以添加一个 tab 了, 摊摊建了之后凉起了,这点某我可可以看一下啊。三号员工, 三号员工生成思维导图。 好,那现在就可以开始配置了啊,咱给他一个主题,让他给我写文案,写完文案之后给我整理成四维导图的格式,然后整理完之后通过这个工具与加工生成四维导图,那结束, 那么这里阳光,这里小模样,这里那应该怎么整呢?哎,点进去之后看这里,第一个给大家记好,要打模型啊。第二,用大语言模型,使用变量和格式都能回复模型顶面,我们可以看一下啊,热门的, which 排在前面的是热门了,哎,豆包无颠城,深入思考啊,极致速度,视觉理解,视觉理解,自动深入思考。哎, dipstick, 再往下拿,哎,有豆包啊, 还有谁 dipstick 啊,各个版本还有二一呢,二一在深入思考的也挺厉害的啊,然后再往右滑,哎,还有 kimi 呢啊, kimi 上面啊,还还有这个,这个什么激流星尘啊,会预兆的很少了,还付费着, 我一般用这个 double six 二一,然后还有这个豆包,豆包一点六啊。极致速度,这个比较快,因为加入 c m 四口的话,团队会时间比较长,比较费胜利啊。那么这里写文案,我们用谁 选择对不? c, 二 e 就 可以了啊,为三等一也可以,那就用这个不用二 e 吧。 好,他负责写文啊,那么技能,什么是技能?看这里,上网,咱刚说了啊,写文要有了,会上网,会上网,我们可以给他添加一个技能,让他去送了。 上网,上网干啥呢?上网 a, 头条搜索可使用头条的搜索功能,通过关键词搜索内容和网址链接。 嗯,它会搜索,那么我们可以会上网的一个头条搜索的一个技能啊,这个技能里面 a 有 两个,看哪,我们需要哪一个。当你获取网页 pdf 时,使用此工具,那我们不需要搜索用户询问的内容。 a, 这个可以。 好,技能里面有了啊,再到输入节点,输入节点就是变量,给他的一个变量啊,让他写什么主题,那么这里我们应该选谁是未开始节点的主题。 嗯,好,这里就码的是中文,这样的话会错的啊,那么这里,嗯,自动变成古题了啊,好,变量名主题,这里可以改,可以不改,我们为了保持一致性啊,改一下主题, 通过这个主题是不是可以写文案了?嗯,这啥意思?系统提示词和用户提示词, 我们再看下这里系统提示词和用户提示词,人设设定人设,然后用户提示词 基于文本提问,这啥意思呢?我们说这个员工负责写文案,那么他的角色是想他的角色是不是就是文案大师,文案文案创作大师, 他会干啥?根据用户提供的 提供的主题生成文本,对吧?他的角色,他的技能, 嗯,这里适不适合给他一个角色进行的定位,那么题日词有固定的格式,就是 markdown 格式,我们看一下 这里 dbm 有 一个自动对话题日词,我们写完之后写一个大概,那么是不是可以点击这里,它自动给你把题日词进行排版,我们可以看下效果。 嗯,有点慢呀。嗯,很好。 哎呀,太 spa 了啊,那你是一个思维导图生成出手以这样结构化思维导图需求,它为什么会出现这样的一个思维导图格式呢?还没有到思维导图呢, 我们不要他写了,我们看这里,他为什么会这样写?大模型有时候就像开盲盒啊,我们点击编辑这里,你看一键生成思维导图的工作流,那么你是不大模型就会抓取到他这个他的一个功能,我们先不用管这个,他负责写文案的就可以。 那你还用还有没有什么要求?字数多少啊?字数五百字。好,我们再看这个用户填日期,用户填日期这里有什么的? 引用变量名主题,对吧?这是我们给他的主题, 那么有了这个主题是不是就会给你写出文案了?那么我们再看输出这个输出的结果是不是写出来的文案结果。好,我们看这里,小齿轮 大模型讲过了啊,小齿轮选择输入变量,这里系统填词词,然后填词词输出。好,这边都介绍完了啊,那进坎门了,给大家一个保姆级的一个教程啊。 哎,这上面还有一个小三角设置概念。啥意思?点一下,试一下它的功能,是不是就是 给你单节点运行一下它的一个输出的一个结果,对吧?我们让他写文案,那比如说写个什么文案的。嗯,写个啥呢? 耶愧替代。那写工作岗位。好,我们闲着试一想,看他写的咋样啊,来一看是不是其他节点都没有变呀,只在运行这一个节点。 嗯,看一下啊。 欸,写好了 我们可以看一下。 output 的 输出依然 啊,高风险极大的。客服类的,标准港标准化的啊,制制造业的,数据分析的,创意技术的啊,编码的。 嗯,行政会计系技术写份人员啊,是不是还行写的啊你如果你感觉这个写的你不满意的话,那我是不是可以干啥? 怎么变不要这个员工了?不要了对不对?或者我选豆包可不也可以我们再看啊,看这个员工写的咋样。耶耶。能替代哪些空白岗位呀?直接逆袭。 反正不要钱啊,你就把它当成一个人才招聘市场啊,这个员工,不行咱再换一个,再招一个。再招一个啊,直接招到让你满意的员工啊。 看这个员工写头咋样啊。 嗯,这个员工写头看的时间挺长的,还调用了。嗯,调用了搜索插件,你看这里是不是才上网搜索的 that 搜索了啥搜索了这么多啊,新来的啊?网易的东方财富的啊。好,咱看下。他说了这么多,看他写的咋样。 嗯,标准化重复性的劳动岗位啊,客服与呼叫中心,收银员,分拣员,仓促啊,会计,法律,杜离, 新闻类的,文本类的,文案设计类的,还有不可替代的,科学家,艺术的,复杂角色的,高管啊, ai 训练师。嗯,这个写的版面不错。好,我们就选这个员工了啊, 然后再看这个员工写好之后。我们,哎,我们要哪一个呢?是不是要哪一个?我们是不是他的结果?要哪一个 结果?我们玩要划这里输出结果有几个,一个是阿德普的一个输出,一个是啥? a reason content, 就是 深入思考。那么我们是不是要结果?要哪个?要阿德普?好,我们这里点击第二个仰慕这里,你会就会要考虑到这一点了。它的输入是谁? 整理成思维导图?整理啥?整理?是不是晒一个员工写的文案,那么这个员工写的文案在哪里?是不是在阿德普特,在他的输出?那这个应该咋选呢?是不是选的员工一一阿德普特会了没?这样选呢, 你不知道选哪个结果的时候,你是不是就可以在这个这单一个节点上面点进这个试运祥? 好,我们第二个阳光记忆配置啊,它干啥?它是整理思维图,思维导图格式。嗯,这种我们选哪一个呢?其实还有些区别的,比如编程的话呢,当然第一个就好有视觉,比如理解图片啊, 我们这里用到的是啥?它是整理的,那是不是角色扮演?它的角色啊,我们就选这个角色扮演吧, 这个效果会更好一些啊。然后它的技能什么整理思维表图啊,整理思维导图格式,不需要上网了,输入节简有了选择这个员工写的第一个员工写的文案,那么这里系系统 tips。 哎呀,系统 tips 啥意思呢?还是角色定位啊?它是啥 角色?嗯,角色。哎,你来看一下吧。那个,那这里有个帖子文档啊,所以大家有时间都可以去这里看一下啊。 啥?提示词被几部分组成?我们看这里,第一,角色名称,第二,目标第一,他是什么角色?他会干啥?一句话描述啊,他是一个文员上的大师。呃,目标啊,他会干啥?技能 啊,你这个要实现什么目标?他的一个技能是啥?哎,一二很好,数字格式样式,这样就是一个一个工作流,它里面的一个提词词的这个系统提词词的一个格式啊, 呐,你点击这个插入,是不是把这模板给你了,你在里面输入就可以了,或者是你不掉不要他的,你自己写也可以,但是怎么打出来的?我们比如说角色啊,它这是什么?是不是有减号键? shift 加减角色。 角色,诶,刚不是橘色么?为啥变成黑色的?这格式是不是不对?好,鼠标放在颈后面,那么空格是不是就好了?角色,你是一个思维导图格式构建大师,可以 根据用户提供的内容生成。思维导图格式生成不太恰当啊,整理成思维导图格式, 有逻辑简洁,用语逻辑简洁明了,又有逻辑。 much。 正立场思维导图格式,详细的正立场思维导图格式。诶,他的也是为一个他的角色, 这个是什么?这个是技能啊。 哎,为啥这个加第一个没加?我们再看第一个,这里是不是没有加,很简单的,其实这个也是一样啊,不要这些也是可以的,但是为了给大家讲一下啊,只是为了为了给大家讲一下,这样更严谨一点。就是我们用这个角色, 用它正常的一个格式把它给圈起了啊,比如说限制,它一共分成三部分啊,角色技能限制什么限制呢?就是说什么呢? 不要带英文, so 就 可以,这,这就是限制, 以便它回到这里啊。尽量给你整理成思维导图格式,以便啊,以便更好地 生成思维导图。好,我们到下一步了。用户提示, shift 加大括号是不是?哎,出来了嘛?你不切换大写的号它出不来啊。好,切换成之后我们再往下滑, 往下滑,看这里有个什么,有个输出啊,输出只有一个啊,那么这里是不是我们到配置下一个了?