粉丝186获赞411

今天我们来教大家怎么在工作流中添加极梦的图生图插件。首先新建工作流,从开始节点引出连线,添加插件,搜索极梦,找到极梦图片生成。添加下面的 g mangeni teamage 插件, 来看看插件需要的输入变量。 l key 是 需要输入米和的 key, prompt 是 需要输入图片生成的提示词, images 是 需要输入图片的链接,是个数组字符串类型。 model 是 图片模型,可以选择即梦三点一,四点零,四点一,四点五几个图片模型。 ratio 是 图片比例。知道了图片生成需要输入的变量后,我们回到开始节点来设置输入变量。 首先设置输入变量 key 字串类型,接着新增一个输入变量 image 文件图片类型, 再新增一个输入变量 prompt 字串类型。然后来设置即梦图片生成的变量 key, 将开始节点的 key 传入 prompt, 将开始节点的 prompt 传入 images, 要求输入的是个数组字串类型, 所以我们还需要一个字串转数组的插件来实现图片链接转为数组字串。在开始节点后,新增插件 我们收藏的插件剪映小助手数据生成器下添加 s t art list 的 插件,没有收藏的小伙伴可以通过搜索剪映小助手数据生成器找到下面的这个插件进行添加。设置输入变量 app, 将开始节点的 image 传入 回到极梦插件 images, 将 s t r to list 的 节点的 info 传入 model, 我 们选择图片四点五模型填写图片四点五 ratio 对 于生成的图片比例,既可以手动要求,也可以自动识别。由于我们是来做以图生图,为了保持图片比例和原图片一致,我们用自动识别图片比例来完成。 所以我们在开始节点后再新增一个大模型节点来识别原图片比例模型选择豆包一点。六、视觉理解大模型设置一个输入变量 image, 将开始节点的 image 传入。 视觉理解输入,新增一个输入变量 image。 一、 将开始节点的 image 传入。 系统提示词填写,你是一位图片参数专家等提示词内容用户提示词填写 image 和 image。 一、 输出变量 ratio 字符串类型,把大模型节点名修改为识别图片比例, 回到极梦插件 ratio, 将识别图片比例大模型节点的 ratio 传入。再来看看输出变量 er 就是 我们最终得到的图片链接。 最后将极梦节点和结束节点连接,设置结束节点参数,输出变量 er, 将极梦节点的 er 传入。 为了和原图片对比,我们再新增一个输出变量 image, 将开始节点的 image 传入。至此,我们工作流的全部设置就已经完成。是运行工作流。我们来上传一张图片, 添加图片提示词,比如保持图片中人物的脸部形象不变,将图片中的人物穿上红色古装汉服,背上背着一把宝剑, 头发挽成发髻,全身照四十五度平视视角,侠女形象,骑在一匹白色的高头骏马上,正在一片草原上纵马驰骋。背景是一片广袤的草原,蓝天白云,光影自然,高清,写实电影宣传版面风格。 然后来到米和页面个人中心,将自己的 a、 p、 i、 t 进行复制,粘贴到 k 输入框,然后点击是运行按钮,工作流开始为我们生成图片。 工作流完成运行后,我们就得到以图生图的图片。可以看到图片就是按照我们提示词所要求的内容进行生成,而且还严格保持了人物一致性不变。 我们保留原图片不变,重新填写新的图片提示词,严格保持图片中人物脸部形象不变。将图片中的人物穿上洁白的婚纱,头发盘起新娘妆,正面视角全身照,纯色背景光影,自然高清写实摄影,摄像风格。 点击式运行按钮很快就完成了运行。来看看生图效果也很好地按照要求生成了女生穿上婚纱的图片,同时也看到图片很好地保持了人物的一致性。 所以我们可以用这个以图生图插件批量生成人物一致性的图片,用于很多使用场景。 怎么样,你学会了怎么在工作流中添加即梦图生图插件了吗?大家也快来动手做起来吧!

扣子二点零上线的 skills 新功能,百分之九十人都理解错了,很多人以为它能够替代工作流,结果折腾了半天全是坑。 今天用三分钟把 skills 的 核心逻辑能力、边界,它和工作流智能体的区别,一次性讲透,放进至少上一个月的试错时间。首先,你可以把 skills 理解成为 ai 身上的技能包,说白了就是别人提前做好的 ai 小 插件、小工具, 比如写周报、做 ppt, 甚至做课间,你需要什么,找对技能包,一键就可以生成。所以, skills 的 本质就是一套即开即用、标准化的技能小工具,主打一个零门槛快上手。 其次,他擅长什么,不擅长什么,这个边界一定要划清。他的优势很明确,只适合目标明确、步骤固定、天天都要做的常规任务, 比如固定的模板周报、简单的 ppt 生成,标准化的文案输出,它的输入输出都很清晰,不用动脑调整,它能够秒出结果,效率非常高。 但它有明显的边界,它没有办法处理复杂的数据,比如批量抓取、清洗、分析数据,它也搞不定。循环和皮处理, 他不能做多分支的决策,如果要根据任务需求走不同的线路,最后汇总的流程他就不行了。对于高定制项目,需要随时调整、动态判断的企业级需求,他也根本没有办法解决。更关键的是,现在扣子中每次只能加载一个 skills, 无法做到技能组合和叠加。最后,他和工作流智能体的根本区别在哪里?工作流就是自动化的生产线, 它按照编排步骤完成复杂的定制化流程,智能体则更像你的专属顾问,按照规则和你对话,处理需要反馈、梳理、沟通的复杂问题。 而 skills 就是 一个多功能的工具箱,现成的小工具不能改,不能组合,主打快捷,没有任何的定制空间。其实 skills 这个概念在海外二零二四年底就有了,但为什么一直没有代替工作流呢?就是因为它只能覆盖不到百分之十的简单场景, 剩下百分之九十涉及复杂逻辑、动态判断、深度定制的需求,就必须靠可自由编排、可适化的工作流来完成。 总结来说, skills 就是 cos 为大多数职场小白提供的快捷入口,能够快速上手,但真正要构建竞争力,解决复杂问题,依旧还要掌握工作流。我们看清工具的边界,才能用对工具。如果你在具体使用时还有困惑,评论区见。

一条视频教会你扣子工作流搭建的完整视频,本视频共计三十七分钟。在百度里头我们去搜索扣子两个字,我们搜到第一个就是我们把这个功能拉到最右侧,我们可以看到这个有三个功能,一个是扣子空间,是扣子 推出来的通用智能题,扣子编程对应的之前呢扣子的开发的平台,他这个名字改掉了对这个扣子的罗盘,那我们主要是用到扣子编程,也就是扣子开发平台。第二个功能好,我们直接打开扣子编程好, 点进去之后,我们直接就来到了什么扣子开发平台的一个界面,我们直接在这个页面,我们直接打开左侧这个菜单,资源库这个菜单。 好,在这里大家可以看到这都是我们之前创建好的一些工这个工作流的一些列表,当然这里边不单单有这个工作流,你还可以有这个插件,包括知识库,这个提示词以及数据库等等,总之是各种各样的资源全部在这个资源库里边。 好,那我们接下来我们就在资源库页面的右上角,这有一个资源的按钮,我们直接点击把它打开,这里边有各种各样的,你可以创建插件,工作流、对话流等等知识库。好,在这里我们是创建一个工作流。好,我们直接点击它。 好,那在创建之前给他起个名字。好,那我们今天就给大家以自媒体这个行业为例,这个名字没有什么特别的要求,比如说我们就用汉语拼音,有些朋友说我这个英文不太好,那就用汉语拼音,你看我就起的是自媒体这三个字的这个拼音。好, 没问题,我们加一个工作流。好,这个名字就大概就这样就行了啊,当然不能,不能是中文的好,工作流的描述,你这个工作流是干什么的,你就用你的大白话把它说清楚,说清楚就可以了。好,在这里我们的工作流就是我们想根据用户输入的主题, 也就是说用户输入什么主题,我们来去生成相应的文案,因为我们是做自媒体的内容啊,以及这个图片和什么 和相应的这个视频。好,那我们是今天去做生成自媒体素材内容的这么一个工作流。好,那这样我们的名称跟描述就写好了。之后我们直接点击右下角确认的按钮,我们直接点击右下角确认的按钮。好, 来到这一步,来,咱们直播间的各位朋友有没有问题?这样我们就直接进入到了对创建搭建这个工作流的页面这个界面了。好,大家可以看到这里有有,只有开始和结束这两个默认的一个节点, 到这步我相信大家应该都没有问题。来,大家有没有问题,我们把我这个工作流,大家可能不太好理解,你就把它想象成咱们工厂的流水线。好,我们去扮演工厂的厂长, 你要做的任务是什么?来,去招人,雇这个员工来为你去干活。把人雇进来之后,你要给他培训,再去给他分配任务, 你这些招进来的员工都是你的 ai 的 员工,让 ai 来为我们来进行干嘛?帮我们来自动化的去干活,替我们去干活。既然是这样,那我们就可以根据我们的今天的这个需求是什么? 首先我们去要去创建一个什么,对,创建一个这个我们是讲根据这个主题,我们根据这个主题去生成相应的什么 文案、图片以及视频。好,那我们就去先去添加一个什么帮我们去写文案的这么一个员工, ai 的 员工,好,那我们 大家可能去想到写文案,是不是我们要去添加这个,比如像大模型 deepsea, 我 们就把大模型的节点添加进来, 这个大模型的节点就是帮我们去生成文字的内容,也就是我们今天的一号员工,我们来给他稍微编排一下,改个名字,点击这个三个点,在这重命名一下,他就是今天的一号员工。把,我们是干嘛的?把,我们去 对写文案的生成文案。好,我们先不着急来对他进行一个配置,作为厂长,我们先把所需要的岗位,这个员工我们都先招进来。 好,那我们接下来我们要去招什么?我们是不是要招第二个我们的员工就帮我们去生成图片了,那怎么去招?我们在一号跟结束的节点这个连线的中间,我们这他是不是有一个加号的按钮? 我们点击这个加号的按钮。好,他是不是又弹出这个界面了?那这个你可以把它想象成就是一个工具箱扣子给我们提供的各种各样的工具模块节点都在这个工具箱里边。好,那我们往下滑,我们既然要去升图片,我们在这里是不是有一个图像生成的 这个功能?好,我们直接把这个图像生成对这个节点来给他添加进来,那他就是我们今天的什么,相当于是我们二号机器人的一个员工,就是我们的,我们同样给他改个名字,他就是我们的今天招进的二号员工,好,那就是帮我们去生成图片, 那接下来我们是吧?我们第三个需求是什么来的?我们第三个需求有了这个文案,有了这个图片,第三个是我们要去生成一个视频,最终的视频。所以在我们二号员工跟结束的节点中间,我们再去干嘛?再去添加一个员工,帮我们专门去生成视频。好,我们直接点击加号按钮, 又弹出这个界面了,所以大家看到没有,你,你,你如果只需要去添加各种要去加,去添加 ai 的 员工帮你去干活,你都是需要跟这个界面去打交道,这里边有各种各样的, 我们都可以认为它是,你认为它是工具也好,或者说功能模块也好,我们 ai 的 员工,好,那在这里我们就找到在音频视频处理这个区域。好,这有个生成视频的这么一个员工,我们把它添加进来。好,点击你的鼠标左键。好, 那这样我们就把他加进来了,我们就给他改个名字。好,我们继续,这个就是我们的三号。等员工。好,帮我们去生成什么生成视频的。 好,那到这你作为厂长觉得就是我们的这个人今天着齐了。好,接下来你要干嘛了?对,接下来你要去对他进行培训,分配任务,给他 进行一个执行,帮你去完成最终的一个任务,这样我们整个的工作流他就可以帮我们去自动干活了,我们最终为了达到这么一个目的,最终的目的就是能够帮我们自动干活,帮我们去自动去根据用户的主题去写完啊,生成图片,生成相应的视频。 那接下来我们就要对他来进行训培训,就跟我们这个公司招人之后,给他培训之后才能上岗一样的道理。好,那我首先我们就来对我们的第一个 爱的员工来进一个培训,我们选中打开它之后,这是它的整个大模型的一个配置界面,我们简单的来看一下,大家都知道大模型是什么?大模型,包括我们今天的搭的智能体工作流来,大家有知道的吗?有不知道的扣零好不好?知道的扣一, 那我就快速的去过一下给大家。大模型是什么?大模型就是我们用的这个像豆包、 d、 p、 c, 什么 k 密,包括大漂亮的 g、 b、 t, 这个都属于大模型。 那大模型它主要的工作主要是帮我们干嘛?帮我们去生成文字的一些内容,比如说你去写个文案,写个短视频脚本啊,去写个报告,写个总结,它主要是帮我们去做文字方面的一些工作。好,那我们的智能体是什么?智能体 它就不一样了,智能体你可以把它想象成既有这个大脑,又有这个手和脚,那大脑就是我们刚刚说的大模型,就可以充当为它的大脑, 那手和脚就能帮助我们来把这些具体的一些问题进行落地。比如说你要去写一个,生成一个具体的 ppt, 或者说需要剪辑某些视频,或者你要生成一个表格文件,什么 word 文件,像类似的这种的好, 那我们就可以通过这样的一个智能体来帮我们去实现,帮我们去生成这样类似的一个文件。当然我只是捡了一些简单的一些例子,当然他智能可以帮我们做很多事情,而且在各行各业,在各种各种场景都可以帮我们去完成相应的一些解决,我们完成相应的一些工作,帮我们解决一些问题。 说到大模型智能体,那工作流又是什么?工作流,我刚才说了工作流,我们现在搭建的就是工作流,工作流就是你的业务的核心逻辑,都是搭在工作流里边, 有了这个工作流,你好比是什么?就是帮助咱们的智能体去实现一个具体去解决这个问题。来去就说为什么 大家总说大模型不能去落地,他能给你很好的创意,给你很好的一些点子,但是你要想让他去生成,比如说某一个文件, ppt 文件他是不是做不到?或者说把你想生成某一个 某一个 word 文件等等,是不是做不到?他只能把你先生成文字的内容?好,你要生成 ppt 文件这种的好,那就需要我们干嘛对第三方的一个去搭建这样的一个工作流来实现。 好,那以上给大家就是简单的介绍了一下这个智能体大模型,包括工作流的它的概念,那我们还是回归到我们的正题这块,我们的这个大模型的一个配置,那我们在这里其实大家 来看这里边有很多模型的选择,豆包的,包括 deepsea 的 豆包的,大家都知道豆包的也是我们自结旗下的,扣子就是自结旗下的,它是一个生态的系统。好,那我们如果选用, 比如说你要豆包,其实我们用豆包一点五三十二 k 这个 pro 三十二 k, 它这个啊其实挺好用的,而且它的速度很快,我一般演示都会去用它。好,如果你想想写的更好一点的一些文案,你可以用一些深度思考的一些这个模型,像豆包的一点六这种的深度思考,或者说 deepsafe 有 r 一 的模型, 都是一些深度思考的一些模型,包括第四个 v 三点一这种的都是深度思考的。好,那我们就用这个一点五 pro 三十二 k 足够用了。好,那接下来我们再去配置一下这个输入。好,输入是什么呢?大家注意看好输入,包括还有这个输出, 我们添加的这些模块与这些节点,所有的 ai 的 这些员工啊,都有输入和输出,看到没有?好,包括我们的三号员工也是有输入输出,所以我们的每一个 ai 的 员工啊,输入和输出是 共同的一个特点。好,那大家可能对于输入输出啊,没有学过基础的,或者说没有搞过这些可能不太好理解。确实,那我们怎么去理解他。好, 我在这给大家举个简单的例子,比如说我们把输入这里,我们就把它想象成是输入的这个材料通过我们加工, 加工之后输出的是什么,输出的就是他的一个成品。那我们在这里,比如你现在要做一个蛋糕,我们在这里输入的蛋糕的这个原材料,包括有这个蛋糕的批子,什么牛奶、奶酪,还有水果等等,这些就属于我输入的这个变量,你就把这个变量 底座是我要输入的一个原材料,因为你去想这个变量不太好理解。好,那我们输出的是什么?输出的就是我这个蛋糕做出来一个这个蛋糕。好, 我相信大家这样答案应该就很好理解了。那我们在这里输入的就是什么,我们打开我们的这个小齿轮配置按钮,然后在这里开始这个节点,有一个,你会看到有一个 input 输这个变量。 好,当然这个音符的变量就是我们开始节点的这个变量,你可以给他改个名字,咱们刚才忘了改名字,这个名字是可以改的, 你可以用汉语拼音,比如说我这里是接收到用户输入的这个主题,对不对?好,那这个主题我给他改了一个汉语拼的名字,这不是英文单词,就是主题汉语拼音。好,我们又回到一号员工,我们再去打开输入的配置,再开始这个节点,你就会看到是不是不是有一个主题的变量? 好,那我们直接把它配置进来,点击你的鼠标左键,把这个变量的名字,我们同样可以改成汉语拼音这个主题。没关系,我们不懂英文也可以去学,因为很多确实英文基础不好。他说你这个能不能写,其实这个名字真的没有那么重要,你哪怕就写一个 a 也行,能理解吗?你就写一个 a、 a、 b、 c、 d 都可以,你只要说你能够知道它是代表什么意思就可以了。那我们现在有了输入的主题,因为我们现在就一个,对不对?就一个主题,就是用户输入的这个主题我们已经配置好了,当然如果你有多个这个变量,也就是说你要输入多个原材料的时候,你就可以呢 添加多个这个变量,答案能理解好,当然我们现在就一个,接下来我们就来到了我们的提示词的一个书写, 我们就来到了一个提示词的书写好,那提示词在这里我想跟大家说一下,非常重要。如果你说整个的我们工作流这些工作模块,大模型这个节点可以说是所有这个模块里头最重要的,对不对? 大模型就是我们用的 deepsea 豆包好,那我们的提示词可以说是重中之重,为什么?因为你看你不管你在用这个 deepsea, 也要用豆包也好,你在平时在网页当去用,或者说你下载到手机里的 app 去用的时候,你是不是要去提问 好?你提的这个问题其实就是在写这个提示词,也就是说你你提问的这个好坏,你也就说你写这个提示词的好坏,决定了什么?决定了这些大模型,决定了 deepsea 也好,豆包也好,给你输出的一个答案的质量的高低好坏, 大家能理解。所以那有些朋友就说我用 deepsea, 用豆包舀,或者说用用用,用国外的那些也好,我为什么同样的这个大模型,我为什么有的别人为什么能输出很好的一个结果?我用起来为什么总感觉它傻傻的,或者说不好用? 你要去审视一下是不是你写的这个问题,写的这个提示词,提问的这个问题不是很好,所以对不对? 所以他给你出来的结果也就天差地别了,这个就差距非常大,模型是一样的模型,但是你提问的好坏这个非常重要。好,那接下来我来带着大家去简单的手搓一个提示词。 首先你写这个提示词,你可以给他先定一个角色,你是谁?你扮演一个什么角色好,要干什么?要干什么?好,达到什么目的? 整个有什么要求?好,把这个两点写清楚就可以了。这个其实就是对大家去提问的一个简单的一个要求,当然有时候你,你扮演什么角色都可以忽略掉。好,那比如我现在跟大家去说一下,比如说我现在告诉大家,你是一个告诉大魔镜,你是一个优秀的 文案写作专家。好,你需要帮我去用户输入的主题,是不是用户输的主题?帮我 根据用户输入的主机去写生成文案。什么生成文案和什么?对,和,我们需要生成图片,但是是不是大模型不能直接给你生成图片?打 excel 包括这个,他能给你生成图片吗?不能吧?好,那我们再生成图片,我们需要让大模型生成。什么 生成叫做帮我去生成图片的描述提示词,对不对?好,提示词好,和什么?和我们对吧? 三号员工,我们需要的是什么?视频的什么动作提示词好,视频的动作提示词 好,他,对吧?你,你们就记住大模型,他可以帮你生成各种文字的内容,各种文字的内容,对吧?好,就是你,你去让他帮你去做。好,那这里你看我这么一句话,是不是 这么一句话,是不是交代了你是谁?然后呢?要干什么?帮我去干什么,对吧?说,说的很清楚,就通过这一句大白话就可以了。好,我把他删掉,那在这里,其实这个题的词他就能够帮你去做这件事了。 已经可以了,但是有些有些同学这个也太简单了吧,对吧?太简单了。好,然后有些同学说,我能不能让他优化一下变得更好呢?当然可以。好,怎么去做?怎么去做。 各位啊,很简单,很简单。来,我们稍微看一下,我往这边挪一点。好,你们可以看到,其实扣子给我们已经提供了,在这里是不是有一个这个什么? 有一个什么,对吧?在这最右侧有一个按钮,叫做可以优化这个提示词。可以优化。好,我们直接点击这个按钮,自动优化提示词,他就会针对我们写的这段什么这段提示词来进行一个优化。好, 你看我们就点击第一个。好,我们稍微等一下,你看。所以大家你看到没有?你需要做到的就是把你这个想要干什么表达清楚了,你不会优化,没有关系,交给 ai, 让 ai 帮你去优化,帮你去写。 已经写完了,大家看没有?我们来看一下他优化的一个结果。好,这个就是角色,你是一位,对吧?专业的多类型内容生成专家,看到没有?他帮我改了, 我刚才说的是文案生成专家,为什么他现在改掉了呢?你看他把我就优化了。多内容生成专家,因为他不光光是帮我们去写文案,他还要帮我们去生成提示词,对不对?生成图片的那个描述提示词和和什么?和视频的动作提示词,对吧?好, 你看没有,根据用户书的这个具体主题精准生成文案、图片提示词以及视频的动作提示词,对吧?擅长结合不同的场景需求来调整内容的这个风格和细节。好,这就是一个角色比我写的好,对吧?优化的比我写的好,对吧?好,来,技能,你看 三个技能应该对应的就是文案生成,第二个技能在哪?图片的一个提示词生成,对吧?在这里,然后呢?第三个是什么?视频的动作提示词?这么长,看到没有?好,最后是限制好, 我觉得写的非常不错啊,我们直接点击你,你觉得不错,你直接只需要去点击这个替换的按钮,好,他就会帮你,对吧?把原来的那个替换掉用,对吧?用他帮你生成的一个提示词,看到没有?我们两句话,人家给我优化生成了这么长的一段提示词,够不够专业?各位, 所以大家一定要擅长利用 ai 帮你去做事,对吧?你只需要把你的需求提出来,用大白话讲,讲清楚,一定要讲清楚,好,让 ai 帮你去优化,大家一定要擅长去做这件事,对,好, 没问题吧?好,那我们这个第一个,大家看到我们的这个系统提示词,我们就写完了。好,那用户提示词又是什么呢?用户提示词其实很简单,其实就是这个用书的这个变量,也就是我们输入的这个原材料,对吧?输入这个原材料,你把它写进去,写到哪呢?写到这里, 好,怎么写?摁住键盘的 shift 键,在键盘的左下角,左下角,好,然后打出大括号,它就会自动弹出这个变量,然后呢,你去点击左键,好,这样我们就引用成功了,就引用成功了,当然我们还要跟大家说一下, 其实用户的这个提示词,你可以把这个变量这个主题可以放到系统提示里边,这个是都是可以的,对吧?都是没有问题的,你这里用户提示词可以是空的,当然我们放到这里我们这样写是一个比较规范的标准的一个写法。好吧? 好,那我们这样就整个的我们的这个提示词就配置完了。好,接下来我们整个大模型的配置还没有完,还没有完。好,我们对,我们来到了我们的什么? 对,输出这部分,输出这部分。好,你既然,对吧?你,你输入有了中间加工,其实提着词就是来去帮你加工的,对吧?帮你去加工的整个过程就是提着词的一个能力。好,最后输出的结果是在哪?在这你要把你加工, 对吧?把这个原材料加工之后的一个成品产品输出出来。好在这大家是不是这样的话,是不是就通俗易懂了?我相信大家应该就能够很好的去理解这件事了。好,我们怎么输出呢? 大家记住,你看我们这里边是不是有三个不同的技能,也就是三个不同的任务,所以你输出的结果他一定是三个,哪三个呢?文案 对吧?然后这个是什么图片提示词,这个是什么视频的动作提示词。好,是不是这三个?那因此我们输出的结果他也是三个,他也是三个。好,我们点击这个加号的按钮, 我们点击这个加号的按钮,来再去添加两个变量。好,是不是添加了一共三个输出的一个变量,三个一个输出的变量, 好吧?好,来,我们来给他进行一个命名,这个名字输入变量其实也是跟你的输入那个名字输入输入变量去写输入变量,这个名字的规则是一样的,对吧?英文的字母或者是什么, 对,或者是这个汉语拼音就可以,好,那我们第一个就写文案,大家发现没有?我全是写的什么,我全是写的这个,这个,这个汉语拼音,汉语拼音,所以大家这个不要担心说我不懂英文,能不能去学,可以,对吧?没问题吧? ok, 好, 来,然后呢我们备注一下啊,点开这个箭头按钮,我们在这里要去添加一个备注什么呢?这就是我们的文案, 然后呢在这我们去写一个什么呢?第二个输出的边上就是我们的什么图片提示词,图片, 对吧?图片提示词,好,那这个就是我们的图片提示词,对吧?图片提示词,好。第三个就是我们的视频,对吧?我们照样还是写的是汉语拼音,好,那这个就是我们的视频提示词, ok, 好,到这里我们的三个输出变量我们就搞定了,就搞定了整个整个我们一号员工大模型这个员工我们就配置完了,一号员工我们就培训完了,我们花了将近半个小时的时间在这个上面, 为什么?因为我我们觉得整个的工作流的搭建,智能体的搭建,其实我们最需要去研究的,最需要琢磨的就是大模型,我们应该花更多的这个精力在上面去好好研究它, 对吧?因为你们很多的结果都是跟他的输出的结果是相关的,对吧?你后面比如说你的提示词,你生成的图片的好坏,包括生成视频的好坏,都是跟你的大模型输出的这个结果息息相关, 大家能理解吧?对吧?因为你,你,你后面不管生成图片是根据你的这个提示词,对吧?你提示词生成的好坏,对吧?决定了你视频生成的一个好坏, 大家能理解了吧?所以你看没有他,他这个他的这个重要性不言而喻,所以我们花的时间就比较久一点,我们讲的细一点,让大家能够更清楚, 来,我们继续,那我们现在有了,对吧?一号这个大模型的这个员工,有了一号大模型的这个员工之后,接下来我们来进行,对吧?我们,对吧?第二个员工就是我们的这个生成图片,生成图片 我们直接打开选中我们的二号员工,我们来对他来进一个配置,来对他进一个配置。好,大家会发现,那我们的二号员工就是我们的生图的,首先我们去选择我们的生图模型,首先我们去选择我们的生图模型。 啊,那我们的这个深图模型,那个墨雨,墨雨,墨雨爱这个伙伴,刚才我说这个大模型这块能,这个就把你刚才没有看到,能理解吧,对吧?就是你,你这么长的这一段话怎么来的?应该能理解了吧? 点这个自动优化提示词帮你去转化的,你,你首先得得要把你那个,对吧?你想干什么表达清楚了,说明白了,然后呢去优化一下就可以了,好吧?来, 好,那我们首先去选择一个生图的模型,那在这里呢?这里头这个模型跟我们这个刚刚一号员工的那个大圆模型就不太一样了,刚刚是 deepsea 豆包是什么?对,是帮我们去生成文字类的这些模型,对不对? 好,那我们在这里这一个是什么?这个是帮我们去生成这个图片的生成图片的,所以这些都是生图的模型,我这里我一般就是用这个通用 pro, 我 一般比较喜欢用通用 pro, 一个是它生成的效果 还非常不错,而且它的性价比非常好,价,价格比较低,对吧?好,我们就选用它,然后呢我们再去这个选一个比例,我们就选一个九比十六吧,对吧?这种竖屏的一个比例,如果你要选横屏的,你要选横屏,你就,你就用这个十六比九,用十六比九,好吗?对, 好,我们这里选择一个九比十六,然后呢把生成的这个质量拉高一点,拉高一点。好,好, 对,拉的越高,你生成的这个图片质量肯定会越高,肯定会越高,对吧?当然你生成那个时间也会也会变长, 好吧,好,那在这里呢,我们继续往下配置参考图,这里我们没有用到,我们没有参考图,就是说什么呢?就是说你添加就把根据你你的这个图片来去生成另外一张图片,就是图身图的一个功能,我们这里没有用到,我们用的是什么纹身图,对吧? 好,通过输入的文字来去生成图片,所以我们在这里输入这块,对吧?我们要添加一个什么?点击这个加号的按钮去添加一个, 对吧?添加这么一个变量,那这个变量就是我刚刚说的,对吧?输入的这个原材料,对吧?输入的这个原材料,我们来对它进行一个配置,我们来对它进行一个配置。好,怎么配? 很简单,点击这个小齿轮的按钮,点击这个小齿轮的按钮,好,我们对吧?可以看到开始和几这个一号员工,我们直接打开我们的一号员工的什么这个, 对吧?你可以看到有三个输出的这个输出的这个这个变量,一个是什么文案,然后第二个是图片的提示词,对吧?第三个是什么视频的这个动作提示词。好,来大家这个跟我互动一下,来,我们这里需要配置哪个? 需要配置哪个?可以在公屏上打出来配置哪个,是不是配置第二个呀?图片的提示, ok, 好, 我们直接选中我们的二号,这样我们就拿到了这个,对吧?拿到了这个图片提示词, 我们直接在这里进行一个引用,在正向提示词这里进行一个引用。好,怎么引用?好?摁住 shift 键, 然后呢?是不是就打弹出这个大括号了,摁住 shift 键打这个大括号,就会弹出这个变量。好,我们把这个对吧弹出的这个图片这个给他引用到这里,点击左键,好,那我们就这里就拿到了,对吧?就拿到了这个图片的提着词, 好,然后他就可以,对吧按着这个提着词,根据这个对吧给到大模型,让大模型按着这个提着词去生成图片了,就生成图片了。好, 到这里来到这里咱们的整个的深图的配置就搞定了,我们继续,我们来对我们的三号员工,帮我们深视频的这个员工来进行一个什么呢?来进一个配置了。好,大家可以看到这个就是我们的这个深视频的一个员工,对吧? 你会发现三号的这个圆框有两个,一个是什么?一个是这个两个一个是纹身视频,一个是图身视频,对吧?好,纹身视频什么意思?顾名思义,通过文字的描述,对吧?来直接去生成视频,好,那它的优点就是因为 文字描述他都是比较什么比较随意,就比较有创意,对吧?比较有创意,所以他能够生成一些非常有创意的一些视频,对吧?非常这个天马行空的一些这个视频,这是他的一个优点,但是他的缺点是什么呢?他的缺点就是你可能需要通过大量的什么,大量的这个抽卡, 对吧?然后呢他会,对吧?因为因为什么呢?因为你生成这个你的文字的描述,他一定是这样的,他他 不稳定,对吧?好,对,你的这个文字的这个要求就会比较高,提示词的这个要求就会比较高。好,那我们的这个第二个图声视频呢?图声视频是干嘛的? 对,图声视频就是通过图片去生成这个相应的一个视频,那他就相对比较稳定,不需要你大量的抽卡,对不对?好,那我们尤其对于我们的这个新手,对吧?初学者来说,我们一般我们就直接选用图声视频, 这样的话会减少你大量的一个抽卡,对吧?它的概率就会大大提高。好,那我们选图中视频,我们来对它简单的一个配置。好,首先你看这是什么视频的生成模型, 对吧?我们直接打开它,好,这个模型又跟我们之前的那个又不太一样了,跟 deepsea 跟豆包,对吧?那是大语言模型,我们的二号员工是什么呢?生成图片,我们选择的那叫什么?那叫生图的模型。好,这里我们选择的是什么?我们选择的叫做视频生成模型,对吧?好,那它这个就简单,就两个, 就两个你需要做的,对吧?你就选其中一个,那这个是 light, 对 吧? light 模型,这个是什么? pro 模型,那这个就是 相对便宜点,对吧?那这个就是贵一点,深层的效果会比它好一点,这里我选择这个便宜点的。好,主要是给大家去演示啊,然后分辨率三个分辨率最高的幺零八零 p, 现在目前这块它最高就幺零八零 p, 然后四八零,对吧?七二零。好, 然后时常是一个只有两个,一个是五秒的,生成五秒的一个视频还有一个十秒的。好,来讲到这里呢,我给大家看一下我们官方升视频这个插件的这个成本是多少?然后大家自己去生成视频的时候,大家心里也有个数啊,你们去看一下他的一个升视频的一个成本还是比较, 对吧?高的生成幺零八零 p, 五秒钟的一个视频, light 模型是二十五万的一个 talk, 相当于多少呢?相当于是两块五,那 pro 模型相当于多少?三百六千三千六百个字样点就相当于三块六, 好吧,这是他的一个生成视频的一个成本。好,那我们现在选的这个,对吧?最低的这个要要求的一个最低的一个大概的成本是在五毛钱左右,五毛钱左右。 好,那我们这个就选完了之后我们来配置这个参考图片啊,参考图片,参考图片在这里呢,来,大家注意看我们的手帧图片,我们点开这个小齿轮的配置按钮,我们,对吧?我们去选择一下我们的二号员工,二号员工是什么呢?在这,对吧? 对,这个 date 就是 存的什么放的就是我们的这个,这个,这个,这个图片图片,对吧?好,我们把它配置给他。好,那这里呢?伪真跟参考图,对吧?咱没有,因为咱们就一个二号员工申图的,对吧? 好,所以我们这里没关系,我们这里可以不用去配,他,照样可以生成视频。当然如果你想进一个控制想生成的整个视频的这个生成的一个 结果,是按照你手针跟尾针去生成的一个这样的一个结果,你需要去这么控制的吗?你需要给他一个尾针的图片,对吧?那我们在这里有个手针就可以去生成了,让他让他去去根据自己的一个 大模型生成这个视视,生成视频,生成模型自己去发挥去生成,好吧?好,那 我们这个图片就配置完了,接下来我们要添加输入,这个输入是什么?对,输入的就是我们的视频的这个动作,也就是我们常说的运镜,你要让这个图片怎么动起来,怎么动?好,所以我们在这里添加一个输入,输入的就是我们说的什么运镜动作,提示词在哪? 从哪去拿,是不是我们的一号员工,对吧?我们的一号员工这里都有三个变量,前面两个我们已经用过了,对吧?一个是写文案的,一个是帮我们去生成图片体式词的。好,第三个是什么? 第三个就是我们需要的这个视频的动作体式词,也就是我们的这个运镜,对吧?让图片怎么去动?变成一个视频,好,我们去把它进一个配置。 ok, 好,我们点击左键给它进一个配置。好,那这样我们就拿到了什么?拿到了这个运镜,拿到了这个视频提示词,然后我们在哪?好,我们在哪?我们在这个提示词这个部分,我们在提示词这个部分, 我们直接把它引用进来。怎么引用?摁住 shift 键打出大括号,它就会自动弹出这个变量。好,我们把它引用到这里。好, ok, 把它引用到这里。好,这样我们就拿到了,我们就拿到了这个视频的这个动作提示词。好,他就会干嘛?就会结合这个图片给到这个生成视频的这个模型,帮我们去生成视频了, 帮我们去生成视频这个就是他整个配置的这些这些参数我们就配置完了,好吧?输出,输出这里我们不要配,不用配置了,输出他这有一个默认的固定的一个什么微丢的一个输出,他就是输出的是一个视频的一个 ui 地址,对吧?你点开他,你点开他就是你的这个视频了。 好,那这样我们整个的视频我们三号就配置完了。好,来,大家有问题,我们先跑一下吧,跑的过程当中我给大家回答一下大家的问题,好不好?来,因为跑正好需要这个工作,需要这个时间,我们正好边边边跑这个工作流,边给 边这个回答一下大家的问题。来结束的这个节点我们来配置一下,我们去比如说你要输出这个一号的这个文案,对吧? 然后呢你还可以输出其他的一些这个,比如说这个图片,你想输入出来,或者说最后的一个视频,你想输入视频这个微调,就是这个这个地址,视频的这个地址,好,这样我们整个的这个工作流就生成完了,就就就就就搭建完了啊,就搭建完了,好吧?好,我们搭建了,我们搭建了 快一个小时了,当然你如果真的自己去搭的话,可能五分钟,对吧?十分钟就搞定了,那我们主要给大家,对吧? 把中间的一些细节给大家讲的非常细。好,我们直接点击这个试运行来打给我一个主题,给我一个主题,我们让他,我们来跑一跑,对吧?我们搭了半天的工作轮,我们来跑一跑,看一下效果。然后呢对跑的过程当中我来给大家回答一下大家的问题, 大家有问题的可以把你们问题打在公屏上,我一会来给大家统一的去回复一下,来给我一个主题,有没有的?我们去生成一下看下结果。大家给我一个主题,有没有主题,随便随便,因为我们这个,我们这个不调不调,没有,是吧?没有,我自己写了一个,比如说这个 跳舞的古代,好,我们我们就这样,我们直接点击视频,行,我们来跑一下,好,跑的过程当中,然后大家这个我来回答一下大家的问题, 好,我们来看一下是不是一个一个,这个我写的是一个跳舞的女女子,对吧?这是一个跳舞的女子一个场景,他怎么为什么是这样的一个场景呢? 他一定是根据我的提词词走的,我们来看看一下他的提词词是什么就知道了。在这里是不是根据你的提词词去走的? 风格是国风,写实的风,对吧?主体一位穿着红色古装翩翩起舞的古代女子,对吧?场景是在古代的庭院中,石桌旁边,周围有盛开的花朵和随风摇曳的柳枝,是不是这个场景 是吧?好细节,女子的发丝随风飘动,群摆这个,这个飞扬。好,这是细节的一个描述啊。你再去看这张图片,是不是按照我们的提示词去生成的,没问题吧?一定是这样的,一定是这样的, 我们再来看一下视频。好,视频在哪?在这,我们再去看一下,点击他,然后呢去播放一下,看一下效果。五秒钟的,五秒钟的一个视频帮我们切了三个,三到四个这个分镜头,三到四个分镜头,所以 你看没有,他一定是根据你的这个运镜走的。视频的,这个提示词在哪?我们再去看一下。呃,他这个确实有点多了,在哪?在这 四个镜头跟我说的没错了,四个镜头,其实你这里可以给他限制一下,在你生成视频动作提置词的时候,你就说跟他说,对吧?五秒钟的这个视频,你就帮我生成两个分镜就行了,因为四个分镜明显的感觉到这个,你说五秒钟的这个切的太快了,大家能理解吧, 对吧?切的太快了,所以我们五秒钟要两个镜头就行了,两个镜头足够了,这个四个镜头就太快了,你看第一个镜头对吧?你看一下他运镜怎么走的?推,镜头从古代庭院大门推进,展现整个庭院的景色,最后聚焦在跳舞的这个女子身上, 是不是?大家回忆一下,是这样的,好。然后呢?镜头二是平移镜头跟女子这个舞动,展示他全身的一个动作和优美的舞姿,对吧?好。第三个镜头是固定的镜头,拍摄女子灵动的眼神和精致的妆容,对吧?好。第五四个镜头是 镜头拉远了,展示女子和周围环境的一个融合,最后定格的一个画面,画面定格好,我们来再看一下这个视频,对吧?我们再来看一下这个视频的一个效果,你们再去结合他的一个刚才的一个运镜,是不是?是不是按照我们的这个运镜啊?这这个四个运镜去生成的,你们去看一下,你看 是吧?特写,然后拉远定格,对吧?没,没问题吧?虽然他很快,他的这个效果很快,因为他就是这样吗?我他四个镜头吗?切的太快了,但是他是完全遵循什么? 遵循我们的这个提示词去生成的,对吧?生成自媒体这个素材内容的一个完整的,对吧?完整的一个工作流就答完了,大家不要看他简单,你把这几个模块学明白了,你后面做很多的一些这个这个自媒体生成自媒体内容的,其实 说白了什么呢?你就可以举一反三了,对吧?你就可以拿它来举一反三,或者说拿它来照猫画虎了。你把这个搭完了之后,你可以延伸出做很多很多其他的一些这个这些这些内容,可以的,好吧?比如说你在这个基础上, 对吧?你要,你要去加声音,加字幕,对吧?加其他各种什么元素可以了?好,这个视频,这个整个的工作流就给大家讲到这。

大家好,今天介绍第四个 ai 生成 ppt 的 工具 cos 空间,它是字节推出的个人知识库产品,它与大家比较熟悉的 cos 是 两个不同物种, cos 是 和 daffy 类似的智能体开发平台, cos 空间知名度则要小很多。它现在有两种生成 ppt 的 模式,代码模式和设计模式。代码模式属于经典模板流,先根据用户上传原文 输入内容要求提炼生成大纲结构。在基于用户选择的 ppt 模板,将生成的大纲结构填入到 ppt 模板中去,得到最终的 ppt 内容。对应成果形态是 基于 ppt 模板加常规组建加文字填充设计模式,属于视觉直出流,他们抛弃 ppt 模板风格,样式组建和文字完全依据用户输入的原文,利用文声图模型去动态构建出一张张完整的图片。对应成果形态是 每页都是一个完整的信息图片。那接下来第一趴,我们先选择默认的代码模式,也就是经典模板流来测试。我们同样选择基于原文来生成演示文稿 ppt 的 场景进行测评,按之前在测评背景中描述的完整流程和步骤来测试。一、 首先看下上传原文件的能力,进入扣子空间生成 ppt 的 页面,可以看到左下角,这里这里有两个按钮,左边一个是选择知识库中已有的文档作为研文,右边一个代表临时上传文件。二、接下来输入提示词。为了横向比对, 我们还是使用这套相同的提示词来生成 ppt 作对比,包含基于原文的要求以及对受众的描述、风格的描述和五个主要章节的要求等。三、然后再点下这个设置按钮, 可以看到扣子空间的参数设置比较丰富,可以设置对原文的遵循程度以及页数和内容密度等信息。这里我们还是选择十五页左右的样子。四、 在就是要选择模板了,下面可以看到扣子空间目前模板风格也比较丰富,选一个赛博一点的。五、点击生成扣子空间,也是会先生成大纲结构,再生成 ppt, 这个大纲结构看起来比较准确,我们就不需要手动调整了。六、再点击生成 ppt, 等待大约几分钟,结果就出来了。七、接下来我们来对比下成果的质量。 按之前在测评背景中描述,我们选择原文,最后总结这块的部分内容,来横向对比扣字空间代码模式的效果。先看看它的内容匹配度,从标题到内容错也没错,就感觉提炼的内容有点少,而且重心提炼不太准。再看看展现效果, 文字样式和布局看起来都比较简陋,不过整体结构是清晰的,部分页面也会引入一些列表组建,加小图标,加颜色样式来增强展现效果。八、再回来看看二次编辑, 扣子空间这里可以直接在线二次编辑,也可以导出 ppt, 在 线下编辑还是比较方便的。九、最后看下扣子空间的历史对话记录, 它生成过程的记录,还有历史成果都在,随时可以重新点进去再次修改。十、从使用成本方面来看,扣子空间应该是完全免费的,目前没看到功能收费限制或者使用次数方面的限制等。好到这里,扣子空间代码模式的评测结束, 我们对前面评测的环节做个总结,环绕 ppt 成果质量、生成过程可控性、二次编辑方便性、成本与费用这四个大的角度 对它做个打分。看一下这个图片,声明下,这仅代表个人体验和观点。接下来第二趴是扣子空间设计模式,还是尽量遵循前面一样的步骤来测试。一、 上传要生成 ppt 的 原文,还有输入提示词,都和代码模式一样,这里就不重复介绍了。二、设计模式最大的区别就是这里没有参数设置按钮,也不需要选择模板了。三、直接点击生成 扣子空间设计模式,它直接根据文章内容和提示词的要求,进行每月的视觉风格描述和每页要表达的文字内容, 这个过程不需要用户介入。四、在生成 ppt 过程,设计模式相对比较耗时,不过还在能忍受的范围内。五、最终出来的成果,我们看看质量,先看内容匹配度,标题是原数据是二、 a g 从理论到实战的桥梁,这个和原文是非常匹配的, 下面内容文字摘取也比较准确。再看看展现效果,体现桥梁的图片,非常具像化风格,虽然有点炫酷,但桥梁的作用全靠下面一段文字来表达,还是有点欠缺。不过总体来说已经超过代码模式很多了,也超过前几期评测的几款工具了。六、接下来是二次编辑能力, 可以看到设计模式支持在线二次编辑,它实际是利用文生图模型来动态修改,它也能导出 ppt, 但导出的 ppt 中也是图片。七、设计模式的历史对话记录和经典模板差不多,不重复描述了八、成本。费用方面,扣子空间设计模式也是免费的, 目前没看到功能收费限制或者使用次数方面的限制等。好到这里,扣子空间设计模式的评测也完成了,我们也从评测的四个角度打了个分, 看一下这个图片,声明下,这简代表个人体验和观点。最后我们把扣子空间代码模式和设计模式的打分放在一起做个对比,方便大家选择。

大家好,我是凯哥,我们之前已经讲过了图片理解的一个自己的制作方式和使用方式,那我们这期视频来讲一讲如何去进行一个视频理解以及复刻。 那么如大家所见啊,我们说进行视频理解和视频复刻的话,就是为了进行制作的一个仿照的视频。那么我们先来看一下我们的一个案例视频,当然我是用豆包跑的,所以效果没有那么好。好,我们来看一下, 那这是我们的一个案例视频啊,比较短,而且这个效果说实在的确实很一般啊,但是不影响,我们毕竟是用来做一个讲解的案例嘛,所以它的效果呢,其实不影响我们后续的讲解。 然后呢我们在这里啊看,我们,比如说,尤其是对很多行业来讲,对吧?我们有了一个好的一个视频的展示方式之后啊,我们要进行复刻,那我们在这里看, 首先在这里呢啊,首先在这我们有三个参数,一个是我们的目标视频,我们要把它拿下来,还有一个这个是我们需要替换的自身的一个图片啊,我们自己需要用到的一个图片。然后最后这个呢,就是我们这个图片的一个名称 啊,或者是说我们这样的具体的一个事物的名称。那我们有了之后,嗯,我们后面呢这里看,我们这是扣子官方出来的一个叫视频抽真的东西, 视频抽针,然后这个视频抽针呢,他一共有三种方式,他分别是定数抽针,这个定数抽针是什么意思呢?就是你指定你要抽取多少次,就简单理解,就是指定你要抽取多少次,你比如说十针,对吧?那这就是抽十次,你要抽二十针,那这里就抽二十 次,好吧?好。还有什么是一个等时抽针?这个就是根据你要设置的这个时间去进行抽针 啊?我们刚才叫等数定数抽针,这个你比如说一段二十秒的视频,你要抽二十针,那就一秒一个,一秒一个。好,那这个定时抽针呢?也是比如说二十秒的视频,你要十秒抽一个,那就是抽两下,对吧?你要五秒抽一个,那就是抽四下。 好,是这样的一个理解方式,那这两种方式其实不是特别好使,因为我们这个视频变化的过程太快了,他的一个抽帧的时候,这个抽到的这个内容呢,可能就比较的模糊。 那我们还有一个什么呢?还有一个叫抽取关键帧,那这个抽取关键帧就是当我们这个视频整体的画面,他出现一些变化的时候呢,他就会去分析当时变化的那一帧,那一刻的那个图像的画面 啊,就这么去理解。所以一般来说啊,我们去做视频理解的时候,以及我们去做一个视频复刻的时候,我们采用的都是抽取关键帧,就是抽取他变化的那一刻的那一个帧率的图像 啊,我们叫关键帧。好,那我在这里选择好关键帧之后,输入我们的一个目标视频,那下一个我们是不是要进行一个他的一个抽帧的理解, 对吧?那我们将它前面的啊,我们前面有很多参数,是吧?我们在前面这个参数里面,这个叫 chunks 啊,它里面有等等等等这些这些我们把整个的一个对象数值给它拿过来扔进去啊,扔进去,然后扔进去之后,下面就是我们需要对这个抽帧的画面进行理解了,对吧?那我们理解的画面啊,当然这里我是 用的有模特的啊,用的有模特的,所以呢我会让他去这样去写,当然有时候不一定非得有模特,对吧?这个题词呢,就看大家的这个 自己的需要啊,自己对目标视频的一个啊,需要他的一个整体画面的理解,去具体的书写这个题词,当然我这个题词写就很简单,非常简单。 好吧,那我们的后面呢,有这个提示词之后,我们就要去复刻生成它的一个视频提示词,其实呢就是将我们前面在这 啊,在这生成的这些抽真理解的画面内容,以及我们整体的视频和我们需要替换的图片呢进行一个融合, 按照这个视频的顺序将我的抽帧的画面呢进行理解融合,替换成我需要替换的一个目标图片,那就这个提置词的作用, 好,那我们有这个提置词的作用,这样这里呢我们选择的依旧是我们扣子官方的一个视频生成啊,他用的是豆包的一个 lit 模型 啊,这个模型确实效果也一般啊,确实效果一般。好,我们看我们在这里呢选择的是图声视频,然后我们选择这个模型,我们选四零八啊的一个分辨率以及一个十秒的时长,然后参考图呢, 好,我们就将我们这一开始上传的一个需要替换的图片,在这里给他做一个格式转换啊,给他转换成数组的形式之后,加上我们的一个前面复刻的一个视频的提示词,给它传入进来,然后等待它生成就行。那我们来看这生成效果,它其实这个生成效果有点穿模啊,有点穿模。 来,我们先去啊回顾一下,对吧?这是我们的目标视频,然后这是我们的图片,我图片选用的是这个第二张这个,所以我没有去水印啊,他都是带着水印走的。好,我们来看一下 是吧?确实效果一般啊,这个效果一般有几个原因,一个是我这里这个提示词呢啊,这里我们分析抽帧画面提示词的时候很简单,然后融合的时候很简单,再加上我们这个豆包模型,确实它在视频生成效果方面也比较的差 啊,比较的差,所以就导致我们出来的最后效果其实也很一般啊,也很一般,我没有细致的去打问这个提示词。 好,我只是说咱们大家如果是需要做这样的一个视频理解视频抽帧以及复刻的话啊,我们就按照这样的一套流程来即可,这样的流程来即可。好,那么我们本期的视频到这里就结束了,关注我带你了解更多知识,我们下期再见。

开发一个扣子插件,你觉得需要多久?看我这套操作,从 ctrl 生成代码到一键同步到扣子平台,满打满算也就两分钟左右,你看屏幕,现在已经全部同步完成了。为什么这个流程能这么快呢?因为以往字眼插件最容易卡在四道坎面前。 第一,不懂编程,看代码像看天数一样。第三,参数得一个一个手动配,费时费力。 最消磨耐心的是第四点,好不容易弄完了,审核却不通过,还不知道究竟是什么原因。这种大海捞针式的排查,经历过的小伙伴应该都有体会,比起手动折腾,这种自动化的逻辑才是效率的关键。 举个例子,我发现了一个免费的大模型平台,想将它接入扣子,直接点击查看 api 文档,复制所有内容,然后在科室里新建一个参考文档, 把内容粘贴进去。接着要用准备好的 code 插件开发规范以及刚才新建的参考文档,告诉他开始开发,剩下的就交给工具去处理吧。 开发好了,我们点击确认,然后运行同步。小助手选择刚才 ai 自动创建的插件文件夹, 大家看一来,安装工具、信息代码、逻辑、参数、配置现在都是自动一步到位。 这套流程不仅是快,关键是后期迭代也很省心。比如我想到了几个优化方案,第一,直接将我的 api 可以 内置,不需要设置为参数。第二,添加故障转移功能,当一个模型失效的时候,自动切换到另一个模型,直到成功返回结果。 第三,只需要输出模型的回复内容,其他参数都删掉,然后放上内置的 k 发送 好了,不需要手动改任何一行代码,让小助手重新跑一遍,它就会自动更新。 我们到工作流里实际测试一下输入的内容,选择开始节点的音符的参数模型,我们随便选择一个型号输入,然后将答案输出, 点击试运行,随便输入一个问题,比如一加一等于几, 响应很顺滑。这个插件我已经发布到扣的市场了, a p i k 也是内置好的,大家搜一下就能直接用。另外,如果你对这套工作流感兴趣,可以去老立方查看。

那么本期视频主要是想带大家了解一下这些大模型和供能模块有哪一些,以及如何去使用它,例如我们在后期自己搭建或是说破它的时候,不至于完全不认识它,或者不知道去去怎么运用。 那么我们要先分清的是大模型和工作流是我们这期视频要讲到的, 但是它和平时我们用到的 ai 工具的最本质区别在哪里?就好比如我们要写一篇新闻稿,这个新闻稿还要附加一些图文样式,那么我们就可以运用到大模型还有工作流, 从大模型中输入一些比较关键的提示词成,我们就可以一一键到底拿到正文还有图文样式。 那么类似于豆包的 ai 工具,我们需要一步一步地修入关键词,先是得到我们需要的新闻稿,再到下一步的再次修入其中关键词,才能得到我们的图文。 那么意思就是我们的工作流和大模型会相对于普遍的 ai 工具来说会 自动化一些。那我们现在来到了扣子编程的酒业哈,我们可以在工作流开发里面进入,或者说是资源库都可以进入到界面,点击资源的工作流创建工作流,创建一个新的工作流可以叫哦实验。 那么进入到这个界面,我们可以看到最初始画的两个节点,开始和结束,我们可以通过添加节点的这个快添加到大模型和我们想要的插件组建之类的, 也可以从开始这里拖拽结束也是可以的,可以看到我们可以添加自己想要,最近我们用到的都会在这里说已收藏的插件还有代码选择器,最常用的也有很多,比如说这个图像生成, 还有视频生成之类的,后面一一都会讲到。那么如果我们想要进一步的去了解或者认识这些后续会议用到的组建,可以在评论区扣 扣一一,我们会发送资料到你的手上。相信很多小伙伴都会想到大模型和差距到底区别在哪里?我们可以看到这个插件,插件它也有很多的 我们可以运用到的东西,比如说先问这种 ai 的 小模型,还有图片生成,豆包的图片生成,想要查询天气,我们可以用到这一个插件,那么我们来到大模型, 大模型它是作用于我们要人工地去输入关键的提示词,然后它就通过这些文本输入来回复我们达到我们所要的, 它可以用于比如比方说格式的转换或是文案的恶创之类的。 那么我们可以看到这个大模型,这里有提系统提示词,还有用户提示词,它们两个的区别在哪里呢?系统提示词是提供系统级的指导,就是电脑它的里面系统可以给到我们,比如说自动优化可以看一下, 那么这些就是大模型的系统提示词,这叫大模型的提示词,它分为很多类, 那么我们可以再到用户的提示词,它是向模型提供的用户指令,就是简单来讲就是人工,这个是需要人工去输入自己的文件的提示词,它就可以基于文本来回答我们。 那么讲完大模型,我们可以来看一下插件, 对于你想要得到的多去挑选适合的插件,一些插件是免费的,可以看到有免费字样,但是有一些插件呢,它是有着付费的,可以看得到付费的内容情况。 那么还有一个工作流,工作流就不具体展开了,我们的工作流可以看到,比方说 可以看得到下面也有很多的模板可以为我们进行参考,或者说是直接去那用,它是比较复杂的,那么我们以业务逻辑的循环这个模块来进行 将记一下,首先记得每一次都要先连接,不连接它是无法读取你这个模块,它所输入的内容用在于,比方说如果我想要同一个 文本内容去生成二十张、三十张这样的图片,我们就可以运用到这个图像生成的节点,放在循环体里面,它就可以循环往复地为我们生成二十张、三十张我们想要的图片数量,它是循环往复的生成, 这样就不用我们去添加二十张、三十张或者更多的图像生成的这样的模块。 那么现在比方说拿一个节点做举例,我们可以用比较常见常用到的图像生成, 要记得每一个节点和每一个插件组件都要先相连接,接下来可以用一下优化布局 是乖一些,我们这边可以看到这个插件可以设置模型,还有参考图的上传,还有输入,输入是自己必填的,一定要填上开始的模块, 那么这个模型呢?它是不同的模型有不同的功能吧,比如说这个扣子自带的模型,它可以设置一次性生成多少张图片,或是说 或是说是否要带水印这一些选择,那么通用的都是这个通用扣, 他呢就是会给我们带一些默认值,这个图片的高或者宽度都是默认图片的值是这个参考图,我们可以自己添加或是不添加都是可以的。 这个参考图如果不添加的话,我们可以通过这个提示词,通过正向的提示词或是负向的提示词,但是 正向提示词和副向有什么区别呢?正像是在于好比方说就是这个正向提字词是要告诉这个 ai 必须画这个,或者重点是要画这个,这个我需要的图片之中一定要包含的内容 就是 ai 画图的核心素材,还有加就是它的加分项吧。那么反向提示词反过来就是说绝对不能画,或者说是坚决避开,完全排除这一种,它是不可以画的减分项这些。 那么我们举个例子,比如说我们要想要献成一个古风,古风女生,还有 那些小动物之类的,那么这个小动物我们的圣象提示词是比如说要把它描述画在它的草地上,阳光要洒下来, 那么反向提示词就是它的颜色,我要的是橘猫,但是不可以画到其他颜色之类的,那么古风美女的那些,比如说我要 的衣服是红色的,那么它的这个古装汉服是不可以有其他颜色的。 再看到下面的这个输出,这里有个 image 的 date, 还有 msg, 这么这个 date 的是说明生成的图片通常是公开或可访问的, u r o u r 幺是链接, msg 是 节点执行的状态,比如说 就像是运行成功或是运行失败的提示,那么接下来我们去试运行一下哈,我们比如说我们要宣传一张 那么正,那么正向提示词就是我们需要的图片内容,那么负面提示词就是我们不需要,比如说我要的是丝瓜汤,不要哦木瓜汤, 那么我们去试运行一下,注意检查的是输入和输出有没有选好选项哈,那么我们试运行,我们需要的是这个, 那么我们可以看到运行成功了,运行成功出来,我们这个输出是成功的 success, 还有这个注意看到的是我们收入丝瓜汤,它就给我们生成的是丝瓜汤的图片, 还记得刚才说的 date, 还有 msg, msg 是 标明了成功就是运行成功了, date 就是 网页,我们生成,我们生成出来的图片,我们按进去就可以得到,放大吧都可以,就是下载都可以, 那么注意的是哈,可以看到我们的左上角有个运行成功十二秒的零 takes, taken 是 什么?就是我们前面说到的算力,就是我们生成这一张图片需要用到的计费金额之类的, 那么生成了图片我们看着虽然说是看到都流口水,但是我们可以试着去做一下视频,去看一下它能不能更加生动一些,那么我们现在就可以用到这个节点,我们中间要加什么节点呢? 哎呀,菜菜太聪明,这是视频生成哈,这个视频生成直接就给我们优化一下布局哈,这样更容易看清楚一些, 那么看到这个视频生成有纹身视频,还有图纹身视频,纹身是视频吧,就是我们自己人工去输入提示词, 我们可以输入,比如说这个视频里面我要把这个丝瓜糖怎么怎么样去喝掉它啊,还是说吃掉它之类的, 那么图纹身视频呢?就是可以滑到参考图片,有手针图片,尾针还有参考图,参考图是都是可以上传 照片的,我们还是记得一定要选择这个 m s g, 那 么我们看一下都选择同一个可以吗?我们来尝试一下, 可以看到说是不支持同时配置参考图和首尾针的哈,就是不能同时设置你同时有首尾针的图片,又要参考图, 那么我们可以去掉首尾针,因为我们都是只需要这个参考图,这个参考图就是前面生成出来的丝瓜汤。 讲完了这里可以看到上面还有一个模型设置,和前面的图像生成是一样的,它的模型不一样,它生成的功能也是不一样的。还有比例,这个分辨率是说 可以看到这个模型是不支持这个最高的分辨率的,那么我们只能用到四百八的分辨率, 但是同时说明的是不同的分辨率,它的计费程度是不同级别的, 越高的分辨率它的计费是越高的,那么这里可以看到有一个总资的值,总资值就是它其实就是 ai 声视频的固定创作编号,同参数下一个编号对应一个固定视频, 那么换编号就会生就同样主题,但是不同细节的粑粑,哪怕他是负一或是一将,他都不是同一个编号。那么我们现在需要做到的是利用视频生成的 插件,再结合前面图像生成的丝瓜汤的图片来进行一个视频的编辑。那么我们可以刚才说到的图纹身视频还有纹身视频这样的纹身视频,我们现在可以先试一下啊, 纹身视频,纹身视频就是要需要用到提示词,有时候我们来一个小孩子用勺子喝丝瓜汤这样的, 还有这个输入的值变量值,我们要注意了,我们是要用到,我们如果要用到前面的图文生成出来的图片去结合成一个视频的话,我们要选到这个 dates, 这个就是图片的网址,也是图片这个的本质, 我们去试运行也要注意这个结束,这个结束我们要选中视频上传的 v d o 就是 视频这个 m s g e 就 可能是会读取错误, 我们试运行选择这个 v d o, 我 们来试运行。有一个我们盛传的项目是小孩子用勺子,有一个小孩子的出现, 这里运行成功了,前面的那么可以看到我们的视频生成就运行成功了,也可以看到这里 m s g 开始是输入的, 输入的网址就是输入了 date date 这个网址,那么它就是成功地读取到了这个网址,再输出这个视频,这个是视频所在的地址哈,我们点进去可以看得到这个下载好的视频 读取成功,我们来看一下这个, 好的,那么我们刚才讲完了纹身视频的,它们两个的区别在哪里哈? 注意的是图,纹身视频和图生和纹身视频,我们放大来对比一下图纹身视频可以看到它的参考图片,未配备参考图片,这里是第一个区别哈, 那么其他这些模型设置是一样的,它是关乎到模型的问题,并不是 并不是坏的问题啊,那么参考图片我们试一下,在参考图这里点击对,就就是要选就用这个 emoji 的 图图像选项, 这个也是也是对他的。其实死还是我们来用一个小孩子喝丝瓜汤试运行一下,输入也是这个试运行, 可以看到这里运行成功了,但是这里却运行失败了,这是为什么呢?那么我们再倒再倒回来看一下哪一步出错了, 那么我们可以试着在手针图片这里,还记得前面是说过,如果有了手针的 yes 这个选项,但那么参考图这里就不可以同时出现了,把它关掉,我们用同样的提示词再次运行一下, 可以看到这个图片运行生成成功了哈,看一下视频生成,看到的是这个视频生成也成功了, 那么这是 为什么呢?它们的区别到底在哪里?主要来说比较核心的原因是在于插件的图纹声,视频是 逻辑上把这个前面生成的参考图当做视频的首帧第一帧的画面模板,而不是整个视频,这是全视频。再简单来些就是这张图不是 ai 画视频的 全程参照物,只是视频开头一开头给我们呈现出来的画面而已, 所以说我们不能放在参考图这里。这个图文生视频的选项的时候,我们是不可以在参考图这里选中参考图的,只能选中手帧或者尾帧图片, 但是手帧和尾帧图片是可以同时选选中的,像这样, 那么本期视频我们了解到了图像生成还有视频生成这两个最常用最常见的模块,这两项,这两个插件可以同时运用于不同的场景或者不同的作用, 那么我们下期视频可以继续再来讲解一些 关于这个工作流的其他模块、插件或是功能之类的,我们下期的视频再见吧。


hello, 大家好,现在扣子升级到二点零版本来了,很多同学问我需不需要学习,这个还需不需要学习工作流了?其实 啊,咱们扣子虽然说升级到二点零了,但它的底层的话呢,这个工作流咱们还是必须要学习的啊。首先我简单介绍一下咱们二点零版本 它有哪些改变啊?首先咱们这个扣子空间和咱们这个扣子编程啊,它的整个积分系统已经打通了,看一下之前扣子空间它是不需要积分的啊, 然后它里面的一些会员的版本有些小的改动, 比如说他像以前的话呢,我们扣子编程的话呢,是每天有五百啊,免费积分,现在变成了一千五百啊,一千五百免费积分啊,免费积分升级了一些,但是咱们扣子空间啊,咱们扣子编程里面的呢, 这个空间啊,空间不能新建空间了啊,已经不能新建空间了。 然后咱们这个扣子空间里面呢,它是不是多了一个啊?技能商店啊,多了一个技能商店,然后还要直接可以连通到扣子编程呢,现在扣子空间可以直接跳转到扣子编程里面去,然后多了一个技能商店, 然后咱们扣子空间里面的这个积分体系啊,也有积分体系了,大家可以看一下啊,也就是它现在扣子空间和扣子编程里面积分现在是通了啊,打通了,然后我们看一下它,首先咱们这个技能商店, 我们进入这个技能商店里面,现在是不是有很多技能啊?现在目前的话呢,咱们这个技能商店里面呢,已经啊有一些技能了啊,已经看一下,虽然说不是很多,但是已经有一些了, 然后我们这里可以直接点击这个创建技能啊,这个创建技能的话就直接跳转到了我们的那个 code 编程里面来了,然后然后它可以直接用咱们自然语言啊,来进行一个技能的,一个啊,一个开发 这个 code 编程咱们先不讲啊,然后咱们还有一个看一下 它的一个对话模式啊,也有些改变,比如说像现在它这个对话模式,它可以加啊,可以加技能啊,看到没有?也就你可以把啊你需要的一些技能加到这里面来, 然后直接可以让他做了啊,直接可以让他帮你做了,有点类似于一个小插件的意思啊,有点啊小插件,然后还有一个功能啊,给大家介绍一下, 就是咱们的这个啊,扣子空间里面这个长期计划,长期计划我们点击咱们这个啊,这个下面这个加号,然后就可以创建一个长期计划,看一下这个呢啊,我试了一下啊,看到没有?也就说你啊只需要发 提一个要求啊,比如说你最近需要干什么,比如说你最近啊,最近一个月需要做什么啊,做一个什么小项目,然后你发给他,然后他就能够直接你看到没有, 他就可以直接根据你这个啊需求,然后他给你设立一个日程,就你每天需要做什么,然后他包括你每天需要的一些啊,需要需要的一些素材啊,什么东西的,他都可以给你安排。 其实这个功能还是蛮不错的啊,蛮不错的,看一下他有点类似于啊,你看一下, 包括从这个选择题啊,他每天你需要做什么,他甚至把一些啊,一些素材啊,包括这些图片啊,什么东西都给你准备好了,你看 啊,这个功能还是挺不错的啊,说实在的大家可以去试一下啊,但说实在这个插件功能的话呢,他这个技能啊,他这个技能的话,其实的话 您可以理解成一个一个插件啊,可以理解成一个插件,其实它还是代替不了工作流啊,它其实你可以做它这个技能的话呢,相当于是 做一些简单的一些啊,一些事情的话还是可以的啊,就是一些重复简单的事情还是可以的,但是如果说你想做一些啊,比较 就是,嗯,比较系统性的一个事情的话,还是需要用到我们的扣子编程里面的工作流啊,啊?还是需要工作流,你看它这个里面的技能,比如说一些 啊,一些简单的一些啊,一些流程啊,一些一些简单的流程呢?看到没有?比如说一些简单的数据分析啊,什么生成一个 ppt 啊,包括一个思维导图,什么东西的啊,这些都是可以的, 但是想你想正常的是不是啊?做一个比较,嗯,比较大一点流程化的一个项目的话,还是需要用到工作流,因为工作流的话它还是比较稳定的,而且的话咱们这个技能的话呢,它是封装的,封装的 你不是很好改,所以这个针对的话,针对一些小白的话呢,还是比较方便的啊,针对小白的话,你可以直接 就直接把它添加啊,添加进来用一下是没毛病的,但是如果说你需要的一些比较复杂一点项目的话,还是需要我们用工作流啊,来搭建我们的工作流。 所以说他目前的话,以目前呢,他这个能力的话还是代替不了工作流的啊,工作流还是我们啊一个底层的逻辑 啊,目前它的改变的话基本上就是这些,但是整个这个还是比较好的。比较好的看到没有?因为它现在把这个 cos 空间和咱们 cos 编程啊进行了一个打通,这样的话有更多的人啊会了解我们的这个 cos 编程。 好,今天就讲到这里了。

好,同学们,我们这节朋友们,我们这节一起来给大家一起来分享一下啊,我这个证件照工作流是智能体当中的一个选择器的一个插件啊,选择器插件啊,除了一头一尾,大家这个我之前给大家分享过,对吧?一头一尾一个输入一个输出,对吧? 这个结束的是输出,然后选择器插件主要是用它来判断我们输入的输入的这个制服啊,输入的这个文字代表我们要选择的一个一个方向啊,我这里的选择器的话,它主要是做了两个选择,第一个是选择蓝色的背景,第二个选择红色的背景, 否则就选择白色的背景啊,它是通过这个选择器来做选择啊,所以说大家的话直接是在我们的添加插件这里面选择我们的选择器啊,选择器点一下就可以了,好, 就和我上面一样的啊,这个名字我们是可以改的,对吧?名字可以改,因为上面有个选择器了,所以说它这里面加了一个下边一做区分啊, 然后在这个里面我们可以添加我们需要的一个选择器的一个相关的一个判断啊,就是像我这里面一个变量,对吧?这个变量是什么?你可以输进来,然后他的条件是什么样的,对吧?你可以选择啊,选择我们相关的一些条件,因为我后面是接了我们三个替换图片的一个插件啊,所以说这里面需要选择它相关区的一个插件的一个变量啊, 蓝色、红色,对吧?分别去进行一个选择啊,这个选择器插件主要是做,主要是用来做选择用的啊,所以说大家把它了解一下啊,这是我本节的一个分享啊,感谢大家的支持啊。