粉丝205获赞2621


说实话,在 ai 时代,用马力做设计才是最笨的勤奋。今天这条视频,手把手教你用国产的 ai 工具,美图设计师把原本三小时的工作压缩到三分钟,为了保证大家都能学会,接下来全程干货,建议收藏! 为了拍张好照片,你是不是还要买柔光灯,买背景布?现在完全不需要看这张我随手在桌子上拍的照片,我们打开美图设计师,选择 ai 商品图,直接上传,注意看他不需要,你懂。 ps, 系统会自动识别主体并抠出背景。接下来的操作核心在右侧选择场景,这里建议大家选简约 或者植物类,更显得高级。点击生成,大家看这个细节, ai 全部帮你自动融合了。 很多小白最大的痛点不是不会软件,而是没有审美,做出来的海报特别土,这里教大家一个移花接木的绝招,在首页直接点击海报或者搜索你的行业。比如美妆,选择一个你喜欢的模板,点击它,然后直接选中海报里的这个原本的产品图, 点击上面的替换,上传照片。如果图片你带背景怎么办?别急,左边这里有个抠图的按钮,点一下看背景没了。这时候你的产品直接就长在了这张大世纪的海报里,最后双击文字,改成你的促销信息,完事。 但是有时候照片拍的好,背景里混进了一些路人或者产品上有些脏东西怎么办?我们回到首页,然后选择 ai 工具,找到智能消除,把照片丢进去,哪里不要涂哪里。比如这个抢镜的路人,用画笔涂满它,松手。见证奇迹的时刻到了。最牛的是,它不是简单的模糊,而 ai 根据周围的环境自动帮你把背景画出来了,完全看不出修图的痕迹。去水印,去瑕疵,去路人,这比你学两年的 ps 都要快。经常有人问我, ai 会不会取代设计师,我的答案是,不会取代。但会使用 ai 工具的人一定会取代掉只会死磕软件的人。 所以我们不要被低效的勤奋所拖垮。好了,这期视频就到这里,记得点赞收藏,多练习,熟能生巧!

agent 是 怎么设计多轮对话的?这个问题我一般会先这么理解,就是智能体的多轮对话,其实不是聊天那种简单的问答,而是怎么让一个模型在一次对话里记住上下文,知道自己该干什么,什么时候问,什么时候行动,什么时候收尾。 我之前做任务型 agents 原型的时候就发现很多人以为是靠大模型自动推理,但如果没有结构,模型会越聊越飘。我一般会把这件事拆成几块,但不是为了堆概念,而是因为实操里如果哪块没想清楚,最后多轮就会跑偏。 简单说一下我当时踩过的几个关键点,首先会有一个显示的对话状态,就是模型每轮不是直接拿原始对话去生成,而是先把这轮的意图,我当前的任务目标用户有没有提供新约束,都整理成一个结构化的状态。 我之前没做这一步的时候,模型很容易在第四五轮突然忘记用户最开始的要求,所以后来我们就强制每轮都产出一个 state, 让他自己先复述我现在在做什么。第二块是什么时候问,什么时候干。大模型的一个典型毛病是容易过度询问, 比如用户已经给够信息了,他还在那追问细节,所以我们加了一个清亮的决策层,意思就是模型先判断当前信息够不够,执行要不要调用工具, 还是要再向用户确认。我当时为了验证这个逻辑,做过一个很小的 offline 测试,把各种对话样本塞进去,看模型会不会乱问不相关的东西。这一步其实比调题式词更关键。第三块是对历史的压缩, 因为上下文会越来越长,如果直接把所有轮次丢给模型,成本和稳定性都扛不住。我当时的做法是让模型每隔几轮生成一个摘钥匙的对话记忆,只保留跟任务相关的点, 比如订机票任务只需要保留时间,城市预算不需要保留用户寒暄。这种记忆的颗粒度如果太细,模型会失真,太粗又容易漏信息。 所以我们做了一轮又一轮的小样本调节。最后一个点其实挺重要,就是怎么优雅收收尾。多轮对话里,模型如果一直问不停确认,用户体验会很差。 我在实践里发现,必须让模型知道任务何时完成,所以会让决策层判断所有关键 slot 都齐了,执行结果用户已确认就进入收尾模式,否则模型会一直续命。所以如果让我讲智能体的多轮对话设计,我不会把它理解成堆记忆加堆大模型, 而更像是让模型在每一轮都知道我现在在做什么,缺什么,下一步该问还是该做。我踩过的典型坑就是没有状态管理,导致第三四轮直接跑飞。所以现在我做这类东西会更强调结构,而不是让模型自由发挥。

花三点五小时练完这三十页,你的 agent 的 搭建就牛了!很早之前就想搭建自己的 agent 了,一直都没抽出时间。这两天抽空搭了个 do agent 习作系统,还整理了一套图文教程, 从需求分析、工作流搭建到智能体设计、对接、外部生态,每个步骤都拆解清晰明白。教程内容也是专为新手打造,就算你是没接触过 agent 的 小白跟着做,也能搭出自己的智能体。对 agent 感兴趣的宝子可以抱回家上手学习。

十分钟用 ai 搞定一整套马年 ip 设计!今天教大家目前最偷懒的 ip 设计流程。首先先让 ai 给我生成二十个高矮胖瘦不同风格的小马 ip, 在 lava 里面一定要选择 nano banana pro 模型生成,然后等待结果就行。 执行的过程完全交给 ai, 我 们来把控方向和最终选择。可以看到每一个小马的 ip 都不一样,我们要在这里面选择一个最喜欢的进行延展,比如穿红色衣服的这个潮流小马,那如果我不喜欢它的裤子和鞋子,也不需要重新生成,可以直接用 mark 功能去标记它, 就可以直接将右边小马的裤子和鞋子替换过来,这个真的是超级方便的功能。那我也可以给 ai 来一个变装秀,比如给小马换上不同风格的服装,而且不要改变他的造型和动作,把这段话发给 agent, 就 可以同时轻松搞定十个换装插画。 我们还可以通过涂鸦功能点对点的修改一些图片的瑕疵,这样就不用手动 p 图了。那我现在感觉整个没有排版,很单调,我先去找一个 ip 版式的海报,再用刚刚的标记功能给小马直接替换过去,这样我们就可以得到一张一模一样的本面。 现在的图片信息是之前的信息,那我可以通过最新的编辑文字功能进行修改,这也是我最喜欢的功能,因为终于解决了 ai 没有图层没法编辑的难题,他连艺术字也可以改,并且他可以完美的模仿字体风格,只有设计师才知道这个功能的含金量啊。 接下来我们可以生成一些动作延展 ip 动作,想要做的生动丰富的话,一定要在描述词里面加入夸张透视、视觉张力这种词,这样出来的 ip 动作就会非常的生动有趣。 我们选择一个跳跃的动作,让 ai 去生成一些三 d 的 效果,这样我们就可以拿固定的动作给他不同的三 d 换装的海报,比如符合跳跃的运动滑板、跳水啊,滑雪,包括跑酷等等等等。 我们再给他生成一些表情包设计,但是后面可以不断的去丰富他的世界观和故事漫画,最重要的是整个的过程非常快,这要归功于拉瓦特可以同时生成几十张图,而且他的自由度非常高,基本上不用打开其他软件就可以直接编辑铲除方案,是我认为目前真正意义上的设计 a 针。

今天想和大家分享一下做了一年弊端 ai agent 以后的产品设计心得。很多人一提到 ai agent, 脑海中浮现的便是一个无所不知的智能助手,或者把产品的主界面直接改成一个万能对话框。这个印象在 c 端或许深入人心,但在复杂严谨且结果导向的弊端世界里, 这几乎是最具误导性的起点。在弊端,客户的真实使用流程可不是这样简单陷星的他可能在多个平台反复横跳,协通多种直能角色, 甚至要跨越线上线下完成合作。所以在这种复杂的弊端业务流程下,设计 agent 绝对不是设计一个对话框这么简单。我们需要先搞清楚三件事,探寻解决的问题本质,回归真实的用户流程,以及搞明白最终的交付产物和价值。 这也正好对应了弊端很重要的三个层面,回归业务视角,尊重用户习惯和为结果负责。首先来看第一部分,搞清楚 agent 要解决的问题本质。那我举一个例子,在设备机房里,所有的机器成本都很高,一旦出现故障,修复又特别复杂。针对这样的业务痛点,你会设计一个怎样的 agent 来解决呢? 是不是想到了一个设备维修的 agent, 一 旦主机出现报警,工程师可以自动解锁知识库,生成自动的修复策略。 那听起来好像蛮符合业务场景的,但我们再仔细想想,业务痛点是机器成本高,维修复杂。那刚刚的方案是出了故障再让 agent 来维修,但其实我们应该更前置来避免机器出现故障,例如前置完成风险预防,自动修复高危漏洞,这样对业务结果才是真正的负责。 所以说,在 b 端做 a 阵呢,第一步不是问 ai 能解决什么,而是往前想想业务究竟卡在哪里。与其让 ai 更快地解决问题,不如利用 ai 更根源地杜绝问题发生。 第二个部分便是去摸清真实的用户流程。 b 端用户的行为模式具有高度的路径依赖,早已形成了肌肉记忆,所以我们不能打乱用户的行为惯性,更不能因为引入 ai 而增添不必要的步骤。 我们要让 agent 自然融入且契合用户的流程。那再举一个例子,如果我们要做一个数据分析的 agent, 用户的真实流程是什么样的? 那针对复杂的行为数据,用户不可能背下来手动输入,它一定是在原有数据平台里把数据导出为报告,然后上传给 ai 来分析。所以我们可以看到查看在线数据就是用户的行为起点。 那么如果想让 agent 融入的更丝滑,我们就应该让它嵌入原有的数据平台,在数据出现异常时自动触发分析,并向用户推送 ai 的 分析结果。所以当我们分析出流程的起点,才能在用户最自然、最需要帮助的那个瞬间唤起 agent, 也能最大程度地帮用户提效。 那我们再想一想,用户分析数据的终点是为了什么?就是要查看一份分析报告吗?不是的,用户的目的是要定位数据异常的问题,并同步相关人员来解决, 所以在 agent 的 分析结果里,也应该支持生成任务清单、同步人员等能力。所以说,当我们了解了用户流程的终点,才可以让 ai 的 任务结果形成真正的闭环。 那最后一部分,我们来看看 agent 最终的交付产物是什么?弊端客户,尤其是决策者,对 ai 技术细节其实不感兴趣,他只为靠谱的结果买单,也就是只关心三件事,成本、风险和收益。那如何从设计上引导生成一个靠谱的产物呢? 例如,这种模糊的引导词有什么可以帮您?就很不适合弊端场景,因为它没有给出任何的行为暗示。如果改成这样,快速生成报销单,用户就可以一眼明白你的能力和产出物,清楚 ai 能为我做什么。 同时,我们也可以在对话框内自动植入一些模板来约束用户的行为。例如,看到图种这样的对话框,我就立刻清楚要上传一份发票图片,那我现在就要掏出手机给我的发票拍照了。 除此之外,我们还可以想想 ai 的 价值可以更显化吗?例如,像以运行十个任务这句话看起来就没有什么情感触动,但如果我们改成以扫描十份文件扼杀五个病毒,就立刻感知到这个 ai, 它保障了我的文件变得更安全,能更明确感受到收益和 ai 的 价值。 那以上呢,就是我做弊端 ai a 证的一部分设计心得,如果有任何关于弊端 ai 产品设计的问题,可以一起评论区交流呀!

这是我没用 agent skills 时 ai 生成的页面效果,而这是我用了 agent skills 后 ai 生成的效果。 这两张图对比非常明显,上图是清一色的蓝色渐变,堆积着各种 emoji, 让人看着想吐。而下图的页面是不是让人眼前一亮, 不仅没有了俗套的蓝底渐变,也没有了过度的 emoji 装饰。本期视频我将讲解如何在 cloud code 中使用 agent skills 制作出这种设计精良的页面。什么是 agent skill? 用最通俗的话来讲, agent skill 就是 一个大模型可以随时翻阅的说明文档。以官方提供的前端设计 skill 为例,它的文档结构是这样的, 文档的最上方是原数据层 metadata, 包含 skill 的 名称和描述。大模型运行时,只会将所有 skill 的 名称和描述作为上下文,而不会把整个文档都发送给大模型。只有当大模型判断需要使用某个 skill 时,才会读取该 skill 的 完整文档。 skill 的 名字和描述始终对模型可见, 但具体的指令内容只有在 skill 被选中后才会被加载,这样可以最大程度降低 token 消耗。在 cloud code 中, skill 是 以文件夹的形式存放的, 路径是在 c 盘 users 用户名点 cloud skills 目录下。以安装官方的 frontend design skill 为例,第一步,从 github 官方仓库获取 skill 文档,在 github 中找到 cloudy code, 在 plugins 文件夹中找到 frontend 底站,然后找到 skills 文件夹。第二步,在 skills 目录中新建文件夹,命名为 frontend 底站, 然后把刚才下载的 skill gmd 放到文件夹 frontend 底站中就完成安装了。第三步,验证安装。打开 cloud code, 可以 通过以下方式查看已安装的 skills, 输入 skills 命令, 或者直接询问你有哪些 agent skill。 安装好之后应该如何进行使用呢?第一步,说明需求,给 cloud code 描述你的需求, 比如视频开头的事例。为了能让 ai 更准确地使用 skill, 可以 在后面强调一下要使用 skill 进行开发。第二步,确认使用 skill。 cloud code 意识到需要使用前端设计 skill 后会请求确认,回车同意后,他才会将文档的完整内容加载进去。第三步,生成结果。 cloud code 根据 skill 中的指令进行规划和代码编辑,最终生成符合要求的页面。 agent skill 还有一些高级用法,可以为 skill 添加辅助类型的文件,比如 scribes 脚本、参考文档、 assets 资源文件图片样式表等静态资源。这些高级功能可以实现更复杂的自动化任务。 github 上有很多开源的优质 skill 可供探索,你也可以根据自己的需求编辑定制化的 skill。 如果有兴趣,欢迎关注后续的视频。

那既然 memory 有 写入和读取的这个节点的话,那你就得定义说,如果我今天在我的绘画当中定义了 memory 这个变量,我需要去定义,首先,第一,什么时候写入,什么时候存 memory 嘛,对吧?存什么东西?第二个,什么时候读?读什么, 对不对?第三,哪些场景会涉及到 memory 的 引用?那我们讲涉及到 memory 引用在你的场景下面,第一,你的用户 query 每轮进来 是不是都要结合对话的上下文以及 memory 去看?哎,你过去的几轮对话里面收集到了哪些槽位?还差哪些槽位,通过还差哪些槽位去掉大模型,生成追问话术,让这个对话去进行推进,对不对? 因为你不断收集到槽位,你就把它引入到 memory 作为一个变量嘛?那我问过的问过的这些槽位,我后面就不需要再找用户重复收集了,对不对? 直到说啊,我对应这个意图,比如说你说这个用药师问答,比如说去问药品的禁忌症,直到我这个意图对应的所有的槽位都收集完整了以后,我再去什么?我再去可能就是比如说,呃,调取这个知识库的这个 api 的 接口,或者说去掉一个 api 的 函数去做执行的操作。所以 memory 这个东西,它第一,它的使用场景是推进对话, 然后不断地去生成追问话术,去把槽位都收集完整以后去做后续的执行动作,这是第一个。第二个的话是结合 memory 去看本身的意图有没有改变。 嗯,比如说你的用户的前几轮对话里面说,呃,我要查什么,什么禁忌症,他,他给了你一个什么药品,或者说给了你一些相关的信息,但是用户给你提提供了新的块的时候,你发现用户的意图 a 切换到了, b 换了个意图,用户做了意图的切换,这件事情是不是要结合他过去的记忆?所以我们讲 memory 两个应用场景,一个就是 你要去推进对话状态,直到收集完整所有的信息,明确客户的需求。还有一个就是通过 memory 来来去检查用户的意图上下文是否一致,中间有没有进行意图的切换。那你说具体 memory 怎么样在你的这个项目里面去体现呢?刚刚讲,那你说,比如说用户的快二进来,首先第一 你得知道从 note 框里面去什么,哪些东西要存入 memory 吧?草味的抽取这件事情是要写入 memory 的, 现在在你的场景下会有几个意图?比如说第一个意图是问禁忌症啊,第二个是问这个药品本身的,比如说用药说明一天吃几次,这种是典型的两个意图吧,那对应这两个意图应该有不同的草味抽抽取的哦,对应的策略,这个是需要事先定义的, 所以,嗯,刚讲你写入呃,写入 mary 的 东西可能就是草味。还有就是可随着呃用户提供的信息去把它整合成一句能够描述他记忆的一句语言。比如说用户说,呃,我想要查什么,什么药品的禁忌症,然后我今年多大年龄了?然后能不能和其他的药物一起服用?这是一段文本,一段文本也可以给他记下来, 因为文本记下来以后,其实是更好地去理解语义。那读什么时候读呢?每一轮用户考核出来生成话术之前是不是都要去读?所以我得去看我已经收集到哪些槽位了,我还要收集哪些槽位,还有就是我所有的槽位都收集完了以后,我要去构造我的 api 调用函数了,我是不是也要去读?我把槽位全部都拿出来,然后去构造函数,对吧?在 prompt 里面有一句话就是说请结合历史对话以及 memory, 然后 memory 你 理解它是一个公共的组建嘛?你的每一轮对话都需要去读取你的 memory, 而不是默认只有最近的什么五轮八轮。实际测下来,如果就是你只用默认的最近五轮八轮的话,它的 呃,第一就是可能用户并不一定它的完整的需求在五轮八轮就能够表达清楚。第二点的话就是你的轮数越多,每增加一轮靠这种大模型的幻觉就会越大,而你本身抽取出来的槽位保存到短期记忆里面去调用它,所以它是稳定的。

呃,哈喽,大家好。呃,最近有小伙伴就是在私信我说能不能出一期关于呃 a p p user 做 呃文字识别相关的应用的教程,那么这边我在今天尝试用千帆这个 a g 的 平台再去做一个呃文字识别通用的识别的一个应用。 那我们登到这个智能云之后,我们在大维信这里,呃,进入大维信平台,嗯,进来之后呢,选择 agent 开发。 呃, agent 开发这边呢?我们,嗯直直接点击 agent 就 行。那在这边,嗯, 选择创建 ajax 嘛,就是这边会给你几个选项,嗯,我们就用最简单的吧,就是自主规划 ajax, 就是 它会自动地去调用相应的,根据用户需求调取你配置相应的呃工具, 然后就可以实现你的应用的功能,然后点进,点进来,点自主规划,自主规划 ajax, 呃,这边呢我们给它起个名字叫做,比如,呃图像识别助手, 助手 ocr 应用, 对吧?嗯,简单描述一下,我们把它复制过来粘贴一下就行。角色指令的话,这个地方,嗯,看它的介绍吧,就是我通过这个角色指指令,嗯, a agent 能够知道它到底是干什么的。 那么这边我们把我之前准备好的一个 agent 的 g 是 角色指令 copy 过来,你也可以带。呃,这边我演示一下吧,它有一个就是 ai 生成的一个功能,比如我这边 copy 一 份工过来, 然后呢我让它去进行一个 ai 优化, 他会自动的补齐一些角色任务,然后工具能力,然后相应的要求限制以及相应的场景, 嗯,这边你再可以再去改,再去优化,这我就不做不做演示了。然后第二部分呢,是一些,嗯,能力拓的,然后这边你可以相应的去配置你的要使用的那些模型,这个模型呢,相当于是呃千万平台他自己部署的一个模型, 你也可以去自己训练自己,训练自己专用的模型,对吧?嗯,去创建模型服务这里,也就是在在这个地方模型服务这边, 这边有一些就是已经预制好的一些大模型服务,我们开通后付费啊,或者是预付费之后就可以直接调用了。在这种推理这边就可以去创建你的相应的推理服务 这边我就不再演示去创建你自己的推理服务了,然后后续有需要的话,我们可以再出一期相关的内教程。这边呢,我都是选的是呃健康平台内置的两个模型,一个是 v 三点二的 思考规划用用 v 三点二的 d c v 三点二总结的话就用 r 一 的就行,然后思考轮数就改成一。呃,同样的你这边也可以去配置嗯,其他模型服务,比如, 嗯,火山,或者是阿里,或者是其他,比如你在 open api 呃那个,对吧? open api 搞了几个模型,或者呃 cloud, 或者别的谷歌的什么模型,也可以在这边配 u r l, 然后配上它们的键权就可以了,然后就可以调。 然后主键的话呢,这边我们就去选嗯, m c p 下面的一个通用文字识别的一个主键,等我下去等它加载一下, 有一个直接在搜吧文文文字识别, ok, 选这个通用文字识别就可以了。然后这边的话我们需要去配音相应的键权,然后这个键权的话,我,呃 就是在系统管理这个地方,这边是有 api k, 你 可以去创建相应的 api k, 然后呢给它自定义相应的权限。比如我这边创建一个,嗯,图像识别, 图像识别专门来做图像识别应用的时候,给他全部的权限,在自定义权限这边呢,我们可以给他配置嗯,不同模块,然后给他全部权限之后呢,我们这里可以看一下他的有哪些权限。 呃,比如模型服务权限,应用开发的权限,还有 ai 开发能力底下就包括我们的图像识别,对吧?图像识别它所有的功能是全都包括的,也就是我给了它所有全部产品的权限。 ok, 点确定 好,他现在是有了所有能所有功能权限,那么我们把它给刷新一下,粘贴一下,复制一下这个 a, 复制一下这个键圈,能把它给 copy 到这里替换掉。 ok, 好, 那么目前的话我们把我们文字识别的功能已经给加进来了。呃,后续的话也可以加一些知识库,比如你想要去做一些呃,更为准确的问答,或者是加一些相应的词库,用来呃, 对应你所需的业务吧。这边也会加一些开场白啊什么的,比如你好, 然后推荐问,比如上传图片什么之类的,背景图片也可以加这里,我就不再去展示了,那么这边我们就调试一下, 上传一张随便上传一张校徽的图,对吧?然后去让哎让这个音频它去识别图片中的文字, 嗯,并对内容进行进行接受,并对文字文字。 那这边的规划思考模型就是 v 三点二的, 它再去相应调用这个模型,然后调用成功之后呢,我们可以看到它调用了之后又识别到一山大学的字样,后面的生成总结模型就是按一的模型来操作的, 然后现在是在就是按我的要求去对文字内容进行介绍的一个输出。 ok, 我 们这个文字识别的 agent 就是 已经做完了,那么我们可以把它进行一个发布。呃,发布的话推荐问,这边我就跳过 咱们描述的话,就 v 一 吧,展示执行过程的话,这边你可以就是如果你想要对用户展示的话,那就可以点确定,然后我这边发布一下, 我为当天发布的是 v 一 版本的,那么我们也可以开一些,比如百度搜索的免费分发,也就是如果你开了这个之后呢,它会给你百度会提供一些相应的呃,免费分发的 流量嘛?但是这个我还不太确定,我这没有用,没有用过,那网页版的我们就可以直接访问了,我在这边就使用。呃,就去同样的吧,再做一个 文字识编内容,识编图 图文字内容,然后我要求它只除出文字。 好,这个思考规划就是,呃, d f c 为三点二在执行了,那它去调用我们的图,用文字识别的 m c p, 对 吧?然后这边它有嗯述说相应的内容, 这个就是我们的 r r e 在 操作,然后识别的结果就出来了。 ok, 我 们的功能就 完成了。后续的话呢,我们可以可以去绑定到呃,微信应用啊,或者公众号啊,小程序客服都可以,然后也可以切入到网站里面,然后这次的教程就到这里。然后后续的话有一些调优啊,或者是数据干预的功能。 嗯,比如调用次数啊,每天调用次数,这个就。嗯,在使用过程中可以逐渐熟悉。 ok。 呃,教程到这里结束,后续有其他的想,然后再介绍的也可以。嗯,私信我或者什么都可以。

如果有一款工具能代替 loarte, 那 就是国内的新流 agent, 与 loarte 完全一样的界面,使用方法也是同样的,连功能都是一样的,拥有无线画布,同样支持对话框输入需求,就可以让 agent 工作。这里面图片模型 v a 就是 nano banana pro 模型,标记功能、文字编辑与编辑元素功能、样机功能这些经常需要到的功能它都有,里面还覆盖了多种主流的深图模型与视频模型。接下来我将为大家讲解新流 agent。 打开这个,大家可以看到这里的界面是与鲁瓦特一样的,新建一个项目在无限画布里的。点击模型片号, 这里的图片模型 v i 就是 nano banana pro 模型,直接选择它。我想要制作一个芒果饮料的海报,粘贴我已经整理好的内容,就能得到一张芒果饮料的海报。点击图片点击编辑文字,就可以把图片里的文字随意修改,而且字体风格不会有改变。再继续点击图片点, 点击编辑元素,图片里的主要元素就会拆分出来,可以随意拖出图片或者编辑文字内容。然后我又想把这张海报改成草莓饮料海报。鼠标按住 ctrl 键,鼠标单机标记内容,把芒果的元素全部改写成草莓的,就能得到一张与芒果饮料海报风格一致的草莓饮料海报。 这是我已经生成好的七张图片。点击图片点击 moc 样机功能,就可以把这两个角色拖进图片里就能融合进去。我把剩下的都拖进图片里, 可以看到阴影与折痕的效果都能融合在一起。我还想把这三张图片制作成一个视频,按住 ctrl 键,鼠标点击标记内容,点击这个符号,随便使用一个视频模型,输入想生成的内容,就能得到一个青年拿着手机的视频。 还可以在这个主页界面的社区里找个别人已经做好的设计,点击做同款。就比如这个大透视图片,我想深层洗茶的,直接修改一下,就能得到一张风格一致的洗茶大透视图片。在这里大家就能够看到新流 agent 是 与 robert 高度相似的 lavart 里面有的功能。犀牛 agent 里也有 touch edit, 指哪改哪, text edit 文字随便画, edit element, 一 键拆分图层,这些功能它都有,对于使用 lavart 因为网络而困扰的设计师们,可以去试试看。

雷后啊,兄弟们,今天只讲一个内容,极猛 a 者模式到底该如何正确使用,想看成品案例的可以先滑到最后面啊去看啊,然后我前面主要是讲一些正确的一些操作,就是我建议大家都学一下,非常有用。 然后先声明,本期视频所有的资料都会直接打包放在粉丝群里面,免费的,有需要的自己去拿就行了。然后就是说明一下,他这几个东西是我个人觉得比较实用的啊,其实他什么东西 应该是说都能做,但是我把它最实用的几个点给大家练一下。第一个怎么去用自己的产品去匹配别人的一个效果,他不是是简单的重提,以图一为基础,对吧?然后就换他的产品,他不是这样的,而是重新去设计一份类似同行的,然后匹配自己产品的一个场景效果, 就是说别人的是什么样的吧,我们也想要达到别人的效果,但是我们又想跟他不一样,他是这么一个东西。第二个是一个修图的一个东西,就是无论你是要产品精修,无论是什么产品,大部分产品吧,塑料啊,或者是说呃,铁的,生锈类的,对吧?你想去给他还原恢复 大部分都可以做。第三个就是一个什么批量生图的一个东西了,然后他怎么去批量生图呢?就是我们把产品图放出去之后,对吧?然后加一段提示词,他就会立马得出这个结果给我们就把他的结果拿来,拿来之后重新丢给他,他就能把五张图全部生成出来。 第四个是什么呢?第四个是一个产品视频的了,然后我们一起来看一下,然后来到我们的极梦官网,然后我们选择一下 a 阵模式,他不是我们平常看到的这个兄弟们千万要记住,他不是我们平常看到的这个东西啊,他虽然也叫 a 阵,但是他的这个强度跟另外一个地方的一个强度他是完全是有区别的。我们来到这里无铅画布, 点击它进来之后往下滑,在这里直接新建一个项目,点击新建完项目之后,我们直接去上传我们需要去改动的一些产品图的一些效果,然后我这里就可以直接跳过了,因因为我这边有上传过了,大概是这样的一个效果, 我们只需要去点击这里添加到对话,这是我们的产品图,我们现在要做的一个任务是什么?把这个模仿图二的一个效果就给他做出来,那我们就添加到对话,这个也给他添加到对话,然后这里记住这里把这个灵感操作全直接给他关闭啊,这两个东西都不能打开的。然后我们选择一个极光四点五的一个模型, 选择完之后我们来到这边复制我的题的值,复制第一行吗?对吧?复制这一行,然后发送给他, 他就会跳到这边,然后切记啊,在这里是在深层结束之后,呃,把那个提车直接加上这么一句话,这句话的作用是什么呢?就是能固定我们的产品外观不变的,然后我们先直接等待他一下, 你看他会基于刚刚开始的一个分析,然后我们可以得到一些什么样的一个关心支持,对吧?然后他这个是他得到的一个结果,大家一起看一下温暖的什么,是的,对吧?传统什么什么什么, 你可以根据具体的需求去调整,这些权重细节都可以去调整。那我们现在不调整啊,我直接去给他复制使用啊,复制复制他,然后把这张图片也还是添加到新对话框,然后复制完之后,记住啊,这句话一定得给他添加 ctrl c、 ctrl v, 他 最后是大概这么一个效果, 大概是这么一个效果,然后我们直接点发送,他现在就在呃,思考了, 然后我们现在能看到这张图片,他是寄予我们新的产品,新的产品图接上同行的一个大概效果,排版,无论是排版,对吧?大概的类似效果他就去全部去重新给他设计一遍,就是他不是简单的是说啊,把图一的产品放到图,他不是这样的,如果是这样的话,那就没有必要讲了,他他是这这么样的一个意思, 就是重新寄予我们新创的新上传的一张产品图,就给他一个设计,所以他也是,所以他这个东西也叫做一个纹身图, 所以就是说我们现在已经能看到一个东西,就是什么呢?这是我们的产品图加上同行的一个类似风格,对吧?然后去基于我们自己的一些什么配色,然后他去重新去一个调整大概得到的一个效果, 然后这些效果的话是其实是完全可以基于我们自己去把控的,因为他不是直接去深图,而是有给了我们一段提示词之后,我们可以基于他这张提示词去给他修改,都可以。 然后我们接着来下一个啊,我把我的头像给他关掉吧,不然太影响太影响体验了。然后我们点击这一张图片,来到我们第二个点击添加到对话,添加完之后,我们这里还是选择我们的 a 轴模式,然后回到我们的问题这一边,给他复制一下这个问题,复制完之后丢给他, 把问题丢给他之后,他等一下会把他的结果得到给我们吗?那我们等一下用他的结果继续去给他刷图,但是这一点呢,就是他是精修的,那我们得确保他的产品外观真的能保持不变,那我们这里得去点他一下 换成这个图片生成,换成之后还是选择这个四点五模型,然后把这张图片先给他添加过来,添加过来之后复制他这里的提示词, 复制,然后粘贴,然后点击这张图片,点击完之后这里给他拉满,这是一张百分百的,就是如果你是点五十或者以下,对吧?那他可能这张图片就会发生一些问题的一些变化,那么保存, 保存完之后还是把他这句话给他复制一下啊,就是尽可能给他一致吧,其实你不要一致的话,应该也是没什么问题,然后我们给他点发送,等他得出来, 然后我们现在就能看到他得出来一个结果,反正就是其实你无论是怎么去操作的吧,他肯定是会有一些区别的,但是我们就拿我们想要的结果呢,就可以 把这张图他的效果怎么样,对吧?然后我们把他拿我们相对应的一个结果,他四张图肯定是有几张是有问题的,但是百分之八十以上的概率有一张是没有问题的,我们就直接去使用, 大概就是这个意思,他是无论你是什么样的一个产品,呃,三 c 或者是什么三 c, 或者是化妆品啊,或者是一些塑料类的一些产品,他都可以去操作。然后我们直接跳到下一个问题, 然后现在来到我们的第三个,对吧?第三个的是一个应该是非常就很多很多人都需要的一个东西了,就是说啊,我该如何去给他写题?事实让他申妥,对吧?这一块其实吉梦 a 症他自己也能解决,但是他现在就是不一样了,不是在我们刚刚这个窗口里面,而是在这边 他是另外一个地方呢,不不不同的一个地方,但是他就是能解决,看我操作。然后我们只需要去找一张产品图,将这张提字词整一个给他复制一下,先复制完之后我们先给他填充,然后我们来这边随便拿一双鞋子为例吧,我就先随便选一张,然后我给他保存这张吧, 保存下来,对吧?然后我们直接去点击这个上传,上去上传等待他一下, 大家选完,上面是他的分析,下面是他的结果,但是我们现在有一个离谱的一个点,就是这里, 但是寄予一生你是一个什么什么什么样什么样什么样,对吧?他这个东西我也不知道他为什么能这么操作,但是基,哎,不是,就是之前来说我们是基本上只能去豆包啊这些东西这些地方去给他解决的吧,但是我不知道他为什么能能这么操作,但是如果他是可以,那我们就直接拿来用就行了,就不要管他那么多, 然后有需要的话我们就自己去再去修改嘛。他现在来说就是说他得出了所有的题的词了,那我们就给他复制一下主图一,对吧?全部给他复制一下啊,不用管他对不对?我们主要是图他的一个方便,然后点击发送,然后我们就直接把我们刚的产品都给它丢进去嘛,丢完之后直接让他去生成就行了,不用管他那么多, 点击发送,等待他一下, 然后我们现在就能看到了啊,这个是我提交的图片,对吧?其实我们也不用管他,我们提交的是什么样的图片,对吧?然后我们直接点击去看一下他啊,看一下到底完成的一次性到底怎么样。就是 反正现在这些东西就是很神奇,我自己也不知道为什么现在能发展到这一步。你看无论是什么,他现在这些东西真的是很神奇,都能自己去给他解决一下,都可以自己看一下啊,这是他的大概的一个效果,如果你想要更好的效果,那你就基于他的提示词去给他修改,知道吧?就是 他提示词写给你又不可能说百分百,呃,百分百保证你,你是想要这一个效果,那你就去基于他的提示去修改,无论是他的标题还是什么的,自己去修改就可以了。 第三块就是大概是这一个这样一个意思,无论你是什么产品,你可以让他去分析,分析完之后得出一些提示结果给你,你再拿他的东西去丢给他,就非常非常方便的一些操作。 然后现在又来到我们第四个,这是成品生成视频了,对吧?我们他现在虽然说这个东西消耗积分有点多啊,但是其实效果还可以啊,我给他复制一下,全部复制, 然后来到我们刚刚这里,点击添加到对话,然后把我们提示者给他输入进去,输入过去,反正全流程都是一个输入输出的一个文。呃,过程就是说我们把问题给他,然后他把结果给我们,我们再把结果还给他,大概就是这么一个过程,然后我们现在等待他一下,等他的结果, 这里现在是试它的一个结果了,那我们就直接复制。呃,点击这里啊,直接 ctrl a, ctrl c, 然后复制一下,复制完之后把这个产品图给它添加, 添加到对话框,然后选择模式的话换成这个视频生成。呃,我们直接选这里吧,点三点五 polo, 然后把这个东西添加到对话框。 呃,首尾针我就不去弄了,我先直接弄个手针吧,然后给大家去看一下,手尾针的话,就这里的话就是你最后的一个落脚点吗?你你要去处理也可以啊,都可以的。然后我把这张提示给他复制过去,然后这里选择十二秒点击发送,等待他一下, 等下他结束之后,我们打开看一下他的效果,点击播放, 就是大概是这么一个意思啊,但是里面有一个什么问题呢?就是首尾针的一个问题,你们自己去操作的时候一定要切记首尾针得去填好, 然后呢就是到了这里之后,对吧?大家也能发现,我每一次就是把我的问题丢给他,就是我想要的东西,对吧?我去问他,我问他我该怎么去做,然后他就能把我们想要的反馈给我们,然后他这个反馈的这个过程呢?就是说,呃, 他是基于他自己,他本来我们也是想让他去做图,我们本来也是想让他去做视频,那就只我们如果去调用了其他的 ar, 如果说你说一百七或者是豆包,对吧?那你去调用他们的话,他们输出的格式完全就是不是他想要的,我们得理清楚一个点,就是 我们是跟谁在沟通,那我们跟谁在沟通的话,我们能基于去别人的。如果说我去把豆包的一些提示词或者是第一些提示词放到放到放到放到这边来去丢给他,那根本就不可能是说一次性就能成功, 而是什么呢?如果你想成功,你就是你得完全意识到我们是在跟谁去都沟通,这个问题一定要想清楚,无论如何就是我们得想清楚这个问题, 我们在跟谁沟通,那我们跟他沟通的话,我们是不是要基于说一些他能听得懂的一些东西去跟他沟通,他来才能反馈出一些我们想要的结果, 那就证明了什么呢?我把问题给他,他把结果给我,那他这个结果给我的时候,他是肯定他自己能听得懂,那我们就拿他这个结果去给他,这是完全没有问题的。 然后后面的话就是说我准备呃,更新几期视频,就是说搭建工作流的,就是主图指出或者是说详情页指出这一块,我后面会往这方面去考虑,然后去录制一些视频,就是大家有什么问题想问的,对吧?或者说我们看了这些视频之后, 你们有什么还不懂的,你们可以直接反馈给我。大概就是这个这么一个意思吗?就是说我需要得到你们的反馈,我才有动力继续做下去。如果没有反馈,那我我可能就自嗨吗?这些东西做的是自嗨吗?对吧?大概就是这个意思。好了,兄弟们,我是阿涛弟,拜拜。