我用 n 八 n 搭了条广告流水线,填银行表格,自动生成三条真人种草视频。 i'm brushing, and we just got way cooler, i'm literally manipulating a giant giant heart model right here on my desk with these gestures, the clarity is insane。 没错,这些看起来像真人拍的种草视频, 其实是我用一个自动化系统十秒钟片样生成的。今天我就把这套自动化系统完整的拆解给你们看。 整个系统就是靠这张表驱动,你只需填六列产品名称、产品图链接目标用户,比如健身的年轻人。产品核心卖点还有视频场景,比如在健身房、更衣室。最关键的一列选模型, 我们有三种模型供你选择,微优三点一、 nano 加微优三点一以及 zora。 选完点击运行系统,自动走不同的路径,生成三种风格的视频,而且全程不改产品外观,保留原始包装,人物自然手。 我最推荐的是这条 nano banana 加微优三点一,为什么呢?因为它分两步走,效果最稳。 第一步是 ai 先生成一张人池产品的参考图,调用 nano banana 输入产品图场景描述,抄写实景 ugc 风格图像。 最关键的是,产品能够原形不动,只是加了真人手和环境。 第二步,再用这张生成的图生成视频,调用 v o 三点一, fast 输入视频脚本参考图, ai 自动写台词。比如我超爱这个风扇,亲到忘记带着,但风力超强,输出八秒 竖屏视频,带自然口型、轻微手抖和环境光效。 你看这些产品的 logo, 颜色平行,全部和原始图一致,这才是品牌方敢用的广告, 整个系统的核心是这几个 ai agent, 它不是随便写几句词,而是被训练成专业的 ugc 导演。举个例子,图像 agent 会强调产品部的修改必须与原图一致,视频 agent 会要求对话要像真人随口说的一样,不要广告腔, 还会自动分析成生成的内容,确保视频和图像风格一致。这就相当于请了一个懂摄影、懂文案、懂产品的全能助理,而且永不疲倦。 这套系统我已经打包好了,包含完整的 n 八 n 工作流、谷歌 sheet 模板,还有所有的 agent promos, 全部免费。只要你需要点赞本视频,加入我们的智日星球星盟。 ai ai 不 会取代创作者,但会取代不用 ai 的 创作者。现在轮到你了,去生成你的第一条 ai ugc 广告吧!
粉丝158获赞625


欢迎收听扣子 ai 播客。 哈喽,大家好,最近我发现身边好多朋友都在玩豆包的 ugc 智能体,好像不用花一分钱就能搭出自己专属的 ai 助手。我自己也试了试,确实挺有意思的。今天咱们就来好好聊聊,怎么从零开始搭建测试,甚至用它变现。 对,我之前刷到过别人做的那种小学生作文辅导 ai, 还有职场文案机器人,感觉特别实用。不过到底什么是豆包 ugc 智能体啊?我之前一直没搞太清楚。 其实简单来说就是你可以用文字训练出一个专属的 ai 助手,不用写代码,不用租服务器,完全零成本。比如你想做个育儿规划师,就可以把自己的育儿经验、看过的育儿书籍上传进去,它就能帮你给家长出方案。 核心价值就是一次创建,后续别人用你的智能体,你就能持续拿收益。而且它还能自动吸收用户生成的内容,不断优化自己的回答。 听起来确实挺香的,那搭建的具体步骤是什么样的?能不能给我们拆解一下?没问题,我总结了五个核心步骤。首先,第一步得找准定位和入口,你不能什么都想做,得聚焦一个单一功能。比如小学生作文辅导 ai, 就 专门帮小学生改作文除写作思路,这样用户一搜就能找到你。 对,太泛了,反而没人用,得让用户一眼就知道你这个智能体是干嘛的。那第二步呢?是不是要起个名字? 没错,第二步就是基础信息配置,名字一定要直白,最好是用图加人群加功能的结构。比如小学生作文辅导 ai, 别人一看就知道是给小学生改作文的一句话,简介也要说清核心能力,比如专注小学生作文批改,写作思路启发,别写那种模棱两可的话。 那第三步的角色指令设定呢?是不是要写很多东西?不用,反而要短,控制在三十到五十字左右,采用角色加能力加规则的结构。比如你是专业小学生作文辅导老师,能精准批改作文,给出修改建议,只回答作文相关问题,这样 ai 就 不会跑题, 千万别写长篇大论,不然 ai 反而不知道自己该干嘛。哦,原来如此,那第四步的知识点呢?是不是要上传很多资料? 对,你可以上传 pdf、 txt 或者 word 文档,系统会自动分段。这六个关键一定要开启严格匹配模式,这样 ai 就 只会用你上传的知识库内容回答问题,不会胡说八道。比如你上传了小学作文评分标准,他就会按照这个标准批改,不会自己瞎编。 那第五步的交互限制是干嘛用的?就是设置一些规则,比如用户问了超出知识库的问题,你可以预设一个回复,比如,抱歉,这个问题超出我的专业范围,请提问作文相关问题,还要设置触发词机制和追问机制,最多让用户追问两次,避免无限循环。 搭建完之后是不是就直接能用了?肯定还要测试吧?那必须的,测试是非常重要的环节,我总结了三个测试阶段。第一阶段是单轮响应测试,要覆盖知识点的全部章节,准确率得达到百分之九十五以上,不能答非所问。 第二阶段是多轮连贯性测试,至少进行五轮以上的交互,看看 ai 能不能保持角色一致性,比如全程都像小学作文老师一样说话,不会突然变成职场顾问。那第三阶段的压力并发症是什么意思?普通人也能测吗? 其实就是模拟很多人,同时用你的智能体,看看延迟高不高。官方要求是一百,病发请求下延迟稳定在一点八秒以内,这样用户体验才好。不过普通人可能测不了这么专业,你可以找几个朋友同时用你的智能体,看看回答速度慢不慢。 那测试完之后怎么迭代优化呢?有没有什么具体的计划?我给你分享一个。七天进阶调试计划。第一天,先解决答非所问的问题,把知识库中模糊的地方改清楚,调整角色指令。 第二天,优化输出结构和细节,比如让 ai 的 回答更有条理分点说明。第三天,添加变量适配规则,比如针对不同年纪的小学生给出不同难度的写作建议。 第四天呢,是不是要让用户能反馈?对第四天添加反馈优化机制,比如让用户可以给回答、点赞或者点彩,你定期查看这些反馈,调整知识库和指令。 第五天,进行多场景适配,比如模拟不同用户的提问方式,看看 ai 能不能应对。第六天,提升效率与精准度,比如删除知识库中重复的内容,优化触发词机制。第七天,复盘固化,把这次搭建的经验整理成模板,下次再搭就不用从头来了。 听起来这个计划挺实用的,那迭代优化的关键是什么?主要是两个方面,一是记录偏差,对用户标记为有帮助或无帮助的回答进行分析,看看哪些地方答的不好,及时更新 prompt 和知识库。二是数据管理,定期清理荣誉对话,把优质的回答导出存档,下次可以直接附用。 那搭建的时候有没有什么常见的坑?需要避开?新手最容易犯的几个错误,比如指令太具体,导致低效回复。比如你写当用户问写春天的作文,你要先写开头,再写中间,再写结尾,这样 ai 就 只会按照这个模板回答,不会灵活应对。 还有就是内容偏离场景,明明是作文辅导, ai 却上传了很多育儿的资料,导致回答混乱。还有呢?比如隐私方面有没有要注意的? 当然有,隐私保护很重要,绝对不能上传敏感信息,比如个人身份证号、银行卡号,还有用户的隐私数据。还有就是指令要具体,别写,做个方案,这种模糊表述要写清楚,做一个适合三年级学生的春天主题作文写作方案。 那安全合规方面有没有什么要求?官方有数据安全的三道关。采集原则是最小必要,就是只采集必要的信息,别什么都要 存储,要分级加密,重要的数据加密存储使用权限要隔离和脱敏。比如用户的个人信息要脱敏处理,不能直接显示。还要建立三级审核机制,事前敏感词过滤适中, ai 检测,事后人工抽检,避免出现违规内容。 那搭建完智能体之后怎么变现呢?除了别人使用拿收益,还有其他途径吗?主要有三种变线路径。 第一种是使用收益,别人每次使用你的智能体,你就能拿到分成。第二种是流量收益,如果你的智能体排名靠前,官方会给你推荐,流量多了收益自然就高。 第三种是个人 ip 打造,你可以搭建多个专业智能体,比如作文辅导、职场文案、育儿规划,积累一定粉丝后就可以接咨询,带徒弟做社群。那哪些应用场景比较高频呢? 我总结了几类学习辅导类,比如作文辅导、英语单词背诵。自媒体文案类,比如短视频脚本生成、公众号文章写作。职场办公类,比如 ppt 模板生成、工作总结待写。 健康养生类,比如食谱推荐、运动计划制定、生活实用类,比如旅游攻略生成、穿搭建议,这些都是用户需求比较大的场景。那豆包 ugc 智能体的技术底座是什么样的?未来有什么发展趋势? 它的技术底座是豆包大模型二点零,用了 transform 改进版和动态稀疏注意力机制,还有 m o e 混合专家模型,处理复杂任务的性能提升了七倍。 ultra man 超长记忆架构,能支持几万字的上下文,比如你上传一本几百页的书,它也能记住里面的内容。还有扣子平台是一站式智能体开发与运营平台,支持了六十多个插件,比如天气查询、翻译、计算器。 那未来的发展趋势呢?我觉得有几个方向,一是打通所有应用的统一账号,比如你用豆包账号就能登录所有智能体,不用再注册新账号。二是通过强化学习自我进化,比如 ai 能根据用户的反馈自动调整自己的回答,不用人工干预。 三是多模态融合的 agent 生态。未来的智能体不仅能处理文字,还能处理图片、语音、视频,比如你上传一张照片,它就能帮你生成配文,或者给你做视频脚本。听起来未来的发展空间挺大的,那普通人现在开始搭建还来得及吗? 当然来得及,现在豆包 ugc 智能体还在快速发展阶段,官方也在大力扶持,只要你找准定位,做好内容,很快就能拿到收益。而且搭建门槛特别低,不用懂技术,零成本就能上手,适合所有想尝试 ai 变现的人。 那今天咱们聊了这么多,能不能给新手总结几个关键点?没问题,新手搭建的时候记住这几点。第一,定位要精准,聚焦单一功能,别贪多。第二,角色指令要简洁,采用角色加能力加规则的结构。 第三,知识库要精准开启,严格匹配模式。第四,测试要全面覆盖单轮、多轮、并发三个阶段。第五,迭代要及时,根据用户反馈不断优化。只要做好这几点,你就能搭出一个好用又能变现的智能体。 好的,今天咱们的分享就到这里了,希望对大家有所帮助。如果你也搭建了自己的智能体,欢迎在评论区分享你的经验。没错,咱们下期再见!

欢迎收听扣子 ai 播客。 哈喽,大家好,我是今天的主持人,咱们今天来聊一个最近挺火的话题,就是普通人零代码也能搭建自己的锤类智能体知识库,而且它的长期价值真的能帮咱们省下不少力气。 没错,很多人可能觉得知识库就是给智能体额外加点资料,其实它根本不是可有可无的锦上添花,而是垂直智能体的能力基石。要是知识库设计的乱七八糟,不仅会让 ai 的 回答变得离谱,后续维护起来也会特别麻烦。 那先跟大家拆解一下核心概念吧,什么是 ugc 智能体啊? ugc 智能体就是咱们普通用户不用写代码就能创建的专属 ai 助手,你可以给他设定角色,绑定知识库,还能编排工作流,让他完全按照你的需求来干活。 那锤类知识库又是什么呢?锤类知客就是聚焦特定领域的结构化资料,比如医疗、法律、金融这些,它是通过 r a g, 也就是解锁增强生成的技术来提升 ai 回答的准确性和可解释性。 简单来说,通用大模型靠的是它自己的训练数据,而锤类智能体靠的就是咱们搭建的知识库。所以锤类知识库一定要有纯度和关联度,可别把资料堆成大杂烩,那样反而起不到作用。 明白了,接下来咱们就进入保姆级的搭建流程,首先得知道入口在哪里,还有需要准备什么,对吧? 对手机端的话,你得打开最新版的豆包 app, 版本要在 v 七点五点零以上。然后点击我的,找到智能体工坊,电脑端直接访问豆包点 com, 进入我的智能体或者创作中心就行。不过在这之前得先完成实名认证,开通相关的权限,不然可能操作不了。 接下来就是设置基础信息和人设了,这一步有什么需要注意的吗?名称得直白,体现功能,而且要控制在十二字以内,不能有特殊符号。 一句话简介要明确,核心直能。比如帮你解答职场面试问题,性格与语气可以勾选关键词,比如严谨、幽默、简明这些。开场白也要好好写,引导用户正确使用这个智能体。比如可以说,你好,我是职场面试助手,有问题随时问我。 然后就是创建知识库和上传文档了。这一步听起来好像挺复杂的,其实还好, 新建知识库的时候,命名要用英文数字或者下划线,而且得以字母开头描述,可以写零到五百字,说明这个知识库是做什么的。数据类型分非结构化和结构化。非结构化的有 pdf、 word, markdown、 txt。 结构化的有 csv、 excel、 json、 l。 那项链化模型怎么选呢?一般默认选 dobell, embedding, 二四零七一五,加上关键词模型就行。如果是长文本,可以选多语言模型,要是追求精度,就选 large 版本。 切片与缩影这块非结构化数据可以设置切片规则,一般八百到一千五百 token, 重叠两百 token, 这样能保证上下文的连贯性。结构化数据就按字段来分,缩影算法默认选 h n s w h hybrid, 它能兼顾语义和关键词。解锁 投喂资料的时候,格式优先级是怎样的啊?格式优先级是 markdown 最高,然后是 html、 word、 pdf 尽量别用扫描件和图片型的 pdf, 因为 ai 很 难识别里面的内容。还有数据清洗也很重要,得按四步法来。先把格式标准化,比如转成 markdown, 玻璃页眉页脚,然后划分语义单元,按章节或者条款分段, 还要保证术语一致,比如同一词要统一,最后做好时效性管理,加上版本号和更新频率。上传文件的时候有什么限制吗? 单次上传的文件数和总大小大概限制在两百 mb 左右,而且系统会自动过滤敏感信息进行审计,这个不用担心。 接下来就是把智能体和知识库绑定在一起了,怎么操作呢?在智能体编辑页找到知识库高级技能,然后添加资料,你可以上传文档,也可以直接粘贴文本或者 faq, 系统会自动解析这些资料,建立语义缩引,大概两到三分钟就能生效。 这里还要设置提示词约束,让 ai 优先寄予知识库。回答,如果不确定的话,要明确告诉用户,他不知道别瞎编。 那工作流和技能这块是进阶内容对吧?对,这部分是可选的,你可以设置意图识别、条件路由,精确检测的工作流,实现智能路由,让 ai 根据用户的问题自动找到对应的知识库内容。 还可以添加官方技能,比如 pdf 提取、表格识别、网页解析,还有插件,比如天气搜索、邮件飞书这些,让智能体的功能更丰富。 最后就是发布和测试了,这一步得好好检查对吧?没错,发布的时候可以选择可见性,比如仅自己可见,仅链接可见,或者公开搜索,如果选公开搜索,要优化关键词标签,增加曝光。 测试的时候要检查三个要点,一致性就是回答是不是基于知识库的内容边界控制。当问题超出知识库范围时, ai 要礼貌拒绝,还有多轮对话记忆,能不能记住之前的对话内容。测试完要是有问题就返回编辑页修改设定或者更新知识库, 而且系统有版本管理和回滚机制,不用担心改坏了找不回来。刚才讲完了搭建流程,再跟大家说说最佳实践和避坑指南吧。 首先,知识库拆分要遵循原则,最好按主题或者实体来分,比如分成公司信息、产品中心、售后 faq、 技术支持这些,别把所有资料都堆在一起,那样 ai 解锁的时候会混乱。 那解锁策略方面有什么需要注意的吗?可以选择向量解锁关键词 bm 二五或者混合解锁。还可以用 re、 rinking 和 melaton 的 权重来优化解锁结果,让 ai 更精准地找到需要的资料。 怎么验证知识库的质量呢?可以让专家审核资料的准确性,也可以用工具辅助检测敏感词和内容冲突。还要定期复盘,看看高频问题是什么,错误率最高的 top 五是哪些。然后针对性的优化知识库,知识库也需要持续更新,对吧? 当然日常可以根据用户反馈和业务变更来更新,比如有新的产品上线,就把产品信息加到知识库里面。 还要建立定期机制,比如每月统计一下大家的问题,扩充相关的知识。版本控制也很重要,可以用领域、年纪的格式来命名,比如职场面试下划线、二零二四 q 三,方便管理和回溯。 最后总结一下,普通人搭建垂类知识库其实没那么难,零代码大概十分钟就能跑通一个垂直场景,而且一次创建就能长期复利。 没错,垂类知识库是专业能力的基石,他的成败就在于结构化设计和持续迭代。未来智能体的竞争本质上就是知识库的广度、深度和活性的竞争。 所以建议大家先跑通一个垂直场景,再复制扩张,而且一定要注意数据合规和隐私保护,别泄露了重要信息。今天的保姆级教程就到这里了,希望对大家有帮助,咱们下次再见!再见!

欢迎收听扣子 ai 播客! 哈喽,大家好,又到了咱们的新手课堂时间。没错,今天咱们要聊的是一个特别实用的工具,豆包 ugc 智能体知识库搭建。我知道很多新手朋友一听到知识库这几个字就犯怵,其实真没那么难,跟着咱们一步步来,你也能答出越用越专业的智能体,是 先得搞明白到底什么是豆包 ugc 智能体知识库啊!说白了就是你给豆包定制一个专属的知识储备库,让他能根据你上传的内容更精准的回答问题,甚至帮你处理特定的任务。 对比如你是做电商的,把自家产品的说明书、用户常见问题都传进去,以后客户问问题,豆包就能直接用你给的资料来回复,不用你再反复解释。或者你是学生,把教材笔记上传,他就能帮你整理重点,解答疑惑。 没错,这就是他最实用的地方,能帮咱们节省大量重复劳动的时间。而且新手学这个也很有必要,毕竟现在 ai 工具越来越普及,掌握一点定制化的技巧,能让工具真正为自己所用。 那咱们先从最基础的开始,创建豆包智能体的完整流程。首先得确保你的豆包 app 是 v 七点、五点零级以上的版本,不然可能找不到智能体工坊的入口。 对这个版本要求一定要注意,要是版本太低,先去应用商店更新一下,更新完之后打开豆包 app, 点击右下角的我的,然后找到智能体功房,点进去就能看到创建智能体的按钮了。 没错,这几步其实挺简单的,跟着路径走就行。接下来就是知识库搭建的关键步骤了。首先是上传文档,豆包支持 pdf、 txt、 d、 o、 c、 x 这些常见格式,单次最多能传五个文件,总大小不能超过一百 mb。 这里有个小细节,上传的时候尽量把相关的文件分类整理好,比如把产品的说明书放在一起,用户问题放在一起,这样豆包在调用知识的时候会更清晰,而且上传之后系统会自动解析文档内容,这个过程可能需要等一会,别着急。 对上传完文档之后就可以设置角色了,角色设定特别重要,他决定了智能体的说话风格和回答逻辑。比如你想让他当一个专业的客服,就可以把角色设定成热情耐心的电商客服,熟悉产品知识,能快速解答用户疑问。 没错,角色设定的描述越具体越好,最好能明确他的身份、语气和职责范围。比如你要让他当老师,就可以写严谨负责的高中数学老师,擅长用通俗的语言讲解复杂知识点。 接下来就是配置技能了,技能配置其实就是告诉智能体他能做什么,比如解答产品使用问题、生成产品介绍、文案整理、用户反馈等等。你可以根据自己的需求来添加不同的技能。 这里还有几个关键参数需要注意,比如响应长度默认是五百到两千字之间,你可以根据需要调整。还有敏感词过滤和联网搜索开关,敏感词过滤建议打开,避免智能体输出不合适的内容。 联网搜索开关如果打开的话,智能体可以结合网上的信息来回答问题,不过要是你希望他只使用你上传的知识库内容,就把这个开关关掉, 对这些参数的设置要根据自己的使用场景来调整。比如你要是用智能体来处理内部文档的问题,就关掉联网搜索,这样他就只会用你上传的内容来回答更精准。 那说完了基础的搭建步骤,咱们再聊聊实用技巧,怎么让智能体越用越专业。首先就是持续迭代知识库,随着你的业务发展或者知识更新,要及时上传新的文档,替换旧的内容 没错,比如你家产品更新了功能,就要把新的说明书上传进去,不然智能体还会用旧的内容来回答问题,就会出错。而且每次上传新内容之后,最好再重新测试一下,确保智能体能正确调用新的知识。 然后就是测试优化方法,最常用的是一致性测试和边界控制测试。一致性测试就是问同一个问题,多次看智能体的回答是不是保持一致,避免出现前后矛盾的情况。 边界控制测试就是问一些超出知识库范围的问题,看看智能体会不会胡乱回答。比如你上传的是电商产品的资料,就问他一些关于医疗的问题,要是他说我不太清楚,那就说明边界控制做的不错。要是他随便乱答,你就要调整角色设定或者技能配置,明确他的回答范围。 对,还有一个小技巧,就是持续优化人设描述和技能配置。比如你发现智能体的回答语气太生硬,就可以在角色设定里加上语气亲切,像朋友一样和用户交流,要是他的技能不够全面,就再添加新的技能。 没错,这些优化都是一个循序渐进的过程,不可能一次就做到完美,需要你不断的测试和调整。聊完了技巧,咱们再说说新手常见的坑,帮大家避避雷。 第一个常见问题就是上传的文档格式不对,导致系统解析失败。比如有些 pdf 文件是图片扫描件,不是可编辑的文本格式,系统就没法解析,这时候你就得先把扫描件转换成可编辑的文本格式再上传。 对!还有一个问题就是角色设定太模糊,比如只写客服,没说清楚是电商客服还是售后客服,也没说清楚语气要求,这样智能体的回答就会比较随意,达不到你想要的效果,所以角色设定一定要具体。 还有一个坑就是上传的文件太大,超过了一百 mv 的 限制。这时候你可以把大文件拆分成几个小文件,比如把一本厚书分成几张分别上传,或者先压缩一下文件,看看能不能把大小降下来。 没错。还有就是忽略了测试环节,刚搭好智能体就直接用,结果发现回答错误百出,所以一定要先测试,确保智能体的回答符合你的要求之后再正式使用。 还有一个常见问题就是不知道怎么叠带知识库,很多人搭好之后就不管了,过了几个月,知识库的内容已经过时了,智能体的回答自然也不准确,所以一定要养成定期更新知识库的习惯。对,这些都是新手很容易犯的错误,大家搭建的时候一定要注意。 好了,今天咱们把豆包 u j c 智能体知识库搭建的整个流程,关键步骤、使用技巧和避坑指南都聊的差不多了,其实总结下来,核心就是三步,搭建基础框架配置、关键参数,持续优化迭代。 没错,新手朋友不用害怕,先从简单的开始。比如先上传一份自己的笔记,设置一个简单的角色,测试一下效果,然后再慢慢调整和优化。 对,最重要的是动手实践,光听理论没用,自己操作一遍,遇到问题再回来看看咱们的指南,很快就能上手。而且随着你不断的优化知识点,智能体会越来越专业,真正成为你的得力助手。 没错,希望今天的内容能帮到大家,要是你在搭建过程中遇到什么问题,欢迎在评论区留言,咱们一起交流讨论。好了,今天的节目就到这里,感谢大家的收听,咱们下次再见!再见啦!

欢迎收听扣子 ai 播客。 哈喽,大家好,我是大一,我是咪仔,欢迎来到我们的技术分享时间。最近刷技术论坛的时候,看到好多人都在聊豆包 ugc 智能体,说搭建起来特别麻烦,踩了好多坑, 刚好我们团队刚做完一个垂直场景的智能体搭建,今天就跟大家聊聊从零到一的完整流程,还有怎么把这套流程附用起来,快速复制到别的场景里。 对哦,我记得最开始我们启动这个项目的时候,你还跟我吐槽过,好多人都在跟风做智能体,但大多都是那种通用型的,放到垂直场景里根本不好用。 没错,就是这个问题。当时我们服务的是一个做家居建材 ugc 社区的客户,用户经常在社区里问一些非常具体的问题,比如小户型客厅怎么搭配沙发实木地板怎么保养之类的。通用智能体要么达的太泛,要么就是直接复制粘贴网上的内容,根本没有针对性。 那客户当时的需求就是要一个专门针对家居建材 ugc 场景的智能体,能理解用户的具体问题,还能结合社区里的优质内容给出准确的回答是吧? 对,而且客户还有个痛点,就是他们的运营团队不是技术出身,没法自己维护和更新智能体的知识库,每次有新的社区内容上线,都得找我们帮忙调整,效率特别低。 所以我们当时就想,能不能做一套可以附用的搭建流程,不仅解决当前的垂直场景问题,以后遇到类似的 ugc 场景也能快速上手。那第一步肯定是需求分析吧,毕竟要先搞清楚用户到底想要什么,才能开始后面的技术选型和功能设计。 没错,需求分析我们分了两步走,第一步是跟客户的产品和运营团队聊,搞清楚他们的核心诉求。除了刚才说的针对性回答和方便维护之外,他们还希望智能体能自动识别社区里的优质内容,自动更新到知识库,这样就能减少运营成本。 那第二步呢?是不是还要去跟终端用户聊聊,看看他们平时在社区里的使用习惯和真正的问题点? 对,我们找了大概二十个活跃用户做了深度访谈,还爬取了社区里三个月的用户提问数据,发现大家的问题主要集中在产品选购、安装维护、搭配设计这几个方面,而且很多问题都是带有强烈场景化的, 比如租房党怎么选性价比高的床垫、南方回南天怎么保养皮质沙发之类的。这些数据应该给后面的功能设计提供了不少方向吧。 没错,需求分析做完之后,我们就开始进入选型了,当时考虑了几个方案,最开始想直接用豆包的基础模型,然后通过 prompt 工程来优化,但后来发现 prompt 工程只能解决部分问题,对于 ugc 场景里的个性化内容处理还是不够灵活。那最后你们选了什么方案? 最后我们决定采用基础模型加垂直领域知识库加自定义技能的架构。基础模型还是用豆包的四点零版本,因为他的语理解能力确实不错。垂直领域知识库我们用了向量数据库,把社区里的优质内容转换成像量存储进去,这样智能体就能快速解锁到相关的内容。 自定义技能这块我们开发了几个针对家居建材场景的插件,比如产品参数查询、搭配方案生成、保养指南推荐之类的。听起来这个架构还挺清晰的,那功能设计这块你们是怎么考虑的? 功能设计我们围绕用户的核心需求分了几个模块,第一个是用户提问处理模块,负责接收用户的问题,进行意图识别和语音解析,然后判断是直接调用基础模型回答还是需要从知识库中解锁内容,或者调用自定义技能。 那第二个模块应该就是知识库管理模块吧,毕竟客户希望运营团队能自己维护知识库。没错,知识库管理模块我们做了可视化的界面,运营人员不需要懂技术就能上传新的社区内容,系统会自动转化成像量存储到数据库里。 而且我们还加了智能审核功能,能自动过滤到低质量或者违规的内容,减轻运营的审核负担。那第三个模块呢?是不是还有智能体的对话管理模块,负责处理多轮对话的上下文? 对对话管理模块很重要,因为很多用户的问题不是一次性就能问清楚的,可能需要多轮交互才能得到满意的回答。比如用户问小户型客厅怎么搭配沙发,智能体给出推荐之后,用户可能会接着问,那茶几选什么材质的比较好? 这时候智能体需要记住之前的对话上下文,给出连贯的回答。那具体实施的时候,你们是怎么一步步把这些功能落地的? 实施阶段我们分了四个步骤,第一步是数据准备把社区里的优质内容整理出来,清洗到重复和无效的内容,然后转换成适合向量数据库存储的格式。这一步花了大概一周的时间,因为数据量比较大,而且还要人工标注一些关键信息,比如内容的分类、关键词之类的。 那第二步应该就是搭建知识库和配置基础模型了吧?对,第二步我们先搭建了向量数据库,把整理好的内容导入进去,然后配置了豆包的 api 接口,设置了基础的 prompt 模板,让模型能根据用户的问题结合知识库的内容生成回答。 这一步我们遇到了一个问题,就是模型有时候会忽略知识库的内容,直接用自己的训练数据回答。后来我们调整了 prompt 的 权重,强制模型优先使用知识库的内容,才解决了这个问题。 第三步是不是就是开发自定义技能和界面了?没错,第三步我们开发了几个自定义技能,比如产品参数查询,我们对接了客户的产品数据库,用户问某个产品的参数,智能体就能直接调用接口获取数据,然后整理成自然语言回答。 界面这块我们做了外部版本和小程序版本,用户可以在社区里直接和智能体对话,运营人员也可以通过外部界面管理知识库。那第四步就是测试和上线了。 对,测试我们分了三个阶段,第一个阶段是内部测试,我们团队的人模拟用户提问,检查智能体的回答是否准确,有没有出现幻觉或者错误的信息。第二个阶段是邀请了一百个社区的活跃用户做灰度测试,收集他们的反馈,然后根据反馈调整模型的参数和 prompt 模板。 第三个阶段就是正式上线,上线之后我们还做了一周的实时监控,每天查看对话日记,及时处理用户的投诉和建议。 那搭建过程中你们遇到的最大挑战是什么?最大的挑战应该是知识库的更新和维护问题。最开始我们是手动上传内容,但后来发现社区里每天都有大量新的优质内容产生,手动上传根本跟不上。 后来我们开发了一个自动爬取和筛选的工具,能自动识别社区里的高赞内容,自动转换成像量存储到知识库,这样就解决了更新不及时的问题。还有其他的技术难点吗? 还有一个难点就是多轮对话的上下文管理。有时候用户的问题比较复杂,涉及多个场景和知识点,智能体很容易忘记之前的对话内容,导致回答不连贯。 后来我们优化了对话管理模块,增加了上下文缓存和记忆机制,让智能体能记住用户之前的提问和回答,这样多轮对话的体验就好了很多。那现在这个智能体上线之后效果怎么样? 效果还不错,客户反馈说,用户的提问响应速度比之前快了很多,回答的准确率也提升了大概百分之三十。而且运营团队现在不需要找我们帮忙维护知识库了,他们自己就能上传和更新内容,效率提升了不少。 那接下来就是大家最关心的部分了,怎么把这套流程附用起来,快速复制到其他同类场景?其实我们在搭建这个智能体的时候,就考虑到了附用的问题, 所以我们把整个流程抽象成了几个标准化的模块。第一个模块是需求分析模板,我们整理了一套针对 ugc 场景的需求分析框架,包括用户访谈提纲、数据爬取方案、需求优先级评估方法之类的。以后遇到类似的项目,直接套用这个模板,就能快速完成需求分析。 那第二个模块应该就是技术选型和架构设计的标准化了吧?对,第二个模块是技术架构的标准化,我们把基础模型加垂直领域知识库加自定义技能这套架构固化下来,针对不同的垂直场景,只需要更换知识库的内容和自定义技能的功能,就能快速搭建新的智能体。 比如如果要做一个美食 ugc 场景的智能体,只需要把知识库换成美食相关的内容,自定义技能换成菜谱查询、食材推荐之类的功能就可以了。 那第三个模块是不是就是实施流程的标准化?没错,第三个模块是实施流程的标准化。我们把从数据准备、知识库搭建、模型配置,既能开发到测试上线的每个步骤都整理成了详细的操作手册, 每个步骤都有明确的时间节点和质量标准,以后不管哪个团队来做类似的项目,都能按照这个流程一步步来,避免走弯路。 那除了这些标准化的模块,还有什么可以附用的东西吗?还有一些通用的工具和组建,比如我们开发的自动爬取和筛选工具,知识库管理界面对话日记分析工具之类的,这些工具都是可以附用的,只需要根据不同的场景做一些小的调整就能用。 那对于其他想尝试类似项目的团队或个人,你有什么建议吗?首先,我觉得要明确自己的核心需求,不要盲目跟风做智能体,先想清楚你要解决什么问题,目标用户是谁,他们的痛点是什么? 然后在技术选型的时候,不要追求最先进的技术,要选择最适合自己场景的方案,比如如果你的场景比较简单,可能用 prompt 工程就能解决问题,没必要搭建复杂的架构,还有吗? 其次,要注重数据的积累和知识库的维护,智能体的回答质量很大程度上取决于知识库的内容,所以一定要花时间整理优质的垂直领域数据,而且要建立定期更新的机制。 另外,在开发过程中要多做测试,尤其是灰度测试,收集用户的反馈,不断优化模型的参数和功能。最后还有什么要提醒大家的吗? 最后,我觉得要注重流程的标准化和附用性,不要每次做项目都从头开始,要把之前的经验和成果沉淀下来,形成可附用的模板和工具,这样以后再做类似的项目就能节省大量的时间和成本。 还有就是要保持学习,智能体技术发展的很快,要不断关注新的技术和方案,及时更新自己的知识体系。今天跟大一聊了这么多,收获真的很大,从项目背景、搭建流程到关键挑战和赋能价值,都讲的非常详细,相信对很多想尝试智能体开发的朋友会有很大的帮助。 没错,希望今天的分享能给大家带来一些启发。如果大家有什么问题或者想法,欢迎在评论区留言,我们会及时回复。好的,今天的技术分享就到这里,感谢大家的收听,我们下期再见!再见!

那 cds 呢,这也是会出了好多天了,我也是会玩了好多天了。我这边的话呢,会把一些视频能生成的案例和一些实操的逻辑啊完整的来聊一遍,还有目前我们能白嫖 cds 的 一些网址啊,我们说出来从一开始我们使用 cds 的 时候呢,需要打开了极梦网站啊,那里面呢就会有, 然后呢它在往下的时候会有一些像 agent 图片和视频,我们呢可以选择视频生成能分两种模式,一种是会更快的啊,主播是让我目前使用的时候在 fast 其实相对生成的不是很舒服啊,而我这边的视频呢,就完全是按照 我们来做电商的一些引流案例的视频啊,包括是我们的开箱的采用的是我们能生成 ugc 的 啊, 然后在一起呢会想让他一句话能生成一些整个开箱的视频哈,然后呢我好去发 t k 啊,发印子哈,我们来演示一下他实际能生成的一些视频的效果是否是 ok 的, 生成的是 t k 的 风格的快节奏,好多运境。那么同时呢还有一个女生可能开箱包包的视频啊,我的原来说的话呢,我的画面不要有文字和不要会有像 抖播啊,我们练练生成试一下啊。我们能生成的时候呢,会有一个细节,就是如果是充会员的话,他实际上能插队的啊,就是如果是没充的话,他是需要去 排队的。而目前按我实际上使用的时候呢,能发现他其实生成的还是会比较慢啊,而且呢会跟下面的时长啊会有关系的事。 而等他能生成的时候呢,我们就聊一下像白嫖的啊,会在哪?目前免费版的有两个平台,一个呢是你用小云雀也是 ok 的, 还有一个呢是你用拿豆包也是可以直接能生成的 ok 视频呢,能搞定了啊,放大了看一下啊,一开始微信 开箱啊 哎,而且还有一个试穿的动作哈,里面东西我觉得它对于一个短视频来说其实已经 ok 了, 我们能发现的视频的质量还是不错的哈, logo, 箱子还有人物的表情哈,包括是环境上也是 ok 的, 还有的是一些运镜和这多脚本,这一副很很那个啥的表情哈。 还有呢是人物试穿的一个物理模型大小,物品物理模型的大小啊,那完全是 ok 的, 没有问题的,是我觉得它是一个符合短视频的一个快节奏的风格啊。我在刚刚呢也是啊, 能生成了一个黑人能开箱 ag 四的啊,我们来试一下啊,我们来看一下 oh yeah these are clean 还有试穿,哎呀,我觉得它的视频完成度和 多镜头来说是很可以的呀,是我没错吧,包括是后面的环境,卧室,还有是其他的鞋子哎,还不错嘛 我觉得,而且它的卧室的能做装修的风格确实是海外的环境哈,它包括是细节的地毯它都会有哈,而且它确实能够直接去能发视频了,包括是 发 t k 上就发 ins 上,还是你能当成买家秀,这都完全没有问题的啊。我在后面呢,又生成了一个像欧美女性的哈,这也是这个 t k 的 风格,很类似的哈,我们也来看一下就可以了。 oh it's even more beautiful in person。 我 觉得它的视频模板其实是同一个,就是开箱展示,试穿没有了啊,无论是它的细节,确实很可以的,对于环境,对于像在人物的位置和一些你能拿着的包包物品哈 啊, ok 的 嘛,还是哈,以后就不用找达人了哈,我们都用 ai 生成每个人自己的达人就可以了。 还有一个案例呢,就是我们能拿它生成动画,就比方说是我们一些很常见的就是皮克斯的动画,或者是一些像二 d 的 啊,平面动画,那都是完全没有问题的。我这边呢,会让它生成的是一个皮克斯风格的剧情反转的视频,十五秒的哈, 包括是我们输出的一些像人物场景时长音效哈,然后呢,我们会让它先生成剧情哈,而有了视频的脚本之后,我们就需要会有一幕的图片,而我这边呢,会让它用 jason 的 格式啊,能生成的,由于呢是按它的一些 格式呢,会让 ai 好 理解,而且模型上会好控制,包括是我们输出的一些逻辑上,就也是会让 ai 更好的啊 理解。而我们往下的一步呢,是拿着这个 flow 的 平台,就也是谷歌的啊,这个平台呢,是可以无损无水印的,支持 nasa banana 啊,能打开之后呢,我们往下有个 new project, 然后下面呢,我们可以去选择,就像一些尺寸,包括是横版的,竖版的哈,而我们需要的是 竖版的,包括是我们一次性需要输出四张图片哈,还有把之前的词汇我们来拷起来,而我们选择的是创建图片啊,我们回车一下,我觉得第几张第二张还不错啊,我们呢,点击右上角,能下载的是二 k 的 哈, ok, 图片你能搞定了,之后就是能把图片生成视频了哈,然后呢,会把之前的图片我们能搞上传,那么同时我还缺一段提示词,而它的提示词其实还是 ai 生成的啊,而它呢,能生成的是一段 图片生视频的这个词包含剧情还有分镜哈,而我们呢,只是需要把它能拷出来啊,那我就没问题了,之后还是选择全能参考啊,有个十五秒的哈,其他的我们都不用管啊,这都不用管, ok, 我 们还是看一下啊,就是它生成的情况啊, 还可以还可以还可以。目前呢,在我们看来呢,就包括是音效,还有是像毛发,还有一些画风上, 确实会把视频制作的门槛啊,都拉低了已经。还有一个号呢,是目前 d a 上很火的,就是一个前后这有对比的图哈,只发了八条视频就涨粉九万,而且呢,很明显是拍的视频, 只不过很少会有人能把他们搞出来哈,很帅的,欧的 money 的 感觉的。而想复刻他的视频呢,其实只要两部,也就是我们只需要复刻两段图片就 ok 了,一块的话呢,是他一个很胖的哈,然后呢,很胖胖的,很臃肿的,很老的。然后还有一块呢,是后面 会很老前锋的哈,有腹肌的有。然后 ai 就 直接生成一个 jason 版本的第二次哈,包括是美国的胖胖的男性赤裸上身哈的 flow 平台里面啊, 让它生成左边右边都觉不大吧,就来这个吧啊,详细看一眼啊,我们又让 ai 生成了一个励志版的,就是身材很壮硕,自信又帅气留胡子,我们还是把词汇能拷进去, 我们由于保持人物的一致性,就需要把之前的图片让他当参考,就是按了一下 ai, 就 可以让他参考人物图片能生成了, ai 能发现已经变成了一个人物,很阳光很帅气哈,而且呢,也是拿着手机在自拍哈, 我们还是把它能拷下来,而我们会把两张图都传上去。之后会有个小细节,就是他可以艾特图片啊,我们来演示一下这样如何使用的,我们呢,会让他直接艾特图片就 好了,就是艾特一下就可以了,艾特之后呢,会指定某一个图片去直接使用的,是会有哪些剧情,而且发现呢,他的视频是无法生成的哈,无法生成就是 显示有人脸信息,而有人脸信息的时候,其实会有一个小 tips 可以 绕过它啊,我这边呢,突然它在不给任何图片的情况下生成一个对比图,我们来看一下啊,搞定了哈,我们来看一下啊, 有这意思了,而它呢,能当成像企号励志,或者是一些像做 lifestyle 模板的一些视频哈,那完全没有问题的。 而在同时呢,我还生成了一个像目前 pk 上很火的叫做勾子的视频啊,我们看一下。 hey, watch, where you're going sir, let me tell you about the incredible aaron 500 you won't believe the price。 无论是你那边想换成像 产品,优惠活动,这些东西,其实包括是优惠码就全部是 ok 的, 拿产品的也是 ok 的。 然后他的提示词,生产流程其实也是一样的,包括是视角,人物呢,在开车,行人就在马路上, 而且在这儿呢,其实可以任意的换场景,就比方说晴天的,雨天的,或者是人物换一换,或者是其他的全部都换一换啊,都是没有问题的,丢到 cds 里面会让它直接 生成,其实是一样的,我们就不用演示了哈。而在同时呢,还有一个视频的类型,我觉得也是很合适的,就是服装的啊,我在之前的话呢,能上传了一张像人物的图片去生成了一个类似汉服的展示的啊, 类似的视频呢,是我复刻的是 nova 汉服。就是我在之前 也聊过吗,他家的汉服呢,会卖的非常好。而目前呢,你可以完全会用 ai 能生成模特了,然后呢,你去能发视频或者引流,甚至你拿着视频投放也都是问题 的啊。我们搞集梦的时候呢,会有一点细节,就是它可以生成像同一个主体之间不同场景的广告片和品宣的一些片子啊,而我们还是演示一下,看他是如何生成的。 我这边呢,我把图片等上传之后,我让他生成的是抖音风格,不要有话外音,字幕要有口播的。那么同时呢,我会把不同的描述,就比方说是一开始会有人会躺在沙发上在玩手机,还有呢,人物和男朋友一起,哎,还有的是 有孩子和一群人会在能开 party 啊,让他一次性会出好多个场景哈。 ok, 我 们来看一下啊,像他生成的效果, 而他的本质呢,是会在同一个物品之下的不同的生活方式。而且他会有一个细节还是要抽卡, 所有视频生成还是要抽卡呀,我觉得很难,一次性会出来很满意的结果是吧,没错吧。 ok, 我 们年后再见。

欢迎收听扣子 ai 播客。 哈喽,大家好,今天咱们来聊一个挺有意思的新赛道,豆包 ugc 智能体定制接单。你可能最近也刷到过不少相关的内容,我先给你掰扯清楚,到底啥是豆包 ugc 智能体?对,我之前只知道豆包是个 ai 助手,这个 ugc 智能体又是啥新东西? 简单来说,就是豆包平台开放了一套零代码、低代码的工具,普通人不用会编程,也能自己做专属的 ai 智能体。比如你是开奶茶店的,就能做个帮你回复顾客、咨询推荐饮品的智能体,不用雇人二十四小时盯着后台了。 那为啥有人愿意花钱让别人帮忙做呢?自己摸索不行吗?你问到点子上了,自己做当然行,但大部分人没那个精力和专业能力。而且企业付费找定制核心还是为了降本增效。比如一个客服团队雇三个人,一个月工资就得小两万, 做个智能体一次性花几千块,后续维护成本也低,还能二十四小时服务,不用轮班,不用休息,这不像吗?确实,而且有些企业可能还想做品牌差异化,比如做个带着自己品牌风格的智能体,跟别人不一样。 没错,这也是一个重要原因。还有些个人,比如自媒体博主,想做个帮自己回复粉丝提问、整理素材的智能体,自己省出时间去做更重要的内容。接下来咱们说说哪些人会是这个服务的典型客户? 我先来猜猜,肯定有中小企业主吧,他们预算不算特别多,但又需要提高效率。对,中小企业主是大头,比如开装修公司的,做个智能体,帮客户解答装修流程、报价问题,不用老板自己天天回复。 还有自媒体人,特别是做知识付费的,做个智能体,帮自己回复课程咨询、整理学员问题,省不少事。电商卖家应该也需要吧,他们每天要回复大量的售前售后问题,智能体能帮着分担不少工作。 没错,电商卖家的需求特别明确,就是智能客服,还有教育培训机构,做个智能体,帮着回复家长的报名、咨询、课程介绍,甚至可以做个智能助教,帮老师批改简单的作业。 政务和事业单位呢?他们会不会也需要,也会有需求。比如做个智能导办机器人,帮群众解答办事流程,需要带什么材料这类问题,减少窗口工作人员的重复劳动。线下商家,比如连锁餐厅、健身房,也能做个智能体,帮着预约答疑,提升顾客体验。 那这个接单服务的流程是啥样的?总不能上来就直接做吧,肯定得有一套完整的流程,我给你拆解一下。第一步就是需求沟通,得跟客户聊明白他们要这个智能体干啥,要解决什么具体问题,比如是当客服还是当助教?有没有特殊要求? 哦,这一步很重要,要是需求没弄清楚,做出来的东西客户不满意,那后续麻烦就大了。对,所以这一步得聊透,最好能让客户列出具体的使用场景和想要实现的功能。 接下来就是提示词工程,这一步是核心,你得把客户的需求转化成 ai 能理解的提示词,告诉 ai 该怎么回答问题,怎么跟用户互动。 提示词工程听起来挺专业的,是不是得有一定的技巧?确实不是随便写几句话就行,得知道怎么给 ai 设定角色,怎么限定回答的范围,怎么引导 ai 输出符合要求的内容。 比如你做个奶茶店智能体,就得告诉 ai, 当顾客问甜度的时候,要推荐哪些甜度选项,还要提醒顾客可以做去冰、少冰之类的。 那第三步呢?是不是要搭建知识库?没错,知识库就是给智能体喂料,把客户的产品信息、业务流程、常见问题这些整理成结构化的内容,让智能体可以从中调取信息来回答问题。 比如装修公司的智能体知识库,就得包含装修的各个环节、材料报价、注意事项这些内容。那做完之后是不是就可以直接交付了? 还不行,得做测试调优。你得模拟各种场景去问智能体问题,看看他回答的对不对,有没有不符合要求的地方,然后不断调整提示词和知识库。比如测试的时候发现智能体回答奶茶甜度的时候漏了去冰选项,就得回去修改提示词,把这个加上测试,没问题了,就可以交付了吧? 交付的时候还得给客户做培训,告诉他们怎么使用这个智能体,怎么更新知识库,怎么调整提示词,毕竟客户以后可能自己要改内容,不能每次都找你。最后就是后续的迭代维护了,比如客户业务有变化,或者 ai 回答出现新的问题,你得帮着调整优化。 那这个服务大概怎么定价呢?总不能乱喊价吧?一般来说可以分成三个档次,入门款大概五百到两千块,就是帮客户做个基础的智能体,比如简单的客服问答,知识点,内容不多,功能也比较单一。 那进阶款呢?进阶款大概三千到八千块,这个档次的智能体功能会更丰富,比如可以接入客户的官网小程序,知识库内容也更全面,还能做一些个性化的设置,比如带着品牌的语气风格回复,那定制款就是一万块以上了。 对,定制款一般是针对需求比较复杂的客户,比如需要对接客户的内部系统,或者要做非常个性化的功能,比如智能体可以帮客户生成合同,做数据分析这类的。影响价格的因素主要有这么几个,首先是复杂度,功能越多,越复杂价格越高。 还有知识库大小对吧?知识库内容越多,整理和搭建的工作量就越大。没错,知识库越大,花费的时间精力就越多,价格自然就高。还有接入方式,要是需要对接客户的第三方系统,比如电商平台、 crm 系统,难度就大很多,价格也会上涨。 最后就是维护周期,要是客户需要长期的维护服务,比如一年的迭代优化,价格也会相应增加。 做这个服务有没有什么需要注意的风险?当然有,首先就是不能过度承诺,有些客户可能对 ai 智能体的期望过高,觉得什么问题都能解决,这时候你得提前跟客户说清楚智能体的能力边界,不然交付之后客户不满意,容易产生纠纷。 还有需求边界不清的问题吧,要是一开始没跟客户说清楚哪些功能包含在报价里,哪些需要额外付费,后续很容易扯皮。 对,这个特别重要。签合同的时候就得把需求写清楚,比如知识库的字数上限是多少,能调整多少次。提示词后续维护包含哪些内容,避免后期客户加需求又不想加钱? 还有知识库版权的问题,客户提供的知识库内容必须是合法的,不能有侵权的东西,不然你帮着做了,万一出问题你也得担责任。 还有迭代维护成本的问题吧,要是客户的需求经常变,你就得不断调整,这时候你的时间成本就会增加,要是一开始没算清楚维护费用,可能就会亏钱。 没错,所以在定价的时候,得把维护成本考虑进去。比如长期维护的话,可以按月或者按季度收费,也可以一次性收取一年的维护费,这样比较稳妥。接下来咱们聊聊这个行业的展望,你觉得这个赛道未来怎么样? 我觉得 ai g c 服务市场肯定会越来越大,毕竟现在企业都在想办法用 ai 降本增效,这个需求是实实在在的。 对,随着 ai 技术越来越成熟,企业对智能体的需求会越来越多样化。不仅仅是客服、助教这些基础功能,可能还会有更多定制化的需求,比如帮企业做市场分析,生成营销文案之类的。那要做这个服务需要具备哪些技能呢? 首先肯定得会提示词工程吧,刚才你也说了,这是核心技能,得知道怎么跟 ai 对 话,怎么让 ai 输出符合要求的内容。 没错,提示词工程是基础,你得熟悉豆包平台的提示词规则,知道怎么写才能让智能体听话。 然后是业务理解能力,你得能听懂客户的业务需求,知道他们的痛点在哪,才能做出符合他们需求的智能体。比如你帮装修公司做智能体,得先了解装修行业的基本流程和常见问题,不然你写的提示词和知识库肯定不符合要求。 还有沟通协调能力吧,你得能跟客户聊明白需求,还得能把客户的需求转化成 ai 能理解的语言。要是沟通不好,做出来的东西肯定不对味。 对,沟通能力特别重要,特别是跟非技术出身的客户沟通,你得用他们能听懂的话解释专业的东西,不能一上来就说提示词、知识库这些术语。另外你还得不断学习新的技能,比如豆包平台更新了新功能,你得赶紧学会用,不然就跟不上市场了。 那你觉得这个赛道有没有什么新的机会?我觉得可以做垂直细分领域的定制服务,比如专门帮电商卖家做智能客服,或者专门帮教育机构做智能助教,这样你就能把某个领域的需求摸透,做的比别人更专业,价格也能卖的更高。 还有就是可以做配套服务,比如帮客户做知识库的整理和更新,或者做智能体的托管维护,这些都是可以延伸的业务。那有没有可能未来豆包平台自己推出更简单的工具,让客户自己就能做,不需要找人定制了? 这个可能性肯定有,但短时间内应该不会完全取代定制服务,因为很多客户的需求还是比较复杂的,自己做不了那么专业,而且就算工具再简单,还是需要有人帮着梳理需求,优化提示词。就像现在很多人会用美图秀秀,但还是需要专业修图师一样, 专业的事还是得专业的人来做。也是,毕竟不是所有人都有那个精力和能力去研究怎么把智能体做到最好。那今天咱们聊了这么多,你给想进入这个赛道的人提几点建议呗。 首先就是得先把豆包 ugc 平台的工具摸透,自己先做几个案例出来,这样跟客户谈的时候才有说服力。然后就是找准自己的定位,是做全品类还是做垂直,细分领域得想清楚。还有就是要注重客户体验,做好服务,毕竟这个行业口碑很重要,客户满意了才会给你介绍新客户。 最后就是要不断学习,跟上 ai 技术的发展,不然很快就会被淘汰。没错, ai 技术更新换代这么快,不学习肯定不行。今天咱们聊的这些内容,应该能给想做豆包 ucc 智能体定制接单的人一些参考了, 希望能帮到大家。要是你对这个赛道感兴趣,可以先去豆包平台试试手,自己做个智能体感受一下,说不定就能发现新的机会。好的,今天的分享就到这里,感谢大家的收听。


在上一节课中呢,我们已经完成了对故事剧本的一个编写和分镜头的制作,搭建了我们整个故事的框架。在这节课中,我们将基于 ai 生成的故事来创建故事中的角色,完成角色的一个设计。我们使用到的工具是豆包的一大模型和极梦 ai, 它们都可以免费在线地来进行使用。 因为我们生成的是一部大约一分钟的 aigc 动画短片,所以角色的设计会相对简单一些,你可以用一种放松的心态来对待这个学习的一个过程。现在我们就开始吧。首先,我们来简要讨论一个问题, 那就是为什么我们需要进行角色设计,毕竟我们创建的 aigc 短片只有大约一分钟的时间,真的有必要进行角色设计吗?角色设计的意义又是什么呢?实际上,我们创作的角色设计有两个主要的目的。第一个呢,是保持角色的统一性。 无论是一分钟的短片,还是涉及到任何场景切换的地方,只要镜头中出现的是同一个角色,我们就需要在整个过程中保持我们角色的一致性。想象一下,如果小满在井边喂鱼时是羊角辫,到了雨中挖沟的场景,却变成了齐刘海的一个短发, 观众们就会瞬间疑惑,这还是同一个人吗?所以,第一个我们角色设计的核心意义呢,就是让观众始终认得我们所设计的角色。这个呢,在任何设计场景切换的故事中,提前建立角色设计是必不可少的步骤。第二个核心意义呢,就是契合我们故事的氛围,因为我们视觉是为情感服务的, 角色的外观设计必须以这种氛围完美的匹配,让观众一眼就能感受到我们故事的温度。在我们进行角色设计中呢,我们仍然使用豆包、大圆模型工具和图像生成工具来进行生成。加豆包。这个工具涉及两种方法来创建我们的角色设计。这里我们总共有三种方法。 方法一呢,是根据剧本的故事情节内容,用大圆模型来生成对应的角色设计的提示词,一共参考, 然后使用专门的 ai 图像生成工具,比如极梦来生成角色的一个外观。这种方法的第一步需要我们使用 ai 大 元模型来生成提示词。此外,我们还需要利用大元模型的文本参考功能,这种方法呢特别适合,就比如我们已经完成了剧本创作, 我们只需要将我们的剧本给到 ai, ai 就 会自动地帮我们从剧本中提炼出最重要的视觉元素。第二种方法呢,是参考现有的设计,然后在脚本中生成角色。 这种方法需要某位角色设计找到一个参考图像,然后使用具有语言理解能力的图像生成模型来生成相似的角色设计。这种方法的好处呢,如果我们对某个角色的视觉风格有明显的偏好,或者在网上看到了喜欢的参考图, 这个方法就能让我们的设计更加的可靠。我们通过上传我们想要的一个参考图片,让 ai 来学习其中的绘画风格、色彩搭配和造探特点,从而让我们生成风格一致,内容原创的角色设计。 第三种方法呢,是最快速的方法,通过指令让 ai 直接来生成我们的角色。这种方法的好处是速度快,迭代灵活,且特别适合在设计过程中不断地调整和优化我们的设计作品。 首先咱们来演示第一种方法,我们先从上个课程里把最终修改好的故事剧本调出来,然后上传到豆包。 上传完成之后呢,大宇模型会自动地解析我们文档里的所有内容,我们这里能看到我们文档里面的字数大小和格式。下面呢是根据这个文档 可以进行的一些快捷指令,比如详细总结这篇文档的内容,用通俗易懂的话说说文档讲了什么,对文档的内容进行润色。不过我们今天呢用不上这些快速选项,我们需要大圆模型帮我们完成角色设计的设定, 所以要按照下面的方式来编写我们的提示词。这我还是当他是一个专业的角色设计师,参考我刚才上传的小满与晶晶的剧本设计。三个角色外貌的提示词 风格呢是二 d q 版。最后提示词需搭配,即萌 ai 来生成。不知道大家发现这个提示词里面的漏斗没有,这里我们直接上传给 ai, 大家可以看到。没过一会儿,就得到了我们故事里的主要角色,小满晶晶不顾头巾老奶奶 他们的一个外貌提示词描述,而且他还很细致地整理了比如小满的发型、服装和标志性的一些细节。这个对于我们在比如奇梦的一些图像生成平台,他理解我们生成的内容就会容易许多。但我们仔细想想,这样的信息其实还是不够完善的,因为从前面的故事剧本里,我们能清晰看到, 比如小满进城之后在学校里面的一个场景和小满的奶奶这两个画面,这两个角色设计其实是没有设计的, 这里呢,我们就可以根据实际的剧本内容来进一步的展开。比如我这里继续让 ai 来生成小满在城里上学以及小满的奶奶的角色,告诉 ai 这两个并没有设计,让 ai 再帮我设计一版。在发送之后呢,我就能看到下面就是迭代之后的一个版本,并且加上了 小满在城里上学版以及小满的奶奶他们的角色设计。这个方法呢,就是我们利用大语言模型的上下文关联能力生成出来的角色设计。接着我们只需要复制这些提示词,然后使用图像生成模型来生成特定的角色设计。 接下来我们就来看一下第二种方法。第二种方法呢是参考图生成原创角色。我们参考现有的设计来生成剧本中的角色。 实际上不仅仅是在当前我们 ai 时代,在传统的我们设计当中,我们在设计角色时,为了创造出更好的设计,往往需要参考其他已经落地成品的一个作品, 从中来汲取灵感。例如我们可以在别人已经生成过的 ai 作品里找到一些可以让我们来使用的元素,比如学习这个小女孩的服饰, 或者另一个小女孩的发型和表情,结合了各方面的优势之后呢,设计出自己独特的角色,这个呢是角色设计中最常见的一种方法,因此在我们 ai 时代来生成图片的过程中,我们也可以参考这种方式来进行生成。 首先我们在网上搜索我们认为合适的图像作为参考,就比如这张,我们回到我们的大语言模型里,然后将我们需要参考的图片上传到我们的大模型里。至于提示词呢,我们这里直接输入,你是一个大师级的角色设计师,请参考这些图像来设计。小满的外观 风格为二 d 水彩角色,保持双臂自然下垂,正面站立,视角比例为十六比九。 在这段描述里呢,有一个非常重要的话术,即角色直立站立,双臂自然下垂,正面站立。当我们生成角色设计图像时,如果没有这句话,生成出的结果呢,往往有许多的随机构图或者角色姿势的一个改变。 在我们后期需要创建角色三式图时, ai 可能并不能很好的理解我们想要生成这个人物的角色,所以我们最好先生成一个正面的仕图。这里我们直接点击发送。 一会呢,我们就能看到 ai 大 元模型已经成功地为我们设计出了我们小满的一个角色设计图像。这个角色呢,它是综合了我们上面三张的一个参考图像。当然,如果我们对当前的设计方案不满意的话,还可以继续迭代我们的提示词,让 ai 设计几个不同的版本。 嗯,点击发送之后呢,我们就又获得了四张不同风格不同样貌的一个小满的一个形象。 我们可以直接将这些图片作为我们后期生成人物图像的一个参考图片,当然这样生成图像的时间是非常低的,怎么豆包上也没有任何的经济成本, 所以如果生成的设计还不够满意的话,我们还是可以重复之前的操作,生成更多的图像,从中呢来选择我们所需要且契合我们剧本的一个角色。 接下来我们就来看一下第三种方法,直接让大圆模型来生成角色设计。这种方法呢其实并没有技术挑战性,我们直接指示 ai 大 圆模型来设计一个角色的外观。方法的好处就是可以快速迭代,风格呢也能自动地联动, 特别适合在设计过程中不断地调整和优化我们的设计方案。这里我们就直接告诉 ai, 我 们就用之前他所生成出来的 ai 角色设计的一个提示词, 让他直接帮我生成小满的一个角色。我们能看到下面四张呢,就是他所生成出来的图片,虽然都非常的精美,但是这个画面和我们的剧本并不贴切, 而且年龄上呢也不相符合。下面我们就可以进一步地来戏化我们的提示词,让他帮我们生成二 d 水彩 q 版的一个小满画面。在这样不断尝试之中呢,借助 ai 大 元模型的理解功能,就可以对我们已经生成的设计做一些调整, 最终得到我们需要的图像效果。就比如第三张图片,当然我们还能让 ai 学习它所生成的这个画面。我们下面就可以这样告诉 ai, 基于小满的形象设计。一个 蓝布头巾老奶奶的形象设计。下面就是老奶奶的形象设计,我们也可以这样说道,让 ai 基于小满和老奶奶的形象创建一个他们在池旁边对话的场景。小满满脸的不解,这样呢,就可以将我们刚才所生成的两个人物形象 合并在一个场景里,我们直接发给 ai, 最后生成出来的画面呢,就是上面小满和老奶奶对话的一个场景。 当然,如果你对这个形象不满意的话,我还可以要求 ai 再生成几个不同的版本来让我们进行选择。通过上述方法,我们已经成功地设计了老奶奶和小满的一个形象, 当然这是还不够的,应在故事中小满还有去城里上学的一个角色设计。我这里还可以进一步地让 ai 来生成小满上学的一个场景。我们直接发给 ai 中呢,它也是完美地生成了小满上学时的一个场景。我们使用大圆模型来生成图像,自然从生成质量来看呢, 它可能不如专门的图像生成工具,可能不如专门的图像生成工具,就比如小满手这里还是有一些污渍的,但是在我们前期创建故事版材料时,可以很方便地将它与上下文联系起来,确保在不同的场景中生成的角色一致性, 这样就能获得更好的效果。这个呢是第三种方法。在讲完了使用大圆模型直接来生成角色的方法之后呢,我们来谈一下风格。 在我们设计角色的外观时,首先要确定我们画面的艺术风格,常见的一些风格,比如现实风格、动漫风格、二维插画、匹克斯风格、三 d 动画等。然而对于这些风格,如果没有具体的指定的话,其实 ai 并不知道我们具体要什么风格, 因此我们在设计我们的图像时,需要保持艺术风格的统一,比如我们这里就使用了二 d 水彩 q 版的一个风格,同时呢,我们也需要保持水彩 q 版风格的一些特征,比如笔触特征、色彩搭配、造型比例的。 但是在深层,比如写实风格的时候,笔触特征、色彩搭配和造型比例就会相应的改变。如果我们在设定风格时,我们不知道我们到底要什么风格,我们就可以去网上找一些参考的图像, 让具有大圆模型理解能力的图像生成工具来学习这种风格。最后呢,生成具有一致性风格,但是不同外观的角色设计。 例如这里我们就可以找一张这样的图片,然后这里我们可以告诉 ai, 我 会给你我想生成画面的提示词,所有后续所生成的图像呢,你都需要引用我们上传这张图片的这样一个风格。然后 ai 就 会帮我们分析这个风格呢,是国风卡通三 d 渲染风格。 就比如我们这里直接让它生成一个小女孩放风筝的一个场景,然后它就会参考国风卡通三 d 渲染风格来生成小女孩放风筝的场景。 从结果上来看呢,最终生成出来的效果和我们之前上传的图片是很像的,包括这个小女孩, 能明显地看到就是我们上传图中的这个小女孩。以上呢,就是本节课的全部内容。这节课中我们解释了如何使用 ai 大 元模型来设计故事脚本中的角色, 还介绍了三种角色设计的方法,以及如何确定生成图像的艺术风格。下个视频我们将详细讲解这些方法以及如何操作我们的节目 ai, 获得更好的生成效果,例如制作角色三式图,从而获得更多更稳定的角色设计的产出。 如果你觉得这期视频对你有帮助的话,你可以点赞并且关注我们,下个视频再见!今天呢,咱们接着上一期的内容往下深入,之前我们已经给大家详细拆解了三种用语言模型做角色设计的方法, 今天这节课呢,把咱们构思好的角色设定转化成更专业的角色设计图。首先第一步就是即墨 ai 的 平台操作步骤。 第一步,我们打开浏览器搜索极陌 ai, 点击进入平台首页,进入之后找到左侧导航栏的生成选项并点击。 说实话,在我用过众多的 ai 生成平台里,极梦的切免和操作逻辑算得上是最简洁好上手的,完全不用花时间去琢磨复杂的功能按钮, 进入生成页面后,底部区域可以输入提示词,同时还支持上传参考图像。再看页面左下角有个功能选择按钮,点击后会弹出下拉菜单,里面包含图像生成、视频生成、数字人动作模仿这几个选项。 我们这次目标呢是制作角色设计图,所以我们直接点击图片生成功能就可以了。 在选好了功能之后呢,接下来就是关键的参数设置环节,咱们一步步来。首先在图像生成右边第一个的是模型选择按钮,目前极梦平台最新的版本呢是图片四点五模型, 这里给大家分享一个通用的规律,和大多数的图像生成工具一样,模型的版本号越高,生成的画面效果通常也就越精细,但是对应的消耗的平台点数也会多一点,大家可以根据自己的需求来进行权衡。 第二个是宽高比的一个设置,我们平台提供了几种常见的比例,比如竖屏九比十六,横屏十六比九,还有适配头像或者海报的一比一比例。下面是分辨率的选择, 这里特别说明一下,咱们做的是角色设计图,后续呢需要放在我们每一个分镜中,而分镜里的角色并不需要占满整个画面,只需要清晰地呈现核心特征就可以了。 所以我们这里就直接使用高清二 k 的 一个分辨率就完全够用了,没有必要追求更高的分辨率来浪费这个点数。这里呢给大家补充一下极梦 ai 的 图像深沉机制,在标准模式下就是在我们不充会员的情况下, 是一张图片只消耗一个积分,而且每天登录极梦都可以自动领取八十个积分点, 这就意味着我们每天可以免费生成八十张图片,所以其实是完全够用的。这里同时也有一个误区,大家可能会认为说豆包 ai 也能免费生成图像,那么我们为什么要用即梦 ai 呢? 其实这两个工具的定位和能力差异是很明显的,豆包的图像生成模型更偏向于实用性,擅长生成符合场景现实的传统画风、字体等内容。而且我们让豆包 ai 来生成一些中文的文字海报的话, 比较容易出现汉字的一个乱码或者画面逻辑错误的问题,而即贸的模型更偏向于意识创作,抽象概念的深层能力更强,画面的逻辑一致性呢,也更好。 在我们做角色设计或者是 ai 设计师,用极梦这样专业的图像生成工具,理论上能得到的效果是比豆包更好的。基于提示词的转写格式其实和豆包是很相似的,因为极梦的图像生成功能具备不错的自然语言理解能力, 所以它不用像 stable fusion 那 样用一堆逗号分割关键词,我们直接可以书写。如三 d 皮克斯,风格简单,灰色背景延伸三式图,角色插画自然手臂下垂,这里有完整的描述, 这里有个关键的技巧,要生成标准的三式图。我们刚才说到的框高比的选择是非常重要的, 咱们首先要选十六比九的一个横屏比例,因为竖屏的比例很难生成完整规整的,单是种效果。 在设置好格式之后呢,咱们就把上节课用故事剧本生成的老奶奶和小满的一个外贸文字描述复制过来,粘贴到提示词框中,然后点击生成,就能直接生成我们的角色图了。点击生成后呢,我们会发现最终生成的结果,虽然角色造型大体是一致的, 但是还是会存在一定的随机性。比如有些图里的角色并不是标准的正侧背三式图,而且混进了特写镜头。不过从中挑选出相对成功的三式图作品,其实难度并不大。 但这里我们会遇到一个新的问题,深沉的角色设计图艺术风格和我们之前用豆包深沉的设定图 差异还是很大的,那么怎么解决风格一致性的问题呢?答案就是使用图像风格参考功能。在我们的提示字框左部有个图像上传区域,咱把之前用豆包生成的角色图片上传到这里。在大家生成了满意的初稿之后呢,我们还可以对图像进行进一步的优化, 在图像的预览界面,点击直接进入画布的编辑模式,点击智能高清选项,优化图像的清晰度,对比处理前后的一个效果,我们能看到差异还是相当明显的。 优化完成之后呢,我们就可以点击右上角的导出按钮了,就能把角色的三式图保存在我们本地。如果图里有多余的角色呢,后续用 ps 等图像编辑工具,我们直接擦掉就好了,这样一张完整的角色三式图就制作完成了。 最后把咱们做好的三式图角色设计和之前的故事剧本整合在一起,一个相对成熟的动画短片前期方案就成型了。 好了,这两节课的内容到这里就全部结束了,咱们来简单回顾一下这两节课围绕了如何用 ai 来完成角色设计展开,详细讲解了三种方法, 一是先生成提示词,再用专业的图像生成工具制作角色设计图。二是参考现有的图像生成脚本化的角色设定。三是直接用语言模型来生成角色设计图像。 同时我们还教了大家如何用专业的图像生成工具来制作角色的三式图,就要强调的呢是这些方法在不同的艺术风格和剧本的要求下,它们各有各的优势, 大家可以通过不断地练习,找到最适合自己的角色设计方法。如果大家觉得这节课的内容对你有帮助的话,欢迎点赞关注并支持我们,咱们下期再见。 hello, 大家好,欢迎大家来到我们 ai g c 动漫系列课程的第三部分。 这节课呢,我们主要来讲一下故事版图片的一个生成,就算你是一个完全不懂 ai 视频制作,不懂图片剧本深沉的一个小白,学完这节课也能快速地上手。 那么在创建 ai 视频的时候呢,我们通常会使用到文生图带图声视频这样一个视频流程,然后再将这些所有生成的视频片段进行后期的编辑和制作,来完成一个完整的 ai 视频作品。 在整个生产流程中,这个故事版的一个生成就显得格外的重要。所以我们就开始今天的课程,我们今天的目标就是快速来上手我们的 ai 视频制作。首先我们会介绍三种专业的故事版图像生成方法,以及多种图像修改的一个优化技巧。 最后呢还会讲到如何保持这些艺术风格的统一性。一般来说,我们有三种方法来创建我们的分镜头脚本图像。第一种方法就是直接生成法,从剧本描述直接生成故事版图像,但需要我们进行进一步的调整。 第二个呢就是优化描述法,我们将已有的剧本进行修改他的一些场景描述,然后再生成,这样生成方法呢,更精确更稳定的来生成我们的故事版内容。第三个呢是视觉想象法, 结合我们的脚本与个人的想象,这个方法呢,自由度会高一点,但其实更需要我们有一定的故事版图片创建的一个经验,每个方法都有各自的优势和适用场景,接下来我们就来逐一的讲解一下。第一种方法,从剧本描述来直接生成我们的故事版内容。 第一种方法非常简单,我们只需要在 ai 里面写下以下内容,你是一个小说作家,请编写一个情节简单,题材为后羿射日的改编故事,言简意赅,字数约为四百五十个字。 在短暂的时间之后呢,我们的故事版内容大概就已经宣传好了,当然有一些具体的画面描述,我们还是需要进一步的叠带我们的提示词的,就比如这里,我让他清晰明了的描述后羿单膝跪在草原上,身体微微后仰,拉满弓 弦,箭头对准太阳,背景是随风摇曳的草原,这样一个情景,让他更细致地来编辑我们这个后羿。设置新编, 我们直接发送给 ai。 这个方法呢,其实大部分时候是可以用并且可以成功地来生成我们的剧本描述的, 但是遇到一些细节上的情况,又需要我们对提示词进行二次的一个优化来生成。这里我们只需要记住,越具体的描述, ai 理解的也更准确一点。我们可以看到刚才呢, ai 就 给我们生成了 我们迭代之后分镜头的一个画面内容,这里其实我们可以让它一次性生成所有的一个故事版的一个画面内容,但是这里我们就把画面描述简单到了十个,这样也方便我们来进行教学的展示和修改。 首先我们来看一下第一个画面,山顶链界,后羿站在山顶的岩石上,穿着黄色的长袍, 他手握住神弓,弓弦拉开一半,背景呢是蓝天白云和连绵的山脉。这我们能看到其实 ai 深沉的画面有些是不符合我们想要的一个要求的,就比如这个十日同天的一个场景, 背景还能是蓝天白云以及山风还吹动着他的衣袍,这个就显得有一点不符合当时的一个场景,所以我们就需要继续迭代我们的提示词,我们就直接告诉 ai, 这个天气应该再恶劣一点。在这样调整之后呢,我们生成出来的内容其实会更加贴近于就比如说十日同天,大地质考这样一个场景,在这样生成了分镜头的画面之后呢,我们直接让它来修出图片。 这里我们来看一下 ai 给我们生成的图片。第一个呢就是后羿在山顶炼剑,站立在山顶的岩石上。第二个呢是十日同天, 并且远处的山脉在栩栩中显得模糊不清。这个画面呢,其实我们注意看一下 它生成的太阳其实是只有九个的,所以我们需要进一步的来迭代我们的提示词,让它帮我们生成十日同天的一个画面。 所以其实总的来说呢,我们如果使用第一种方法,直接从故事版的一个场景中来生成我们的分镜头图片, 大多数情况下是没有问题的。但是就比如这个十日同天的一个场景,我还是需要进一步的来迭代我们的提示词,让它生成更准确的一个画面。所以在我们使用第一种方法的时候呢, 我们的任务就是将我们的文字故事版内容进行进一步的提炼和迭代,以及它所生成出来故事版的一个图片呢,进行进一步的一个修改, 这样才能创建出比较准确的一个画面图像,这个也是我们故事版图像生成的第一种方法。接下来我们来看一下第二种方法, 修改剧本描述之后来生成我们的故事版图片。这种方才是什么意思呢?就以我们刚才后羿射日改编故事为例,它里面原始的剧本往往包含了过多的文学性语言,不够直观,所以我们需要通过精简的优化来大幅度提升我们的画面质量。 操作步骤其实也很简单,我们回到刚才后羿射日的一个场景里面,这里我们就先复制分镜头一的一个画面描述,然后粘贴在输入词框里, 告诉 ai 重新编辑简化里面的内容,并且保留关键的视觉信息,重新来生成脚本。 这里我们能看到它重新生成了一个后羿射日的简化版本,并且保留了画面中的视觉重点。使用这种方式所生成的一个故事版内容呢, 可以将原本一些词藻过于华丽,没有抓住关键重点的描述词句,修改为更简洁更直观的一个画面内容。修改完成之后呢,我们就能看到, 例如分镜头易山顶易变的一个画面内容就简洁了许多,并且保留了关键的一个信息。用这个修改后的描述去生成图片呢,出错的可能性就会好很多,这个呢就是第二种方法,接着我们来看一下第三种方法,结合视觉想象自由进行创作。 这里我们就以神农藏百草为例来发挥我们的创意。主要的内容呢,就是参考我们的故事脚本,再加上自己的视觉想象来生成故事版图像。因为 ai 在 给我们生成画面的时候,并不会帮我们生成一些画面的细节和一些细节的物品, 所以我们就需要发挥我们的想象,像导演一样详细地描述每个镜头,构图、角色动作、环境、氛围等。 这个方法的优势呢,就是画面效果有最高的一个可控度,并且能精确地实现我们的创意构想。但是你需要有一定的语言表达能力,并且需要具备基础的审美和构图的知识。 这里我们就用神农尝百草的这个画面举例,就比如镜头三里面这样一个画面,这是我们完全没有告诉 ai 我 们画面里面想要一个什么样的内容的。这里我们就可以直接跟 ai 说 镜头山里,神农在那种特别茂密的山林里,周围是各种各样的草药,他呢正在认真地看着一株长着红色叶子的草药,手里拿着一个小桃罐,镜头从侧面拍写,突出神农专注的样子。接着我们直接发送给 ai, 我们能看到生成之后的画面呢,就很准确地还原了侧面镜头,他手里拿着小桃罐,然后认真地看着一株长着红色叶子的草药。 因此呢,第三种方法,结合我们的视觉想象以及 ai 现有的一个故事记本来生成的。我们故事版图像是一个非常精确且极其可靠的一个方法,这个也是归功于我们用了自己的想象,然后对画面进行精确的描述的结果。 有时如果你对画面,所以如果大家具备一定的构图和审美鉴赏能力,就可以直接使用这种方法来进行生成我们的画面内容。接下来我们再来看一下图像修改的一个技巧,一般来说我们有两种, 一般来说我们有两种方法来修改我们的画面图像,对我们的画面细节进行进一步的修改。第一个呢是大语言模型的修改, 例如豆包这样的 ai 大 圆模型,这样的方法呢适合一些局部的细节调整,例如去除装饰,改变小物件等。但是因为大圆模型它并不具备很好的图片一致性, 所以就导致我们换场景时,可能因为我们换了一个其他的场景,容易导致风格的变化和人物的变化。 第二个呢是极梦的局部重绘功能,这种方法可以更精确的修改我们的画面内容,并且实现一些复杂的局部重绘以及专业级的效果。首先我们来看一下第一种方法, 使用大语言模型来修改图像,这里我们就来看一下第一种方法,我们还是以神农举例,就比如我让它结合镜头三来生成神农走在森林的小路上的特写镜头,并且神情紧张比例为十六比九。 我们能看到生成出来的算面呢,确实是在这个场景中的,也确实是二 d 的 一个画面风格, 但显然原色的外貌特征已经完全的改变了,从原本的头上没有角的形象生成出来了有角的形象,因此在这种情况中呢,我们就需要用到极梦 ai 就是 我们第二个方法, 这里等会儿我们会详细地讲解。到。这里我们接着来说通过大圆模型来局部重绘我们的画面内容。就比如这里我们让红色的草药变成白色的草药,这里我们点击这个图片的右上角更换图片, 然后点击 ai 生图,找到里面红色叶子。通过这个大圆模型来生成的故事版内容辨识可以在我们前期很好地生成我们的画面内容,但是如果需要更精细化地处理的话,就需要用到我们的第二种方法,就是使用极梦来局部重绘我们的画面内容。 因为我们之前讲过极梦呢,它出了四点五版本,它有很强的一个一致性和风格的统一性。所以这里我们还是以刚才神农为例,上传神农的一个图片, 然后直接告诉极梦 ai, 让它根据图片来生成神农走在森林小路上的特写镜头,然后直接发送给 ai, 就能看到我们刚才生成的人物是一样的,它很好地保持了风格和人物的统一性, 并且是走在森林的小路上的。我们刚才使用大语言模型所生成出来的画面呢,有本质上的一个区别。同时这里我再来讲一下通过极梦 ai 实现局部重绘功能的一个使用方法, 我们还是用刚才的图片,接着我们只需要告诉 ai 将红色的草药变成白色,其他的画面不要变动,比例十六比九, 我们能看到它在保留了我们画面和原画面不变的情况下,将红色的草药变成了白色积木。 ai 还有一种用法就是它可以根据我们上传的画面内容来生成接下来的四个不同的分镜图片, 我们这里直接让它根据图片来生成接下来四个分镜的一个图片, 这个就是积木 ai 根据我们上传的图片来生成的四个不同分镜的一个图片。我能看到其实它对于这个图片的理解能力是很强的,有时候呢也能生成我们意想不到的一些画面。最后我们来简单回顾一下我们本节课的一个内容, 我们首先讨论了三种生成故事版图像的一个方法,同时我们还讨论了两种图片修改的一个方法。如果你觉得本节课的内容对你有帮助的话,不妨点赞并关注以支持我们,我们下一节课再见。我是 ai 女掌门,关于 ai 随时提问。

你有没有发现很多 a i u d c 最诡异的地方不是廉价,而是脸已经很真了,画面还是不像真的拍出来。问题通常不在脸,而在你把拍摄逻辑写丢了。最常见的第一个错误就是只写人,不写镜头。 很多人会写一个女生在咖啡店自拍,很真实,但这句话只是在交代内容,没有交代这是谁在拍,用什么拍,怎么拍,所以模型就会自己乱补。最后出来的不是自拍,而是一张长得像写真棚拍的图。正确的写法不是只写自拍,而是把自拍为什么像自拍写出来。 前置镜头、手臂距离轻微、广角低变、手持构图、室内混合光,这些一补上,画面才会像真的。有人举着手机拍了一张。第二个常见错法是,视角写的像上帝似的,不像人类视角。很多图为什么一眼假 不是人?假是因为假,你得让观众一眼知道这个镜头是拿在手里拍的,不是飘在半空里拍。要写清楚手机在什么高度,人物离镜头多远,镜头从里边看过去。这也是为什么很多所谓提示词,你一套就翻车, 因为提示词不是魔法,他只是把镜头、光线、空间打包了。你不懂这三个变量换十套预设提示词还是假的。今天的分享就到这里,我是设计师妍妍,关注我,带你掌握更多 a i g c 生成技巧!