粉丝426获赞5628


欢迎收听扣子 ai 播客。 哈喽,大家好,我是大一,我是咪仔,欢迎来到我们的技术分享时间。最近刷技术论坛的时候,看到好多人都在聊豆包 ugc 智能体,说搭建起来特别麻烦,踩了好多坑, 刚好我们团队刚做完一个垂直场景的智能体搭建,今天就跟大家聊聊从零到一的完整流程,还有怎么把这套流程附用起来,快速复制到别的场景里。 对哦,我记得最开始我们启动这个项目的时候,你还跟我吐槽过,好多人都在跟风做智能体,但大多都是那种通用型的,放到垂直场景里根本不好用。 没错,就是这个问题。当时我们服务的是一个做家居建材 ugc 社区的客户,用户经常在社区里问一些非常具体的问题,比如小户型客厅怎么搭配沙发实木地板怎么保养之类的。通用智能体要么达的太泛,要么就是直接复制粘贴网上的内容,根本没有针对性。 那客户当时的需求就是要一个专门针对家居建材 ugc 场景的智能体,能理解用户的具体问题,还能结合社区里的优质内容给出准确的回答是吧? 对,而且客户还有个痛点,就是他们的运营团队不是技术出身,没法自己维护和更新智能体的知识库,每次有新的社区内容上线,都得找我们帮忙调整,效率特别低。 所以我们当时就想,能不能做一套可以附用的搭建流程,不仅解决当前的垂直场景问题,以后遇到类似的 ugc 场景也能快速上手。那第一步肯定是需求分析吧,毕竟要先搞清楚用户到底想要什么,才能开始后面的技术选型和功能设计。 没错,需求分析我们分了两步走,第一步是跟客户的产品和运营团队聊,搞清楚他们的核心诉求。除了刚才说的针对性回答和方便维护之外,他们还希望智能体能自动识别社区里的优质内容,自动更新到知识库,这样就能减少运营成本。 那第二步呢?是不是还要去跟终端用户聊聊,看看他们平时在社区里的使用习惯和真正的问题点? 对,我们找了大概二十个活跃用户做了深度访谈,还爬取了社区里三个月的用户提问数据,发现大家的问题主要集中在产品选购、安装维护、搭配设计这几个方面,而且很多问题都是带有强烈场景化的, 比如租房党怎么选性价比高的床垫、南方回南天怎么保养皮质沙发之类的。这些数据应该给后面的功能设计提供了不少方向吧。 没错,需求分析做完之后,我们就开始进入选型了,当时考虑了几个方案,最开始想直接用豆包的基础模型,然后通过 prompt 工程来优化,但后来发现 prompt 工程只能解决部分问题,对于 ugc 场景里的个性化内容处理还是不够灵活。那最后你们选了什么方案? 最后我们决定采用基础模型加垂直领域知识库加自定义技能的架构。基础模型还是用豆包的四点零版本,因为他的语理解能力确实不错。垂直领域知识库我们用了向量数据库,把社区里的优质内容转换成像量存储进去,这样智能体就能快速解锁到相关的内容。 自定义技能这块我们开发了几个针对家居建材场景的插件,比如产品参数查询、搭配方案生成、保养指南推荐之类的。听起来这个架构还挺清晰的,那功能设计这块你们是怎么考虑的? 功能设计我们围绕用户的核心需求分了几个模块,第一个是用户提问处理模块,负责接收用户的问题,进行意图识别和语音解析,然后判断是直接调用基础模型回答还是需要从知识库中解锁内容,或者调用自定义技能。 那第二个模块应该就是知识库管理模块吧,毕竟客户希望运营团队能自己维护知识库。没错,知识库管理模块我们做了可视化的界面,运营人员不需要懂技术就能上传新的社区内容,系统会自动转化成像量存储到数据库里。 而且我们还加了智能审核功能,能自动过滤到低质量或者违规的内容,减轻运营的审核负担。那第三个模块呢?是不是还有智能体的对话管理模块,负责处理多轮对话的上下文? 对对话管理模块很重要,因为很多用户的问题不是一次性就能问清楚的,可能需要多轮交互才能得到满意的回答。比如用户问小户型客厅怎么搭配沙发,智能体给出推荐之后,用户可能会接着问,那茶几选什么材质的比较好? 这时候智能体需要记住之前的对话上下文,给出连贯的回答。那具体实施的时候,你们是怎么一步步把这些功能落地的? 实施阶段我们分了四个步骤,第一步是数据准备把社区里的优质内容整理出来,清洗到重复和无效的内容,然后转换成适合向量数据库存储的格式。这一步花了大概一周的时间,因为数据量比较大,而且还要人工标注一些关键信息,比如内容的分类、关键词之类的。 那第二步应该就是搭建知识库和配置基础模型了吧?对,第二步我们先搭建了向量数据库,把整理好的内容导入进去,然后配置了豆包的 api 接口,设置了基础的 prompt 模板,让模型能根据用户的问题结合知识库的内容生成回答。 这一步我们遇到了一个问题,就是模型有时候会忽略知识库的内容,直接用自己的训练数据回答。后来我们调整了 prompt 的 权重,强制模型优先使用知识库的内容,才解决了这个问题。 第三步是不是就是开发自定义技能和界面了?没错,第三步我们开发了几个自定义技能,比如产品参数查询,我们对接了客户的产品数据库,用户问某个产品的参数,智能体就能直接调用接口获取数据,然后整理成自然语言回答。 界面这块我们做了外部版本和小程序版本,用户可以在社区里直接和智能体对话,运营人员也可以通过外部界面管理知识库。那第四步就是测试和上线了。 对,测试我们分了三个阶段,第一个阶段是内部测试,我们团队的人模拟用户提问,检查智能体的回答是否准确,有没有出现幻觉或者错误的信息。第二个阶段是邀请了一百个社区的活跃用户做灰度测试,收集他们的反馈,然后根据反馈调整模型的参数和 prompt 模板。 第三个阶段就是正式上线,上线之后我们还做了一周的实时监控,每天查看对话日记,及时处理用户的投诉和建议。 那搭建过程中你们遇到的最大挑战是什么?最大的挑战应该是知识库的更新和维护问题。最开始我们是手动上传内容,但后来发现社区里每天都有大量新的优质内容产生,手动上传根本跟不上。 后来我们开发了一个自动爬取和筛选的工具,能自动识别社区里的高赞内容,自动转换成像量存储到知识库,这样就解决了更新不及时的问题。还有其他的技术难点吗? 还有一个难点就是多轮对话的上下文管理。有时候用户的问题比较复杂,涉及多个场景和知识点,智能体很容易忘记之前的对话内容,导致回答不连贯。 后来我们优化了对话管理模块,增加了上下文缓存和记忆机制,让智能体能记住用户之前的提问和回答,这样多轮对话的体验就好了很多。那现在这个智能体上线之后效果怎么样? 效果还不错,客户反馈说,用户的提问响应速度比之前快了很多,回答的准确率也提升了大概百分之三十。而且运营团队现在不需要找我们帮忙维护知识库了,他们自己就能上传和更新内容,效率提升了不少。 那接下来就是大家最关心的部分了,怎么把这套流程附用起来,快速复制到其他同类场景?其实我们在搭建这个智能体的时候,就考虑到了附用的问题, 所以我们把整个流程抽象成了几个标准化的模块。第一个模块是需求分析模板,我们整理了一套针对 ugc 场景的需求分析框架,包括用户访谈提纲、数据爬取方案、需求优先级评估方法之类的。以后遇到类似的项目,直接套用这个模板,就能快速完成需求分析。 那第二个模块应该就是技术选型和架构设计的标准化了吧?对,第二个模块是技术架构的标准化,我们把基础模型加垂直领域知识库加自定义技能这套架构固化下来,针对不同的垂直场景,只需要更换知识库的内容和自定义技能的功能,就能快速搭建新的智能体。 比如如果要做一个美食 ugc 场景的智能体,只需要把知识库换成美食相关的内容,自定义技能换成菜谱查询、食材推荐之类的功能就可以了。 那第三个模块是不是就是实施流程的标准化?没错,第三个模块是实施流程的标准化。我们把从数据准备、知识库搭建、模型配置,既能开发到测试上线的每个步骤都整理成了详细的操作手册, 每个步骤都有明确的时间节点和质量标准,以后不管哪个团队来做类似的项目,都能按照这个流程一步步来,避免走弯路。 那除了这些标准化的模块,还有什么可以附用的东西吗?还有一些通用的工具和组建,比如我们开发的自动爬取和筛选工具,知识库管理界面对话日记分析工具之类的,这些工具都是可以附用的,只需要根据不同的场景做一些小的调整就能用。 那对于其他想尝试类似项目的团队或个人,你有什么建议吗?首先,我觉得要明确自己的核心需求,不要盲目跟风做智能体,先想清楚你要解决什么问题,目标用户是谁,他们的痛点是什么? 然后在技术选型的时候,不要追求最先进的技术,要选择最适合自己场景的方案,比如如果你的场景比较简单,可能用 prompt 工程就能解决问题,没必要搭建复杂的架构,还有吗? 其次,要注重数据的积累和知识库的维护,智能体的回答质量很大程度上取决于知识库的内容,所以一定要花时间整理优质的垂直领域数据,而且要建立定期更新的机制。 另外,在开发过程中要多做测试,尤其是灰度测试,收集用户的反馈,不断优化模型的参数和功能。最后还有什么要提醒大家的吗? 最后,我觉得要注重流程的标准化和附用性,不要每次做项目都从头开始,要把之前的经验和成果沉淀下来,形成可附用的模板和工具,这样以后再做类似的项目就能节省大量的时间和成本。 还有就是要保持学习,智能体技术发展的很快,要不断关注新的技术和方案,及时更新自己的知识体系。今天跟大一聊了这么多,收获真的很大,从项目背景、搭建流程到关键挑战和赋能价值,都讲的非常详细,相信对很多想尝试智能体开发的朋友会有很大的帮助。 没错,希望今天的分享能给大家带来一些启发。如果大家有什么问题或者想法,欢迎在评论区留言,我们会及时回复。好的,今天的技术分享就到这里,感谢大家的收听,我们下期再见!再见!

嗨喽,大家好,我是兔子。本节课内容根据大家上交的作业进行了一些调整,主要围绕视频创意思路及创意剪辑方法来做讲解。本期课程我们要在传统的捏仔展示视频中增加一些新玩法。以这个视频为例, and other people you have woken you。 穿搭展示部分可以参考变装小游戏思路 或是指引式展示,避免传统的截图罗列。教程如下,在仔仔里保存穿搭前、穿搭后的静态素材,将穿搭前素材以画中画模式导 剪映,可以适当增加描边效果。 然后点击画中画,导入穿搭后素材。利用抠图功能,把衣服抠出来, 放在人物两侧,用关键针功能为衣服定制一条路线,选中上衣视频,在前半部分打个关键针,这是起始点。再在结尾处打个关键针,这是终点。将衣服拖动至人物身上对齐, 这样一条完整的路线就出来了。 指引式展示比刚刚的简单一些,所用到的功能是画中画、抠图和 贴纸功能。具体操作如下, what i'm gonna sleep with hot and miss。 动态展示部分可以与正 侧面展示合并起来,让整体画面看起来更丰富。具体操作如下,先导入一段动作,把人物抠出来,放到画面上方, 再导入一块背景图, 点击蒙版中的矩形弱化一下,图片的边缘呈现出渐变效果。 将仔仔正面和侧面图片导入抠图,在贴纸中选择一款喜欢的边框,调整位置 大小,再添加文字标注, 最后再添加一些贴纸,丰富画面。 最后再教大家一个裸眼三 d 制作的小技巧,可以用于动态展示。先导入动态素材复制,选中第一段素材,在结尾处打一个关键针,然后选择蒙版中的镜面, 再挪到视频开头,打一个关键针,选择蒙版中的镜面,把两条线放大至全屏, 选择第二段素材,切到画中,画与第一段素材对齐,然后点击抠图,把人物抠出来, 这样裸眼三 d 的效果就出来了。下面是作业时间。

欢迎收听扣子 ai 播客。 hello, 大家好,欢迎来到咱们今天的播客,我是大一,我是米仔。今天咱们要聊的话题啊,可能是很多在做豆包 ugc 智能体的朋友都会忽略的,那就是怎么保持芝士库的活力,让它持续进化。 没错,很多人一开始搭建知识库的时候特别上心,把能想到的内容都塞进去,就觉得大功告成了。但其实啊,知识库就跟咱们用的手机 app 一 样,不更新不维护,用着用着就不好使了。 是呢,我之前就遇到过一个朋友,他做了一个美食推荐的智能体,一开始知识库里面都是去年的网红店信息,结果今天好多店都关门或者换菜单了,用户问起来智能体还在推荐那些已经不存在的店,用户体验一下就变差了。 这就是典型的内容过时问题。其实知识库退化的现象还挺多的,除了内容过时,还有覆盖不全的情况。比如说你一开始只是想做一个考研政治的智能体,结果用户后来又问起考研英语、考研数学的问题,你的知识库就覆盖不到了,这就出现了盲区, 还有质量稀释的问题。我见过有些朋友的知识库里面,同一件事情重复放了好多次,甚至还有一些内容互相矛盾,用户看了都不知道该信哪一个。 对这些问题如果不及时处理,慢慢积累下来,你的智能体就会越来越不好用,用户也就不愿意再来找他了。所以啊,咱们不能只想着建设知识库,更要想着让他进化。 那接下来咱们就聊聊怎么让知识库进化吧。首先第一步肯定是要先发现问题,对吧?也就是诊断机制。大叶,你觉得怎么才能发现知识库里面的问题呢? 我觉得最直接的方式就是看用户的反馈,比如说用户经常问同一个问题,但是你的智能体答不上来,或者答的不对,这就说明你的知识库在这个知识点上有缺失。还有就是看智能体的回答命中率,如果命中率越来越低,那肯定是知识库出问题了。 没错,除了用户反馈,咱们自己也可以定期去检查一下知识点,比如说看看里面有没有过时的内容,有没有重复或者冲突的地方。还有啊,咱们可以去看看同类型的优秀智能体,对比一下人家的知识点,找找自己的差距。 对诊断出问题之后,还得有评估标准,判断哪些内容是好的,哪些是不好的。比如说内容质量,要看它是不是准确有用,有没有错误。信息覆盖度的话,要看是不是能满足用户大部分的需求,有没有明显的盲区, 准确性就更不用说了,内容必须是正确的,不能误导用户。那评估完了之后就是迭代策略了,具体要怎么操作呢? 我觉得可以分成几个方面。首先是补充,把知识库里面缺失的内容补进去,比如刚才说的,用户经常问但是答不上来的问题,就可以把对应的答案加进去。然后是修正,对于那些错误或者过时的内容,要及时修改或者替换掉, 还有淘汰,对吧?那些重复用余或者没用的内容就应该把他们删掉,不然知识库会越来越臃肿,有时候还需要重组,把一些相关的内容整理到一起,让结构更清晰,方便智能体调用。 没错,工具方面的话,其实豆包本身就有一些功能,可以辅助咱们维护知识库,比如说可以批量导入导出内容,还可以设置关键词关联,让智能体更容易找到对应的内容。 另外也可以用一些第三方的文档管理工具,比如飞书文档、腾讯文档之类的,方便团队协助维护知识库。 说到团队协助,其实很多人可能是一个人在做智能体,但如果是团队的话,分工就很重要了,比如说有人负责收集用户反馈,有人负责更新内容,有人负责审核质量,这样效率会更高。 不过啊,在实践过程中,很多人都会踩一些坑,比如说只增不减,只往知识库里面加内容,不删除,没用的。时间长了,知识库就会变得特别臃肿,智能体调用的时候也会变慢,而且容易出现混乱。 对,我就见过一个朋友的知识库,里面有好几千条内容,但是很多都是重复的,或者是几年前的老内容,他自己都不知道哪些有用,哪些没用了。还有的朋友特别依赖自动化工具,觉得用 ai 生成的内容直接放进去就行了,完全不审核结果,里面有很多错误信息,误导了用户。 还有一个误区就是忽视用户反馈,觉得自己做的知识库已经很完美了,不需要听用户的意见。其实用户才是最了解自己需求的人,他们的反馈就是最好的优化信号。比如说用户经常吐槽某个回答不好,那咱们就应该去看看对应的内容是不是有问题,及时调整。 缺乏版本管理也是一个常见的问题。很多人更新知识库的时候,直接就覆盖了原来的内容,要是更新错了,想恢复都恢复不了。所以啊,定期备份知识库,做好版本管理还是很有必要的,这样万一出了问题还能回溯到之前的版本, 那怎么才能让知识库的进化持续下去呢?我觉得首先要建立一个周期性盘点机制,比如说每个月或者每个季度,花点时间去检查一下知识库,看看有没有需要更新的内容,有没有问题需要处理。 对,还要形成一个用户反馈驱动的迭代闭环,就是说收集用户的反馈,然后根据反馈去优化知识库,优化之后再看用户的反应,再继续调整,这样一来,知识库就能跟着用户的需求一起变化。 数据指标监控也很重要,比如说可以看看智能体的回答,命中率、用户满意度、问题解决率这些指标如果命中率下降了,就说明知识库的覆盖度或者准确性可能有问题,如果满意度低了,就说明回答的质量可能不够好。通过这些数据,咱们就能及时发现问题,调整策略。 团队写作的话,要是有团队的话,明确每个人的角色分工,比如有人负责内容收集,有人负责审核,有人负责更新,这样大家各司其职,效率会更高。就算是一个人做,也可以给自己制定一个计划,比如每天花多少时间去处理用户反馈,每周花多少时间去更新内容。 其实啊,知识库进化的本质就是跟着用户需求的变化而变化,用户的需求不是一成不变的,今天可能问这个问题,明天可能就问那个问题,所以咱们的知识库也要跟着变,才能一直满足用户的需求。 没错,而且未来肯定会有更多智能化的辅助维护工具出现,比如 ai 可以 自动帮咱们检测知识库里面的错误内容,自动更新过时的信息,甚至可以根据用户的提问习惯,自动推荐需要补充的内容,到时候维护知识库可能就会轻松很多了。 不过不管工具怎么变,核心还是要以用户为中心,毕竟咱们做智能体最终目的还是为了服务用户,只要咱们能时刻关注用户的需求,不断优化知识库,就能让咱们的智能体一直保持活力。 好了,今天咱们关于豆包 ugc 智能体知识库进化的话题就聊到这里了,希望大家听完之后能对怎么维护知识库有新的认识,也希望大家都能把自己的智能体做的越来越好。没错,感谢大家的收听,咱们下次再见!