00:00 / 01:56
连播
清屏
智能
倍速
点赞145
Agent答错政策问题,我第一反应不是改答案 在做 Agent 项目的时候,如果它连续把政策类问题答错,我的第一反应其实不是「赶紧教它正确答案」。因为只改答案基本没用。换个相似场景,它还是会翻车。 第一步,我会先拆“它在哪种情况下容易错”,我不会让 Agent 只记一句“上次这个问题答错了”,这种记忆几乎没有复用价值。我更关心的是它是不是在某一类高风险问题上,处理方式本身就不对。比如我会把错误抽象成一条经验:「只要是退款、会员权益这类问题,如果不先查最新政策就直接回答,风险就很高。」重点不是记结论,而是让 Agent 识别出这是高风险问题类型。 第二步,直接改它的处理顺序翻车之前,Agent 往往是“我大概知道 → 直接回答”。那 policy memory 更新之后,我会给它加一条默认规则:「遇到退款 / 政策类问题,先查规则,再回答。」这样下次再遇到类似问题,它不会急着给结论,而是先拉最新政策、看有没有例外条款,不再凭感觉做决定。 第三步,约束它“怎么说”很多客服翻车,其实不是完全答错,而是话说得太满。比如:“肯定能退”“马上到账”。所以我会再写一条经验进去:「政策类问题,回答时必须带条件,避免绝对承诺。」于是它的回答就会变成:“如果符合这些条件,一般可以退款”,“具体以系统处理结果为准”,投诉和风险会明显下降。 最后一步:教它什么时候该停下。这一点我觉得非常关键。当 Agent 发现信息不全、政策冲突、置信度不够时,policy memory 会触发一条兜底规则:不要硬答,先澄清,或者直接转人工。很多系统不是“不会答”,而是不知道什么时候该停。 Policy memory 不是记住“正确答案”,而是让 Agent 知道:哪些问题要先查、怎么说才稳、什么时候别逞强。这才是 Agent 连续翻车之后,真正应该学会的东西。 #llm #大模型 #ai #互联网大厂 #面试题
00:00 / 02:07
连播
清屏
智能
倍速
点赞54
00:00 / 01:01
连播
清屏
智能
倍速
点赞30
00:00 / 02:17
连播
清屏
智能
倍速
点赞4
00:00 / 05:43
连播
清屏
智能
倍速
点赞751
00:00 / 00:48
连播
清屏
智能
倍速
点赞22
拿到孩子寒假作业的第一时间千万不要直接撕掉答案……家长应改变对答案的偏见,从小学高年级起,要逐渐培养孩子独立使用答案改错的答案 1.独立做完习题后,对照答案批改 答案应在独立完成练习后才能使用,切忌孩子在做题时偷偷使用,如果真的不会,应鼓励孩子先尽量写一个答案或解题思路,错了再用红笔改,有助于后期的错题整理工作 2.发现错误,独立检查错误点 对照答案时,第一遍教会孩子只改对错,不看具体过程。然后针对错误的地方,先自己去修正,看是否可以找到计算或正确的思路,这一过程至关重要,与考试检查类似,在反复的自我检查过程,发现大量的知识点理解偏误,审题错误,做题习惯的漏洞等,修正薄弱点,提高应试能力 3.找不到错误点,深究答案过程 若是第一遍无法自查发现错误,这类题的价值就相当大,遇到了自己的知识盲区了,此时应深究答案的细节与步骤,反复推敲,举一反三,发现自己思路和答案的偏差,即可找到该题考查的重点 4,完全不会的题,学习答案的解题思路 不是照抄,也不是完全看一遍答案就行了,而应一步一步揣摩答案的解题思路,看到第一个提示点后,试着盖住答案,自己往下做,被卡住后继续翻看答案,如此反复循环,一步一步看,直至理解透彻,争取下次遇到类似问题能独立完成 答案是一种训练辅助,是相当重要的自学材料,尤其是标注了详细解题步骤的答案,孩子能否从答案中吸收知识在很大程度上决定了自学效率#你的寒假作业写完了吗 #做作业的那些事 #辅导作业的家长 #家长必读 #培养孩子好习惯
00:00 / 00:07
连播
清屏
智能
倍速
点赞36
00:00 / 01:03
连播
清屏
智能
倍速
点赞19
00:00 / 00:21
连播
清屏
智能
倍速
点赞374
00:00 / 00:56
连播
清屏
智能
倍速
点赞11
00:00 / 00:56
连播
清屏
智能
倍速
点赞0