00:00 / 08:47
连播
清屏
智能
倍速
点赞63
00:00 / 02:16
连播
清屏
智能
倍速
点赞1369
00:00 / 00:59
连播
清屏
智能
倍速
点赞150
AI产品经理实战篇之幻觉是什么 2023 年,纽约一个律师用 ChatGPT 写诉状,AI 给他引用了 6 个判例,案件名、法官名、卷宗编号一应俱全。 律师交上法庭。结果——6 个判例全是 AI 编的。律师被罚款 5000 美元,当场社死。 这事让全世界第一次看清楚:AI 不是 bug,AI 本来就会编。这就是「幻觉」。 ① 幻觉到底是什么 AI 一本正经地胡说八道。错误的事实、虚构的来源、编造的数字。最可怕不是错,是错得理直气壮。 记住这句话:幻觉不是 bug,是大模型的天性。只要还是这代模型架构,幻觉就永远存在。AI PM 的任务不是消灭幻觉,是把它降到可接受范围。 ② 为什么 AI 会编 大模型不是知识库,是接龙游戏。 它的工作机制只有一件事——根据前面的话,预测下一个字最可能是什么。它不在乎对不对,只在乎接下来这个字"看起来通不通顺"。 3 种最常见的幻觉类型: 事实性幻觉:爱因斯坦 1955 年获诺贝尔奖(实际 1921) 来源性幻觉:根据 Nature 2023 研究(论文不存在) 逻辑性幻觉:前文说 A 不能 B,后文给 A 怎么 B 的方案 ③ AI PM 怎么治 80% 的 AI 产品事故都死在幻觉。工程层 4 个标准动作: 上 RAG(开卷考试,基于真实资料) 加引用(强制标来源,可溯源) 做评估(LLM-as-a-Judge 测幻觉率) 加兜底(关键场景人工复核) Prompt 层 3 句治幻觉咒语,写进 system prompt,幻觉率立刻降一半: "基于参考资料作答,没有的直接说不知道" "每条结论必须标注来源" "不确定的内容用'可能/大约',不要用确定句式" 面试金句(直接抄) 被问"幻觉怎么治",按 4 句答: 第 1 句:幻觉不是 bug,是天性,只能控制不能消灭 第 2 句:工程层 4 策略——RAG / 引用 / 评估 / 人工兜底 第 3 句:Prompt 层 3 句咒语——基于资料、标来源、用不确定句式 第 4 句:上线标准——幻觉率 ≤ 5% 4 句答完,面试官立刻知道你是踩过坑的。 一句话总结 所有说"我们 AI 不会胡说"的,都是在胡说。 下条讲 Token 是什么,你和 AI 聊一句话到底花多少钱。关注 NOVA,每天一个 AI PM 知识点。 #AI产品经理 #AI幻觉 #大模型 #AI落地
00:00 / 04:37
连播
清屏
智能
倍速
点赞13
00:00 / 01:05
连播
清屏
智能
倍速
点赞2082
00:00 / 00:57
连播
清屏
智能
倍速
点赞106
00:00 / 01:06
连播
清屏
智能
倍速
点赞654
00:00 / 06:20
连播
清屏
智能
倍速
点赞13
00:00 / 00:33
连播
清屏
智能
倍速
点赞493