00:00 / 02:41
连播
清屏
智能
倍速
点赞282
00:00 / 00:29
连播
清屏
智能
倍速
点赞5
📍 STEP 01|收齐公司文档 把退货政策、物流表、产品手册、客服 QA 全找出来。 ⚠️ 这一步最痛——文档散落在飞书、企微、个人电脑各处,要花 1-2 周整理 300-500 份。 老板催你?答:"文档质量决定 RAG 上限。" 📍 STEP 02|文档切成小段(Chunking) 黄金参数 ✍️ 背下来: · 每段 300-500 字 · 相邻段重叠 50 字(防止上下文断裂) 跟工程师说:"LangChain 默认切分器,chunk_size=500,overlap=50。" 📍 STEP 03|文字变向量 + 存数据库 文字变数字,让电脑按"意思"匹配。 🤖 Embedding 模型怎么选: · 首选 bge-large-zh(智源开源 / 90% 国内企业在用) · 别用 OpenAI embedding(中文差 15-20%) 🗄️ 向量库:有团队选 Milvus,没团队选 Pinecone。 📍 STEP 04|用户提问 → 捞 5 段(Retrieval) Top K 怎么定: · K=3 太少,漏信息 · K=10 太多,烧 token · K=5 ✅ 行业经验值 进阶玩法 🚀:两阶段召回——先粗捞 20 段,再用 Rerank 精排成 5 段,效果高 30%。 Rerank 推荐 bge-reranker-large。 📍 STEP 05|拼 Prompt 喂大模型 治幻觉核心咒语 👇 "基于参考资料作答。资料里没有的,直接说转人工,不要编造。" 🤖 大模型选: · 国内 DeepSeek / 通义 / Kimi · 海外 Claude / GPT-4 · 别用 7B 以下小模型(幻觉爆炸) 📍 STEP 06|上线前必测 2 指标 ⭐ 这是 AI PM 和工程师的分水岭。 📊 指标 1:召回准确率 捞的 5 段真包含答案吗?≥80% 可上线 📊 指标 2:生成忠实度 答案真来自那 5 段吗?≥90% 可上线 ⚠️ 必须分开测——混着测出问题不知道是检索坏了还是生成坏了。 下条视频讲:3 种场景千万别上 RAG,硬上就是浪费成本 👀 关注 NOVA,每天讲透一个 AI PM 知识点 ✨ 评论区聊聊👇 你做 RAG 时卡在哪一步? #AI产品经理#RAG
00:00 / 05:44
连播
清屏
智能
倍速
点赞81