00:00 / 02:22
连播
清屏
智能
倍速
点赞93
00:00 / 03:51
连播
清屏
智能
倍速
点赞15
1️⃣ 查询构建(Query Construction) 问题一进来,AI得先决定去哪查、查什么。 •查表格数据?→生成SQL •查图谱关系?→生成Cypher •查语义相似?→构造查询向量 它不是靠死记硬背,而是要选对入口。 ⸻ 2️⃣ 问题翻译(Query Translation) 问题不一定直接拿去查,有时候需要拆一下、换个问法,甚至先假设一个答案再反推要找什么资料。 常用的方式像是: •多轮拆问(multi-query) •反问法(step-back) •HyDE:先生成假设答案,再检索验证 这一步的目标就是:提高检索准确率。 ⸻ 3️⃣ 路由选择(Routing) 查之前得搞清楚去哪查。 •逻辑路由:比如“我要销量数据”,那就走数据库 •语义路由:像“这问题听起来很像客服问答”,那就走Prompt模板2号 这个环节帮AI选通道,不然查错方向,生成就废了。 ⸻ 4️⃣ 检索(Retrieval) 这是RAG最核心的一步,查资料。 •拉出来的资料太多,就做筛选、排序(用RankGPT等方法) •找的不够准,就“主动重查”一次 •有时候还会做压缩提炼(CRAG),避免喂给模型太长的上下文 关键不是“找到”,而是“找到对的、提炼得好的”。 ⸻ 5️⃣ 索引(Indexing) 让AI能快速查到资料的前提,是资料本身就整理得好。 所以在数据进入系统前,会做: •语义切分(避免一段话被切残) •多版本表示(原文、摘要、关键词) •层级组织(像树一样,便于跳转定位) 这一部分如果没做好,检索阶段就会卡得很惨。 ⸻ 6️⃣ 生成(Generation) 最后才是你看到的那段回答。 它不是一开始就编的,而是: •结合你的提问 + 查到的内容 •再决定生成的结构、语气和信息密度 •如果AI自己判断答案不行,还会“回头再查一遍”,这叫 Self-RAG 这就是为什么现在很多AI助手答得越来越准——它不是变聪明了,而是“会查会审会改”。 #aigc #ai #RAG #架构
00:00 / 03:19
连播
清屏
智能
倍速
点赞17
00:00 / 09:51
连播
清屏
智能
倍速
点赞10
00:00 / 01:54
连播
清屏
智能
倍速
点赞143
00:00 / 03:59
连播
清屏
智能
倍速
点赞13
00:00 / 01:06
连播
清屏
智能
倍速
点赞7