粉丝9940获赞77.5万

一起来看看字节 agent 的 面筋,看看你能答上来几道。这套题整体难度偏难,但是前面是基础,后面才是真正区分水平的地方。 我是小哲,点赞收藏加关注,我们马上开始!第一道题, re rank 模型的原理和作用是什么? re rank 的 核心作用是在召回结果里做二次精牌。 embedding 先快速找出一批相似文档 re, rank, 再把 query 和每个后选文档一起输入模型,判断相关性分数。它更慢但更准,特别适合 r a g 里提升最终上下文质量。 第二道题, embedding 和 re, rank 模型在原理上有什么区别? embedding 是 双塔思路, query 和文档分别编码成像量,再算鱼弦相似度,适合大规模快速解锁。 re, rank 更像交叉编码,把 query 和文档放一起建模,能看细力度与异关系。所以工程上通常 embedding 负责召回, re, rank 负责金牌。 第三道题, transformer 里的 q k 是 怎么计算的? q k 都是从输入 token 的 隐藏向量限性变换来的。简单说,输入向量分别乘以不同的权重矩阵得到 query k value, q 表示我要找什么, k 表示我有什么特征,两者点击后得到注意力权重,再加权聚合微。 第四道题, h n s w 缩影的原理是什么? h n s w 本质是分层小世界图,底层节点多负责精确搜索,上层节点少负责快速跳转。查询时先从高层粗略定位,再逐层下沉到低层精细搜索。它牺牲一点召回精度,换来非常高的向量检测速度。 第五道题,完整描述一次大模型生成时,底层发生了什么?用户输入先被 tokenizer 切成向量,进入多层 transformer 模型,根据上下文算注意力和隐藏状态,最后输出下一个 token 的 概率分布。采用策略,选出 token 后拼回上下文循环生成,直到遇到停止条件。 第六道题, r a g 的 分块策略如何设计? r a g 分 块不是越小越好,也不是越大越好,核心是保持语义完整,比如按标题段落函数 faq 来切,再配合 overlap 保留上下文。工程上还要看解锁力度、 token 成本、 re rank 效果和答案引用准确性,最后用评测级调参数。 好,这套面筋我们就分享到这里。这套题表面看是在问向量剪索 transformer 和 r a g, 其实真正考的是系统设计能力和工程落地经验。希望在评论区看到你的答案。

拒绝金鱼脑这款 ai 记录神器让我拥有了过目不忘的超能力! ring a bell, i got a conditioned stimulus in a bowl anyone who can tell me what the conditioned stimulus is mostly do i mean yonosie nicholas care to elaborate the conditioned stimulus was the ringing of the bell, which made the dogs elevate even in the absence of food, nice dude! 姐妹们,兄弟们谁懂啊!每次开会聊天转头就忘,现在终于被我找到了终极解决方案!这款叫欧米的 ai 助手真的太绝了! 实时转录,开会、听课甚至路边聊天,它都能自动记笔记屏幕理解网页看过了, 视频刷过了,直接问他,他全记得!多端同步手机、 mac, 还有超酷的 ai 项链、眼镜硬件无缝连接,最重要的是它是完全开源的, 这意味着你的隐私数据掌握在自己手里!目前已经有三十多万专业人士在用了,快来试试你的 r n d brain!

欢迎观看本期论文解读。今天我们要深入了解一篇来自 cwi 和 google 等机构的研究论文,题目是 semantic recall for vector search 向量搜索的羽翼召回。 这篇论文提出了一个全新的评估指标,叫做羽翼召回,用来衡量近似最近邻搜索的质量。传统指标只关心能不能找到羽翼上等价的结果同样重要。 这个思路非常实用,可能会改变我们评估和调优向量检测系统的方式。在讲羽翼召回之前,我们先回顾一下现有的评估方法。近似最近临搜索,也就是 a n a s 是 向量检测的核心技术, 无论是搜索引擎还是推荐系统底层,都在用它来快速找到最相似的向量评估 a n n s 的 标准指标是固考了 k, 它的定义很简单,返回的 k 的 结果中有多少个是真正的最近邻? 这个指标有一个隐含假设,他认为只有精确距离最小的那 k 个向量才算正确答案。但问题是,在嵌入空间中,距离相近的向量往往是与一等价的。比如两个向量距离差了百万分之一,它们对应的文档可能完全一样。好 传统预靠把这种微小的差异当成错误,这真的合理吗?论的核心贡献就是提出了羽翼召回这个新指标,它的定义是,在返回的 k 个结果中,有多少个属于真正的羽翼近林集合。 关键在于怎么定义羽翼近林。论文提出了羽翼领域的概念,用等价关系来分组, 如果向量 u 和 b 之间的距离在 v 的 所有邻居中排名很靠前,那它们就属于同一个羽翼领域。 简单说就是,如果你跟我足够近,我也跟你足够近,我们就算一伙的。这个定义非常直觉,而且论文证明了一个重要性质,大部分查询的羽翼邻居数量远少于 k 值。 在他们的实验中,百分之六十的查询最多只有四个语义邻居。这意味着传统瑞克要求找到所有开个精确邻居,其实是在惩罚很多本来就不存在的目标 力申赚回虽然好,但计算成本很高,因为需要预先构建语义领域。为了让这个指标在实践中可用,论文又提出了容差召回作为语义召回的近似代理。 容差召回的思路很巧妙,它引入一个容忍域值 app, 那 有返回结果,与真实最近邻的距离差不超过这个域值。就算命中,你可以把它想象成考试时的容错分差一两分不影响最终的等级。 论文通过大量实验证明,容差召回与羽翼召回的相关性非常强,皮尔逊相关系数达到零点九五以上。这意味着我们不需要真的去计算羽翼领域,只需要调一个域值,就能很好地近似羽翼召回。 论文在四个极准数据集上做了全面验证,包括 m s m a r c l 太宇数据集。 这些数据集覆盖了文本检测、通用向量搜索和快语言场景,非常有代表性。实验结果揭示了一个有趣的发现,羽翼邻居的分布呈现明显的密律特征, 少数查询有很多羽翼邻居,但大多数查询只有很少的几个。这意味着传统无 colour k 在 大多数查询上其实过度苛刻了。 论文还做了一个关键实验,对比了不同 a n n s 算法在传统无扣和羽翼无靠下的排名变化。结果发现,用羽翼召回来评估时,一些更便宜的算法排名会显著上升,因为他们虽然找不到所有精确零距,但羽翼等价的结果基本都找到了。 最实用的部分来了。论文展示了用羽翼召回和容差召回来调优向量解锁系统可以带来显著的性能提升。 具体来说,在保持同等质量的前提下,所有的构建成本和查询延迟可以降低百分之五到百分之三十五。 百分之三十五啊!对于大规模系统来说,这是非常可观的节省,原理也不复杂。当你用传统追靠调优时,系统会花很多资源去追求那些精度差异微不足道的向量。 但用语义召回调优系统知道哪些差异是真正有意义的,就可以放心地用更粗力度的缩影参数。论文还发现,容差召回作为代理指标,调优效果与直接用语义召回几乎一样好,这进一步验证了它的实用价值。 总结一下,这篇论文的核心观点是,评估向量搜索的质量,不能只看精确匹配,还要考虑羽翼等价性。羽翼召回指标让我们第一次能够量化这个直觉,而容差召回则让这个指标在实践中真正可用。 对工程师来说,最大的启示是,如果你还在用传统 recall 来调 u 向量解锁系统,你可能浪费了不少资源。试试语义召回或容差召回,说不定能省下百分之三十的成本。我是林深,见 ai, 我 们下期再见!

哈喽,大家好,今天我想给大家分享怎么用 ai 去练自己的口语,就是我们会发现在很多做题网站上,他也会有针对口语的练习,但是他一般就是接入一个比较低级的 api, 然后帮你去实现一个 ai 的 打分,其实很多时候是不准的,大家应该都比较有感受。在准备雅思的时候, 然后今天我就分享一下我是怎么用 cloud 来练习口语的。首先你就明确的告诉他你要进行雅思口语的练习,然后他会随机的给你一个题目,然后因为 cloud 他 是没有呃语音通话的能力的,所以你在打出自己口语答案的时候,可以用到下方的这个麦克风的这个按钮,按住他会 呃实现一个短时间的一段录音结束之后,他就会把你录入的信息做成一个文本,然后 cloud 会根据你的这篇文本, 就像这样给出你几个比较具体的更改的建议。你也可以要求他按照你的水平或者你的目标分数给你一篇相对应的模板,这篇是可比较好的一个优点,他会根据呃你的要求做出一个合理化的延伸,就像我只要求他给我一个模板,我没有要求他另外的东西,但是他会在给我模板之后告诉我把这个读几遍, 然后用自己的话复述给我听,他会给你个延伸的任务。后面是我自己关于任务的一个编排,就是我不想每次都把题目呀还有范围呀什么的,就是自己去摘录,觉得比较麻烦,你就可以告诉 ko 的 新建一个任务,就比如说像我这样的,我的原始回答或者是我的表达问题,我的优化方案,这些 就是我没有告诉他你需要往里面去添加哪些东西,他会适应性的根据你的摸索出你的需要,然后帮你整理出这样一份文件。然后第二点就是你新开一个窗口的话,他会丢失之前的 我的建议,所以呃,我的建议是你可以把呃口语练习是单独做成一个新的窗口,然后每次练习完毕之后告诉他按照你之前的要求更新这个文件。好,我的分享就是这些,拜拜。

很多人一聊 rega, 上来就扯向量解锁,那遇到这种情况我通常会打断,因为连解锁策略都没讲清楚, rega 基本等于白做。如果面试官问你 rega 解锁策略怎么样来设计,别着急背技术名词, 先讲清楚目标。一句话总结就两个字,准和全准。招回的内容必须要相关,你不能答非所问, 权关键信息不能漏,尤其是需要多角度多证据的问题。但问题也出在这准和权天然矛盾,召回多了全是噪音,召回少了必然会漏信息。 所以真正落地的 red 一定是分层设计。我一般会分三层,招回层、融合层和金牌层。第一层,招回层,我们选择多路招回。记住一句话,不要迷信单一解锁。最基础的一路肯定是向量解锁, 语义理解强,用户和文档用词不一样也能招回,但是他有硬伤,专业名词、型号、品牌等精准度不够,所以一定要加上关键字的剪锁。在此基础上,我们可以再加上第三路、第四路,比如结构化过滤、原数据过滤,甚至图解锁。 这个我们得看具体场景,核心逻辑只有一个,把不同视角的后选文档捞上来。第二层,融合层,多路招回的分数怎么对齐?多路招回一来,问题就出现了,分数不可比, 怎么排序?最简单也最常用的方法是加权融合,比如向量权重零点七,关键词零点三算一个综合分,重新排序。但说实话,权重他没有标准答案,不同业务不同问题,最优权重一定不一样。 所以更成熟的做法是用学习排序,让排序模型自动去调。第三层,金牌层 决定了 reag 上线的关键一步,前面多路召回可能拿回了几百篇文档,你全部丢给他模型,那会导致又贵又慢还不准。 所以必须用一个金牌模型深度理解问题和文档的相关性,只保留最相关的前五或者前十篇。这一步的精准度比召回阶段更高。出一个 level 收满主框架,再送你几个加分的优化点。第一, 动态召回数量。不是所有问题都值得捞, top 前五十简单的事实问题 top 十就够了,多套推理或者复杂问题才需要更多, 所以要先做意图识别和复杂度的判断。第二, quarry 改写和拓展用过的问题往往不专业不完整。解锁前要不要做改写? 解锁前先做改写就能够直接拉高召回质量。第四,先压缩空间再做精解锁。文档数量大的时候,先按照类目章节、业务域去做出差, 再在小空间里边做精准解锁,效率和效果会好很多。最后,给你一句面试总结的话, reig 的 核心不是魔心多牛, 而是用分层解锁,把准和权这两个互斥的目标做到极致平衡。你要是能这么讲,面试官基本上在心里就默默的给你加分了。 我这里也整理了一份某大厂内部 ai 产品经理必修的文档,里边儿包含了 ai 产品研发的全流程大模型,未来方向和学习路线图,想要少走弯路的同学可以拿去学习。

哈喽,大家好,我是木最近呢小智虾哥,他开源了这么一个叫做 vivo stick 的 这么一个项目,他呢基于 m o stock 的 这个 stick s 三呢作为语音输入,通过 bl e 的 方式接入自己的这个电脑, 同时呢他使用了豆包的这个语音识别大模型,可以把语音输入呢实时的转成文本输入到我们的这个聊天窗口,这个呢其实和我之前买的这个大模型的这个语音输入的键盘或者鼠标呢很类似。然后在我手上的这个呢就是 m o stock 的 这个 stick s 三了,我提前呢已经烧录好这个了,我们现在只需要单机中间的这个蓝色按钮呢就可以进行语音输入,现在我们来试一下 今天的天气怎么样,大家看到了吗?我语音输入的时候呢,它同时可以进行一个翻译,显示到这个屏幕上面,这个呢是后面新增的这么一个功能,那么大家觉得它的这个呃怎么样呢?同时我们 输入的这个聊天的这个窗口呢,可以设置到这个屏幕上的左上角,右下角或者说其他的地方,这个呢可以作为一个翻译的这么一个装置,如果说对方就是双方都使用了这个装置呢,那我们可以和外国人呢进行一个交流,就是说我们各哪一个对方一个,我们手上一个,那么就可以以自己的这个语言呢进行一个实时交流了。那么大家说这个怎么样呢? 大家看,然后在这里是它的这个设置的这么一个窗口,我们可以看到现在呢是不支持这个中文的,大家可以看到我现在这个设备呢,就是我当前的拿的这个小设备了,它可以设置它的一些主题啊等等的同时我们这里可以设置一个大模型啊,这个是检查更新,这个检查更新,然后我们来看一下它的一些设置项。 设置好在设置这里呢,我们需要填写自己的豆包大模型,要下面这里填写自己的一个大模型的一个 呃,相当于接口地址模型这些我们填好这个以后呢就可以使用翻译,如果说你不需要使用翻译功能,那么你只需要填写这个豆包的这个流式语音识别的这么一个密钥就可以了。那么大家觉得这个项目怎么样呢?如果说感兴趣呢,你可以去 这个它的官网呢去了解一下这个项目,我们这里可以看到这个是它的这个网址,然后在这呢是它的这个 gitap 的 一个地址,大家如果感兴趣的可以去试一下。


今天我发现一款非常好用的知识图谱的插件,它有点像 obc 点,但是是 obc 点的扩展版,能把你的所有的文件以及你的一些记忆全都串联起来,包括一些文件的关联以及位置找得更加清楚。 是我在本地加载的,就是我基本上基于他的做了个很轻微的改造,就是他的基本上也都是文本类的知识框架来去做了个类似 wiki 的 一样处理,用户阅读起来的话会很方便,而且很清凉化。 然后呢? graph 呢?就是比如我加在我们项目的那个文档啊,他可以分类,比如说,呃,只看某个部分, 然后每个部分他单独选的话也也非常方便,就很清晰,就是用起来比较方便,所以我是比较推荐这样的用法的。

precision 和 rico 分别是什么方面的问题?蓝海大脑作为高性能服务器研究领域的专家认为精确度 precision 查准率 t p t p 加 f p 等于 t p p 预测为珍重实际为正样本的概率。 召回率 reco 查询率 p p t p 加 f n 正样本中被识别为真的概率。

家人们,我太激动了,最近这个 ai 真的 超级智能,我最近不是拿到了这部结果吗?这部结果有一大堆的这些呃蛋白,然后我需要从中筛选到哪些与脑泡运输有关的一些基因,然后我也不可能一个个去找着,去 uni pad 上去找它的功能,我就直接把它全部复制,然后 复制之后把它粘贴为纯文本交给 ai, 然后输入这一段说,告诉他这是我质谱结果的蛋白,分析哪些基因与脑泡运输有关,然后让他就真的给我提供了很多这些呃有关的基因,然后呃那些都是正确的,就是真实存在与脑泡运输有关的,太智能了,大家可以去试一试。