那我们既然要学习 java 的 agent 开发,那我先来给大家介绍一下 java 技术站下有哪些 agent 框架。那随着深层式 ai 技术的逐步成熟啊, ai agent 已经越过了技术炒作周期的峰值,进入了大规模的探索和产业落地的阶段。那越来越多的企业呢,开始将 ai agent 应用于你像智能客服啊,自 动画运营啊,辅助决策啊等等这些核心的业务场景。那在 java 技术这样下呢,有这几个框架可以用于快速构建 agent 的 应用,包括 spring a 阿里巴巴,同样是阿里系的 agent scope 干 java 以及 spring 之父领衔开发的 embel agent。 那 么我们在本系列课程当中呢,主要会给大家去讲解 spring a 阿里巴巴,为什么呢?那当然有人可能在之前用过 spring a 阿里巴巴,他会觉得 spring a 阿里巴巴它不就比 spring a i 多了一点东西吗? 然后可以直接接入千问平台吗?那我告诉你,它其实在二五年啊,做了一个很大的更新,它现在是一个叫做 angelic ai for more, 它是一个智能体的 ai 框架,可以轻松地去构建单智能体,多智能体,还有 workflow 流程编排,它底层基于这种 d a g graph 的 方式 来进行变异。所以其实这二程序员你要学 ai 的 话,就跟着阿里走就行了,毕竟阿里它百分之八九十的现代化 内容都是用 java 来去做的。那目前他对 ai 的 支持,不管是大模型还是整个 ai 应用的开发生态体系,都支持的非常的完善啊,你可以看到他提供了很多构建 agent 的 框架,还有成熟的产品。那我们呢,主要就会使用这个 spring 阿里巴巴 agent framework 来去开发 agent 的 应用,那么它可以构建 agent 还有 workflow 以及多 agent 的 应用,所以能力非常的全面。那另外呢,就是阿里系的另外一个 agent 的 框架, agent scope 干 java。 那 agent scope 呢?它本身是一个 python 框架,然后阿里发现这个框架呢,非常的受欢迎,所以又构建了一个 java 下的解决方案。 那么官方呢,也明确表示, edgen scope 啊,它比较侧重于 legendary 为核心设计理念的应用架构。所以如果你打算构建侧重 legendary 为核心设计理念的 ai 应用呢?啊,推荐使用 edgen scope 干架网。如果打算构建 各种 walk flow 流派的 agent 的 应用,推荐使用 supreme ai 阿里巴巴。当然啊,呃,虽然它们各自有优势,其实我们也不需要面临两难的选择,因为在未来呢,官方也明确表示, supreme ai 阿里巴巴生态呢,将会全面支持 agent scope, 它会集成 editscop java, 以后呢,我们只需要通过一个 starter 就 能去集成 editscop 了。所以这也是为什么我去选择 spring ar 阿里巴巴的原因,一旦它集成 editscop, 可以 说是双键合并啊。那最后呢,就是 in bamboo editor, 它是由 spring 之父领衔开发的,它主要呢是基于 celtic 语言来构建的,所以可能上手成本呢比较大,我试了一下,还必须要通过 idea 二零零五才能更好地去运行。呃,所以目前似乎市场呢,还没有特别的流行,那后续如果有必要呢,徐树老师会单独的再去讲解一套 bingo agent 的 框架,所以我们首选 supreme ai 阿里巴巴。毕竟呢,不管从现在已有的这个生态,还是对未来的这个发展,它会集成 agent scope, 我 们都是比较看好的。那接下来呢,我们就来进入 supreme ai 阿里巴巴 agent workflow 框架的学习。
粉丝3.9万获赞18.7万

如果你在二六年三月五号开始学 ai agent, 需要多久才能学会?这是我总结的 agent 的 学习路线,只要不是三分钟热度,一个月的时间就能从新手进阶成 agent。 工程师 建议先收藏,避免以后走弯路。第一周,打基础,先理解 agent 的 核心理论,搞懂其关键组建,深入了解大语言模型在其中的作用,吃透规划模块、记忆模块、工具集等基础概念。第二周,专攻 agent 工作原理和难点解决方案, 拓展学习 react、 c o t 等经典 agent 的 方式。第三周,生化学习,了解多智能体写作机制,再学习 prompt 调优技巧,让你的 agent 输出更稳定、更精准。 第四周,练实战,结合前三周的知识,亲手完成两到三个企业级项目实操,跟着走下来,你就能真正把 agent 技术接入实际业务。我已经把配套的学习路线和视频教程都已打包好,需要的朋友留下学习直接抱走。

我们先来看一下 supreme 阿里巴巴 agen 的 宏观它的整体结构啊。那首先你必须要知道的是, supreme 阿里巴巴它的底座呢,依然用的是 supreme ai, 由 supreme ai 呢去构建了对接大模型的抽象标准,你像它提供了叉的 model, 也就是大语言模型的标准,纹身图模型的抽象标准,纹身视频的 图像标准,还有你像酷我对话记忆 m c p red 下的向量化向量数据库存储,就是这些功能呢。 spring ai 阿里巴巴它并没有重复地造轮子,而是将 spring ai 作为它的底座来进行基础的支持。那基于 spring ai 之上呢?提供了一个运行时的 graph 框架,不知道大家有没有了解过 python 下的 roman graph? spring ai 阿里巴巴也是基于 lan graph 构建了一个可以实现复杂编排的症的应用,它同样的具备了你像 graph 下的节点啊,状态啊,面啊,但这些概念呢,可能初学者使用难度会比较大,所以 spring ai 阿里巴巴 非常贴心的基于 graph 的 上面构建了 agent framework, 它隐藏了 graph 的 复杂实线,可以让我们开发人员呢更加简单地去构建 agent 的 应用。所以 agent framework 它包含了 spring a 阿里巴巴 graph 框架,也包含了 spring ai 框架。那有同学可能会问啊,他说我不懂 spring ai, 或者说我不学 supreme ai, 直接学 supreme ai 阿里巴巴行不行呢?其实从理论上来说是可以的,因为毕竟 supreme ai 阿里巴巴它是基于 supreme ai 之上 分装了一套新的 a p i 出来,所以我们其实可以面向这一套新的 a p i 来进行学习,没有太大的影响。但是啊,其实我还是建议大家能够 先从 spring ai 开始学起,毕竟它的底层依然是基于 spring ai 来进行封装进行扩展的。我给你举个例子啊,就比如说我们能不能说我学完 spring mvc 就 可以不用学 servata 呢?因为毕竟它们俩 也是基于封装来进行扩展。虽然我基于这种 mvc 框架确实好像不太会用到 servata 的 一些 api, 但是它的一些核心基础思想,包括一些特殊的场景,其实还是会用到。 哪怕你直接用 supreme ai, 阿里巴巴,其实它的一些核心的 a p i, 包括 two, 我 们刚说的 m c p 叉的 model 等等,它其实都是基于 supreme ai 来的一些特殊的场景,比如说你需要基于底层来进扩展,或者你只需要实现简单的大模型的对话,其实 supreme ai 依然还是会用到的。 所以一个正常的健康的学习路线应该是先从 spring ai 开始,然后再学 spring ai 阿里巴巴。当然,你说我现在时间比较紧,我之前没有接触过 spring ai, 我 就想直接从 action 的 开发开始学,行不行呢?不是不行 好吧,只不过到时候你涉及到的 spring ai 的 一些基础核心知识,你还是得去了解,你可以用到再去学。好吧,那这三个框架呢,也是可以单独的去使用的。那为了让大家更好地去理解它们各自的优劣势,我通过一个简单的 ai 应用,从 spring ai 再到 ai 的 framework, 再到 graph, 带领你通过一个视力速通这三个框架。 nice。

假如你从二六年春节后开始学习 ai agent, 需要多久才能学会?接下来告诉你一条最快的学习路线,让你少走弯路。如果你年龄在四十五岁以下,那么恭喜你,只要不是三分钟热度,一个月的时间就能从新手进阶成 agent 工程师。 第一周,打牢基础,吃透 agent 核心理论,搞懂核心组建,把大模型基础规划模块、记忆模块和工具调用,这些核心概念彻底理解。第二周,吃透 agent 工作原理和难点解决方案,深入学习 react、 c o t 等经典 agent 架构范式。 第三周,进阶,学习多智能体协助的逻辑,精通 prompt 工程与调油技巧,让你的 agent 输出更精准。第四周,进行实战,用前三周知识动手落地真实大模型项目, 跟着走下来,你就能真正把 ai 技术接入实际业务,升职掌心不在话下。如果你还不知道从何开始,我这里整理了学习路线以及配套视频教程,留下学习双手奉上。

现在去面试 ai 应用开发,如果你只会最基本的发模型对接,智能对话是不够的,面试官会问你有没有做过 agent? 随着 agent 的 发展,越来越多的企业会将 ai agent 去接入他们的核心业务,比如自动化工作流来提升效率,或者数据的实时分析,经过推理之后进行告警等等。那现在市面上这么多 ai 应用产品 和 agent 的 开发框架,比如 minus, open close, defy, spring ai, 阿里巴巴, agent from work, lan graph, lanchan。 那 哪些技术可以写在你的简历当中呢?有必要给大家说一下。首先很多人其实连 agent 是 什么都不知道,在早期,如果你能对接大模型,完成最基本的智能对话就可以称为。 但是随着 agent 的 发展,他现在呢,已经有了一个明确的标准, agent 呢,他会根据用户的任务进行感知,然后进行规划和拆分,再调用具体的雇佣工具执行行动。然后将反馈的信息再交给大模型,看任务是否完成, 如果没有完成呢,再进行反思,循环往复这个过程,直至任务最终完成。举个例子,比如我有一个帮我去百度搜索徐树,并且总结一百个字的任务。那么首先呢,大模型它会经过感知推理,看它已有的信息是否能够完成这个任务, 如果无法完成,它会进行规划拆分。拆分成几步,比如说第一步,打开浏览器,第二步,输入三 w 点百度,第三步,搜索徐树。第四步,总结一百个字。然后每一步呢,去调用具体的 to 来执行行动,然后将执行的结果 反馈给大模型,再经过感知和反思,看任务是否完成,没有完成,执行下一步,循环往复的执行这个流程,直至最终任务完成。那我们虽然知道了 agent 它的边界,但是市面上这么多产品和技术,我们应该如何划分呢?其实所有的 ai agent 的 技术都可以从两个维度来进行划分,那第一个维度呢, 是站在产品经理的角度,从产品业务的维度来进行区分。第二个维度呢,是站在架构师的角度,从 底层技术的维度来进行区分。那首先按照产品的维度,可以分为通用型和垂直型,那通用型它通常是用来处理那些巴萨的边界模糊的任意任务,所以它是全能型的,你像 manus, open close 他 们都可以处理任意的任务。那么像这种通用型的产品,我们作为开发人员啊,可能就很难 包装到简历当中了。当然你也可以手录一个写在简历当中,比如在我们的课程当中呢,就会带着大家去开发一个简版的 minus。 那 么从产品角度的第二个维度就是垂直型的,它通常呢会聚焦某一个单一的业务流程,比如说专门用于代码辅助的 costar, 专门用于复杂机票组合优化的 deep trip, 专门用于解决企业内部自动化流程的 a 卷的流程。那其实你会发现啊, 垂直型的产品,它可以说占据了百分之八九十的企业真实落地和盈利的场景,也是 ai 应用需求开发最大的一个方向。所以大家可以重点 从这个角度去包装一个垂直型的 agent 的 项目到你的简历当中。比如你是金融行业,可以开发一个替代客户经理的公信贷风险审批 agent 的, 比如说你是制造行业,可以开发一个替代设备工程师的设备,预测 故障原因的诊断 agent, 比如说你可以开发一个替代 hr, 招聘专员,自动化人才智能匹配的 agent 等等。那么再来说一下,站在架构师的角度,根据技术底层,我们可以分为 walk flow 流派和 agent 流派。那么 walk flow 呢,通常是由程序员去制定一个严格的执行流程,比如说我们做一个自动编码的 agent, 我 们可以制定。第 第一步,做需求分析,如果需求无法实现,直接跳出流程。如果需求可以实现呢,去做架构设计,然后根据架构设计做具体的代码实施。所以它的每一步流程都是确定性的,都是可控的。所以在需要可控的业务 环境下, walk flow 它是唯一解,因为业务呢,它绝对不允许大模型因为幻觉,偏离既定的业务流程。那再来说一下 agent 流派,那这种方式呢,不会预设固定的步骤,而是提供一个总目标和一组工具库,让大模型呢自主决策去调用 哪一个工具,然后呢,评估执行结果,遇到问题呢,自我反思,然后再重复执行这个过程,直至任务的完成。那这种方式呢,你会发现它极度的灵活,是由于整个执行过程呢,是属于一个黑盒的状态,比较不可控,所以 可能会陷入一些死循环或者 warp 过度消耗的问题。所以我们极少会直接通过 agent 接入核心的生产库啊,因为它不可控,所以你会发现 agent 由于它的灵活性呢,更适合做这种通用型的 agent 的 应用。因为通用型的 agent, 它是全能的任务, 我们不可能为每一种任务去定制一个 sop 流程,这是不现实的。那 workflow 呢?由于它的确定性啊,就更适合做企业内部的垂直型的 agent 的 应用,我们需要它按照既定的流程来进行执行。不管是 agent 还是 workflow, 现在主流的框架 long graph for ai, 阿里巴巴都可以去实现,所以用它们也可以完成混合的 agent 加 workflow 架构,既能保证确定性,又能引入 ai 的 灵活性。那在 java 进入站当中呢,我主要会给大家去讲解 spring 阿里巴巴 agent 的 framework。 那么当业务和底层架构清晰之后,技术团队通常就会面临技术选型的问题。那要开发 agent 又有哪些方式呢?首先第一种方式,我们可以基于你像扣子, definefast, gpt 这种 agent 清代码 sas 平台,通过这种方式,我们可以使用这种拖拉拽的方式来去配置节点和插件,下载支库,调用 mcp 等等。这种清代码平台呢,他们通常更适合作为 自己的个人助手,提升你自己的工作效率,或者你需要快速上线一些非核心业务的 ai 辅助能力,这种方式呢,就会比较高效。所以作为开发人员呢,这几种 agent 新代码 sata 平台建议大家也掌握一下。但是呢,这种方式它难以应对已有系统的业务深度 提成。比如说你的 agent 需要跨微服务来完成分布式事务,比如你的 agent 需要去接入已有系统的用户权限,比如你还需要更精细的并发控制或者接入已有架构的服务组建,比如说 necks, reddit, mq 等等。那么这种 agent 情代码平台呢?将无能为力。那这个时候呢,我们就需要手动地 去开发 agent 的 应用,才能更好地和我们已有的业务系统进行集成。那目前我们通过 supreme a 阿里巴巴呢,就可以去开发 agent 的 应用,它可以通过这种 graph 流的方式来进行编辑,可以轻松地去开发 on agent 的 多 agent 和 workflow 流程编排。并且阿里现在已经全面地支持 agent 的 生态,你可以看到它提供了很多 agent 的 裁员框架 和开源的产品供我们进行使用。那如果你是 java 开发啊, spring 阿里巴巴 agent 的 workflow, spring 阿里巴巴 graph, 我 建议可以加入到你的记录站当中,再结合公司特定的 垂直业务,包装对应的项目到你的简历当中。接下来我会给大家去讲解 spring 阿里巴巴,并且手撸一个简版 manage 项目,以及集成不同行业的 agent 的 流程,带你学习阿里巴巴 agent 的 workflow 下的 io, 多 a 整的 workflow 工作流, a to a 人工介入,完整的进行讲解。所以你不用怀疑啊,现在 java 技术栈完全有能力去开发各种流派的 ai 智能体应用。

假如你从二六年春节后开始学习 ai agent, 需要多久才能学会?接下来告诉你一条最快的学习路线,让你少走弯路。如果你年龄在四十五岁以下,那么恭喜你,只要不是三分钟热度,一个月的时间就能从新手进阶成 agent 工程师。 第一周,打牢基础,吃透 agent 核心理论,搞懂核心组建,把大模型基础规划模块、记忆模块和工具调用,这些核心概念彻底理解。第二周,吃透 agent 工作原理和难点解决方案,深入学习 react、 c o t 等经典 agent 架构范式。 第三周,进阶,学习多智能体协助的逻辑,精通 prompt 工程与调油技巧,让你的 agent 输出更精准。第四周,进行实战,用前三周知识动手落地真实大模型项目, 跟着走下来,你就能真正把 ai 技术接入实际业务,升职掌心不在话下。如果你还不知道从何开始,我这里整理了学习路线以及配套视频教程,留下学习双手奉上。

程序员转做 agent 开发工程师学习顺序千万别弄反了!转做 agent 开发工程师必须知道的三大技能技能一,大模型底层知识,掌握 python、 神经网络、 transformer 等相关核心知识,这不仅是后续所有学习的基石,还决定了你未来职业发展的天花板。技能二, 专业框架的开发重点深耕 luncheon、 long graph 两大主流框架,同时熟练走完知识库搭建全流程,从文本拆分、 embedding 模型选型,到向量数据库存储部署,再到 r a g 链路的优化,每一步都要形成闭环实操能力。技能三,工程化落地能力需掌握项目服务部署、本地模型、二次微调技巧等, 真正把技术落地。以上三大技能就是求职路上的敲门砖,只要全部吃透,无论是为本职工作提质赋能还是转行,都是绝佳的选择。为了帮大家少走弯路,高效入门,我为大家整理了一份超齐全的大模型学习资源,有学习路线、各知识点的教程、实战项目、行业落地案例等,留下学习双手奉上。

家人们,我被 ai 智能体吓到了,事情是这样,我推荐了一款普通人也能做硬件开发的 ai 工具,居然有了二十五万播放量。然后有用户评论说,二九八 n 这种电机模块都没有,失望, 学过两年半硬件开发的人都知道 l 二九八 n 是 一款电机驱动芯片,我寻思这么常用的芯片,这软件居然不支持,一看库管里虽然有很多种电机驱动支持,但还真没有 l 二九八 n 主包正好感冒了,于是找朋友帮忙, 你能不能做个 l 二九八 n 的 酷啊,有用户要用,最近忙了,没时间搞酷,你不是吹全流程 ai 吗?怎么 ai 不 起来了?对啊,我怎么都忘了有 ai 了。于是我告诉 ai, 帮我做个 l 二九八 n 的 酷 ai, 居然啥也不问,就独自开始干起来了。可以看到 ai 多次思考问题,然后上网查资料,然后巴拉巴拉的干活,我能做的只有围观。过了一会儿,居然告诉我已经写好库了,让我安装。还没完, ai 自告奋勇要帮我写个视力程序, 那你就写吧,写出来我正好试试。又等了一会儿, ai 写好视力了,翻译、销路测试居然可以正常使用,以前这工作可要让我做大半天啊! a i 按这发展速度,以后岂不是没我什么事了?家人们,主包十多年的开发经验怎么办啊?有没有擦皮鞋的工作,点赞收藏,以后我来给各位擦皮鞋!

面试官问,你们是怎么准备向量数据并最终入库的?嘿,同学们,如果你回答说把文档切开直接上传,那面试基本就凉了。大模型专家级的数据工程可没你想的那么简单。 咱们对着这张大模型 red 向量数据工程架构图,我带你们拆解一下,一个年薪百万的大模型专家到底是怎么玩转数据入库的。本视频的代码笔记,我整理进了一百万字的 ai 大 模型学习笔记里了,里面包含了穿梭门架构蓝衬、 red 模型训练与微调 a 阵的智能体开发等二十多个技术站与一百多个 ai 大 模型企业落地项目实战笔记。 大家好,我是彭宇,咱们先看第一步,其实做 rag 有 句名言叫 garbage in, garbage out, 垃圾进去出来的肯定也是垃圾。你想想看, 你拿到的原始文档是什么样的?有扫描件 pdf, 有 带各种奇怪格式的 html, 还有堆满表格的 word, 这时候你直接切片,那里面全是乱码和广告噪音。所以我们第一步要用 un structured 或者是布局分析算法去做格式标准化。这时候我问大家一个问题, 为什么一定要提取原数据?其实啊,原数据就是给文档打标,比如这篇文档的发布时间,作者甚至是他在公司内部的保密级别。有了这些,后面我们做检测的时候,才能实现只搜二零二四年以后的文档,或者只搜技术部的文档,这叫原数据过滤。没有这一步, 你的检测就是盲目的大海捞针。好,数据弄干净了,接下来就是最考验内功的切片了,大家思考一下,如果我按固定五百个字幕,一段 咔嚓一剪刀切下去,会发生什么?最怕的就是语义断裂,一句话讲到一半被切断了, ai 怎么可能搜的准?所以咱们在工程里要用地规切分,还得设置百分之十到二十的划窗重叠,给上下文留一点缓冲带。但更高级的是图中写的这个 small to big 子负块架构。 这是什么意思呢?简单说,我们入库的时候存小块,因为小块的向量特征更明显,搜的准。但我们检测出来后,要把这个小块背后的大块送给大模型, 这样既保证了搜索的精度,又保证了生成的上下文足够丰富,这才叫专业。接下来要把文本变成坐标,也就是向量化。这时候有人会问, 我,就用最贵的 inviting 模型不就行了吗?其实不然,如果你做的是医疗、法律这种专业领域,通用模型往往表现一般。这时候你得考虑对 b g e m 三或者 m 三 e 这种模型做微调,让他听得懂你们行业的黑话。数据变向量了,存哪?别只知道那几个向量数据库的名字。 你要思考的是缩影算法。如果你有千万级的数据,是用 f l a t 暴力搜索吗?那服务器得烧着了。我们要用 h n s w, 也就是基于图的缩影,他在速度和精度之间找了个完美的平衡。在入库的时候,咱们还要做批处理优化,别一条一条发请求,那样入库效率太低。大工程必须要考虑吞吐量,最后数据存进去了,这就完了吗?还没完。入库后,我们得做一套闭环验证, 因为向量剪索有时会产生幻觉,比如你想搜如何开户,他可能给你召回了如何销户,因为语义太像了,那怎么破局?看图里的最后一步,混合剪索,我们不仅要搜向量,还要搜关键词,再配合一个 rerun 重排序模型。 这就好比向量剪辑是海选,选出前五十名,重排序模型是精选,从这五十名里选出最靠谱的前五名。甚至我们还可以用 h、 y、 d、 e 技术,让 ai 先模拟一个答案,拿着答案去搜,召回率直接翻倍。 所以你看,从清洗到腐子块切片,到微调 embedding, 再到混合剪索,这一整套流程下来,才叫真正的向量数据工程。做 reg 没那么容易,因为数据决定了模型表现的下限,而工程能力决定了它能达到的上限。 好了,说了这么多,咱们来给今天这个问题做一个专家级的总结。大家看架构图的最下方,其实所有的技术动作都可以浓缩为三个核心关键词。第一是精细化与处理,记住,数据质量永远是 rek 系统的天花板, 你对原始文档处理的越细腻,模型表现就越稳。第二是上下文保持,我们要利用刚才讲的父子快和重叠机制, 死死守住知识的语义完整性,不让 ai 断章取义。第三是工程化闭环,不能入库了就不管了,必须通过混合检测和重排序不断调优找回精度,才算完成了一个工业级的数据工程。说白了,掌握了这套从清洗到解锁优化的完整链路, 你就等于掌握了生产级 reg 应用的底层密码。以后面试官再问你,你就按这个架构逻辑从头到尾给他讲一遍,保证他听完直接想给你发 offer。 好 了,这就是今天向量数据工程的全链路方案,那么下次再见了。

面试官抛出问题,你们怎么处理向量数据,然后存进数据库的?你脑子里闪过念头,就是把内容分割转成向量存起来呗。如果你是这样回答,这个职位就跟你没关系了。为什么?因为面试官已经听出来了,你没有实战经验。大家好,我是大宇, 今天咱们拆解一下,一个年薪百万的大魔性专家,到底是怎么玩转这套系统的。首先问你个问题,你拿到的文档是什么样的?我跟你说,真实的数据源有多混乱?老旧扫描件、十多年前的 pdf、 o c r 乱码满天飞,页码、水印、页脚全混在内容里,网页爬虫数据、 html 代码、 java script、 cs、 央视第三方追踪脚本一团乱码。办公文档、 word 里面表格套表格合并单元格、隐藏文本 排版。逻辑糟透了,你要是直接拿这些废料去切割会怎样?进来的全是垃圾,出来的肯定也是垃圾,这就是业界的铁律。所以第一步必须清理, 用工具库,比如 unstructure 或者布局识别算法,把格式统一,乱码去掉噪音清掉,整理成规范的结构。但这还不够,最关键的一步,大多数人都漏掉了。打标签。什么叫打标签?就是提取原数据、发布日期、来源、部门、保密等级、业务分类。 有了这些标签,后续搜索就能实现精准过滤用户。问最新的技术方案,系统只返回二零二四年最新的来自技术部的文档。没有标签, 你的搜索就是瞎蒙,在大海底捞针,全靠运气。现在数据洗干净了。接下来第二步就是分割这个环节,这里有个坑,很多工程师都踩过, 最常见的做法是什么?简单,暴力,设定固定的制服数,比如五百字一段,知道会发生什么吗?一个完整的逻辑,一句话, 一个知识点,可能被深深切成两半。我们的优化策略分为三部分,第一是性能优化,第二是 ai 拿着这个残缺的片段去做匹配,怎么可能准确,就像医生只看了患者的半条腿,根本没办法诊断正确做法。智能定位切割系统会聪明的识别 这里是不是句子的分界线,这里是不是段落的转折,这里是不是逻辑的断点,然后才切,加上划窗重叠。 前后两个片段故意有百分之十至百分之二十的重合。比如片段 a 第一到第十句,片段 b 第八到第十七句,故意重合第八和九句。这样形成一个缓冲地带,确保边界信息不会因为被切到接缝处就丢失。但最高级的玩法 叫小块大块架构,这是区分业余和专业的分水岭。理解,小块解锁块,大小控制在两百至三百字,一个单一完整的知识点, 特征鲜明。这个镜像量库,大块生成块,大小控制在一千五至两千字,包含完整的背景,详细的案例,深层的解释。解锁出小块后,把对应的大块送给模型,为什么这样?因为小块的向量特征非常突出,搜索时能精准定位,但生成答案时,模型需要丰富的上下文。 这个架构就是用小块做精准定位,用大块做充分生成,既保证了搜索精度,又保证了答案质量。 大多数公司的 r a g 系统效果平平,原因就在这,要么只优化了搜索结果,信息不足。要么只优化了深层结果,搜索不准。只有真正的高手才能两者都兼顾。第三步,非常重要的一步,文本要变成向量,需要 ingabili 模型。 这时候有人会想,我直接用最强最贵的模型肯定没问题啊!错,这是大坑!我给大家讲个真实发生过的案例,某医疗公司做 ingabili 模型处理医学文献,结果怎样?效果特别差。 用户问,什么是冠心病?系统返回的是什么?是普通感冒的内容?为什么会这样?因为通用模型是用互联网通用数据训练的。 他根本不理解医学领域的专业黑化。在通用模型的向量空间里,心梗、心肌梗死、冠状动脉狭窄这些在医学里完全不同的概念, 都被挤到了心脏相关的同一个区域。模型无法区分。法律领域也一样,合同违约和协议变更在普通人眼里区别不大,但在法律专业里,是两个完全不同的法律问题。通用模型分不清,怎么解决?微调,你不能依赖通用模型, 必须用我们行业的专业数据对模型进行调整。拿医疗的几千份专业文献,对 bgm 三或 m 三 e 这样的基础模型进行微调。训练完成后,模型就变聪明了。他学会了区分冠心病、心肌梗死、心力衰竭 这些词在医学里的真实含义和细微差别。效果提升有多明显?精准度能提升百分之五十至百分之八十,这不是小数字, 这直接决定了整个系统的天花板。记住,通用模型加垂直微调才是王道。第四步,向量有了,要存进数据库。很多人会说,我用 panico, 我 用 milos, 我 用 vivite, 这都是表面真正的核心在锁影算法的选择。 假设你有一千万条向量数据,你能用最朴素的 f l a t 锁影吗?什么是 f l a t? 就是 暴力搜索。每次用户查询,系统要把查询向量和所有一千万条向量都计算一遍,距离 计算量是什么量级?一千万条数据,每次查询都是一千万次浮点预算,你的服务器会直接被烧穿,用户要等好几秒才能看到结果,这完全不行。所以我们用 h n s w 分 成导航小世界, 这是目前最实用的解决方案。 h n s w 怎么工作的?想象一下,不是直接在数据大海里乱翻,而是先构建一个多层级的图结构,这个图像导航地图一样,让你快速定位到最相关的数据区域。搜索时,你不是全表扫描,而是沿着图的边逐层跳跃,逐步逼进最相关的向量。 性能提升有多明显?时间复杂度从 n 级别降到了 log n 级别,也就是说,一千万条数据, f l a t 需要几秒钟, h n s w 只需要几十毫秒,这是质的差别。还有个被百分之九十九的人忽视的细节。批量入库优化,很多初级工程师怎么做的?一条一条的发送请求 入库,第一条限量等待入库,第两条等待入库,第三条等待,这是最低效的方式,数据库完全没办法发挥兵发能力。 怎么做?把数据分批一次性发一千条项链的请求,让数据库能够并行处理,效果有多明显?入库速度能快五到十倍,一百万条数据从几小时降到几十分钟,这就是生产级系统和玩具级系统的根本区别。有人会想好了,数据入库、完成,任务结束,错的离谱, 真正的问题才刚开始。向量解锁最可怕的漏洞是什么?它会产生幻觉。什么叫产生幻觉?用户问怎么开户,系统却把怎么销户的内容解锁出来了。为什么会这样?因为这两句话在向量空间里太像 模型,根本分不出区别。意思完全相反的两件事,被系统当成了同一件事。用户来开户,你给人讲怎么销户?这是什么服务啊?所以需要一个超级关键的机制,混合解锁。什么是混合解锁?不止靠项链,而是同时用项链搜索和关键词搜索。比如用户问怎么开户, 向量搜的角色找所有与意相近的内容,关键词搜的角色找所有包含开户这个关键词的内容。两个搜索结果一结合,开户和销户就再也别想混淆了。但这还不够,我们还要加一个 re rank 重排序模型,这是最后一道防线。 想象这个流程,初选阶段向量搜索加关键词搜索,先塞出前五十个后选。复选阶段重排序模型接手,对这五十个后选重新打分, 用一个更聪明的模型来判断真正的最相关决选阶段,只返回 top 五,最靠谱的结果给大模型。这就像选秀节目的流程,初赛是海选,塞出所有有潜力的,复赛是精选, 从这些人里挑出真正的明星选手。有些顶级公司还会用 h、 y、 d、 e 技术,让 ai 先模拟一个可能的答案,拿这个假答案去做向上搜索,为什么这样有效?因为答案和答案的相似度往往比问题和答案的相似度更高,召回率能直接翻倍。所以 整个向量数据工程的核心就三点,第一,源头要精细。第二,上下文要完整。第三,搜索要精准。 好了,假设明天有面试,面试官问这个问题,你怎么回答才能赢?我给你一个三层级回答框架。第一层,质量意识,我们非常重视源头数据质量,首先用布局分析清理格式,然后提取原数据打标签,为后续精准过滤做准备。 第二层,架构优化,采用低规切分加划窗重叠,确保语音连贯。核心是小块,大块架构,小块镜像量库,保证搜索精准度。 大块送大模型,保证深层质量。引编码模型也是垂直为调的。第三层,工程闭环,用 h n s w 锁影配合 p 处理,保证 性能。入库后用混合解锁重排序和 h y、 d e 技术做多重校验,避免语义错误,持续通过数据驱动迭代优化。你这么回答,面试官听完会怎么想?这哥们真的做过生产级项目?保证他听完直接想给你发 offer, 那 一刻 你就赢了。好了,今天的分享就讲到这儿,点个赞,关注一波,我会持续更新大模型的深度技术内容。

假如你从三月三号开始学习 ai agent, 需要多久才能学会?接下来告诉你一条最快的学习路线,让你少走弯路。如果你年龄在四十五岁以下,那么恭喜你,只要不是三分钟热度,一个月的时间就能从新手进阶成 ai 领域的工程师。首先按照这个流程制定一个学习计划,每日打卡。 第一阶段,打基础,先掌握 agent 的 核心理论,搞懂核心组建,吃透大语言模型、规划模块、记忆模块和工具这些基础概念。 第二阶段,知透 agent 的 工作原理和难点解决方案,拓展学习 react 卡等经典 agent 的 范式。第三阶段,强化学习,了解多智能体协助的逻辑,掌握 prompt 的 调优技巧,让你的 agent 更精准的输出你想要的结果。 第四阶段,进行实战,结合前面所学知识,自己动手完成几个大模型项目,跟着走下来,你就能真正把技术接入实际业务,升职掌心不再话下。如果你还不知道从何开始,我这里整理了大模型及 agent 的 学习路线配套视频教程,留下学习 agent 的 份上。

我是大厂研发工程师张飞,欢迎来到张飞 ai 开发实验室这一节我们继续上一次遗留的一些问题,网友们说的一些问题。首先第一个问题就是说 这个扣炮,扣炮怎么使用这个飞书?第二个问题就是怎么这个用这个 i m studio。 第三个问题,有些粉丝说要开发这种并行的多智能体去使用,比如说 像我这样子,我可能有一个需求,有一个产品经理 agent, 还有一个市场营销推广 agent, 两个 agent 都要连接我的飞书,并且我在飞书里加上我们三个去组成一个群组去讨论问题,像这种两个 agent 同时运行在我们泡电脑上,这个该怎么去做? 主要是讲这三方面。好,那我们先讲一下飞书,飞书需要在这个飞书这个开放平台去 创建一个企业的企业资金运用,我创建的是两个,一个是市场营销推广一个 agent, 第二个是产品经理一个 agent, 两个都已经起用,那市场营销推广我们看一下子,那这里就是在创建这个 库炮的时候,库炮里边有让添加这个 app id, 还有一个密钥,把它复制过去就可以去创建了。另外创建的时候添加这个应用能力,需要添加机器能力,把它加进去在这里会显现。另外还要开一些权限管理,我们基本上开通的都是云文档 一些权限,还有事件回调这块,事件回调这块需要添加一个长连接,视角事件配置这块加一个长连接,接受事件 回调这块也可以加长连接,这样的基本上再去创建机器人就可以了。好,最关键的是这两个 app id 和 app secret 都要放到这个 call 里头,我们看一下 call 怎么去设置, call 就是 channel, 在 这里备注,这里会让你添加 这么一个 app id, 还有 app cache 在 使能保存就可以了。好,保存之后呢,我这里打开飞书就可以看到这两个 a 阵,我都给他发了我的一个飞书文档,让他去阅读,但是这里还有一些问题啊,他好像是没法去阅读这个文档, 包括这里也是我可以另外使用了他的一个浏览器的一个方式,他也没有去做,这是一个小问题,但是这里可以给大家说,可以去通过 agent 就 可以和他去交流。我演示一下子,在这里我应该是已经开启了,对, 我看看是否 model 是 否配置了。 ok, model scope 切换一下子保存好,我们再切换到飞书,在飞书这里头我给它设好营销, 你说你好看,他能回复吗?好,回复了一个。这个好,我们就做一个简单的一个演示。另外呢,我们再看一下这个 ims 六六,如果双击 ims 六六,上一次我想去 自己写代码去做,但是有一些粉丝朋友说,其实在这里面可以去创建。我们继续看一下这个 i m s 六六如何去做。 i m s 六六,一个,我们在这个爱的 provider 里边去添加一个这么一个 id 和这么一个名字。 i m s 六六,在这里就要设置一下基本的 base ul, 这边是可能你本地的一个 ip 地址加上一个端口号,再一个斜杠为一,这个 api k 可以 不用去设置,在这里是 models, 需要添加一个你在本地需要加载的一个模型设置上就可以,另外在这里需要做一些激活,在这里比如说可以是 i m s 六六,再选择它就可以去保存了,在这里我就不演示了。 好,最后我们看一下子,这个就是多智能体的一个开发需求,目前多智能体开发这块我还在去研究和尝试啊,看看能不能开发出来两个智能体并行运行在一台电脑上,目前我在和智普模型在去交流,现在有一个方案说可以做这个 智能体,但是智能体可以做两个智能体,但两个智能体它虽然说是有不同的工作区,比如说 space, 但是它同一时间只能有一个智能体去活着不可,而且它要只能支持快速的一个切换和激活第二个智能体, 但这样子就没法满足我的一个需求,说像 opencloud 那 样子,两个智能体可以和我组成一个群组,三个人一起去讨论,所以说我还在和他去交流,看有没有更好的一些并行的一些运行智能体的一些方案。好,就是这样子,谢谢大家。

程序员转做 agent 开发工程师,学习顺序千万别弄反了!转做 agent 开发工程师必须知道的三大技能技能一,大模型底层知识,掌握 python、 神经网络、 transformer 等相关核心知识,这不仅是后续所有学习的基石,还决定了你未来职业发展的天花板。 技能二,专业框架的开发重点深耕 land chain、 land graph 两大主流框架,同时熟练走完知识库搭建全流程。从文本拆分任编码、模型选型,到向量数据库存储部署,再到 r a g 链路的优化,每一步都要形成闭环实操能力。 技能三,工程化落地能力需掌握项目服务部署、本地模型、二次微调技巧等,真正把技术落地。以上三大技能就是求职路上的敲门砖。为了帮大家少走弯路,高校入门,我为大家整理了一份超齐全的大模型学习资源,有学习路线、各知识点的教程、实战项目、行业落地案例等,留下学习直接暴走!