00:00 / 00:30
连播
清屏
智能
倍速
点赞5
一蛙AI2天前
如何通过上下文工程来管理和优化上下文,以应对长任务、多轮交互和大量工具调用导致的成本上升、延迟变大与context rot 三个核心原则:卸载、减少、隔离上下文。 1. 卸载上下文 卸载指把信息从模型的上下文窗口转移到外部存储,以便在需要时再取回。 •持久化信息:代理可把计划等信息写入文件,执行多步操作后再读回文件,从而保持一致性并避免遗忘。 •跨会话记忆:文件系统(如cloud.md、agent.md)可以保存跨代理调用会话的持久状态,用作长期记忆。 •卸载动作:与其在系统提示中加载大量工具,不如给代理少数原子化工具(如Bash、文件操作工具)。代理可通过这些工具调用文件系统里的脚本,从而扩展能力范围,同时不污染系统提示。 •渐进式披露:以Anthropic的技能skills为例,系统只加载技能的头部描述。代理决定调用某技能时,才会读取技能目录中的详细skill.md并使用基本工具执行对应脚本,以减少初始上下文负担。 2. 减少上下文 减少上下文指在每次交互中降低传入上下文的体积。 •压缩:如Manus代理会把已执行、较旧的工具结果完整内容转存为文件,并在消息历史中只保留文件引用。这是可逆的,需要时可重新读取原文。 •总结:当上下文窗口接近满载(如95%)时,系统会把整个消息历史总结成更精炼内容,以节省空间。这类压缩是不可逆的,会有信息损失。 •过滤:一些系统(如Deep Agents包)使用中间件过滤特别大的工具输出,防止其直接塞进模型上下文中。 3. 隔离上下文 隔离指使用独立的上下文窗口或子代理来处理可独立完成的任务,以避免上下文爆炸。 •子代理模式:父代理生成子代理,让后者在全新、干净的上下文中执行工作,再把最终结果返回给父代理。这样父代理不必承受整个任务细节带来的负担。 •共享上下文资源:某些设计下,子代理虽使用独立上下文,但仍可共享父代理的资源,如文件系统,以在隔离的同时保留必要的信息访问能力。 视频中用到的文档:notion.so/Context-Engineering-for-Agents-2a1808527b17803ba221c2ced7eef508 视频英文原稿在油管LangChain频道 #大模型 #人工智能 #aiagent #langchain #claudecode
00:00 / 16:26
连播
清屏
智能
倍速
点赞353
00:00 / 02:18
连播
清屏
智能
倍速
点赞56
00:00 / 21:26
连播
清屏
智能
倍速
点赞NaN
00:00 / 01:06
连播
清屏
智能
倍速
点赞238
00:00 / 00:51
连播
清屏
智能
倍速
点赞82
00:00 / 01:27
连播
清屏
智能
倍速
点赞10
00:00 / 00:26
连播
清屏
智能
倍速
点赞3
00:00 / 05:18
连播
清屏
智能
倍速
点赞3
00:00 / 03:00
连播
清屏
智能
倍速
点赞2
00:00 / 00:30
连播
清屏
智能
倍速
点赞2
00:00 / 00:29
连播
清屏
智能
倍速
点赞4
00:00 / 02:59
连播
清屏
智能
倍速
点赞2