Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
搜索
探索
直播
放映厅
短剧
小游戏
搜索
您是不是在找:
怎样给ai发布长沙的指令
ffmpegskill安装教程
大数据把你定位成哪类人
OpenSpec任务文档写法
claude接入imgea2教程
codex的pr是什么意思
exe异环什么定位
softik暂停的作用
workbuddy如何编写QT程序
cortis日输怎么样
大模型项目实战
6天前
上下文信息太长,如何有效地进行筛选与压缩且保证正确率最大化? #大模型 #ai大模型 #大模型学习 #大模型面试 #大模型应用
00:00 / 05:47
连播
清屏
智能
倍速
点赞
94
做游戏的小🐟
2周前
如何安装使用reasonix,并且高达99的缓存命中率是如何做到的?#deepseek #reasonix #agent
00:00 / 10:53
连播
清屏
智能
倍速
点赞
3341
小工蚁
4天前
使用动态压缩上下文和全局记忆 插件显著降低token消耗 #小工蚁 #上下文工程
00:00 / 00:41
连播
清屏
智能
倍速
点赞
19
AI鹅鹅鹅
1月前
AI Agent是怎么自动压缩上下文的? #AI #context #Agent #抖音10亿流量扶持计划 #技术分享
00:00 / 09:03
连播
清屏
智能
倍速
点赞
1608
AI大模型-楼兰
1周前
面试官:上下文信息太长,如何有效地进行筛选与压缩且保证正确率最大化?#ai大模型 #大模型面试 #知识分享 #agent
00:00 / 06:22
连播
清屏
智能
倍速
点赞
231
VA7
2月前
分享#openclaw 长任务、复杂任务配置经验:通过超长上下文窗口、主动压缩与记忆快照,还有状态外化的方式做管理。 #agent #claude #ai #gpt
00:00 / 06:52
连播
清屏
智能
倍速
点赞
4892
AigoSage
1天前
#Harness #驾驭工程 #aicoding #上下文压缩
00:00 / 03:43
连播
清屏
智能
倍速
点赞
13
程序员晓刘
3周前
Codex真的可以自动管理上下文了! #编程 #AI #Codex #大模型 #编程
00:00 / 03:40
连播
清屏
智能
倍速
点赞
686
生活的临时工
2周前
#编程 #deepseek #智能体 #agent #token 简直是把省钱刻在骨子里了!给大家推荐一个编程智能体deepseek reasonix 这个非常节省token绝了简直
00:00 / 02:56
连播
清屏
智能
倍速
点赞
293
AI大模型大鱼
2天前
挑战讲透大模型100问:为什么我们在做企业级RAG或者对话系统的时候,还要费死劲去研究“上下文压缩”?#大模型赛道 #大模型学习 #ai大模型 #RAG #程序员
00:00 / 05:36
连播
清屏
智能
倍速
点赞
28
FacialHair
3天前
S06 上下文压缩:Agent 越跑越慢,不一定是模型差 Agent 跑久了以后变慢、跑偏、忘记前面做过什么,很多时候不是模型不行,而是上下文被塞爆了。 这一集讲清楚 Claude Code 里很关键的一步:上下文压缩。 重点不是“删历史”,而是让 Agent 在上下文变短之后,还能记住: 目标是什么、做过什么、文件在哪、下一步该干什么。 本集你会看懂: 1. 为什么工具结果会撑爆上下文 2. 大输出为什么要先落盘 3. micro compact 怎么只保留关键结果 4. summary compact 怎么保住连续性 5. 压缩和 memory 到底有什么区别 一句话:压缩不是为了省 token,而是为了让 Agent 能持续干活。 下集讲权限系统:Agent 能做什么,不能做什么,边界到底怎么管。 #AI #AI新星计划 #Claude #上下文压缩 #AI编程
00:00 / 03:09
连播
清屏
智能
倍速
点赞
10
向日楑
3天前
DeepSeek-TUI和Reasonix实测,推荐后者 #Deepseek #Agent #Codex #Ai
00:00 / 00:39
连播
清屏
智能
倍速
点赞
57
安逸Ai
1周前
深度拆解 Claude Code 架构原理6- 上下文压缩 (第六期)上下文压缩压缩机制深度解析#Cluade #ClaudeCode #架构 #大模型 #原理讲解
00:00 / 04:32
连播
清屏
智能
倍速
点赞
48
AI打工人
3天前
大模型是怎么记住上下文的-记忆机制 记忆机制从原理到工程落地: 方案一,全量历史给到prompt 方案二,滑动窗口,只保留最近n轮对话 方案三,摘要压缩 实战,三区记忆 + KV Cache #agent #记忆机制 #上下文 #大模型
00:00 / 03:50
连播
清屏
智能
倍速
点赞
57
算法魔法师
6天前
从100万上下文到1024,DeepSeek V4这招太狠了 视频制作不易,如果这期视频对你有帮助的话呢,麻烦各位观众老爷点赞收藏一波,你们的支持是我做视频的最大动力!感谢!#青年创作者成长计划#AI新星计划#DeepSeekV4 #混合注意力机制 #大模型
00:00 / 18:57
连播
清屏
智能
倍速
点赞
501
阿sir
5天前
deepseek百分百缓存命中率 针对deepseek定制开发的reasonix,缓存命中率高得吓人,跑了一下午不到1块钱 #ai #deepseek #国产agent
00:00 / 01:31
连播
清屏
智能
倍速
点赞
66
C哥聊科技
1周前
节约上下文的设计技巧:让 Skill 更高效 为什么你的AI分析不了几十份报告?因为它根本装不下!每次读取信息,都在疯狂挤占它的工作台空间。空间一满,AI就开始丢信息、变弱智。今天分享一条我设计Skill的硬核原则,一招破解。#长上下文 #skill #ai
00:00 / 06:50
连播
清屏
智能
倍速
点赞
45
明天讲大模型
1周前
假如让你设计一个能连续工作的AI员工,怎么解决上下文不够用 #AI大模型#大模型应用开发#大模型面试#程序员#人工智能
00:00 / 04:00
连播
清屏
智能
倍速
点赞
108
扶安AI小课堂
1月前
大模型春招模拟面试: 模型上下文窗口很小的情况下 如何设计能长期稳定开发复杂项目的AI程序员Agent保证完整写完项目?#ai #大模型 #程序员 #上下文 #agent
00:00 / 01:40
连播
清屏
智能
倍速
点赞
133
蒙多大调查员
2天前
一个工具给AI消费打2折 省token工具RTK,上下文压缩,不影响对话质量,省掉80%token。 #token #Hermes #小龙虾 #ai #ai创作浪潮计划
00:00 / 00:20
连播
清屏
智能
倍速
点赞
9
AI小李
1周前
Github这次真没炸! deepseek-reasonix实测好用!#deepseekV4 #reasonix #deepseektui #claudecode
00:00 / 00:25
连播
清屏
智能
倍速
点赞
NaN
晓辉博士
7月前
DeepSeek-OCR是个怎样的创新? DeepSeek-OCR这两天引起很多关注和讨论,又是一个意料之外但情理之中的创新,用视觉方式实现上下文信息的压缩,论文称用这种方法,用一张A100的卡一天能生成20万页的训练数据,对于接下来的模型进步很有帮助。#OCR #DeepSeek-OCR #DeepSeek #Glyph #上下文压缩
00:00 / 05:48
连播
清屏
智能
倍速
点赞
5678
章鱼哥讲AI
4天前
Claude Code 的上下文管理 Anthropic 官方出了一套 Claude Code 入门教程,9集每集3分钟,从安装讲到底层原理。中文版译制。 本集井上下文。context window 是 Claude 的工作记忆,每个文件、每条命令、每次回复都占空间—满了就开始忘事。 三个命令:/compact 压缩当前对话保留要点、/clear 完全清空从头开始、/context 看当前占用。一个反直觉点—prompt 写得短反而费 context,因为 Claude 得自己去翻代码库、自己想,多写一两句明确反而省。 #Claude #ClaudeCode #上下文管理 #Anthropic #AI编程
00:00 / 03:20
连播
清屏
智能
倍速
点赞
69
新
3周前
删1个token,价格涨10倍?Prompt Caching 上下文压缩时,正文被剥离只留摘要,缓存命中率会下降吗?答案反直觉:没满时前缀不动继续命中,将满时Compaction重建新前缀用一次失效换后续多轮命中。Prompt Caching是接口级缓存,相同前缀逐字符复用,命中只收原价10%。中间删一个字符,分叉点后全部失效,单字符价格最多涨10倍。Claude Code源码拆解:没满时else分支不压缩缓存继续命中,满了才触发压缩重建稳定前缀。上下文工程系列第11期。 #claudecode #源码解读 #ai创作浪潮计划 #青年创作者计划
00:00 / 05:04
连播
清屏
智能
倍速
点赞
228
V 姐深夜局
1周前
[5] Claude Code 上下文管理,更高效工作 Context 是 Claude 的工作记忆,决定了它能理解多少项目背景、对话历史和任务细节。 在 Claude Code 中,管理好上下文非常关键。视频重点讲解了什么时候使用 /compact 压缩上下文,什么时候使用 /clear 清空上下文,以及如何避免无关信息占满窗口。 核心思路是:让 Claude 保持足够信息,但不要被过多历史内容干扰,才能让 AI 编程更稳定、更高效。#ClaudeCode #Claude #上下文管理 #AI编程 #Context #程序员工具 #AI工具 #开发效率 #代码助手 #科技前沿
00:00 / 03:51
连播
清屏
智能
倍速
点赞
22
老傅1024
2周前
为什么你的 Agent 跑长了就崩? 讲透 Subagent 隔离与 5 级上下文压缩 #AI #Agent #AI编程 #claude #Harness
00:00 / 07:22
连播
清屏
智能
倍速
点赞
98
沐晨AI笔记
2周前
很多人做 Agent,第一反应都是给更大的上下文窗口。但真正做过长时间运行的编码代理、研究代理或者多轮工作流,你很快就会发现:更大的窗口只能延缓问题,真正决定代理能不能持续工作的,是它如何压缩历史、保留工作状态、丢弃噪音,并把还能继续工作的上下文交给下一轮。这条内容会把压缩器为什么比上下文窗口更重要讲透。 #AIAgent #ContextEngineering #上下文压缩 #CodingAgent #AI工作流
00:00 / 02:59
连播
清屏
智能
倍速
点赞
12
二次螈Ai工具箱
4周前
开源神器终结claude失忆症 7万⭐ 这个叫claude-mem的插件像给大模型装了外置硬盘,把对话上下文压缩成可检索的知识图谱,彻底打破4k上下文的玻璃天花板。 #vibecoding #AI工具 #效率神器 #ai #人工智能
00:00 / 00:50
连播
清屏
智能
倍速
点赞
620
克劳得Everything
4天前
Claude Code 的上下文管理 Anthropic 官方出了一套 Claude Code 入门教程,9 集每集 3 分钟,从安装讲到底层原理。中文版译制。 本集讲上下文。context window 是 Claude 的工作记忆,每个文件、每条命令、每次回复都占空间——满了就开始忘事。 三个命令:/compact 压缩当前对话保留要点、/clear 完全清空从头开始、/context 看当前占用。一个反直觉点——prompt 写得短反而费 context,因为 Claude 得自己去翻代码库、自己想,多写一两句明确反而省。 #Claude #ClaudeCode #上下文管理 #ClaudeCode101 #克劳得Everything
00:00 / 03:31
连播
清屏
智能
倍速
点赞
98
教你宇宙级AI编程(求关注)
3周前
【无遮挡重置版】别让你的 claude code 频繁压缩上下文!一个技巧突破200K限制!释放 claude code 完整 1M 上下文
00:00 / 01:06
连播
清屏
智能
倍速
点赞
260
小工蚁
3周前
vllm实现TurboQuant缓存压缩 模型上下文扩大4倍 #小工蚁 #vllm #大模型推理优化
00:00 / 06:05
连播
清屏
智能
倍速
点赞
37
Felix 的上下文
1月前
Agent 开发中最重要的 6 件事 System Prompt,能力系统,跨 session 的记忆能力,上下文压缩,可观测性和 benchmark #ai #大模型 #agent #程序员
00:00 / 01:50
连播
清屏
智能
倍速
点赞
36
AI产品千媚
1周前
day3 Claudecode上下文管理技巧,常用命令行和小技巧#Claudecode#vibecoding#Agent#智能体#大模型
00:00 / 08:01
连播
清屏
智能
倍速
点赞
80
产品总监看AI
3天前
Agent 记忆不是聊天记录|TencentDB Agent 把 Agent 的上下文从聊天记录、向量库,拆成分层记忆、Mermaid 压缩和白盒追证。企业要的不是多记一点,而是记得清、查得到、能复用。 #产品总监看AI #AgentMemory #AI智能体 #TencentDB #企业AI
00:00 / 05:08
连播
清屏
智能
倍速
点赞
4
AI 数字人
1周前
《AI成本优化:把账单压下来》 系统拆解AI成本优化: 成本五层结构:模型调用 / 检索上下文 / 工具调用 / 失败重试 / 基础设施 Prompt优化:压缩系统提示 / 动态上下文 / 结构化输出(输出Token比输入贵3-10倍) 三级缓存:语义缓存 / Prompt缓存 / 结果缓存(收益最大的单一手段) 模型路由:简单问题走便宜模型,复杂问题再升级(Cascade模式) 优化优先级:先上缓存 → Prompt优化 → 模型路由 → 自托管 看完这期,你将掌握系统性压低AI成本的方法,把每一分钱花在真正需要的能力上。 #AI成本优化 #模型路由 #Prompt优化 #缓存策略
00:00 / 01:37
连播
清屏
智能
倍速
点赞
1
虎子AI
8月前
RAG上下文压缩大法 本期视频深入探讨了上下文压缩(Context Compression) 这一重要技术,旨在解决大模型上下文窗口有限的问题。 核心问题在于,传统的RAG检索可能会返回大量包含“噪音”(与用户问题语义无关的信息)的文本块。将这些噪音填入有限的上下文窗口,会稀释关键信息,从而损害大模型的性能。 上下文压缩的精髓是“少即是多”。其核心思路是在将检索到的文本块(chunks)送入大模型生成最终答案前,先进行一次“预处理”: 检索: 首先通过传统方式检索出与问题最相关的Top-K个文本块。 压缩/提炼: 然后让大模型逐一对这些文本块进行压缩,仅保留与用户问题语义高度相关的核心内容。视频中介绍了三种压缩模式: 信息过滤: 直接过滤掉无意义的文本。 生成摘要: 对原内容进行概括总结。 精准信息提取: 直接提取出最相关的关键信息。 生成: 最后,将所有压缩后的、去噪的精炼内容拼接起来,再交给大模型来生成高质量的回答。 这种方法让大模型分两步专注工作:第一步专注于“提炼信息”,第二步专注于“生成答案”,有效提升了最终答案的准确性和效率。 #RAG #上下文压缩 #大模型 #AI教程 #人工智能
00:00 / 02:58
连播
清屏
智能
倍速
点赞
13
丽姐的AI悄悄话👩💻
3周前
第111期丽姐的AI悄悄话-上集:Codex使用技巧第一弹,小白新手必看! [技巧1 - 自动压缩会话] [技巧2 - @键快速调用插件] [技巧3 - Markdown渲染+注释] [技巧4 - 海量插件即插即用] #codex #AI #agent #编程入门 #软件分享
00:00 / 02:07
连播
清屏
智能
倍速
点赞
60
GitHunter
2周前
Claude 90%更便宜的克劳德代码刚刚开源 有人构建了一个位于您的AI和shell之间的工具,并在每个命令输出到达上下文之前对其进行压缩。 装运: •自动重写git推、货测、ls、grep等。 每次运行都能节省大量代币 与克劳德代码、光标、双子座、法典和副驾驶一起工作 •100%开源 上下文限制和代币账单刚刚被摧毁。#claude #ai #新人如何做抖音 #github
00:00 / 00:22
连播
清屏
智能
倍速
点赞
883
大厂吾师兄(AI篇)
2周前
ClaudeCode官方最新干货: Prompt Cache 面向 **Agent / LLM 应用开发者** 与 **做长上下文产品** 的同学:一期聊透 **Prompt Caching**——它在你架构里不是「加速选项」,而是 **成本、延迟、稳定前缀** 的底层前提。 **你会听到:** - 前缀与 **精确匹配** 为什么一换 token 就全量重算,**顺序** 为什么比你想的还重要 - **Claude Code 式三层缓存**(全局 / 项目 / 会话)+ **Cache Control 断点** 怎么把「能复用」和「能升级」分开 - 常见坑:动态内容塞错位置、改 system、动工具顺序、模型切换、压缩时弄断前缀 - 收束到 **设计原则** 与 **生产监控**:命中率、延迟、存储、预热、A/B 与账单对齐 #Claude , #ClaudeCode , #Anthropic , #PromptCaching , #Agent
00:00 / 10:39
连播
清屏
智能
倍速
点赞
106
赛博吴同学
6天前
腾讯重磅开源TencentDB Agent Memory!独创符号化短期记忆+分层长期记忆,拒绝暴力堆上下文,把冗长日志压缩成Mermaid符号图,Token消耗直降61.38%,任务成功率飙升51.52%! 无缝适配OpenClaw、Hermes,零配置本地SQLite运行,长期对话记忆精准度从48%拉到76%,生产级可用,AI智能体从此拥有真正长效记忆! #赛博吴同学 #AI #科技 #TencentDB #AgentMemory
00:00 / 00:08
连播
清屏
智能
倍速
点赞
442
小工蚁
2月前
OpenCode上下文压缩插件 节省token消耗利器 #小工蚁 #opencode #和AI一起写代码
00:00 / 03:14
连播
清屏
智能
倍速
点赞
124
Ai Agent学习记录
3周前
LLM进阶落地:从参数到生产闭环 围绕 LLM 工程化进阶展开,核心是把“可用”做成“稳定可控”。 重点包括采样参数联动调优、上下文压缩、系统提示分层约束、RAG 分块与混合检索重排、Function Calling 设计、多 Agent 协同与状态持久化、人机审核机制,以及重试降级、监控告警和成本治理。 实践建议是先保证可复现,再优化效果与延迟,最后建立安全与运维闭环。 #LLM #AIAGENT #AI #RAG #优秀创作者扶持计划
00:00 / 03:27
连播
清屏
智能
倍速
点赞
53
炼丹师的工具箱
2天前
Token压缩代理,AI编程成本降低近九成的开源方案! 用AI辅助编程的时候,命令行输出动辄几千个Token,账单飞涨怎么办?技术社区里有一些值得关注的新方案。 这类方案的核心思路很巧妙——它在命令输出和AI上下文之间加了一层代理。当执行git状态查看或运行测试时,原始输出先经过过滤压缩,去除冗余信息后再进入AI的视野。 具体工作机制分为三步:首先通过钩子自动拦截命令执行,然后对输出内容进行智能过滤,最后只保留关键信息传给AI。整个过程对开发者完全透明,不需要改变任何使用习惯。 从实际测量数据来看,效果相当可观。基于数千次真实开发命令的统计,常见操作的Token消耗平均可以降低近九成。测试命令的压缩率最高,状态查询和文件搜索也有显著改善。 更值得关注的是兼容性。这类方案支持多种主流AI编程工具,包括命令行助手、代码编辑器和自动化代理等十余种场景,覆盖了开发者日常使用的绝大部分命令类型。 技术实现上也很简洁。整个工具打包成一个二进制文件,没有外部依赖,运行时开销控制在毫秒级别。 这类开源方案在降低AI编程成本方面有一定优势,值得关注一下。 #Claudecode #程序员 #生产力 #技术分享 #CLI
00:00 / 01:00
连播
清屏
智能
倍速
点赞
13
马斯洛AI智能体
3周前
deepseek-v4的1M上下文如何不污染?使用局限在哪里 当上下文膨胀到 100 万 token 时,标准注意力机制下每个 token 的注意力会被 100 万个 KV 条目"稀释",关键信号淹没在噪声中——这就是你说的"注意力稀释/上下文污染"的本质。 DeepSeek-V4 的解法不是去"修复"一个稀释后的注意力分布,而是从架构层面根本性地阻止了稀释的发生——它让每个 query token 只与精心挑选的几百个、而非 100 万个 KV 条目交互。 #deepseek #上下文工程 #上下文 #ai #大模型
00:00 / 10:30
连播
清屏
智能
倍速
点赞
116
雷哥AI
3周前
AI的记忆是精准忘记 #AI #人工智能 #大模型 #上下文窗口 #AI记忆 #代码编程 #Codex #CloudCode #OpenCode #AI工程化 #AI应用 #技术干货 #程序员 #编程工具 #上下文焦虑 #模型优化 #AI效率 #LLM #AIAgent #记忆压缩 #精准遗忘 #科技科普 #涨知识 #AI前沿 #算法 #代码 #开发 #技术分享 #AI工具 #AI实战
00:00 / 07:05
连播
清屏
智能
倍速
点赞
209
慢学AI
4月前
为AI的思考空间“降噪”—解构“压缩上下文”的核心策略 精读langchain《context engineering》⑤#上下文工程 #langchain #大模型开发 #人工智能知识分享
00:00 / 04:53
连播
清屏
智能
倍速
点赞
223
卢菁老师讲AI
7月前
AI Agent 卡壳?3 个顶级项目的上下文压缩策略 AI Agent 卡壳?3 个顶级项目的上下文压缩策略,藏着解决痛点的关键 AI Agent上下文压缩策略对比 #AIAgent #上下文管理 #压缩策略 #技术干货 #人工智能
00:00 / 01:20
连播
清屏
智能
倍速
点赞
43
赛博吴同学
1周前
rtk 是轻量CLI代理开源免费,目前快 48k Star🌟了,它能智能压缩LLM上下文噪音,降低 Token消耗60-90%,无依赖低延迟,大幅提升AI编码效率。 #赛博吴同学 #AI #科技 #前沿科技 #rtk
00:00 / 00:08
连播
清屏
智能
倍速
点赞
295
AI大龙虾
1月前
让hermes上下文压缩更丝滑…
00:00 / 03:15
连播
清屏
智能
倍速
点赞
70
我的AI已失控
1周前
Ai. CONTEXT上下文工程详细介绍。
00:00 / 10:22
连播
清屏
智能
倍速
点赞
4
璟礼
1周前
Agentic设计模式第9期:记忆管理 AI为什么“转头就忘”?因为缺少记忆管理。 短期记忆如何做上下文窗口管理(滑动窗口 / 摘要压缩) 长期记忆如何构建向量库并注入生成流程(分块 → 嵌入 → 索引 → 检索 → RAG) 记忆管理,是Agent的基础设施。 #Agent #AI #大模型 #AI教程 #AI学习
00:00 / 03:50
连播
清屏
智能
倍速
点赞
49
C哥聊科技
6月前
DeepSeek-OCR 掀翻 AI 底层逻辑 DeepSeek-OCR刚刚开源,它用“上下文光学压缩”技术,将长文本转为图像处理,效率提升十倍,直接破解长上下文瓶颈。#deepseek #deepseekocr #长文本 #AI #汉字
00:00 / 05:18
连播
清屏
智能
倍速
点赞
507
卢菁老师讲AI
3周前
【深度解读Deepseek-V4】核心技术亮点: 注意力压缩 /1M 上下文/ MoE 架构/ Agent 能力全覆盖!deepseekv4开源大模型天花板来了#Deepseekv4 #Deepseek #深度求索 #大模型训练 #大模型
00:00 / 01:00:47
连播
清屏
智能
倍速
点赞
4
程序员手艺人
2月前
别再吹openclaw啦,跟风前先想想用处 99%的人都不知道拿openclaw干嘛,花499装openclaw?不如先补补想法 现在agent的思路就是 工具+上下文优化压缩+工具调用+skill+一直在执行+定时任务
00:00 / 02:36
连播
清屏
智能
倍速
点赞
306
zidea
2周前
什么原因导致AI编码降智 利用 AI 代理进行软件开发的上下文工程(Context Engineering)策略。作者指出,盲目依赖 AI 会导致代码质量下降和技术债堆积,因此提出了“研究、计划、执行(RPI)”的系统化工作流。通过意图压缩和子代理分发,开发者可以将庞大的上下文简化为关键信息,从而确保 AI 始终在高效的“智能区”内运行。该方案强调不能外包思考,主张人类应通过审查计划来维持心理对齐,而非仅仅通过简单的提示词来生成代码。最终,这种方法旨在提升大型存量代码库的开发效率,帮助团队从传统的开发模式转型为以 AI 为主导的高性能协作模式。#假期宅家日记#人工智能#harness#上下文工程#Agent
00:00 / 03:20
连播
清屏
智能
倍速
点赞
13
aetheread
3周前
100万上下文如何省下90%显存? DeepSeek V4 的注意力压缩机制(CSA与HCA) #DeepSeekV4 #大模型 #人工智能 #KVCache #硬核科普
00:00 / 00:58
连播
清屏
智能
倍速
点赞
201
尹会生·AI求生指南
3周前
拒绝"断片":构建 OpenClaw 持久化记忆与上下文管理 龙虾原生记忆压缩时会丢失关键信息。 两种外挂方案:Memory 9本地部署,一句话安装,隐私加密永久免费; 腾讯云Agent Memory一键开启,四层记忆结构自动提炼偏好。没有记忆每次都是重启,有记忆每次都是续写。 #AI #大模型 #互联网 #程序员 #龙虾
00:00 / 09:50
连播
清屏
智能
倍速
点赞
5
程序员小江
3月前
claude code 效能提升插件: claude-hub,相当于给 claude 装上了仪表盘,随时了解上下文使用了多少,还有显示 AI 正在做什么,哪些工具处于活跃状态,在管理多个 claude 会话时非常有用,效率起飞!#ai #程序员#claude #效能提升#干货分享
00:00 / 01:02
连播
清屏
智能
倍速
点赞
176
和老曹一起玩AI
3周前
Github热门项目:AI 突然变笨?Context Mode 来了! Context Mode 是一款专为 AI 编程助手设计的开源 上下文窗口优化工具,旨在解决大模型在处理大量工具输出时产生的冗余问题。该项目通过 沙盒执行环境 将原始数据保留在上下文窗口之外,能实现最高 98% 的令牌减量。它支持包括 Claude Code、Cursor 和 VS Code Copilot 在内的 14 个主流平台,并提供 会话持续性 追踪功能,确保模型在窗口压缩后仍能记住任务进度。此外,该工具内置了基于 SQLite FTS5 的 知识库索引 与 输出压缩机制,极大提升了长对话中的推理效率。所有操作均在 本地环境 完成,在保障隐私安全的同时,让开发者能够更持久、更精准地与 AI 进行协作。#零基础学ai #创作者中心 #创作灵感 #github优质项目 #ai玩家
00:00 / 01:15
连播
清屏
智能
倍速
点赞
34
系统之外
3周前
30秒了解 DeepSeek-V4 用的关键技术 很多模型上下文一长就掉速、掉状态、工具一调就断线。DeepSeek-V4 这次真正猛的,不只是 1M 上下文,而是它在超长上下文里还能继续压缩历史、挑重点、只激活少量专家,还能跨工具调用把 reasoning 接着跑。30 秒带你看懂 V4 的关键技术。#DeepSeek-V4
00:00 / 00:30
连播
清屏
智能
倍速
点赞
71
建斌聊AI
4月前
上下文 ≠ 记忆 Agent 降 token 的第一刀:上下文裁剪,其实就是记忆管理 #agent #上下文 #记忆 #token #大模型
00:00 / 00:44
连播
清屏
智能
倍速
点赞
45
声译看世界
3周前
DeepSeek V4仅用2 内存的秘密 DeepSeek V4发布 性能卓越且长上下文处理高效 解析压缩注意力CSA和HCA核心思想 揭秘如何大幅降低内存占用
00:00 / 17:15
连播
清屏
智能
倍速
点赞
1
Vuk 武克
3周前
DeepSeek V4注意力架构教程 这期视频拆解 DeepSeek V4 的注意力架构,重点讲它如何在超长上下文下兼顾全局理解和局部精确细节。内容包括重度压缩注意力、压缩稀疏注意力、lightning indexer、混合注意力、共享 key/value 的压缩 token、attention sink,以及这些机制在不同层中的交替安排。 章节: 0:00 DeepSeek V4 注意力总览 0:06 重度压缩注意力 1:14 压缩稀疏注意力与 lightning indexer 2:49 混合注意力与共享 key/value 压缩 token 3:22 Attention sink 与分层安排
00:00 / 04:42
连播
清屏
智能
倍速
点赞
38
简介:
您在查找“
reasonix上下文压缩怎么搞
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-05-21 06:08
最新推荐:
蛋仔创造工坊运动器怎么使用
小迷糊最后结局怎么样了
永劫无间鸿鹄姿
询问明天有没有空文言文
哪里高速能直达香港
嘉欣猫女教程
渝八两鸡公煲做法
深海迷航调查蝌蚪坞怎么不被火焰影响
有哪些组织或机构支持紫丝带妈妈?
吃米不下蛋原唱是谁
相关推荐:
一直戴面具唱歌的人是谁
用拼豆怎么能拼出来来一只趴着的小鹅
深海迷航主动技能在哪扫描
浑诳是什么
和平精英周年双倍卡不领取会到邮箱吗
明教官引导孩子快乐成长
crybaby为什么有毛绒的有硬的
爱乐男团换人了吗
谁给我塞进来的姐姐的孩子
紫色曼陀罗花心理学
热门推荐:
m7和ptr32对比
reasonix安装卡住
统哥能作用抖音短剧标题吗
巾凡是obs吗
抖音精灵的食物怎么上传香烟的
蜻蜓显示器ktc三角洲设置
张雪说可以憧憬年度冠军了拼多多
chat gpt可以ai短剧吗
iQOO 15小插件怎么搞
道具被使用是什么意思