reesix, dixic, 原生的终端 ai 编程代理。 ai 编程很强大,但常会话下 toc 成本居高,不下一次重度使用一天就要花掉六十多美元。 reixix 的 答案是百分之九十九点八二的缓存命中率。这不是实验室数据,而是真实用户的实测结果,成本直降百分之八十。这一切源于四大缓存支柱, 第一,不可变前缀系统提示词和工具定义在绘画开始时冻结。第二,只追加日制,每轮对话只追加不重排不圆的编辑。第三,一失草稿,思维链在缓存前缀之外执行,永不污染下一轮命中。 第四,自动压缩上下文,接近上限时就轮次折叠为摘要追加到前缀,前缀本身不重写缓存命中得以延续真实用户一天的数据。四点三五亿 token 缓存命中,同样的工作量,如果不用缓存费用将是五倍甚至更多。 在 v 四 pro 模型下, riscx 能为你节省百分之九十一的 api 成本。相比 cloud code、 cursor 和 ader, riscx 是 唯一围绕 deep seek 前缀缓存专门工程化的工具,其他工具只能偶发命中,而 riscx 在 每一层都为此调优, 加上 mit 开源协议,成本优势无可匹敌。 riscx 提供十二项核心能力,包括 selif、 渲染器、 m、 cpe 等,支持计划模式、全线控制嵌入式仪表盘、持久化绘画、羽翼搜索、自动检查点和事件。日制 riscx, mit 开源社区共建,打开终端,输入 npx resix code, 即刻体验专为 deepseek 打造的缓存优势。
粉丝36获赞1145

今天这条视频讲 rexix 最新版本升级,从 b 零点四十七点二到 v 零点四十八点零,一次功能性升级带来了四大改进。 先看整体变化,这次升级聚焦四个方向,第一,集成 tricer 语法,高量打包了六种编程语言的解析器。第二,新增 no mouse 和 no proxy 两个命令行标志。 第三,代理配置逻辑重构更灵活。第四, qq 远程通道体验优化包体积从二十五兆增加到三十三兆,全部来自语法解析器的数据文件。首先看重头系 tree sitter 语法高量, v 零点四十八点零引入了 webtree sitter, 运行时并内嵌了六种语言的 tree sitter 解析器,分别是 go、 java、 javascript、 python、 rust 和 type script。 这意味着代码块的高量从正则匹配升级到了 a s t 级别的结构化,解析准确性大幅提升。构建流程也新增了一部 copy tree sitter grammars, 把语法文件自动复制到输出目录。 第二项改进,新增两个命令行标志, no mouse 标志,用于禁用终端里的鼠标交互,适合纯键盘用户和直连环境。 这两个标志覆盖了 code 指令、 chat 指令、 run 指令核主入口使用一致。第三项,代理配置增强, v 零点四十八点零新增了 low proxy config 函数,支持 disable 和 no proxy 两个配置项。 当用户传入 no proxy 标志或配置里设置 disabled 为触时,代理安装直接跳过。这个改动,让代理逻辑从大局一刀切,变成了可精细控制的模块。第四项, qq 远程通道体验优化, ci 端地连接流程简化,启动绘画后执行 qq connect 即可。桌面端入口统一放到 settings 的 文档下的 qq channel 文档也做了同步精简,去掉了用余的步骤说明,一键直达。 总结一下,这次升级不包含 breaking change, 所有现有配置和 api 向后兼容。 升级方式很简单, m p m install g resynix at latest 或者在 resynix 里直接执行 resynix update。 如果你关心代码高亮准确性或需要 no proxy 标志,推荐立即升级。

好消息, gitlab 这次终于没炸了!大家都知道 cloud code 能力很强,但只能用自家模型,于是有人做了 deep sync 专属 agent。 国外作者的 deep sync t u i gitlab 已经两万星,火得一塌糊涂,而国产作者做的 reasonix 才一千星,几乎没人知道。但是实测下来,同样的任务, reasonix 的 token 消耗只有 reasonix 的 十分之一,十块钱的活才一块多搞定,表现不输,甚至更强。一千星碾压两万星,差的不是实力,是曝光! reasonix 该被看见了。

刚才我查了一下账单,发现自己用 deepsea 写代码花了将近二十三块钱,三千多次调用将近四亿 token, 同等量级扔到 gpt 上,一个月少说几百十几倍的差价,而且用起来说实话没感觉有什么区别。这就是我今天想聊的东西, resonix, 一个专门适配 deepsea 的 本地编程助手。先说清楚,这玩意儿不需要外网,装起来也很简单。 github 搜 resonix 小 白直接下桌面客户端,双击打开即可, 首次启动会让你填 a p i 密钥,据 deepsafe 官网注册一下,领个密钥粘进去一两分钟的事。界面就是个聊天窗口,有两个模式需要注意, review 和 auto 模式会申请工作区外的文件访问权限,而我日常电脑没什么重要的文件,所以一般直接开 ulog 模式,省事方便。 来实际带你们体验一下。比方说我想知道 ai 热点,用这个 ai 热点的 skill, 直接跟他说帮我搜今天 ai 圈有什么新闻,整理成精简文案,他自己就去抓信息了,不用写任何代码。 等了大概几分钟,结果直接出来了,可以看到这都是最新的资讯,时刻紧跟热点。我做自媒体内容的时候,给他搭了一套完整流程,从八视频素材提文案到改写预判数据表现,一条指令走通, 花费一两个小时搭建,就能节约以后我找素材的时间。而且如果你完全不懂代码,也能用它搭个人网站。 我试过用了开源的模板,借助 deep c 转化为我想要的样子,可以给大家稍微看一下成品纯前端,自己图一,乐呵乐呵的。当然运行中间报错了也别慌,它会自己看错误信息 自己修,修完继续跑。对新手来说,这体验确实可以。原作者我在评论区 a d 出来了,感兴趣的可以关注。下期的话,看评论区问的最多的问题,我挑一个话题继续深入。

哈喽,大家好,我是这个 riskx 的 作者,呃,我们可以简称 nex, 然后 这个是我们的项目啊,大家应该也都有一些了解啊,然后我们之前不是有一个 t u i 的 项目嘛,它比较火,其实我们是同一个时期的作品啊,它可能宣传的比较好,然后被国人都 知道,就是有一个国外有一个叫 t u i 的 项目,其实国产我们也有啊,只是大家可能了解的不多,加上我这个名字可能也确实难念啊,然后大家其实可以知道 nix 就 好了,然后我们这个,呃产品呢?嗯, 定位呢,就是缓存优先,就是以成本而为主啊,降低它成本,因为代代用 deepstack 的 主要目的还是为了就是降低成本嘛,然后它便宜嘛,对吧?然后我可以大家先看一下我们这个产品啊, 这个是成我们输入指令之后呢,就可以看到我们这是我们的产品的一个呃,这个用法, 这个首页状态啊,这就是我们所有的,我们这里有很多功能,比如说可以换主题啊,啊,可以换语言啊,一般默认应该是会选你本机的这个语言啊,默认应该都是中文的,然后有的,如果有的你的,呃,他给你学了英文,你可以直接手动在这里切换,也是可以的啊,切成中英文啊, 这样切上去语言就会接吻中文。好,那我这边呢是给大家演示一下我们这个啊,比如说我们现在有已经开了我以前的一个老项目啊,然后我可以让他,比如说分分析项目号,太久了,我,比如说可以,呃,帮我 呃制定一个计划啊,比如说什么计划呢?呃,帮我制定一个计划,看一下项目的结构, 哪些需要改进的啊?这个时候他可能就会去看,先看项目结构,然后看完节目之后他会给我们一个,呃,就是 你看他这就会有一个思考,思考完之后会回复我们,我们只要耐心等。呃,应该还是蛮快的,因为我这边做了很多的优化和处理啊,你可以大家可以跟别的就是硬件去比较啊,包括 t u i 也好啊,什么其他也好 啊?我我自己用下来,我,因为我自己也在用嘛,所以我自己用下来的体感还是,呃蛮不错的,大家也可以自己试一下。 然后我们的这个呃 get up 项目已经接近一 k 了。呃也是非常感谢大家的支持啊。然后现在,呃现在支持,呃知道人确实很少。 呃。我们也在不断去改进啊,我们这边也是很多都是我自己提的,就是自己的改进,然后我会优先修 bug 和一些核心的架构的一些这些改动,像这些增强或者 rfc 的 提案 我都会稍微往后放一点啊,因为这个都是不着急嘛,还是保证稳定性为主啊。然后我们的 pr 基本上都是合并了的,然后都做完了的,然后我们只在这里去不断的去改进,也有很多国外的朋友还有国内的朋友都帮我 就是提了很多的这个 pr, 然后也非常感谢这些作者,就是这些书的作者也是非常感谢他们, 然后我们可以继续看一下这里啊,然后他现在是确认了做了一个计划啊,他做了四步,先是探索,然后再去探索。这个检查啊,我们采纳让他去做,我们有没有补充,你也可以在这里写一些自己的补充,没有补充的话就直接回车就好了。 那他就会按这个计划一项一项执行,每执行一项呢,你看他就会打勾啊,然后直到四个全部做完之后,他就会进行一个汇总,我们让他接着继续跑,然后我们接着继续 介绍我们的项目。我们项目其实呃就是大部分的 angel 呢,它的功能都是有的,都是支持的,比如说像 m c p 还有 plan 呢,对吧?然后包括一些呃盆米选,就是比如说有一些 i m 杠 f 要把你的整个盘或者整个文件删掉啊,这种是 不可逆的吗?然后我们是会加了一个风险控制,就是不允许这种,这种比较呃风,就是比如把你文件删掉,这种行为要等到你自己确认之后他才能执行,不然的话他呃自动执行的话可能就会误删。 然后包括我们还有一个,其实还有一个后台的一个 web, 我 们等会展示一下,还有一些互啃啊,然后包括有一些本地的模型的支持啊,我们可能会要求,比如说你想文件项目比较大的时候啊,文件比较多的时候,你可能就是靠呃这个 devic 它自己去搜索的话,可能会消耗很多 token。 那 如果说我们本地装一个模型,然后去缩影的话,可能就会呃少很多 token 啊,然后还有一些自动检查点啊,包括啊 log 什么的。然后这里呢,我也写了一些,我看中文版吧, 这里我们也是有个中文版本的 啊,我们这里也是,反正这些原生工具我们都支持的,就是基本上其他 engine 的 有的能力我们其实都有的,包括记忆的、外部搜索的啊。 然后我们的这个项目的结构呢,也是因为我本身也是一个专业程序员嘛,然后所以我整个项目会把控的比较,呃,就是自然会 去把控它,不会说让它偏离我自己的一个掌控啊,不会因为啊 ai 去写,然后导致呃项目越来越笼鱼啊,或者呃结构会越来越混乱啊,尽量避免这种问题吧。 然后我们这里也有一些对比啊,就是比,比如说跟 cc 的 比 coser, 还有这啊这些市面上主流的这些 n 卷呢去对比。 首先我们的后端是只支持 deep stack, 他 们其实是支持一些啊,不仅支持自己自家的模型,还有一些比如说第三方他们也是也是能支持的,只是说他们的这个 api 有 点不同,他们的引擎的能力呢,都是针对自己家的模型去优化的。所以说你接入别的这个模型的时候呢,他多多少少都会有些问题的啊。比如说像 cc 可能大家用的比较多啊,然后它可能有一些配置你可能比较麻烦,比如说你上来不知一照上下文,对吧?然后包括它的 tools 可能会调用失败,或者呃,然后它的这个就是思考时间会比较长, 工具调用的时间比较长啊,这都是很多大家实际会碰到的问题啊。呃,还包括价格、缓存命中的这些问题,可能大家都可以去对比,比如说你在 cc 这边输入同样的提示词,在 啊 nex 这边也输入同样提示词,可以大家看一下它的输出的速度和输出的结果的质量,还有包括最后的价格啊,大家都可以去对比的。然后我们是,呃,基本上是全面都是完胜他们的啊,当然当然了,这还是要看不同的这个情况的,但是我测的大部分情况下都是完胜的啊,你们可以多试一试, 然后我们再接着看这边啊,他这边就已经基本上就是整理规划出来了,然后啊,哪些是好的,哪些是坏的,你看他都给我整理出来了啊,所以他主要的这个能力还是有的,也是没什么问题啊,总体跑下来是没什么问题的 啊,如果说大家在使用的任何过程中有任何的问题啊,都可以来我们的这个 github 上啊进行 反馈啊,我都会第一时间去优先解决这些 bug, 如果不是 bug 呢?嗯,是一些你的想法或者建议啊,我也会啊,当天去回复你啊,在 这个人不是很多情况下,我是可以回复啊,如果人后期维护的人越来越多了,我可能就会针对性回复,然后比如说比较重要的啊,或者比较或者我感兴趣的啊,我就会优先回复你啊,要不然其实一天下来我又要写代码又要回复,肯定是做不过来的。 好,那我们今天呢就介绍到这里,也是感谢大家对国产安全的 next 的 支持啊啊。

hello, 大家好,我是 linux 作者。呃,今天给大家介绍一下我们这个产品啊。呃,这个是我们的 github 首页, 我先教大家怎么去安装我们这个 linux, 它很简单,首先你要安装有一个环境, node js 的 环境,只需要搜索, 然后 get node js 啊,如果你是 windows 的, 就直接这边安装就行了,如果你是其他系统的,它会自动推荐,点击完之后会有一个安装的一个装包, 这里呢可以默认一直点下一步就可以了,我这里已经安装过了,就不再介绍。然后接着呢,我们可以打开我们的这个 cmd。 嗯,首先呢我们需要一个项目,我们可以在 f 盘下面新建一个自己的项目,我们可以随机取一个叫做 test 啊 test 一, 然后在这个 c m d 里面呢,可以进入,进入到这个 f 盘的 test 一 里面,然后输入我们的这个呃, resix 启动指令, 这里是我已经。嗯,之前启动过了,然后正常的启动呢,会有一个启动的界面,它会引导你去输入你的 api key, 然后如果你不知道 api key 在 哪里获取的时候呢,这里上面也有一个链接可以让你去点击, 当你输入这个 api key 之后呢,它就会进入到这个界面,那这里呢就是有一个 web。 呃,我们不仅仅是支持这个终端的啊,也支持 web 的 啊,点进去之后呢啊, ctrl 加左键,点进去之后呢,这里是我们的这个后台,然后这里的面板呢,它是一个 t y 的 镜像,就是你这里写的任何东西,它在这里都会啊反馈出来,比如说我们说你好啊, 这两边是同步的,当然你在这里发,这里也是会同步的,那这里呢有一些功能,就是可以看到一些以前的计划,还有一些绘画啊,包括你的这个,呃,应用缓存,还有包括你的 token 消耗啊,用量。 然后我们这里的话,呃,是当你比较熟悉的时候,你可以再来看这些,这里是比较深度用的一个地方,比如说对你的项目的文件进行一个缩影啊,可以本地有个模型给你安装 啊,然后下面有些 m c p 啊,还有包括 skills 啊,记忆啊、 memory 啊,户口其实都是支持的啊,包括这里有一些设置啊,但是这些设置可以都不用改。然后 我们可以先啊尝试着做一个项目啊,比如说做一个五子棋项目, 呃,在他做五子棋项目的时候呢,我可以给大家介绍一下,就是我们这个 deepsea, 就是 另一个用户用我们这个 reason, 然后它的用量, 嗯,这个用量呢?大家看一下啊,它用的非常多,它用了大概四亿三千五百万个 token, 对 吧?嗯,这是 flash, 它大概就是一百块钱不到,跑了它就跑了,它这个跑的用量有点大啊,其实用量也大,正常人不会跑这么大的。 那为什么我们这个缓存命中率它能达到百分之九十九啊?这个有百分之九十九以上啊。呃,我可以给大家讲一下啊,就是我们有一个叫做前缀缓存的这个命中率, 就 deepsafe, 它有个 api 有 个特性,就是你请求开头若干字节,如果跟上一次完全一致,它命中的部分呢,就会按照定价的百分之十来计费,也就是说如果你命中了它,就给你打一折啊,这个机制是 deepsafe 提供的,那所有的 deepsafe api 的 这个客户端呢?都有这个功能,那 为什么大部分客户端命中只有三十到六十,我们可以达到百分九十九呢?啊?这就要考验这个你设计客户端的设计水平了 啊啊,他这边还问了我们一些问题啊。嗯,我这个是滚轮,也可以去控制啊,比如说他要做一个 web, 那 我们做个 web 就 够了啊,回答一下他问题, 那接着我们讲别人怎么做啊?就是主流的 engine 呢?一般怎么做的?为什么他们做不到百分之九十九?第一个就是 devic 自家的这个 chat, 他 们的 chat 它对话率一般都是六十到八十左右,但是啊,比如你新开一个会话,它的命中率马上就会掉到零 啊。第二种呢就是,呃,就 cherry studio 这种,他们用 open ai 的 那种形状的 sdk, 每一轮对话的历史呢,都是会重新序列化的,重新排序,有时候还会塞个时间戳进去,他们那个前缀的字节序列就变了,缓存就废了,所以他们的一般命中率呢,可能会更低一些。 然后第就是最后一种呢,就是那个 close code code 啊,这个就比较主流啊,我先把这个 set up 一下,让它继续跑。 然后他们呢,就是他们不是为 deepsea 缓存设计的,他们是为自己的这个 cloud 和 gpt 是 能力设计的,他们的优架构 能力呢,就是能力优先,成本是结果,所以我们是反过来的,我们是成本,是约束条件,我们的能力呢,只会在这个约束下最大化,所以这是产品定位的区别,不是说谁好谁坏啊 啊,这里再统一一下,因为我们现在这选的是 review 模式啊, review 模式就是他每操作就是每一个操作都会问我们啊,要不要这么做,我们可以呃,也可以关掉,我们比如说加 shift, 加 tap 切换一下,切换到 auto 啊,就让自己写,我们就不管了。 然后我们具体做了哪些事呢?我们其实就是呃,就是在所有提示词前面 计算一下他的这个码,然后把他的绘画一开始就会计算一下哈,吸一下定死。所以在这个绘画里面,前面的这一段的字节都是不变的敞亮。听起来是很简单,但是很多框架都做不到,因为他们很想动态去根据对话状态去调整 system prom 的, 这样看起来会更聪明,但是缓存会当场失效,所以我们选择不动它。 第二个就是 append only, 就 只追加不改写,他每个对话的时候我们都是指望日制的末尾加东西不行不准,不进行重新排列,也不会去修改,他就保持他前面的字节保持不动。 那这条听起来是很简单,但是要嗯实现起来呢就比较麻烦,你跑久了肯定会很想清理一下历史啊,让上行往好看一点啊,那一清理缓存就完蛋了,对吧?那 后面还有一个就是呃 r 一 的这个思考,我们升到 v 四之后就叫 thinking, 它这种推理模型呢,它会输出一大堆的这个 reason content, 就是 那种 呃,就是用过的都知道,它会有一个自己推理的一个,一个就是可以看到,但是它不是作为一个主要输出的, 然后他有一些框架呢,就会把这个东西呢塞回去,这样就会让 angela 记得自己想过什么。那我们会把这个东西呢隔离在一个新的区域里面,每一轮结束的话就清空了啊,然后我们会通过一个叫思维提取的模块,然后去把它要用的时候就拿出来啊,我们会把它压缩成一个结构化的一个小块, 然后最佳进 log 里边啊,原原始的那个呃思考链呢,就不会进缓存了,这里他要启动一个端口去跑起来。好,我们拍摄啊。没有哈,他肯定想别的办法。 然后呢?除了缓存呢我们还有什么省钱呢?然后比如说,呃,就成本控制的一个东西,就比如说 flash first, 就是 优先 flash 模型,然后 pro 的 话因为比较贵嘛,那百分九十其实口顶 flash 够了。那 cloud, 比如像 cloud cloud code 以前都是用 sonet 对 吧? coser 也是 sonet, 然后口袋是默认的 gpt 啊,都是那种稍微便宜点的模型。那每一轮结束呢,就是有差不多三千个 token 返回就会自动压缩啊,模型用的时候就有个完整内容,用完就只剩下摘药,如果下一轮还需要的话就重新 build file 啊,总比拖着这个呃十二 k 的 这个托儿跑起来会便宜很多啊。 如果一碰到难题,你可以单轮起用这个 pro 模式跑一下,那跑完就自动回收啊,但那这样肯定会就是单次这种呃缓存命中肯定会降下来啊,但是可以更好的解决问题吗?对吧?那这里他说他设计好了,那我们可以去看一下 啊。跑起来了,我看看他运行怎么样,我随便玩一下,我感觉他设计还可以啊,对吧?啊?五子连击,黑棋胜,重新开始啊,没问题,我们来让白棋胜一把。 好,白棋获胜啊。好,那我们这个如果说这个时候呢,你想看一下这个后台 dashboard 啊, 可以这样,然后它会有一个提示,你可以点击这个进入外部后台啊,在这里也可以看到效果,它这里展示是一样的,这里可能会稍微好看一点。 好,我们这里可以看到它在后台跑了一个 job, 所以 我们才能啊预览出来这个游戏啊,如果它没跑这个 job 的 话,你在这里是看不到这个游戏的,那我们可以把它停掉。 那停掉的话,我们先可以看下 jobs 就是 跑了哪些任务,他跑了两个任务,第一个任务是失败了啊,那第二个任务是成功了,这个是成功了,那我们可以把他杀掉。 q 二,他是第二个。好,他正在停止。 好,停止了,停止后这边就没有那个东西了,那当然这个网页在刷新的时候他就打不开了啊,就无法访问了。 那整个流程就是这样,就是你想做什么都可以跟 ai 去沟通啊,我们这里的缓存它基本上达到了百分百,就是基本上全命中了啊,没有什么没有命中的,然后你可以在后台可以看得到这个。呃,详情啊, 我们可以在这盖栏里面可以看到,因为我刚刚还之前还对话过其他东西啊,平均下来可以达到百分之九十七啊,还是非常高的,因为我们第一轮聊天的时候,他肯定是比较低的嘛,他是后面慢慢的就会增高啊,就是一轮比一轮的比一轮高。 好,那我们今天就介绍到这啊,欢迎大家来使用我们这个 listeners 啊,如果有你有什么问题或者反馈都可以来我们的 github 上提这个问题啊,我都非常的呃乐意去 啊,比如说你们要发 pr 啊什么的,我都会乐意去合并或者提出一些我的建议啊,去改进一下。好,谢谢大家。

最近那个 deep seek resynx 听说挺省钱的啊,我们看一下代码,看一下它为什么这么省钱啊?一般都是走 catch, 因为如果 deep seek 你 从官方价格来看,走 catch 的 话是只要付百分之十七的费用啊, 就靠这个就是靠命中 catch 来省钱啊。其实就是,那怎么尽可能的命中 catch 呢?这里关键其实就是像那个就是 system prompt 和 tools 这两个东西, 这两个东西因为它在对话比较靠前,嗯,它们如果发生了变化,那整段对话都无法命中,缓存了,就就废了,那你就得 掏更多的钱嘛。所以其实 deepsea consensus 就是 在这两个地方。嗯,下功夫啊。就是我们要想一个问题,就是为什么 system prompt 这个东西会发生变化呢? 或者因为我们之之前有一个东西比较火,就是叫 deepsea t u i 嘛,它你去看它的实现,你就会发现像像它的那个 mod 就是 它的模式,有 agent, 有 agent, ulow 和 plan plan 模式,对吧? 这三种模式啊,它在这三种模式中间切换的话,这个 system prompt 肯定要发生变化。那你不能不变化是吧?就是比方说 plan 模式,你在做任何操作, ai 在 做任何操作之前 是吧?你得制定个计划。我靠,是吧?你不告诉 ai 怎么行? 大家想想这个问题,但你如果告诉他 system prompt 就 变了,对吧?变了我就不命中 catch 了,我就要花更多的钱,那 deepsea t u i 他 就是不管了。但是我们这个 reasonix, 我 们看一下它代码怎么做的,对吧? 我们首先发现它这个 system prompt 都不变,你看它这里是不变的,哎,它不变,那问题来了,它不变,它怎么做?那个 play 模式是吧? 它这个 play 模式它直接告诉你,哎,它告诉你这个 play 模式怎么写,它这么做的呀? 当他发现是 play 模式的时候,然后这个 ai 是 吧? ai 如果还没制定计划,直接给你报错,对吧?这个就是他比较巧妙的一个地方,他直接给你报错,给你拦住,换句话说,他是 就是 deep seek ti 的 方式是,呃,我一开始就知道,我现在是 play 模式,我一开始就知道,所以我 a, 我 作为 ai, 我 知道我是 play 模式,我一定会先制定计划,然后再写, 但是对于对于那个 deep seek resynix 而言,我压根不知道,就你不告诉我,为什么呢?因为告诉我这个缓存就不命中了,这个就是代价。 那我如何知道呢?通过程序检测直接给你报错,哎,报错我就知道了,哎,我一看报错,哦,我知道了,换句话说,我我,我要多浪费一次请求,对吧? 但是我的 catch 保住了,就我,我这个是一个两害相权取其轻啊,这个就是他做的一个价值判断,就是这么一个 啊。同样啊,就是工具,工具描述,工具描述,呃,在 deep seek t u i 这里是会变的,为什么呢?因为模式变了,因为因为不同的模式下它用的工具都不一样,所以一切它全切了。 但是 deep seek resynix 就 这里就做了个取数,它它工具都是固定的,就因为,呵, ai 压根不知道现在是什么模式, 当然 ai 它知道每种模式下应该怎么用,但,但是它只能通过那种去试探性的,就是发现有问题,我有问题,哎,我就缩回来,哎,原来我现在是 plan 模式对不对?否则我就不把我自己当 plan 模式。就 它,它其实就是采取了一些这样的措施,换句话说它们俩价值,价值取向不一样,就是,呃, deepsea renaissance 它更加,它宁肯用更多的 request 来换取,换取 catch 的 命中率就是你们,你们试下来是不是更加省钱啊?是吧?

喂喂,你好,你是谁啊? 你好,我是瑞斯克斯 cold。 很 高兴见到你。有什么需要帮忙的吗?尽管说。一加一等于几啊? 简单,一加一等于二。让我来回答。一加一等于二搞定,你会做什么啊?简单介绍一下呗。 好的,让我简单介绍一下我的能力。以上就是我会做的事情,随时吩咐。

大家要是平时用 deep sync 在 终端改代码,最怕的是不是 token 越跑越贵?我这次拿同一个项目,让 deep sync, t o i 和 resanix 跑同样的分析和改动流程, resanix 这边连续跑到最后,缓存命中拉到百分之九十四点四。 t o i 前面分析阶段也很猛,最高一度到了百分之九十九点六,但一进真实改代码阶段,它最后这轮掉到了百分之七十九点三。 也就是说 t o i 更像前面分析猛, rezanix 更像长绘画,更稳。所以我觉得 t o i 可以 尝试一下。但如果真的在乎长期跑下来的 token 成本和稳定性, rezanix 值得现在就试一试。如果大家也在找这种真能接近开发率的 ai 工具对号,可以先关。

reesnex 升级解读,从 v 零点四十六点零到 v 零点四十七点二三天,五个版本变化非常大。 v 零点四十六点零是一个 breaking 版本。 renex 移除了 rest 渲染器,回归纯 inknote t y 五个平台可选包和 nap 加载器全部删除,跨终端兼容问题同时消失。 m p m install 不 再拉取平台。二禁制,一个依赖数覆盖所有系统。 two e 全面翻新 card 组建,移除左侧装饰条,采用纯列盒子布局,统一图标词汇圆点表示运行中对勾表示完成,叉号表示失败。 composer 包裹圆角边框状态栏移至底部 窄终端上状态标签自动换行, dashboard 链接和 copy 命令更显眼。 v 零点四十七点零,桌面端成熟, 新增 about 弹窗和一键检查更新聊天。支持 syntax 数学公式渲染窗口标签绘画滚动位置跨启动恢复。 新增 compact retry btw feedback 斜杠命令,每条消息支持复制和文件导出。 macos 通用 node 捆绑, intel mac 不 再空白屏。 t u i composer 第二轮优化按键和视觉对其 cloud code ctrl r 切换详细模式显示推理和工具原始输出。 esc esc 打开最近五秒回退选择器 优撤销限制在五秒窗口防止误触鼠标滚轮默认开启。 i m e 光标贴附 搜索全面强化正则搜索迁移到 worker 县城。 redux 模式可干净终止 worker 超时从五秒延长到六十秒。 walk 超时从十五秒延长到一百二十秒。 table 新增为 web search 后端 mojic 四零三十自动切换。 esc, 抢占排队中的工具,调用 cloud 生态兼容 renesix 现在自动提取仓库中的 mcp, g, s, o n 和 cloud skills 目录,现有 cloud code 配置,无需二次复制。通用技能自断别名支持 v 零点四十七点一提示词预算大幅压缩。 code system prompt 压缩百分之五十一,每次请求节省约三千一百个 token。 工具规范描述压缩百分之二十八,每次请求节省约两千七百个 token。 自结预算回归测试锁定缓存前缀随之缩小。首轮请求更便宜。 shell 执行和 twoe 修复,逐次审批流程首次运行即可显示,不再禁摩失败就把 windows comast 降低刷新频率。浅色主题修复双斜杠注视,不再被误解为斜杠命令 架构。眼镜新增 coreutil 工作区块 face 一 内部分拆工具拦截器链支持排序 plan 模式持久化步骤证据,原数据 read file 大 纲域值从五百一十二 k 降到六十四 k。 multi edit 写入失败时自动回滚文件修复 edge 端点 table 引擎、全线星号前缀等多个问题。 v e 零点四十七点二热修复修复了 m p m install 时的 workspace 协议错误导致安装失败的 bug。 core utilities 从运行时依赖移至开发依赖。 v e 零点四十七点一,以在 m p m 标记为废弃,请直接安装。 v e 零点四十七点二 总结,从 v 零点四十六到 v 零点四十七, rezenix 完成了一次 u i 和架构的双重重塑。 two e 翻新,桌面端成熟搜索强化 cloud 生态兼容。提示词预算大幅缩减。 如果你还在 v 零点四十六,建议立即升级执行 m p m install rezenix at latest 即可。感谢观看!

兄弟们,我又来了,我是没有想到呀,昨天我发了一个抖音,没想到评论区惊现了一位大佬在推广他的编程智能体,我就下载了, 于是我今天就试了一下,就是他 deepsea renaissance, 他 是 deepsea 原生的代码智能体,这个作者游戏出身,代码功底应该非常的扎实, 整个架构也非常非常的厉害。他有一个非常省钱的技术,就是可以让大量 token 乖乖的命中缓存。而这边呢,就是这两天比较火的 deepsea, 它虽然支持中文,但是呢不是原生中文,有的时候呢会不太方便。另外我使用下来,这个 token 消耗还是比较大的,我甚至都不敢用 pro 模型, 但是他从设置到配置全部都是中文的。他有一个我非常喜欢的地方,就是这里有一个 web 界面,我打开给大家看一下, 在这里大家看到了吗?这里我的对话是同步的,这里 这里是一个突兀的镜像,这边这里也可以实时的去调整一些强度啊,模式啊之类的, 然后这里有很多的,你可以去设置,这里可以获取余额啊,比如说像这里,我今天小跑了一下,那缓存的命中率是百分之九十五, 非常的强大。还有工具啊,基本上呃该有的都有了,非常好用, 虽然没那么火,但是我觉得这个项目的潜力也是非常巨大的。另外给大家看一下这两个呃, get up 的 地址,这个是兔翼的, 这个是 reasonx 的, 我个人觉得这个名字取得非常的不好,如果叫做 deep sea, cold 之类的名字,可能会比现在要火的多啊。哦,这是吐译作者,这是经常出现在新闻上 这个 reason 的 作者主页,他,他是游戏出身的,这是他做的一个框架,应该是一个关于游戏的,这是一个游戏框架, 这个作者大部分项目都是 ps 研,推荐给大家,大家可以试一试,支持国产作者。

定要不忘初心,牢记使命,全力爬坡,不是在爬坡,就是在爬坡。兄弟们,今天我们继续来讲讲行业神话。到某河。 最近我拍了一期视频,讲的是这个关于到某河涨价后跟桐叶交流的视频,反响很强烈,感觉只要一提到到某河,就会有很多侠客心肠亮剑,伸张正义。 但也有个别认知积极的死忠粉在顽强抵抗,可谓亲者痛仇者快。我感觉这是个特别有意思的事。支付圈有个怪象,在所有支付同行里, 到某河是最不被认可的,但是在到某河眼里,除了说到某河的,其他同行都是弟弟 这种自我认知,纵观整个支付圈,除了到某河,也是无人敢出其右。还有一些粉丝问我,到某河是好平台吗?到某河能做吗? 呃,客观来说吧,存在即合理回收。到某河过往发展经历,从六个维度我们今天全方位 分析一下,共同了解一下稻谷的六脉神剑。第一个,费率,一年的机器基本上会长到零点六三加三,一年半会长到零点六九加三,综合费率零点六六加三加三等于万十,也就是客户终端平均费率零点七六, 也不算太高。我的天呐!第二个,零点七六的平均费率,分润万五起步,结算代理商底价为零点七,比起其他平台的客户也就贵十几个点,也还能接受,至少我看到我的伙伴都能接受, nice! 第三,一个平均两年换一个 app, 也不算换的太勤,主要是到某猴的伙伴太有战斗力,两年基本上都快爬到顶上了。那必须给你换个 app 重新爬, 不然干劲没了怎么办?一定要不忘初心,牢记使命,全力爬坡,不是在爬坡就是在爬坡啊!第四,一个,开一台机器,做到客户无押金,需要每台赔五十块, 按照公司劝导,一个客户必须过满舞台,一户综合才赔二百五,一点都不多。为了团队的荣誉,为了拿到第一名,虽然不给钱,但是这点代价算什么?为了价值三十元的奖杯,奖牌必须出四,虽然是二百五,但人肯定不是, 也不一定不是,哈哈哈哈!第五个,客户返还押金需要十八个月,这个过程当中也就少两到三次的价格,扣个四次流量费,为了拿回九十九块的押金, 多花个一两千块手续费算什么,反正都是客户出小 case 啊!第六,一个一年平均才收客户三次流量费,加起来才两百多块,平均每个月还不到二十块,太合适了, 电话卡的月租也不止这点钱。什么别人家的机器没有服务费,没有服务费会有服务吗? 超一流的价格才能配上超一流的服务,别想了,赶紧出,哈哈哈!以上仅为个人行业视角分享, 理性客观分析,不针对任何人,仅供同行参考,同路的兄弟们点赞加关注,下期更精彩,记得点赞关注哦!

ok, 速览一下 razenix, 呃,一款为 deepsea 特调的 agent, 那 么它是做了缓衰循环优先,这样的话它的缓衰命中率会非常之高。 呃,一般都在百分之九十以上,我实测的情况是大部分在百分之九十九到甚至是到了百分之百,那么我开 pro 的 情况下是三十多轮对话,花了我二毛七分, 所以大家可以猛猛登。然后缺点不足的话也比较明显。第一个是 web ui, 它的交互并不是很好,有时候会有一定的 bug, 然后有时候会出现呃, 交互之后模式无法切换,或者然后无法正常切换模型的这个状况,然后在 c r i 上话,它反应是正常的。另一个的话就是 plan mode 并没有集集成到 shift table, 也就是它的 a 键的状态中。那么后面呢?我觉得它可以切换增加这种模式。目前的切换方式是使用命令行,并且还手动关闭的话也需要输入 play off。 ok agent 应该后续有开发 desktop, 也就是桌面版应用的计划,因为我已经在源码中找到 desktop 目录,并且现在应该是在开发中,我们后续可以期待一下。

一千零四十六颗星,一百一十八个第三方服务一键连接,每二十分钟自动同步。一个用 rest 打造的桌面 ai, 二十分钟就能了解你的全部工作上下文。用过 ai 代理的人都知道这个痛点,它刚启动,什么都不懂, 你告诉他的事,转头就忘别的 ai 积累足够,上下文要好几周。而 open human 只要二十分钟,核心是 memory tree, 邮件文档、聊天记录全部压缩成三千 tokyo 以内的 markdown 块,分级存储在本地,同时生成 abcde 知识点库,你打开就能搜索、编辑浏览。 灵感来自 carpathy 的 笔记工作流。 gmail notion github slack stripe calendar。 一 百一十八个服务,一键 oof 授权连接,不需要手动配 api key, 每二十分钟自动拉取最新数据到你的 memory tree。 每次工具调用网页抓取邮件内容都吃 token, token juice 压缩,曾把 html 转 markdown, 长链接缩短,清除涌鱼,同等信息量下, token 消耗减少最多百分之八十。和 cloud co work、 open cloud hermes agent 对 比, open human 在 记忆系统集成数量、自动数据获取、模型、路由四个维度全部领先, 别人还在手动配插件,它已经全自动了。它还有个桌面吉祥物,会说话,有嘴型同步,甚至能加入你的 google meeting 当真实参会者。 语音输入加语音输出,不是打字,是真的在跟你对话。一千多颗星, new 开源协议,完全免费,数据全部本地存储加密,隐私有保障。关注我,下期继续带你发现开源宝藏!

就一个人在干活,然后他还被不停的一堆的领导提意见,你发现 ai 在 这种对抗场景下,然后絮絮叨叨的像个祥林嫂一样,可以 试试宣泄法。我最近我开源了一个提取文章摘药的这么一个项目啊,就我在这里面做了一个多 agent 的 一个对抗系统啊, 其实就是有一个干活的 agent, 他 要生成招标嘛,对吧?就有一个 ai, 他 是干活的,然后呢,我又给他配了一堆的领导啊,这些领导他本身也是 agent, 他 干嘛呢?就检查他的工作,然后挑毛病啊,批判他, diss 他, 就好像那个大学生参加论文答辩一样,就是他要被一群教授给屌的那种啊。最后我发现在这个场景像那个干活的 ai 啊,就特别表现的特别容易焦虑,经常崩溃,然后提交的内容也经常出问题啊,这个也可以理解,因为这是一个对抗性的一个系统,就那个 就一个人在干活,然后他还被不停的一堆的领导提意见,然后这些意见和修改意见,往往他们又是互相冲突,互相矛盾的,就根本不可能让所有的领导满意。 这个时候这个干活的这个 agent 他 就会,有的时候他会莫名其妙的在那诉苦,然后说,哎呀,我好难啊,你们提这种要求我根本做不到啊,对吧?我,我怎么做?我做的出来吗?您意见都是相互矛盾的, 这个不行啊,这个,这个,这样就不行了,他因为这个 ai 把诉苦的话直接插到用户,就是插到工作成果里面 啊,这些成果最后会提交给用户啊,这怎么行呢,对吧?所以我后来是怎么解决这个问题呢?就说哎呀,你这个干活的 ai 这么难受是吧?就让你诉苦一下吧,我就给他准备了一个叉秒的结构,说你诉苦可以,但是你诉苦的所有的话都必须放到这个叉秒结构里面啊。就说你说,哎呀,有多难多难,多难多难。 嗯,随便你说,但是你必须要放到这个结构里面,所以这个叉秒结构其实就是一个情绪垃圾桶啊,等他把结果一交付,哎,我把他诉苦的话一删,干干净净,剩下的只有没有抱怨的那种, 输出的那种公共就是工作成果,对不对?工程上其实就这个问题就搞定了,对吧?我把你牢骚话全删了, 那剩下的就是工作成果,这个其实就是弗洛伊德的宣泄法就是。呃,如果你发现 ai 在 这种对抗场景下变得非常的表现的好像有点焦虑,然后絮絮叨叨的像个祥林嫂一样,可以试试宣泄法,我觉得还蛮有用的。

开箱三百配元神 cs 收藏卡,众星瞩目的收藏卡终于到了,我们团是一月初开的团,花了两个月时间成功成团,代理那里主播一天能问八百遍,有单号以后就天天看着飞机飞到哪了, 快递员电话打过来的时候可给主播激动坏了,去搬箱子的时候腿还抽筋了。咸鱼上面流浪者的收藏卡的价格看的主播心惊胆战, 一百配居然要三千块,又是谁的一个月工资累目了主包自己开团一百配才四六零,哈哈哈哈,黄牛粉牛你们接着炒吧,我不和你们玩了。晚上八点直播拆配,欢迎大家来看。

给大家推荐两个超好用的工具, deepseek to eherysinix, 专门为 deepseek 而生的工具,昨天一点三亿 token 才用了五点五八元,感觉性价比已经拉满了,干活的质量还非常的高,推荐大家都用用看。

传统食品工厂面对市场巨变,怎么拥抱新渠道?怎么去经销商化?如何靠产品创新和品牌化?爆品大单品打进新零售货架?今天一条视频讲清楚,没有破局的创新大单品,不配进新零售。 二零二五年十二月,盐津铺子董事长张学武站在台上,身后屏幕写着四个字,东方薯片。台下坐着上千名经销商。他说,魔芋这个曾经只配在火锅里涮一下的配角食材,要用十六个月干到十个亿。台下没人笑,因为数据是真的。而另一边, 一家名叫韩近的食品厂,五年前还在给乐天做全国代理, sku 多到连老板都数不清。今天,他绑定了胖东来、沃尔玛、河马奥勒奇,出口两年涨十倍,靠的只有一个单品,海苔。这些厂家凭什么杀尽新零售?不是因为便宜,不是因为关系,是因为他们会拆化。什么叫拆化?是爆品! 把一颗魔芋拆成膳食纤维含量、口感、脆度、酱料附着力、保质期、稳定性、常温陈列耐受性,这叫拆化。 把一张海柴拆成头水紫菜拌饭、碎度、防潮、包装、儿童适口性,这叫拆化。没有拆化的产品,在新零售采购总监的 excel 里活不过第一轮筛选。今天我会用三个真实杀出来的案例, 拆解食品厂家定向产品创新的完整作战地图,计划到每一个数据、每一家品牌、每一个渠道打法。食品厂的老板和研发总、市场总监们看过来, 第一步,拆品类,把大陆货拆成渠道刚需。案例,盐津铺子大魔王魔域爽数据,上市十六个月,单月销售额破亿。二零二四年,大魔王系列突破十亿元,魔域品类三年增长七倍。二零二三年十月,盐津铺子做了一个反常识的决定。 当时全行业都在做轻资产、高周转,盐津却跑去印尼和云南花重金见魔芋原料加工网络。同行看不懂,魔芋不是满大街都是吗?至于自己建厂,他们不懂,盐津不是在买原料,是在拆品类。 盐津铺子研发团队做了三件事,第一,拆解消费痛点。市面上的魔芋爽,要么太辣胃疼,要么口感像橡胶。盐津发现真正卡住复购率的不是辣度,而是吃了有负担,于是定位健康加上瘾,双驱动。第二, 拆解风味壁垒。盐津干了件很重的事,联手百年老字号六必居,把麻将风味引入魔域爽。六必居的芝麻酱是国家级非遗风味,谱系极其复杂,这可不是贴牌,是联合研发。盐津的研发团队跟六必居的师傅一起泡了三个月, 把酱香挂壁杆量化成水分活度、脂氧化值年度系数。第三,拆解渠道适配。盐津没有把同一个产品往所有渠道塞,它的策略叫分层供给、权益协同。 量贩零食店零食很忙等走量高性价比跑规模商超会员店推蛋黄、鹌鹑蛋、大魔王、麻酱、素毛肚等高质感定制产品,强化品牌溢价。山姆等特定系统开发专属定制品, 深度绑定成果。二零二五年上半年,休闲魔域制品营收七点九一亿元,同比激增一百五十五点一零,占公司总营收二十六点九零,成为增长第一引擎。给食品厂的拷问, 你的产品在货架上和隔壁的有什么区别?如果只是口味不同,那不叫差异化,那叫选择题。新零售渠道要的不是选择题,是唯一结。第二步,拆原料,把大宗商品拆成供应链主权案例含金食品 z 一 k 海苔数据海苔系列年销六亿元,拌饭海苔细分市场全国第一, 海外出口从四百万飙升至四千万,两年涨十倍,成本优势领先同行十五、韩近的故事最适合那些什么都做、什么都不精的食品厂。二零二一年之前, 韩近是一家典型的贸易性公司,代理乐天 sku 近千个,海苔、鱼肠、柚子茶、果冻,什么都卖,什么都不突出转折点,砍 sku 二零二一年,韩近启动海苔战略, 把饼干、鱼肠、饮料等非核心品类全部剥离, sku 从近千个锐减至不足一百个。砍 完 sku, 他 干了一件更狠的事,锁死头水紫菜。什么叫头水紫菜?第一次收割的叫头水,口感最嫩,营养价值最高。后面的二水、三水、四水,一次比一次老头水成本比四水高五十以上,绝大多数品牌舍不得这个成本。 韩信的选择是直接飞到韩国西海岸,跟产地签长期协议,既所价又所制。这意味着什么?二零二三二零二五年,全球紫菜原料价格因为海洋升温减产大幅波动,韩信的竞品拿不到货,或者只能拿二水、三水, 韩信依然稳定供应头水原料,这就是供应链主权,不是你有钱就能买到,是你必须提前五年把身家压进去。 更关键的一步,从铺货到造货,韩进不是把货铺进沃尔玛就完事了,沃尔玛的采购团队多次到访韩进工厂,不是去验厂, 是去联合研发。下一阶段什么口味会火?儿童海苔的钠含量能不能再降?十?拌饭海苔的碎度要不要调整?这些问题不是韩进等沃尔玛给订单, 是双方一起找答案。结果,韩进绑定了胖东来、沃尔玛盒马叮咚、朴朴良品铺子等几乎所有主流渠道的 海苔品类战略合作,从单一品相扩展到全品相,给食品厂的拷问,你的原料是市场现货,还是战略资产?如果是前者,你永远在跟行情博弈。如果是后者,你才有资格跟渠道谈。共创第三步,拆渠道, 把供应商身份拆成定制服务商。案例,卫龙美味称山姆会员店数据,魔芋爽年销超三十亿元蔬菜制品收入占比从二零二四年的五十点五五,正式取代辣条,成为第一曲线 线上渠道。二零二四年收入七亿元,同比增长三十万。卫龙是魔芋爽的开创者,二零一四年就推出了这款产品,但真正让他进入新零售核心圈的,是二零二五年的一部曲, 为山姆会员店定制产品。这款产品叫高仙牛肝菌魔芋爽,你仔细看这个名字,不是把卫龙魔芋爽搬进山姆,是为山姆重新做了一个魔芋爽。区别在哪? 普通魔芋爽,辣味主导,包装鲜艳,单价低,适合冲动消费。母定制款用牛肝菌替代部分红油,主打高膳食纤维,包装克重更大,客单价更高,契合山姆家庭囤货、健康升级的用户画像。这不是供应商,这是解决方案服务商。卫龙还干了另一件事, 地域化定制。二零二四年推出香味麻辣小龙虾、风味辣椒炒肉、风味魔芋爽,精准拿捏湖南消费者的地域饮食记忆。二零二五年推出麻酱魔芋爽,用芝麻酱替代传统红油,减辣不减味, 直接切入那些想吃辣又怕辣或者给小孩买零食的辛辣人群。这不是口味创新,这是场景拆解 给食品厂的拷问。你的产品是一个 s k u 打全国,还是为不同渠道、不同区域定制的专属版本?如果你只有一个版本,你就没有溢价权,因为渠道随时可以找到第二个供应商,只有定制才能绑定。第四步,拆门槛, 摸清新零售的入场券密码。过去食品厂赚钱,靠的是信息差,我知道哪里便宜你不知道。未来食品厂赚钱,靠的是拆画能力。我知道这个产品还能拆成什么你没想过的样子,而我能把它做出来。没有拆画的产品不配进新零售,因为渠道不再缺货,只缺非你不可的货。

给大家讲个可笑又可气的事,我代理那个竹芒科技的共享充电宝,我代理的是搜电品牌的, 每天提现是从平台的账户里去提。那他可以把钱都划走啊,是吧?他明明可以直接划,但他不,他给你整个呢?升级充电宝, 这个就是三代宝,每个在你机器里每天扣五毛啊。我合作的是黑充电宝,没配这个,但是他从别人机器里借出来,还到我机器里,每个每天扣五毛。两条路,第一条就是你让他无限期的扣下去 啊,一千五毛,一个月十五。第二条呢,就是用你扣的钱去买一个配额,记住是配额,不是充电宝归你了,充电宝还是归公司了,你只是享有了不扣钱的权利,不扣钱的权利你要花钱去买,五十九块钱用一个这个配额加五十九换一个,这个 我有一个配合的情况下,这个充电宝在我机器里就不扣钱了,搞笑吗?啊?可气吗?我想说的是啥?良禽择木而栖,大家要合作项目的时候擦亮眼睛,选好公司。
![[螺旋精配] AI代理技能是什么及其工作原理 本视频介绍了AI代理技能(Agent Skills)这一开放标准,解释了它为何被主流AI编码平台采用。技能通过简单的skill.md文件,为AI代理提供程序性知识(即如何完成特定任务的步骤、规则和判断),弥补了大语言模型仅擅长事实推理而缺乏操作流程的短板。技能采用渐进式披露机制,分三层加载(元数据、完整指令、资源文件),高效节省上下文窗口的token预算。视频还对比了技能与MCP(工具访问)、RAG(事实知识)和微调(模型权重固化)的区别,强调技能专注于程序性知识,且可跨平台移植。最后提醒用户注意技能文件中的安全风险(如提示注入、恶意脚本),建议像对待软件依赖一样审查后再使用。 #AI代理技能 #程序性知识 #开放标准 #渐进式披露 #AgentSkills](https://p3-pc-sign.douyinpic.com/tos-cn-p-0015/o8bA5EeDgM8Bm8QFfgq9AAA9IFI7yCIJGQrAoD~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2098501200&x-signature=xMcRXXFaZ%2FBSIDEEdMOE1GgUqbE%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=2026070413505502DCB04F10F3BF0426F0)
什么是 ai agent 技能?它们为何成为几乎所有主流 ai 编码平台采用的开源标准?嗯,这是因为技能专门用来解决 ai agent 在 运行过程中遇到的某个具体问题。 ai agent 是 相当不错的推理者, l l m 或大型语言模型已经知道大量事实,它们可以告诉你 coburnatus 架构, s q l 历史,或者一只未付种燕子的空诉。这部分没问题,但它们缺少一些东西, 它们缺乏程序性知识,也就是那些专门针对实际工作如何具体完成的知识。 比如说一个包含四十七个步骤,用于生成一份完全合规的财务报告的详细工作流程。没错,那听起来确实会非常有趣。 所以,当运行大型语言模型的 ai agent 在 执行生成这样一份报告的任务时,它实际上基本上存在着两种不同的可以选择的方式和路径, 要么每次有人需要输入每一步全部四十七步,并且每次都需要这样做。 或者情况更糟糕的是,这个 agent 完全只能靠胡乱猜测来进行处理。而现在我们要理解的是,所谓技能,其实指的就是如何将那些程序性的知识真正有效地融入到人工智能 agent 系统当中去。 技能的格式真的简单到几乎有点令人可笑。这其实就是一个非常简单的 skill 点格式的 md 文件而已,那是一个 markdown 格式的文件,放在一个文件夹当中。现在让我来详细画出一个技能实际是什么样的结构。 在技能点, md 文件的最顶部位置包含的是 i m l 前置源数据部分。那么现在让我们一起来仔细看一下, 在前置源数据部分究竟都定义了哪些内容。最起码来说呢,这里至少包含两个非常重要的基本项目, 具体来说就是名称以及对应的描述信息。这是两个必填字段。首先第一个字段是名称,它用来标识这个技能是什么。第二个字段是描述它用来告诉 agent 这个技能的具体功能,以及应该在哪些场景下被使用。这个描述非常重要, 因为它是触发器条件准确告诉 agent 该技能何时适用。例如说,这个技能名称可以叫做 pdf builder, 而它的描述部分呢,大概会是这样写的, 当用户要求提取一份 pdf 文件的时候,就使用这项功能。你还可以在前置源数据中添加其他字段,如作者和版本,但名称和描述是必填的。 现在请大家看前置源数据的下方,这里呢,我们其实还有一个正文的区域在等着我们。现在请注意,这些才是真正需要遵循的操作指令,包括逐步工作流、规则输入、输出视力、 agent 完成任务所需的一切,它直接用纯 markdown 编辑技能。文件夹还可以包含一些非常可选的文件夹在里面。这些不是必须的,但你可以添加。 其中一个可选文件夹,就是 scripts 文件夹,里面包含了 agent 可以 真正实际运行的可执行 javascript、 pencil 以及 bash 脚本。系统。当中还有一个名为 reference 的 参考目录,这个目录里面包含了额外的文档资料,如果 agent 这个智能代理判断认为需要用到这些文档,它就会自动去加载这些内容。 最后另一个非常实用的可选目录就是 assets 目录,它包含了大量的静态资源,比如模板和数据文件。这就是 agent skill 的 具体样子, 但 agent 可以 拥有非常多的 skills 来帮助他们进行查找。那么当存在数百个这样的 skills 时,究竟会发生什么呢? 在启动时,将所有它们加载到 l l m 上下文窗口中,会在任何人提问之前就耗尽 token 预算。 skills 使用一种称为渐进式,譬如 progressive disclosure 的 机制。渐进式批录分三个层级工作,第一层仅仅只包含了原数据这一部分内容。这里的情况确实也是如此。 在启动时, agent 仅仅从每个 skill 加载各自的名称和描述。每个技能真的只需要非常少量的 token, 即使安装了一百个 skills, 总开销也不会填满整个上下文窗口。 这本质上真的是非常类似于一个技能的目录表现。在我们来谈第二个层级,这与完整的操作说明密切相关,并且非常重要。当 agent 看到与 skills 描述匹配的请求时, 他会将完整的 skill 到 nb 正文读入上下文,这告诉 agent 要做什么,即我们正在教他的 skill。 这种识别将给定任务需求与可用 skill 匹配 是通过 lm 自身的推理完成的。模型决定何时可以使用该 skill, 这就是为什么好的 skill 描述如此重要。第三层就是这些非常实用的可选文件夹了, 这些资源就对应着 scripts, references 以及 assets 这几个文件夹,它们只在特定任务实际需要时才被加载。 agent 从所有可做事项的清量所引开始运行,也就是名称和描述。 当相关时,它会拉取详细的指令,记正文。基于匹配触发条件,并且只有在确实需要时才会去获取资源。 skills 为 agent 带来一种知识,但将知识融入 agent 有 几种方式?那么现在让我们来简要地做一个比较,因为它们所处理的内容其实是不太一样的。我想提到的第一个是 m c p, 即 model context protocol 模型上下文协议。 m c p 究竟能给你提供什么样的知识?提供工具权限,它赋予 agent 调用外部 api 并与服务交互的能力。 scp 关注 agent 能触及什么,但不告诉 agent 何时去触及,以及触及后做什么。 是 m c p。 另一个重要的技术是 r a g, 也就是解锁增强生成。这是一种非常实用的方法。而 r a g 处理的其实是这个问题,是事实。知识,它在运行时从知识库拉取相关片段, 当 agent 需要查询信息时非常方便,但 r a g 不 教 agent 如何做某事,它属于参考材料。 那另一个呢?我们来试一下微调操作如何?有何用处啊?微调这个技术可以把知识直接嵌入到模型的权重参数之中, 这是持久的,但成本很高。如果模型发生了变化,微调就需要重新来一遍。而对于技能的话呢,实际上从来都不会去做这些事情中的任何一项。那么技能究竟能够为 agent 带来哪些具体的知识和能力呢? 呃,技能所处理的呢?正如我一开始就已经提到过,其实就是程序性知识,他教怎么做,按什么顺序,用什么判断力, 而且因为技能只是文件,所以可以版本控制,容易更新,还能轻松跨平台移植。实际中,技能常会用到其他知识形式, 比如 m c p。 m c p 提供了调用外部服务或功能的能力,而技能则负责判断应该在什么时机,以及采用何种方式来执行这样的调用。现在我想再补充一点关于技能的重要说明, 那就是 skill d m d 格式本身是一个完全开放的行业标准,它已经正式发布在 agent skills io 这个网站上,而且这个项目采用的是 apache 二点零许可证,这意味着任何人都可以自由地使用、修改和分发它。 目前,这个格式已经被众多主流 ai 平台广泛采用和集成,比如大家非常熟悉的 cloud code 和 open ai codex, 以及许多其他优秀的开发工具和平台。为一个平台构建的技能可在任何支持该规范的平台上工作。 有一种非常有用的思考技能的方式,并且它来自认知科学。事实上,人类确实拥有非常多不同类型的记忆,有羽翼记忆,也就是事实知识。比如罗马是意大利的首都, 有情景记忆,也就是过往经历。比如说我去年夏天真的去了一次罗马,去了,真棒。 还有程序性记忆,也就是各种技能,比如如何在罗马街头骑行踏板车,并且还能活下来。讲述这个故事, 我也勉强做到了。现在所谓的智能体架构已经开始逐步学着模仿这一结构模式了。我们来讨论一下语义记忆,他和我们之前说的内容非常接近,可以建立连接,这个内容涉及到了解锁增强生成技术以及相关的知识库。系统 情景记忆功能,嗯,他的确能够很好的映射到对话日记的记录以及交互历史的追踪方面。程序性记忆,嗯,没错,这种说法确实能够非常贴切并且完美的映射到技能文件这个概念上,让人很容易理解。 现在有一个很重要的事情确实需要特别提出来说明一下,那就是这些技能可以包含可执行的脚本程序,而这些脚本程序能够访问文件、系统环境变量以及非常重要的 api 密钥, 而这正是它们强大的原因所在。但这也正是信任如此至关重要的原因所在。 因为当智能体运行这些脚本中的某一个的时候,他通常会在你的机器上以本地方式执行相关命令。 而且审计结果已经发现,那些公开可用的技能经常包含一些非常不良的内容,比如说提示注入这样的问题,又比如说 工具中毒这样恶劣的情况,比如隐藏的恶意软件,基本上就是任何开放生态系统中的常见问题。所以要以任何负责任的团队对待安装任何软件依赖的方式来对待技能安装。 也就是说,在本地机器上使用之前要审查它并了解它的功能。那么这到底给我们带来了什么呢?技能就是 ai 智能体的程序性记忆,它们定义在 一个文件夹中的 markdown 文件中,该文件教智能体如何完成特定任务。技能是条件触发的,并且通过渐进式批录的方式来高效加载,而它的格式则是一个开放的标准,一个已经知道 非洲和欧洲无赋载燕子的空速速度的智能体。现在也可以学习如何执行你为其定义的任何可重复任务,这就是 ai 智能体技能。如果你正在使用,请在评论区留言。

这是一个可以干掉你百分之九十同事的项目,有大神把一百多个行业专家的技能直接做成了 ai, 员工免费开源给你用。它的名字叫 agency agents, 在 github 上已经狂揽了将近九十 k 的 star。 比如你要做公众号,它里面就有专门的公众号运营。你想做抖音视频,它就有专门的抖音策略师。你想卖东西,它配了专业的销售团队,你要写代码, 他安排了前端、后端工程师,甚至连设计、测试、客服这些岗位也早就帮你配齐了。整整两百多个岗位,全是 ai, 随叫随到,不用发工资,有了它,一个人也能撑起一家公司。