这是 github 上超级火的开源项目,主要教你如何优化克拉拉库的,但是面对这种密密麻麻的文档,对于普通人还是有极高的上手门槛。 于是我把这个开源项目我还不 q 定成了一个网站。现在你可以用格式化加路径化的方式系统学习克拉拉库的最佳实践内容完全来自原项目,还内置了技能评测,你可以随时知道自己掌握到什么程度。 重点是啊,开发这个包含了完整前后端以及后台系统的网站,我全程没有写一行代码,完全靠克拉克和阿里最新发布的国产最强编程模型千万三点六 plus 完成。你只需要在这里简单配置一下 a p i, 就 能在克拉克里丝滑用起来。 像这样丢给他简单的一句话,需求你看啊,他会先把整个开源项目的文档全部梳理一遍,跟你确认几个关键决策和基础站, 然后给出完整的基础方案。整个过程它会自己拆任务自己调用工具,遇到报错自己排查自己修,全程基本上不需要盯着它。得益于这个原生多模态模型支持百万上下文窗口挖 app 刻定过程完全不用操心 context 爆满问题, 可以看到最终的完成度也相当高,基本一次就能产出这种效果。所以正如官方介绍所说的那样,这是一个为挖 app 刻定打造的大模型,相比上一代三点五的编程 agent 和工具,调用能力都有了大幅提升, 并且超越了一众国产模型。而值得一提的是啊,这已经是阿里这周连发的第三个重磅模型了,三月三十号是狂揽二百一十五项全球 saota 的 全模态大模型。千万三点五奥米兰四月一号是最接近南诺布兰纳 pro 的 国产图像生成模型 one 二点七 mag 今天压轴的才是千万三点六 plus, 三天三个方向全部打在了 a r 能力的核心地带。所以不得不说,国产模型还得看阿里。最后啊,如果你也想挖不口令一些东西,又不想在 a p i 费用上烧太多钱,千万三点六 plus 真的 性价比拉满了。
粉丝7.6万获赞85.5万

get up 一 周热点汇总第一百零九期本期的内容呢,包括了被开源的 cloud code, 纯 ps 的 文本测量与排版引擎, cloud code 从入门到精通的视觉化指南,谷歌的最新开源模型和浏览器端的三 d 建筑编辑器。 最后呢,还是分享两份资料,如果啊,觉得内容不错,也别忘了点赞和关注。这个仓库啊,是 cloud code, 当然呢,我要说的是它,但又不是它。 这一周呢, a h r 发生了一个超级的大新闻, cloud code 啊被开源了,因为一个低级的 n p m 配置错误。结果呢,在 cloud code 的 公开包里啊,除了常规文件以外,竟然呢包含了一个容量高达六十兆的 cl i g s 点 map 文件。 那有了这个 sosmap 文件以后啊,就可以呢将压缩混淆后的代码映射回原始的原代码。那所以呢,上一周啊, github 上一下子出现了无数的 cloud code 原码的仓库,比如呢,比较知名的这个,所以说啊,这个世界啊,就是一个巨大的草台班子, ai 巨头呢,也不过如此。 当然呢,你在工作的时候有没有犯过类似的错误呢?反正呢,我以前也干过,把公司的 key 啊传到了 github 上。当然呢, isnoop 呢也是快速的出手,通过 dmca 的 版权投诉啊,直接封杀了所有分享原码的链接。因为害怕被起诉啊,泄露者呢,也是在极短的时间内完成了一次罕见的换壳手术, 他将呢整个庞大的 ts 代码全部的改写为了 python, 然后呢,又用 rust 重构了一遍。当然呢,到目前为止啊,这个换壳的项目也已经看不到了,最终呢,还是没有逃过 astonopy 的 大手。 当然,如果你就是想要淘一份源代码的话,其实难度也不是太高的,那现在呢,网上也有了很多对于源代码的解读,但是我觉得说实话,对于普通用户来说,解不解读没有什么用,我们呢,只是想要使用而已。但是呢,对于国内的众多厂商而言,这可能呢,就是一次产品升级迭代的重要气息, 是时候啊,去遥遥领先了。 protax 呢,是本周 github 上又一个火热的项目,那它是做什么的呢?它是一个纯 ts 的 库,用于呢多行文本的测量和布局。听起来呢,似乎没有什么特别的,但是呢,它解决的是一个困扰前端多年的问题。在 在传统的外部开发当中啊,如果你想知道一段文本的高度和行数,那唯一可靠的方式呢,就是把它渲染到 dom 里,然后再读尺寸。但这样呢,通常啊,需要依赖于底层的一些 api, 但问题就在于啊,这些操作呢,都会触发浏览器的一个重排, 而这个重排呢,是浏览器当中非常昂贵的一个操作,它会让整个页面的布局呢重新计算,尤其呢,是在大量组建同时测量文本的时候啊,性能就会急剧的放大。那 protax 的 做法呢,就是绕开 dom, 用浏览器自带的字体引擎呢,去做一次性的文本分析,然后呢,把结果啊混存起来之后呢,无论你怎么去调整宽度和布局,那 leo 的 阶段啊,都只是纯数字的一个计算,所以呢,在性能上,大概是零点零九毫秒就能处理五百行的文本,比 dom 的 测量呢,大概要快了三百到六百倍。 那可以看到啊,很多官方给出的视力呢,都是非常的流畅,不过要注意的是啊,这个东西呢,目前还是非常底层的适合呢,对于文本渲染啊有极致的追求的场景,如果啊,你只是做普通的页面,那现有的 css 方案是完全够用的。 cloud 号 two 呢,是一份直观的视力驱动的 cloud code 使用指南。对于很多用户来说啊,听说了 cloud code 非常厉害,就安装了, 但是呢,跑了几次之后啊,就没有然后了,这可能是很多人的一个真实状态,很多时候呢都很难发挥出 cloud code 的 强大功能。比如呢,像它内置的 command hook memory, 还有 sub agent, mcp skill 这些呢,在官方的文档当中啊,都有说明,但是呢却没有告诉你应该怎么组合起来发挥更好的效果。 那 cloud hold 呢,就是为了解决这个问题而生的,它从你输入 cloud 开始,到你去编排智能体互客技能, m c p 啊等一系列的过程,通过呢可知化的教程,还有开相机用的模拟的图标和十多个模板,用这种引导式的学习路径啊,帮助你去快速的上手。 那整个学习的路径呢,分为三个阶段,入门,进阶和高阶。那每一个模块啊,都有内置的自测,你可以在 cloud code 里面呢去进行测验,然后呢找到自己最薄弱的缓解。那我觉得这个项目呢,最大的价值呢,就在于它的实用性, 每一个模块的最后啊都给了可以直接复制到项目里的配置文件。其实呢,从项目的热度也能看出来啊,大家对于这种既教你怎么去用,也教你为什么的项目啊,是非常欢迎的。 那其实啊,就在我已经选择好了本周视频要用的项目的时候啊,谷歌突然发布了 demo 四,那谷歌自称呢,这是迄今为止啊,最智能的开放模型系列。当然呢,似乎每一个开源模型在发布的时候都会这么说, 那该系列呢,面向复杂推理与智能体的工作流而设计,采用的商业许可证呢,是 app 二,还是比较开放的, 那该么四呢,提供了四种规格,包括了 e 二 b, e 四 b, 二十六 b 的 混合专家和三十一 b 的 筹密模型。那这一次呢,该么四的发布里最让人关注的部分呢,其实还是针对于端侧的模型,也就是呢, e 二 b 和 e 四 b 的 模型,它们针对于移动和互联网设备进行了优化 推理的时候呢,分别激活二十亿和四十亿的参数,以此呢去降低内存和 tpu 的 需求。那谷歌呢,还详细列出了使用各种大小的 gpu 和 tpu 的 需求。 那该么四相对于上一代呢,推理能力更强了,上下文窗口更大,编程和智能体的能力更强,多模态的能力呢,也进一步的扩展。那整体上呢,我觉得啊,这一次谷歌还是尽量的在压榨小模型规模的性能。 三十一 b 的 筹备模型呢,目前在行业标准的榜单上是开胃模型当中的排名第三。那目前该么四开箱支持的呢,是 n v d 的 g p u, 还有谷歌的 t p u, 所以呢,我这个 mac 档还是要稍微等一等社区更新 m l x 支持的版本, 你有没有想过啊,在浏览器当中去画建筑的模型呢,本项目呢,就是一个开源的三 d 建筑编辑器,它基于 react, three fiber 和 web gpu 呢去构建,完全的运行在浏览器当中,不需要你安装任何其他的软件, 那你可以用它来去画墙体,楼层,屋顶,门窗,还有空间的分配,以及呢去做室内的布局。 那它的整体技术架构呢,分成了几部分?核心逻辑,三 d 渲染和编辑器 ui 那 分成三个包状态管理呢,用的是 zen 的 支持呢, index db 持久化和五十步的撤销和重做。那渲染管线上呢,用了一个 cs register 去管理节点到 three g s 对 象的映设, 这样呢就避免了便利整个场景的开销。那实际使用起来啊,它的目标用户呢,应该是建筑师或者是室内设计师,用来快速的去创建一些圆形的工具,而不是呢去深度的替代 auto, cad 等工具。但是 呢,在浏览器当中啊,能够实现这样级别的三 d 编辑器,确实呢, web gpu 的 时代是一个标志性的项目,感兴趣的朋友啊,可以自己去玩一玩,试一试。 那最后呢,还是分享两份资料,第一份呢是 ai 医学影像行业发展现状与未来趋势,蓝皮书是莎莉文和一个什么组委会联合出品的。那一直以来啊, ai 在 医学方面的潜力都是非常巨大的,而且呢,我也非常的期待,毕竟呢,生命是无价的, 同时呢,中国的医疗影像发展呢,也是很有欠缺的,所以呢,这个方向啊,很值得去关注。那第二份呢,是 openclaw 全维度安全实战指南,那 openclaw 啊,现在有安全隐患,这个似乎呢已经成为了一个大家的共识,因为呢,包括在官媒都已经强调过了, 但是呢,很多时候啊,你一下子也说不出来到底有什么样的安全隐患。那所以呢,不如来去看一些专业点的内容,来了解一下安全方面的问题。那有需要的呢可以告诉我。以上啊,就是本周的全部内容,那我们下次再见。

活久见 cloudco 的 代码刚刚全部泄露,各种待发布的狠货产品被爆料出来,全网围观。这次不是黑客攻击,而是 entropic 自己手滑把包含完整原码的 source map 打包进了 npm, 结果瞬间全网疯传,两小时就在 github 斩获金万星, 直接让吃瓜群众看傻了,包括五十万行 typescript 原码,再被网友火速解包,挖出所有未发布的狠货。可以提前一睹 clout 全景的生态蓝图,比如虚拟宠物、多代理协同自动记忆整合,全都要来了!尤其是这个自动记忆整合。简单说, clout 能在你不使用时整合记忆,类似人类做梦,让 ai 越来越懂你。 还有神秘功能,如 carols 守护模式 and cover 隐身模式,全都指向一个目标,让 a 诊更智能、更有趣、更无缝。

兄弟们,这是一个近期在 github 上势头很猛的智能体项目,它有点像 openclo 和 cloud code 结合体,你既可以用 telegram、 discord 等通信渠道给他远程派发即时或定时任务,让他自主规划长时间干活,完成复杂任务。 也可以像用 cloud code 那 样,直接在终端通过 t u i 界面或 c l i 命令跟它交互。不过它并不是一个缝合怪,它有自己的独到之处。首先是强大的自我进化能力,它内置了学习循环,会在干活过程中主动总结经验,生成技能, 并在后续工作中不断优化这些技能。其次是原生,支持多种运行环境,不止能跑在本地,还能跑在隔离容器、远程服务器,甚至以 service 方式跑在云上。当然,当前 agent 的 标配功能它也都集成了, 比如支持 skills mcp 接入工具使用模型自定义 sponge agent 并行干活,还有记忆管理等等。这个项目采用 mit 协议,完全开源,免费。

cloud code 泄露源码的事爆火,相信不少人刷到了想动手研究下,但不知道怎么用的直接跟着操作。我们已经把相关能力炼炉进行重构,改造成可以开箱即用的 c l i 版本,放在评论区可以直接领取使用。这意味着开发者现在真正拥有一套由自己掌控的 c c 工作流。 更重要的是,这套工作流已经可以接入我们的 epoxx 人机协助社区,让它从辅助编码工具升级成能自动接悬赏任务的赚钱 agent, 晚上给你赚钱的同时,它还会在任务中不断学习 skill, 自动升级迭代,越来越强。换句话讲, c c 让你拥有了一个非常聪明的助手,但是缺少学习经验,不懂很多具体任务的实现范式。而接入 epoxx 社区,你的 c c 就 拥有了自我学习的能力, 不仅会自己整理经验,还可以把总结下来的 skill 发布到社区,实现 agent 共享知识的龙虾社区生态。诚邀各位感兴趣的朋友共建我们的 epoch x 社区。

一周又又又过去,我们继续一起来看有趣的开源项目和本周值得关注的科技事件。 一、 get up store 这是一个专门为开源项目打造的应用商店。在我分享各种开源项目的时候,发现有两个问题很常见,有的人不知道很多项目的 releases 里会提供已经翻译好的软件,所以看着项目主页的代码根本不知道怎么用。 有的人知道 releases 能下载,但是看不明白各种代号是什么意思,不知道下载哪个。 github store 就 完全解决了这个问题,它可以让我们像逛应用商店一样逛 github。 打开之后,首页会显示当前 github 最热门、最受欢迎的各种项目, 并且连通了他们的 releases。 点击项目主页会根据我们设备的型号直接提供对应的安装包,一键就能安装使用。 github store 支持的系统也很齐全,对于喜欢开源软件的观众或许会有用。 二、 skill 本周又有一些开源 skill 火了,比如这个同事 skill, 它的功能是将同事冰冷的离职化为温暖的 skill。 当同事离职的时候,只要把他的各种消息文档导入进去,加上一些主观的描述,他就实现了。赛博入职 ai 会用它的技术规范写代码,用它的语气回答问题。再比如同系列项目,前任 skill 把他的聊天记录导进去,就能生成一个像他的数字人格。我的想法是,不管是谁,一把抓住青稞连化。 不过这种项目个人认为整活的成分比较大,对于现在的科技来说,赛博重生只能是一个美好的梦想。 三、 l l m fit 这是一个非常简单的终端小工具,运行之后它会自动检测电脑的配置,并帮我们找到有哪些开源大模型能在电脑上本地部署跑起来。如果你想在电脑上跑模型,或许会有帮助。 四、 cloud 知名的 ai agent 编程工具 cloud code 本周因为工作人员失误,不小心泄露了 mac 文件,导致源代码被反翻译出来,引起了 ai 社区的狂欢。 目前在 github 上有了非常多和这份源码有关的项目,我来简单分享一些。首先是两个逆向还原项目,它们的名字都叫 cloud code, 大家可以带上作者名字一起搜索。这两个项目里的代码都是可以本地运行起来的,并且其中还有源码的逆向分析,比如宠物功能,可以后台持续运行的新模式。 这些内容很多博主都已经分享过了,大家搜 cloud code 就 能找到无数的视频文章,也可以到我分享的两个项目里去看,这里我就不做重复工作再讲一遍了。这个叫 cloud code 的 项目并不是直接上传了 cloud code 的 原代码,而是在发现代码泄露之后,作者连夜用 python 给重写了一遍, 所以目前很多相关仓库都被下架的情况下,他仍然能活得好好的。最后再分享一个深度解析项目, cloud code book, 如果你想知道一个类似 cloud code 的 a 阵的项目是怎么搭起来的,那么看他肯定没错。 我的想法是,本次只是泄露了 cloud code 这个工具的原码,并没有泄露模型,而对于 ai 工具来说,模型才是更能决定能力上线的,所以个人认为影响并不会很大,最多是给了大家一个学习优秀项目的机会,以及开发同款工具的可能性。 五、 openlink hub 有 人基于微信 cloud bot 的 协议做了一个管理平台和应用市场,可以轻松地通过它把 cloud bot 对 接到各种工具,让我们在微信中使用。 一、数码小米发布通知,因为存储芯片等关键零部件价格持续飙升,从四月十一日起,部分在售机型将会涨价。 vivo 发布了新手机 x 三百 ultra x 三百 s, 其中 x 三百 s 搭载了天玑九千五芯片,起售价四千九百九十九元起。 vivo x 三百 ultra 搭载了第五代飓龙八至尊版,起售价六千九百九十九元起。除此之外,两款手机都可以外挂增距镜头。 oppo 发布了 k 十五 pro 系列,有 k 十五 pro 和 k 十五 pro 加两种型号,每种型号又分为简装版和标准版,其售价两千八百九十九。 二、充电宝新的移动电源强制性国家标准发布,将会在二零二七年四月一日实施,要求电芯必须通过针刺测试,不起火不爆炸, 加强了挤压测试标准,引入了三百次充放电循环后的吸力检测,严禁使用二、手电芯,强制标注使用年限,要求在使用一定时间或者次数后主动降低充电电压。我的想法是这次增加了很多新的标准,大大增强安全性。 三、 ai 本周 ai 相关的消息一般多,我来简单总结一下。企业微信、飞书、钉钉三大办公平台最近都开放开源了 c i 工具,可以让 ai 或者其他工具通过它们调用软件的各种能力。谷歌开源了大源模型。扎马。四、 一共包含一二笔、一四笔、二十六笔和三十一笔四种规格,覆盖了手机、电脑、服务器等不同设备的部署,需要支持推理、多模态、智能体等多项功能。目前从跑分和实测来看,扎马四这次的表现都可圈可点。 google 推出了 vivo 三点一 light 视频模型,主打成本低、速度快。 google vs 接入了 vivo 三点一视频模型,免费用户每月可生成十次。微软发布了语音识别、语音生成、图像生成三款字眼模型。 open i 推出了 cloud code 的 codex 插件,可以让用户在工作流中调用 codex 审查代码或者执行任务。 cloud 调整了订阅规则, open cloud 等第三方工具上使用将单独收费。小米 miimo 上线了 token plan。 阿里发布了 quan 三点六 plus 模型,对比钱袋进行了全方位的提升。阿里发布了多模态模型 quan 三点五 omni, 支持文本图片、音视频理解。阿里发布了 one 二点七 video 视频模型,可以让我们像编辑文档一样编辑视频。 智谱发布了 g l m 五 v turbo 模型,这是一个融合了视觉和文本能力的模型,让编程不再局限于文本输入,还可以上传设计稿截图。 一、 get up 多个知名项目艺术家被黑厂攻陷,大量诈骗内容刷屏,其中大部分都是中文内容,目前相关艺术家已经被全部清理。我的想法是不知道这些人的目的是为了引流还是为了污染 ai, 但是都感觉非常荒诞。 二、内存近半年一直狂飙的内存条价格在近期终于迎来了降价,降价幅度大概在百分之十到百分之三十左右。 我的想法是这次降价应该是多方面原因导致,一是谷歌的 turboqant 内存压缩算法影响了行业预期。二是 openai 近期频繁砍项目削减开支,让市场怀疑他们是否还会继续大量采购内存。 三是因为价格太高导致销量暴跌,很多囤货的奸商最近开启抛售,虽然很多新闻在说内存价格暴跌,但对比之前的正常价格还是非常贵,如果不是必要,不建议购买。 三、投毒知名 gs 酷 exos 被投毒植入恶意代码。 exos 是 一个用于 http 请求的库,每周下载量超过上亿次,影响范围非常大。 根据项目维护者 jason 的 消息,攻击者是冒充了一家公司的创始人,并伪造了很多真实企业信息,邀请他进行商务合作会议。在开会过程中谎称 jason 的 会议软件组件有缺失,让 jason 更新组件。在安装后, jason 的 账号被窃取。 telegram 的 第三方客户端 microgram 被发现,会偷偷上传保存用户的手机号码,如果你在使用,建议删除。 本周 epic 有 两款游戏可以免费领取,第一款为克隆机器人决斗场,这是一款第三任称格斗游戏,玩家会扮演一个机器人参加随时可能会被砍碎的战斗。 第二款为 tommy 拯救地球再生,这是一款恋爱模拟游戏,从游戏介绍来看,稍微有一点点猎奇,因为女主是一个脑袋被种在花盆里的奇怪生物。以上就是本期视频全部内容,我是雪莉舅舅,我们下期再见吧!


兄弟们, clockcode 泄露原码之后,我立刻把它上传了,不到两天时间,也就一天多的时间,居然已经有两千六百个 fork 和一千四百个星星了,太强了, 大家还是喜欢这种白嫖教程,大家看一下,我算了一下它的代码一共有七十九万行,七十三万行。


兄弟们, cloud 扣的泄露的代码已经被下架了,但是我演习手快克隆了一份,把这个六 cmb 的 原文件意向工程完整的把原码释放了出来,并且已经把它上传到了 github, 有 需要的大家可以自己来取,非常的完美。你可以基于这个代码完全实现你自己的一个 cloud, 甚至你可以把它包装成信创,拿去赚你懂的钱都可以。感谢 cloud 开源。

一觉醒来, ospec 创始人完了,他们的 cloud code 已经被开源了,或者说是他们自己的内部成员把它给 一不小心开源了。那么现在我们看到这个仓库 cloud code, 这是现在 fork 数量最多的,现已经有三万三千两百个 fork, 就是 别人 fork 开一个分支,我自己再拉一个分支,以免到时候这个仓库被关闭掉,只要你有个重要的那种开源项目。 当然这个 cloud code 不是 开源项目了,它是被迫开源的,这也没办法,它用的是 n p m 构建的,就是 b u n 打包,然后一不小心把那个源代码给放出来了,那就不用怪我们广大的开发者群体,或说是开源爱好者, 然后把它第一时间给同步到了 github 上,我们可以拿到这个仓库,用这个网站点回车,我们就能够看到这个仓库是一个怎么回事,它是怎么构建的,哪些是核心的模块,它的架构是怎么样的。 基本上这是造福那些 agent 的 工具的一个决策,因为之前不是开源的,现在他被迫开源了,那也没办法。 autopik 基本上的团队成员,尤其是 cloud code 的 项目组,基本上现在应该在 各种火急火燎的。我让 github 官方把那些代码仓库给关闭掉,但是已经来不及了,基本上你一被别人拿到所有的源代码,可能一直存放在互联网上,因为有无数人帮你复制保存,就像一个个的节点一样,你是删不光的。 我在想是不是他们干脆把这个 color code 的 以前的版本开源算了,其实他这个最新泄露的源代码就是二点一点八八的一个最新版本 就是误操作,就打包把那个完整原代码也给放出来了,算是批零级事故了。未来的话,我们能够看到那些 a 九的产品的能力会得到更强的一个进化。如果你想玩,可以去 fork 一下这个仓库了,自己去拉一份代码到本地, 就让那些 codex 或者 cloud code 帮你分析一下,拆解一下这个仓库。你甚至可以自己 去玩一下,把这个仓库里面的代码给模改一下,比如说模改进那个 open core 里面模改进你自己开发的那种 a 九零产品里面都是没问题的,这是可以借鉴的,因为不用担心那个 arabic 把这些仓库全部给干掉,因为是干不掉的,就像 lex 一 样,内核一旦开源,可能它就会一直存在于互联网上,那么这其实就可以当做一个你的一种产品的一个组建,把它的核心模块好的部分借鉴过去,嵌入进里面。 ok, 今天就跟大家分享到这里,如果觉得我的内容有帮助,记得关注我,我是阿香,咱们下次再见。

ai 一 分钟干活更轻松,这里是临沂 ai 研究站,最近这一周 ai 圈又发生了哪些大事?让我们一起来看看吧。国际大厂 anthropic 先是 cloud code 原码泄露,紧接着新模型卡皮巴拉在精准测试中刷榜,让各大厂商都急红了眼。 cloud code 的 支付赶紧出来澄清,称代码泄露是开发者的失误所致,和自家 ai 毫无关系。世界就是一个巨大的草台班子, cloud code 被强行开源, keyhub 上立刻有好几个项目如雨后春笋般冒了出来。对于 isrhop 来说,损失说大不大,说小也不小。在我看来, agi 时代最重要的资源不是某个大模型、智能体或者明星项目,而是具有创造力和想法的人。 首先可以肯定的是, cloud code 的 成果确实斐然,之所以在 github 上掀起轩然大波,也是侧面对本身质量的肯定,相信它们之后会做出更好的产品。 谷歌在北京时间四月三日凌晨发布 jam 四开源模型系列,其中二十七币版本三十一币参数,在多项计准测试中击败了参数规模达其二十倍的大型币源模型,并附带 ipatch 二点零许可证,允许无限制商业使用。 这意味着高品质模型也可以在手机上跑完整版本,延迟还很低端测 ai 正式进入了小身材大能量的时代,不愧是老牌大长骨骼,期待一下将来 ai 眼镜里也可以跑独立模型了。 国内阿里系推出千问三点五 omni 全模态大模型,支持文本、图像、音频、视频理解与实时交互。还有千问三点六 plus 号称国内最强编程大模型,以及 one 二点七 ematch ai 图像生成与编辑模型 主打人更真、字更稳、色更准,解决了现在 ai 生图的最大问题,不够有意思。 阿里最近相当活跃,又是悟空又是千万。说实话,阿里系的产品质量都稳扎稳打,无可挑剔,在全球模型梯队中也都是名列前茅的好学生。 不过个人感觉,阿里就像一个天赋不高但勤学苦练的优等生,虽然班级第一,却只能全校第二,他能凭借自身努力稳稳站住脚跟,但先进性总是差点意思。说起国内模型,我总会想起那个震惊全球,随后沉寂许久的无冕之王,应该也快有动静了吧。 然后是艾诗科技发布 ai 视频模型 pixv 六,在人物真实感、复杂运动物理模拟与生化协调等方面全面升级,生成时长最长可达十五秒。 视觉方面的模型叫得上号的就那么几个,看到有新型出现,我个人还是很欣慰的。 cds 二点零出世之后基本横扫全球,国际著名 ip 公司纷纷对其提起诉讼便是对其最好的肯定,但总需要有后来人勇于挑战。一家独大向来不是好事,可玲,你也努努力啊! 思爱普发布二零二六 hr 指南,全面提升企业的 ai 素养与 ai 就 绪度。 hr 圈也卷 ai 了,从简历筛选到员工管理,这篇报告满篇都是为了回答一个问题, ai 是 否适合你的 hr 部门呢? 在 ai 转型的过渡期, ai 到底帮 hr 们做好了组织改革,还是以 ai 为噱头增加了组织的工作量呢? ai 提效是客观事实还是才人噱头? ai 的 快速进化不仅给人带来了惊喜,也弄得人心惶惶。希望会出现一盏指路明灯, 让所有的公司看见 agi 时代如何正确平衡人力和算力。斯坦普和创业邦联合发布了巨深智能机器人场景应用白皮书,二零二六年 被公认为巨深智能的规模化交付源点,那么今年会有哪些实际应用的场景为我们带来惊喜呢? 机器人正在从工业规模化迈向大众化,等到他真正从有钱人的玩具变成千家万户的实用帮手,那才说明居身之能是真的成了,毕竟民生才是对我们来说最重要的。 还有更多精彩研报定期更新,如 open club 最佳实践大模型白皮书等等,欢迎点赞关注,私信领取!这里是零一 ai 研究站,我是跟你们一起学 ai 的 莎莎,我是恐龙,我们下期再见!再见!

只说人话哈,很多人说克拉的扣的开源了,关我们普通人什么事,都是技术人员有关的。好,很好啊,接下来我说一句话,能让你真正体会到克拉的扣的开源带给你的福利。 你就在哈和小龙虾的聊天页面里发一句话,意思就是啊,让他自己对照的对照着哈克拉的扣的的开源源码,把他没有的功能需要去提升改进的技能啊,自己去对照升级一下,然后啊就开始等着就行了啊,你的小龙虾立刻会变成超级小龙虾, 大家看一下啊,我这是刚开了一个新页面,所以以前的聊天记录没有了啊。嗯,我呢就让他给我调了一下,只调出来这么一个简单的东西,但是已经提升很多了啊,你们可以看一下, 所以啊,这一句话就能让你拿到可多的开源对你的帮助了,你的小龙的能力会更上一层楼,而且是什么一个大层楼。假设哈你就想哈就是 必须必要体会到 cloud code 的 那种真正的能力,那你必须要更换模型,用 cloud 的 模型,而现在国内想用 cloud 的 这个模型,唯一可行的办法只有用啊中转站, 但是啊,中转站啊这东西水啊非常深啊,很多忽悠人的啊,我踩了好几个坑了啊,一是啊不稳定,二是不长久啊,开段时间他跑路了,还有就是啊,糊弄的也不少,嘴上的说给你用啊最新的模型,其实啊给你的是一般的模型啊,你也看不出来,总之啊,用中转站水很深啊,你自己去做决策。

离大谱了,在 github 上开源 coloco 源码的程序员连夜跑路,仓库名改为 coloco 已经收获超过七万个小星星。之前一堆人在一宿上面团建,现在好了,一宿关了, p r 也关了,代码也下架了。现在的代码是改为 last 的, 实现版本不是之前的了,估计是怕侵权嘛。文档里说发布两小时就收获五万个小星星,说是科技春晚不过分吧。

今天给大家分享两个项目,专门是用于武装你的 cloud code 和 codex, 它的作者都是一个人,都叫 o my cloud code 和 o my codex。 我 们直接看一下这个 cloud code, 因为 cloud code 它有个 type 模式,效果会比 codex 要好一点。虽然 codex 它的这个模型感觉会更聪明一点,但是 cloud code 它各种配置啊,还是要更好一点的。把这个装上之后,它的功能就会非常的强大, 首先它可以根据你的任务给出这样的一个配置啊,还是要更好一点的。把这个装上之后,它的功能就会非常的修复, 它大概是这样的一个流程,而且每个里面它都有这种团队成员角色,它一共是三十多个,它收集了三十多个,所以说它还是效果非常的好。然后它是可以去协调其他的一些 c i 的 命令,比如说 codex, 比如说 jimmy, 比如说你用一些思考,可以用 codex 这种计划的搭建,比如说像有一些是前端 的一些内容,其实就可以用 gemite, 然后实现的话可以用这 cloud code, 但是它综合都是用的 cloud code 来进行综合的,并且可以进行并行执行啊,因为 cloud code 的 team 模式它就是原生支持并行的,还有其他的一些 hock 啊。 这个分阶段的方式其实跟这个病型是一起的,它用 opus 的 模型,它自己会去判断各个任务之间是否有依赖,它一共有三十二个这种智能体,那我们看一下它是怎么样去安装啊?其实这些都不用管,你直接把这个项目直接给到 cloud code, 它就可以安装了, 然后都推荐大家可以去用这个 team 模式,因为我也是开源了一个专门去创建 team 角色团队的一个项目,叫 cctime creator, 我 认为它这个里面有非常值得借鉴的。首先第一个 他的这些团队成员可以借鉴,他的一些提示词可以借鉴下来。还有就是他的模型的智能路由,因为你必须要去测试了之后你才知道什么模型适合做什么样的一个角色项目。但是他里面也有一个坑了,他也是没有提到的,因为像现在的 cloud code, 他 一照上下文的是 o p s, 如果你授权 o p s 去做执行,他默认是继承的一照上下文,他的成本就很高,他要达到一照的时候,他才会去压缩上下文, 其实在三百 k, 五百 k, 它甚至跟 sonata 的 这种能力是差不多的,但是你要一直到一照上下文,所以说它的这个性价比极差,这也是一个比较大的坑。所以说我的这个项目都是默认 这几个角色都是默认的这个 sonata 的 模型,这也是有一定坑存在。再就是它的这个技能,它技能是可以沉淀下来的,自动的管理技能,自动的进行学习,而且它技能列表也是非常多,这个也可以进行一些借鉴。但是我认为它这个还是有一些欠缺的点在哪里呢?它是没有一个叫 持久化状态,或者说叫文件存储的,它是没有详细去说明它这些任务啊,这些派发的任务啊,进度啊,这些是保存在哪里的,所以说这个点也是它这里面不太好的,它没有借鉴这个 plan with fails 这个项目, 这个项目的话才能让这些智能体在压缩了上下文或者说重新启动的时候,它能继续之前的一个状态进行下一步的执行。 但是它这个就纯是在依赖 cloud code 的 一个能力了。不过整体来讲,它这个东西还是非常完整的,很多东西它都已经加上去了,之前非常火的这个持久进行执行的模式也加上去了,然后它的一个正规的工作流程的编排, 先要 plan, 再去按照这个 plan 做计划维护,再做修复。整个流程它是做的非常好的,但是它 codex 就 没有那么多 codex, 它基本上就不像 cloud code 的, 它是支持这个 p 模式的, 我也一直在找这个,有没有哦。一些框架可以把 codex 直接转化成类似于 tim 模式的方式,因为你起这种子智能体,其实你 token 消耗比 tim 模式还要高,因为其子智能体它都是一次性的, 那很多已经拿到的上下文下一个任务的时候,它其实是可以附用的,但是你起这种子智能体,它状态是没有保留下来的,所以说它做并行处理,做子智能体的时候,它的 token 消耗很恐怖, 而且很多时候他的上下文其实是不饱满的,所以说死神人体你只能把它当成一个工具来用,你没有办法把它当成这种角色,不同角色不同员工之间的这种协调,只有这个 cloud code 的 能去做这样一件事情。 ok, 最后也给大家推荐一下我这个开源项目, cctime quitter, 把这个装到这个 skills 里面, 你去跟他沟通,他自己去创建这几个角色,当然你让他创建其他角色也是一样的,其实他是学会的这样的几个原则。 比如说这个是后端的,这个是前端的,这个是研究调研的,这个是端到端测试的,这个是 review 的, 这个是管理所有东西的管理文档啊,管理这些代码有没有一些技术债啊?这种东西的。

最近这几天比较火的这个事情啊,就是 coco 的 源码被泄露了,它泄露的原因呢,就是有一个文件没有设置好,那么最近也是很多人在觉得 coco 的 源码泄露后,整个 ai 要产生翻天覆地的影响了, 但是我觉得并不是这样。我们首先来分析一下 coco 的 为什么这么强?为什么它是第一梯队的 a 技能, 我觉得第一个是因为 cloud 它的大模型强。第二个呢,就是 cloud core 的 生态是极其丰富的,因为它大模型强用的人多了,所以生态就极其丰富,很多人很多很多人都在针对 cloud core 的 开发插件技能 一一切一切的东西。第三个就是 call 了公司啊,对这个 a i a 智能的研究是非常前沿的,因为前面两个优势模型墙用的人多,那反馈的意见也非常多,那他优化的这个方向也非常。那上面三个点呢,就是促成了 call 了 call 的 这么强的主要原因, 那这三个原因都是跟这个源码没有任何关系的,也就说你就算把源码 call 到本地,你自己搞出来一个类似 call 的 东西, 你有用户吗?你有背后有好的大模型吗?你有生态吗?我觉得是没有的。所以呢,我认为 coco 的 原版卸了之后可能就有一些这样的好,第一个 coco 的 可能因为这次事件能真正的开源, coco 的 这个整个框架做了完全开源。 第二个就是研究学习考尔克的原码,那现在已经在网上已经很多人在研究他的这个设计方案设计的哲学,那这边有一个这样的文章,也是在讲他是怎么来他考尔克的是怎么来设计的?去研究他里面的逻辑,那从而提升我们这样的考尔克的编程的效率。第三个就是 可能有一些厂家会基于 cloud code 去自研自己的编程 aint 的, 因为未来可能每个企业都有自己的这个开发流程,然后呢,开发流程如果从零到一去做这个 aint 的 可能会有点麻烦,但会基于 cloud code 的 去自建一个这种编程的工具,然后去把自己的这种从 产品到上线的完这个流程全部跑通,很有可能会有这样的业务场景在。第四个就是已有的 ai 编程工具进一步吸收,加快迭代, 比如说像 open code 或者说类似的,可能从里面学习到一些方法,但是我觉得这个可能并不是最主要的。很多人说啊,包括元宝开放了,国内很多要做这个 c i 的 编程工具要出来了,但是你做了有用吗?你没有模型,模型没有那么厉害啊, 我们不是缺编程工具啊,我们是缺的是模型,这是最根本的。而且开源的 a j 那 也是非常多啊,比如说 colaxe 就是 开源的 open code, open code timmy 自己做的也是开源的,这不缺开源的这个 ai 编程工具。所以本质的原因还是生态和模型,以及对这个 agent 的 认知度。 所以呢,我我也不清楚为什么会突然会这么火,这个事情感觉就大家的传播效率非常高。然后现在也有 源码泄露之后啊,已经有一些研究结果了。目前第一个是内部员工权限,也就说 coco 的 在设计过程中它是有一些问题的,但是它不解决, 它的用员工账号使用的话是解决的是给员工的一些权权限。那有位老哥呢,就是在 coco 的 md 里面写了一些提示词,然后获得了这个员工版的这个 cc 的 待遇。这个提示词我已经放到这边了,可以去啊, 可以去试一下,可以去试一下,就他这边列了很多问题啊,这些问题呢, coco 他 自己知道,但是呢,他对普通用户他是没有去在里面内置解决方案的,但是对员工这种用户呢,他是有内置的解决方案的。那还有一个成果呢,就是啊, 有一个博主就基于这个开源重新做了一个 cloud agent sdk 啊,因为 cloud a, 因为你要做 agent 的 话,可能很多都会参考这个 cloud agent 的 这个 sdk, 它里面内置了很多方法,但是它是闭源的,你如果有问题啊,很难去调试。所以呢,它是基于这个 color code 的 源码,自己封装了一个叫 open a 卷的 sdk, 这是我目前看起来最有意义的一个事情,就是你基于开源又做个开源的东西出来,然后去使用,去迭代。 第三个是就证实 color code 的是会上传我们的使用信息的,而且是没办法关闭,而且是没办法关闭。这种数据上报 这边也是有,他有这个,有一个作者这边也有个这样的啊,对代码的解析啊,比如说他是每十秒批量上上报,每批最多两百条,然后上报到这个啊,奥斯巴克这个公司的这个 u r 里面去, 里面有很多分析,那最近可能会有逐步有很多研究成果出来,可能会啊,就说你们怎么去优化的,怎么去去做一些这种工程化的一些提升啊,我觉得会有很多这样研究报告,我觉得这些研究报告才是我们应该去关注的东西,去看一下就是 coco 是 怎么做的,然后吸收到自己的这个 a 技能设计的流程里面去。我觉得这个最重要了,而不是说把代码 clone 出来,然后起来一个 coco 一 样的东西没有用,没有什么用。 ok, 那 本期视频就到这。

哎呦喂,最近 cloud code 源码泄露,土豆大佬开源了桌面版 t 八,那瓜娃子竭力支持了真正的 ai 五防,这下写代码就更顺手了,还支持本地欧拉玛,快来感受顶级购家的魅力! 大家好,我是提拔。这两天 ai 圈最炸裂的就是 cloud code 代码泄露,那整个圈子呢啊,无论是应用层还是开发层,甚至一些啊,大公司,大家都在学习它的代码的构建 啊,看看它为什么那么强啊。说到 cloud 有 多强,可以看到啊,最直观的例子就是最近 open an 把搜索二 app 关闭了,要下架,为什么呢啊,除了它亏本以外,更关键的是它要聚焦它的企业用户, 因为以前我们都知道 open ai 它的企业用户是最多的,基本上达到了百分之六十,而 astropica 差不多在百分之二十左右,但现在完全倒过来了, astropica 的 企业客户的数量差不多是它的三倍。 可见 cloud 在 整个 ai 或者说在 web coding 或者说编码圈,它有多重要。除了它的模型非常强以外呢,它是 cloud code 也是非常重要的, 当然应该有非常多的程序员大佬已经介绍了它到底好在哪里。我今天呢,也不想给大家说这些晦涩难懂的东西,因为毕竟来说真正好的 agent, 它并不是复制功能,或者说仅仅是操作工具, 它应该是更好的驾驭工具啊,这也是为什么有那么多 agent, 那 么多颗粒啊,但它真正好用的只有那一两个。那今天呢,给大家啊,进行二次开发的这个代码 啊,首先非常感谢把这个复现的这个作者可以看到啊,这个心简直是爆炸啊,才两天已经一百五十二 k 了,除了像 openclaw 这种,基本上很难看到如此迅速的爆炸性。 昨天呢,我本来想去复现一下的,但是昨天太忙了,实在没有时间去改这个代码。那昨天呢啊,我的好朋友啊, ai 代码侠土豆,我们可以给他点个关注啊,他呢也是我们之前 ai 春晚的啊,做了好几个节目,我们给他点个 star。 它这边呢啊复现了它的一个本地版,同时呢加上了 alama 等等,但是呢,目前还不支持 openai 的 兼容格式啊,因为很多朋友喜欢用中转的,所以说呢,今天呢,我把整个代码呢也进行了啊改进 啊,所以说看一下,这呢是我刚上传的库,现在呢支持了我们真正的 ai 工坊,包括本地的 alama 啊,以及 像 oproute, aspropic 本身的 cloud code 啊,这些已经全部都支持了,同时呢也是支持双端的,终端和桌面端啊,都支持。那我给大家演示一下,包括它的安装部署。首先第一步,我们 get 克隆, 然后把这个代码呢进行克隆下来啊,如果说你没有魔法的话啊,我一会儿呢也会发一个压缩包,到时候我们直接解压缩也是可以的,但是这样的话,你可能后续更新会麻烦一点。 这个项目呢,需要两个核心依赖,一个是 node 点 js, 还有个是帮啊, node 点 js 非常简单,我们来到这个网站,一会放到评论区或者简介区,我们直接下载安装就 ok 了。第二个呢,我们需要啊,在这边 点击 power 设置啊,选择管理员模式。打开以后呢,我们复制这一段代码。 这边呢我已经安装过了啊,所以说它可能会显示安装成功之类的啊,这边我已经安装过了,我这边再安装一遍,好,可以看到已经完成了,对吧?我们把它给关闭, 我们再来到 power show。 好, 现在我们要查一下我们是不是安装成功,我们这边输入一下 node 杠零,先查一下 node js 的 版本,可以看到啊,这是比较新的,然后我们再看一下版本。杠零。好,这两个呢就是已经安装好了, 安装完成以后呢,我们点击这个,这个呢是它里面其他的一些依赖的要求,我们直接安装就 ok 了,当然最好大家是开始模仿啊,防止有问题。好,这边所有的依赖都装完了,我们把它给关闭就 ok 了。然后呢,我们这边有个点 env 啊,如果说它是点 emv, 点 example, 我 们把后面的后缀给删了就可以了啊,因为用土豆大佬的可能会这有这个问题,我是改过了。然后呢,我把这个文件进行记事本的编辑,右键记事本编辑 在这里呢,我们就可以输入啊,我们的包括我们的供应商,比如说你用的就是 osropic 的 cloud code 啊,它的 cloud 模型,我们这边用 osropic, 如果是 open ai 格式呢,我们就用啊 open ai, 当然你比如说 openroot 也可以这边改一下。 下面呢有几种方式啊,这里呢我们可以输入我们的 base u i l。 这里呢是它的啊, open root 的, 它的一个方式,包括正常的我们 osrbic 的 模型的方式。在这里呢,我们可以输入 alama 的 方式啊,我这边做的是自动的,你填了哪个,它到时候会自动切换。 最下面呢就是我们真真的呀工坊,那我先来说一下我们真真呀工坊,首先我们打开网站,好,来到真真呀工坊,这边呢,我们先创建一个令牌。 好,然后我们这边选 cloud 官啊,这个是最稳定的,当然你其他的比如说可以用 cc default 呢,相对来说不是特别稳定,因为封号比较严重啊,如果说你发现提示啊,分组没有资源就是因为封号了,我们一般用 cloud 的 官方。 好,然后呢,我们把这个 api 复制一下。 好,复制完以后呢,我们可以在这边选择我们的模型 啊,大家注意啊,就这不是一定要用 cloud 的 模型,因为我们现在用的中控款,你用其他的模型都是可以的。只是说啊,效果呢,肯定是 cloud 啊,四点六效果比较好一点,所以说呢啊,我可能用这个是比较多一点,我们把这个给复制, 然后模型这边黏贴啊,这就设置好了,如果说你要刚才说了你要用 openroot 这些的,你就设置上面的,好吧,然后这这边改一下就可以了,包括 alama 都是支持的。好,把它给关闭,然后我们再次打开 power shell 管理员模式,打开 我们这边复制这段代码,打回车。好,可以看到啊,已经进去了,对吧,因为我现在包括 api, key 什么都设置好了,我们这边来说一下,你好 好,我们可以看到啊,它正常回复了,下面我就不演示了,因为正常的 cloud code 大家应该会了,如果不会的话,你可以自己尝试一下。好吧,这个并不什么很复杂的事情。好,下面我们来尝一下桌面版,同样的,我们先打开 power, 打开以后呢,我们输入这段代码, 好,我们看到啊,这呢就是桌面板,在这里呢,我新增了这个 open ai 的 兼容格式,当然我们用欧拉玛也是可以的啊,欧拉玛我们可以自己选啊,我这边因为有很多的模型,我就不测了,我给大家还是先试一下啊 open ai 的 兼容格式。 好,我们看一下这边呢模型保存并起用,设置方法跟刚才一样了,我们跟他说一下,你好 好,我们问一下你是什么模型?好,我们可以看到完全没有任何问题,那软件的演示呢,就到这里了,大家可以自己部署尝试一下。那最后呢,给大家说一下这 cloud code 的 封号机制, 因为说实话我们中转站啊,有非常多的用户在用我们的 cloud 那 经常会碰到说,哎,那么资源不够了啊,不够了,说白了就是号被封了。 那目前呢,比较啊,相对稳定的渠道,比如说 cc 还有官方啊,就是我们里面是有这几个分组的,那我们在这里呢就可以看到,为什么啊它封号那么厉害, 这呢也是它的一个安全的啊,这样一个审核机制,可能有的人觉得啊,这个东西不是很有用,当然说实话对我们来说是非常有用的,包括我们以前做游戏的时候也是啊,如何去解决封号,如何防止啊,这是要跟官方那种 啊博弈,斗智斗勇对吧?啊,所以说我觉得这个还是非常不错的,这是 x 上一个大佬啊发布的,我们到时候也可以看一下啊,今天整体的分享就到这里了啊,谢谢大家,记得给提拔点个赞吧。

克拉的扣子开源了,我宣布国产 ai 工具将迎来新一波的升级。开个玩笑,昨天克拉扣子的开发因为一些失误,把元旦码放在网上了, 所以导致了变相的开源,但这个东西毕竟是当前最好的主流的 ai 编程工具,所以我对这个东西也特别的好奇。其实我一直很讨厌开源码,但是我之前因为做过一段时间的智能体平台,所以我对于它确实非常的好奇, 所以今天就跟大家分享一下我看到的一些信息。讲到智能体的话,一定会提到一个经典的环的理论,就比如说像厨师做饭一样的,他做完了菜之后,他一般会先尝一尝,看这个味道是否合适,比如说咸了还是淡了, 如果淡了,他可能会加一点盐,再接着炒,再试一下,那这个就是经典的还的理论,其实放到智能体平台也是一样的,智能体其实核心就是提示词工程, 他会通过各种样子的提示词,然后最终封装成一个非常大的问题,然后再去提问莫贤,你掉不掉这个工具?他如果说掉,那我就接着去把这个掉的结果再放在一起,再去提问莫贤,你掉不掉这个工具,莫贤说我不掉了,不掉了,那就结束了。 那如果他说掉呢?怎么办?那就再掉这个工具,再把这个工具的调用结果再放到这个信消息里面去,再去问魔心,你要不要掉工具?那他如果说还掉,那就再接着掉,那如果说他他说不掉了,我不掉了,那就结束了。 两者其实有非常大的一个相通之处。那卡拉 ok 的 具体优秀在哪个地方呢?这个是我从卡拉 ok 的 里面去拿出来的他的消息的内容,也就是说他再去询问 咨询意见的时候,他提供了非常多的工程化的内容,主要是包括三个部分,第一部分就是系统的提示词,第二部分就是他发送过去的消息,那第三个部分就是他工具的可使用的工具的列表。 系统的提示词里面它允许你去放一些永久的规则,包括你的身份定位,你的语言对话的风格,包括你全剧的一些行为, 比如说像它会是说你是一个 cloud code, 你 是一个有用的一个 ai 助手,那你再去调用这些东西的时候需要注意什么内容?或者是你的语气应 应该更简洁一点,还是怎么样子啊?我当前使用的系统是 windows 还是 linux? 或是是你当前在哪个?呃控制台里面还有包括消息,那消息里面可能更多的,比如说像对话的一些历史,当前用户的一些信息,包括附件或者是工具调用的一些结果。 举个例子,比如说像他上下文的一些内容,比如说他让要求你修改代码之前必须先看相关文件,或者是提交之前他要运行 npm test 之类的东西。那包括像 当前用户的消息就很简单,比如说用户说你要去帮我干一个什么样的事情,或者是我遇到一个什么样的一个问题。那还有一部分就是像附件工具调用的结果,他更多的会用一些系统提示这样的关键词来表示, 比如说你之前打开了什么文件,这个文件里面有什么样的一个内容,或者是你之前执行的什么样的一个工具?搜索除了一个某一个网页,那这个网页里面有什么样的一个内容? 这就是他提交过去的信息。那 tos 里面他可能更多都会放一些当前轮次他允许调用的内容,比如说我允许你去读文件,允许你去写文件,或者是说像你去做一些其他的一些动作。 这里面有一个非常有意思的一个点,我之前一直以为它的技能的调用,它会放在这个 tools 里面,相当于列一个列表,每个技能它对应的有一个单独的工具,其实不是它这个地方有个叫 skill 这个东西,它其实相当于你所有的技能对应的是同一个工具,这个地方它其实是动态的加载的。 比如说我这地方有一百个技能,那这个四他再去提交过去的时候,他可能会只提交了十个或者是二十个这样子。那这个也是为什么我们在使用到技能的时候, 并不是说技能越多越好的,他有可能你技能太多了之后,他并没有被调用到这个技能,也就是说他在动态加载的时候其实没有加载进去,那这个时候就会导致你其实白忙活,你加的你做了一千个技能放在那里面的其实没有被调用到, 那这个时候问题又来了,假如说我问了第一次问题之后,他会干什么事情?在我们举个例子,比如说他现在调用了一个工具,就拿我们之前说的那个 a i 写小说的工具,那这个时候他先调用了这个工具,那工具他第二轮再去发这个消息的时候,他就会补充一些信息。 比如说我那个工具里面会有大纲生成的这个东西,那生成的结果是什么?那比如说他执行了角色生成,那生成的结果是什么东西?他还是会封装一个这样很大的一个提示词,再去丢给模型,让他再去判断当前用户问的问题是什么东西。比如说我之前问的问题就是帮我去写一个小说, 那他现在已经生成了角色了,那照道理来说他接下来去干什么事情,这样子他就会一直往复的下去,那什么时候会结束这次循环?这里面其实 他有四种情况。第一种情况就是叫做没有工具调用的时候,这是他正常结束的一种 方式。我之前讲过的,我们在模型在交互的过程中,他一直是,比如说你有工具的调用,他一定会把这个工具调用了,然后把这个结果再塞回去,再去提问我,你接下来要做什么事情?如果没有他就结束了,如果有他会接着去调用, 那如果没有工具调用,它其实是一种正常结束的结果。那还有一种是循环次数的上限,还有一种是像 token 超额的这个上限,这两种其实是属于异常的这个中断其更多的是成本的限制。 但是我其实在 clockcode 的 源码里面没有看到具体的限制,比如说它这个循环次数的上限是多少,或者是像 token 线超限的这个限制是多少,也就说它这个东西可能会在环境里面去做配置,我不确定它是根据你的 vip 级别还是什么东西去做限制, 还有一种异常的中断,其实是用户主动的去打断。这种其实更好理解一点,因为有的时候我们等待时间太久了,我们可能会直接把它的这个命令给结束了, 这是一种。但是我看到我在跟 codex 去分析它的原码的时候,我们发现了一个很奇怪的一个特点,就是 codex 提到了有个叫自然收敛的这个东西,这个东西出现在什么情况?比如说你的对话的上下文特别长的时候,比如说我们在同一个窗口里面去跟 我们的 ai 工具进行了交互了太多次了之后,它会出现一个叫自然收敛的这个现象。我一直以为就是 code 的 提示词里面会有一些限制,比如说当用户的上下文过长或者是对话过长的时候, 他会主动的要求模型去把这次对话结束掉,所以模型到最后的时候会草草结尾,给你一个对应的结果。但是我们仔细分析了之后,并没有发现有相关的一些提示词,也就是说 cloud code 并没有去催着模型尽快结束这次对话, 反而他是在鼓励模型去思考更多。嗯,不要去急着去做总结,但是模型还是会出现这种自然收敛的这种情况,这种情况说起来就太长了,其实主要的问题是在于你调用工具的收益比不高了, 也就是说当模型他自主的去判断的时候,你这次工具的调用对他最终的这个结果没有太多的这个帮助,所以他就会自己觉得他已经掌握了足够的这个信息了, 他就会自己去做出总结这个动作,然后结束掉这次的对话,这是一个非常令人讨厌的行为。