今天淡淡的讲个大事,朋友们,你听说了吗?月之暗恋 kimi, 一个月前估值四十三亿美元,一个月后直接飙到一百二十亿美元,这涨速比我基金跌的还快。来,咱们盘盘这笔账。 去年底 idg 领投五个亿,估值四十三亿,账上躺着一百亿人民币,注意是人民币。结果刚过完年,阿里、腾讯这些老股东又追投了七亿多美元,两轮融资加起来超十二亿美元,创下近一年大模型行业最高纪录。杨紫玲 就是那位九零后清华学霸,创始人直接放话,我们不急着上市,先在一级市场把钱拿够,这 底气我酸了。 a k 二点五模型发布后二十天,收入直接超过二零二五全年,海外收入甚至反超国内。这波是墙内开花,墙外也香啊。 e p m。 也有凡尔赛的时候说他现在不搞当兵作战了,搞百人群哦,写代码,传个视频就行, 做 ppt, 丢篇论文进去。 excel 那 是基本功,但我基本功不太行,所以用这个职场人外挂懂得都懂。当然 timi 也不是没烦恼,用户太多,算力一度间歇性罢工,页面提示算力不足。这个场景是不是很像你老板跟你说预算不足。 最后说个冷知识,这些融资的钱怎么花?杨志玲就三个字,扩显卡。看来在 ai 圈显卡才是硬通货,比黄金还保值。所以你看 kimi, 这哪是融资,这是给 ai 行业打了一针肾上腺素。好了,我是但人,不但是的杰哥,大家在评论区聊聊,你觉得 kimi 值一百二十亿美元吗?关注我,了解 ai 新鲜事。
粉丝6获赞50

兄弟们,今天我终于花费巨资两百大洋,为大家深度的体验了一把 agent 集群模式,说实话让我有点失望,为什么呢?因为我要处理的主要是长文本的写作, 结果我花了差不多一个上午的时间,先给他去搜集整理了相关的文献,每个文献的大小不超过一百兆, 所以我呢,精心的选择了五十个文献,基本上覆盖到了论文写作的所有的方面。 我把它上传到这个对话框里面之后,然后我就给出了一段非常具体的指令, 后来就等了十来分钟,他终于给我生成了一篇一万七千多字的文章。但是他生成的文章有一个有趣的地方,就什么呢?他只能提供一个 txt 的 文档,而不能生成一个合格的 word。 当我把它复制粘贴到我的 word 里面去了之后,大家可以看一下,这就是在 kimi 二点五级群模式下所生成的一个文档,长度还是可以的哈,一万七千六百二十一字。 但是他的注视就让我有点抓狂了,他有这么多注视,但是只有注视的符号,却找不到任何一个注视, 后面虽然也附了参考文献,但是和注是完全不对应的,也就是说你还得重新给他注一遍,这不是让人抓狂是什么样?而且看他生成的这个文本呢, 有点像一个文献综述,缺乏论述的逻辑性和针对性。我们再来看它,之前是在 kimi 二点五 agent 普通模式下,这里有 kimi 二点五 agent 集群模式,还有 kimi 二点五 agent 普通模式, 我就是在这个普通模式下生成的。大家看一下这篇论文,它的注是和后面的参考文献是一一对应的,你们看 是吧?非常的具体。当然参考文献的数量呢,不好说,但是他全书有一万八千多字,注是有八十六个,而且每一个注呢都能对应到具体的这个参考文献上面去,这其实就给我们省了非常非常多的时间。 所以我感觉这个集群模式,可能对于我们这些想要用它来进行长文写作的,尤其进行科研写作的这些学者呢, 未必有什么大的价值,但是他最大用处可能在编程或者其他网站平台的搭建方面,在工作流的处理方面,可能在这些方面有令我们意想不到的效果。 当然我后期可能去体验一下,看看他还有一些什么特别宝藏的东西,也就当为大家提前去踩一下坑吧。

探击文明的秘密从来不是个人的智商,而是组织,包括分工协助规模化对于归机生命来说也是这样。 ai 发展到今天,我们见过薄纹墙记的模型,他们有着超大的上下文窗口,也见过深思熟虑的模型,他们有着超强的推理能力, 但是这些都还是天才,还处于单体智商的极限竞争。就在昨天, kimmy 发布了 k 二点五模型,并带来了一个名叫 agent swarm a 卷集群的重磅炸弹, 这个新的功能把国产 ai 推向了组织智能的新高度。先说 k 二点五,用一个关键词来概括这个模型的话,那就是全能。 怎么个全能法? k 二点五把视觉和文本对话和 a 卷调用,思考和非思考,所有你目前能想到的关键能力全都集中到了一个模型里边,而且在全能的情况下,他在各项评测当中都取得了极佳的表现。 另外你别忘了, k 二点五还是一款开元的模型,他在多项评测当中,由于 gpt 五点二 xhi, 但是成本只有对方的几分之一, openai 万亿美元的护城河又塌了一些。那么问题来了,模型的发展有那么那么多方向, kimi 为什么非要把所有的能力全都塞进一个模型呢?因为只有全能的模型,才能驱动得了最新的 a 卷集群功能,才能实现 kimi 在 这个阶段的野心。 我不知道 kimi 是 不是一开始就规划好的,但是你回过头来看的话,确实啊,它们的模型发展路径特别有一种 scale 三部曲的感觉。三部曲的第一阶段是 kimi 一 点零时期,那个时候模型的代表能力是 memory, ai 学会像人类一样去记忆。在这个阶段, kimi 卷的是长度,上下文的长度。第二阶段是 reason 和 tour use, ai 学会像人一样去思考和使用工具,尤其是在长城任务当中。在这个阶段, kimi 卷的是深度推理的深度。 前两个阶段提升的其实都是单体智商,但是啊,你要实现 agi, 光靠一个超级天才是不够的,你必须把一群的天才都给组织起来,有组织的智能才是文明,这才是 agi 要达到的高度。 于是第三阶段的 kimi 开始卷写作,也就是让 ai 自己组织 ai。 代表模型就是这次推出的 k 二点五。有了全能的 k 二点五,无论你需要什么样的子 a 卷,要并发多少个它都能实现,都能协调。我给你们演示一下就明白了。 第一个例子,我让 kimi 去所有主要学术和技术资源库做一次大规模的文献扫荡,然后识别并编目所有论文报告和官方文档。这个任务需要 kimi 具备极强的专业能力,否则你连找都找不着,更别提之后的整理了。 另外,因为是文献扫荡,所以工作量很大,很考验并行处理的能力。接到任务后, kimi 生成了四个子 agent, 分 别负责不同的渠道,比如 archive, github 等等。 每一个子 a 卷都交代了非常详细的要求,比如时间的范围、作者、主题、关键词等等。然后四个子 a 卷领了,任务就同时开工了。在主界面的下方,你可以看到他们的工作进度,点进去可以看到详情,知道他们进展到了哪一步。 当某一个子 agent 完工了,下方会有气泡提示,左边栏的进度条也会走满。当所有子 agent 都完成任务之后,一切都会汇总到主 agent 这边。它会整合所有搜索结果,开始创建最终的报告,包括可量化分析等等。 这个过程会涉及到文档的状写,也经常会需要编辑代码。还好背后的模型是 k 二点五,足够全能,否则根本不可能这么顺滑。当一切搞定之后,交付物会存在虚拟机的文件夹内,其中包括几十篇高质量文献,以及一份非常非常详尽的报告。 如果是人来干,且要在短时间完成的话,你肯定得来一个课题小组吧。刚才这个例子非常有代表性,因为几乎所有专业领域的人才实心都非常非常高,你要是想请他们帮你找找资料,做点分析,你得付出大的价钱。 那现在有了 kimi 的 a 卷集群,你就可以用算力换实心,只需要付出一点点的算力成本,你就可以让 ai 专家帮你干活,随叫随到,毫无怨言。 这个在以前是根本不敢想的。而且 kimi 的 a 卷集群可以处理高达一千五百轮的工具调用,在短时间内就能完成高负荷的工作。刚才的例子属于理工科的,咱们再来看一个文科的例子。 我希望 kimi 针对高达动画闪光的哈萨维的第一场战斗做一个拉片分析,也就是一帧一帧的拆解镜头语言。接到需求后, kimi 做了两件事。第一,生成 sub agent 一共有四个,分别是战斗分析师、视觉分析师、构图分析师和身份分析师。你看,从这四个分析师的配置就看得出来, kimi 对 这次的任务做了拆解,他知道要从哪几个方面切入,于是才有了战斗、视觉、构图和身份四个部分。第二,分配任务, 四个专业分析师同时开工并行工作,这样能保证效率。等他们都完成之后,主 agent 再进行整合,形成完整的拉片报告。 最终的报告还是挺有料的,包括对战况、节奏、试听语言的分析,尤其是还点到了导演的核心意图。这个特别棒,但是光有文字的分析好像还差点意思。我在想能不能加点配图呢?于是我让 kimi 创建表格形式的分析报告,并且附上手绘风格的分镜图。 这个就是全能模型的好处,当你需要图片的时候,他可以调用多模态的能力直接生成。 这种手绘的感觉还挺好的,不是吗?通过刚才的演示,你就知道什么叫真正的 a 卷集群。第一,它是角色涌现的。真正的 a 卷集群绝不是被程序员写死的流程图。过去两年,有无数的团队在做 multi agent system, 他们定义角色,设计流程,编写规则,但是这本质上还是人在组织。 ai 只是很初级的机群,只能做一些现性的任务。而 kimi 正在做的 a 卷机群是像人类社会一样,可以根据任务临时组建一支特种部队。 有的 a 卷负责看财报,有的 a 卷负责收新闻,有的 a 卷负责写代码。 a 卷永远跟随需求流动,它们欣赏得了动画,也看得懂 ai, 论文不会被锁死在固定的岗位上边。第二,它是三 d 编排的,以 minus wide research 为代表的 a 卷是二地并发的, 他让一百个实习生同时去搬砖,各干各的,最后再把结果堆在一起,只有分头,没有协助。而 kimi 的 a 卷集群拥有动态中继站, 他们可以在关键节点停下来交换信息,互相校准,然后再开始下一阶段的创作。有分工,也有对齐,所以我才说这是一种三 d 编排式的写作。 今天的 ai 面对的是更加复杂、更加通用的场景,靠单独的 a 卷不行,靠像预制菜一样的多 a 卷也不太灵, 真的需要因地制宜实时生成。所有角色分配、任务拆解都由 ai 在 现场及时决定。 对于用户来说,你拿到的不是一个更加聪明的模型,而是口袋里的字节跳动。对于 ai 这种归机生命来说,这是从天才进化到文明的开始。目前 a 卷集群功能还处于贝塔阶段,如果你是 kimi 会员的话,一定去试一试。 ok, 以上就是本期内容,想了解 ai, 想成为超级个体,想找到志同道合的人,就来我们 newtype 社群,那咱们下期见!

我觉得现在最适合用这个 oppo 靠的模型呢,实际上可能是阿里新推的这个服务啊,这个东西叫这个扣丁不烂是吧?呃,为什么呢? 就之前吧,就是续费了好几个这种模型,然后呢?你续的不多,但它其实用量还挺大的,你看昨天晚上我就大概一个小时,我就把 kimi 的 那个十五元的 top 的 额度也就一个小时我就用光了。 我算了算,调用其实也不多,但是因为你在欧风靠的调用和你日常对话的调用是不一样的。今天我想打算试试这个阿里云百炼,简单说一下这个东西怎么回事啊?他其实就是把几个常见的这个模型给打包了,打包了以后有一个专属的调用地址和专属的 api, 来看一下它的指南。它是这样的,整合了这些顶级模型,然后还兼容主流的编程工具,就比如说我们 用的那些 id 类类的工具哈。如果你要是正常调用,他有的时候会限制速度或者限制这限制,那如果你一定想使好的模型,要么你去买会员,要么去升级,是不是他通过固定的费用?其实我算了算,应该是还是挺便宜的,虽然不至于到这个可调用的一折,但还是挺便宜。 然后它现在有几个基础的模型啊?这个千万三点五过年的时候推出的,很牛。据说啊, kimi 呢,也是刚推出不久,然后 mini max 当时那阵刚推出的时候也火了一阵。 glm 那 个五现在可以对标,他说可以对标那个叫什么来着,那个很牛的那个。 然后它有更多的就是千万三的 max 模型,这也是版本挺新的,二六年一月二十三号的,然后加上这些小模型啊,这无所谓,就是我们理论上如果你的调用次数差不多,那么你根据你的任务来选择不同的有特色的模型就可以了, 尤其是千万的这个和 kimi 的 这个都支持。图片理解费用上啊,首月七块九,其实你看的挺便宜,对不对?然后这个高级套餐呢,是三十九块九,就真的是特别便宜,但是价格上你看啊,首月七块九,次月呢是二十,也就是说他的正价是四十块钱,第一个月呢是便宜,然后第二个月呢是五折,第三个月就是正价。 呃,我猜两个月以后可能在这种东西上可能会有更多的爆发。呃,其实现在我我印象里火山就有这种类似的这种打包的这种服务,但是呢,一呢他的价格不便宜,二是他好像我查了查,他没有明确的说他支持那个 oppo 扣,这个呢是明确的说了他支持这个 oppo 扣,然后即使是最贵的这种 两百每月,那也真的是不算贵,因为你如果真的深度用了,你把两百的额度都用光的时候,那我认为你值得在这个上面花更多的钱。然后那个那天我还看到论坛上就有一个人说我除了租房子吃饭和日常开销,我把所有的钱都用来买陶坑上,哈哈哈,其实这是很有意思一件事啊,我觉得真的挺贵的。 我,我查了查我的用量限制,我觉得我用的不算多,但是其实也不算少,我其实在很多工作上都是在在那个詹妮的那个网页上去完成的,因为很多时候你要做调查呀,做一些文本的生成啊,那些东西他那个 pro 的 版本就完全能搞定了,因为我有个 pro 的 版本,但是如果按照他这个标准, 每五小时一千两百次请求,我现在是达不到的,但不知道我买了这个套餐以后会不会达到哈,我回头再测一测。那我认为新手呢,你就花七块九加上二十块钱,先用两个月, 对吧?然后当你发现不够的时候,你去升级那个就可以了,你就直接干到二百一个月呢。其实也没啥,二百块钱一个月也就是个电话费吧。我现在已经买完了, 买完了以后呢?他现在剩余天数二十八天,我不知道他为什么是二十八天,明明买的是一个月对不对?这个是不是他的 bug 按照当月天数计算的?那你们要不要搞到下个月再买二十八天?你看他是按照这个算的,上个月的二十六号到下个月二十七号对不对? 这个就不对了,这个非常过分啊,明明是一个月,所以我打算提前使光呢,呵呵。然后我们获取了这个东西啊,它有专属的 api key, 然后呢,怎么配置啊?这里面说明,我们来找说明配置, 看 open 框中配置这些东西,实际上不要被它这种东西吓到,如果你的 open 框现在正好用的状态, 你就把这段命令考下来。怎么写啊?我这就写了,我现在咱说说怎么配置哈,就首先呢,第一步就是修改配置文件,哪个配置文件呢?就是这个东西啊,但是呢,我们在 open 里可以直接跟他说,这是我上面已经配置完了,我重新演示一遍怎么配置,就跟他说修改配置文件啊, 然后呢?把这句 copy 过来啊,这这段啊,把这段 copy 过来,然后你可以把你的 apk 呢替换到这,我懒得打码,我也就不替换,放到这。然后呢?就这样呢,这个命令就搞定了,你回车, 回车以后就是我刚才的配置,那我已经配置完了,他现在就告诉我有这些可以用的了,然后同时它底下呢,还有一段,你可以直接考过来, 然后站到这,然后回时它就会自动把你这些东西都改好。看到没变更的载药就是什么呢?它其实就是告诉你默认模型变成这个,主模型 变成这个,然后移除了原先的什么什么,这些,就移除了原先其他的所有模型,然后把其他都移除了,我还有钱在里面。其中我认为比较好的几个,特别好的四个主流四个模型就是 kimi 的 二点五,对吧? g m m 五, 然后迷你 max 的 二点五,这个也不错,迷你 max 二点五。我发现他好像在写程序上更有优势。也是这样的,我的感受上啊,因为他的代码他理解的更快更好。然后这个是个多模态模型。嗯, kimi 应该是多模态吧,我记着这两个是多模态模型,如果你需要用到图片处理,尤其是处理本机的图片的时候,这两个模型非常好。 到了这步你的七块九已经发挥作用啊。至于接下来怎么用,那其实还是靠大家去想象。我之前因为这个模型的用量问题,我现在想都给他背地里的任务, 我现在都给他加回去,加回去以后我看看他这个调用的数量到底能撑多久啊?我每天会监控他的用量,我把他这个用量记进去吧, 非常好。我觉得整体来说这下就算完事了,至少我这个月应该不会特别为掏坑的续费吧?因为每次他如果出问题的话,你很难发现,除非你里面充特别多的钱。

看到富盛在分享怎么让小龙虾整 token 的 视频,基本上我听完这条分享之后, 其实我的小龙虾就已经拥有了节省 token 的 能力了。我不知道大家能不能理解这件事情,当你看到知识的时候,其实你就已经拥有了知识,很有意思,这是可能在 ai 时代新的一种学习范式。其实这就是一个建 skill 的 过程, 我给大家演示一下,你现在这个界面是我自己 cloud 的 命令对话框,我现在就把不剩的视频的文案发给我的小龙虾,让他自己学,就用魔法打败魔法。现在我用的是 kimi, 我 们看一下,他现在已经学完了 脚本替代,我们现在是在用的多模型在用。我要问他,你能不能建 skill? 对 我而言,其实它应该属于一个简单任务, 米干活很糙的,就是他建好之后他也不跟我说个结果,所以我决定还是要让 cloud 看一下,我会更放心一点,怕是已经查出来一个严重 bug。 我 刚刚也是试测了,其实写 skill 这种事情还是需要博士生上的,现在 他问我要不要帮我来修复这些问题,那我就告诉他说,别,你先别干,因为不像很多人说你有了小龙虾你什么都不管了,不是那样子的,我觉得在定规则这个阶段还是要管的,他得了解你的工作习惯,了解你的标准。所以呢,我现在就会告诉他 不行,因为首先第一,我需要看到完整的规划,第二,你得明确告诉我,你什么时候来提醒我这个上下文需要 compress 了?你的标准是什么?你是到一百万 tock 的 时候,那钱都烧的不知道到哪去了,包括他要帮我去优化怎么选择模型,那我也会告诉他你都不知道我要处理什么任务,如何去分配。因为一开始那个 kimi 也是写的很离谱, 说让 kimi 帮我写代码,让 opas 帮我看图片,然后就神经病啊哈哈哈。相当于就是你找了一个错的人去干他不擅长的事,即使是 opas, 我 得需要让他 很清晰的把他准备怎么干他的计划先给我看,不然那完全就是一个黑箱子,他在里面搞东搞西你都不知道。所以我们把这个命令发出去,好像我们的反馈已经开始出来了。首先,必要的和不必要的可选的是什么?你看 他会告诉你压缩上下文出发条件是什么,提醒的形式是什么样的,你看这就很好,执行后费用可降低百分之五十到八十,包括责任务的分配,他会给我看到整个的执行流程,调度机制是怎么样的, 那我就心里很有数,现在这个 skill 已经开始在工作了,就刚就是我问他这个 talk manager 的 skill 有 没有已经在开始运作了,那你判断这是一个复杂问题还是简单问题? 你看 ai 就 咔咔咔咔就给我回答了一串,我套了一下他的话,我就套套说这个对话,你已经有开始按照我们的 token manager 这个 skill 开始判断模型了吗?就我的言下之意就是你是不是还在让我再烧 opus, 用很贵的模型在处理简单任务?刚刚还在讲,哼,你这个 skill 都没有好好工作, 结果你看人家说你说的对,但是我刚刚查了一圈,你现在用的模型其实已经是二点五了,也就是我们的这个 skill 其实已经在起作用了。它没有提醒我,但是它悄悄地已经把那个模型给我从 opus 换回了二点五。 接着提醒,现在这个对话窗口的上下文已经超了,那就问我要不要开始执行压缩,他已经开始按照 skill 制度自己在开始运作了。那我刚刚也看了一下后台的 a p i 的 消耗量,确实止血了,不像前几天那样真的让人血压飙升,所以 我们的这个 token manager 就是 谢谢富顺老师的贡献。如果你对这个 skill 感兴趣,也可以留意评论区,那我们下次分享见,拜拜。

kimi 二点五这个 a 镜头集群相当有东西啊!可能很多人对 kimi 的 印象停留在读报告和搜索上,但这个二点五 a 镜头集群出来,局面完全变了。 你一定要去试试,让他去帮你写一份你所在行业的调研报告。我做了个测试,我让 kimi 二点五和 notebook lm 同时调研国内 ai 行业的发展。我给了这么一份同样的提示词, 帮我深度调研国内 ai 和海外 ai 的 差距优势,追赶趋势,同时调研国内 ai 进入传统行业及降本增效的应用情况。 不到十分钟, kimi 在 调研了全网以后,给了我一份长达四十九页的详尽报告。而 note 和 lm 给的报告只有四页。 我用姐妹来作为中间裁判,以信息准确度、商业价值、风险预判等六个维度来评价这两份报告。结果根本没有悬念。无论在哪个维度, kimi 这份报告的质量那都是碾压级的存在。最让我震撼的是啥子? 是 kimi 整理的数据不仅是最新的,而且针对数据提出了非常深刻的分析见解,更扎力的来了 谷歌全家桶在 ppt 领域一直是王一般的存在。然而,我让 kimi 二点五和 notebook lm 根据之前的报告,生成一份用于阅读的 ppt。 从裁判的角度来看,除了在视觉层面有差距,其他方面都跟谷歌打得有来有回。这还要啥子自行车哦?

嘻嘻,我也开始养龙虾了,正在醒来试一下 kimi curl。 hello, 大家好,我是一个设计师,呵呵。呃,今天我也呃装了一个龙虾,然后就想国外的 open curl, 嗯,配置起来比较麻烦嘛,所以我就简单了呃,直接呃, 就是买了一个 kimi 月月套餐的会员一百九十九,所以就装了 kimi ko, 呃,当然我身边的朋友也有给我推荐推荐, 然后我我装的时候还是挺开心的,但是在做的时候我就发现他的问题好多呀,我本来我就想着我我就是他装的过程还挺简单的,就是一键就基本上就安装了,然后完了之后他不是需要关联一个企微,我弄了个企业微信,我想的还特别美, 我给我的企微就是整了四个机器人,然后有做设计的,做开发的,还有就是呃 ai 资讯的,还有理财的, 然后完了之后我就想让他就是呃跟那个 kimi, 然后连到一起,然后他们各做各的事情啊,就是就是多 a 整套并行任务,就这样子,然后折腾了一下午都没有折腾出来, 完了之后我就跑到了那个呃,就是官方那边去问他不是有专门的那个群吗?可以艾特 kimi 小 助理,然后我就问我说你们这个呃,怎么就是怎么就是能关联到四个,四个就是 ai 机器人,然后让他们就是并行任务,他说还不行 呃,一个账号只能关联一个 a 整他意思就是说你你你那个什么你的一个 kimi kra, 然后你关联呃,微信聊天,你只能关联一个机器人, 完了之后这个机器人你可以给他呃,就是安装很多 cues, 但是这样子不会很乱嘛?我本来我想的还挺美的,我就觉得,哎,我弄一个专门搞设计的,然后再弄一个专门搞开发的,然后再弄一个资讯一类的,理财一类的,然后我就是他的 ceo, 我 就让他给我去去去搞 没有搞好,搞明白没有搞出来,然后问了官方才知道他只能搞他的一个 kimi, curl 只能只能对接一个企业微信里面的机器人,这有啥意思啊?这跟那个我平时用呃 vs code 的 呀或者是 cloud code 的 做东西都差不多嘛, 就觉得没有任何用啊。完了之后,呃,我还科学上网,科学上网就是想想想,因为我经常看一些国外的那种呃跟技术或者是设计相关的一些视频嘛,比方说是 youtube 吧,我就给他了一个地址,我说你帮我汇总一下这个视频吧, 他还不能连到国外的网站,他他还连不上,对我就觉得他有什么意义啊,就觉得好坑呀, 反正,反正今天对那个 kimi ko 我 还挺失望的。嗯,完了之后他还不能,就是好像是云端的嘛,所以他不能访问我的本地电脑,我还说你帮我把下载里面的文件,因为我我电脑上面下载的那个文件夹就比较乱嘛。我说你帮我把那个下载的呃那个文件文件里面的那些东西规整一下, 然后也量不上,也规整不了。它既不可以呃多 a 整它并行任务,也不可以看外网的一些视频汇总,就说会呃,就是看外网的视频,然后把视频汇成汇总成 pdf, 然后还不能呃 访问本地,我就不知道它有啥用。然后就是能装个 skills。 那 现在很多大模型它可都可以装 skills, 然后完了再跟它聊天,我就, 哎还搞出来个可绕,我都不知道他可绕的是啥,好失望。我也不知道是我不会玩还是还是怎么样,就希望有懂的朋友能够指点迷津。谢谢。


大家直观的感受一下下一个阶段的某一种类型的 ai 产品,它可能是一种什么形态?比如说你有业务拓展,可能你需要找到一些需要贷款的企业, 我是重庆做中国银行负责贷款的经理,我需要拓展我的业务,需要在重庆去找到我的目标的客户,你需要帮我匹配一下贷款额度在一千万以内的这些企业大概都是什么样的类型,他们在重庆都分布在哪里?直接帮我找到他们, 不管是电话号码,他们的邮箱还有地址,他们公司的信息等等。我找到五十个,我说一下原理,他们自己搞了一个虚拟的电脑,你可以理解为刚才的这段指令,你是嫁给了一个人,他需要自己上电脑上去找你这些信息去。 可能这个活这五十家企业他得找一天,有可能找一周。那像 agent, 现在他在做的事情其实就是基于你一个比较模糊的目标,在进行自我推理, 自己去研究这事该怎么干,然后去验证,去执行。执行的过程当中如果是不通过返回来重新再去迭代,再去验证, 然后也就意味着什么呢?那你作为负责贷款的经理,你肯定有不同类型的工作,就是一系列需要去进行某种推理,把这个工作完成得去执行。按理论上来讲, ai 的 形态就是这种叫 agent 的 形态,它就是在逐渐的干这个事情, 这一套下来大概是三千积分,一百块钱招助理,假如说是三千五四千,把这个钱你充给他,一个月的活可能一周就干完了。

二零二五年, agint 成为了 ai 的 主流形态,模型开始会规划、拆解任务,自己调用工具。但当问题变得复杂时,再强的 agint 也只能同时思考有限的事情。本质上它仍然是一个单体智能, 但复杂问题从来不是靠一个大脑就能解决的。就像人类文明的跃迁,靠的不只是更聪明的人,还需要分工和写作。 ai 已经足够聪明,所以 ai 的 下一步进化方向很可能不再是更强的单体 agent, 而是让多个 agent 协同工作,形成真正的 agent 的 集群。我们已经看到各个大模型厂商在新一代大模型中探索落地这种多 agent 的 写作模式。比如 cloud code 的 agent teams, 它允许多个 cloud agent 像一个团队一样, 在一个项目上并行工作,每个 agent 负责自己的任务部分,并且能直接互相沟通和协调,压缩传统串行工作所需时间。 国内的 kimi 大 模型甚至更早就开始探索多 agent 的 方案,在大模型训练的时候就引入了并行设计能力,在这个基础上推出了 agent swarm 功能 open ai, 在 gpt 五点三 codex 相关的文章里也暗示了下一步 agent 迭代将朝着多 agent 的 交互上做努力。那么问题就来了, agent teams 和 agent swarm 的 区别是什么?和 sub agents 有 什么区别?我们先从单 agent 的 情况说起。 从单 agent 到 agent teams, 我 们知道 cloud code 最基础的功能就是在一个窗口上让一个 cloud agent 替你干活,如果有多个任务,就在一个窗口里依次串行执行,但这样所有对话都挤在一个聊天框里,有上下文过长的问题, 所以我们一般会自己拆分任务,手动开多个窗口并行执行。但这样要是各个窗口改动出现冲突,就需要自己手动和代码。 于是 cloud code 又引入了 sub agents 功能,通过一个主 agent 来控制多个子 agent 的 工作,效果上相当于让主 agent 替你开多个子窗口,独立进行执行,最后由它来自动汇总结果。 但子 agent 之间没法直接交流,所以更适合改动相对独立、偶合较少的任务。于是 cloud code 又又引入了 agent teams。 在 agent teams 里,依然有一个主 agent 的 角色,他将任务通过共享任务清单的形式把任务给到各个子 agent, 子 agent 并行申领并执行任务,并且可以互相通信,这样多 agent 间协作可以更紧密。 agent teams 实测大概原理懂了,我们用一个实际例子看一下 agent teams 的 工作流程。我们先执行 cloud update, 确保 cloud code 是 最新版本。然后在 cloud settings 点 json 文件里将 team 相关的环境变量打开。在 cloud code 输入框里提到 agent team 关键词就可以触发相关功能。 比如使用 agent team 创建多个 agent, 从不同角度讨论二零二六年还适不适合在上海买房, cloud code 就 会创建多个 agent, 并行的从不同角度去做头脑风暴。最后给出一份讨论结果看起来挺好,但我认为短期内它依然只能是个实验性功能,因为它有两个比较严重的问题, 首先是 token 量爆炸。 sub agent 方案里,子 agent 会把执行上下文总结后返回给主 agent, 所以 上下文长度更可控。而在 agent 的 teams 里,则会让所有子 agent 的 共享上下文,每个 agent 的 每一轮提示词都要包含所有 agent 的 历史消息,任务越往后,执行。 agent 的 的历史消 息任务越往后,执行。 agent 的 成员通常在任务开始时就根据角色定下来了,很难在任务中途根据工作量动态扩容。 比如,我一直想做一个关于硅基文明简史的话题,讲述从二进制到计算机,再到 transformer 等一系列推动 ai 发展的一百个事件。 它分成几个阶段任务。首先是需要一位研究员收集人类历史出现过哪些关键事件,审核员筛选事件 图片生成源,生成一百张图片,图片审核员教演图片风格是否一致,再让 ui 设计师生成网页风格。最后才是给程序员开发网页。 这个例子中, agent team 只会创建六个 agent, 尤其是在图片生成阶段,可能还是由那一个图片生成员慢慢画一百张图,他不会因为发现任务量大,就临时裂变出多个 agent 同时开工。那有方案可以解决上面提到的两个问题吗?有。让我没想到的是,国内的 kimi agent swarm 把问题给解决了。 kimi agent swarm 功能实测,我们先来看一下执行效果,再了解下 kimi agent swarm 和 agent teams 的 区别。先将上面提到的归机文明简史任务描述粘贴到 kimi 下拉框,选择 agent swarm 执行, kimi 会启动一个叫 kimi's computer 的 虚拟机, kimi k 二点五会作为主 agent, 像项目经理一样,将复杂任务拆分成多个步骤的子任务,并现场决策生成六个子 agent, 每个子 agent 只负责这一个阶段子任务的上下文,这样 agent 的 上下文更短,注意力更聚焦,可以大大降低幻觉和出错概率。 点击每个 agent 都能看到它对应的照片和角色描述,就像一个电子员工一样。其中,研究员会在互联网上发起多轮搜索,从国内知名技术资讯站点获得几千条搜索结果,再从里面筛选出一百三十八个候选事件,生成一个 md 格式的结果文档交付给审核员。点击底部的 all files, 可以找到这个结果文件。点击查看文件内容,可以看到研究员已经将收集的内容按年代进行排序,并给出事件的历史意义。审核员淘汰三十八个,留下一百个真正改变世界的技术。以 md 文档格式给到图片生成员, 图片生成员拿到审核员筛选过的文件内容后, kimi k 二点五发现多张图片。生成一百张图片的任务时间会很长,于是将子任务进一步拆分成五个小批次,临时创建五个新的子 agent 并行去执行生图任务。 比起单个 agent 挨个串行执行任务改成并行之后,任务的实际运行时间会明显变短。 点击列表里的任务,可以看到每个任务的具体执行情况。注意看,这里面会有一些失败和报错, a 警的内部会不断调整策略,重试并最终完成子任务。 这要是在传统多个单体的 a 警的架构中,一个 a 警的内部报错,就算内部有重试,也会大大增加执行耗时。而 a 警的 swarm 架构中,局部任务的失败并不会严重影响大局,这样系统稳定性更高。之后经过图片审核员、 ui 设计师和程序员的写作完成了网页可以看到,网页按时间线给出了每个年代影响 ai 的 重要事件,且美术风格一致。 kimi agent swarm 通过多个 agent 的 互相协助,只花了几分钟时间就完成了我可能需要花一天甚至几天才能完成的任务。 agent teams 和 kimi agent swarm 的 区别最后总结下 kimi agent swarm 和 agent teams 的 差异。首先是架构逻辑不同, kimi agent swarm 逻辑上更接近 sub agents 的 增强版。 子 agent 之间上下文物理隔离,只负责局部的子,任务生产的中间结果会被总结后再返回给主 agent, 这样既保证了任务聚焦,又把 token 消耗压到了最低。 其次,支持动态并行。 kimi k 二点五在训练时引入了并行代理,强化学习技术,也就是 p a r l, 这让他具备了动态编排的能力。他像一个聪明的项目经理,能根据工作量现场摇人,比如身徒任务多,他会动态创建几十个 a g 的 并行跑,效率能比传统串行提升四倍以上。 最后是集成度不同, cloud code 更像是一个程序员的专业工具。想用好 a g 的 teams, 你 需要自己配环境,安装各种 skills。 而 kimi agent swarm 自带 kimi's computer 虚拟机,申图、搜索、写代码、运行网页,全是开箱即用,对普通用户来说更友好。从单体智能到群体协助, ai 正在复刻人类文明的跃迁路径,不是更聪明的大脑,而是更聪明的协助。 当无数 a 警特学会像团队一样并肩作战、分工配合, ai 就 不再是工具,而是队友,而这可能才是通往通用人工智能的真正基点。现在大家通了吗? 好了,如果你觉得这期视频对你有帮助,记得转发给你那不成器的兄弟,文字版的笔记见评论区,这里是小白的 bug, 我 们聚焦一切可能影响人类历史进程的技术,如果你感兴趣,记得关注我们,下期见!嘟嘟嘟嘟嘟。

你现在看到的不是游戏画面,这密密麻麻的六边形蜂窝是成群结队的 ai 大军,每一个格子都是一个正在干活的 ai agent。 点开它,你就能看到他正在思考,正在执行任务。这个项目看得我头皮发麻。他叫 vibecraft, 一个开源项目,灵感来自于 starcraft, 相当于我们变成了一群 aia 卷子的指挥官。这种工具的诞生是一个重要信号,单打独斗的 ai 已经不够用了,我们要开始指挥 ai 军团了。 二六年会出现很多 mote agent 产品,在一个任务上增加 agent 的数量,就会成为新的 skating low。 比如刚发布的 kimik 二点五基于模型的能力,就添加了一个 bata 功能 agent swarm。 swarm 的原意是指蜂群啊,一只蜜蜂是很渺小的,但一群蜜蜂就诞生了超级的智慧。去年七月, minus 推出过一 主打广度的 wide research 功能,对标的是 open ai 的 deeper research。 他预先定义了一套固定的多智能体流程,先任务拆分,再多 agent 并行,最后汇总处理。并且每个子 agent 都扮演相同的角色,比如三十个调查员各自去负责调研一支股票。 而 kimi 用了一种新的方式,把 motiage 的能力做到了模型层面。 k 二点五模型在 agent 集群环境中进行了专门的强化学习训练, 这就使得他更为灵活,没有预设的规则,都是由模型自行判断如何拆解任务,使用更加多样化的角色。例如同时派出数据分析师、多方分析师、空方分析师分别收集资料,再让一个转稿人汇总写文章,再让三十个画师并行生成配图。 从 b h mark 来看,这种模式有效的可怕,在众多评测中都取得了当前最佳的表现,并且效率和性能大幅 领先于之前的单一 agent 模式。来看一个具体的案例啊, program 的神作,如何做出一件伟大的事是我最喜欢的文章,我想把它做成中文的视频,要 ai 帮我做一百个分镜图片, 原本我人工制作的话呢,先要对文章做手术刀级别的分割和理解啊,分成一百份,再设计统一的美术风格,然后为每一段话设计分镜画面,再一张一张去生成图片,最后整理成一个图文交错的文档,即便有 ai 的辅助,我一整天都是做不完。 我试着把这个任务扔给 aj 双,接下来的一幕啊,堪称视觉盛宴。他直接创建三个子 aj, 翻译官、导演和画面描述师,每个人还有姓名,甚至有工牌,翻过来还可以看到他们的职位描述。三个人通地合作,写出了一份文档,包含角色设计,一百个分镜的描述以及视觉风格。 注意看啊,接下来就要生成一百张图片了,他创建了五位画师,五个人同时开工,每个人负责二十张图。这就是使我们的高吞吐量优势,不需要像传统的单体 ag 那样串形处理,一个一个任务浪费时间,而是大家一起上,效率倍增。 在过程中呢,我就发现意外发生了啊,有一个画师 a 卷报错了,如果是传统单体 a 卷层,一个地方报错,就会堵塞整体的执行,反复试错,最后甚至导致整个任务的失败。但所有的架构中啊,局部的失败不会影响全局,有更强的鲁棒型。 不止如此,啊,这种分布式的群体智能,由于每一个单点都有自己的智慧,整个系统就有很强的自我修复能力。在刚才我们这个报错案例中,子 aginten 自行尝试了不同的方案解决了报错。一百张分镜图生成完后,全部存在了文件系统里,可以一键下载下来。还没完啊,一个 web 开发 agent 登场,用之前的所有资产制作成网页。一百张分镜,完美和台词对应,且风格一致。比如啊,开头第一段分镜就带有大标题, how to do great work。 给视频一个华丽的开场。当文案提到要选择一个领域的时候呢,分镜就展示了四条不同的选择路径。 在结尾的升华中出现了一句,为什么不能是你呢?封禁也充满了希望感,并且把 why not you 写在了画面上。 回看整个过程啊,我只是输入了简短的指令,然后他自行组建了一支团队,干了一个多小时,完成了我一天的工作量。并且呢,我过去没有在任何 agond 上一次性完成过这个任务。 但是啊,这个案例只创建了不到十个 agent 小团队而已啊,不够恐怖。 agent swarm 能创建的 agent 数量可以到非常夸张的规模。比如啊,我把巴菲特股东 信的网站发给他,要求他下载每一封信,逐个翻译,从几十封信中总结出投资经验。他创建了六十个 agent, 每个负责一封股东信,最多的时候有三十二个 agent 并行工作。更有意思的来了,那个总指挥官 agent 找到了连我都没注意到的 bug。 巴菲特从六五年就开始写股东信,但我发给 ai 的那个网站,只有七七年之后的信件,资料不全啊。他立刻只派新的 agent, 全网搜索,把缺失的补齐。这要放在传统的单体 agent 里啊,他脑子里就装满了各种不同的信息,又要规划任务,又要翻译信件,很难意识到 bug 的存在。 这就体现了 agentsworm 另一个优势,把认知负载分散到多个 agent 里,每个 agent 专门负责一部分任务,占用 contacts 更少,注意力更聚焦。比如指挥官不读信,只管人。每个手下呢,也 只专注于自己负责的信件,没有无关的信息,始终是头脑清醒,可以极大降低幻觉和出错的可能性。最终呢,他不仅给我提供了六十封巴菲特股东信的中文版,还写了一份精华总结,都可以去出一本书了。当然啊,所往不仅仅是人多力量大,还有更进阶的玩法,多角色的互相制衡。 比如说最近白银疯涨,我很好奇这什么情况,还能涨多久?我就希望有多个 ai, 从不同角度互相辩论。这种需求给到单体 ai, 只能自己跟自己左右互搏,像精神分裂一样。 在 sumdi 啊,直接创建了三个子 aagent, 数据分析师,写代码,抓数据,看多派找上涨的理由,看空派找下跌的风险。三个人分头行动,互不干扰,然后转稿人负责汇总。这还不够啊,最关键的角色来了,审稿人每一个数 据他都要核查来源,每一个观点他都要验证逻辑。这又是 swarm 的一大优势啊,通过多 agent 交叉验证,降低幻觉。 最后一个和我一样的长发小哥, a 卷者,负责前端开发,把这一大堆的文件做成一个可交互的网站,有图有表,有理有据。这就是所谓的集思广演,集体的智慧,把玄学的 ai 变成了科学。 那在大量测试后,我认为啊 kimik 二点五的 agent swarm 不是以前那种几个月一次的模型小步迭代,而是让大模型跨入了一个新的阶段, 协作被刻进了大模型的脑子里。在我测试的很多任务中,已经超出了节省时间、提升效率的范畴,而是拓宽了我的能力,让我做到原本不可能的事。例如啊,调研前一百的科技股在总结规律,单一的模型很难完成这么长的任务,就算我作为人类亲自出马,给我充足的时间, 也很难把一百个公司的信息摊开在面前去总结。规律并行让效率更高,分工让专业化更强,分脑让注意力更集中,互相制衡让幻觉更少, 分布式的结构让容错更高。一个人再全能,也无法独自把火箭送上太空。伟大的奇迹从来都是协作的产物。

curse 发布了 composer two, 这个呢,是前段时间业界蛮大的新闻了。据说呢,在编程领域,这个模型呢,超越 cloud, 但是今天产生了二十四小时的反转。因为开发者 finn 在 调试 cursor 的 api 时候呢, 截获了一个模型 id, 上面写的是 kimi k two point five r l 零三幺七。字面上意思呢,就是 kimi 二点五的强化学习的版本,是三月十七日星期的一个代号了。结果呢,约战面的御讯联盟负责人杜玉伦呢,在 x 上发起 书 composer two the tokenizer 和 kimi 完全一致,并直接质问 kirsten 联合创始人 michael trail 为何不遵循许可协议,也没有支付费用。就连马斯克也唯恐天下不乱说 yeah, it's kimi two point five 越拆面呢,因为他那边也在融资嘛。这个消息呢,对他们来说,与其去责怪 kirsten, 可能更有价值的是变成自己的背书。所以很快呢,他就删除了之前的指控帖子, 改为祝贺 kimi 发布了 composer two 声明。我们很自豪看到 kimi two point five 提供了基础,并澄清 kimi 呢,通过 fireworks ai 平台访问 kimi 二点五属于授权商业合作。那 kimi 呢,也跟进回应。那个创始人阿曼三个解释团队呢,对多个基座模型进行了评估, kimi k 二点五呢,是最强的,他说的评估叫做 populous evaluation, 就是 混合度评估, 就是增加一些无效信息,看是否会很有意思。当然了, kimi 团队也提出,他们在 continuous pre training 就 继续一系列和 r, 就是 强化学习上面呢,发挥了四倍以上的战力的规模。 四倍以上呢,其实我也没有完全理解什么意思是用了预训练的四倍以上的算力呢?还用什么?如果是强化学习的话,其实是不需要大规模的语料,所以呢,这个四倍我觉得是有待考究的,因为四倍的强化学习对比预训练强化学习,目前以我们的理解呢,是很大规模的强化学习了,不像是后训练公司能做的事情。 这个事情呢,其实从某个层面上也看出 curser 这家公司的一个尴尬的境地,因为一般来说,一个 a 家公司会看自己的应用和模型。从应用来说呢,其实 curser 呢,已经遇到了很多的挑战,无论是跟它完全一样的 cloud code, 还是 get 它 compiled, 还包括在目前的编程的范式上升级的类似 minus 的 编程能力,类似基于 open cloud 的 这种通过沟通聊天进行编程。所以呢,本身从应用层面的科学上其实受到了很大的影响。我个人认为最大的范式变化就是 open cloud 带来的以聊天开启的面向所有人的这种编程的范式。那从能力来看呢,目 目前 curser 只具备候训员能力,而且呢,候训员这个过程呢,其实非常依赖国产的太原模型,所以对于这一家年收入超过二十亿美元,估值两百九十三亿美元的入股公司来说呢,面临的挑战非常大,无论是从应用测还是能力测, 都严重依赖比它更低的类似 kimi 这样的模型公司。所以呢,目前的 curser 的 估值在目前的市场环境下也很难持续性的维系。 稍微再补充一下,实际上呢,从另外角度来说,后训练呢,其实并不是一个可耻的事情,过去的几年,大部分的模型公司都不会从零开始预训练,这部分呢,占比呢,从成本来看是很高的,但是呢,效果呢,其实已经没有明显的提升了,所谓的 continuous pro training 呢,其实更多的是在与料层面增加更多相关的内容。而 后续呢,其实作为所有的模型也好应用公司来说,其实是一个能快速起效果的,能在自己的场景里形成壁垒的重要的一个组成部分。那这个组成部分呢,实际上从对数据的需求,对算力的需求来说呢,对比一家从零开始建设的运行公司来说,是一个很小的规模, 对整个的模型公司的价值的元素和投入成本呢,在目前的情景中呢,也在快速的产生变化。那对于很多的有后勤人员的,有应用场景的,尤其是在自己的专业领域里面逐步深挖的 ai 公司来说,更好的选择呢,其实是应该是从后勤员到用户数据,通过资源的模型呢,去摆脱对人的高价 api 的 依赖,从而呢, 能让自己的财报上显示更高比例的毛利。从这个层面上来说,我也认为科斯目前做这件事情既是必然的,也是对公司具有战略性价值的。

昨天关于公积金贷款额度,只给大家讲了最高限是多少,但是没有给大家讲具体的贷款额度是如何计算的,他有两个公式,两个公式是取,嗯,最小值哈,嗯,公式一呢,就是按夫妻双方的嗯,还贷能力, 嗯,怎么计算的呢?就是夫妻双方近六个月,嗯,公积金,嗯,月交存基数, 然后乘以百分之六十,再乘以贷款年限折合成月。 如果你是贷十年,那就是乘以一百二,如果是贷二十年,就是乘以二百四,贷三十年的话,就是乘以三百六,再减掉夫妻双方负债的金额,这是一个算式。另一个公式是夫妻 双方公积金账户余额之合乘以二十倍。借款人夫妻双方嗯,公积金账户 之合的余额如果小于一万,按一万计,也就是说最低这个其贷额度是二十万。 但是你不要认为你的贷款额度最低就能贷二十万了,他是和上面那一个公式取最小值。具体的计算公式放到评论区下方,大家自己可以实际自己算一算。记得点赞加关注!

什么?工行建行只需要一千块钱就能激活百万预审批?这个方法银行永远都不会告诉你的。 我是老木,专讲贷款必坑!很多人以为想要额度就要存大钱买理财,其实恰恰相反,大额理财别在银行买,手续费高,小额用来养只需要一千到两千块钱就够了。怎么养? 工行建行买上七天的短期低风险理财,放七天取出来再买进去,反复的倒。你做的不是理财,是提升银行的 aum 值, 那 aum 值一上去,你的信用等级预审批额度直接就被激活了。我去年十二月的时候啥也没有,哎,今年一月份的时候,建行预审批直接出了三十万,这就是银行的真实逻辑。点个关注,下期告诉你具体怎么操作,记得点赞关注哦!

a 诊的技术的进展好像天天都应接不暇,前几周大家在晒 skills, 这两天又有 cloud bot, 所以 我在想呢,能不能尝试自己搭建个人 a 诊的工作助理? 我的需求呢,是让 ai 基于本地的知识库帮我做一些案头整理的工作,比如说 excel 填写,自动生成工作报表,以及根据我工作长期的上下文呢,主动提醒一些工作节点,比如说最近我们可以借某个政策和某位专家去做一个交流。 我没有编程的基础,尝试了三个工具,腾讯的艾玛、字节的扣子和字节的 treo。 首先是腾讯的艾玛,它是一个很好的个人知识库的产品,我们可以很方便的录入各种 word, pdf, excel, 还有公众账号都可以一键导入,但是因为它暂时没有办法调用其他的一些 api 和工具的接口,所以说执行不了更复杂独特的工作流,它就是一个专属于我们个人聪明的大脑。 第二个呢,是字节的 cos, 呃,号称零代码,可以搭建个人的 a 阵的工具界面确实是比较友好的,分为开发智能体、工作流、网页等等。针对每一个类型呢,已经先制了一些模块,我们主要 主要去上传内容就可以。比如说 a 阵呢,他会让你选择智能体调用哪个模型,是什么样的人设,什么样的回复逻辑,上传什么样的插件,工作流,文本表格、照片记忆等等。 但是我在上传这个资料录入就发生了问题,我上传的 excel 表格呢,机器就报错。呃,请教了一下程序员呢,原来是这个 excel 表格的内容,因为它同一个页面有两个表头,所以机器就不知道该怎么识别, 我只好对这个内容去做了改正,之后,机器就识别了。所以说 ai 都是有数据洁癖的,我们得具备程序员的逻辑,去做格式的转换,处理一些不规则的数据。 然后第二个呢,就是我想搭建一个工作日报的一个 skills, 我 需要告诉 ai 数据从哪儿来,怎么总结,发给谁,存在哪儿,结果就卡在了企业微信接口的这个步骤,因为我的大部分的工作是发生在企业微信的这个工具上的。 呃,这个就是一个现实的信息接口的问题。还有一点焦虑呢,就是这些敏感的数据发布到 a 诊的之后呢,会不会有一些不安全? 第三个适用的工具就是 treo, 这个呢,嗯,就没有一些模块的限制了,纯粹是自然语言去编程。在这个里面呢,我先做了一个简单的指令,写一个外部程序,用于展示当前目录下的某个 excel 文档的内容。结果呢,机器就返回 pixie 命令,执行失败, 它需要创建一个简单的 pc 服务器的脚本,然后运行它,我只能恢复好的,然后把权限给他,然后看到 ai 一 直在的 bug。 所以 对于零代码基础的人呢,还是有一定的门槛的,因为之前确实不知道开发环境之类的这首要素。 嗯,然后这几天又出现了这个 cloud boot, 它看上去像是一个终极的解决方案啊,彻底放权给电脑。所以很多极客为了去执行 cloud boot, 又新买了苹果的 mate 麦克。 但是在这个实践的过程中呢,我周边的程序员也讲,呃,还是有很多 bug 的, 可能昨天搭建好了,今天又不能用了,以及非常贵,每天要调用大量的头啃。呃,有一个朋友一天花了四百刀, 所以说呢个人的 a 阵的助理呢,如果说有一百米的话,最后十米现在还是很重要的。嗯, 第一个涉及到权限到底怎么给,给少了是残废,给多了容易出 bug。 以及这个个人的工作流呢,哪怕是一个月报,也需要比保姆还细致的一些指令。所以说实验下来呢,我觉得,嗯, 虽然暂时没有办法一步到位啊,但是我们还是先从一些抓取信息流的这种小的工作 skill 开始,虽然说有很多坑,但是能看到未来的一些边界的,这个感觉呢,还是很好的。