kimi 这次是真的杀疯了!新出的 kimi code c l i 压根不是那种他给你建议你负责复制粘贴的普通机器人,而是一个能直接获取授权,在你电脑上真正动手的智能 agent。 自己写代码,自己跑命令,自己修 bug。 以前你是给 ai 打下手,现在它是你的全自动编程搭档。想让它入职你的电脑?先划重点,它基于最新的 k 二点五模型,硬性要求开放三点一三环境。很多人电脑里的开放还是老古 懂版本万升级绝对会把电脑搞崩。我的亲测建议直接用 server bay, 它能一键开启隔离环境,瞬间搞定。开放三点一三既满足 kini 的 要求,又完全不污染本机系统主打一个干净又卫生 终端输入, p p install kini 杠 c l i 回车安装。 接下来有个巨大的坑,一定要听劝!输入 logo 后会出现三个选项, 选项一是尊贵付费版,咱今天主打一个薅羊毛体验版,选二或三,接着去官网生成 api key, 重点提醒,这个 key 只显示一次,我第一次随手关了网页,结果只能重来,巨麻烦! 所以生成的瞬间赶紧复制,马上切回终端粘贴。最后模型选最新的 k 二点五思考模式选关闭。做完这些,你的全自动打工人就正式上岗了! 从今天起,把写代码的累活全甩给他!记得点赞关注哦!
粉丝16获赞151

最近 kimi 更新了一个很惊艳的功能,就叫做 a d 的 鸡群,今天我们就带着大家用几个任务来看一看这个 a d 的 鸡群到底给我们带来了哪些新的体验。首先我先说一点,咱们这个视频不会讲任何的这种概念或者参数的东西,我们就用几个真实的任务来看一看他到底能不能真正来帮我们解决问题。 测的标准只有三个,第一个呢,就看他是不是是鸡群的概念,他是病情还在串起,串起他们就排队来做任务,一个一个完成病情的多个 a d, 它同时在执行。第二个就是他对生产的效果到底可不可以交付,能不能够直接应用到生产力。第三个就他上手到底难不难,我之前没有接触过,我能不能直接用? ok, 首先我们先让他做一个调研,去搜集一百个科技类的油管的博主,然后粉丝数需要大于等于五十万, 直接整理成咱们很常见的这种 excel 表格。我大概提了一些要求,我说每位博主必须要包含这种频道粉丝数或者主要内容方向,还有近三个月的热门的视频主题,还有大概的合作的报价区间,包括按粉丝数从高到低的排序,就相当于给他提一个大概的这种要求,我们看一下他执行的这个效果怎么样的。 ok, 我们运行一下,我们这会能看到他这边已经开始去编辑代办的这个清单,包括搜集搜集博主的信息,整理博主的数据,然后按粉丝排序,最终生成结果生成的 excel 表格。他这个规划已经出来了,我们这边可以看到他开始搜集大量的网页归类的信息,现在他应该是在分派任务,你可以看到他在创建各个助手, 我们看到他大概分了四个并行的任务,相当于他是分成了多批来完成这个搜集,每一批二十五个,你看每一个都是二十五个,第一个二十五个,第三个也是二十五个,第三个也是二十五个。而不是说让一个 一个 a 进的同时搜集一百个,那这样相当于他速度会快很多,起码快了四倍,对不对?之前可能我一百个外花四分钟,那现在我四个 a 进的同时在搜集,那我可能一分钟就搞定了。 我们这会可以看到咱们的这四个员工,每一个员工都按照自己的任务开始去执行。就真的很像我们的员工,有时候他做事他就比较慢,但是做的比较慢的可能做的比较好,有的做的比较快,可能做的质量一般,当然也有咱们做的又快又好,你看这个行知的应他已经执行完了, 我们可以看到他这边二十五位粉丝数大于五十万的邮件的主要内容方向,还有他预估的合作报价的区间,他已经全部出来了, 当然还有三位还在加油做,还没做完。所以 a d 的 齐全的意义,他不在于说他有能力更强或更聪明,而是他在一个更多的手,更多能够并行的这种方式来加快我们完成任务的效率。对,这就有点像你,现在你是一个人在带着四个员工在干这个事,我们现在需要找到一百个信息,好,接下来每个人二十五个,你们去做就好了, 是不是有种这样的感觉? ok, 已经结束了,我们能看到他们显示已经搜集到了一百位科技类油管博主的信息,现在更新任务状态,我们看他现在的新的大概是什么。第一步已经结束了,第二类就整理把所有的信息,这个数据按照咱们要求的这个次段整理排列一下。 当然还有后两步,按粉丝数排序,并评估合作的优先级,以及最终生成一个表格,后两个还没有执行。现在是第二个阶段,在整理博主的数据,把他自己写了一个 person 代码在执行。实际上在这个过程中我们应该能够看到 ai 在 某些场景下真正的价值,并不是说它只能,它只是个回答问题的工具, 而是他能把你想做的一些工作,比如说就我们常说的什么脏活累活,他全部都能帮你干掉你。像现在你搜集一百个博主的信息,那谁是个重复的一个动作,就是一个相对机械式的,但是又带有一点主观决策意识的动作,那现在 ai 就 可以执行的很好。 ok, 我 们这边已经看到他已经生成了,其实我已经成功完成了一百科技类油管博主的调研,变成你成了可直接使用的 excel 表调研。首付一百位,粉丝数的范围是二百二十五万到七千一百六十万,平均的粉丝数是九百三十二万,所有博主粉丝数均大于等于五十万。 合作的 u 片级比较高的是十八位,占占百分之十八。合作 u 片级是中等的三十位,比较低的是五十二位。那这里我们就看到了,按照我们的需求,他已经把我们需要的一百位有馆博主,包括他们的粉丝数排名和六个方向这三个视频的主题, 合作的报价,这些已经出来了判断依据,为什么是高,为什么是低,他已经全部就出来了。正常而言,你会发现你按照这个逻辑,你可能要一个小时,但是你用一个机群的这种逻辑,可能就是几分钟就可以搞定了。 第二个案例,我们尝试来做一个所有打工人都躲开一个东西,叫数值报告,一整年的工作日记、周报项目记录。我们给到 kimi, 看他能不能帮我们提炼出我们的成果,讲出我们到底在干什么,而不是说给我们堆流水账。我们这边又爱生成一整套虚拟的这个工作的资料,包括我们的周报项目记录,还有我们的成果。那现在我们就把我们的整个虚拟的工作资料给到他,看他能不能按照我们的这个要求来给我们生成对应的内容。 ok, 我 们这边可以看到,他先检查了我上传的工作资料,你上来阅读我的工作资料,生成专业的纸袋里,包括大纲的设计师、报告转写员、讲稿转写员、问答准备员。再生成一个十五到二十一的 ppt 大 纲,然后编辑三百页字的数据报告,再编辑每天 ppt 投稿讲稿。 可以看到他这边创建了四个助手,并行的助手,包括我们的大纲设计师。我们可以看到他的任务就是根据我们的需求设计十五到二十页的数值的 ppt 大 纲,包括每页授课格式,包括我们的报告的钻写员,还包括我们问答的准备员,也就是说 他直接给到了我们四个色,当帮我们干活的员工。我们先看第一个大纲,设计师李华的任务,请根据权位以下产品经理设计一份数值的 ppt 大 纲。第二个码落的是摒写一份约三千字的年度数值报告。中文里斯特的是摒写每页对应的口播讲稿。 林志的是准备可能被上级追问的问题以及参考的答案。好, ok, 我 们看一下,他们现在正在准备他们各自的工作,这里绿色的小点就是他们工作的进度。我们这边可以看到李华给我的这个 ppt 大 纲已经写完了,包括开场散野、核心项目展示、数据成果展示、个人成长大纲的规划。 ok, 我 们再看这个,阿洛现在是帮我拣写一个三千次的数值报告正文,我们可以看一下,他这边已经写完了,我们再看。接下来根据我们的数值报告,这个是我们对应的口播,完整的口播稿创建文件。最后现在是在思考问题,有可能会被上级追悔的问题。 我们看一下可以看到大概的问题,这个问题呢,就是相当于他会假设你的上司怎么会反向提问,然后给到你大概的一个回答的思路。你可以看到回答的非常的详细,你可以看一下,就是这个,如果需要这个回答的文件的话,如果你可以联系我,开场回答,应对压力,非常不防御,不回避,转危机为机会。嘿, 这个真的确实很懂职场,那接下来我们能不能让他再有一个更复杂的任务,比如说基于你规划的数值内容,帮我生成对应的 ppt, 我 不仅要你给我生成内容规划大纲,还需要你直接把 ppt 做好。好,我们看一下他现在的一个 ppt 的 开发过程, 实际上你会发现在整个这种重构,就是整个帮我们做数值报告的整个过程中,他其实一直在干三件事,第一个是拆解我的项目,第二个是算各种数据来看我的贡献,最终来重写这个趋势。甚至他不仅给我的大纲和数值稿,甚至老板可能会问我什么问题,都给我准备好了。所以说很多时候在职场 你会发现很多人他不是干的不好,而是他不能把他自己的结果或者成果结构化的表达出来,而 而进的鸡群本质上就是刚才帮我们完成的表达的工作。 ok, 我 们这会已经看到他在帮我们生成我们需要的 ppt, 一 共是二十一、二十四年的报告,因为咱们给他的参考文档写的是二十四年,不是二五年,也不是二六年,写的二十四年的,所以在这生成了二十四年,你可以看到他这边 ppt 的 质感做的很好,版式做的很规整, q 一、 q 二、 q 三、 q 四, 可以看到每一季度的整个工作回顾,在上面他开始输出具体的项目的总结,那这会这个 ppt 就 已经生成好了,我们可以看到它整个的页面,大家可以看做的怎么样,如果觉得做的可以的话,评论区可以打六六六,我们就可以直接带到本地, 看一下他整个的这种效果是不是做的就很棒,对不对?所以很多时候如果说咱们现在比较头疼就是报告,你可以完全让他先生成我们美业的规划,我们数值的这种口播稿,甚至 ppt 也直接给我们做好。好,那这个就是我们第二个案例展示,最后一个案例,我们就提高点难度,让它更加的标准化。 生成一份关于 ai 进的技术的文献综述。先把我找到五十天近两年相关论文,根据论文的核心贡献,梳理技术,给您路径和趋势,做出一份结构完整的综述文档。可以把它这个要求改成 ppt ppt 格式, 那就相当于第一个找到五十天近两年的相关论文,找到每天论文的核心贡献和进方向,就梳理一下,最终形成一个完整的综述报告。好,我们看一下它整个进行的过程,先看一下它整个的待办清单,包括搜集, 先搜集论文,然后并行阅读,提取核心贡献,按技术方向分类梳理,再梳理技术研究的路径和趋势,最后再生成结构完整的报告。先存不同的数据源来搜索对应的这个论文, 因为先获取大概的一个论文,你可以看到这边都是在对论文的一个或数据的获取。当他拿到这些对应的这个数据,大量论文数据之后,他开始说我将创建多个字 a 进他来并行分析这些论文数据之后,他开始说我将创建多个字 a 进他分类,你可以看到他这边有很多这种助手。 为什么创业这么多?是因为虽然他们的工作类型差不多,但他们主要是来并行,提高他的处理效率。假设这几十篇我一篇篇的读,同样读很久,包括 a 的 分析也是,如果是创业,他第一篇搞完才能看第二篇。所以你可理解五个学生每个人读十篇,每个人分析十篇,最后他再把这十篇的结论做个汇总就 ok 了,这样他的效率就高很多。 前面四个都是已完成,最后这个孩子在刚刚开始写,就很像咱们带一个实习生的团队,前四个工作都已经干完了,最后一个还在托稿,还没教,是不是有很像这种感觉? ok, 我 们可以看到几个分工去读论文的这个实习生已经读完了,现在他又创办了一个 a 进塔。他的任务是什么?你是一个专业的技术报告转写专家,擅长 对这种学术综述报告。然后你的任务是将 ai 进他的技术论文的分析结果整理成一份完整的综述报告,包括摘要引言、技术方向、分类、核心贡献、点击路径,它是帮我们在做整合。我们这边可以看到这个总结的论文已经写好了。 ok, 这里可以看到他这边写的总结的文档,因为这个文档比较长,我们直接就把它转化成为了 ppt, 方便我们去阅读和理解。 ajin 的 技术文献综述基于五十篇前沿论文的系统分析,包括大元模型、多智能体系统、自主决策,你可以看到目录四个部分研究背景,然后进入方向分类,进入引进、趋势挑战和未来的方向。 ok, 我 们看我们这会的这个 ppt, 它也就直接制作完成了,包括 这整个任务就完成了它大概完成的文件事务页的 ppt, 完整的综述报告六千次,五十篇论文的原始数据,还有五组论文的详细分析,这里面是他全部的文件。 那今天这本这个关于 kimi 的 演示, kimi 的 演示咱们就结束了。在整个过程中咱们涉及到的所有的文件,无论是关于产品的相关的,还是说做科技博主调研的这种对象,这种数据,还有过程,包括我们刚才去做偏学术的 ai 论文核心 方向提取,还有分析这三个测试案例的过程,相关的文档我都会整理出来,大家如果需要评论区可以打个六六六,如果说咱们想学习更多关于 ai 的 应用,也可以关注我,感谢大家。

提起 ai agent, 你 脑海里是不是浮现去年全网刷屏的 manas? 没错,就是那个让 ai 动手干活、一人成军的神器。如今, manas 被 metas 收购成了出海明星,而放眼国内,长江后浪推前了, agent 的 进化速度快得让人折舌。 今天的 agent 不 止会埋头苦干,更能影分身摇人组队,以多专家协助的蜂群思维来攻克难题了。近日, kimi k 二点五的 agent 集群发布,能根据任务需求动态调度多达一百个专家,并行执行一千五百个步骤。相比单个 agent, 任务效率提升四点五倍, 运行时间减少百分之八十。值得注意的是,这和 madison 路径有本质区别。 madison 侧重驱动大量同质化智能体,以规模效应和人海战术取胜。这种模式的优势是简单直给,适合明确可拆解的批量任务。 但天花板也很明显, kimi a j 的 集群走的是另一条路,意志角色的分工协做,好比可以同时摇来项目经理、技术专家、市场分析师和刊稿人组团,让他们各司其职又紧密配合。 更关键的是,所有的角色分配与任务拆解,无需我们手动预设,全由 k 二点五自行决策。目前我也开了下会员,体验了下这个在内测的新能力。比如,一位生物科技公司的研究员需要一份关于全球所有抗衰成分的全景扫描报告, 包含胜肽、合成生物等各类物质,并要求信息权威、来源可靠。只需对 kimi 下一个指令,它便能启动集群模式 拆解任务,并自主调度相关专家。有的直奔 pubmed 梳理文献,有的扫描全球专利库离清产权,有的负责从 fda 等机构提取数据,最后生成一份包含数据图表与深入洞察的专业报告。再比如,想系统学习 powgram 的 文章, kimi 的 集群也会自行分工整理框架,提取观点、归纳核心思想, 最后汇总成一份脉络清晰的精华综述,从信息收集到成果输出,全部自动完成。数据显示,在大规模搜索场景下,与单 a 阵的执行相比, a 阵的集群将达成目标,性能所需的最少关键步骤减少了三到四点五倍,效率提升显著。又或者,当你询问如何培养孩子未来进入北大中文系时, 也可以上 kimi, 调用顶尖专家智囊团,让历史上最伟大的科学家、心理学家、哲学家、教育家、文学家等各书几件, 给你一份融汇多元智慧的养娃方案。可以看到, ai 正从提供标准答案走向模拟、多角色思辨,以更智能的方式辅佐人类决策。 不难看到,如今国产 agent 已出现明显路径分野,一条是 magus 所代表的向外整合路,另一条则是 kimi 深耕的向内突破与自主进化之路,后者相当于在软件层面构建自主可控的基础设施。 这是一条更艰难也更正确的道路,因为它不断逼进 a j i 所需的核心能力,规划、协助与解决复杂问题, 并将树干牢牢扎根于安全的土壤之中。这次 kimi 更新确认也让我很意外,大家熟悉的 kimi ai 又回来了,更聚焦技术,更聚焦生产力提升,推荐你们上手试试!

我刚刚充值了一个 kimi 的 最高会员,因为我想要试用一下它的这一个 agent 集群的功能。 agents, 我 目前来说想要让它试用的一个场景是,呃,文案的创作。我个人是觉得 好的文案创作是一个团队的事情,不是单单一个人负责生产。我就想单纯的看一下 kimi 二点五的这一个 agent 群到底是怎么样哈,我们就点击 run, 它一共就四十三个额度,跑一次要三个额度。 ok, 它的这个图标真的挺可爱的哦,他在创建助手团队架构师,相信数学直觉胜过, 哎,你们别说,它的这个界面交互设计我个人真的非常喜欢,还是蛮有感觉的。所以它先生成了三个,一个是团队架构师,一个是流程设计师,然后又生成了一个叫纪康的质量管控师。为什么都没有女生? 第一个是女的,他不是李斯特。所以说 kimi 这个问题你们开发者好好想一想好吗?作为一个女性用户来说,他可能是觉得男性比较适合做这个可可文案创作,就变成女性了。我每次看到 ai 就是 一次迭代,我脑子就那个信息过载,我觉得我们活着的意义是什么?我们现在工作的意义都会被 ai 取代掉, 除了创造力的执行的很多,所以未来更重要的就是去制定 ai 需要做什么工作的人很重要。但是我可能提的需求不对,因为我是让他制定一个团队架构和工作流程,但其实我是想让他帮我生产出 一个合理的文案,所以我的提示字可能这边提的有点问题。 ok, 所以 说他目前来说已经过去五分钟了,他还在设计文案的团队架构,然后他再要升级设计多伦文案的生产工作流程。哦,他一下子就开始开始搞了。 决策层,文案团队负责人,专业层有策略规划,内容生产层,文案策划师、高级文案审核编辑执行层,内容运营专员、素材管理员。作为一个整个项目的负责人, 他的确把我平时要做的文案生产的所有的环节全部都考虑到了。我现在 想用这一套工作流给我自己生产文案,但是我不知道他是不是能够让我去对每一个他里面的集群, 他里面的每一个 agent, 让我可以去作为人去监控他的产出,并且给出是否能够让这个工作进行到下一轮的一个指令。 可能这是旧时代的工作习惯,我还想着要去 check 他 每轮的产出眉笔。我不需要,他已经帮我生成了一个个人的文案工作流核心。那现在的问题是,他已经帮我把工作流生产出来了,我应该怎么让他帮助我生成一个能够真的产出文案的助手呢? 我需要你直接给我搭一个能够根据我的需求直接生产最后文案的文案助手,和上述工作逻 辑能够和我沟通我的需求,然后一步一步帮我生产最后文案的文案助手。 我不知道他能不能做到这个事情。好,他已经生产了,需求拆解、策略策划、文案创作审核优化输出成功, ok, 直接运行拍段文件。我应该怎么去用他呢?但问题是他现在好像没有办法直接生产 一个可以用的程序,或者是一个工具的一个状态哈,直接运行这个文件开始我的第一个生产问题是我真的不知道他在哪里,我这里再试一下,直接给他我们的一个产品文档的文件试试。好, 这是我给他提的一个新的需求,我给了他一个我们果干产品的文档,然后给了他一个比较宽泛的要求, 并且我告诉他,我要五十条,我看一下他能不能帮我做到,他现在已经完全的生产好了。我们来看一下这个啊。第一道十条是针对年轻女性的精致生活篇,一百到两百个字打的一个减脂期, ok, 不 仅好吃,还超出篇。 好,我们来看一下接下来的十条。宝妈针对家庭用户, ok, not bad, 打的是学生和职场人高效便捷的卖点。这个有点硬了啊,这个有点硬了,越写越硬了。我感觉综合来说,我觉得他写的这个文案我打三十分, 我打三十分,他把整个工作拆得很细,但是在最后一步文案生成上呢,还是有点拉杂,因为我个人觉得生成一个好的文案还是需要 几个步骤的,从大纲到细化,到最后的一稿二稿三稿, 都需要不同的 agent 去做不同的事情,才有可能生产出一张还不错的文案。对,那么目前来说,这是我对于 kimi agent swamp agent 集群,智能体集群的第一次尝试, 那么未来也会做更多的试用,如果屏幕前的各位也有更多使用 kimi 的 agent 一个比较好的方式,或者说我这次用的方式有些不太对,有些可以精进的地方的话,也欢迎在评论区告诉我,我们下期视频再见。

兄弟们,今天我终于花费巨资两百大洋,为大家深度的体验了一把 agent 集群模式,说实话让我有点失望,为什么呢?因为我要处理的主要是长文本的写作, 结果我花了差不多一个上午的时间,先给他去搜集整理了相关的文献,每个文献的大小不超过一百兆, 所以我呢,精心的选择了五十个文献,基本上覆盖到了论文写作的所有的方面。 我把它上传到这个对话框里面之后,然后我就给出了一段非常具体的指令, 后来就等了十来分钟,他终于给我生成了一篇一万七千多字的文章。但是他生成的文章有一个有趣的地方,就什么呢?他只能提供一个 txt 的 文档,而不能生成一个合格的 word。 当我把它复制粘贴到我的 word 里面去了之后,大家可以看一下,这就是在 kimi 二点五级群模式下所生成的一个文档,长度还是可以的哈,一万七千六百二十一字。 但是他的注视就让我有点抓狂了,他有这么多注视,但是只有注视的符号,却找不到任何一个注视, 后面虽然也附了参考文献,但是和注是完全不对应的,也就是说你还得重新给他注一遍,这不是让人抓狂是什么样?而且看他生成的这个文本呢, 有点像一个文献综述,缺乏论述的逻辑性和针对性。我们再来看它,之前是在 kimi 二点五 agent 普通模式下,这里有 kimi 二点五 agent 集群模式,还有 kimi 二点五 agent 普通模式, 我就是在这个普通模式下生成的。大家看一下这篇论文,它的注是和后面的参考文献是一一对应的,你们看 是吧?非常的具体。当然参考文献的数量呢,不好说,但是他全书有一万八千多字,注是有八十六个,而且每一个注呢都能对应到具体的这个参考文献上面去,这其实就给我们省了非常非常多的时间。 所以我感觉这个集群模式,可能对于我们这些想要用它来进行长文写作的,尤其进行科研写作的这些学者呢, 未必有什么大的价值,但是他最大用处可能在编程或者其他网站平台的搭建方面,在工作流的处理方面,可能在这些方面有令我们意想不到的效果。 当然我后期可能去体验一下,看看他还有一些什么特别宝藏的东西,也就当为大家提前去踩一下坑吧。

你现在看到的不是游戏画面,这密密麻麻的六边形蜂窝是成群结队的 ai 大军,每一个格子都是一个正在干活的 ai agent。 点开它,你就能看到他正在思考,正在执行任务。这个项目看得我头皮发麻。他叫 vibecraft, 一个开源项目,灵感来自于 starcraft, 相当于我们变成了一群 aia 卷子的指挥官。这种工具的诞生是一个重要信号,单打独斗的 ai 已经不够用了,我们要开始指挥 ai 军团了。 二六年会出现很多 mote agent 产品,在一个任务上增加 agent 的数量,就会成为新的 skating low。 比如刚发布的 kimik 二点五基于模型的能力,就添加了一个 bata 功能 agent swarm。 swarm 的原意是指蜂群啊,一只蜜蜂是很渺小的,但一群蜜蜂就诞生了超级的智慧。去年七月, minus 推出过一 主打广度的 wide research 功能,对标的是 open ai 的 deeper research。 他预先定义了一套固定的多智能体流程,先任务拆分,再多 agent 并行,最后汇总处理。并且每个子 agent 都扮演相同的角色,比如三十个调查员各自去负责调研一支股票。 而 kimi 用了一种新的方式,把 motiage 的能力做到了模型层面。 k 二点五模型在 agent 集群环境中进行了专门的强化学习训练, 这就使得他更为灵活,没有预设的规则,都是由模型自行判断如何拆解任务,使用更加多样化的角色。例如同时派出数据分析师、多方分析师、空方分析师分别收集资料,再让一个转稿人汇总写文章,再让三十个画师并行生成配图。 从 b h mark 来看,这种模式有效的可怕,在众多评测中都取得了当前最佳的表现,并且效率和性能大幅 领先于之前的单一 agent 模式。来看一个具体的案例啊, program 的神作,如何做出一件伟大的事是我最喜欢的文章,我想把它做成中文的视频,要 ai 帮我做一百个分镜图片, 原本我人工制作的话呢,先要对文章做手术刀级别的分割和理解啊,分成一百份,再设计统一的美术风格,然后为每一段话设计分镜画面,再一张一张去生成图片,最后整理成一个图文交错的文档,即便有 ai 的辅助,我一整天都是做不完。 我试着把这个任务扔给 aj 双,接下来的一幕啊,堪称视觉盛宴。他直接创建三个子 aj, 翻译官、导演和画面描述师,每个人还有姓名,甚至有工牌,翻过来还可以看到他们的职位描述。三个人通地合作,写出了一份文档,包含角色设计,一百个分镜的描述以及视觉风格。 注意看啊,接下来就要生成一百张图片了,他创建了五位画师,五个人同时开工,每个人负责二十张图。这就是使我们的高吞吐量优势,不需要像传统的单体 ag 那样串形处理,一个一个任务浪费时间,而是大家一起上,效率倍增。 在过程中呢,我就发现意外发生了啊,有一个画师 a 卷报错了,如果是传统单体 a 卷层,一个地方报错,就会堵塞整体的执行,反复试错,最后甚至导致整个任务的失败。但所有的架构中啊,局部的失败不会影响全局,有更强的鲁棒型。 不止如此,啊,这种分布式的群体智能,由于每一个单点都有自己的智慧,整个系统就有很强的自我修复能力。在刚才我们这个报错案例中,子 aginten 自行尝试了不同的方案解决了报错。一百张分镜图生成完后,全部存在了文件系统里,可以一键下载下来。还没完啊,一个 web 开发 agent 登场,用之前的所有资产制作成网页。一百张分镜,完美和台词对应,且风格一致。比如啊,开头第一段分镜就带有大标题, how to do great work。 给视频一个华丽的开场。当文案提到要选择一个领域的时候呢,分镜就展示了四条不同的选择路径。 在结尾的升华中出现了一句,为什么不能是你呢?封禁也充满了希望感,并且把 why not you 写在了画面上。 回看整个过程啊,我只是输入了简短的指令,然后他自行组建了一支团队,干了一个多小时,完成了我一天的工作量。并且呢,我过去没有在任何 agond 上一次性完成过这个任务。 但是啊,这个案例只创建了不到十个 agent 小团队而已啊,不够恐怖。 agent swarm 能创建的 agent 数量可以到非常夸张的规模。比如啊,我把巴菲特股东 信的网站发给他,要求他下载每一封信,逐个翻译,从几十封信中总结出投资经验。他创建了六十个 agent, 每个负责一封股东信,最多的时候有三十二个 agent 并行工作。更有意思的来了,那个总指挥官 agent 找到了连我都没注意到的 bug。 巴菲特从六五年就开始写股东信,但我发给 ai 的那个网站,只有七七年之后的信件,资料不全啊。他立刻只派新的 agent, 全网搜索,把缺失的补齐。这要放在传统的单体 agent 里啊,他脑子里就装满了各种不同的信息,又要规划任务,又要翻译信件,很难意识到 bug 的存在。 这就体现了 agentsworm 另一个优势,把认知负载分散到多个 agent 里,每个 agent 专门负责一部分任务,占用 contacts 更少,注意力更聚焦。比如指挥官不读信,只管人。每个手下呢,也 只专注于自己负责的信件,没有无关的信息,始终是头脑清醒,可以极大降低幻觉和出错的可能性。最终呢,他不仅给我提供了六十封巴菲特股东信的中文版,还写了一份精华总结,都可以去出一本书了。当然啊,所往不仅仅是人多力量大,还有更进阶的玩法,多角色的互相制衡。 比如说最近白银疯涨,我很好奇这什么情况,还能涨多久?我就希望有多个 ai, 从不同角度互相辩论。这种需求给到单体 ai, 只能自己跟自己左右互搏,像精神分裂一样。 在 sumdi 啊,直接创建了三个子 aagent, 数据分析师,写代码,抓数据,看多派找上涨的理由,看空派找下跌的风险。三个人分头行动,互不干扰,然后转稿人负责汇总。这还不够啊,最关键的角色来了,审稿人每一个数 据他都要核查来源,每一个观点他都要验证逻辑。这又是 swarm 的一大优势啊,通过多 agent 交叉验证,降低幻觉。 最后一个和我一样的长发小哥, a 卷者,负责前端开发,把这一大堆的文件做成一个可交互的网站,有图有表,有理有据。这就是所谓的集思广演,集体的智慧,把玄学的 ai 变成了科学。 那在大量测试后,我认为啊 kimik 二点五的 agent swarm 不是以前那种几个月一次的模型小步迭代,而是让大模型跨入了一个新的阶段, 协作被刻进了大模型的脑子里。在我测试的很多任务中,已经超出了节省时间、提升效率的范畴,而是拓宽了我的能力,让我做到原本不可能的事。例如啊,调研前一百的科技股在总结规律,单一的模型很难完成这么长的任务,就算我作为人类亲自出马,给我充足的时间, 也很难把一百个公司的信息摊开在面前去总结。规律并行让效率更高,分工让专业化更强,分脑让注意力更集中,互相制衡让幻觉更少, 分布式的结构让容错更高。一个人再全能,也无法独自把火箭送上太空。伟大的奇迹从来都是协作的产物。

探击文明的秘密从来不是个人的智商,而是组织,包括分工协助规模化对于归机生命来说也是这样。 ai 发展到今天,我们见过薄纹墙记的模型,他们有着超大的上下文窗口,也见过深思熟虑的模型,他们有着超强的推理能力, 但是这些都还是天才,还处于单体智商的极限竞争。就在昨天, kimmy 发布了 k 二点五模型,并带来了一个名叫 agent swarm a 卷集群的重磅炸弹, 这个新的功能把国产 ai 推向了组织智能的新高度。先说 k 二点五,用一个关键词来概括这个模型的话,那就是全能。 怎么个全能法? k 二点五把视觉和文本对话和 a 卷调用,思考和非思考,所有你目前能想到的关键能力全都集中到了一个模型里边,而且在全能的情况下,他在各项评测当中都取得了极佳的表现。 另外你别忘了, k 二点五还是一款开元的模型,他在多项评测当中,由于 gpt 五点二 xhi, 但是成本只有对方的几分之一, openai 万亿美元的护城河又塌了一些。那么问题来了,模型的发展有那么那么多方向, kimi 为什么非要把所有的能力全都塞进一个模型呢?因为只有全能的模型,才能驱动得了最新的 a 卷集群功能,才能实现 kimi 在 这个阶段的野心。 我不知道 kimi 是 不是一开始就规划好的,但是你回过头来看的话,确实啊,它们的模型发展路径特别有一种 scale 三部曲的感觉。三部曲的第一阶段是 kimi 一 点零时期,那个时候模型的代表能力是 memory, ai 学会像人类一样去记忆。在这个阶段, kimi 卷的是长度,上下文的长度。第二阶段是 reason 和 tour use, ai 学会像人一样去思考和使用工具,尤其是在长城任务当中。在这个阶段, kimi 卷的是深度推理的深度。 前两个阶段提升的其实都是单体智商,但是啊,你要实现 agi, 光靠一个超级天才是不够的,你必须把一群的天才都给组织起来,有组织的智能才是文明,这才是 agi 要达到的高度。 于是第三阶段的 kimi 开始卷写作,也就是让 ai 自己组织 ai。 代表模型就是这次推出的 k 二点五。有了全能的 k 二点五,无论你需要什么样的子 a 卷,要并发多少个它都能实现,都能协调。我给你们演示一下就明白了。 第一个例子,我让 kimi 去所有主要学术和技术资源库做一次大规模的文献扫荡,然后识别并编目所有论文报告和官方文档。这个任务需要 kimi 具备极强的专业能力,否则你连找都找不着,更别提之后的整理了。 另外,因为是文献扫荡,所以工作量很大,很考验并行处理的能力。接到任务后, kimi 生成了四个子 agent, 分 别负责不同的渠道,比如 archive, github 等等。 每一个子 a 卷都交代了非常详细的要求,比如时间的范围、作者、主题、关键词等等。然后四个子 a 卷领了,任务就同时开工了。在主界面的下方,你可以看到他们的工作进度,点进去可以看到详情,知道他们进展到了哪一步。 当某一个子 agent 完工了,下方会有气泡提示,左边栏的进度条也会走满。当所有子 agent 都完成任务之后,一切都会汇总到主 agent 这边。它会整合所有搜索结果,开始创建最终的报告,包括可量化分析等等。 这个过程会涉及到文档的状写,也经常会需要编辑代码。还好背后的模型是 k 二点五,足够全能,否则根本不可能这么顺滑。当一切搞定之后,交付物会存在虚拟机的文件夹内,其中包括几十篇高质量文献,以及一份非常非常详尽的报告。 如果是人来干,且要在短时间完成的话,你肯定得来一个课题小组吧。刚才这个例子非常有代表性,因为几乎所有专业领域的人才实心都非常非常高,你要是想请他们帮你找找资料,做点分析,你得付出大的价钱。 那现在有了 kimi 的 a 卷集群,你就可以用算力换实心,只需要付出一点点的算力成本,你就可以让 ai 专家帮你干活,随叫随到,毫无怨言。 这个在以前是根本不敢想的。而且 kimi 的 a 卷集群可以处理高达一千五百轮的工具调用,在短时间内就能完成高负荷的工作。刚才的例子属于理工科的,咱们再来看一个文科的例子。 我希望 kimi 针对高达动画闪光的哈萨维的第一场战斗做一个拉片分析,也就是一帧一帧的拆解镜头语言。接到需求后, kimi 做了两件事。第一,生成 sub agent 一共有四个,分别是战斗分析师、视觉分析师、构图分析师和身份分析师。你看,从这四个分析师的配置就看得出来, kimi 对 这次的任务做了拆解,他知道要从哪几个方面切入,于是才有了战斗、视觉、构图和身份四个部分。第二,分配任务, 四个专业分析师同时开工并行工作,这样能保证效率。等他们都完成之后,主 agent 再进行整合,形成完整的拉片报告。 最终的报告还是挺有料的,包括对战况、节奏、试听语言的分析,尤其是还点到了导演的核心意图。这个特别棒,但是光有文字的分析好像还差点意思。我在想能不能加点配图呢?于是我让 kimi 创建表格形式的分析报告,并且附上手绘风格的分镜图。 这个就是全能模型的好处,当你需要图片的时候,他可以调用多模态的能力直接生成。 这种手绘的感觉还挺好的,不是吗?通过刚才的演示,你就知道什么叫真正的 a 卷集群。第一,它是角色涌现的。真正的 a 卷集群绝不是被程序员写死的流程图。过去两年,有无数的团队在做 multi agent system, 他们定义角色,设计流程,编写规则,但是这本质上还是人在组织。 ai 只是很初级的机群,只能做一些现性的任务。而 kimi 正在做的 a 卷机群是像人类社会一样,可以根据任务临时组建一支特种部队。 有的 a 卷负责看财报,有的 a 卷负责收新闻,有的 a 卷负责写代码。 a 卷永远跟随需求流动,它们欣赏得了动画,也看得懂 ai, 论文不会被锁死在固定的岗位上边。第二,它是三 d 编排的,以 minus wide research 为代表的 a 卷是二地并发的, 他让一百个实习生同时去搬砖,各干各的,最后再把结果堆在一起,只有分头,没有协助。而 kimi 的 a 卷集群拥有动态中继站, 他们可以在关键节点停下来交换信息,互相校准,然后再开始下一阶段的创作。有分工,也有对齐,所以我才说这是一种三 d 编排式的写作。 今天的 ai 面对的是更加复杂、更加通用的场景,靠单独的 a 卷不行,靠像预制菜一样的多 a 卷也不太灵, 真的需要因地制宜实时生成。所有角色分配、任务拆解都由 ai 在 现场及时决定。 对于用户来说,你拿到的不是一个更加聪明的模型,而是口袋里的字节跳动。对于 ai 这种归机生命来说,这是从天才进化到文明的开始。目前 a 卷集群功能还处于贝塔阶段,如果你是 kimi 会员的话,一定去试一试。 ok, 以上就是本期内容,想了解 ai, 想成为超级个体,想找到志同道合的人,就来我们 newtype 社群,那咱们下期见!

大家好啊,之前我说过 deepsea 和其他几家国产模型,如果春节发布, agent 的 模型可能会成为新的行业爆发点。现在看来,我还是低估了国产 a 的 计划速度了啊。 昨天中国开源与三家 deepsea、 kimi、 千问都发布了自己的新模型啊,性能长板可不相同,但是相继霸占了海外的热搜榜,可谓是神仙打架了。从最新的热度来看呢,这次 kimi 靠视觉编程和 agent 能力打差四方,算是这一波里最出圈的了。 之前 kimi 出 k 二的时候呢,我有一期说这可能是另一个 deepsea 时刻啊,原因就是它是一个 a 阵模型,可惜 manos 出来早了啊,因为国内当时没有合适的 a 阵的模型而出走海外。而 k 二这半年虽然受到很多国际关注,但还算不上大爆款,个人觉得还是时机未到。 最近长城推理的技术进展和成本下降呢,已经逼近了这个 c 端爆发的拐点。我的日常工作平台,包括文本写作、 ppt 这些都已经在用 agent 来处理了,但是海外模型的成本对普通用户太高了, agent 又比对话消耗头肯大几个数量级。 这次的 k 二点五一下就实现了 agent 的 sota, 还有编程的开源 sota 啊,真的很争气, 测试下来呢,我感觉完全不输 minus 了,更重要的是把 minus 的 工程优化很大程度上内化到了模型里啊,加上可以预见的大幅降价,国内各种 agent 工具估计很快就会百花齐放,让 c 端用户第一次真正用得起持续性的深度推理。 估计这次大概率会重演去年 deepsea 时刻的盛况啊,只不过这次的主角会轮到东柏泰长城 agent 了。我试了几个经常用来测试的场景,大家可以感受一下。先给一张照片预测拍摄地点, 这个能力,原生东柏泰模型像 g、 b、 d 四 o 已经做的很好了啊,但需要给出详细的提示词。国内照片的识别效果呢,也很一般。 这张首都机场的照片,上来就搞了几个分工明确的专家,一起商量着干活。一个专家先识别了缅甸航空公司的 logo 啊,另一个通过太阳角度和光线判断是中国北方大兴机场山脉形态、建筑和跑道说像是首都机场的西北角。然后讨论了一下,确认认为缅甸国际航空在中国北方唯一主要通航的大兴机场就是首都机场。我的感觉是这模型澄清了, 我又上了点难度啊。它识别出了远处的奥利匹克塔,还有近处的清河和上清桥立交,然后用三点定位法写 python 代码,从平面几何计算定位到了五百米范围内的另一个小区,还比较让人满意 啊。这是让他抓北京的小区房价做动态热力图啊。当年这组进度还正经得学些日子呢啊。再看图片生成能力怎么样,我给了他这样一张腾讯研究院 ip 的 唐晓岩的图片,让他用五个风格截然不同的知名艺术家为我设计五个系列,每个系列十张的马年主题表情包图片。 然后他就建了五个 a 阵,开始一起酷酷的画,画的挺快还挺像那么回事。 然后就是打工人最关心的 ppt 啊, banana 和 notebook rf 虽好,但是不自己搓工具的话只能搞十来页,而且不能编辑。我让 kimi 自己解锁资料,做一个五十页的啊, ai 教育主题的 综述材料啊,他还是分工之后各自去搜,然后会做非常快。沈曼也在线啊,我觉得 a 阵的最先淘汰的技能可能就是手搓 ppt 了。 潮流一旦形成呢,就不会倒退,人类一旦有更偷懒的办法呢,就一定不会再吃苦了啊。不止 ppt, 从官方介绍来看呢, k 二点五已经具备了视觉复刻网页和 app 的 能力了。 这让我有一种感觉啊,软件这种交互形态正在消亡,我们不用再遇到问题时候找一个封装好的软件,而是可以通过 ai 这个最大的流量入口及时生成。用好几分啊。这一天可能真的就快来了,感谢关注未来博士,为从跨界的视角看懂未来的方向。

朋友们,就在昨天,现在是一月二十八号,在昨天一月二十七号, kimi 发布了他最新的模型 k 米 k 二点五, 可以看一下他在各项精准能力中的测试了,基本上可以说已经和国际的顶尖模型持平了, 并且在代码测试中,它是超过了杰米娜和咱们的 g p t 五点二,最重要的是它更新了一个功能,我往下翻给大家看一下。 kimi k 二点五,它更新了一个 i g t 集齐的功能,它可以专门建立动态的 i g t, 就 像你 创建一个公司,然后给你的员工分配任务一样,去完成所有的任务,好给大家看一下啊实际的效果。我在这边已经跑了一个, 这里一共给了他一二三四五六七八八个文档,这个文档是整个设计网站的设计方案,包括前端后端,我要让他一次性给我输出这套网站设计的非常全面,并且还有多多个参考的网站都放在这里。 可以看到一开始他就直接给我创建了两个新助手,一个太极和一个一飞,就是一个全站工程开发师来用到了我在 在网上设计中给他们说的要用到的这些技术路线。太极是一个专门开发前段的那么一个人,他现在专注于开发前段,一个人开发后段,等我结果跑出来了,给大家看一下效果。

二零二六刚开年, ai 圈啊,就爆了个大新闻,买特豪掷二十亿美金买走了中国团队 minus。 这不仅是一笔天价交易,更像是一份宣言, agent 就是 今年全球 ai 竞争最关键的赛点。 那么,面对这条被天价资金选中的赛道,咱们中国的公司都在怎么玩呢?其实啊,现在已经走出了两条不一样的路。第一条呢,就是 minus 代表的应用创新,就利用 cloud 这 等美国基座模型进行应用设计和使用体验优化,这也迅速获得了硅谷投资人的关注。后面的故事呢,我们都知道了,不过呢,很多人也意识到了,这条路径隐含着一层风险,那就是应用做的再好,地基毕竟是别人的,那地基不稳,要么被收购,要么被卡死。 所以呢,还有另一条更具野心的路,那就是自研 agent, 不 借谁的船,也不用谁的翻,从底层模型到上层 agent, 全部自己搞。只有这样啊,才能彻底摆脱对海外技术的依赖,不怕未来的权限封锁、成本波动与使用限制,把主动权握在自己手中。 那么,国内有没有不靠外国模型自主研发 agent 呢?还真有,你可能想象不到呀,死磕自研的竟然是 kimi。 仔细调查了一番,发现他们过去的一年啊,只做了两件事,一是自研有 agent 能力的模型,比如 k 二、 k 二 thinking。 二呢,是把模型能力和 agent 功能整合起来,比如推出了深度研究 ppt 助手 ok computer。 简单来说啊,他们想做的呢,就是让 kimi 从训练阶段就掌握干活的能力,这样便能模型和产品两手抓。 不过呢,说的再好听不好用,那都是白搭。这个百分百自研的 agent 到底行不行呢?可还真帮大家测了测,给我的感觉呢,很奇妙,以前呀,我是操作工具的打工人,但现在呢,好像变成了指挥专家的人。 什么意思呢?我举几个例子啊,比如打开他的 ok computer 模式,告诉他你要分析什么数据,然后等着就行了。他自己呢,就会去搜数据,做清洗,分析,画图表。最后呢,直接给你生成一行代码,都不用写。 还有这个啊,深度研究,你丢给他一个复杂课题,比如深度分析一下人形机器人的核心关节技术到了哪一步,那接下来呢,他就自己设计关键词,去爬取阅读成几百份资料,然后呢,从里面筛选出最权威的那百分之几。 最后交给你的是一份带详细引用的万字深度报告,外加一份可以点来点去的格式化报告,相当于把最耗时的分析工作和美化工作呀都给干了。 还有我特别喜欢的 ppt 助手,它的智能布局模式是真的好用,会自己设计风格,找图生图,而且呢,还能编辑和下载,主打一个实用效果嘛,大家自己品吧,我是自愧不如的,而且只花了几分钟看完这些案例呢。如果你是扎克伯格,应该也会想要压住 agent。 和 传统的对话工具相比啊, agent 是 真能干活呀。但是话说回来, minnes 其实只是证明了我们的应用创新能力,国产 agent 要是想在 ai 竞争的下半场弯道超车,还需要更多像 kimi 这样的自研 agent 的 团队在 中美 ai 的 长跑中出色的应用啊,是锋利的毛,而自主可控的底层智能则是让我们立于不败之地的盾。 agent 的 时代,行动力决定一切,自主生长方能决胜未来。

第二个就是文献综述场景,我觉得强力的吹一波这个 kimi 二点五的彩虹屁,我认为我后边不再买 minas 了哦, minas 正好过期了,我认为 kimi 的 二点五完全可以实现我对于 minas 的 那个需求。 给大家展示两个,一个是非投位式的综述写作,一个是投位式的综述写作,大家可以看一下。先看一下一个非投位式的啊,非投位式的还是有一定的幻觉,但是已经发现他很能打了。 好,这个都就直接调用的就是 kimi 二点五的 agent 能力。针对情感劳动主题写生,你看我题词只有一句话,针对情感劳动主题生成一万字的文献综述。 然后呢?有没有发现它也是有 skill 的, 它有一个专门的 skill, 我 们可以看一下,这是 kimi 的 工作方式,是有一个 kimi 的 computer, kimi 电脑,对吧?它是一个虚拟的电脑,只是我们看不到它的 skill 的 具体的内容,但我们大概能够知道这是一个做文献综述的 skill, 对 吧? 所以你看, skill 其实跟智能体结合起来,现在智能体的底层内容已经是由 skill 来去组成的。开始写,查找数据,你看他查找的基本上都是我们讲的 google scholar, google scholar 的 数据完了之后,开始维代班清单开始运行,开始写作,最后其实就看到这个结果,我们就看结果就行了。你看,就一句话,写完了一万五千字。请你看到这个结果,我们就看结果就行了。 你看,就一句话,写完了一万五千字。请你看结果就行了。你看,就一句话,写完了一万五千字。请你看就一句话,写完了一万五千字,请你就发现未来展望, 你看他这个就,咱不看别的,我觉得就看他这个提纲的质量是非常高的。引言,情感劳动理论发展,情感劳动的核心维度与策略。情感劳动理论的模型作用机制。情感劳动的前沿变量。情感劳动的后果变量调节于中介机制、测量工具与方法论的进展。不同情境下的应用研究,研究趋势与未来展望, 参考文献。好看,这里边的写作的长文的感觉我觉得还是不错的。你看大家看看这个段落的感觉并没有那么强的机器味,而且关键是他那一代的逻辑很清晰,因为我对这个里面还是比较了解的,很清晰整个的概数 中间这个过程谁做了什么样的开创性的贡献,在这本书当中这个区分了什么?谁做了什么样的整合,再往下谁又进一步的推进了什么?中国学者的本土化探索是什么样的?勤劳动的核心维度和策略是什么样的?你看 这个总数大家打多少分?这是没有任何投喂,只用了一句话。所以你说未来这个题式词不需要那么复杂了,因为大魔星越来越聪明了。当然你可不可以在前面再加题式词,我觉得也可以加,你甚至可以加一些更加与众不同的, 加一些更加细分的,比方说你可以专门让他综述医学领域的情感劳动,或者说教育学领域的,或者细分的等等,这是都是 ok 的。 好,这是一个, 再看一个头尾版本的,这个我觉得就更能打了。这个是我目前发现没有哪个原生大模型能够做到的,我给他一次性上传了四十五篇论文, 因为这几天我正要访谈一下北京大学陈向明教授,所以我就把陈老师的四五篇文章都下载下来了。大家可以想一想,四十五篇论文大概已经按照字数算,已经按照一万字算,就四十五万字他都不止,他的中文数在一万五千字,也就是说这已经有六十万字了。 六十多万字, timi 一下都吃掉了, timi 直接调用了他的这个多 a 整的,开始干什么?我让他针对四十五篇论文写作两万字文献综述,注意他全部都读完了。 这个我目前没有发现哪一个大模型能够一下吃掉四十五篇论文,就在上下文的窗口,这要在以前的线下博士论文我都没办法讲,我只能让大家先让大模型把招标提出来,再把招标整合到一个文档再做。现在不需要了, 你看开始批量提取、批改、编辑、转写综述巴拉,但这个过程会很长。这个过程大概用了一个多小时的时间,做四组文情,做主题分类,构建详细的文情综述框架的话,开始写好,字数不够,空了两万字,这是他的过程,咱就不管了, 写了两万一千三百三十五字七大章节,大看引言问题域的出场与研究的聚焦理论建构实践性知识,多为审视方法创新进行研究的路径,探索生存机制,从个体实践范式转型。 我觉得用来做这个领域的这个相当于针对一个学者思想的综述学,已经做的很好了,你说你干的过他吗?你要真把这四五篇文献读完, 再开始构建这样一个框架再写,我觉你没有半个月都干不完这个事。最后看完他这个成品,大家看看他的成品,你看教育实践性知识与专业发展、中国教育学界之行探索基于十校名团队以及合作者研究的文献综述, 这都是,这都是我,都是真实存在的文献,你都不用去验证了,这个文献都是这四十五篇当中的,而且都是从里边吃的很深,这个跟咱们过去只给四十五篇的这个摘药是完全不同的, 因为摘药的这个体量和我们讲一万五千字的权威抓取的东西是完全不一样的。你如果只用摘药,你写不出来这么丰富的,你的深度是不够的,这个深度已经完全 ok 了,你看写完了。 所以你想如果大家再做博士论文,如果到后边的话,那我就可能就一句话就完成了,甚至你可以在一个 kimi 的 窗口完成十五万字到二十万字的博士论文,我就没有任何的问题。

想干就干,不留遗憾,我是一幺三,今天呢,给大家介绍一下大模型 kimi 的使用。拆的 gpt 出来呢,有一年多了,但是可能很多人都还没有真正的使用过大模型,主要呢还是访问的难度,还有收费方面有门槛 机密呢,至少目前是完全免费的,而且国内是可以很方便访问的,没有什么障碍,而且性能呢,算是国内大模型中数一数二的了。 我这里呢,以 kimi 为例,给大家普及一下大模型的使用, kimi 呢就像一个超级博学的朋友,能精准的回答我们的提问,也能帮我们整理材料。我们先介绍一下怎么访问使用 kimi, kimi 呢在电脑端可以访问,也有专门的 a p p, 可以在手机上使用,手机端呢,可以直接在应用市场里面搜 kimi, 然后下载安装。需要注册一下账号,账号呢,可以用手机号或者微信来注册,登录后呢就可以在输入框里面提问了。不想打字的话呢,也可以用语音来发送,还可以 发图片,文档, ppt 之类的文件,让 kimi 呢自动读取里面的内容。 kimi 呢会以文字的形式来回复回复的结果,右下角呢有复制的按钮,可以很方便的一键复制,而且呢,手机端还可以让 kimi 把回复的内容朗读出来。是的,你与我交流时,包括问题和答案在内, 我们的对话内容累计的总字数上限是二十万字,这意味着从对话开始到结束, 所有文本的总和不应超过这个限制,已经非常像真人说话的效果了,虽然语气节奏上呢,比拆的 gpd 还稍微有点差距。左上角的按钮里面呢,有历史内容也可以删除。 右上角呢,是可以发起新的聊天。电脑端呢,直接输入 kimi 点 ar 会自动跳转到一个正式的地址。同样呢,是需要注册账号的。电脑端和手机端的账号是互通的,总体的功能和移动端基本是一致的, 只是没有语音朗读的功能,不过多了一个自己设定常用语的功能,相当于是一个快捷输入的效果了。接下来呢,根据我的诗容给网友们总结一下 kimi 的能力边界, 便快速了解听力哪些能做,哪些不能做。先说下能做的。输入方面呢,他可以输入文字、图片、文档、 ppt、 ptf 之类的文件,图片里的文字也会被识别出来。知识方面呢,他基本涵盖了学习、工作、生活的方方面面,几乎你能想到的问题都可以去尝试问一下, 甚至可以让他帮忙出一些创意之类的。回复方面呢,你可以简单的提问他直接回答,也可以设定一下他以特定的角色来回复, 比如让他模拟某位亲人和你聊天之类的,可以持续多人的聊天。内容上呢,可以要求简洁的或者详细的,又或者符合某种特定的格式来回复,也可以让他帮忙编写才 材料报告或者分析数据。适当的呢,可以设定一些语气,但是不能模拟很负面的语气,比如凶狠的、不耐烦之类的语气。再说一下 kimi 做不到的事情,首先就是 kimi 不能回复任何违法犯罪的内容。第二呢, kimi 只能以文字的形式来回复, 它不能生成图片、视频或者文档之类的。移动端呢,可以语音朗读,也是先生成了文字,在文字转语音而已。第三, kimi 呢,是只能在软件内回复问题,它没有掉入手机其他 a p p 的权限,所以呢,它不能像 iphone siri 一样帮忙设定闹钟,播放音乐之类的。第四呢, kimi 输入的图片 只能识别里面的文字,他不能识别图片里面的其他图像的内容。五、 kimi 呢,只能做参考建议,特别是医疗法律之类的,专业性问题,还是需要自己主观的识别一下,不能全信他的。六,每个独立的会 话呢,算上所有的提问和回复的内容呢,是不能超过二十万字的。第七,类似报告书,方案,小说之类的材料,拼命没办法直接凭空生成整份的完整内容。基本上一开始呢,只会给你一个大纲, 需要你不停的跟他交流,告诉 kimi 完善的方向,才能把内容一点点补全。但并不是说所有的内容都需要自己准备好,他只是单纯的整理内容而已。 kimi 作为大模型,其实已经学习到很多内容,所以呢,他可以发挥一些联想的能力,自动帮忙补充很多的内容。 有些人呢,会排斥使用大模型的能力,但是生产力发展到这个阶段是不会退回去了。目前大模型的能力呢,是越来越强,而使用的方式上呢,却越来越简单了。其实没有什么上手的难度,大家不妨试一试。最起码 kimi 不需要任何特别的手段,直接可以下载使用,而且是免费的。


朋友们,就在昨天,现在是一月二十八号,在昨天一月二十七号, kimi 发布了他最新的模型 k 米 k 二点五, 可以看一下他在各项精准能力中的测试了,基本上可以说已经和国际的顶尖模型持平了, 并且在代码测试中,它是超过了杰米娜和咱们的 g p t 五点二,最重要的是它更新了一个功能,我往下翻给大家看一下。 kimi k 二点五,它更新了一个 i g t 集齐的功能,它可以专门建立动态的 i g t, 就 像你 创建一个公司,然后给你的员工分配任务一样,去完成所有的任务,好给大家看一下啊实际的效果。我在这边已经跑了一个, 这里一共给了他一二三四五六七八八个文档,这个文档是整个设计网站的设计方案,包括前端后端,我要让他一次性给我输出这套网站设计的非常全面,并且还有多多个参考的网站都放在这里。 可以看到一开始他就直接给我创建了两个新助手,一个太极和一个一飞,就是一个全站工程开发师来用到了我在 在网上设计中给他们说的要用到的这些技术路线。太极是一个专门开发前段的那么一个人,他现在专注于开发前段,一个人开发后段,等我结果跑出来了,给大家看一下效果。
