第二个就是文献综述场景,我觉得强力的吹一波这个 kimi 二点五的彩虹屁,我认为我后边不再买 minas 了哦, minas 正好过期了,我认为 kimi 的 二点五完全可以实现我对于 minas 的 那个需求。 给大家展示两个,一个是非投位式的综述写作,一个是投位式的综述写作,大家可以看一下。先看一下一个非投位式的啊,非投位式的还是有一定的幻觉,但是已经发现他很能打了。 好,这个都就直接调用的就是 kimi 二点五的 agent 能力。针对情感劳动主题写生,你看我题词只有一句话,针对情感劳动主题生成一万字的文献综述。 然后呢?有没有发现它也是有 skill 的, 它有一个专门的 skill, 我 们可以看一下,这是 kimi 的 工作方式,是有一个 kimi 的 computer, kimi 电脑,对吧?它是一个虚拟的电脑,只是我们看不到它的 skill 的 具体的内容,但我们大概能够知道这是一个做文献综述的 skill, 对 吧? 所以你看, skill 其实跟智能体结合起来,现在智能体的底层内容已经是由 skill 来去组成的。开始写,查找数据,你看他查找的基本上都是我们讲的 google scholar, google scholar 的 数据完了之后,开始维代班清单开始运行,开始写作,最后其实就看到这个结果,我们就看结果就行了。你看,就一句话,写完了一万五千字。请你看到这个结果,我们就看结果就行了。 你看,就一句话,写完了一万五千字。请你看结果就行了。你看,就一句话,写完了一万五千字。请你看就一句话,写完了一万五千字,请你就发现未来展望, 你看他这个就,咱不看别的,我觉得就看他这个提纲的质量是非常高的。引言,情感劳动理论发展,情感劳动的核心维度与策略。情感劳动理论的模型作用机制。情感劳动的前沿变量。情感劳动的后果变量调节于中介机制、测量工具与方法论的进展。不同情境下的应用研究,研究趋势与未来展望, 参考文献。好看,这里边的写作的长文的感觉我觉得还是不错的。你看大家看看这个段落的感觉并没有那么强的机器味,而且关键是他那一代的逻辑很清晰,因为我对这个里面还是比较了解的,很清晰整个的概数 中间这个过程谁做了什么样的开创性的贡献,在这本书当中这个区分了什么?谁做了什么样的整合,再往下谁又进一步的推进了什么?中国学者的本土化探索是什么样的?勤劳动的核心维度和策略是什么样的?你看 这个总数大家打多少分?这是没有任何投喂,只用了一句话。所以你说未来这个题式词不需要那么复杂了,因为大魔星越来越聪明了。当然你可不可以在前面再加题式词,我觉得也可以加,你甚至可以加一些更加与众不同的, 加一些更加细分的,比方说你可以专门让他综述医学领域的情感劳动,或者说教育学领域的,或者细分的等等,这是都是 ok 的。 好,这是一个, 再看一个头尾版本的,这个我觉得就更能打了。这个是我目前发现没有哪个原生大模型能够做到的,我给他一次性上传了四十五篇论文, 因为这几天我正要访谈一下北京大学陈向明教授,所以我就把陈老师的四五篇文章都下载下来了。大家可以想一想,四十五篇论文大概已经按照字数算,已经按照一万字算,就四十五万字他都不止,他的中文数在一万五千字,也就是说这已经有六十万字了。 六十多万字, timi 一下都吃掉了, timi 直接调用了他的这个多 a 整的,开始干什么?我让他针对四十五篇论文写作两万字文献综述,注意他全部都读完了。 这个我目前没有发现哪一个大模型能够一下吃掉四十五篇论文,就在上下文的窗口,这要在以前的线下博士论文我都没办法讲,我只能让大家先让大模型把招标提出来,再把招标整合到一个文档再做。现在不需要了, 你看开始批量提取、批改、编辑、转写综述巴拉,但这个过程会很长。这个过程大概用了一个多小时的时间,做四组文情,做主题分类,构建详细的文情综述框架的话,开始写好,字数不够,空了两万字,这是他的过程,咱就不管了, 写了两万一千三百三十五字七大章节,大看引言问题域的出场与研究的聚焦理论建构实践性知识,多为审视方法创新进行研究的路径,探索生存机制,从个体实践范式转型。 我觉得用来做这个领域的这个相当于针对一个学者思想的综述学,已经做的很好了,你说你干的过他吗?你要真把这四五篇文献读完, 再开始构建这样一个框架再写,我觉你没有半个月都干不完这个事。最后看完他这个成品,大家看看他的成品,你看教育实践性知识与专业发展、中国教育学界之行探索基于十校名团队以及合作者研究的文献综述, 这都是,这都是我,都是真实存在的文献,你都不用去验证了,这个文献都是这四十五篇当中的,而且都是从里边吃的很深,这个跟咱们过去只给四十五篇的这个摘药是完全不同的, 因为摘药的这个体量和我们讲一万五千字的权威抓取的东西是完全不一样的。你如果只用摘药,你写不出来这么丰富的,你的深度是不够的,这个深度已经完全 ok 了,你看写完了。 所以你想如果大家再做博士论文,如果到后边的话,那我就可能就一句话就完成了,甚至你可以在一个 kimi 的 窗口完成十五万字到二十万字的博士论文,我就没有任何的问题。
粉丝2.9万获赞24.5万

欢迎收听歪哥 ai 研究院的美日 ai 日报。今天是二零二六年一月二十八日周三,我们专注为 ai 开发者、从业者和创业者浓缩美日行业动态,帮你快速抓住关键信息。 今天歪哥帮你扫了十二个 subreddit, 五百四十四条 twitter 和二十四个 discord 频道,总共七千四百七十六条消息,相当于省了你六百零二分钟的阅读时间。 今天有六个重磅主题,包含开源模型发布、闭源产品更新、技术架构突破、开发工具升级、行业评测对比和社群开发者动态。先说今天最炸的消息,月之暗面开源了 kimi k 二点五,这可是一点五 t 混合参数的怪物级模型,首创 agent swarm 架构,能同时调度一百个智能体,并行干活 一百个智能题。这是要组团打副本啊,对执行效率直接提升四点五倍,能跑一千五百个步骤。而且 k 二点五原声支持视觉和文本二五六 k 上下文在 h l e brascom m u pro 这些精准测试里全面超越 d c v 三和 g p t gemina。 视觉编程能力怎么样?能从自然语言直接生成完整前端代码,还支持视觉调试。同步开源的 timi ko 支持终端和主流编辑器。 agent sdk 也快开源了。另外,腾讯混元图像三点零也开源了八零 b 参数的图声图模型, 引入思维链机制,阿里的 logicsam 八 b 推理模型也通过错题驱动实现了突破。外哥刚才聊的是开源模型,那三大闭源厂商最近有啥动作吗? 动作可大了! openai and froppy 和 google 这三家几乎是同时发力, openai 推出了 prism 科研工作空间,基于 gpt 五点二免费向拆 gpt 用户开放,提供 latex 文献检测,这些功能专门给科研人员用的。哦,那他们自己的芯片呢? 对,同时发布了自研 ai 芯片 made 二,两百 fps 四,性能超十匹套 fops, 专门为 gpt 五点二这些大模型提供算力支持。 那 android 和 google 呢? android 给 cloud 加了 m c p 服务,可以直接在对话里调用 figma、 github、 camera 这些工具,从聊天机器人变成了真正的智能体平台。 google 则推出了 ai plus 计划,月费七点九九美元, 提供 gemini 三 pro 模型和两百 gb 云存储。还曝光了 aluminum os 界面,深度融合安卓和 chrome os, gemini ai 成为系统核心,三家都在抢占生态和基础设施的制高点。外哥刚才聊的都是产品更新,那技术层面有什么大突破吗? 有啊,今天技术圈炸了, timi k 二点五开源了一个一点五 t 参数的猫模型,三十二 b 激活参数最牛的是它首创了 agent swarm 架构,可以同时指挥一百个智能体并行干活,执行时间直接砍掉百分之八十 一百个智能体验。这不就是 ai 版的分身术吗?对,而且它能处理一千五百个步骤,在 h l e, bras、 comp 这些精准测试里,直接超过了 g、 p、 t 和 gemini 这些闭源模型。 另外, deepsea 也没闲着,他们的 oc 二二用了视觉因果流技术,把视觉 token 压缩了十六倍,阅读顺序的准确度大幅提升, 这压缩率有点狠啊。还有更狠的,斯坦福和英伟达搞了个 ttt discover 方法,让模型在测试阶段实时学习,解决那些训练时没见过的科学问题。性能超过人类专家,成本才几百美元,这是推理犯事的重大突破。哇,哥刚才聊的是模型,那开发工具这边有啥新动态吗? 有啊,今天开发工具集中升级了。先说 curser, 他 们开放了一个内部命令,叫 dissop, 专门清理 ai 生成的代码垃圾,比如勇于注视异常的防御检查,还有类型强制转换这些问题清理完还给你一份简洁的变更总结, 这个使用。那 code c l i 呢? code c l i 升级了,新增了原声盘模式,你可以在执行前先确认修改方案,避免直接改代码。它会自动生成任务计划,清晰列出要改哪些文件,具体步骤是什么,通过配置文件或命令行就能开启, 还有别的吗? transformers v 五正式发布了某模型,性能提升六到十一倍, api 简化了,还支持动态权重加载、量化张量并行。这些配合 v l l m 零点一、四点一用单提示,推理速度提升百分之五十,并发推理速度直接翻倍。 这波升级确实给力,开发效率直接起飞了。蛙哥刚才聊的是工具,那模型本身呢?最近测评结果怎么样? 哈,这个问题问得好, timi k 二点五,在 h l e 和 bras comp 测试中拿到了全球 s o t a, 编程能力甚至超过了 cloud opus 四点五。不过用户吐槽说精准成绩漂亮,实际用起来感觉没那么神, 所以还是得实战检验啊。那阿里的 quan 三 max thinking 呢?正式版表现很猛, g p q a diamond 拿了九十二点八分, i m o s o bench 九十一点五分。它用的是经验累积式多轮迭代策略,不是简单重复提问,而是真正在学习,但 api 速度还得优化。 国产模型这是全面追上来了。对豆包在博物馆导览测试中表现最亮眼,历史文物解读、文化背景分析、真伪鉴别都很准,本土文化理解这块国产模型已经领先了。歪哥,最后聊聊社群开发者的反应吧。 t m k。 二点五在 reddit discord 炸了锅, 对 reddit 的 local 拉玛板块六百四十三条讨论,大家都在测试。 agent swarm, 一 百个子智能体并行跑一千五百步,速度提升四点五倍,这对复杂编程任务简直是质的飞跃。 不过定价有争议啊,工具调用配额消耗太快,促销价二月就结束了,后续成本可能扛不住。是的,但多模态能力确实惊艳, discord 用户验证了他能把屏幕录制直接转成网站代码。 el marina 说,创意写作和前端开发比 gemini 三 pro 还强,不过小众领域准确率还得提升。 open router 集成还有点问题,工具调用、端点报错,图片幺二幺处理也不稳定。另外,社群还在热议克劳堡更名 modbay 的是开发者警告他零售权获取环境变量存在数据泄露风险,大家用的时候要小心。 好的,今天的 ai 日报就到这里回顾一下。我们聊了 kimi k 二点五的开源突破, a 阵,集群架构、多模态能力,还有社群的真实反馈。 对开发者来说,这意味着开源模型正在追平甚至超越闭源巨头。 agent 架构和多模态融合是未来的核心方向,创业者可以关注 agent swarm 这种并行架构,它能大幅提升复杂任务的执行效率,这是真正的生产力革命。 如果觉得今天的分享对你有帮助,别忘了点赞关注转发一箭三连哦!你的支持就是歪哥继续更新的最大动力,也欢迎私信我,聊聊你最想聚合哪类 ai 信息,我来给你定制日报内容。感谢大家收听歪哥 ai 研究院的每日 ai 日报,我们明天见。

兄弟们,今天我终于花费巨资两百大洋,为大家深度的体验了一把 agent 集群模式,说实话让我有点失望,为什么呢?因为我要处理的主要是长文本的写作, 结果我花了差不多一个上午的时间,先给他去搜集整理了相关的文献,每个文献的大小不超过一百兆, 所以我呢,精心的选择了五十个文献,基本上覆盖到了论文写作的所有的方面。 我把它上传到这个对话框里面之后,然后我就给出了一段非常具体的指令, 后来就等了十来分钟,他终于给我生成了一篇一万七千多字的文章。但是他生成的文章有一个有趣的地方,就什么呢?他只能提供一个 txt 的 文档,而不能生成一个合格的 word。 当我把它复制粘贴到我的 word 里面去了之后,大家可以看一下,这就是在 kimi 二点五级群模式下所生成的一个文档,长度还是可以的哈,一万七千六百二十一字。 但是他的注视就让我有点抓狂了,他有这么多注视,但是只有注视的符号,却找不到任何一个注视, 后面虽然也附了参考文献,但是和注是完全不对应的,也就是说你还得重新给他注一遍,这不是让人抓狂是什么样?而且看他生成的这个文本呢, 有点像一个文献综述,缺乏论述的逻辑性和针对性。我们再来看它,之前是在 kimi 二点五 agent 普通模式下,这里有 kimi 二点五 agent 集群模式,还有 kimi 二点五 agent 普通模式, 我就是在这个普通模式下生成的。大家看一下这篇论文,它的注是和后面的参考文献是一一对应的,你们看 是吧?非常的具体。当然参考文献的数量呢,不好说,但是他全书有一万八千多字,注是有八十六个,而且每一个注呢都能对应到具体的这个参考文献上面去,这其实就给我们省了非常非常多的时间。 所以我感觉这个集群模式,可能对于我们这些想要用它来进行长文写作的,尤其进行科研写作的这些学者呢, 未必有什么大的价值,但是他最大用处可能在编程或者其他网站平台的搭建方面,在工作流的处理方面,可能在这些方面有令我们意想不到的效果。 当然我后期可能去体验一下,看看他还有一些什么特别宝藏的东西,也就当为大家提前去踩一下坑吧。

kimi 二点五版本正式上线,还开源了!我琢磨了半天,发现这新功能是真实用,尤其对咱老师写教案、办公写代码的朋友。首先说最惊艳的原声多模态视觉。简单说就是 kimi 能看图看截图看录屏了。 之前咱传个图,他顶多识别个文字,现在不一样了,连界面操作、文档结构甚至代码逻辑都能给你发的明明白白。我给你举个实际例子, 比如你做 ppt, 想参考别人的版式,但不知道咋调格式,你就打开 kimi, 点左上角,上传文件,选图片截图,把别人 ppt 的 页面截图传上去。然后直接说,帮我分析这个 ppt 的 版式结构,包括字体大小、配色方案,再按这个风格生成一页关于季度总结的 ppt 内容。 等个十几秒,它不光给你列出版式细节,连文字内容都给你写好,你直接复制到自己 ppt 里改改就行。还有 agent 集群机制办公和工具能力升级编程优化 teamcode 这次升级真的太顶了,大家赶紧去用起来吧!

你知道吗?真正颠覆性的技术突破,往往诞生于无数次失败之后。今天就带你揭开 kimi k 二点五模型背后那段极少人知道的研发真相。他的第一个狠招是智能体风群,一个模型能同时调度上百个子智能 体并行工作效率飙升百分之四百五十。更关键的是,每个智能体拥有独立记忆,彻底解放补脑负荷。这不是单纯推算力,而是架构设计的真正创新。但鲜有人提及的是,在此之前,他们经历了至少五十七次规模化失败,团队花了数月才从死胡同里闯。 而破局关键往往是一个简单却被忽略的方案。这揭示了一个残酷现实,当前注意力机制可能已接近瓶颈,未来的突破不再架构内卷。而在全新的学习算法,他们的研发方式更值得深 思。从单只 p u 开始验证路径,敢于公开百分之八十七的失败数据。团队文化极度务实,鼓励质疑,拒绝包装在算力缺口高达百分之六十的约束, 他们选择不盲目对标大厂,而是专注解决可验证的真问题。所以,下一代 k 三瞄准的不仅是十倍性能提升,更是一条新路,限性处理器机 制。这场突破告诉我们,真正的创新不是一直光芒万丈,而是在黑暗里再次重启,直到长虹无惧失败,技术才能真正进化,踏出星辰大海。

不得不说,现在的国产 ai 真的 让人刮目相看。最近 kimi 发布的新模型 k 二点五,直接用实力证明了什么叫以少胜多。谁能想到,仅用顶尖 ai 实验室百分之一的资源,他竟然就能在被称为人类最后的考试中拿下五十点二的高分。不仅在代码、视觉理解等多个领域的测试中都取得了全球开源模型的最佳成绩,从实验室到商业化落地, 更是把效率优势发挥到极致。 timi 是 全球首个在大型语言模型训练中跑通利用优化期的公司。同时, timi 自研的新型注意力机制在处理速度上已显著超越传统的全注意力系统。现在 timi 系列模型还全面开源,让更多开发者能用上顶尖技术, 真正实现智能屏权。而且 k 二点五是真的把实用做到了普通人能感受到的层面。以前这个编程、做设计都是专业人才的事,现在普通人也能轻松上手刷到喜欢的网页动画,只要录个屏传给他,就能自动拆解背后的逻辑,生成专业代码。为了让拼力真正融入大家的日常工作流, k 二点五已经开始 熟练掌握 office 套件的核心技能。最近不是简单的技术突破,而是中国 ai 在 全球赛道上的一次定节奏。我们用百分之一的资源跑出超越想象的中国速度,证明了高效创新远比盲目堆料更有力量。你可以永远相信中国速度,更可以期待国产 ai 未来的更多惊喜。

大家好呀, kimi 二点五昨天已经发布了,那很多人会拿它来跟现有的一些大模型进行比较对,接下来我将用五个安利带大家一起来看一下 kimi 二点五目前的一个大模型的能力。我拿出来对比的模型是 nano banana pro 以及 gemini 三,我们一起来看一下吧。 首先第一个案例是绘制一个六乘六的网格,每一行每一格都有它独特的内容哎, nano banana pro 这边很快就出来了,并且它的一个绘制目前来看是没有什么问题的。 kimi 这边的话用那个二点五 agent 来进行一个实现,它在整个构建的过程当中就相对会比较慢一些,因为它会去调用 agent 里面的一些 skill。 他的一个整体输出是以 emoji 的 方式,那么基本上他的一个输出的准确性是没有问题的。下面我们来进行的是第二个案例,内容是生成一张三比四的图片,然后上面主要是写茅屋为秋风所破歌,内容是要完整的全文,然后上面要标注汉语拼音, 同时要以水墨画的方式来呈现。那么我们来看一下中文内容是没有问题的,他的拼音是有问题的,我抽了很多次,目前为止没有让我有一个百分百成功的一个案例,来看一下 kimi, kimi 的 整一个词句以及他的拼音目前看起来好像没有什么太大的问题。 这一个我觉得 kimi 这边的一个整个输出对中文的理解都是 ok 的。 下面我们来看一个图片,对,图片其实一直是 nasa banana pro 这次引以为豪的一个统治的令,这边也是拿了一个网上的案例,是中国最高桥梁花江峡谷大桥, 需要它来描述桥梁的基本信息,并且进行一些标注。那来看一下左边的这个 nano banana pro, 它这边的一个整体标注,它的一个高度、宽度,一个竹篮的长度以及一个横跨。在这一版里面它也没有做的特别的清晰。看一下 kimi, kimi 的 信息其实是对的,但是它的一个标注能力其实没有那么强。 接下去我们来一个中文题,需要他进行一个思考和逻辑判断的,主要的是描述公元前二百六十年五月到十月之间,东京多少,北纬多少发生的一个事情。那这个事情其实主要就是一个长平之战,秦国跟赵国一个战役, 我们来看一下他们在整体的内容的输出以及排版上面会不会有一些问题。 nano banana pro 今天整个准确性上面感觉是有点降智了,这里出来的时候是全文字,可能他中间在调用他整一个模态的时候出现了一些异常。 来看一下那个 kimi, kimi 这边是给了一组图,针对于每一个图,它也给了一个对应的一个介绍,同时给到一个详细的一个信息图的一个汇总,所以两边在模态展示上其实都没有达到我的要求。我们来看第四个案例, 四个是一张图片,我希望将这样的一张有年味的饺子的图片,把它替换成红烧肉,然后它整体的场景与文字都要做相应的变更。速度上面还是拿 no banana pro 更快。它整体的一个替换效果都是很好的,包括这个红烧肉,然后酱油肉肉片,然后八角这一些, 那右边是 kimi 的 整个样式看起来其实也没有太大的问题,只是这个大手拿着一个大勺子不太符合这个微缩的场景了。对,那这图片上面感觉目前确实还是拿 no banana pro 来的更好一些。 最后我们来看一个制作网页的这样的一个案例,帮我建一个个人网站,首先是要莫兰迪色系的,然后内容是要展示个人的基本信息,经历、技能和项目内容,数据的话由他自己来默克。然后交互需要高级,交互的高级里面我的要求是参考苹果的玻璃锂态的一个效果, 其实整一个输出上面 gemini 就是 ai studio 的 一个整体 build 上面非常的快,它其实大概只用了五十几秒的时间,基米它整一个是一个以 agent 的 方式去调用了不同的它的一个工作流,所以整体看起来会比较慢,包括昨天我在测试的时候,可能一下子涌入的人太多了,整体的算力 存在一个比较紧张的一个状态,我整一个网站的产出大概是花了我大半个小时的时间。整个效果我们来看一下,这个是 as studio build 的 整个一个玻璃拟态的一个效果是非常棒的,包括它的弹框浮层以及它的这种动态的微缩的这种感觉啊, 但是它其实在这个莫兰迪色系的一个抓取上面并没有有一点渐变色,我们来看一下 kimi 它的一个色系确实是会比 vs studio build 更莫兰迪一些。然后它的一个整体展示也是中文的,它的内容的分布 以及鼠标放上去的放大缩小的这种感觉,它其实是都做了,但是它的一个整体玻璃底胎的这种效果还是差了一点的。所以整个几个测试下来,我自己的感受是, kimi 二点五其实是能打的,包括它的费用其实跟国外相比也是非常的优惠的, 他的 agent 的 能力他也用到了他目前自己内置的一些 skill 相关的功能,但是图片这个维度看起来还需要再加把劲。对,那这个就是我今天的一个整体的测评分享了。记得一件三连哟,拜拜。

今天 kimi 发布了二点五的多模态大模型啊,据说是比 cloud 四点五还要强的模型。我们今天来这个官网上测试一下,你看,这里可以做网站,我们就做一个外贸电子产品的网站吧。 well, 我 想做一个外贸电子产品的顾问,请你记好目前的最新。 你看这这这是这样,我们看它效果怎么样。都在执行了。 你看它也用到了最新的 skills, 他应该是自己做了很多 skill, 正在编辑。 这里可以看到他已经用到了这个二点五调研 ppt 网站表格。这个二点五已经全量上线了, 如果他这个效果好的话,我可能会后面充会员试一下。 你看他现在已经做了很多这种任务了,自己做了这个 p r d 文档,用你 at 技术站搜索图片素材优势结合服务器网站。 这里是带版权的,看哎,能不能点进去哦,还在创建文件看。 我们可以看到看一下他的外网,他那个很很多这个测试。 这里测试写的是,就是比这个 g d p 五点二 pro 的 off 值四点五还要好,但这里没有对比那个 pro d。 哦,是对比了 off。 boss 是 八十点九,这个是七十六点八,还差一点点。这个是目前编码最强的,这个是思考编白电路最强的,这个是画图最强的。 你再看一下他现在写的怎么样了。还在写啊,这个速度感觉比之前那个上面的还是要慢一点的。 我顺便说一下,现在这个 cloud bot 已经改名字了,它现在不叫那个 cloud bot, 因为那个法律问题啊,版权问题啊,它现在改名叫这个了。 multi bot 安装指令是这个, 再瞧一下他编排的怎么样,这个速度实在是有点,你看净度还在这里,十杠一 暂停一下, 当前净度是十啊,终于跑完了,跑了大概半个小时吧, 我们去看一下它这个你看这个是设计文档,这里都跑完了,这是十,现在可以看它的技术栈,右里 app 加 type script highwind 动画库。来我们去预览一下 哦,还是可以的,相比就是谷歌那种风格的话,它这个风格还是别出一辙的。 看一下这蛮不错的。哎,英文 中文, 这就是一个简单的,看看能不能用啊,还是可以用的,看观看视频 哦,它还是有一些细节没有啊,这个内衣也是没有的,放购物车没有错,看,这是什么哦,这是分享适配手机, 这里可以下载这个文件,我们看一下。下载有八兆,这里可以下载。嗯,这里可以下载成一个完整的一个项目,这个比那个 之前那个谷歌出的那个玩的时候好一点,因为这个下载的是一个完整的项目,之前谷歌出的那个不是完整的, 它还是需要你用代码去转的。这个应该是一个完整的项目,你看这有一个 d s t, 这是一个编辑好的文件啊,这是一个完整的项目啊,这里有 index。 从这一点来说还是比较良心的,因为这个这样的话,有了原文件,你在这个基础上改就特别方便了,不用再转一遍。之前写了一个一个谷歌在里面转那个网页的一个工具,有这个的话就不需要那些东西了。 嗯,那今天的分享就到这里,拜拜。

kimi 二点五来了,我这几天深度测试了它的核心能力,只能说非常惊艳!首先是做 ppt, 以前熬一整晚才能做完的汇报,现在直接丢给 kimi 一个主题, 几分钟就给你一份排版精美、逻辑清晰的完整演示文稿,从大纲到设计,全自动搞定。更夸张的是,这个录屏复刻,看到喜欢的网站动效,直接录个屏传给 kimi, 它自动拆解交互逻辑,生成专业代码, 连图片的都给你还原的明明白白。还有这个学术党狂喜功能,上传一篇论文缜密,不仅能深度解读,还能直接生成一个精美的交互式网页来呈现核心内容。枯燥的学术内容瞬间变得直观又好看,做学术汇报直接起飞!但真正的杀手锏是这个 agent 疾群! 以前 ai 只能单兵作战,现在 kimi 能自动创建上百个智能体,并行工作复杂,任务拆解多现成执行效率直接翻几倍。写报告、做调研、搞创作,相当于同时雇了一个专业团队给你打工。登录 kimi 点 com 就 能体验,大家快去试试吧!

这个 kimi k two five 一 出来大家就炸了,就觉得,哎,这个东西可能会让 ai 真正的变成一个人人可用的一个工具,就真的是那种 就每个人都可以用的感觉,就好像每个人都可以当老板啊,就这种感觉。咱们先来聊第一个部分,就是这个效率飙升利器, agent swarm 智能体集群。 首先第一个问题就是这个东西到底是怎么帮我们提高任务处理效率的?这个就相当于说原来的那个 ai, 它是一个人在干活,现在它是可以分身成最多一百个 agent, 然后去并行地处理这个事情。它的这个工具调用次数也可以达到一千五百次。 它是我们目前最强大的模型,在 a 阵编程、视觉和各种通用任务上都表现出色。更重要的是, k 二点五是一个开源模型。 k 二点五在极具挑战性的 a 阵评测中取得了当前最佳表现,包括 h l e browse com、 deep search、 q a 等等。 同时他的编程能力也非常强,我们不光是想让 timi 会写代码,更希望他具备设计审美,他能做出那种像专业设计师出品一样有高级审美和动效的网页。 k 二点五通过视觉能力把编程的门槛真正降了下来, 直接传个录屏给他。 k 二点五会用干净专业的代码把它从头到尾复现出来。接下来看一下办公场景。为了让 timi 真正融入大家的日常工作流, a 二点五已经开始熟练掌握 office 套件的核心技能。不管你是要搭建复杂的财务模型,还是要处理专业的 pdf 排版,或者是制作一份咨询公司级别的 ppt, 我 们希望把这种专业能力赋予给每个人。以前那些得花好几天才能搞定的任务,比如说把五十个不同部门的报告合并起来, 或者把一篇三万字的论文编成一份精准的 ppt, 现在可能只需要十几分钟就能搞定。就这个 agent swarm 和 传统的那种 ai 的 最大的区别到底体现在哪里?就最直观的就是它不是一个人在干活了,它是一个集群的智能体,它可以并行地去处理这个事情,然后它也不需要你去提前定义好每一个步骤, 它会自己去分析这个任务,自己去拆解这个任务自己去调度,等于说就彻底把用户从这个繁琐的流程当中解放出来。没错没错,而且就是它这个 kimi k two five, 它是 自己通过这个 p a r l 就是 并行智能体强化学习,然后自己学会了怎么去协调这些子 agent 的。 所以他在遇到一些大规模的复杂的任务的时候,他会比这个传统的 ai 快 非常多, 而且他也会很稳定的去输出这个结果,所以就是人类用户就只需要说提出我要干什么就行了。这个 agent swarm 到底能在哪些实际场景当中发挥它的威力呢?比如说你要在一百个不同的领域里面 去筛选出 top three 的 创作者,然后他可能几分钟就给你整理出来一个非常结构化的结果,就这种速度确实很夸张。还有就是比如说你要做一个呃几十篇论文的这种文献综述,他也可以帮你很快的就分好工写好。然后包括你要做一些这种 市场分析,或者说这种产品开发的一些多步骤的这种项目,它也可以就是自动的帮你拆解成一个个小任务,分配给不同的 agent 去做,就会大大减少你这种人工的繁琐的操作。 ok, 对, 对,它的这个在一些权威的测试里面的分数已经超过了很多 同类的这种开源的或者闭源的这种大模型。对,所以它的这个性价比和它的这个实际的能力都是非常让人惊喜的,这个生产力平权啊,真的是离我们越来越近了。好了,那就是这一期节目咱们就到这里了,然后感谢大家的收听,咱们下次再见。拜拜。

朋友们,就在昨天,现在是一月二十八号,在昨天一月二十七号, kimi 发布了他最新的模型 k 米 k 二点五, 可以看一下他在各项精准能力中的测试了,基本上可以说已经和国际的顶尖模型持平了, 并且在代码测试中,它是超过了杰米娜和咱们的 g p t 五点二,最重要的是它更新了一个功能,我往下翻给大家看一下。 kimi k 二点五,它更新了一个 i g t 集齐的功能,它可以专门建立动态的 i g t, 就 像你 创建一个公司,然后给你的员工分配任务一样,去完成所有的任务,好给大家看一下啊实际的效果。我在这边已经跑了一个, 这里一共给了他一二三四五六七八八个文档,这个文档是整个设计网站的设计方案,包括前端后端,我要让他一次性给我输出这套网站设计的非常全面,并且还有多多个参考的网站都放在这里。 可以看到一开始他就直接给我创建了两个新助手,一个太极和一个一飞,就是一个全站工程开发师来用到了我在 在网上设计中给他们说的要用到的这些技术路线。太极是一个专门开发前段的那么一个人,他现在专注于开发前段,一个人开发后段,等我结果跑出来了,给大家看一下效果。

大家好,欢迎来到小易的课堂, kimi 推出二点五模型也实施当下反响热烈的智能伙伴,他知识储备丰富,响应速度快,能在很多方面给咱们提供高效又实用的帮助。今天我就来给大家讲讲教培老师怎么用 kimi 二点五模型辅助课程设计落成 第一部分,课程内容创作以往咱们设计课程内容耗时又费力, kimi 二点五模型就像一个二十四小时在线的超级助教。 比如你要涉及历史课程,只需告诉他课程主题和重点,他能迅速生成包含历史背景、事件经过、人物分析等丰富内容的出稿,就像有个历史专家在旁边帮你出谋划策,让课程内容既丰富又有深度。第二部分,教学方法规划 不同学科、不同年龄段的学生适用的教学方法。 q 零二点五能根据课程特点和学生情况,提供多样化的教学方法建议。 比如教小学生数学,他可能会建议用游戏化和故事化的教学方式,把抽象的数学知识变得生动有趣,就像给教学方法开了个百宝箱,让咱们能轻松找到最适合的教学手段。第三部分,课程评估与感 课程设计完成后,还需要不断评估和改进。 qm 二点五可以模拟学生的学习过程,为课程进行评估,找出可能存在的问题,比如知识点难度是否合适、教学节奏是否合理等。这就好比给课程做了一次全面的体检,让我们能及时发现问题并做出 调整,让课程越上越好。家人们, kimi 二点五模型在课程设计中真的能帮上大忙,你们有没有用它试过设计课程呢?使用过程中有啥疑问都可以在评论区留言交流哦!我是小一,我们下期见!

朋友们,就在昨天,现在是一月二十八号,在昨天一月二十七号, kimi 发布了他最新的模型 k 米 k 二点五, 可以看一下他在各项精准能力中的测试了,基本上可以说已经和国际的顶尖模型持平了, 并且在代码测试中,它是超过了杰米娜和咱们的 g p t 五点二,最重要的是它更新了一个功能,我往下翻给大家看一下。 kimi k 二点五,它更新了一个 i g t 集齐的功能,它可以专门建立动态的 i g t, 就 像你 创建一个公司,然后给你的员工分配任务一样,去完成所有的任务,好给大家看一下啊实际的效果。我在这边已经跑了一个, 这里一共给了他一二三四五六七八八个文档,这个文档是整个设计网站的设计方案,包括前端后端,我要让他一次性给我输出这套网站设计的非常全面,并且还有多多个参考的网站都放在这里。 可以看到一开始他就直接给我创建了两个新助手,一个太极和一个一飞,就是一个全站工程开发师来用到了我在 在网上设计中给他们说的要用到的这些技术路线。太极是一个专门开发前段的那么一个人,他现在专注于开发前段,一个人开发后段,等我结果跑出来了,给大家看一下效果。

国产 ai 站起来了! kimi 二点五性能远超 g p t 五点二。官方精准显示 kimi k 二点五在代理任务上领先,其中哈雷要一得分百分之五十点二,高于 g p t 五点二的百分之四十五点五。 jimmy nice and pro 的 百分之四十五点八。效果最直观的就是 agent 集群这个功能, 它就像一个包工头,能自动分析复杂任务,然后组建智能体团队并管理团队完成任务,输出多个结果。例如这个全球抗衰成分全景扫描报告,不仅生成了包含九个工作表,收入了九十种抗衰成分的完整信息的报告,还有多个可示画图表。其中普通 chat 或者 agent 的 模式也很好用, 无论是做文档、表格还是网站都能胜任,而且知识多,模态输入了很方便。我是一平哥,关注我,带你走进学术的 ai 世界!

据最新爆料,月之暗面旗下 kimi k 二五模型上线仅三天便交出炸裂商业打卷,全球付费用户环比增长四倍,海外市场收入正式超越国内,成为国内大模型全球商业化的标杆案例。 此次 k 二点五以无发布会最末上线的低调姿态,却在全球 ai 圈掀起高热。一托原生多模态架构百人 a 阵的极品协助全站代码生成能力图形,在 oppo r o t 平台掉量跃居全球第三,仅次于酷奥桑奈斯第五 与 jamie 三 flash 太原属性叠加,高性价比定价,快速击穿海外开发者与企业用户心智。 在 s w e bench h l e 等任何基础测试中, k 二点五多项指标已兼头部的原模型 却仅为同类产品约七分之一的使用成本,形成技术与价格的双重优势。商业化爆发并非偶然,此前瑞士案例已透露,二零二五年下跌,全球付费用户月增速达百分之一百七十十一月起,海外 api 调用收入三个月翻四倍, c 轮超不融资后,现金储备突破百亿,为国际化扩张助牢资金抵挫。 从长文本处理赛道切入到多模态智能体能力全面落地,听你跳出国内棚式化竞争,以技术硬核加生态开放加全球定价的组合策略,打通西端订阅、低端 api 授权行业解决方案的多元变现电路, 海外收入反超国内,标志着国产大模型从技术出海迈向商业盈利出海的关键转折。 在全球 ai 模型市场格局重构起,虚拟凭借开源合规协议、低进入门槛与稳定性呢?快速渗透欧美开发者生态,打破海外用户对国产 ai 模型的不有认知。 从模型迭代到穿越地环, kimi 用三天的增长曲线证明,硬核技术加全方位运营是国产大模型走向世界的核心路径。 随着 a 阵的生态多模态场景持续升华,睿智暗面有望进一步拉开身位,带领国产 ai 在 全球市场占了第一梯队。 kimi k, 二点五,国产大模型出海, ai 商业化。