粉丝1356获赞8224

不要再去折腾本地部署 openclaw 了, mini max agent 最近进行了一次全新升级,上线了全新功能的 max claw, 十秒钟即可在云端启动一只大龙虾,让 openclaw 变得开箱即用。另外一个重大更新则是 expert 二点零能力。 expert 就是 针对特定场景的专属智能体,而在二点零版本中,只需要用自然语言描述任务目标或者能力需求, agent 就 会根据目标自动创建并且配置对应的专家。无需专业开发能力, 普通用户也能把自己的技能与经验注入 agent, 把具体领域的流程沉淀为可付用的 sop。 本期视频是个手把手的教程,我们先借助 expert 二点零的能力,创建一个周末去哪玩?专家只需要给 ai 城市跟日期, expert 就 能针对活动类型、季节、天气、交通地理、上映电影等信息进行综合的分析, 规划出一个最适合的周末休闲行程,能带来各种创意与惊喜,专治选择恐惧症。视频的后半段,我们再来试玩下 max crow, 让他化身贴身的行程管家,在周末出门玩的时候获得行程、交通、天气的提醒,还能随手记账。 我们来到 mini max agent 的 官网社区,里面已经有了一万多个公开的专家,含盖了方方面面的能力,大部分都是用户自建的。我们也来创建一个自己的 expert, 在 右上角点击创建,输入提示词, 创建一个周末去哪玩儿的 ai 专家。用户提供一个城市跟时间, ai 能自动搜索事件,比如城市活动展览、音乐节季节适合的公园、博物馆特展等等,把 最适合的事件作为核心活动,然后输出一个一天的活动规划。很快, mini max 完成了专家的创建,填充了原数据、视力问题、应用图标,还有指令文档等等。我们可以点击配置按钮, 对 expert 进行微调,比如把名字改成周末去哪玩。这个 expert 的 核心骨架已经搭建完毕了,具备了基础的能力,不过它的大部分知识都是来自于网络搜索,我需要给他更多的精确数据来丰富他的能力。 一个能力就是地理位置信息的感知能力。这里我准备接入高德地图 m c p, 让 ai 能够获取附近的地理信息的数据。在创建页面的右侧找到能力,添加 m c p, u r l, 里面填写高德地图的 m c p 地址, 后面要替换上在高德官网上面申请的 k, 最后确认保存,把 m c p 的 能力开启起来。这个 m c p 具备了地理信息检测还有查询天气的能力。 我们先利用查询天气的能力改造一下这个 agent, 这里输入提示词。整个专家工作流的第一步,先用高德地图 m c p 查询天气,如果天气不好,就只推荐室内的活动。很快 ai 完成了修改,主要修改的是指令部分。我们看到在指令里面,第一步会先调用 m c p 查询天气, 然后根据天气来规划是室内还是室外的活动。当然这个 m c p 的 核心能力还是地理位置信息, 我们可以基于这个能力再改造一下。这里输入提示词。推荐餐厅的时候,先用高德地图 m c p 查询核心活动的地理位置坐标,然后再基于这个地址查询附近的餐厅,还可以查询好玩的活动作为下半场比, 比如附近有电影院,可以加入电影等活动。 ai 通过修改指令,把这些能力也加入了 expert, 点击右上角的创建按钮,就可以把 expert 发布出去。我们可以选择个人使用还是公开,这里我先选择个人,然后我们开始对话测试一下。 我需要规划一个济南三月一号跟女友约会的行程。 expert 先是查询了当日的天气,发现气温较低,而且下雨, 他决定选择推荐室内的活动,推荐了韩美林生肖艺术展,推荐了附近的餐厅,还有下午的活动等等。现在有一个问题是, expert 在 推荐电影的时候只说了是爱情片或者喜剧片,并没有说出更多的细节。 我准备再给 expert 加入查看当季上映电影的能力,这里输入提示词,这是猫眼电影 a p i 在 推荐电影的时候,使用这个 a p i 查询正在上映的电影, 找一个适合当天活动的,比如情侣约会就推荐爱情电影,带小孩就推荐合家欢电影,然后再使用下面这个 a p i 获取电影的详情,把电影的详情加入到输出结果里面。 mini max 很 快完成了修改,把猫眼的 a p i。 能力也接入了 expert, 我 们来测试一下。在刚才的约会例子上,我追加提示词说再推荐一个晚上的电影。 expert 调用了正在上映的电影, 然后又调用了电影详情的接口,对近期的几部电影进行了分析,综合推荐了一个最适合情侣约会的电影星河入梦,我又换了一个场景进行测试, 看看换一个出游的对象, expert 是 否能够应对这种变化,推荐出不同的电影类型。这次是带九岁的娃,我们看到这次 expert 推荐的是亲子电影熊出没,附上了对电影的详细介绍。整个行程看起来丰富详实。 现在我们的专家的能力已经足够的棒了,不过这些纯文字的输出还是略显平淡,我准备再给专家增加两个能力,我希望他能调用 ai 画图, 输出精美的行程卡片。我还希望他能调用网站的构建能力,创建一个行程邀约的网站。我们再来改造一下,我需要 expert 有 能力把规划的行程画成一个精美的行程卡片, 卡片里面用 ai 绘画出形成的主要内容,比如玩了什么,吃了什么,看了什么电影,最好是分成几个小格子这种。 mini max 为这个需求创建了一个 itinerary card skill, 这个 skill 里面加入了创建形成卡片的方法, expert 就 可以通过调用这个 skill 来创建形成卡片。我们基于刚才约会的 case 上面画个图试试。 ai 先是调用了 skill, 掌握了画图所需要的技能,然后规划了四个格子里面的场景,输出了一张行程卡片, 有艺术馆的生肖展、商业街逛街、科幻主题风格的电影等等,准确地展现了每个快乐时刻,让人充满了期待。除了图片的行程卡,我们还可以给 expert 加入创建网站的能力,这里输入提示词,我需要 expert 有 能力把规划的行程做 做成一个精美的 html 网页,然后部署成网站,当用户要求的时候,就能给用户制作这个网站。接下来我们还是用周末约会的那个 case 来测试一下,你帮我把刚才的规划生成一个行程网页, 用来给女友发送邀请。我们的 expert 调用了生成网页的 skill, 学会了如何创建行程网页,然后调用图片生成能力, 每个行程都配了图,最后输出了一个 html 格式的网页,并且把它部署上线,交付了一个公网可用的链接,可以把这个链接发送给女友,直接在手机上就可以打开网页,用了粉色调为主的浪漫配色,展现了每个行程的亮点,把这么一个网站发给女友, 满满的诚意肯定会加分不少。如果对配色风格设计不喜欢,还可以让 expert 继续修改,直接对他说怎么调整就行了。 mini max agent 这次更新的一个重要功能就是 max claw, 也就是一个开箱即用的云端 open claw。 如果说 expert 是 一个网页端的,周末去哪玩规划大师 max claw, 那 就是手机端的贴身管家,两个功能恰好互补。 接下来我们先来启动一个 max claw 实力,然后把它接入飞书。我们来到 mini max agent 的 首页,点击这个 max claw 按钮,然后再点击启动,选择默认模板,十秒后就拥有了一个 open claw 的 实力。 接下来我们只需要说接入飞书,按照 ai 的 提示一步步的操作。首先我们打开飞书开放平台,创建企业自建应用,然后进入权限管理,根据 ai 的 提示搜索这些权限, 全部勾选点击开启,然后直接在顶部点击发布按钮。接下来我告诉 ai 域名选择国内版,把飞书后台里凭证与基础信息里面的 ai 粘贴给 ai, 接下来按照提示,在应用能力里面找到机器人点, 点击开启,在订阅事件里面找到 web socket 长连接模式,添加这两个事件,再发布一个新的版本。我们来到飞书手机端,找到机器人打个招呼,这时候会生成一个配对码,把配对码粘贴到网页端,这样就全部配置完成。 我们周末出门玩,第一个需求就是希望定时定点的提醒行程,这里还是以约会逛街的行程为例,我们可以直接把 expert 规划的这个行程粘贴到手机端,让 ai 通过定时任务给我们发送消息提醒。 ai 给了我们回复时间,已经过去的行程它没有设置,只设置了最后一个 a few minutes later。 等到二十点零八分的时候,我们的手机上就收到了这么一条提示,提醒我们出发去看电影。当然我们也可以把高德地图的数据接入进 max curl, 让它在提醒的时候能够感知天气,感知交通情况, 推荐合适的交通方式等等。大家可以发挥想象力,把 max curl 变成一个越玩越聪明的 a a agent。 我 们再来看一个场景,周末出门玩会产生各种消费,这些都需要记账,如果一笔笔的记账,那就太费事了, 我们完全可以把这个枯燥的工作交给 max curl, 这里输入提示词,我需要你有记账的能力,创建一个专门的文件用来记账,然后如果发现我发给你的图片是账单,你就把它写到这个文件里面,你需要把这个记账的能力写入你的记忆,持久的保存下来。很快 max curl 就 把这个能力配置好了, 我们在网页端可以看的更清晰一点。首先 memory 点 m d, 也就是这个长期记忆这一段作为长期记忆, 然后他创建了一个 ly 二点 m d 文件作为账本。后面我们只要出去玩的时候,每次付款完成,截个图发给 max curl, max curl 就 能帮我们一笔笔的记下来,还能让他汇总账本,做出统计,非常的有意思。 max curl 有 更多有趣实用的玩法,而且现在已经上线迷你 max app 移动端,在手机上也能体验强大功能。好,今天的视频就到这里,感谢大家点赞支持,我们下期再见!

我将演示在 cloud bot 中,接入 mini max m 二点一模型进行使用。首先需要说明的是,最新的 cloud bot 已经更名为 mult bot。 首先需要在本地进行下载安装,复制这条指令到终端中粘贴并回车等待安装。 这里是一个许可申明。我们选择 yes, 然后进入 quick start, 我 们选择 mini max mini max m 二点一,然后粘贴我们的 mini max api key。 然后接下来是选择一个 channel, 这里我们先跳过,然后 skill status。 呃,我们现在先不配置 skill 这里的 hooks。 呃,我们可以暂时先选择这个 session memory, 也就是保留每次绘画的这个记忆, 然后等待着后端进行。呃,此处我们选择推荐项, 然后可以看到在浏览器中已经打开了这个 cloud bot 自带的前端,然后可以看到我们现在的这 assistant 是 没有输出的,因为我前面所用的 api key 是 mini max 国内版 coding plan 的 key。 这时候我们需要做一个配置的调整,进入此处 config, 然后我们往下拉有一个 models, 然后点击 providers, 可以 看到这里我们前面配置的 minmax 的 供应商。但是呢,我们需要对这里的地址调整,需要改成 minmax i 点 come, 然后勾选这个 else had, 再把 api key 重新贴入此处,然后保存 update ok。 呃,更新过后需要静等几秒钟,后端连接完成后,可以看到右上角这里的连接状态也是显示正常的,那么我们再进入 chat, 我 们来试验一下, 可以看到此处调用成功了。 当然,除了上述通过 cloud bot 自带前端进行配置的修改以外,我们也可以进入到 cloud bot 本地的配置文件,通过根目录下点 cloud bot 文件夹下打开这个 cloud bot, 点 json 文件初识配置后, 这里的 base u r l 是 mini max 海外版的模型访问地址, 我们需要把它更新为现在的这个国内版的即可使用。呃,然后也要注意一下,这里 agent 需要把这个 设置包括模型的列表中需要添加 mini max 二点一模型,然后它的这个主模型设置成 mini max 模型,即可在 cloud bot 中成功调用 mini max 模型。

ai 圈的双碗,这是提前开了吧? mi max 新发布的 m 二点五,已经在十币激活参数的极限规模下,再一次突破了旗舰模型的性能效率上线。当我们以为大模型的进化已经触及天花板,开始进入平稳期的时候,还有新的模型在突 破。而且这次 m 二点五最拿手的是它的编程能力测试。 ai 编程如果没有挑战过金门大桥,那都不算见过大场面啊。 你得知道金门大桥长什么样,还得自己建模做光影,桥上还得有车辆穿行,还有雾气和昼夜切换的功能。我没给他任何组件库,也没给任何代码参考,只甩了一段提示词。 m 二点五这门小钢炮,自己大环境规划想办法,结果只花了不到五分钟就告诉我做好了。点开的一瞬间,我真的是被惊到了。 车流在桥面穿行,桥面上空还有浓雾,最绝的是,当我拖动滑块把时间切换到深夜,桥上的灯光和远处的城市居然分层亮了起来。 很难想象啊,这是十倍激活参数达到的效果。接下来难度升级,我让他手搓一个我的世界风格的游戏 demo, 并且真的可以移动,甚至把这块浇碎,他也是一次性搞定。 还有啊,这是他一句话复刻出来的推特,一句话做出来的各种网页效果,编程和审美能力全在线。这还没完, m 二点五在办公场景,尤其是处理复杂 excel 和长文档这些硬核需求,也是能独挡一面的主力了。我把七十七万字的西游记全本丢给他,问了他一个刁钻的问题, 唐僧一共被妖怪抓走了几次,他最牛的地方是自己意识到吴承恩写书不会只用抓走这两个字,于是自动把问题优化成了社剧石斧背,把唐僧等古代更常用的表达去搜。最后他告诉我一共十五次对应的章节数抓走的妖怪是谁, 哪次是想抓,没抓走全有。另一个啊,我只告诉了他员工的出行、加班统计和考勤标准。他几乎秒算出全部四十八名员工的工资情况,还直接是 excel 格式。测完这九轮下来, m 二点五给我最大的印象是可靠。他拿手的方面像是编程处理数据文本,一次出结果 一次搞不定的智能体原生架构,也保证了他能自己规划调整,自己调用工具找到解决办法。他在智能和享用速度之间找到了那个变态的平衡。 干活稳当让他害怕,关键是激活参数才十币,这意味着它能无压力部署在各种设备上,还更划算。听说 mini max 自己百分之三十的活都是 m 二点五干完的,这才是咱们自己都能用起来的生产力。我是彭州 ai 永不眠!

好伙伴们,好,今天我们聊到这个模型,有点意思,就在近期, mini max 发布了最新一代模型 mini max 二零五。先说结论,这个人是我今年测过最具有性价比的 ai 编程模型了, 为什么要这么说呢?因为它仅用了十币的激活参数,却跑出了接近 cloud opus 四点六的旗舰级编程能力。那十币是什么概念呢?相当于同样的显存预算,别人只能跑一个时令,而你可以跑得起三个,比你速度是 opus 的 三倍。并且呢,它价格是加量不加价。 我们来做个狠活测试一下他吧,我们能给他一个比较复杂的游戏需求,比如说我们可以看到用碎街只能做一个三 d 的 飞行技术游戏,我希望有这些风格,并且呢,能够用键盘控制,我希望呢,他 音效也包含在里面,不能使用外部的音频。好,那我把这些题的词交给他,我可以看到终端显示器呢,他干了这些事情。首先他搭建了一个最基本的 c g s 的 三 d 引擎环境,接下来我们打开浏览器一看,已经可以看到一个完整的三 d 飞行技术游戏就运行起来了。说实话,这完成度呢,完全超出我预期, 一个单文件的 h m 平均不到一千行代码就实现了这样一个可玩的三 d 飞行技术游戏,虽然他中间自己在 bug 了好几轮, 比如他路径的规划还有优化,对吧?他能够通过发现问题,定位问题,最后修复问题到验证问题,最后完成部署上线,实现自主闭环。很多小伙伴也好奇 m 二点五跑分到底怎么样,那我们先一起来看一下他在榜单上的实际表现怎么样? 我对比了 cloud opad 四点六,包括 g p 五点二,歼灭三这些主流的模型,我们可以看到这些核心的板块成绩,但这些数据呢,可以看到 m 二点五呢,在编程能力上确实达到了第一梯队的水平,甚至在某些榜单上甚至超过了 cloud opad 四点六这样的旗舰模型。 这张图可以看到,横轴是每个任务的成本,那纵轴呢,是胜率, m 二点五呢?在图的右上角,胜率是百分之六十,成本却呃接近了零美元,这是什么概念呢? opus, 胜率虽然更高,但是每个任务的成本在二点五美元。 而 gdp 五点二呢,虽然它的胜率是百分之五十五,成本是一点五美元,但是 m 二点五呢,却用极低的成本跑出了接近旗舰级的技能, 这就是石币参数带来的优势,显存占用小,推率速度会更快,并且呢成本很低。那这一次呢, m 二点五呢,依旧保持传统 api 版本呢,提供了两个类型, 第一个是标准版,平衡了性能和成本。那第二个呢,是 high speed 版,这个版本的速度会更快,并且呢支持一百 tps 的 超高吞吐量,在 cody plan 的 价格呢,依旧保持不变, 这个性价比在第一梯队里面真的很难得。那我们看完参数之后呢,接下来我们来揭露一下这个 cloud code 的 模型。 那首先我们打开 mini max 的 官方文档,找到这个 m 二点五的选项,这里呢提供了详细的图文教程,并且展示了它支持的 ai 工具,那包括了 cursor clean 对 吧?这一次我们要使用的 cloud code, 对 吧?首先我们打开 cloud code 的 配置文件,将我们的 mini max k 替换一下, 然后最后重启 ctrl, 那 这样我们就看到了这个 m 二点五的这个模型选项了。记录完成之后呢,我想到一个有意思的方法,在往期的视频中,我使用 m 二点一呢,做过一个专业的 ai 翻译平台,那当时呢, m 二点一的表现已经非常不错了,但是 m 二点五呢, 相比于 m 二点一呢,提升了这么大的一个空间,那肯定是在编程能力上有所提升,虽然我们不如用同样的需求呢,重新测一遍,看看新版本到底进步在哪。那我们将同样的圆形图和需求文档发给 m 二点五, 我们点击回车,可以看到它已经开始写代码了,那可以看到相比于上一个版本呢,这一次 ui 还原的会更加的出色,然后是页面布局规划,那可以看到整个核心功能的实现都不错。 嗯,说实话,我觉得对比 m 二点一版本呢,我发现几个明显的提升,比如说它的 ui 还原度会更高, ui 细节呢会处理的更加到位。那从这个表现上来看呢, m 二点五呢,在同样的任务上确实是有进步,大家觉得这个功能怎么样呢?可以在评论区给他打个分。 下面我们一起来看一下同一个任务下各类主流模型的表现,这里呢是创建一个现代化的补课项目。 我们回车之后,可以看到 c 人物效果还不错,无论是布局,配色还是 ui 都非常清晰。那我们再看一下 m 二点五的表现, 这里呢依旧我们回车,我们可以看到这里有一个小细节, m 二点五呢,这一次内置了 space 能力,也就是说规范驱动开发,在创建任何人物之前呢,都会进行一次完整的规划,然后进行设计,最后再进行开发,那这里是 kano 最早提出来的, 这样呢,可以使 m 二点五呢具备了像加勾丝一样的思考能力。嗯,比如说我们可以看到,在动手写代码之前,他会以一个加勾丝的视角去拆解任务和功能,最后进行完成了前期的规划。好了,结果已经出来了,可以看到 m 二点五的效果呢,依旧,嗯,非常出色,对吧? 最后我们再看一下 gp 五点二的表现,有一说一,我觉得这个界面呢,相比于 m 二点五呢还是略逊一筹, 但效果呢也是不错的。好了,那以上就是 mini max m 二点五的完整体验过程呢,通过这次测试,我对 m 二点五呢有了一个比较完整的判断。最后我们再总结一下, mini max m 二点五呢是非常具有性价比的模型, 无论是编码能力还是速度都大幅提升,对外的还原能力呢和提字词的理解呢,也非常的到位。 ok, 那 以上就是本期视频的全部内容呢,我是小刘,我们下期再见。

前几天发现一个很有意思的开源项目,能让 mac 电脑也拥有灵动脑,并且可以展示播放的音乐日历,也可以将文件拖到这里, 实现隔空投送的效果。这个项目目前在 github 上已经拿到七点三 k 的 star 了,但是我在实际使用过程中也发现了一些问题,比如日历模块中日历的展示太小了,并且感觉功能还不够多。我去年的时候也有过用大模型去写一个 mac 电脑灵动脑的想法, 但当时的模型针对 mac 和 ios 的 开发能力还是远远不够的。调了好久的提示词,最后出来的是这样一个残次品。年前我刷到 mini max 发布了最新的 m 二点五模型,在 官方推文中有写编程能力,覆盖了多平台的全站项目,其中就有 ios 和 mac 平台。那本期视频我们就基于 mini max 来修改一下这个开源项目,看看在 mac 端的实际编程体验究竟有多少提升 开发工具。我用的是最新版的 cloud code, 在 mini max 官方文档中选择 coding tab 页,这里就可以看到格式 code 的 接入方式了。我自己是更习惯手动修改配置,那就只需要把这里的配置内容复制过去,接着修改一下 api key 就 可以了。这里最好用 coding plan key 编程,消耗的托管还是有点多的。 保存好配置之后,在项目目录下运行 cloud, 可以 看到模型已经替换成一个完整日历,然后写下提示词 直接运行。这个项目的代码量还是挺大的, mini max 会首先调用工具去了解项目 m 二点五这次具备了原生 spec 行为,在改代码前会以架构师的视角去拆解需求问题,接着才会开始项目代码的修改,这个 能力还是很适合 ai 编程的,不会乱改东西,会根据 spec 一 步步执行,根据效果的实际情况再来几次调整。日历模块就替换好了,从原来的一行日历替换成了一页的日历,还可以根据自己的需要继续加功能。我想在灵动岛上加一个天气的展示模块,还是一样输入提示词, 等待代码生成一遍生成不出效果很正常。来吧,口令就是得多次微调。我发现迷你 max 二点五现在的推理速度快了很多,在官方推文中也确实发现有推理速度提升。 好了,现在来看效果。左上角多了一个天气的图标,点击之后就会跳转到对应的天气页面了,可以看到当天的天气信息和未来的天气信息。后面就是根据自己的实际使用体验不断优化项目了, 这不就意味着在 get up 上能找到的好项目,基于大模型都可以按需添加自己想要的功能了。以上就是本期视频的全部内容,我是鱼仔,我们下期再见!

最近爆火的 openclaw 让 agent 这个话题再次变成热点,不过 openclaw 由于需要部署,配置非常繁琐,而最近的 mini max agent 更新了一个专家 agent 功能,已经支持全平台使用,体验更加便捷好用,甚至可以帮你来管理你电脑的文件进 行归类。比如说现在我想让他帮我整理一下电脑的桌面,可以直接点击下面的文件整理助手。首先他会扫描所有文件有哪些,然后创建文件夹,接着创建一个脚本来智能分类,所有操作都在几秒钟之内完成。 再来一个比较复杂的,我让他在小红书找到 ai 标签的视频,将所有视频抓取链接,封面,标题,然后制作表格并保存到我的桌面,最后直接生成一个 excel 文件,他也是成功的完成了。甚至如果我们已经登录了我们的账户, 我们可以让他为我们发布文章或创建帖子并直接上传。同时呢,我们也可以使用最近比较火的 skills 以确保精准操作,简直是牛马人的福音。 mini max agent 的 资料我已经整理好了,评论领取,欢迎点赞、关注收藏,我们下期视频再见!

这是我做的一个 ai 分 镜神器,可以很方便的生成这种九宫格分镜啊,甚至是二十五宫格也没问题啊。更厉害的是呢,它可以快速切割分镜,单独调整任意一格内容,然后再合并输出, 就可以很好的控制视频走向,节省了积分,也省了很多抽卡的时间啊。而且这么一个工具啊,前后我只花了三天左右就做完了啊,主要用到了迷你 max m 二点五搭配 cloud code, 整体感受这是相当的不错啊,不愧是 openroot 上调量最高的模型。 本期视频呢,我会先讲一下这个 ai 分 镜神器要怎么用,然后分享一下这个工具的一些开发过程,最后教大家怎么修改这个程序,以此来满足一些你的个性化需求。那这个 ai 分 镜助手呢,是开源免费的,需要先去设置里配置一下密钥,因为说到底呢,我们这个还是在调用 banana 的 接口嘛。那 目前我只适配了一个供应商,如果你有自己的一些渠道,那么就可以去看看后面这部分内容。用 mini max m 二点五搭配 cloud code, 快 速适配一个供应商,一个新的模型,那也是相当简单的。那在你配置好密钥之后呢,就可以新建项目,然后进入画布, 双击一下鼠标左键,可以看到有这些节点可以用。那最重要的就是这个分镜生成了,这里你可以快速设置要生成多少个分镜,然后只要在每个格子里写上内容描述就可以了。如果需要上传一些参考图片,那就从左边这个蓝点拖出来, 选择上传图片节点,然后上传图片就可以了,可以多弄几个,在风景格里输入艾特,可以快速引用图片,然后点击生成,静静等待结果就 ok 了。那选中输出的风景结果,点击切割啊,基本上不用做什么设置,直接点应用就可以了。那这样呢,我们就可以把每个格子都切割出来了, 在切割结果这里,你可以拖拽排序啊,如果需要单独修改某个分镜,只需要点击这个按钮,把它分离出来,然后拖拽右侧的蓝点,选择 ai 图片节点,你就可以用 ai 来编辑图片了。那等你觉得编辑好了,再把编辑后的图片的输出接入切割结果的输入,接着点击 分镜格右下角的这个图标,就可以快速替换了。那如果你要上传本地图片来替换,那只需要连接上一个上传图片节点就可以了。 调整好之后呢,点击合并导出啊,然后你就可以下载或者复制这个分镜。分镜的描述文本呢,也是可以选中分镜生成或者切割结果的节点之后直接复制出来的。当你理解了整个逻辑之后呢,就会发现这个流程还是非常方便的,希望这个工具能够帮到各位。 不难看出,这个 ai 分 镜助手其实还是挺复杂的,但是有了强大的 ai 模型之后呢,开发起来难度并不大啊。这里我是订阅了 mini max 的 coding plan, 选择了 plus 套餐,完全够用啊,然后把它接入到了这个 cloud code。 那 我最开始开发的时候啊,其实就是给 mini max m 二点五这么一段话, 以及这样的一个草图,用来确定大致的 ui 布局。那在确定了一些细节之后呢,他就直接开始调研分析了,那 mini max m 二点我在编程方面的提升还是很明显的啊,一些步骤的规划,工具的调用啊,即便你没有明说,他也会自主的去执行,哎,这才叫智能吧。那经过详细的调研分析,制定计划之后,就开始全自动编写代码了, 遇到报错也能自己解决啊,最后也是自动启动程序,把结果摆在了我的眼前,可以看到已经是有模有样了。那对于这样一个比较复杂的项目来说,不要指望着 ai 能一步到位啊,很 多细节还是要慢慢改的,比如说,我想用自定义的标题来让迷你 max m 二点五很快就可以搞定了,哎,这样就更像一个正儿八经的应用了。然后呢,我又让它添加了设置页面,用于配置 a p i 密钥啊,它也是能够准确理解并执行我的指令,来测试一下能够正确调用接口,生成图片了。哎, 这时候我是有点激动的啊,说明咱们这个大方向没有问题,但是现在这个节点和我想象的呢,不太一样啊,所以我就去找了一些,哎,参考,哎,所以你们看到这个界面有点眼熟也很正常啊。那然后最重要的就是说清楚需求,那这么一大段内容,就是要明确告诉 ai 我 想要什么,最终 mini max m 二点五给我的这个结果啊,这 很合我意啊,此时此刻,我也是很有信心了。然后呢,就是开发分镜,生成节点依旧是草图, u i, 参考依旧是详细的文本说明。 b max m 二点五同样也是自主决策,自 主规划,自主编码,我可太喜欢这种 ai 自动办事的感觉了,瞬间觉得这个 qing plan 买的很划算啊。最终这个结果呢,虽然和我想象的不太一样吧,但是大方向是对的哎,不必担心啊,咱们继续让它修改, 这样就合理多了。然后再调整一下,把布局从列表转为这种表格的样式,会更贴合要生成的分镜图效果。那测试结果也是很合我心意啊。后面呢,为了稳定分镜生成的效果,我还做了些优化。首先就是用 mini max m 二点五 单独生成一个测试页面,用于生成这种网格图片。那这让我惊喜的是,这个 mini max m 二点五对 skills 的 支持非常好啊,在没有明确说明的时候呢,也能自动调用对应的 skills, 最终的页面呢,也是一 点 ai 味儿都没有啊。虽然说这只是一个测试页面,但是有这样的结果还是很能说明模型的水平的。然后在正式开发的时候呢,就让 ai 去参考这个测试页面,这样就可以确保我的要求能够完美实现。 这样每次生成分镜的时候呢,就会自动传递这样一张网格图哎,生成的结果会稳定很多,不然可能就会是各种各样的边框了。那除此之外呢,还有很多很多的细节我就不坠出了。总之呢,我这两天也是在高强度的使用 mini max m 二点五啊,这个四十九的套餐呢,我可以说是相当相当的够用啊。 有了这么强的模型之后呢,你去修改这个程序也是非常简单的,配置好 mini max m 二点五,接着在这个项目文件夹里启动 cloud code 或者其他任何一个 ai 编程工具吧,然后说人话就可以了。你 给 ai 的 信息越清晰全面,那么它的效果也就越好。比如说我要让它适配一个新的接口,那么只要和 ai 说一声,然后把接口文档给他,哎,接着回车发送,哎,它就会自动调用对应的 skills, 哎,接下来你要做的就只有等待了啊,等 结束之后就可以去测试了,没问题的话万事大吉,有问题也不要慌,说清楚是哪里的问题,让 ai 修改就可以了。 那这次用下来我最大的感受就是 mini max m 二点五已经具备了从零搭建复杂项目的能力,最明显的一点就是它的 spec 能力,会先像架构师一样,把你的想法写成一份清晰的规格说明,再按这份蓝图推进实现。前期花时间多想一点,后面少返工,哎,结果也更稳定, 所以我也愿意多等一会。那以前总听说编程会是一个人人都掌握的技能啊,现在看来这句话说的还真没错啊,所以非常推荐各位去试试。那么好了,以上就是本期视频的全部内容了,如果喜欢的话不要忘点关注,我们下期再见!拜拜!

给大家测试了一下本地部署的 mini max 二点五,所以你们就不用自己测了。使用的是 lm studio iq 三 xxs 量化版, 显存需求在六万上下文的情况下大概是九十三 g。 具体的得分和测试项目的演示可以在我的个人网站查看。得分的情况是这样的,综合来看,非常接近 cloudsonnet 四 taxon 六边形小球的演示是这样的,似乎小球都在六边形外。 html 手机操作系统模拟器是这个效果。要说不说,这个效果可以说中规中矩。 总结一下, mini max 二点五的参数量稍稍有些大,在一百二十八 g 的 内存里没法跑到四比特量化的,这似乎导致其性能严重的下降, 但是作为一个本地模型,整体还是一个非常可用的状态。但是我为什么不选参数量更小,推理速度更快的 glm 四点七 flash 呢?

这是我们家小姑娘,放假了,已经看动画片两个小时了,不要看了,我就要看。好吧,只能这样了。 嗯?怎么回事?我不是写完作业了吗?还让我学习,算了,继续干,再来 怎么还来,是不是你搞的?呵呵呵,大家好,我是本觉敏。视频开头控制电脑的就是 cloud boot, 现在改名叫做 opencloud。 同样作为一款 ai agent, 看过我之前视频的朋友都知道, cloud boot 需要你坐在电脑面前给他指令和授权,而 cloud boot 是 一款真正的自主 agent, 拥有超长的记忆,就像钢铁侠里面的贾维斯一样,是你随身随地可以召唤的贴身助理。 万丈高楼平地起,我们就从安装和配置开始,因为考的步子权限特别高,而且我们需要他二十小时运行,所以这里我建议大家给他单独准备一台备用机, 最好给他单独的网站和邮箱账号。当然,低功耗高性能而且经营能力特别好的 mac mini 是 首选,这也是他最近卖断货的主要原因。但是大家没必要马上去买。呃,找一台老电脑安装,看适不适合自己再决定是否购买。开始之前,国内的朋友一定要马上去买呃,找一台老电脑安装,看适不适合自己再决定是否购买。开始之前,国内的朋友一定要打开 q 模式。我们来到官网, 这里有很多种安装方式,对于我这样的新手来说,用命令行的方式安装最方便。我们选择 windows, 可用 power shell 或 cmd 安装,我选择 cmd 复制这个命令行,打开终端运行。 安装结束后,我们开始抽象设置,用方向键进行选择,用空格键进行确认,用回车键进行下一步,这里我们同意风险提醒, booting 模式就是 ar 的 入职培训,让它能够更懂你,这里我们选择 quick start 就 可以。模型选择这里 cloud boot 的 创作者虽然很推荐 anthropoid cloud 模型,但是 cloud boot 的 上下文能力比较差, token 数量 很大,所以这里我选择 mini max m 二点一,但由于我使用的是国内的 mini mx r m 二点一, cloud boot 虽然能识别这个模型,但是没有取得它的授权,我们这里暂且配置好,等安装完成后再解决 api k 的 问题。千岛这里我选择用扫码的方式来关联,我们打开 首页,右上角三个点中选择已关联设备,选择关联新设备进行扫码。关联结束后,我们在这里写写出自己的电话号码。配置 skills skills 按需配置就可以,这里我先随便选一个 hooks, 这里可以暂时跳过。安装完之后,我们打开新的 c m d 窗口,输入 cloud boot, get 动 cloud boot。 随后我们来到 c 盘用户你的用户名 cloud boot 文件夹下,找到 cloud boot。 json 文件,用编辑器或者是 记事本打开,按 ctrl f 打开关键字搜索,搜索 mode 到第三个 mode 处,注意我选定的代码,将选定的代码替换成图中的代码,在这里填上你的 api k, 然后保存在同样的文件夹下。找到 office profile json 文件,同样用记事本打开, 粘贴进这一段代码,在这里添加你的 a p i k 之后保存。复制这个 json 文件。打开 agent, 进入 main 登录 agent, 粘贴进刚才复制的 json 文件。相关代码我会放在视频下方或者群里, 之后我们关闭终端,然后我们打开一个新的命令行窗口,输入 clubbot get 位,启动 clubbot, 我 们打开,让它打开它的配置文件夹。 好的,至此,你的贴身助理正式上线了,这期视频就到这里,我们下期视频继续探讨 cloudbot 的 使用。嗯,有用的话欢迎点赞订阅关注我们下期见。

如果一个模型只能从零到一的写 demo, 它还算不上工程工具。这次收到 mini max m 二点五的内测邀请呢,我决定做一件有点冒险的事情,我想要把它呢接近我正在开发的一款产品。好货 app。 那 这不是测试项目啊,这是一个真实的 springboard 的 后端,真实的数据库结构,真实的业务逻辑。它要在完全不能乱动现有结构的前提下,给我生成一 整套 admin 管理后台,如果说他理解错了一个字段,整个系统就会崩塌。所以今天这个视频呢,我们就不聊参数,也不聊跑分,我只测试一件事情,就是 mini max 二点五能否接管真实工程,为实际的开发工作提升效率。 好货 a p p 呢,它目前已经有一个完整的后端体系, spring boot, my circle, mango db release。 现在呢,打卡朋友圈排行榜啊,里程碑这些功能呢,都是已经完美跑起来了,那现在它缺的呢,是一套真正可以去运营的 element 管理后台。 下面这些呢,就是我们本次要开发的一些功能。本次用到的开发工具呢,是 open code 啊,我已经安装了。现在呢,我们就需要去把这个 mini max m 二点五集成进来。那我在做视频的时候呢,它还是处在一个内侧的阶段啊,大家可以看到,目前这个官网它是只能支持 mini max m 二点一的。 那这里呢,我们提前购买了 coding plan 啊,它用于这个日常开发还是非常舒服的。这边它支持的一个开发工具就有这么多,我们找到 open code, 然后照着这个文档去配置一下。现在呢,我们去随便写点提示词,只要能够看到正常回复,就表示安装成功了。 我们在项目的根目录打开 open code, 首先呢我们需要去输入这个斜杠一定的命令,让 open code 对 整个项目建立一个,所以呢可以看到它这边是用英文来回复的啊,不过没关系, 我们可以去啊,让他接下来尽量使用中文来回复我们。然后呢我让他重新生成了一下这个 agent 点, md, 那 执行完毕之后呢,我们就输入这段提示词啊,然后开始执行。 他首先呢会去制定一个详细的开发计划,那这一步呢,我建议大家可以去啊,暂停看一下,比对一下和自己的一个预期是否是一致的,那我觉得他理解是完全正确的啊,所以说我就让他继续执行了。 接下来的话呢,它会创建一个 to do list, 把这个庞大的任务啊拆解成多个小任务,同时呢也可以去追踪任务的一个执行状态。 那它现在呢就按这个顺序去执行了,完成一步呢会标记一下,那可以看到这个 mini max m 二点五的一个执行速度还是非常快的。实体类啊, controller 啊,还有这个数据操作层, surface 层的这个代码一会就生成完毕了。紧接着他对后端做了一次变异啊,然后发现这边有问题, open code 呢,也会自动的去读取控制台的一个报错信息, 然后自行修正啊,就完全不用我们操心。 ok, 那 现在的话呢,整个项目就已经变异通过了,他开始做前端项目,他生成的一个速度也是非常的快,并且中途也是没有出现任何问题的。那接下来的话呢,我们就让他变异运行一下前后端两个项目,测试了一下后端的 api, 发现是四零三了, 这里他给到我一个修复建议啊,并且让我注意的是啊,这里是因为系统健全层面的一个配置的问题,那我觉得当前是开发测试阶段嘛,对吧?就让他直接放行了,正常这里的话是需要走这个用户健全的。那后来呢,我又让他自己造了一点测试数据啊, 这里他对于整个项目已有的一个数据库自断定义还是非常熟悉的,所以说这个测试数据的一个生成以及插入都是非常迅速的。现在呢,我们就去浏览器看一下它整体的一个效果。首先是这个数据看版啊,用户总量,包括今日打卡数,活跃趋势曲线都已经正常渲染出来了, 数据呢不是假数据,而是从我们现有的一个数据库里面查询统计出来的。接下来的话呢,我们来看一下这个用户管理的模块, 这个列表呢是支持分页的,包括上面的搜索筛选也是可用的,点进这个用户详情呢,可以看到用户当时的一个注册信息,打卡记录以及最近活跃的时间。那这些字段呢,都和我们现有的这个数据库结构是完全对齐的啊,那现在呢,我就去做一个真实的功能验证啊,我选择其中一个测试账号,然后我们点击禁用, 接下来我们去到 ios 端,然后用这个账号重新做一下登录,可以看到现在已经是无法登录了,提示这个账号异常。那说明呢,我们现在后台的这个状态字段的一个修改,已经可以真实影响到我们前端的一个现有业务逻辑了。这一步呢,我觉得是非常关键的啊,就是他不是在做一个独立的后台功能, 而是可以真正的去接入啊,我们现在的一个原有系统。那接下来的话呢,我们测试一下内容的审核啊,我这边在后台打开朋友圈的一个列表,这里呢我提前准备了一条包含不文明用语的一个测试内容啊,我们现在呢就点击删除。 接下来呢,我们还是去到 ios 端,然后刷新这个朋友圈的一个页面啊,可以看到刚才的那条动态已经不见了,然后其他的一些功能也都是可用的啊,整体的一个开发效果我觉得还是做得非常的不错。那整体跑下来的话呢,这已经不是一个生成一套界面, 而是完成了一次真正的系统级别的对接啊,从数据库结构的一个理解啊,到接口调用啊,再到这个权限与状态的控制啊, 整个链路我觉得它是做到了完美的闭环。那做到这里的话呢,我比较确定的一件事情就是 mini max m 二点五呢,在这个项目里面,它不仅仅是帮我们写了代码,而是真正的去接管了一整个完整的工程任务。顺带提一嘴啊,最近很火的这个 openclock 大 龙虾呢,也是可以去直接附用 mini max 的 coding plan, 就是 同一个 plan, 我 们既可以去做日常开发,也可以去跑这个大龙虾,真正做到了一次付费,多场景使用,性价比还是很高的。另外呢,大家通过我的这个专属链接呢,可以享受八八折的优惠 活动呢,是一直持续到二月底结束的,链接呢,我就放到评论区了。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频,再见, peace。

不得不说, ai 的 进化速度真的让人难以想象,现在连垂直领域的专业工作流都能靠 ai 完成了。没错,说的就是 mini max engine。 最近上新 expert 二点零,还发布了 maxclock 新功能, 作为一个爱搞测评的科技博主,我也是第一时间没忍住上手体验,结果真的让我震撼。 它里面的专家社区简直是个保障库,从办公效率类的 pptx 制作、 excel 处理助手,到商业金融领域的股票价值分析、行业研报等等,在这里有上万个专家级 angel 能够帮你干活。比如我身边有在做家电相关生意的朋, 又平时需要行业趋势做参考,而想快速拿到专业又靠谱的行业分析,就可以选择行业研报这个专家 angel, 让他分析家电行业的趋势,很快就能走完。研究转载格式化一整套专业流程,还会自动生成研究文档、数据文件、分析图表,最终输出一份完整的行业研究报告。 内容从家电行业整体市场规模增长、全屋智能崛起,到家电产品的节能、智能、环保等技术升级方面,再到健康智能集成、个性化舒适的消费新需求,甚至行业竞争格局都有清晰拆解。 朋友说,这比他每天花大半天查资料做出来的东西专业全面太多了,直接解放双手。而像我,平时做账号运营,节日节点要赶海报,自己设计又慢又没思路。我想设计一张马年元宵节主题海报, 只需调用海报设计师这个专家 angela, 他 立马就能按照我的需求生成完整海报。不仅配色和构图有节日氛围感, 就连明月、奔马、花灯、祥云这些元素全都完美融合,直接让我解放双手,看看这深层的马年元宵海报是不是高级又好看。 现成专家没有让你满意的,他们的专家功能还支持自定义。像我平时做科技测评,经常要整理产品参数 流程,又杂又费时间。现在只需要点击创建专家,然后把这个流程指令用自然语言告诉他,不用写一行代码,就能帮我定制一个科技测评专属 engine, 包括自动抓取产品参数、净品对比、表格生成和智能交互三大核心功能,支持的产品类型覆盖手机、笔记本、平板、相机和耳机。 这对于日常高频做数码测评需要快速对比多款产品的我来说,简直是效率神器。更贴心的是,右边的一栏,连 angela 的 名称描述和定位都自动生成好了。配置精准匹配我的工作流程,后续在我的专家里就能找到。 不仅方便随时调用可见范围设置全部可见,就可以上传社区赚积分,未来还能自定义价格交易,让个人专业能力变成可变现的工具资产。 咱就是说,这么好用又能赚的 ai 生产线工具,谁用了不直呼真香!如果说 x 的 二点零让你拥有了一个专家库, 大 max curl 就是 能随时随地的为你打工的专属助理。最近爆火的 open curl, 我 们还得下载部署找 a p i, 基本都是即刻才玩得转,门槛非常高。但 max curl 把它直接平民化了,里面提前配好各种专家级 skill, 现在我直接一键就可以部署,不用写代码,点开就能用。更方便的是,它还打通了我们日常用的办公软件,像飞书、钉钉这些主流 i m 平台都能接入。我平时工作基本都在飞书上进行, 又经常要追数码圈热点,现在只需要配置热点追踪这个 engine, 再告诉 maxclock, 我 想连接飞书,然后按照他给出的步骤去操作就行了。接好之后,可以直接在聊天框调用这个功能,比如让他帮我实时追踪最新的数码产品动态, 不管是即将发布的手机参数还是爆料价格,他都能帮我快速检查,精准核实,整理成清晰信息。我直接给他发个消息,自己摸个鱼,上个厕所的功夫,他就全部整理完了, 大大减少了我去网上查找信息的时间,让我能有更多精力提前做测评。大纲内容, max globe 已在迷你 max app 移动端面向全球同步上线,大家可直接在手机端运行 open globe, 实现多端携同。 可以说, mini max engine 的 出现,真正让 ai engine 落地到了每个人的日常工作和创作中。这么智能实用的 mini max engine, 我 不允许还有人不知道,大家快去体验吧!


朋友们,我建议所有听说过 openclaw 的 人都来试试这个 maxclaw, 就是 在这个 mini max 它的 maxclaw 的 云上环境来部署 openclaw 啊,它有什么好处呢?一个是免去你这个配置在本地配置环境的一些困难,再一个是它可以规避很多风险,因为它是一个相当于是云上部署,你相当于租一个它的服务器,完全规避了你的电脑上的信息,或者是等等被它给被它盗取,或者被它删除,还有你的 a p i key 的 泄露等等,就规避了很多风险。 而且它只用花四十块钱一个月,相当于四十块钱一个月,它租了一个你可以二十四小时部署的背后它调用的是 mini max 的 模型,也是国产,也是相对能打的模型,就四十多块钱一周,免费用不用为这个,它会不用为小龙虾烧 token 而烦恼。它有一个 就是专门为 openclaw 设计的一段引导程序,你直接告诉他安装,他就能自己安装,中途没有需要确认的地方,完全是相当于是去代码化的帮你安装好,包括包帮你安装好这个 maxclaw 和这个飞书之间的桥梁,你只用在这个飞书的这个开发者后台上面安一些东西,按它的提示文档去做, 大概三四个步骤,你就可以完成整套安装。我今天是让小龙虾帮我做了一个 a 股的一个类似咨询或者是炒股相关的一个 agent, 你 可以看到它有一个当前配置,它的配置里有个选项,有了这个多 agent 源头团队,它这个还是蛮高级的,它用的是一个这个 github 上的一个开源项目 trading agent, 然后它相当于是用这个多 agent, 每一个 agent 模仿这个真实的交易公司的一个职位,模仿一个职位,把它们最后综合起来。按照这个架构, 它就有分析师、研究团队、交易员、代理等等,这个分析师里面就是这个基本面、情绪、新闻技术,这都是非常感觉是非常专业的。安装好这个小龙虾之后,呃,你再安装一些依赖,这些依赖 再安装一些依赖,我给大家介绍几个有用的,这个 a p i 调用的 a p i, 一个是这个 tu share, 它是中国金融平台数据,就可以抓取这个类似 a 股的一些数据,然后问他的时候,他可以直接抓取。 第二个是这个 tiffany, 它是面向 ai agent 实时搜索提取 a p i, 它可以实时搜索提取网络上的一些网站的信息,然后这个 firecrow, firecrow 这个 a p i, 它可以直接用 ai 进行网页抓取,直接把网页抓取下来。就最重要的是 cloudhub, cloudhub 你 连接了它的 a p i 之后,个小龙虾可以直接在这个 cloudhub 里边自己下载一些跟你的用途相关的一些 skills 帮你来做,对 还是非常好用的。其实大家可以试试,比如说我给你看我的这个记录在这,比如问他明天中海游的走势,他可以告诉你最新的行情,虽然他说明天可能无法预测走势,不过这个我觉得应该他就是一个类似免责声明一样的东西, 还有问他这个职称位,这都有问他这个两会 a 股方面的消息,他都可以给你总结,还是非常好用的,我劝大家都可以试试,哪怕是一些程序员等那种专业人士,有编程能力的人士。呃,毕竟要上班嘛,是吧,也没有时间配置这个在本地配置环境。

我们直接来看 mini max m 二点五这款开源大模型如何在性能和成本上掀起波澜。 各位如果把二零二三年看作是百魔大战的元年,大家还在比拼谁的参数更大,上下文更长,那现在也就是二零二六年初,战场已经悄然转移了,不再是单纯堆齐参数, 而是谁能用更低的成本提供更全面、更强大的能力。 mini max m 二点五的出现就像一颗重磅炸弹,它不仅在关键的编码和智能体能力上几乎能打平 cloud、 oppo 四点六这样的顶级闭源模型,更关键的是, 它的成本只有后者的大约百分之一。这传递了一个非常清晰的信息,顶级 ai 能力不再必须意味着天价成本。这不仅仅是技术上的突破,更是商业逻辑和普惠理念的一次完美结合。我们来看看 m 二点五的核心定位。 很多人可能会觉得,要对标 cloud opus 这种级别的模型,参数肯定得是个天文数字吧?但 m 二点五恰恰打破了这个参数迷信。它不是那种动辄千亿、万亿参数的巨无霸,而是采用了更精巧的 mo 一 架构。 它的核心秘密在于两点,第一,总参数量虽然庞大,但处理每个 token 时只激活大约一百亿参数,非常高效。 第二,它的设计哲学是效率优先,并且是为智能体 agent 任务而生的思考与执行引擎。这意味着它在规划、工具调用、多步推理这些方面是原生级优化过的。 这张表对比了 m 二点五和市场上常见模型的一些关键指标,大家可以一目了然地看到它的独特之处。 m 二点五之所以能达到如此惊艳的效果,背后有一套系统性的技术革新,我们把它总结为驱动其前进的三架马车。这三架马车分别是 forge, 这是一个原生的智能体框架 cisco, 这是一个针对模一模型强化学习的特殊算法以及某一架构本身,加上高效的推理优化, 这三者协同工作共同赋予了 m 二点五强大的性能和独特的能力。接下来我们就逐一拆解这三架马车。 先来看第一架马车, forge 传统的 l l m 应用智能体能力很多时候是在基础模型之上,通过外挂 prompt 工程思维链提示,或者像 land chain 这样的外部框架来模拟智能体行为。 这种方式就像给一个只会写诗的诗人,硬加上一套导航系统,练路长、效率、损耗大,稳定性也欠佳。 而 m 二点五的 ford 框架核心思想是解偶与内化,解偶就是把底层的语言、模型能力和上层的智能体逻辑清晰的分开,让模型在训练时就同时学习世界知识和如何使用工具与规则完成任务。 内化则是把智能体的决策流程,比如下一步该调用哪个 api, 这个结果合理吗?深度集成到模型的推理过程中,而不是事后追加规则。 这样做的好处显而易见,泛化能力更强,响应速度更快长,任务稳定性更高。 模型真正学会了如何思考并解决问题,而不仅仅是如何回答下一个问题。 这张图展示了复制框架驱动的智能体任务处理简化流程,大家可以看,输入一个任务后,模型不仅仅是理解文本,而是直接进行任务规划,选择合适的工具执行操作,然后验证结果,最后给出输出。 整个过程高度集成在模型内部,没有过多的外部依赖和繁琐的中间环节,这使得模型能够更流畅、更高效地完成复杂任务, 尤其是在需要多步推理和工具调用的场景下,优势尤为明显。它不再是简单的文本续写器,而是真正具备了思考和执行能力的智能体。我们来看第二架马车 cisco 算法在 m e 模型上进行大规模强化学习 r l 训练其实是个挺有挑战的事情,因为 m e 模型的路由机制是动态的,它会根据输入内容决定激活哪些专家。 这种动态性导致传统的 r l 算法很容易让训练变得不稳定,甚至出现专家之间强的越强,弱的越弱的马太效应。 mini max 的 研究团队为此专门提出了 c i s p 算法,你可以把它理解成莓模型 r l 训练的稳定器和调度员。 它主要解决了两个问题,一是确保训练稳定性。即使在复杂的多轮交互稀疏奖励的 a 阵任务中,所有专家都能得到均衡的学习机会,避免模型崩溃。 二是实现精准的信用分配。在长达数万 tocan 的 复杂任务链中, cpo 能更准确地把最终的成功或失败回溯,并分配到中间的关键决策步骤上,让模型学得更明白。 此外, m 二点五在训练时还特别关注过程奖励,鼓励模型产出不仅正确而且高质量、可维护的解决方案。 最后是第三架马车,也是猫 e 架构本身,加上高效的推理优化。前面提到,猫 e 架构允许模型拥有庞大的专家网络池,但在处理每一个具体 token 时,仅激活约一百亿参数。 这就好比一个拥有各领域顶尖专家的智库,每次只请出最相关的几位专家来会诊,既保证了能力覆盖的广度,又实现了极高的推理效率。 更重要的是, m 二点五从设计之初就不是一个单纯的文本续写器,而是一个为智能体任务而生的思考与执行引擎,这意味着它在规划、工具调用、多步推理、自我反思等 agent 核心能力上得到了原升级的优化。 这种效率优先智能体原升的设计理念是 m 二点五能够在保持高性能的同时实现低成本的关键因素之一。 理论讲完了,我们来看看实战表现。在衡量实际编程解决问题能力的 s w e bench verified 精准测试上, m 二点五取得了百分之八十点二的惊人成绩。 作为对比,当前业界标杆之一的 cloud opus 四点六得分是百分之八十点八,两者差距仅在毫厘之间。而 m 二点五更是首个在该评测中超越 clodzenet 开源模型, 其他主流开源模型在这个基准上的得分通常在百分之四十到百分之七十之间。 这张表清晰地展示了这个对比。 m 二点五的成绩证明了它在硬核编码能力上确实达到了顶级水平,甚至在某些方面超越了之前的闭源模行,为开源阵营树立了新的标杆。 如果说性能是追平,那么成本就是碾压。我们来看一下直接的 api 调用成本对比。按百万 token 计费, 无论是输入还是输出, m 二点五的成本都是零点三美元,而 cloud opus 四点六大约是三十美元。这意味着什么?成本比例大概是一比一百。 假设一个开发者每天需要处理一百万 token 的 代码生成和审查任务,使用 cloud opus 一个月的成本可能高达数千美元, 而切换到 m 二点五,每月成本可能仅需几十美元。这种两个数量级的成本差异,足以让任何团队和个人开发者重新评估他们的技术选型。 这不仅仅是省钱,这是对高性能 ai 可负担性的重新定义。 m 二点五的高性价比和强大能力,让它在众多场景中都能大显身手。我们先来看它的主战场,代码生成与审查 对于开发者来说,这简直是福音。无论是日常编码,根据自然语言描述快速生成函数类或模块代码,支持多种语言, 还是代码审查与重构, m 二点五能指出潜在 bug、 性能问题,风格不一致,并给出修改建议, 甚至可以用来生成系统架构、设计数据库、 schema api 接口文档,甚至是部署脚本。还有调试助手功能,把错误日期备给它,它能帮你快速定位原因, 这大大提升了开发效率,降低了出错率。除了开发者, m 二点五也能为运营、市场、财务等非技术岗位带来巨大便利。 比如,面对一堆混乱的销售数据,你只需要告诉 m 二点五计算每个季度的环比增长率,找出最高的产品线,并生成分析报告、项目建议书,这些任务 提供关键数据点和要点, m 二点五就能帮你自动生成,还能根据要求调整文风和格式, 从永常的会议纪要、客户反馈或调研报告中快速提取行动项、核心结论和代办事项。这些信息提取与汇总的工作, m 二点五也能轻松胜任,这大幅降低了数据处理的门槛。 最具想象力的应用领域,恐怕就是利用 m 二点五的智能体原生特性,构建各种定制化的智能体应用了。 比如,你可以创建一个独立研究 agent, 给他一个研究方向,他就能自动规划搜索策略、爬取阅读论文、整理文献综述。 或者一个客户服务 agent 集成到产品中,处理复杂的售后咨询,甚至能主动调用内部系统接口完成服务闭环。 还有个人效率 agent, 管理你的日程、阅读邮件,做数字助理,甚至可以是个性化学习导师,用生动的例子解释难点概念。或者学术论文助手帮助润色检查、引用 创意内容、脑爆构思脚本、策划活动、起名字, m 二点五都能提供大量高质量方案,这几乎是打开了无限可能的大门。了解了 m 二点五的强大,大家可能已经跃跃欲试了,那么如何快速上手呢?主要有三种方式。 对于大多数开发者和团队来说,直接调用 mini max 提供的云端 api 是 最简单的方式,获取 api key, 安装官方 sdk, 几行代码就能开始调用。 如果你对数据安全要求特别高,或者希望完全掌控推理过程,可以选择本地部署下载模型权重,用 v l l m 或 t g i 这样的高性能推理框架进行部署。 另外, m 二点五已经与 vs code、 cursor 等主流 id 一 深度集成。安装插件配置好 api key, 就 能在编辑器内直接享受它的能力。选择哪种方式取决于你的具体需求和环境。 mini max m 二点五的发布,其意义远不止于又出现了一个好用的模型,它更像是一个清晰的信号,标志着 ai 发展的一个重要拐点。它代表着性能平权。顶尖 ai 能力正通过开源和极致优化汇集更广泛人群。 它将催生应用爆发。低成本门槛会让大量此前搁置的 ai 创意变为现实。 他也预示着竞争泛式转移,未来的竞争将更多聚焦于如何基于高性能开源模型进行创新,同时他会催生新生态,围绕开源模型的工具链和服务将蓬勃发展。 回顾 ai 短短几年的发展,我们看到了从惊奇到落地的迭代。 m 二点五让我们看到了另一种可能,技术民主化,通过架构创新、算法优化和工程卓越而非无止境的军备竞赛,将技术果实更平等的分享。 开源之光正无比耀眼地照向人工智能的核心腹地,而 m 二点五无疑是这束光中最亮眼的火炬手之一。