现在各个 ai 公司都在抢占我们的桌面端, mini maxhop 也推出了本地化部署的桌面端产品,就叫做 mini maxhop, 它里边集成了很多 skill, 我 们可以大概看一下它都有什么功能啊。 首先它也是以无线画布来进行的啊,在启动台的初始页面,我们有一个启动指令,然后你要把什么任务的话,可以在这里直接来进行启动。启动之后我们就可以看到它会 进入到这样的一个画布的一个界面,在画布的右边有个 agent 模式啊,这里边的 agent 模式集成了很多的 skill, mini max 旗下的一些模型,并且集成了国内很多图片视频的模型都综合进来了, 包括 banana 系列,集梦系列,还有 chad gdp 的 image 系列,格林系列, one 系列,集梦动作模仿以及音频。音频主要是用的 mini max 旗下的这个音频和音乐创作模型,这两个还是很不错的啊, 所以它也是一个综合的 a i g c 平台。然后使用方式其实和我们的无线其实和我们这个无线画布的使用方式其实很像的,我们只要在右侧告诉我们的指令,然后传入各种参考图,并且它预设了很多 skill, 有 动物播客,有声书 图片重混宣传视频,并且可以在这个里边创建我们自己的 skill。 当然在使用这个桌面端的时候,依旧是要消耗 talking 以及贝壳的。呃,我觉得它的 agent 是 还是算不错的,算是比较聪明的。像这个 海报的生成啊,我就直接给他说帮我生成一个 mini max odo 的 一个海报,让他自己上网找一些他的特点,并且把这个网址粘贴给了他,然后他就给我生成了这样一个海报设计, 关键风格是什么,色斑是什么?光照什么,氛围构图以及字体调性选用什么模型,然后在这一步只要选择确定之后,他就会生成这样的一个海报,整体效果还是很不错的。但生成这样一个海报,你看两 k 的是六比九的,就二十个贝壳,我们选择一 k 的 试一下,一 k 的 话需要八个贝壳,所以分辨率和精细程度对我们的贝壳消耗 有着影响。而这里边我觉得他有一个好处,就是这种连接性的节点他没有做的那么的重要, 这个画布就比较好,我们把它把重点放在了这个右侧的 agent 上边,但是它又没有完全放弃这种节点的形式,因为我们在做参考图的时候,还是需要有一定这样的一个参考的。当然在 agent 的 模式下,我们也可以直接引用通过右键来添加的对话做一张参考图, 但如果你不习惯用 agent 的 话,也可以在这边直接让它生成图片或者视频,那就会基于你当前选择的素材、图片或者文本来进行新的节点的一个内容创作。像这个工作模式其实给了我们很大的一个自由程度,我们再来看一下它的一个节点都支持哪些啊?文本、表格、图片、视频、音频, 包括时间线,时间线也是以节点模块化的形式出现在了无线化布里边,我们可以来放大在这边来进行剪辑。由于 mini max hub 是 桌面端的产品,所以我们可以直接引用本地的素材,而不需要把本地的素材上传到云端,这样大大节省了我们的资源使用率啊,还有各种基于云端产品的一些限制,比如说 视频大小的限制以及网速的限制啊,因为我们是本地端,所以你看直接拖入进来,这个速度就非常快,没有任何延迟啊。我们把这个节点直接拉进来,这样我们就可以直接进行对素材的一个粗剪,这里边不光可以 导入视频素材,还可以导入音频素材,这个可以解决一个什么问题啊?无线画布这种 ai 生成视频的时候,他的音频都是一段一段的,需要导入到其他的剪辑软件里面来进行制作,但这个里边的话,我们在里边创建一段音乐,然后直接连接到这个节点来, 我们来人为的把这段素材来进行一个合成,所以这个操作就会在一个软件里边同步完成,这个还是很方便的, 期待有更多更好的这种桌面端的产品啊,还有更加期待它的价格可以降下来,因为这样整理一次我的文档就花了将近一百个贝壳,我觉得这个还是蛮贵的,花了好几块钱啊。这个就是今天给大家带来的 mini max 桌面端 ai 应用。
粉丝928获赞5694

大家好,我是 kitty。 mini max agent 升级了,包含两个核心功能,一是桌面端应用,你把一个本地文件夹交给他,他就能围绕这个工作空间做文件整理、数据分析、自动化网页等操作。相比 cowalk 只能 mac 电脑使用, minimax 的 桌面端也支持 windows 电脑使用。二是专家 agent 在 网页端使用,你像选专家同事一样选 agent 或者自定义 agent, 也能看到它的工作流提示词会调用哪些子 agent, 便于复合。 目前官方也开启了限时免费体验,先给大家快速看一下 minimax agent 能帮我做什么。 第一个是电影标人格式化页面, agent 帮我挑选了合适的字体海报呢,也是他自己搜索下载的最重深层的应用,非常美观。第二个是 small 模型训练手册解读 hackinface, 他 分享的这份训练手册非常好, 但 pdf 有 二百一十四页,内容量很大,我让 a 经理帮我做了可适化整个页面,包括 pdf 阅读、音频理解、思维导图,手册的中文解读,页面设计也很精致。 第三个是 ai 官鸟挑战落地页,这项目是 agent 帮我写 prd 在 生成网页,网页里的视频和图片都是 agent 生成的,无论是 prd 文档还是最终的页面,效果质量都很高。 接下来详细看一下怎么用升级版 agent。 打开 minimax agent 官网可以看到 agent 呢,新增了 custom 模式,支持按需选择或者自定义子 agent, 包括代码执行、图片生成、音频生成、视频生成、网站部署等能力。左边栏还新增了 explore experts 入口,点进去呢,可以看到多个官方预设的专家 agent, 每个专家 agent 都能看到它的提示词 以及调用了哪些子 agent, 我 选择了 icon 制作器,让他帮我做一个视频封面。生成网站的图标 agent 先让我选择网站的主要功能 和喜欢的风格方向,选定之后呢,它调用 icon generator agent 生成了两个图标,我觉得不够简洁,让它换成极简风格。第二个极简风格图标我很满意,接着让它帮我生成适配安卓应用的完整图标集, 并打包下载。打包好的文件,我用 office 四点五复合了一下,没有问题。之后,我让 mini max 搜索 cloud code 二点零零版本之后的所有更新,要求分门别类, 对重要的功能做详细的解读,最终生成了美观的 html 页面。可以看到, mini max 搜索了多个网页,提取相关内容并编码, 并且很快完成了部署。我检查后发现一个问题, c c 已经更新到二点一点一二了,但它生成的页面呢,只显示到二点一点零的功能,我告诉它要补上二点一点零之后的更新内容。修正后,它生成了最终的页面。 目前 mini max 模型和 c c 适配非常好,但 c c 更新太快,官方更新呢,重点又不够突出。 用 mini max 生成这样的格式化页面,众人很直观的了解每次更新的要点, agent 生成的导航呢,也很清晰,想了解哪个功能就点哪里。 再来看一下电影标人格式化页面。我的提示词很简单,搜索电影标人的相关情况,官方信息和网友评价, 整理成一个追片指南。格式化页面,用 html 实现页面风格参考电影标人的海报。 agent 呢,先搜索多张海报,然后基于海报的设计风格来创建页面, 最终采用了深色背景,金黄色调和水墨武侠风格,跟电影海报的气质很搭。不让 agent 生成 small 模型训练解读页面的时候,他先问我目标受众的学习水平,我选择了中等。由于手册有两百多页 agent, 他 分了多次阅读。处理过程中,他调用了内容分析,指 agent 来分析内容,格式化生成 agent 来生成思维导图, 还用音频生成 agent 来生成音频解读。 agent 最初生成的页面是紫色的,我觉得不太理想,就让他重新设计一个明亮的、独特且有个性的配色方案。 最终生成的页面呢,很满意。 expert agents 里面有一个热点追踪 agent 非常好用,我让他追踪坐高铁可以不用自己扛行李了。这个热点 要求输出大众能看懂的相声演绎版长文。他先调用输入分析 agent 来分析需求,然后调用 researcher 来进行搜索,找到了三十多个有效信源。 星云的质量呢,是以权威媒体为主,真诚的完整报告,包含十大部分,还划出了最具传播力的内容和建议文章角度。 接着 agent 挖掘爆点话题,并行对四个话题进行深入搜索,之后调用 article writer 来写作。 写作之前呢,他还分析了文风要求,要相声结构要求和配图要求,生成的初稿内容就已经很不错了。 接下来是我最喜欢的一部 a 正呢,开始对文章进行严格的事实和查,发现了几个错误,并且进行了修改。最终生成的文章质量很高,风格诙谐幽默。 您瞧瞧,这是靠谱。读这篇文章就感觉在看相声表演非常不错。 expert agents 里面有一个 p i d 助手,我让他帮我生成一个三十天 ai 观鸟挑战的落地页。 p i d agent 生成了完整的页面结构与文案,包括主视觉区、 价值主张区、三步流程等,还给出了主件与版式建议,以及需要准备的素材类型。接下来,我把这份 prd 放到落地页制作助手里, agent 帮我生成了视频和多个图片素材,很快就生成了一个图标并茂的落地页。现在来看一下如何在 minimax 桌面端使用类似 cloud cowalk 的 功能。首先,从 minimax agent 官网 下载桌面端应用,安装后选择目标工作文件夹。我先让 agent 帮我整理文件夹,要求分门别类,遵循最佳实践。 很快呢,他就诊断出目标文件夹存在多个问题,文件混杂、项目不独立、缺乏逻辑分组等。接着他给出了建议的整理方案,我看了觉得不错, 同意执行,很快就收获了一个整理好的文件夹。接着我让他处理电脑里的零售店销售数据表格,进行可量化分析。 agent 呢?生成的报告呢,非常全面,包括数据概览、描述性统计、相关性分析、分布分析、异常值检测, 还有业务洞察,图文并茂,我个人很满意。另外值得一提的是, minimax agent 和 cloud comwork 一 样,生成的中间文件非常多,每一个都可以点击进行查看, 非常方便附和它生成的脚本也可以直接附用,后续处理类似数据就很省事了。 minimax 桌面端有一个很突出的工具叫浏览器专家。 我让桌面端 agent 登录 minimax agent 的 官网,输入五个不同的提示词,生成五个体数艺术页面, 可以看到 agent 正在打开目标网页,查看页面加载状态和界面布局,还能理解图片内容,然后点击中央输入框,聚焦输入内容并执行。 点击右侧的文件列表,可以看到它在处理过程中产生了非常多的截图,方便回溯每一步操作。最终通过 minmax 生成的体述艺术页面效果非常棒。 稍有遗憾的是,目前浏览器专家的处理速度还有些慢,期待后续优化升级。 highlagent 根据本地的表格搜索并整理二十家 sats 产品的价格对比信息,它不仅生成了详细的价格表,还输出了一份完整的 sats 竞品价格对比分析报告。总的来说,升级后的 minimax agent 给我的体验还是很惊喜的。 网页端专家, agents 覆盖热点追踪、 p、 r d、 落地页制作、图标生成等场景,而且调用列录透明,适合学习和复合。 桌面端 workspace 更接近真实工作流,文件夹整理、数据分析、表格处理都能做,浏览器专家也能把很多重复操作自动化掉。如果你想体验的话,记得二十二号之前是免费的推荐体验。

就在上周, mini max agent 桌面端重磅更新,这次直接打破了次元壁,接管你的整个桌面生态。以前整理本地素材得靠人眼识别,手动拖拽,门槛不高,但很费人。但现在,它支持视觉直连,比如匡选一堆杂乱的鸟类摄影图, 几秒钟它就能自动识别品种成命名并归类,直接就能用。除了管文件,它还能夺社浏览器 hr 想发个招聘帖给个指令,它从做封面到点击发布,全自动搞定。 当你把五年的 seo 经验投喂给他,他能迅速内化为专家 agent 不 仅提供策略,还能协助你执行具体的增长规划。从被动识别到主动执行, mini max 这次真正让 ai 从对话框里走了出来,变成了能干实事的生产力工具。这或许才是 agent 该有的样子。

mini max 总的来说是相对失望啊,总体的效果感觉跟 glm 四点七差不多,可能还差一点, 就是一些简单的人物呢,它不太行啊,也不是不太行吧,就是偶尔会出一些小 bug。 小 问题啊,也不是 bug 吧,比如我让它做一个聊天框,然后聊天框你滚动了之后, 对吧?下面出现一个按钮,回到最新处地方的按钮啊,就一个这么简单的功能,他功能实现了,但是按钮的位置啊,到处乱飘,不知道为什么,然后那个东西我只能自己手动去改了,只能自己手动去改位置,但是他功能是 ok 的, 但是他那个按钮的位置很奇怪。 然后呢,我就拿复杂功功能测了一下,这个复杂功能就是我整个产品接项目页的时候非常慢,下载了一个六点几兆的一个东西啊,也不知道为啥,我让他去看一下这个东西能不能优化, 然后给大家看一下实际效果啊,这是因为他限流啊,限流啊,消息也发不出去啊,所以多发了几次。 然后呢,他给出的结果我是不太满意的,比如看这里,他给出了两个解决方向,第一个是直接让我把功能删了,第二个是把销量搜索放到服务端啊,这个也不太靠谱啊,不太靠谱,就这意味着他还是没有理解我整个项目的逻辑啊。 然后呢,后面我就让他搜搜代码,把整个的就是和销量搜索相关的东西全搜一遍,搜一遍。看到这我就很更不开心了, 就他居然说目前这个东西呢,在产品里几乎没有被真正调用过搜索文件,这是一个工具啊,这个工具是给大模型调用的,你代码里面肯定没有显示调用的东西啊,这是有肯定的时间。看到这句话我就意味着 因为他在搜了一堆代码之后,还是不知道我的这个产品到底是个啥东西啊,他完全没理解 啊,不过他到这家店发现一个问题啊,就是存销量数据库居然只存了赊药啊,这个这个存赊药这个代码应该是这么难卸的吧?啊,这个有点坑,这个我之前确实不知道。 然后啊,然后呢?在这之后他还写出来 bug 了,写出来 bug 了,然后让他去解决,他也没解决掉,所以在这回关了,然后再然后我去试了一下千问三点六啊,这个让我感觉很惊喜,就是完全相同的问题,我给千问三点六去看 千万三点六给出的结果是啥呢?他非常显著的看到了啊,这是有五兆的一个模型啊,这一个模型,然后呢,他是在模块将在静态导入并立即输出化,这是导致整个问题的核心原因啊,这个其实这个东西是整个核心原因。 mini max 他 也发现这个模型了,但是呢,他并没有发现这一点,所以他在那给我搞了半天,然后他还是把这个模型解决不了, 然后像三点六是直接整个啊,整个一次性啊,就这一个,就这一次啊,直接找到问题并且给我解决完了,把这个东西呢,就是改成了一个在动态导入啊,咱家的也就是说在实际使用的时候才会去加载这个东西, 然后呢项目的首页体积直接减少了百分之九十多,非常厉害,这就意味着千万三点六的能力啊,我认为这这这个问题呢,它相当于是一个复杂问题了,复杂问题了,然后千万三点六的能力我觉得就已经显著的高于小米 mate 和 mini max 啊,它是显著高了,但是它跟那个 g l m 五或者五点一怎么比?我不知道,因为现在还没有试过,但是啊,但是 看这里,他刚才呢,就做了这一个任务,这一个任务它掉了十次模型,直接花了一百万头,看,直接花了一百万头,看,十几块钱啊,就这么出去了 啊。所以就是现在直接买 token 几乎是一个不现实的一个状态啊,就是一个任务十几块钱又扔出去了,不现实,所以买 token 是 不现实的。 但是呢,从那个性价比来说, mini max 又非常厉害啊,我买的是二十九块钱的这个套餐,然后五小时六百次都要用 啊,在高峰期呢,那六百次你几乎花不完,因为你一直在被限流,一直要等,然后低峰期用的话,应该可能也就几十分钟就花完了。 但是呢,我觉得他这个性价比呢,就是完全可以买,买了之后呢,你拿他去做一些常规任务,比如你就做一个页面,做一个小功能,这种啊,问题不是很大,可能有时偶尔出 bug 啊,也不是说完全不出 bug, 他 会偶尔出问题,但是呢,可用啊,可用,他是一个可用的状态, 然后千万三点六就是,对吧?这个真的有点贵,然后他他的那个定制 plan 你 买不到,然后呢,真的有点贵,只能看其他家就是能不能提供更便宜的了。

国内终于有能和 cloud code 和 codex 扳扳手腕的产品了。 risclex 是 一个专门为 deep seek 优化的桌面端产品,由 nodjs 构建,已有七千四百加薪。它和前阵子爆火的那个 deep seek t u i 不 同,它核心只做一件事,极致优化 deep seek 前缀缓存架构,围绕缓存优先、循环设计三大支柱,全部服务一个目标 有用户测试,单日四点三五亿输入 token, 缓存命中率百分之九十九点八二,成本十二美元,同样量无缓存约六十一美元。功能覆盖 m c p 技能、系统记忆、 point 模式、语义锁影、 web 面板。作者故意只支持 deep, 感兴趣的小伙伴赶紧去试试。

免费使用大模型的顶级羊毛来了啊,今天我就手把手教你们这个羊毛到底怎么薅,我不宠我的粉丝,谁宠你们,让你们零成本使用! kimi 二点五, mini max 二点七, g l m 五点一,谷歌字节跳动、 deepsafe、 阿里千问,整整九十个顶级大模型的 api, 每分钟四十次调用,可以白嫖一年,普通人根本用不完,你还有什么理由不去学 ai 呢?咱们拍拍手仔细听啊,说白了就是英伟达搞的模型 api 超市, 赚钱可能赚太多了。开始讲良心了啊,第一步呢,创建账户网址,我这不能写啊,你们自己搜一下,输入好邮箱,点 nest 设置密码,创建账户。然后呢,到你的邮箱里去验证一下,通过之后,系统会让你创建一个云账号,记住这里啊,用户名必须用英文和数字。创建完云账号,顶部会弹出一个验证信息,用咱们中国的手机号做一下验证。手机验证通过之后呢,点右上角的头像,选 a p i k, 进入 a p i k 管理界面, k 的 名字你可以随便起啊, 模范围默认勾选就可以了。点 general api k, 看到这个页面马上复制保存,每个账号最多八个 api k, 一个 k 呢,可以访问所有的模型。好了,你现在就可以开始你的 ai 之旅了。再说一句啊,我会的东西挺多的,那你们倒是问啊!

截至二零二六年五月十五日,国内各家厂商的 coding plan 套餐。 coding plan 简单来说就是花一笔固定月费就能在 cursor、 cloud code 这些工具里大量调用 ai 编程模型。 今天我就来帮大家把八家平台一次性对比清楚。先说质谱, glm codein 旗下旗舰模型 glm 五点一,括定能力,开源 sota 能可靠交付。生产级代码套餐分三档, like 四十九元, pro 一 百四十九元, max 四百六十九元。不过智普是限量抢购,手慢无 再说火山引擎方舟这个是模型聚合平台,豆包二点零 code deepseek v 三点二、 g l m 五点一、 k m k 二点六、 mini max 二点七,全都能用,还有 auto 模式自动帮你选模型。 like 四十元 pro 两百元月额度九万次,购买容易。阿里云现在是 token plan, 主推 q one 三点六 plus, 支持图片理解,还集成了 kimi k 二点五、 g l m 五、 mini max m 二点五, 不过目前还不支持 kimi k 二点六和 g l m 五点一 pro 套餐两百元一个月,月额度九万次,限量抢购 腾讯云独家的会员模型 h v 二点零,加上 g l m 五 kimi k 二点五、 mini max m 二点五。 light 四十元 pro 两百元额度和其他家一样,也是限量抢购。 百度千帆文星系列模型加上 g l m 五 kimi k 二点五、 mini max m 二点五 deep six v 三点二 套餐同样是 light 四十元 pro 两百元,购买容易,不用抢。 kimi code 月租四十九元起,主打 kimi 最新旗舰模型,输出速度最高,每秒一百个 token, 适合复杂项目分析和 ai agent 场景, 不过月额度相对少,一千到一万两千次, mini max 起步价最低二十九元每月起 旗舰模型 m 二点七,而且不止编程,还支持语音视频图片音乐全模态,一站式 包年更便宜。最后是小米咪某,三十九元每月起,咪某系列八款模型可选。总结一下,同档位额度总体差不多,各家自家模型都是最新的支持的,其他家模型会稍微晚点 四十到两百元这个区间。 pro 档基本都在九万次月额度,买不上的可以考虑火山引擎和百度千帆购买门槛最低。好,这就是目前国内 ai 抠订方案的全景图,只对比不推荐大家按需选择。

这是我花两分钟就部署好的 openclaw, 你 敢信?以往我需要去 get up、 找文档、敲命令、行处理报错,现在我直接在输入框告诉他帮我安装 openclaw。 他 直接调动了终端能力,自动拆解步骤,下载依赖设置环境变量,几分钟内全自动搞定。这不仅仅是对话,这是直接接管了我的本地工作流。这 就是 mini max agent, 它最大的亮点在于正式开启了 ai 原声工作台时代。它拥有类似 cloud skills 的 底层能力,支持 supergent 封装工具。这意味着你可以直接使用官方和社区搭建好的海量专家智能体, 也可以自己手搓一个顶级分身。比如这个全网热点追踪专家。我不需要打开十几个网页到处刷我直接问, 帮我扫描今天科技圈的 top 十热点,并分析背后的趋势。它会自动联网解锁,过滤噪音,总结核心观点,直接生成一份高质量的简报,让你效率直接起飞。作为一个 ai 博主,每天需要从海量视频中找灵感。 我直接使用它的桌面版,省下了我打开浏览器的海量时间。只需对 mini max 输入关键词,你会看到它自动打开浏览器,模拟真人操作,滚动页面识别数据。 最强的是,它打通了本地文件操作的能力,直接写入我本地的 excel 表格。从自动配置环境到本地文件自动化处理, mini max agent 正在重构我们的工作方式。它不再是一个需要你适应的工具, 而是主动进入你的环境,帮你干活的伙伴。如果你也想体验这种让 ai 替你上班的感觉,可以试试。

今天豆包首次发布了自己的收费标准,分别对应每个月六十八块钱、两百块钱和五百块钱。我们今天就来聊一聊豆包收费对两家大模型上市公司 mini max 和智普到底会带来哪些冲击?先说结论,对于 mini max, 豆包收费版的冲击主要在 c 端的生产地、订阅和通用的 a 剪的场景, 尤其是 ppt、 数据分析和影视制作这一类轻专业或者放专业的任务,会大幅度的压缩 mini max 依靠低价和高性价比来获取用户的空间。当 是对于智普而言,我个人认为它的直接冲击是相对有限的,因为智普的主要阵地一肩是扣顶 a, 减低端本地部署和云端的 a p i, 它的商业模式和豆包其实并不重叠。首先 我们先来看一下定价标准的深入对比,就是看一下谁在按能力收费,谁在按人群收费。从应用的订阅端来看,豆包的定价是最高的, mini max 最低,智普介于中高位档,更加垂直一点。豆包的标准版是六十八块钱,高于 mini max 和 和智普的入门党。而专业版五百块钱的定价也高于智普 max 的 四百六十九块钱。但是我们不能简单地得出豆包最贵,所以他肯定最难卖的这么一个出钱的结论,因为商者的服务对象是不一样的,豆包卖的是开发者编码和 a 阶能力, mini max 卖的是一个高性价。从 a p i。 的 定价端来看, mini max 是 最低的,豆包是中位,智普很明显更有溢价能力。这也就是为什么豆包现在要开始推订阅, 实质点非常关键,因为它不可能永远只依靠中低价的 a p i 和免费的 c 端来吸收它的推理成本。一旦复杂任务在应用层形成价值的应用订阅所带来的单用户平均收入,它的稳定性很有可能会优于单纯的 a p i 调用。第二点,从产品定位、核心用户和商业化路径来看, 它们是三个不同模式的样子。豆包代表的是超级流量入口,它主要依靠字节跳动的内容生态和庞大的用户群体优先先建立起全民的使用习惯,然后再通过复杂任务和交易壁画来实现变现。 mini max 代表的是一种全模态全球化的产品型 方面,他去做星野海豚 ai 和 agent 等原生 ai 产品,另一端他又去做开放平台来实现工程效率的提升和全球化的收入。智谱,它更代表企业级的基座与勾顶 agent, 它的核心是高性能的机模代码和智能体能力, 玩的是 b 端的商业壁画,可以把它理解为是一个弱化版的 cloud。 第三点,我们从商者的经营和商业化结构来做一个对比。 mini max 和智普很明显已经在一定程度上验证了口收可收费这件事情,并且已经找到了自己的商业化路径。但是豆包的现实是,它的用户虽然非常多,但是高价值的付费体系在之前是并不完整的。 之前豆包的商业化路径并不清晰,而且他这种高活跃的用户所带来的推理成本会对他的利润形成非常大的压力。所以大家会感觉到豆包的降质越来越严重了。而且对于一个日活已经过亿,月活接近两亿的新级的产品而言, 再继续保持免费的策略,其实它的编辑价值并不是很高的。豆包它现在更合理的策略就是保留免费版作为一个流量入口,然后把一些最终算力最长链路最强生产力的需求直接通通切到这个付费程序。我们再聊一下豆包收费版对 mini max 的 冲击和对质朴的冲击。我个人的看法,豆包对 mini max 的 冲击是非常直接的,有两个方面,第一个方面就是它会对放生产力的订阅用户 进行很强的分流。 mini max 现在的定价是很具有价格优势的,二十九块钱、四十九块钱、一百一十九块钱,非常适合轻量开发者。但是豆包的收费版, 它的切入场景并不单单是面对开发者,而是更广泛的 ppt 数据分析、影视制作。这意味着大量原本可能选择 mini max 做轻办公和轻创作的这一部分用户可能会优先尝试豆包,因为豆包本身就拥有更强的用户心智和更大的基础盘,特别是在中国的市场,入口的优势往往会比这种 评价指标上面的优势更容易转化为付费。豆包是不需要说服用户你们先来试一试的,因为用户本来就在使用它,但是 mini max 它需要进一步的证明自己有更明确的价格优势,或者有更明确的专业能力优势,才有可能争取到客户,这肯定会增大 mini max 在 国内 c 端生产的场景,它的获客难度以及获客成本。第二点, mini max 的 低价策略的性价比趋势很有可能会被削落,甚至有可能会影响到资本市场。固 minimax 的 一大卖点就是它的高性能和极低价格。当豆包也开始在应用层面对复杂任务收费会让市场更容易接受,就是我做复杂的任务本来就应该是要收费的这么一个商业逻辑。所以这在短期以内并不一定是坏事,因为它帮助了 minimax 更好地教育了市场。但核心的问题在于, 如果一旦市场接受了收费的这一个认定,那用户肯定会进一步去比较谁更好用,而不是单单的去对比谁更便宜了。而在通用生产和大众的认知层面,豆包比 mini max 明显更有品牌和入口的优势。 最后说一下豆包收费对智普的影响,我个人认为它的冲击是有限的,因为它们的场景重叠度并不是很高。智普当前的收入结构显示,它在二五年 收入七点二四个亿当中,有百分之七十四是在本地化的部署,云端部署只在百分之二十六就代表智普他的核心收入其实是来自于企业和机构客户的,而并不单端是 c 端的订阅客户。豆包收费版最大的潜在影响就是在于他可能吸走了一部分并不追求极致代码性能,但是需要完成一些复杂任务, 而且让自己的办公创作更加轻便的一些轻专业的用户。智普他只需要进一步证明,就是我的代码能力是更强的,我的 ngram 是 更稳的 的, b 端是更可信的,这样它就可以去收取更高的用户单价。从事实的结果来看,今年的一季度,智普 通过对 a p i 提价百分之八十三,而且 cody price 多次上调了价格,这一系列的结果其实验证了这家公司是有一定的定价权的。所以豆包对于智普的冲击,我个人认为会相对于 mini max 要小一些。

大家好,我是麦东,今天我们来聊一个很多朋友可能会感兴趣的东西, hermes desktop。 之前我给大家分享过 hermes 网页 ui 的 使用,最近社区又推出了一个桌面版的客户端,提供了一个原声的图形化界面,让我们在使用 hermes 的 时候可以更加的直观和方便。这边有个点先跟大家讲一下, 如果你本地已经有了 hermes, 那 么你再去使用这个桌面端的时候,它会直接连接到你本地的 hermes。 而如果你本地之前没有装过 hermes, 那 么你在安装这个客户端的时候,它也会自动帮你完成 hermes 的 安装。好,下面我们来看看实际的使用体验。 大家可以看到我的桌面打开 hermes desktop 之后,界面就是这样一个比较干净的窗口,左侧可以切换菜单,右侧则是我们主要的聊天窗口。大家如果不习惯看英文呢,可以点到 settings 里面,在这边下拉找到语言,将其切换为中文, 这样看起来可能就会好很多了。 hermes 的 桌面客户端所提供的功能其实跟之前介绍过的一些网页 ui 是 相似的。首先就是一个聊天窗口,我们可以在这边直接跟 hermes 进行对话, 然后接下来是会画列表,这边它会加载你当前 hermes 里面默认所有的聊天记录。我的 hermes 里面聊天记录比较多,所以它这边加载的时间也会比较长,我们就不等它加载了,继续往后看。第三个是答案, 答案其实就是我们所说的 harmus profile, 也就是 harmus 的 多智能体。在这边我们除了管理已有的智能体之外,还能直接新建智能体。第四个菜单,工作区,工作区是客户端提供的一个三 d 格式 y 的 看板,在这边你可以看到当前 agent 的 一些活动,说白了就是给你解个闷,但它并没有什么实际上的作用。 第五个看板,这就是 hermes 的 看板功能,之前我也有出过一期视频做详细的介绍,大家感兴趣的可以去看一下那期视频。而接下来的两个菜单,模型与供应商都是用来配置我们本地的 hermes 可以 使用的模型的,这个就不做详细讲解了,配置也比较简单。 接下来的技能菜单可以管理我们本地已经安装好的一些 skill 人格跟记忆。两个菜单则是直接编辑 hermes 的 source md 以及 memory md 这边涉及到我个人的一些隐私数据,我们就不点开给大家展示了。工具菜单我们可以在这边定义 hermes 在 运行的时候可以使用那些工具, 比如网络搜索、浏览器终端等等。再往下的计划任务以及网关则分别对应了 harmis 的 电视任务以及消息网关,我们在本期视频里也不做详细讲解了。整体来说, harmis desktop 给 harmis 用户提供了一个原生的图形化选择,让日常的使用过程变得轻松了不少。 当然了,他本身也是一个由社区开发的开源项目,功能也还在持续完善中,可能也会有些小问题,但整体来说已经可以正常使用了。他比较适合那些希望用更直观的方式来操作 hermes 的 朋友,并且呢,和命令行网页也完全不冲突,你可以根据自己的习惯随时切换, 感兴趣的朋友可以自行的去了解一下这个项目。好了,本期视频到这边就结束了,工具会变,但方法更重要,我是麦冬,下条继续。

宣布个重磅消息,我要进军短制了!都是我不好,家里已经掏不出一分钱了,签了字,这五十万就是你的。 我这个剧情卡的怎么样?想要继续看的话,先把这条看完哦。其实呢,我之前就想做短剧,但一想到剧本拍摄分镜这一套,就觉得太麻烦了。短剧虽短,工程量却一点都不小,绝对不是一件成片就能搞定的事。但这段时间我体验了 mini max agent 一下,就对 ai 短剧的工程有了信心。 这期视频就教大家怎么用 agent 搓短剧。我们来到 mini max agent 里的 max claw, 这个是 mini max 自家的龙虾 agent, 底层跑的是 m 二点七,这个能自我净化的模型部署很简单,鼠标点一下这里,点一下开始,然后就好了。整个流程其实就三步。第一步,找一个短剧专家。 minimax agent 里面有一个专家社区,里面有好多好用的 agent 配置,这里我用的是这个专家,他能帮我把简略的短剧想法一步步丰富为有人物、有分镜、 有风格、有戏剧冲突的脚本。这个也是 agent 很 擅长的规划和思考,在前期的策划阶段,这非常重要,决定了剧情的上限。第二步,要用对应的 skill 打磨细节。 max pro 里面有一个 skill 社区, 里面是用户自己沉淀的各种 skill 包,像这个可以补人物和场景的视觉,这个可以把分镜往视频推进,这个还能够帮你回头检查镜头和动作的问题。这些社区贡献的 skill 都能拿给自己的分镜打磨细节。当然你也可以自己做 skill, 也能传上去,方便自己附用,也能和别人分享。 第三步,开始执行分镜,打磨好以后直接让他开始进行到下一步就好了,也就是跑图跑视频。这一步呢,主要就是跟他反复确认画面的故事性和情绪氛围啥的,但是因为他在策划阶段就和我碰过很多想法,这一步呢就会非常的省事,跑出来的图基本上都是我想要的 图片,跑了再跑视频,再让他结合成视频就好了,感兴趣的朋友可以去试试。上手呢,比你想象的要快很多哦。还有我的狗血短剧马上就要来了,豪门残疾少爷和他的七月妻子,敬请期待!

千呼万唤始出来啊, mini max 终于是推出了他们自己的桌面端 agent 的 应用 maas。 那 下面呢,是我做的一些测试啊,我先让他分析了一份 excel 数据啊,他不仅呢帮我整理出来了重点,还会自动地去生成这种图标和总结。 然后接着的话呢,我又让他去调研了一下 ai agent 的 一个发展方向,你可以看到他可以去自己搜集资料,然后整理信息,最后直接生成了这样的一个结构化的报告。甚至呢,你还可以让他去生成 ai 慢剧啊,给视频配音生成视觉内容, 玩性还是非常高的。虽然说开局呢,也是这样的一个聊天框,但是他现在能做的其实已经不只是 chat 这么简单了,更像是一个真正能够帮你去工作的 ai 助手。 而且呢,这个 memphis 里面还内置了非常多的 skills, 同时呢,也是可以去支持导入和自己新建的。甚至呢,还可以去记住你的一个偏好,生成新的 skills。 那 这意味着它并不是一个只有固定功能的 ai 工具,而是一个可以不断去被扩展能力的 ai 工作台。但是它真正让我觉得有意思的,还不是说它有这么多的功能,而是它开始让多个 agent 协同工作了。那以前呢,很多 ai 的 工作流本质上面还是 prompt rules, 提示词模板这些,对吧?比如说你保存了一个爆款标题的提示词,那下次你复制进去呢,再让它重新生成一次啊,大概是这样的一个操作。 但是 amazon 呢,它给我的一个感觉就不太一样了啊,就是它更像是在培养一个角色啊,比如说我会去新建这个文档的 agent, 标题的 agent、 封面 agent, 配图 agent, 还有这个审核 agent, 让它们去长期负责不同的事情。而且呢,这些 agent 呢,它不是一次性的使用啊, 他会慢慢地去记住自己的一个职责,包括他做事的一个风格,以及我们使用的一个习惯。如果说你觉得某个 a g 呢,他做的不够好,还可以去单独的跟他对话啊,继续去微调他的一个能力。那这一点呢,我觉得是特别的重要啊,因为以前我们保存的其实是一个 prompt, 现在的话呢,我们更像是在培养一个真实的岗位。那现在的话呢,我们就做一个真实的工作流测试吧,啊,就是帮我做一期这个 agent skills 方向的视频。那这个 agent team 呢,他就已经开始工作了啊,这个视频文案助手呢,就开始去拆解任务,然后做计划。 接下来的话呢,他开始去调用不同的 agent 啊,比如说这个文案助手负责去写这个竹字稿,然后标题助手负责生成标题封面助手负责生成这个横竖 的一个封面,然后配图 agent 开始用这个 html 的 方式去生成对应的口播背景素材。最有意思的是什么呢?就是它不是各干各的,而是真的会相互去协助。那最后的话呢,这个 memphis 是 把各个 agent 呢它生成的一个内容汇聚到了一起, 然后啊调用了本地的这个飞书 c i i, 生成了一篇飞书云文档。那这还没完啊,我们还可以去把这个 memphis 接入到飞书里面啊,就是以后呢, 无论是在电脑端还是在手机端,都可以去指挥 maus 干活啊,就是无处不在,非常丝滑,对吧? ok, 那 现在的话呢,我们就去飞书里面看一下这个云文档的生成效果啊,首先它的这个结构是非常的清晰啊,前面有这个竹字稿, 然后在标题方案这一块呢,它是区分不同平台的,然后这个封面方案这里的话呢,不同平台的设计思路它也是不一样的,下面还给出了相应的一个视力图片啊,大家可以看一下这个图片的效果 啊,包括这个横屏竖屏都是有的啊,而且我觉得是非常的精美。然后呢就是这个配图方案,它这边呢是给人物口播做背景来使用的一个画面啊, 这里面呢它是同步去生成了一个 html 的 文件啊,这个我们稍后会看一下。那最后呢是这个审核报告啊,包括下面的这个格式化图标,这个我一般是会把它截图下来,然后在剪辑的时候去用啊, 就是我们整体的一个视频的画面内容会更加的丰富一些。那我们接下来就去看一下配合口播使用的那个 html 文件吧,它整体的一个配色动效我觉得做的还是非常的不错,对吧?包括说上面的这些文字呢,也不是说胡乱生成的,都是基于我们 上面的那个文案助手写出来的这个文案啊,来生成的,对吧?所以我说他们是相互协助的,之间是有交流和沟通的。 ok, 这个呢,我用到的其实是一个开源的 skills 来做出来的啊,那生成的时候呢,我们可以去指定某个风格,那也可以去让这个 memphis 自己去决定它用什么样的一个风格是最合适的啊,这都可以,那添加这个 skills 呢,也是非常的方便啊,直接在这个技能,然后点击创建,然后从这个 github 导入啊,就可以了。 在以前的时候啊,很多这个 ai 工具,它其实都希望自己是一个全能选手啊,就是你给他一个任务,然后呢,他会从头做到尾啊。但是这个 maas, 它其实更像真实团队里面的那个 职业的分工啊,就是有人负责写,有人负责审核。并且的话呢,这些 ag 呢,它也是长期存在的啊,就是以前的话呢,你可能保存的只是一条提示词,但是现在的话呢,你更像是在培养一只长期写作的 ai 团队。 后面我又测试了一个真实的开发场景啊,就是我想让他去实现一个数据的查询功能。首先呢,这个 code agent 呢,他很快就把这个功能都写完了啊,那如果说是一个普通 agent 的 话呢,到这里其实就已经结束了。但是呢,这个 reviewer agent 呢,很快就发现了一个问题啊,这里面全量查询可能会导致数据量过大,然后存在一个性能方面的风险啊。 最后的话呢,他会把这个东西反馈给 code agent, 让它重新去修改。那这一点的话呢,其实特别像是我们真实的一个开发团队了啊,因为很多真实的工程问题,其实并不是你能不能够运行,而是说我们到了线上啊,它的这个数据量 一旦大了以后,性能是否会下降啊?系统会不会崩?单 agent, 它其实最大的一个问题就是不是说它写不出来,而是说呢它更容易的去只关注这个功能是否可以被完成,因为它本质上面还是自己写,然后自己检查。 webspace 这里呢,它是有一个独立的 reviewer 啊,它呢是专门负责找问题的,那这个机制呢?它们叫做 produce verify。 那 坐到这里的话呢,我就发现这个 webspace 它其实已经不再只是啊 ai 可以 去帮您干活,而是它开始真正进入工程合作这样的一个 level。 我觉得这个 maas 它其实最核心的东西,不是说啊它会做这个 ppt, 会分析这个 excel 啊,因为现在很多的 ai 工具其实都可以做这些,那真正核心的东西,我觉得是它已经开始解决了这个 ai 和 ai 之间如何去协做的这样的一个问题。以前我们看到的那些 ai 工具,它其实更像是一种 呃,一次性的工具,打开使用,然后关闭,对吧?但是现在的话呢,这个 ai 开始越来越像一个数字员工,甚至是数字团队 这样那个方向来迈进了,就是他会去记住你的一个习惯,然后记住你的一个工作流啊,不同的这个 ag 呢,之间呢,还会去形成真正的协助关系。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频再见, peace。

把电脑交给 ai 管理,让他帮我完成百分之八十的重复工作,是怎样一种体验?今天测试一下二零二六年的原生工作台。这是 mini max 最新推出的 agent 桌面端,它和普通 ai 助手最大的不同是,它能直接操作你电脑里的文件、 浏览器,甚至帮你部署网站。今天我测试两个 case, 看看他到底能帮我节省多少时间。第一个 case, 我 让他帮我部署一个个人简历网站。以前大家要做这件事,得先找模板、改代码、配置服务器、上传文件要花半天时间吧。现在我直接告诉 agent 分 析博主李哥 builder, 参考我发的这篇图文笔记, 制作一份李哥的 pdf 个人简历,可以看到他阅读了这个网页的内容,然后为我制作了个人简历。 我再说一句,根据这份简历,做一个李哥个人网站,风格要简洁、专业、现代化,突出独立开发和内容创作经验。你看他开始执行,这就部署成功了。全程只需要说两句话,我们可以看看这个网站的效果。 第二个 case, 我 平常写视频脚本,会存在不同的文件夹分类里,我想整理这些脚本,得一个个打开文件,手动复制数据,再分类整理,光是整理就要浪费不少时间。 但现在我可以让 agent 帮我做这件事,只需要选择对应的文件夹目录,然后告诉 agent, 帮我分析这个文件夹里的所有视频脚本,提取标题、标签、发布时间,整理到 excel 表格里, 然后生成一份数据报告,你看它就自动完成了。 minimax agent 搭载的是 m 二点五模型,在 office 高级处理、深度搜索、调研、长文档摘要等生产历场景中都有提升。传统的 ai 助手,你问他问题,他能给你答案,但你还得自己动手去执行。 而 agent 类的 ai 就 像你雇了一个助理,你只需要告诉他目标,他会自己想办法完成更进一步。他通过分析我的视频脚本,实际上变成了我的工作分身。他知道我的写作风格、常用的表达方式和关注的话题之后,他就能写出更符合我个人风格的内容,做到帮我提效的结果。 这就是二零二六年的工作方式,你专注做更有价值的事,而那些重复性的执行工作交给 ai 就 行。 ok 啊。以上就是我测试 mini max agent 的 桌面端的真实体验,如果你也在探索 ai 提交的方法,欢迎在评论区分享你的经验,我们下期见,拜拜!

每天被杂事堆满,感觉身体被掏空,是时候让 minimax agent 这个最强外挂上场了!它不只是个聊天框,而是一个能跑能算能干活的数字分身。 开启方法超简单,直接搜这个网址或者下载桌面客户端,体验更丝滑。不管是写代码、做方案,还是查资料,他就在你的桌面上随叫随到,妥妥的生产力神兵。 举个例子,你要推新品,直接给他指令看,他会先全网搜竞品分析,再自动生成营销大纲,连配套的文案都给你整的明明白白,甚至还能帮你找配图参考。 他是你的钓儿员、文案专家,甚至是全能策划 minimax agent! minimax agent 把 ai 从对话框变成了行动派,快去试试,把时间留给更有趣的事情吧!

mini max 发布了一款桌面应用产品,叫 mini max hub, 其实也就是把各种 scale 以及智能体然后集成到一个桌面端了。但让人惊喜的是,这个桌面端它可以整理你本地的文件,虽然还不能完全接管你本地的电脑,但是它可以 进行文件的一些整理,就是用它来整理我本地的文件,因为我本地的文件非常多,有时候也很乱,我们下面就来演示一下怎么用 mini max hub 来整理一下你本地的文件。 mini max hub 是 需要下载安装的,它是一个单独的客户端,我们这儿 直接就预设了一个文件管理,我们把这个路径直接复制给他,否则他会找半天,然后白白浪费 talking, 直接点击发送就行了。他已经找到这个文件路径了啊,然后并且已经完成文件的这个识别,经过他分析理解之后啊,然后给了我们一些建议啊, 他会把所有的文件分析出来,里边共有多少个文件,分布在三十八个子文件夹里边,在动手之前需要给我确认几个方向,文件整理方式,按内容分布,重新整组。然后第二步是无法辨别的内容, ai 识别后重命名,输出报告,生成清单列表,然后确认之后直接点击提交。但是他在做的过程中,我们就可以干其他事了, 可以多任务并行,人机携同,我们现在就可以等待他的完成了。好了,他的文件整理已经结束了,然后就会生成一个这样的一个文件报告,就是一个新旧文件的一个名称对比, 包括在什么地方,这样方便你找到这个文件。呃,这种建议一定要生成一个这样的一个文件目录啊。当你再重新整理这个原件素材之后,再剪辑工程文件里面就找不到这些了。我们可以通过这样的一个对比来进行替换查找。我们看一下消耗了多少? tokyo 消耗了大概有 三四块钱吧,不到五块钱的样子啊。其实用这种方式可以来试一试,它还是挺快的。

现在 hermes agent 桌面客户端也已经出来了,支持多端, windows 端、 mac 端, linux 端也是开源免费的,所有功能都是健全的,默认英文,你可以切换到中文,在设置里面进行切换就可以了。如果你之前没有安装过,我觉得你可以试用一下这版,整体的安装过程也会比较轻松, 也能看的懂,但是里面可能会有一些 bug, 如果是你已经安装过的,我觉得你可安装也可不安装,因为你如果有之前这个版本的 y b u i 版本的话,相对功能会更健全一些,也更好用一些。

国产 ai 模型又亮出了一张王牌,在 mini max 上周刚刚发布的 max 的 支持下,一个晚上的时间我就把自己抖音号一百多条作品复刻成了影视巨峰同款的飞书数据看板,并且根据具体数据还做出了新一期内容的十个选题,还平 了分。你以为我是熬夜干这个事情的?完全没有,我只是把我的作品列表发给了他,然后再给了他一句话,剩下的部分就是由一只 ai agent team 来帮助我完成的了。 我们直接跳到这个成品展示,大家现在看到的就是我的内容运营分析仪表盘了,那你们可以看到这几个虚荣的数字,有总观看、总点赞、总分享、二万五累计粉丝增量。那下面的还有一些部分就是播放趋势,用户互动趋势,题材播放量对比,题材互动占比,这些全部都是动态实时更新的。那再往下我一百多条作品的 明细表,每一条都给我标记好了发布时间,视频的题材播放量,完播率,五秒二秒的数据等等,还有封面点击率, 那更觉得是他现在还能自动根据我目前的数据给我筛选了十个选择题,并且进行了打分。我跟你说,真的到这步的时候我真的惊到了,因为我让他干的事是分析数据,那他在分析的过程中,他自己又多干了一件我没有让他干的事情, 就是根据我历史一百零一条作品的表现反推出说柱子哥下一期做什么样的内容大概会爆。那直接给了我十条的选题的角度,再到预计的受众差异化的核心优胜率的评级, 九个维度全部都给我打满了。比如说他给我推的第一条五星选择题是 entropic 五个月的估值翻倍,第二条是 entropic 在 企业端首次反超,全部都靠的团队。那确实,现在也是当下 ai 圈的真热点, 而且跟我历史数据表现好的这些题材入驻是完全可以对得上的。这就是多 a 卷协助的一个价值。那一个 a 卷是做不到这个的,因为他眼里只有说用户让我干的事。但是一直 ai 团队不一样,他们之间是会互相启发,互相补位的,所以我就直接服了,这个确实挺厉害,这功能 我跟你说真的,我自己花一周时间在飞书,你的手搓都可能搓不出这个效果,而刚好飞书也开放了 c l a, 所以 真的很好用。那我做的事情是什么?我就拖了一个十一 kb 的 markdown 文档,并且说了一句话,就是请把这份数据整理成飞书多维表格,并利用你多 a 卷特性进行综合研判。 那 marvis 收到以后,没有上来马上就干,而是先把数据扫了一遍,然后告诉我说,你这报告还是很专业的,有多少条作品,多少个主题, 一个月时间的最终颗粒度很细,我想开两路并行,他就启动了 a 卷一是负责把数据写进非书多位表格,然后 a 卷二到四分别是从内容策划、商业价值、粉丝运营三个角度同时做圆盘,最后汇总给到我这边。 那么看到这里,很多老观众就会问,柱子哥,铁柱老师,这个 mars 它到底是个什么东西呢?你这么理解就可以了,它是 mini max 上周刚发布的一个桌面端 ai 工作团队, 不是 gbt 那 种你问一句答一句的聊天软件,而是你桌面上多了一个有项目经理,有执行人,还有专门挑刺儿的质检员的这种小公司小团队,所有事情你只要跟项目经理对话就可以,然后他就操控底下几个 a 卷,同时帮你干活, 那它的优势在哪?我就觉得有四个点是真正的差异化,不是参数,而是机制。第一个就是它的这个 a 卷 team 的 这个特性多, a 卷并行, 每个 agent 还可以扮演不同的角色,比如说我刚才那桌就是 code verify 呀, general 这三个角色一起上。第二个对我来讲也很重要,叫做 produce verify, 这名字听起来很高级,说白了就是一句话,写代码,这个 agent 它不能自己 code review, 就 不能自己审核自己。 所以在全部做完了以后, varify 会用一个全新的独立的上下文窗口重新读,重新查,看看你这个整个项目里面有没有错漏,就是一个非常好的复审和自查的这么一个机制。我在跑第一遍的时候就对这个 varify 非常有感觉,因为 h 一 第一次是把数据写进非书的时候,字断对的不齐, 这个 varify 直接就打回去让他重写了。第三个特性三层的记忆,它可以全职的记住你是谁, a 选记住他干过什么 session, 记住这次到第几步了,这意味着什么呢?意味着你不用从头 再去跟他解释。第四个就是 i m 系统的集成,它现在和飞书整合的非常好,我们现在可以直接在飞书群里面,艾米尔斯让他直接开干,不用切到电脑上,也不用切其他的窗口。 我们现在进入实操环节,来看一下到底是怎么做的。实际上整个流程非常简单,第一步就是把这个 mini max 给它挡下来。第二步到它的窗口里面,把你的数据丢给他,把你的作品列表拖到他的对话框里面,告诉他说请把这份数据整理成非书多页表格,并且利用多 a 卷特性进行综合研判。说完这句话我就去玩手机就睡觉去了。 那第三步实际上是比较重要的,就是我们看 marvis 在 这个时候干什么,他自己是在配置非书的 cla, 这个 cla 是 真的很好用,他在自己用命令行去给我创建非书的多维表格, 那这个是我。如果放在以前,我可能要打开飞书的开放平台,然后申请自荐应用,然后再配 app id, 就 像 open call 刚出来那会,你要跟他进行非常复杂的对接,看很多的教程。我说实话,我那个时候真的没跑通,但是你看现在阿比斯,他直接把这整套开发流程当成自己的工具用,我什么都不用懂,他自己跑就可以了。 那在之后的八分钟,三个 a 卷都在那并行干。 a 卷一来写表, a 卷二在分析哪类小题的点赞比较高, a 卷三呢,在算哪类视频的商业价值最高,而 a 卷四在猜粉丝什么时候最活跃,他们偏好哪种类型的内容,他 们之间是互相不会去抢资源的。那次完成了 verify 就是 最终复审以后,我打开飞书这个看板就已经在那边了。当然了,柱子哥这次拿他干的是看板,但是 mavis 能干的活远远不止于此。在一个窗口里,他可以给你分析 excel, 写 pdf 学术报告,做 ppt 演示文稿,丢什么文件,他都能给你处理。 比如说我就在我的手机上把我的作品数据发给他,他就可以给我生成一个甲方就能看的 ppt, 看这里面有什么关键数据,什么值得亮点提炼一下,它也支持设定定时任务。比如说我就跟他说,你现在每天早上九点把昨天的 ai 日报给我发过来,结果他现在真的每天早上九点就照做。而且我们现在可以在很多的手机软件上面艾特他,直接干活,不需要去切其他的窗口, 越用越懂你,你的 ppt 风格,你的文档结构偏好,他会不断的进步。所以 ai 时代是已经过了谁的模型更聪明的那个阶段。其实大家都挺聪明的, 那下一个阶段是什么?是谁能在你睡觉的时候,有一支团队可以把你的任务完成,而且还互相 review? 那 marvis 给你的答案是什么呢?说白了一句话就是不是又一个更聪明的 ai agent, 而是 ai team 时代的一个工作台。 那这个答案能不能立得住?我用了一个晚上帮你们验证过了,确实还不错,你们自己也可以试一下。好,上就是本期视频的全部内容,希望会对你有所帮助,我们下期视频再见。

mini max m 二点七我真的觉得得聊一下他这次最狠的地方,不是说参数不是跑分,是他开始自己帮自己升级了。 说白了呢,就是用早期模型去搭技能,改记忆推,强化学习,甚至还能反过来优化训练流程。那这个方向如果一旦跑通了跑顺,那么后面就不是人带着 ai 往前走了,是 ai 自己就开始卷自己了。我们再来看能力啊,也不是说嘴上热了, m 二点七在编程和复杂任务上的表现明显比二点五更稳,理解工程拆任务跑流程都更像一个能干活的 agent。 老子 还有个挺关键的点,它原生支持 agent team 多 agent 并行写作,这个在国产模型里面可并不算常见哦,所以实战价值很高。 而且呢, mini max 最会的那一套也就它的角色感对话感,这次也完全没有丢,再加上 open room 开源, agint 娱乐这边又开始整花样了。 我自己呢的结论就很直接啊,如果说你现在想找一个国产 agint 机模,那么 m 二点七大概率就是第一梯队,关键它还便宜还快,这就很气人了对吧?墙还不贵,这谁能顶得住啊。

你能相信 cloud bot 已经落伍了?估计各位最近都被 cloud bot 疯狂刷屏了吧。作为一个 ai 智能体,它可以帮助用户完成很多自动化的工作,彻底解放双手,提高生产力。但是由于其过于强大的功能,出于安全考量,可能有很多朋友像我一样掏出了吃亏很久的 mac mini, 或是在虚拟机上搭建一个安全的隔离环境。当然,还有更简变的体验方法,就是使用腾讯云港推出的三十八元包月的 cloud bot 清亮服务器,不过你仍然需要再配置后端的大模型 a p i 接口才能让它工作。 而今天要给大家介绍的是 mimax 在 数小时前刚推出的智能体软件,号称是 cloud co work 加 cloud bot 的 合体,是更强的新一代的 ai 智能体,它可以同时在本地电脑和云端运行,通过代理功能来批量运行工作流。它还自带了强大的 skills 技能库,可以控制你的浏览器完成各种任务,并可以轻松定制各种你想要实现的功能。 仅需下载一键安装包,就可以在 mac os 和 windows 系统上顺利运行。我在下载安装后,在易用性和功能性上进行了初步测试。正如 mi max 的 官网介绍所述,这个桌面代理除了可以轻松管理你的本地资源库外,还附带了一些有趣的功能, 比如它可以是管理十八位顶级投资人的 ai 对 冲基金专家,还可以是能帮你生成修仙武侠故事的太虚阁 ai 掌门真人。 这些功能都是开箱即用,无需额外设置。此外,像是需要定期完成的脚本任务,也只需要简单的提示词即可完成。比如在专家模块里,让它每天九点半自动抓取 x 和 ready 的 新闻,并给我推送报告。只需要在对话框输入一句提示词,就能自动创建。 最关键的是 api 配置,你再也不需要额外手动设置了,可以直接调用 min max m 二点一的大模型,或是随时切换到 gemini 三 pro。 通过以上介绍,你觉得 min max 的 这款智能体可以替代 cloud bot 成为你更好的选择吗?欢迎在评论区分享你的观点。

哎呀, ai 做一个网页非常简单,但是你如果要做一个这种专业的有品牌度的这种落地页啊,宣传页啊,就有点难度了。比如我现在做的这个页面是一个汽车的宣传页面, 那么我还做了一个这样商城活动的这种促销的宣传页,那作为没有设计经验的我来说是怎么做到的呢?本期视频就来跟大家一起探讨一下 如何使用 mini max talking plan, 加上这个 mini max 的 前端技能。一句话来生成这种专业的这种落地页和营销页。那我们前提要准备两个东西,第一个是 mini max 的 talking plan 套餐,那这个 talking plan 跟这个 coding plan 到底有什么区别呢?那这个在生成能力上是有很大的区别, 那比如说 talking plan, 它既有这种文本生成能力啊,还有图片的生成能力,也可以做这种图片的识别, 那么也可以也可以生成这种音频和视频,也就说你用一个 key 你 就能生成很多很多东西, 那普通的 coding plan 呢?它专门是为代码而产生的,也就也就说它着重使用的能力是文本生成能力,然后加上这个图片识别能力。那比如说 mini max 这个 talking plan 套餐,那我们可以看标准版的,那么它可以生成这样的图片, 那比如说 plus 可以 生成每天五十张,那还可以生成这个音频,还可以生成这个视频,还生成音乐。那你要准备第二个东西,就是这个 mini max 的 这个前端技能,那 mini max 这个技能呢?有非常多,比如说像前端技能,它还有权杖技能,那这两个是用的比较多的,那第一个 前端技能的话,这个就是我们今天要做的这个生成这个营销落地页的最重要的这个技能了。那这个技能为什么他能够制作出这种专业的这种落地页和产品页呢?那主要依赖于他的这个技能的描述啊和技能的调用。我们看一下他技能描述,重点是看一下他这个 使用场景啊,构建这个着陆页、营销网站、产品页面、仪表盘,生成媒体资源,看到没有?也就是说这一个技能能够生成这些东西,图片、音频、视频、音乐, 然后还可以写转化方案。这个我们在后面实战中我们可以看到创建生成艺术,也是我们看这个技能的描述的使用场景,大概就知道这个技能是用在哪的。 这边也是也是说到了着重讲到了着陆页,也就是用户一看到那种观感比较强的,转化率比较高的那种页面,还有这种营销类营销页面,就那种,那能有那种去参加营销活动那种页面。 那么我们可以看到他技能的这个引用文件啊,也是脚本啊,生成图片的脚本, 生成音乐的脚本,生成这个声音的脚本和生成视频的脚本,也就是在这个技能里面,他就调用了这四个脚本来处理这个音视频和图片,那还有这些专用的这个引用网, 这些参考的这种这个技能的规范。所以说这一个技能的描述和他的这个我们看了资源文件就知道他是能够生成图片、视频、音频和音乐,那么用这个技能的场景就很明确了,就自己看一下我的我的这个页面要不要他来生成图片了? 可能很多,可能很多时候我们都是自己去找图片,对吧?但是你比如说你现在是个产品,你需要去做一个这样的 demo 出来就很专业的 demo, 或者说你现在就要设计一个这样的落地页,你不需要去找这种网络的图片资源,那么你可以直接用它来生成, 这个是非常非常方便的。之前我们开发的时候,要么去找这种网络开源的图片,那可能找的是不对位的,要么就自己去生成,找另外的 ai 工具去生成,再把它拉到我们这个项目里去。缺点就是这个图片的尺寸可能跟你的页面是不匹配的,那如果能在一个技能里面去 做网页的设计和图片的生成,那这样是非常非常 ok。 我 们安装的话也是非常简单,只要打开我们的 cloud, 然后去执行这个加载,加入这个这个 marketplace, 加完之后就可以去安装这个 mini max skills, 我 们可以打开这个 plans, 然后的话 你可以看到,比如说你如果第一步已经成功了,那么你就可以看到在这边有这个 mini max skills, 然后你就可以看到在这边有这个 mini max skills, 然后选择这个, 然后选中它安装,你可以选择比如说安装到当前这个目录,安装完之后呢,那么你就可以去 reload 一下,那么它就会加载出来,加载完出来之后你就可以看到这种,比如这个 frenty 的 第一位就是它的这个 mi max 的 前端设计界面, 那这边的话我生成这个汽车的这个呃页面的话,你可以看一下我的这个整个过程啊,我在使用这个技能的时候,我一段介绍,比如说我现在生成一个汽车介绍的官网,那我发明了一个汽车叫随风,然后的话我设置了一个卖点,整体的风格是什么样子的, 然后让他去参考,然后给了一些简单的信息,信息啊,然后他这边收到我的需求之后,他就会准备生成这个图片素材,这个是非常厉害的,他理解我的需求,我没有告诉他,我没有让他去生成图片。哦,他是理解我的需求之后,然后去生成这 五张图片,那生成的五张图片就在这里,我们可以看到非常非常的就是他是贴合我们整个需求来生成这个图片的, 所以这就是它 talk and plan 的 一个非常大的一个优势了。就是你自己要找的话,你要去想一下你这个页面的你要展现什么东西,然后再去找这个图片。 它是根据我们的需求,比如说它需要手屏要展现什么内饰细节这东西,然后再去生成这张图片,那就跟我们的这个你要做这个页面的业务是紧密的贴合的, 然后你选择 y, 它就会调用这个插件去生成图片。那生成完图片之后呢?它就会去啊构建这样的网页过去完之后,我们就可以看一下它这个效果,我们可以看看一下, 刷新一下,然后的话你看整个英雄业这个图片,还整个风格,你觉得你看这个效果,你看这个金黄色的这个效果,然后图片 这对于一个没有任何设计能力的来说,做出这样的效果是非常不错,而且我就对话了一次,我没有去调整。接下来我们看第二个例子啊,这次我们做的是个促销落地页,那这个需求提示词更简,那我就没有去指定任何的风格,我只是让他去设计个促销页面,然后的话 告诉我,我告诉他正在搞促销,然后免费送鸡蛋。那他这边的话会去生成这样的目录结构啊,就是这个设计的风格,因为前面一个方案,其实我们是指定的一个设计风格,高科技感啊,这个是没有,他就会帮我们出一个设计风格,然后布局规划,然后的话这边就开始去生成图片了, 那这边又去生成图片,然后第二用 talkin play, 然后去输入这样的提示词, ok, 生成图片生成完之后呢,他就开始制作网页,制作完完成之后就结束了,我们再来看一下这个促销的页面, 我这个是一个送鸡蛋,这个鸡蛋还是可以拖动的,然后这边的话是一个这样的显示,然后促销亮点,然后图片展示,然后的话可以参与,然后报名。 这这个看起来就非常非常专业,非常非常厉害,我不知道,可能是以我的水平来看,我觉得是非常不错,而且主要是我是一次对话完成,没有去调整,这也说明 me max m 二点七以及它的这个 talking plan 带来的这个方便性啊,就完全不用去找图片了。如果你是这个 talkin plan 的 这个 max 用户啊,你还可以去生成这样的视频,也就是比如说在我们这种汽车的这种宣传里面,这边如果来一段这种很酷的这种视频的话,那这个网页的效果会更好,所以这个就是 你可以在提示里面跟他说生成这样的视频,他也会去生成视频。但是你前提是他的 max 这个套餐用户, 所以说用体验起来,一是这个技能非常厉害,二是这个 talk and play 非常方便。那么在使用 talk and play 之后啊,你可以看一下这边的用量啊,比如说我这边已经生成了十四张图片,也就是它是有个重置时间的, 它在多少?呃,在这个时间内是可以去生成使用五十张图片的生成额度。 ok, 那 以上就是 mini max talk and play 的 一个实战的一个呃,例子,那么你也可以来体验一下 生成一个这种专业的落地页啊,或者说这种课程销售界面啊,这种产品介绍界面啊,看一下这个前端的技能加上 mini max home plan 做出来效果是怎么样的?