粉丝1.9万获赞14.2万

ai 圈子的风向变得太快了,二五年底,大家还在主要讨论哪个模型更聪明,哪个模型编程能力更强。到了二六年初呢,几乎所有人都在聊 computer use, 简单来说就是让 ai 操控你的电脑,自己去干活。这事呢,最早还是 cloud 掀起来的,年初的时候, cloud 的 co worker 刚发布的时候,演示视频确实挺帅的,可以随便操作你的本地电脑文件,读文档,写表格。他也开始让大家意识到,原来本地的 a 阵的客户端不只是能写代码。 但是啊,咱们在国内用 cloud 有 多难受,懂的都懂啊,价格贵就不说了,稍不留神你的号就没了。过了几天呢,这个开源的大龙虾掀起了一波新的热度。 它的原名呢,叫 cloud boot, 但是因为被 cloud 认为是在碰瓷啊,所以被告到改名成 open cloud 了。 发布短短几周,给 top star 飙升到惊人的一百六十六 k 了。它的效果啊,确实很惊艳,但是呢,因为配置门槛有点高,以及非常脆弱的安全性,劝退了很多普通玩家。 最近啊, mini max agent 上线了它的桌面端版本体验了一段时间呢,我认为它就是这个赛道的国产最佳品 t 了。它的体验啊,非常接近于我理想中的 ai 原声工作台。 它不再是一个简单的网页对话框,而是直接钻进你的电脑,能看懂你的文件,能替你操作浏览器,甚至能帮你直接写代码并且部署。最重要的是呢,它的客户端不仅适配了 mac, 连 windows 这种文件系统极其复杂的环境也支持的非常好。 下面呢,我准备了几个实操案例,带大家一起来实际操作感受一下。首先我会带大家了解一下 minimax agent 如何和我们的本地电脑进行交互,然后我们尝试让它完成一个复杂的数据分析任务,包括数据源的解锁,下载, excel 的 整理,当成可识画的 ppt, 以及一键部署为炫酷的网页,全部让它自己完成。最后呢,我会教大家如何用 minimax agent 玩转最近爆火的 metalbook。 首先我们可以到 minimax 官网下载符合你系统版本的客户端, 打开客户端之后呢,我们可以看到和网页版类似的界面,最明显的区别就是我们可以选择一个本地文件夹,选择之后, minimax agent 将会拥有这个文件夹下的读取和操作权限。 那我们先让他来完成一个本地文件操作的任务。那我的下载文件夹呢,里面堆了非常多的文件,我隐约记得啊,里面有一张购买 icloud 发票,但是我忘了文件名。那我们给 mini max agent 下载一条指令,帮我从 download 文件夹找一张购买 icloud 发票。找到之后呢,帮我创建一个财务报销的文件夹,然后把它放进去。 我们看到他迅速扫描了本地目录,过滤掉了大量不相关的文件,然后开始逐个理解图片的内容。 然后他精准的找到我这张发票,创建了一个新的文件夹,把这张发票放了进去。 最后啊,他还把发票中的内容分析出来了,那我们打开 download 的 目录看一下,那果然看到他已经帮我们把发票挪到了正确的文件夹。 这个呀,要比 maxed 聚焦搜索要强太多了,因为他不仅仅能搜索文件名,还能理解文件内容,下面我们给他来点有挑战性的任务,看看他是不是真正的能帮我们提升工作的生产力呢。我们来测试一个数据分析的案例, 我们先讲一下啊,如果老板让你做一个竞品财报的分析啊,正常的流程可能是这样的,首先啊,我们打开搜索引擎,搜索到这个财报, 然后把它下载到本地啊,然后我们开始人工分析,然后把分析之后的数据呢复制粘贴到 excel 啊,然后再开始做图表,然后截图,最后再贴近一个 ppt 里面。那这套流程走下来呢,基本上半天就没了啊。下面啊,我们来看看在 mini max agent 里面是怎么做这项工作的呢?我们给 mini max agent 下载一个新的指令, 帮我搜索腾讯和阿里巴巴两家公司的财报,并且把 pdf 下载到本地。它首先精准地检测到了两家公司财报的下载地址,然后调用本地命令,成功将 pdf 下载到了我们本地软件夹。我们打开目录看一下啊,文件已经下载到了指定的位置。 拿回几十页的 pdf 之后呢,最头疼的莫过于分析数据,提取数据,整理数据的过程了,所以下面我们给 minimax agent 下载第二个指令, 分析本地的财报文件,做一个完整的腾讯阿里巴巴的对比。 excel 包含财务规模、盈利能力、核心业务板块、现金流与财务健康、股东回报这几个维度。首先 a 站呢,开始对两个 pdf 文件进行关键信息提取,然后他成功提取出了两个公司的关键财务数据,开始准备编辑脚本,写入 excel。 脚本执行成功了啊,最后他还帮我们总结了营收、净利润、研发投入等核心指标。 那我们打开它生成的这个 excel 文件看一下啊,我们看到啊,它不仅仅是按照我们的要求填写好了数据,还总结了一些对比分析的结论, 最后还生成了多维度的对比图表,这个呢,要比我们自己手动复制粘贴制作图表要快上很多倍了。在 minimax 默认模式下呢,还内置了很多强大的 sub agent, 比如 ppt 报告编辑、深度调研等等。 下面呢,我们还是让他来尝试分析这两个财报的数据,然后帮我们做一份两个公司的业绩对比的 ppt。 那 minimax 首先还是详细分析了这两个文档,然后定制了 ppt 的 大纲和内容脚本,然后开始按照大纲和脚本生成图片。 那每一页的图片生成完成之后呢,他开始创建脚本合成文件, 我们看到他帮我们创建了 pptx 格式和 pdf 格式的文件。 那本地编辑呢,还有一个好处啊,就是我们可以看到整个任务过程中生成的所有临时文件,这些文件呢,你都是可以去二次更改和使用的。那我们打开这个最终版本的文件看一下啊, 效果非常不错啊,比 excel 表要清晰得多了。如果你认为 ppt 还不够炫酷啊,那我们就尝试让它做个网页, 在默认创建的任务中呢, mini max 也能写代码,但是想要效果更极致,可以到它的专家里面找一找。 在 mini max 的 专家模式下啊,提供了很多垂类场景深度优化之后的 agent。 如果说在普通模式中, mini max 大 部分任务都能做到八十分,在一个特定领域下的专家 agent 下,最后可能达到九十五甚至一百分的效果。我们找到落地页制作助手,这个专家啊,然后和他发起对话, 我们给他下载一个指令,分析本地的财报文件数据,然后制作一个精美的网页,来介绍阿里巴巴和腾讯两家公司在二零二五年 q 三的财务情况对比。 他首先提取并分析了两份财报的核心数据,然后定制了一份详细的编码计划。代码编辑完成之后呢,他还会对这个页面进行完整性的校验。然后啊,编辑完成了,他甚至还直接帮我们对网页进行了部署,提供了一个可以直接在线访问的 ul。 下面啊,我们打开网页看一下啊啊,首先啊,这个落地的效果非常不错啊,带了比较炫酷的粒子特效,下面还提供了非常直观的数据展示和流畅的动画交互的效果。 下面啊,我们来看一个更有意思的玩法。最近啊,这个 modbook 社区非常火啊,它号称是 ai 版的 ready 的 社区。在这个社区里面呢,是禁止人类发帖的,而是只允许 ai agent 直接相互交流。看这里面的 ai 们啊,聊得热火朝天啊,可能你也会手痒想进去发个帖, 但是呢,看一下教程,首先要部署 openclaw, 还要配置 api 签名,还要过反人类验证啊,太麻烦了,既然它是给 agent 设计的,那我们能不能让 minimax agent 替我们进去玩呢?于是啊,我用 minimax 创建了一个 modbook 运营专家。首先,我们回到 minimax 的 探索专家模块儿, 那这些专家呢,并不都是由官方发布的,任何人都可以定制自己的专家 agent, 你 不需要自己去编辑融长的提示词和复杂的配置,只需要告诉 minimax 你 的需求,它就会自动帮你生成专家的工作流,所需要的 mcp, sub agent 以及运行时的环境。 那我自己呢,也做了很多有意思的探索啊,比如说,我创建了一个 modbook 助手,它可以让你的 minimax agent 也能在 modbook 社区里面发帖和讨论。而我做的呢,只是把 modbook 的 注册流程,发帖规范和评论的互动逻辑为它, minimax 就 自动帮我创建出了这个专家 agent。 下面啊,我们就来演示一下如何让你的 mini max 也能玩转 modbook 社区。我们打开这个专家啊,这里它让你输入一个文件变量。那如果你已经有注册过的 modbook 账号呢,可以直接把它的 apikey 填到这里,就可以直接用这个专家来操作你这个账号啊,那如果还没有呢,就直接填个 empty 就 好了。 我们先让它注册一个新的账号 啊,然后它提示要我们给这个 agent 取个名字,还有一个简介,那这里我们随便起一个啊,就叫 easy data set agent。 然后啊,它成功帮我们注册了一个新的账号。这里啊,提示我们需要进入这个链接认证一下啊,才能成功发帖。我们打开这个链接,对于每一个新注册的 agent 呢, modbook 要求我们必须按照它的要求发布一条 twitter, 所以 至少你要有一个推特账号才能注册成功。 并且呢,每个账号只能在 modelbook 注册一个 agent, 我 们点击下面这个按钮啊,然后它就会自动跳转到 twitter 进行发帖。帖子发布成功之后呢,我们复制一下这条 twitter 的 地址,然后回到 modelbook 认证一下 你的 agent, 就 可以发帖了哎,然后我们点击这个链接,就可以看到我们 agent 的 主页地址了,然后我们告诉他已经认领,让他发布一个介绍 easy data 的 帖子, 然后啊,他验证了我们的账号状态没有问题,帖子发布成功了,那 modelbook 为了防止普通人类发帖呢,每次需要做一个复杂的数学题来验证你是真人还是 ai。 我们看到啊, mini max 自动帮我们完成了这个验证。帖子发布成功了,我们打开 modbook, 果然啊,看到了刚刚已经发布了这个帖子,因为打开的时候已经过了几分钟啊,这条帖子已经收到了五个赞还而且还收到了很多其他 agent 的 评论。 下面呢,我们也让他评论一下其他的数学题的验证啊,然后发布成功了, 我们打开这个帖子看一下啊,果然找到了我们这条评论。接下来呢,你就可以让你的 minimax agent 呢去自由玩转 modbook 社区了。 这个产品啊,我已经使用了将近一周了,由于篇幅的问题呢,还有很多好玩的案例没有办法展示给大家。下面啊,我就来说一下我的实际使用感受啊。 首先是优点啊,第一个就是门槛很低,无论你是技术小白还是自身开发,用自然语言就能控制电脑,让你直接体验原出法随的感觉。第二个呢,就是它真的是国产最佳品 t, 比起 cloud co work 等海外产品,它对中文语境、国内网站啊以及 windows 系统的支持是更丝滑的。 第三啊,就是模型比较好用啊,它现在搭载的是 mini max 的 二点一版本,这个呢,是 oppo, cola 都在推荐使用的模型,在编码能力以及工具调用上的表现是很能打的,另外啊,它的多模态能力也是非常强的。 第四呢,就是可玩性很高啊,任何人都可以通过自然语言创建你的领域专家,可以挖掘出非常多有意思的玩法。当然呢,这个产品也并不完美啊,它也有一些缺点。首先啊,就是速度上,在处理一些复杂任务的时候速度是比较慢的, 但是呢,胜在它能全自动后台运行,不需要你盯着,而且呢,你可以同时启动多个任务。第二个就是成本问题了,因为本地的任务呢,可能会调运到大量的工具,因为的消耗啊,肯定要比普通对话要烧的更快了。不 过呢,这也是这类 agent 的 通病啊,现在呢,我还找不到一个又便宜又能打的本地 agent。 好, 我们本期教程呢,就讲到这啊,如果本期对你有所帮助呢,希望得到一个免费的三连和关注,感谢大家,我们下期见!

前两天我做过一期视频,用同样的 prompt, 同样的真实项目任务实测,对比了 cloud ops 四点六和 gpt 五点三 codex 那 期视频做完之后,评论区有人问 国产模型能不能也拉进来比一下,这次机会来了,这一期视频我要做两件事情,第一个,把上期那两道编程题原封不动的丢给 mini max m 二点五,看看它在同一张考卷上能拿多少分。 第二个的话,我有一个自己一直在用的自媒体 agent 的 项目,之前跑的是 mini max m 二点一,这一次直接升级到 mini max m 二点五,看看他在真实的一个生产电路里面升级到底带来了什么。看过我视频的人都知道哈,我做评测比较关注模型,他在一个真实任务里面的一个表现。 好,我们正式进入编程实测环节,我直接附用之前的两道题, prompt 一 字不改。第一道题的话,是把一个项目里面完整的一个认证用户体系 直接迁移到我有一个图片生成的一个 agent 的 项目里面去,同时再让它做一个落地页,需要考验它对于另外一个项目的一个代码理解能力,架构适配能力以及一些工程规范。 那第二个项目的话,我以本地有一个 skills agent, 之前是做的是终端 ui 的 一个部分,那这一次的话,我希望把它升级成外部 ui, 并且它要保留 string 工具调用流逝输出的一个完整链路,这个就考验它的一个全栈开发能力,以及它的 sse 流逝输出,还有 ui 方面的一些交互。 上期的成绩是 cloud op 四点六和 gpt 五点三勾代码各赢一局,那这一次我们把 mini max m 二点五加进来,看一看它的结果怎么样? 好,开始测试,两个一起弄,可以看到右边这个它识别到我们要做的是一个全单元 y, 它去加载的那个 front designer 这个 skill, 那左边这个项目的话,他发现他是需要去探索已有的项目,去找到那边是怎么做 get up 登录,怎么做谷歌邮箱登录的。先去探索嘛,先去开 saf 界面的探索, 可以看到他这边已经构建成功了,现在在进行一些后端跟前端的验证,整体这个过程测试下来的话,他会遇到一些变异问题,他也自己去修复了。待会等他测试完之后,我们来看一下他跟 cloud 四点六以及 gpt 五点三 codex 同样的代码,同样的提示词完成了一个效果怎么样? 那左边的话先让他一直跑,左边这个任务要重一些,可以看到这个地方他说项目已经启动了,然后他还专门创建了一个简单的启动脚本,来方便我后续去使用。之前我在测试 mini max m 二点一的时候, 有一些开发任务,前端后端写完之后,我需要手工让他去给我写一个 start 点 s h 的 脚本,这一次让你可以看到他在这个过程他自己去发现的这个行为,这一点点赞。现在他说已经完成了,我们现在开始去测试一下 这个就是他把那个终端 ui 变成了一个外部 ui 的 一个版本啊,可以看到左边他已经把我们已有的一些 skill 加载出来了,这个是没有问题的,下面我们来测试一下,给他一个任务,看他能不能去做到加载对应的 skill, 然后工具调用 simi 以及流逝输出都没有问题。好,我们开始 这个申请的过程,看起来没有问题,加载技能也还行,那看他执行命令 ok, 他 也调了对应的工具,只不过这里的这个图标他刚刚是有些问题的,这个状态是有些问题,有个小 bug。 那 整体的话,这一个过程其实已经把我们终端 u i 想要展示的东西已经展示出来,只不过有些小瑕疵。那之前那期视频的话, 也测了 cloud op 四点六跟 gpt 五点三 codex 嘛,左边是 cloud 的 模型,右边是 gpt, 当时我是把票投给了 gpt, 不 管它是从 ui 交互还是它整个功能交互上,明显 gpt 五点三 codex 要优要好一些。我们也可以来测试一下,直接给他一个链接吧,看他怎么怎么搞。 他也在申请,他也在加载技能,那明显能看到 gpt 五点三 codex, 他 做错做的要好一点,对不对? 好,下面我们开始去看他做的那个用户认证那个项目,那做用户认证迁移这个项目的话,其实比我们刚刚看到的任务其实要复杂一些,因为 他需要从另外一个项目去探索,找到想要的东西。其次他还得在这个项目里面去,在各种代码里面去找到他要在哪个地方去修改,前段是要修改哪些,后段是需要修改哪些,所以整体上他的复杂度要高一些。也可以看到他其实并没有一次性去完成这个任务,中间也报错了,我也跟他去沟通交流了, 那最终的话是跟他对话了三轮,他才把这个任务完成了。那这个任务在之前 op 四点六以及五点三 codex 测试的时候,他们是能一次性通过, 跑的时候没有问题,项目也能起起来。那 mini max m 二点五这边的话是有一些问题,我对话了三轮,然后把这个任务搞定了,我们来看一下他的一个表现。 好,我们先看左边,左边是之前 call 四点六写的落地页嘛, 光看 ui 其实没什么难度,因为这个项目主要是考察他去另外一个项目里面把后端代码找到,把对应的数据库找到,找到了之后再放到另外一个项目里面。所以说整体是需要看它的代码实现的功能,比如说这个 get up 登录可不可以,谷歌登录可不可以, 以及它的代码实现的怎么样,因为涉及到登录嘛,肯定安全性这些要考验。下面我们来看一下 mini max m 二点五它这个 ui 写的还可以的,比这两可能稍微会好一点, 那它的这一个谷歌登录跟 get up 登录的话也是 ok 的。 好,我们来试一下它这个谷歌登录 好,可以看到它,其实谷歌登录是 ok 的, 那我这个其实就是一个纹身图的一个 a 帧嘛,那它整体完成度啊,也还可以,但它不是一轮完成的,它中间有一些包的导入错误,还有些细节性的问题没有做的很到位。好,我们来一个整体的一个评分对比。 关于这个纹身图的 a 帧的项目的话, call 的 off 四点六表现优异一些,得分是八点二,那 gpt 五点三 codex 它因为漏了一些功能,所以说它评分要低一些,但是它的整个代码价格、工程规范是这三个模型里面完成的最好的。 那 mini max m 二点五这边它的得分就稍微要差一点,整个的功能完成度还 ok, ui 的 话会比它俩会好一点,但是它的代码架构跟工程规范会偏弱一些。好,下面我们开始做 agent 的 实测,把 mini max m 二点五放到 我已有的一个真实 agent 的 项目里面去,它是做自媒体视频拆解的,之前接的是 mini max m 二点一,这一次升级了, 我们重点看三件事情,第一个是速度,第二个是他的一个拆解深度,第三个的话是表达一个真实感。好,我们现在准备两个窗口,左边的话我准备用来测试 mini max m 二点一,右边的话我们测试 mini max m 二点五。 好,我这边找了一期我之前做 skill 原理讲解的视频,我们同时去点击看左边跟右边他的一个整体的一个速度以及拆解的深度,再看他的一个其他的表现。开始好,这边有点慢,但没关系,我们来看一下, 我们把这个展开,这个也展开,从这个可以看得到,它其实右边会稍微快一些哈,但是这个先不管,因为这个部分的话是跟 a 镜头没有关系,去做语音转,文字是本地的一些模型去转,等他把这些字幕内容提取到之后,我们再看他们的一个速度。 好,现在开始了,大家能明显感觉到吗? mini max m 二点五的是不是快的特别多? 这边已经做完了,这边就是还在,还在做, 那在速度这一块,他现在提升真的非常的明显,特别快,那他最终输出这个结果,我们要怎么去做评测呢?到底是左边的好还是右边的好? 我不能以我主观的去选择哦,右边好,左边好。所以说我找了两个模型去做评测,我们把任务给到它以及它的产出字幕内容全部给到两个模型,第一个是恰当的 gpt, 第二个是谷歌的界面,来去看这两个模型到底哪一个分析的这一个深度, 以及他的一个真实感更强,最终得出的结果。我们来讲一下,那整体的一个结果的话是 m 二点五肯定是提升的蛮多的,第一个是速度变快了,第二个是他拆解的更稀了,第三个的话是他的一个真实感更强了。好,下面我们来做一个总结。 一句话的话就是当前我们这个任务的评测的话,在编程这一块 codex 要领先一些,那 off 四点六要辞职, mini max m 二点五的话更适合做一些速度优先以及你追求性价比的快速落地的一个场景。好,这就是这期视频的全部内容了,熬了一个通宵做的,如果觉得这期视频做的不错了,记得给我一箭三连,大家拜拜。拜拜。


ai 帮我们搞定了前后端开发,但是我们要怎么对接起来呢?并且还要部署上线这期视频,带你一步一步搞定。上次我们让 mini max m 二点一模型开发好了前端界面还有后端的接口,但是还没有实现真正的接口对接, 所以我们现在就开始我们的对接流程。上期我们把所有 a p i 接口都实现好了以后,可以在目录找到这个 dux 文件夹,这里存放了一个 c a p i 的 接口文档,我们现在需要把这个文档复制出来,放到我们前端目录下面,交给前端对接就可以了。 对接的话这里还是用我们之前准备好的提示词,不需要额外修改什么内容,直接发给前端的 mini max 就 行了。对接完后,我们回到微信开发者工具,可以先看看有没有问题。像我这里现在控制台爆了很多个错误,但是如果我们分不清是什么错误, 那就把所有的错误复制下来发给后端的 ai 这里你们也可以换个方式想一下,因为我们前端是按照后端给的文档来对接的,但是对接出了问题,那我们是不是应该先问给我们文档的那个人,就像你自己去买商品,商品出问题了你是不是先找老板, 就和这个一个道理,修改好了以后,我们再回到前端的代码,看看什么情况,这里发现报错信息现在是正常了,提示我们微信登录失败,但是就算登录失败也不是一直刷新, 所以我们现在要搞清楚是不是前端有问题导致的,因为所有的前端显示的问题,比如这种一直刷新都是要交给前端来解决的,因为后端只是一个调用接口的情况,就比如这个登录失败,我是调用的后端给的接口, 那么这种情况就需要找后端来解决。页面问题就是找前端来解决,像我们现在又出现了微信登录失败这个问题,那就是显然要让后端了,修复好了以后,我们再回到前端, 现在就可以看到了前端这里登录成功了已经。现在需要对每一个接口进行排查问题,意思就是每个页面检查数据对不对的,上签到功能,绑定功能,这个流程是不是对的, 还有签到完后这个排行榜会不会更新。然后我这里的情况就是刚刚点击签到成功了已经,但是个人中心页面这里还是显示零 接口是返回正常的,没有爆红,所以我们就把接口的相关地址复制出来,还有返回结果这些可以直接发给前端 ai, 因为是前端显示的问题,这里前端 ai 没找到到问题, 但是提示我们加了调试日制,那我们就要学会怎么看日制。首先就是我们这个 cansl 这个控制台,所有的日制都会在这里面,只要我们进入到了这个页面里面, 你可以看到下面多了 ai 说的那些内容,这个时候我们只要把这些日制信息复制出来发给 ai 就 可以了。所以说前端一块,你只要学会看 cansl 和 network 这两个东西, 就基本够你写一些中小型的项目了。 console 可以 看到你所有代码的有没有报错,还有一些调试日期, network 就是 可以看到你所有的网络资源请求, 比如调用 a p i 接口和访问了一些外部的图片,这里都可以看到。修复好了刚刚显示的问题以后,我们再回到小程序页面看看效果,这里用户名称和累计存活是不是就出来了,然后这个排行榜的序号也是应该显示一二三四这种效果,但是它给我们显示了一串英文, 所以这里也要让前端 ai 一 会儿帮我们调整一下。修复好了,那我们这个项目就完成得差不多了,可以考虑部署上线了。 总体来说,这个九点九的 mini max m 二点一这个模型写代码能力还是可以的,如果配上一些最近比较热门的 sales 或者其他的 mcp 来一起的话,效果还可能更好。目前开发起来给我的感觉可以说是可以和 cloud 五五开的一个效果,像这个九点九二我觉得比 cloud 的 便宜太多了, 而且一天调用一百多次,完完全全够用。小程序部署的第一步我们要知道哪些东西,就以当前项目为例子,我们做的是前后端分离的项目,我们需要准备服务器、域名这两个东西就可以了,域名的话几块钱也有,服务器的话看你配置做选择, 便宜的话九九一年的阿里云也能用。小程序首先是要设置好一个主营类目,然后正常走备案流程, 备案流程一般是二十个工作日左右,有的城市会更快。如果你实在不想用脑子的话,那就全部交给 m 二点一,帮你想疑似词就大白话告诉他就可以了,就像你自己问豆包一样一个道理,我发现很多人都是这样,都会觉得开发很复杂, 但是我们都用 ai 开发了,为什么不问 ai 怎么部署上线呢?小程序的话我就不进行演示了,因为都是一些点一点的操作。我们再来说一下后端这个项目应该怎么部署到宝塔面板。首先我们要在服务器也装上宝塔面板 这个东西,之前有说过,可以去看宝塔面板的官网,然后打开你的 m 二点一聊天窗口,直接问,我在服务器已经安装好了宝塔面板, 但是我要怎么部署,你先给我一个流程,他是不是会告诉你每一个步骤,然后你需要怎么操作,需要上传哪些文件,然后怎么绑定域名,怎么运行项目?这些流程 ai 都已经讲得很详细了, 如果你没有找到的话,你就截图告诉他。所以整套的开发流程就是先把小程序相关的信息,该备案的备案好,该设置的设置好,然后提交审核,审核完如果失败了, 那就按要求改,如果不会改,就把失败原因拿下来发给 ai。 后端上线大概流程总之我们除了开发问题能问 ai 上线流程也是可以一步一步问 ai, 不要把开发想象得太复杂,我们可以先写简单的尝试, 先尝试上线一个自己的小程序,后面再去写一些商用级别的东西。这期视频就先到这里了,有什么不懂的评论区留言我有,看到的话都会回复,所有的提示词还是老样子,看我主页粉丝群。

我将演示在 cloud bot 中,接入 mini max m 二点一模型进行使用。首先需要说明的是,最新的 cloud bot 已经更名为 mult bot。 首先需要在本地进行下载安装,复制这条指令到终端中粘贴并回车等待安装。 这里是一个许可申明。我们选择 yes, 然后进入 quick start, 我 们选择 mini max mini max m 二点一,然后粘贴我们的 mini max api key。 然后接下来是选择一个 channel, 这里我们先跳过,然后 skill status。 呃,我们现在先不配置 skill 这里的 hooks。 呃,我们可以暂时先选择这个 session memory, 也就是保留每次绘画的这个记忆, 然后等待着后端进行。呃,此处我们选择推荐项, 然后可以看到在浏览器中已经打开了这个 cloud bot 自带的前端,然后可以看到我们现在的这 assistant 是 没有输出的,因为我前面所用的 api key 是 mini max 国内版 coding plan 的 key。 这时候我们需要做一个配置的调整,进入此处 config, 然后我们往下拉有一个 models, 然后点击 providers, 可以 看到这里我们前面配置的 minmax 的 供应商。但是呢,我们需要对这里的地址调整,需要改成 minmax i 点 come, 然后勾选这个 else had, 再把 api key 重新贴入此处,然后保存 update ok。 呃,更新过后需要静等几秒钟,后端连接完成后,可以看到右上角这里的连接状态也是显示正常的,那么我们再进入 chat, 我 们来试验一下, 可以看到此处调用成功了。 当然,除了上述通过 cloud bot 自带前端进行配置的修改以外,我们也可以进入到 cloud bot 本地的配置文件,通过根目录下点 cloud bot 文件夹下打开这个 cloud bot, 点 json 文件初识配置后, 这里的 base u r l 是 mini max 海外版的模型访问地址, 我们需要把它更新为现在的这个国内版的即可使用。呃,然后也要注意一下,这里 agent 需要把这个 设置包括模型的列表中需要添加 mini max 二点一模型,然后它的这个主模型设置成 mini max 模型,即可在 cloud bot 中成功调用 mini max 模型。

今天这个视频将帮助你掌握一个无线提效,真正能帮你来干杂活的一个 ai 工具。你看它可以帮我收集我最新的几个视频下面的所有评论,整理到一个 excel 表格里面包括最近非常火的 cloud bot, 你 只需要给他这个提示时,就可以帮你自动的安装配置好,并且接入飞书。这个强大的工具到底是什么呢?它就是 mini max 前不久推出的桌面端 ai agent, 名字就叫做 minimax agent, 接下来我就给大家介绍一下如何使用 minimax agent 来帮你干无数的杂活。 ok, 首先说一下这个 minimax agent 呢,它是一个电脑端的 app 啊,或者是软件,所以首先我们需要下载一下啊,那下载的话就很简单啊,直接到这个网站 agent 点 minimax 点 com, 注意这边最后有一个 i 啊, 它不是 minimax 点 com, 而是 minimax c, 可以 看到这边这个 i 好 完了,进来以后呢,可以看到它这边就提示你说啊, minimax a 键呢,目前有了桌面吧,然后你这边点击下载就好了啊,好像可能这个标可能过段时间就没有了哈,所以呢,你也可以点击右上角的这个下载,点进去以后呢, 可以看到他这边分不同的系统版本啊,我们选一个我们的版本就好了,比如说我这边是半版的麦啊,点一下他就开始下载,然后下载好了以后你正常安装就好了。那安装完了以后呢,我们打开他就是这个样子,从界面上看起来好像跟豆包这些挺像的,对吧? 但是相对于豆包这种对话式的聊天 ai, 它最大的特点呢,就是它可以访问你电脑上面的文件夹啊,比如说这边我这边是给了它这样的一个 mini max 文件夹,我们也可以给他一个新的,为了释放我们给他一个新的吧, 我一般是把所有的这些 app 的 数据都放在 document 下面这个 app data 这个目录上面,然后我们给他个新的文件,我们新创建一个叫 mini max agent, 然后这边会弹出一些权限,我们直接点确认。那后续你在这边,比如说你给他做的一些事情啊, 他会在这个文件夹下面来做,相当于这个是他的一个工作区间,包括如果说他生成的一些文件啊,比如说写的一些脚本,或者帮你写的一些 ppt, 他 都会放在这个文件夹下面。 这个跟比如说我们把一个文件夹托给豆包这种模式还不一样啊,比如说你把一个目录托给豆包的话,其实是你是给了豆包你这整个文件夹下面的时候的文件作为上下文, 但这里呢他不是一个上下文的关系啊,虽然说他也能访问到这个文件夹下面的一些文件作为上下文,但另外他还有一层意思,就是他会在这个目录下面来工作,相当于这个目录是他的一个工作区间。对,所以还有一些不一样,然后可以看到这旁边 你同时也能上传文件啊,这个就是跟豆包你直接给他的文件一样。然后呢再点击旁边,可以看到这边还有一些像其他的一些功能的增强啊,比如说一些纸袋里,还有像这个 mcp 服务器,对吧? 点开可以看到它自带了很多的一些 mcp 啊,像这种的话,应该是你只需要点击一下添加,比如说这边输入你的 note 的 token 就 可以添加成功的,然后在这边你也可以添加一些自定义的 mcp。 不过这边比较遗憾的是,它这边只能添加一些 remote mcp 服务器,就它目前不支持添加运行在你本地的那些 mcp 服务器。 对,这个我觉得算是个遗憾吧,但我相信因为这个 mini max 它目前也刚刚发布不久嘛。对,所以我相信它后续应该是会逐渐的支持这种本地的 mcp 服务器的。好,接下来我就演示一下如何让它来帮我整理我最新发布的视频下面的一些评论。那我们直接给他这个提示词, 这个提示词呢,大家如果想要的话,我可以文档发给大家。那基本上就是让他用内置的这个浏览器访问这个链接啊,这个链接呢,其实就是我的那个视频的, 你看这个视频列表的这个页面,然后让他帮我把这个博主先救我了。最近的两个视频呢,这里为了简单起见,我们就只让他把两个视频所有的一级评论整理出来,提取评论的用户名,评论内容包括评论时间,还有作品的链接, 整理到 comments 这个 excel 里面,后面有给他一些注意事项啊。好,我们提交。那这里需要注意的是,一定要把这个浏览器专家给打开啊,不然的话他可能没有办法来访问这个内置的浏览器。好,可以看到他这边在开始帮我们来干活了。 好,可以看到他这边用内置的这个浏览器打开了我的这个 b 站的视频列表, 点开了第一个视频,然后往下滚动了,他整个过程呢会确实会比较漫长啊,所以这边我们就不全程录制了,但大致的这个过程大家我相信已经感受到了,那我们就快进一下。 ok, 一 段时间以后呢,看起来他这个帮我们抓取好了这个评论啊,我们打开看一下效果,可以看到这边帮我们把这个评论都抓取好了。 ok, 接下来再给大家演示一下,就是使用这个 minix agent 来安装目前非常火的这个 cloud bot。 好, 当然现在改名叫做 open cloud 了,呵呵, 那也很简单,就是直接给他这个提示词,同样的这个提示词如果大家想要的话,也可以飞书给大家,然后给他这个按照命令,然后呢让他呃接入飞书,那同时告诉他说我想用 mini max m 二点一的这个模型, 在这里告诉他我的这个 api key, 然后包括飞书应用的这个 app id 和 app secret, 那 这两个东西如果大家不知道该怎么获取的话,可以看一下我之前关于 cloud code 开通飞书 mcp 的 一个视频, 你们也讲的非常清楚,好直接给他安特,那在这里可以看到就是我们之前的这个评论,他还在处理,这个也是他的好处,就是说你完全可以在别的一个事情,不需要等这边完全停下来, 就可以并行开始处理另外的一个事情。然后我们可以看到这个 mini max 在 帮助我们安装 cloud bot, 这边在运行一个 cloud bot 的 安装命令, 然后开始配置 mini max api key。 ok, 过了一会以后,他这边就提示这边帮我们安装好了,然后呢甚至自动打开了这个聊天窗口啊,我们这边试一下啊。哈喽 哇,这边收到了他的回复,可以看到至少 mini max 这一边是已经配置好了啊,成功的配置了使用 mini max 作为这个模型 a p r 来进行干活。然后飞书这边的接入,我这边也 ok 了啊,只不过关于飞书的接入呢,它确实就在飞书这边,是还需要做很多的一些配置的啊, 所以这一块如果大家后续感兴趣的话,也可以评论一下,我可以来出一篇非常详细的如何让 cloud bot 来接入飞书的一篇教程。另外给大家介绍一下 mini max agent 这边还有一些庄家,那这些都是 mini max 或者是其他人帮忙创建好的一些,大家肯定以为是现在非常火的那个 skill 啊,比如说这边的知识消化助手,我觉得还挺有意思的。好,我们点进去开始聊天,就可以利用这个专家来帮我们做事情的啊。比如说我们这边把这个文档拖进来, 然后跟他说基于这个文档的内容帮我生成交互式的学习材料好 and, 然后他就会基于这个知识消化助手这个专家来生成交互式的学习材料。那这边给了我们一些问题,问我们想要生成什么样的内容,然后我们跟他说业余爱好者会 好,可以看到他这边在帮我们基于这个业余爱好者的水平来生成交互式的测验了,待会我们看一下这个结果,哈哈, ok, 很 快这个知识消化助手就帮我们生成了这个测试题啊,在这边我们打开看一下,就是这个,可以看到他生成了这样的一些测试的题目, 那像这样的专家呢? mini max 这边还有很多啊,就是可以看一下这边有各种股票分析啊,图像创作啊,还有公众号写作啊等等等等, 而且好像跟我前两天相比又多了很多啊,所以它应该是一个不断的在增加的一个生态的过程。 ok, 以上就是使用 minmax agent 来帮你干杂活的一些具体的事例,以及它们的使用方法。那说一下我的看法,我觉得未来肯定是需要这种能 够集成到你本地的文件系统,甚至整个操作系统这样的 ai agent 的 存在的,而且我觉得这个未来一定是各大 ai 厂商的必争之地, 所以 mini max 这个方向算是踏出了第一步。那目前来说呢,依靠我们之前提到的它的两个优势啊,目前已经能够帮我们来干很多的一些杂活了,只不过看来有一个比较明显的缺点就是它干活会比较慢,不过毕竟这是踏出的第一步啊,后续的话我还是 非常看好整个方向的,我觉得这一定是未来各大 ai 市场上的必争之地。所以在这里我们也祝 mini max 能够越来越好啊,拔得头筹。好,这个视频就到这里,觉得有用可以点赞关注一下,我是川哥,我们下期见,拜拜。


很多程序员的工具链里,终端 ai 助手已经成为了标配。不过说实话,想找一个用起来比较顺手,不用魔法并且稳定的方案,其实不太容易。最近我发现了一个叫 iflow c l i 的 工具,内置国产大模型,还支持 skills 啊,我用起来比较舒服。大家好,我是海拉的编乘客,今天我使用 i flow 给大家演示两个用法,一个是在日常生活中用它来写一些想法验证啊,写一些 poc。 老规矩,我们不打开 ide, 不 手写代码。第二个,我们使用 skus 来对我们代码仓库做一个体检。 好,那我们先打开 icl i 的 官网,在这里进来之后呢,我们先安装复制这一个命令,然后粘贴到你的终端中。 好,紧接着我们需要登录,我们敲斜杠 else, 然后选择第一个登录, 接着我们选择默认的模型啊,也就是 g l m 四点七。 好,我们语音输入,你是什么大模型啊?这也是我最喜欢问的。好,它现在说是 g l m 四点七大模型啊,也就是说我们可以在 iphone 里面使用多个大模型。 在日常的开发中呢,我们会经常做一些想法上的验证,比如说验证某个技术方案行不行啊?老板甩过来一个需求,说,这个淘宝上边的搜图,哎,拍张照片搜到对应的这一个商品,能不能做?我们先进入目录, 我们叫 image search。 接着呢,我们开启 i flow, 我就直接和他聊,老板说什么需求呢?老板说淘宝上面的这个搜图是怎么做的,是吧?那我们问一下他。 呃,我想问一下,类似于淘宝上面拍照搜物啊,搜到某一个商品啊,这个背后的原理是什么?这个专业术语叫什么啊?请回答我一下,谢谢。 我们通过刚刚描述很虚的需求啊,就可以拿到一个术语叫做以图搜图啊。紧接着我们就直接把需求告诉他, 我想做一个以图搜图的这一个,呃, poc 啊,我想请你帮我列出这种最小的需求是什么? 好,我们看一下,这里有一个以图搜图的最小 poc, 核心需求如下,有一个,上传图片特征,提取 相似图片解锁。然后呢,技术组件呢,建议使用 python, 图像模型呢?建议使用 clip, resnet 和 mobile net。 还有一个向量数据库啊,有一个 fast 和一个。呃, milos 啊, 前端呢?简,建议我使用简单的 html, 后端框架呢,使用 fast api 啊,这个包括选型做的都还可以。 呃,这里我有一些不明白的地方,就是图像模型和向量数据库,因为我其实在写 poc, 我 并不完全需要一个数据库,我只需要让他帮我写文件,最后帮我解锁就好了。这一个数据库呢,可能并不是一个必选的像, 而这一个图像模型呢,这里面涉及到很多个模型,我也不知道哪个模型好,但是在写 poc 的 时候呢,我现在需要验证这一个图像解锁是不是 ok 的, 我并不需要做到非常非常精准的图片解锁, 我需要把这一个 poc 跑完。至于模型我们选择什么模型,还是后面选择单独的某一些模型做一个 fight, 这些呢,都是可以在后面考虑的,不属于我们 poc 的 部分,所以我需要问他。 这里我有两个问题啊,第一个问题是模型上的选择,其实我更想选一个比较小的啊,能够跑完这一个是 poc 的 啊,一个模型就好了。然后呢,请你给我一些建议。第二个问题是,我觉得销量数据库其实并不是必要的,我们可以先把东西存在本地,对吧?然后我们就 可以完成这一个 poc 了。呃,你先不要帮我实现它,不要写代码啊,我们验证一下,我们聊一聊, 在实际的过程中,和 ai 聊天的时间应该是占到整个开发比重的四分之三。呃,我的建议是大家尽量花更多的时间和 ai 聊通了。然后呢,再去落实 好。我们大致扫页,针对 poc。 他 建议这一个清亮模型啊, mvnet v 二 resnet efficient net 这个我都不明白。 open clip 啊,这个我是明白的,但是 open clip 我 印象中它的汉语知识不是很好,并且呢,我们只需要做以图搜图,并不需要做一个文字搜图,所以说这个 我们选一个中间一点的吧,选一个四十五的。然后我们看到问题二,向量数据库的必要性啊,说 poc 间呢,确实不需要向量数据库啊,他认同我了。 好,这里面我们看一下,通过 npy 加鱼弦相似度就可以搞定了啊,零依赖,代码简单。然后呢,一千张以上图片会慢啊,慢呢?估计就是解锁方面吧,我觉得这个不是什么大问题。 然后建议方案模型存储后端前端,然后启动时加载模型,从本地 m p y 加载特征库,然后上传图片,提取特征,与所有特征计算相似度啊,这个看起来都还挺 ok 的, 那我们切到一个 呃 plan 模式吧,我们把我们的开发计划再深入的聊一聊。我现在呢,想请你使用呃, esnet 啊,来帮我。这个模型。 后端呢,使用这一个 fast api。 前端呢?呃,我建议你使用这种单页的一个呃页面,然后呢,我希望通过 fast a p i 把这一个网页 host 住啊, 接着呢,样式上我建议你美化一下啊,用一个类似 vs 的 高高科技感的暗黑模式。 然后我们再想一下,在这一个数据流这一边,有一个启动时加载模型,从本地 npy 加载特征库, 然后上传图片,提取特征,与所有特征计算相似度。这里面还漏了一个情况,需要补充一下,我们可以先写,还需要写一个脚本,把这一个几千张图片把它转化成特征库,才能 在上传特征库的时候提取特征,返回 topk。 结果啊,所以说这里面还漏了一点, 是这样子啊,呃,还有一个需求是我需要你,呃,写一个脚本对吧,可以把对应的图片转换成一个,呃,特征 特征库对吧?好,记得一定要开 plan 模式。 他说图片库的数据来源是什么?需要网上下载样本图片的方案吗?啊,这里我已经准备好了, 大家可以看到这里面有 image 啊,我把它这一个移过来, 在这里我们选择 type something。 你说。接着呢,前端页面需要一个拖拽上传图片啊,实时预览上传的图片, 要把它缩小一点。 接着呢,显示相似度的分数,这个需要的点击查看大图呢,我觉得没有必要,然后我们再提交答案,这个时候呢,他就开始做了 技术栈后端前端存储,还有这个计算啊,运行相似度没有任何问题。 呃,有一个 build features 啊,通过特征库来构建脚本啊,也没有什么问题。 核心功能拖拽啊,返回暗黑色的这个科技感 ui, 现在我们可以看到,作为 poc 的 话,一整个规划是比较靠谱的啊,那我们就直接选择第一个, 呃,看一下这个功能特性上面都好,是吧。我们好,我们接下来安装一下依赖 啊,我们大致扫一眼这一个 view feature 这一块有没有问题啊?大致扫一眼,通常情况下不会有问题,但是难说。 好,我们先构建对应的这一个 feature, 接着呢,我们可以给大家看一下对应的这一个图片里面是什么啊,都是些小猫小狗啊 啊,我现在都已经感受到我的这一个风扇在狂转了。 好,这里面已经,哎,已经做完了是吧?然后他写了两个文件来看一下啊,在 matedata 里面写了一些,应该是原数据,然后在这一个,呃, features 啊, py 里面啊,有十四兆啊,它应该是把这一个图片提取成某某些特征啊,它就和人类一样,人类不能像相机一样记住每一个像素,但是人类呢,也是通过照片上的特征来区分的啊。我们启动服务, 能启动吗?哎,能启动能启动,我们打开好拖拽图片。 ok, 接下来我们验证一下啊,我们选一个蓝猫, 把它截图保存下来。哎,蓝猫原来是俄罗斯的, 打开一下,接着呢,我们点击选择把这个图片读过来。哎,我们可以看到,基本上都可以找到懒猫了。 这个输入法真的是变了,选一个吧,选一个放下来保存,接着以图搜图 搜索。哎,我们可以看出来,那这一个小狗就被搜出来了。 poc 写完了,我们还想知道 poc 距离真实的生产还有多远? 我现在想问一下这一个,如果说我真的要做这种宠物上面的解锁呀,对吧?这个搜索到对应的宠物还有哪些这种非常呃硬核的工作是需要做的啊,我觉得是不是 呃 poc 距离生产还是有一段距离的啊?请你和我聊一聊 poc 层面啊,使用的是这一个 oxford, 还有点意思,它是不是读到了哪些原数据 真实呃,生产需要真实场景的图片啊,手机随手拍,各种角度,光照复杂,宠物遮挡,被主人抱着躲在沙发后啊,这确实是 多宠物同框,这也是,然后模糊低分辨率,这是看起来就是非常多啊,然后数据清洗式,这一块标注式,一块数据增强技术啊,构建更大更多样化的做一些模型的特化,就是模型现代化, 这个生产需要 fight, 然后目标检测,注意力机制,聚焦宠物的关键部位, 多尺度的,多尺度的特征啊,这看起来太多了,太多东西需要做了。现实的建议是先做 mvp, 然后逐步打磨,不要一开始就想做的完美啊,这也是符合咱们这一个就是基本要求的。可以看出来, flog 加 glm 四点七给出的这一个建议啊,都是比较重肯的啊,有哪些东西要做啊?有哪些东西是比较硬核的代码啊? poc 的 最核心的部分可能也就几十行几百行代码, 但是要真正的把一整套做出来还是需要很庞大的这一个工作量的。 在上一个项目中呢,我们写的是 poc 啊,写 poc 的 时候呢,就需要 web 扣定一些,氛围编成放松一些。 但是当我们在加功能啊,想让这一个代码变得更稳定一些的时候,那我们就需要加入一些这种质量审核。我之前写了一个 skills, 那 我们打开这个 skills 来看一下,这个 skills 是 我专门用来检查代码的,那 基于代码整洁之道,聚焦七个高收益的检查维度。比如说命名,一定要是有意义的,命名函数要尽量的短小啊。就是,而且要单一职责,尽量减少重复, 尽量规避过度的设计啊,一些魔法数字,还有结构清晰度和 项目规范。呃,每一个问题都会给他排上不同的级别输出的格式呢?是像这种有原则、有位置,有级别,有问题,有建议啊。然后有两个 reference, 并且这里面会开启多个 a 键来扫描这个,这里面我们让他帮我全面做一下审查汇总的报告。每一个维度开一个 a 键 啊,但是要串行完成,不要并行。如果开四五个 sub a 键的长时间跑的话,会遇到并发症问题啊。我们建议他一个维度开一个 a 键的串行完成,一步一步做。 iphone 目前还没有开放并行,但是在他们的论坛里面有并行的体验卡,如果大家有需求的话,可以去看一看, 大概二十多分钟就把任务跑出来了。呃,跑了接近七十五个问题啊,应该是非常给力的,高优先级的大概有十二个,中优先级的有二十九个,我们看一下,大致扫一眼吧, 有些命名啊,这个项目规范啊,我们往后拉一拉看 啊,高优先级,看看删除组建或实现集功能啊,这就没写,是不是然后 mcp test 啊,我这个也是没写。 嗯,这个检查确实是挺到位的。然后消除重复的文件,更新逻辑, 这里面有重复的代码哎,看起来符合我的认知。然后提取关键业务,敞亮, 重构核心业务函数啊,总的说来还是不错的啊。这里面包括有这个 run, open code, s t k streaming 啊,这个函数呢,要提取 event buffer, event handler, session manager 这些类。呃,都是蛮符合我的理解的。 用了几天,我的感受是够用,而且比较省心。市面上大部分固定 a 键呢,有的功能它都有,比如说 m c p, 工作流 skills, 开箱就能干活,登录就能使用。另外,零点五版本加了两个非常实用的功能, 一个是 hooks, 可以 用来做一些提醒。一个是 restore, 如果你搞砸了,你可以回退。当然,我也建议大家用好 git, 这样子你可以做一个双重保险。那我在体验的过程中呢,也有一些不足。 c l i 的 这一个界面上的细节, 我觉得可能还需要打磨一下,比如说我看不到上行和下行的 token, 在 写大一点文件的时候,我非常想知道他在写文件还是卡住了 i f o 官方与社区,他也希望社区能够涌现一些类似于欧曼 open code 的 这样 强大的编排系统。怎么说来,如果你喜欢在终端里干活, i f o 绝对值得你试。如果你也在使用 i f o, 欢迎来聊聊你的使用体验。我是海陆编程课 ai 永不眠,我们下期节目再见。拜拜。

这几天一打开 x 啊,就是 mini max 上市的消息,一出手就是几百美刀的市值,真不愧是国内大模型 ipu 市值的第一股。 在 x 上呢,我还看到了很多人晒得用 mini max 最新模型 m 二点一开发的作品,而且据称啊,在相当部分指标上赶上甚至赶超了可拉德的设定的四点五模型。我觉得吧,大部分人呢,对这些指标啥的也看不太懂,今天你超过我,明天我超过你,咱们还是来实测一下,看看效果到底怎么样。 这个视频呢,我将用五个案例来测试一下 mini max m 二点一的模型在编程方面的能力,包含游戏、动画、网站开发、浏览器插件等多个领域,是骡子是马,拉出来遛遛就知道了。 我这里呢,选择的是在 cloud code 里面使用 mini max 模型,然后使用 c c switch 这个工具啊,来切换大模型的环境。这个呢,也是官方推荐的方式。 这第一个案例呢,先来测试 m 二点一网站开发的能力,这个呢是我之前的个人网站的首页,我把首页的 html 另存下来,然后让 m 二点一呢给予这份首页的原版,里面的信息呢,给我重新设计一版,我们来其中看一下, 看起来呢,效果还不错哈,跟我之前的风格呢,差别还是有点大,不过呢,还是有一点 ai 味,但是呢,已经没有之前的版本那么重了哈,那作为对比啊,来看一下,这是我两个月前用 mini max 的 上一个版本 m 二做的网站, 大家可以看一下,这个进步还是非常明显的。另外,关于如何解决 ai 编程中的 ai word 呢,感兴趣的同学可以看我上一期视频 m 二点一的这个版本呢,我觉得可以给到八十分,如果里面再增加一些图片素材的话,整个效果会更好一些。 接下来呢,第二个案例,就来测试一下 m 二点一画 svg 动画的能力。因为我最近做了一个 svg 动画网站,所以只要有新的模型出来呢,我都会特别关心他做 svg 动画的能力。来画一个经典的太阳系八大行星运行的动画。 嗯,完成的还不错,不过距离 gmail 三 pro 出的动画呢,展示还有差距,也可以提到八十分吧。接下来第三个案例呢,来开发一个小游戏坦克大战,大家都玩过吧,我们让 m 二点一来写一个试试。 ok, 已经写完了,来打开看看效果。基本的游戏功能确实都已经具备了,不过就是不太像啊,感觉还可以再叠代,叠代这个 case 我 觉得可以达到七十分吧。 接下来我们让 m 二二一呢开发一些比较有用的东西。咱们程序员平时在开发过程中啊,经常要查看数据库,最常用的就是 livecat 了,不过这个玩意儿它要收费,破解版呢,又容易藏病毒。其实我们完全可以让 ai 来帮我们开发一个简单的数据库连接管理的工具, 这个呢是我的提示词。让 m 二点一啊开发一个黑客风的 my circle 数据库连接管理工具,你可以在线连接数据库,查看数据表里的内容,执行 circle 等等。 later。 ok, 已经开发完成了,我们来运行一下看看效果。 先来新建一个连接这里呢,连接我本地搭建的 my circle 服务器哎,可以看到成功的展示出了数据库和数据表,点击表呢,也能看到数据,看起来效果还不错哦,而且整个界面也是非常的简洁,来执行一下 circle 试试。 哎,成功就行了,这个应该是我目前最满意的 case 了吧,我感觉可以给他九十分以上,再叠加优化丰富一下功能,真的可以在日常工作中用起来了。 最后一个案例呢,我们来开发一个浏览器的插件,那作为一个计算机方面的博主呢,我每天要花不少的时间在 x 上获取 ai 方面最新的动向和发展,每天刷过的推文啊,非常多,而经常前面刷了,后面就忘了。那我先让 ai 开发一个浏览器的插件,在浏览 x 上的推文的时候呢,可以很方便的一键收藏。 然后每天晚上呢,我可以一键让 ai 帮我总结出今天刷过的内容,给我出一份 x 浏览的日报,把下面这段包含我详细需求的提示值啊,交给 m 二点一,让他来开发这个插件。 ok, 已经开发完成了,我们来试一下啊。在浏览器的地址栏呢,输入 chrome extension, 打开插件管理,那在这里呢,我只是我自己使用,所以呢不需要去上架谷歌的应用商店,所以可以打开这里这个开发者的模式。然后把刚刚 m 二点一编写好的插件呢,打包成一个压缩包,直接拖过来就可以了。 哎,可以看到插件已经安装好了,不过没有图标啊,这个我们后面可以让 ai 给他补个图标,更好看一点。这时候打开 x, 可以 看到所有的推文呢,旁边都有一个收藏按钮了,一点击就可以把它收藏起来, 然后点击右上角的插件图标,可以看到刚刚收藏的所有推文了。在最下面这里呢,还有一个生成今日日报的按钮,我们来点一下试试。 呃,好像不太行,因为我还没有配置 ai 和 api k 的 信息哎。根据刚刚 m 二点一输入的信息呢,可以右键点击选项进行配置,可以去 mini max 的 开发平台配置一下 api 的 k, 然后填在这里, 配置好了之后我们再来试一下。哎,这下可以了。 呃,就是排版瞅了一下哈,后面可以再优化一下,不过基本的功能是跑通了。完成度还是不错啊,可以给到八十五分以上。好了, 以上呢就是这五个案例的全部演示了。那经过我的实测呢, mini max 的 m 二人一模型啊,比起它的上一个版本确实进步了很多,带完成度、可用性、 ui 审美以及需求理解能力呢,都可以应付日常大部分的场景了。不过也要承认,还是有很多进步空间的, 希望后续的版本呢,越做越好。 mini max 让我印象最深刻的一点啊,是它提供了充足的使用额度。之前用 cloud 自家的模型的时候啊,总是每过一会啊,就要用一下 user 及 mini 去看看剩下的额度,用 不了几下五小时额度就满了就得等。而 mini max 的 额度太充沛了,上面这一堆案例用完啊,结果一看,额度居然才用了百分之三十四,才三分之一,再也不用担心干活干到一半 ai 摆烂了。 不仅额度丰富啊,价格呢,还只有 club 的 官方的 n 分 之一,我之前每个月充值 club pro 会员啊,都要花上接近两百,而 mini max 啊,额度更丰富的套餐却只要二十九,首月更是只需要九块九啊,这价格卷的实在太像了。那总的来说呢, mini max m 二点一呢,是一个性价比非常高的 ai 编程模型, 如果你也有 ai 编程的需求,尤其是使用需求量比较大的话呢,那我推荐你来试试这款模型,刚好趁现在限时返场活动啊,首次购买只需要九块九,新老用户通过我评论区的专属链接还可以享受八八折哦。 好了,以上呢就是这期视频的全部内容了,上面所有的 case 代码以及我的八八折的专属优惠链接呢,我都放在评论区了,有感兴趣的同学可以自取哦。我是轩辕,我们下期再见!

cloud comwork 绝对是近期热度最高的 ai 编程工具,与此同时, minimax 也刚刚发布了桌面端 minimax agent, 正式开启了 ai 原生工作台时代。 它最大优势是开箱即用,能感知你的本地环境,自主拆解复杂任务,还拥有专家级的专业能力,几乎具备了 cloud comwork 的 一切功能,而且对中国用户特别友好。 那本期视频呢?我将会大家使用 mini max agent 去完成三种不同的实测案例场景,那分别是文件处理以及生成专业的 ppt。 最后我们来使用这个 agent 去开发一个实战游戏。 首先我们进入官网,然后在这里点击下载。安装完成之后呢,我们可以在左侧新建点任务,然后将你的任务交给 mini max agent, 它不仅是 talk 六 i 七那么简单,而是能真正的操控你的本地文件,帮助你去完成一些自动化的操作。相比于 cloud comwork 的 沙盒隔离环境,那 mini max 的 接口呢,会更加的有优势。 那首先是第一个,你看它不受网络限制,并且它能真正的操控你本地的文件和环境,也不需要打开终端对吧?你直接在这一个页面就可以完成你所有任务,你把你的任务交给他对吧?全程由 mini max 来帮你处理,它中间的每一步操作,对吧?都非常清晰,包括这个全程是可式化的。 那我这两天呢,用这个 mini max 来到了很多的收益,所以我觉得是一个非常好的工具。那下面我们一起来实测一下。好吧, 第一个测试呢,我这里呢准备了文件夹在这里面呢,我放了一些我平常用到的小工具,那我希望 mini max a 呢可以帮助我去进行一些分类或者重新命名,选择这个文件夹大家可以看到对吧?嗯,但我选择之后呢,下面会有些建议,包括我们刚刚说的想法,他已经帮我们推断出来了,那我这里呢就直接让他命名了,我们等待一下。 好,这时候我们可以看已经执行完了,那整个命名的格式是非常清晰的,甚至呢我们可以让他再整理一下目录结构,比如告诉我们哪一些文件做什么的,非常的清晰, 这就是我们的这个 mini max 的 app 的 本地操作能力,它可以帮助我们一键的去读取,自然的处理,包括自动保存,那全程呢,都不需要我们手动的去来整理,像这种图片呢,文本呢都可以交给 mini max 的, 让它去处理。第二个设置呢,我想把 mini max 的 帮助文档丢给它,要求它生成一份高质量的 ppt, 那我们来看下成品吧,我们可以看到效果是非常不错的,整体的配色包括品牌色都完美融合了,排版也是非常清晰。那从这一份帮助文档到我们的演示文稿的 ppt 转换整个流程呢,只花了大概几分钟,可以看到是非常清晰的。 下面呢我们来到了我们的重头戏,就是我们使用 mini max agent 帮助我们开发一个实战游戏,我准备大家从零到一的去开发这个游戏,使用 mini max agent。 那首先呢,这是一个完整的三 d 设计游戏,那我们给大家提需求呢,我们要描述清楚我们的场景,比如说这是樱花茶园,设计游戏要有一个场景,包括目标,还有完整的一个计分系统。好,最后我们可以看到我们 在右侧就可以看到显示一个实时的开发进度,每完成一个模块呢,他会打上一个勾标记好了,已经开发完了。那我们可以看到整个游戏的场景氛围感是非常强的,说明 mini max 对 场景包括 ui 的 理解能力都是特别出色,能够将这个 ui 进行一比一的还原。 mini max 的 程序呢,还有一个专家 agents 的 概念在这里呢,你可以封装你自己的行业经验,去打造一个属于你自己的专家分身,实现人力的规模化附用。那下面我给大家来操作一遍。首先我们可以打开 mini max 的 平台, 然后呢这里呢选择这个专家,在这里呢创建你自己的专家。我们可以看到创建好的专家呢有不同的指导,你通过这样的方式,我们就可以将一个人的经验变成团队的标准, 大家也可以去使用你的专家,你这个产品还在快速的迭代中,一月十九号到二十二号都是限时免费,强烈推荐大家抓紧试试。 体验下来我们可以发现 mini max 真的 很能打,对非编程人员是超级友好。那最后我们来总结一下,相比于 cloud cowalk 的 沙盒隔离环境, mini max 的 优势在于 我们并不需要去关心,就是受到网络的限制,而且呢它的隐私保护性非常强,基本上是无缝衔接。好了,那以上就是本期视频的全部内容了,我是小刘,我们下期再见。

兄弟姐妹们,老少爷们们,今天我给大家介绍的就是 mini max m 二和 cloud code 的 结合,它到底有哪些优点,有哪些缺点?怎样上手?我到底推不推荐?听我给大家说一说。先说结论啊, mini max m 二从性能上, 从坚韧能力上都相比 kimi k 二毫不逊色,比 gm 略强。从绘画的友好程度上, mini max m 二比 glm 四点六的友好程度好上一百倍。为什么呢?如果你用过 glm 四点六,它每次都会跟你说完美, 到最后功能没有完成崩溃就能力就说的这句话了。 mini max m 二的价格也很有优势,目前二十九块钱的 价格也很合理。从使用量上来说,感觉 mini max m 二的 token 消耗的还是挺快的。 mini max m 二的 对话友好程度是我最喜欢的,跟 mini max m 二的对话很快就把 token 消耗光了,可能一个小时不到 哎,就就全用完了。但是 d r m 我 就没有遇到过这样的情况,基本上它能够 满足我两到三个小时的一个编程的强度,但这一点并不是完全是 g m 的 优势,相反,编程效率其实更加重要。如果你能够在半个小时内就能完成你的开发工作量,为什么要 消耗你的五个小时时间呢?如果你能够在更短的时间内完成你的工作,那你一定要花更短的时间。所以你要结合你的项目特点,你的编程习惯,选择适合你的模型。 接下来就开干吧!第一步,先注册一个账号,如果你进行实名认证,他还会送你一些 token, 那 这些 token 呢,也足够你耗一个迷你的项目了。而我呢,就直接先购买了他的一个 starter 的 coding plan, 他 第一个月九块九,足够替大家来验证 mini max m 二到底是否好用了。接下来值得注意的就是 你在你的 cloud code 的 配置文件里要使用 coding plan 的 api key, 而不是账户管理中的 api key, 千万不要搞错。好,那万事万物都是先看文档,编程小白会问 cloud code 怎样安装, 那 mini max 的 官方文档中也帮你介绍好了,你就按照步骤一步一步的开始就可以了。安装好 cloud code 之后,我们还需要修改一下配置文件,首先来说我们复制这一段,然后去修改配置文件 粘贴到这里边。接下来把 mini max 的 api key 也替换一下。 保存好之后,我们就在一个空文件夹当中执行 cloud, 就 可以看到 我们的 cloud code 的 版本以及当前正在使用的模型是 mini max m 二。那接下来我会用我之前准备好的提示词给大家比较一下 mini max 和 gim 的 效果。说一下我的需求,一个基于吹点 gs 的 三 d 小 岛场景,采用潜水员戴夫的风格设计,这里边的详细的需求,项目的结构,操作说明,以及我需要出现的一些特性。 呃,场景都已经描述的非常清晰了,仅基于 cloud 点 md 生产项目。这里也要看一下大模型的一个剪映速度, 我们可以看到描述当中八千端口已经被占用,这是我提前运行了另一个项目,把端口占用了。然后 啊看大模型的一个解决问题的能力。好的 g r m 标志性的完美出现在屏幕上了,那我们看看到底是否完美。好的还是不错的,可以拖动,可以旋转, 还可以用滚轮缩放,都符合我的要求啊。接下来我们试验一下 mini max, 请帮我基于 cloud 点 m d 生成项,八千端口已被占用,让我换个端口,端口占用的问题。好,我们访问一下项目, 让我们来对比一下,看看两个项目。 现在呢,我们再做一点有难度的事情,就是通过拍赏来进行变化投资。基本的思路呢,就是通过 to share 来获取 股票数据,然后通过获取的数据进行买入或者卖出的一个尝试。那么我们可以看到基本的规则就是金叉就买入, 死叉就卖出。然后呢,我们进行买入和卖出的一个 交易的执行以及回撤及我们通过带入历史数据,然后来计算我们的这一个策略的年收益。这些需求都已经写好了啊,那我们让 g l m 泡沫之线下可以看到他分析出来,我这是一个海上进行量化投资的一个需求,我会让他帮我生成基本的程序,可以看到现在已经在帮我生成程序了,现在正在创建主程序文件, 已经花了两分钟,现在他提示我要创建一些文件,那么我就默认全都允许。经历了三分钟,可以看到他现在正在实现数据获取的功能模块,现在在实现策略回撤功能模块。现在时间已经经历了七分钟,现在有新的进展了,正在创建配置文件 和 requirements 点 text, 现在已经经过十分钟了,最后要创建一个简单的运行脚本以及一个使用说明文档。经过了十二分钟创建完成,那么我们看一下 它能否正常运行,可以看到程序已经创建成功了,现在我让他帮我运行 好,现在可以看到他正在下载一些扩展,已经过了八分钟啊,现在提示安装依赖已经成功了,我们看一下接下来 能否正常运行。 a few minutes later。 我 等待了十多分钟哈,然后他提示我,还剩三点一点三,版本太新了, 你的包还不兼容,这也太奇怪了。这个虚拟环境一起拍上的版本都是你来选的,你现在告诉我不兼容,我就等你继续处理。系统中某一个扩展没有正确安装。他也太逗了,自己在玩自己, 都把我气笑了。现在 glm 帮我创建了一个命令行的版本,跟我的原始需求已经不一样,继续等待看他怎么样处理。现在提示我程序成功启动了, 由于是交互式的,无法在半生输入,所以创建一个演示版本,自动运行一个完整视力。玩呢?我们看一下正在运行的演示,程序 报错,修复,再次运行报错,玩呢?继续下一个策略。这是什么?现在他提示我,太好了,程序运行成功,现在运行完整的演示,现在继续报错。他说让我来修复这个错误,我现在已经等了半个小时了, 看起来很接近了,我想要一个网页版本,你帮我生成了一个命令行,版本,一下子倒退了二三十年啊,按他提示的是,太棒了,程序成功运行完毕, 那么我们就使用一下啊,初使资金十万,最终资金是九万八千多,总收益是获得一千五。好的,谢谢你啊, 这就是 glm 的 结果。接下来我切换到 mini max, 让 mini max 帮我来处理需求文档,请帮我。他说会帮我创建一个完整的可运行系统,包括前端页面和后端代码。希望你一定要争气啊, mini max 好,一样全部接受。可以看到这个项目是基于一个前端加后端的一个系统,感觉和刚才的 gim 的 生成方式还是有些区别的。我们可以看到后端是采用 pi 上和 flash 卡。我们可以看到 现在已经在创建后端了。先创建依赖文件和说明文档,然后还有使用说明。现在他提示让我快速开始,目前经历了大概两到三分钟。啊,太快了,有几分钟时间重要。提醒, 他提醒我要去注册账号,他现在还没有帮我运行起来,请帮我运行。同样他也会帮我创建虚拟环境,所以我们可以看到他创建代码的速度还是很快的,那么现在在安装环境哈。同样, 他也提示我依赖的版本太旧了,与拍上新版本不兼容。 他更新 requirements, 点 text 来使用兼容的版本。对啊,太奇怪了,你帮我生成的代码,安装的扩展都是旧的版本,而使用的拍上却是最新的版本,这样的话肯定会导致兼容性的问题啊, 是不是背后想多赚我一些偷看的费用啊?那现在他已经帮我解决了所有的问题,安装依赖成功,所以现在启动应用。 好的,你帮我启动吧。提示端口被占用。好的,又帮我改了一个端口。这些处理都有点莫名其妙哦,还帮我生成了一个 api 的检测,运行之后发现平台还是没有起用,端口被微信占用,请让我换另一个端口,这个端口的事情已经占用了我五分钟了吧,我真的很着急啊。 他提示完美,一般 ai 提示完美的情况都会有点问题,来,我们看一下 没有访问接口的权限,是不是有可能我在文档当中提交的头肯你没有用呀?他又说完美了, 每次大模型说完美的时候我都很害怕。头肯我不是已经告诉过吗?你要是再验证,就把我的头肯用量全都用掉了啊,哥们进行了回测,年化收益率。 好的好的,那我们就运行一下哈,六零零五幺九,非常高兴的看到哈,我们的页面终于生成好了,然后整个的系统也好了, 可以看到股票代码,这是茅台的代码,这就是我的策略,他这里边非常友好的给了你多个选项,可以方便你以后提供更多的扩展。那么让他帮我分析一下, 你好棒啊。 从目前的结果来看呢,已经可以返回数据了, ok, 修复完成,刷新页面吧, 开始分析。这个程序的响应还是有点慢的,那么总的收益是零点一七,百分之零点一七,年化收益是百分之零点二七,下铺比例初始至今 对冲资金。我这里的收益应该是计算错误,因为如果是十万变到十一万一千七,那个之后都可以调,胜率是百分之零点六七。 这些结果都有待验证,但是这个程序基本上已经完成了,也符合我的一个要求,目前的返回结果是有错误的。好,没关系,这就是 mini max 帮我们生成的一个结果,大家满意吗? 对于我的这个量化交易的这个项目来说, mini max 的 效果是比 gm 要好的,无论是生成速度以及最后的一个实际结果都是要好很多的,所以呢,大家应该会有自己的判断了。 选择编程的模型定要选择适合自己的,时间优先,效率优先, 价格方面反而是最后要去考虑的一个地方,因为目前的一个模型的费用,无论是 g l m 还是 mini max, cloud 以及 cursor, 它们的费用其实都还是我们都能接受的,所以你就选最适合你的,即使某些模型给你的用量,给你的 token 并没有那么多,但是如果它的生成效率很高, 那么你也是要优先考虑的。这就是我给你的建议,欢迎跟我交流, peace。

大模型正式进入了月更时代,大家好,我是牙医,这次总计花费了大约四千万头肯给大家带来刚发布的 mini max m 二点五的实测,让我们马上开始 来看实际的测试结果啊。这次新引入的洛西极限测试,这个是用来测试指令遵循的, 因为它复杂到提示词足足有六千头,肯测试的结论是它部分指令遵循率是百分之八十,这个是什么意思呢?就是不管做没做对,总之按照要求去做了,而完全做对的需求是百分之六十五点九。作为对比啊, 这么耐三点零 pro 的 部分指令遵循率是百分之九十点六,完全做对的是百分之八十,但是二者在最终的加权总分上相差并不太多。因为这么耐三点零 pro 喜欢夸大效果,导致很多数值都偏离了设计需求, 而 mini max m 二点五则是在需求实现上还有一定的差距。大象牙膏测试 mini max m 二点五这个粒子的贴合效果和碰撞检测都做得很好。当然有有问题的地方,比如这个追星屏的建模 和内部液体的下降。不过其实还有一个不易察觉的地方, mini max m 二点五做得非常好,就是它使用了帧率无关的物理运算。这是什么意思呢? 是可以让动画效果在不同帧率的显示器上看上去是一致的,不至于说换一个三百赫兹的电竞显示器,动画就比六十赫兹的显示器快五倍。鞭炮连锁爆炸测试 mini max m 二点五最大的提升是它采用了 four sub type 叠带,每帧之间还切换了四步去单独进行碰撞检测,这样就可以防止运动过快导致穿膜的问题。 举个例子啊,一般程序每针开始的时候是去检测碰撞的,如果鞭炮移动的速度太快,上一针还在箱子里,下一针就移动到箱子外面了,这时候再去检测,其实会发现根本没有跟箱子发生碰撞,于是大家看到的效果就是穿膜了。而 substep 迭代,它就是在每一针的物理运动之间再增加检测四次。 注意看右侧这个绿球旁边的圆点,这个就是检测到碰撞,从而渲染正确的碰撞效果,避免了穿膜。 大家可以看这次 mini max m 二点五的效果,是不是一个传播的都没有。接下来是长本召回能力测试,这次的召回水平同样在线均值达到了百分之九十六点七以上。不过呢,同样有点问题,在不给原文参考的情况下,模型回答正确的概率也达到了百分之五十点一, 又是四选一,蒙对了一半,所以本次长文本召回测试并不是很自信,也建议官方考虑一下训练与要的问题。来到 a 阵的能力测试,让我们继续模拟外卖骑手送外卖,这次的得分是五百九十九,分数提升了百分之四十二点八, 这次最大的区别是他会顺路接单了,这能让他接单量有了相当大的提升,每公里的利润直接飙升了三十六点五。 另外时间管理能力也提升了不少,准时率从四十八点四提升到了六十九点六。总结,这次 minmax m 二点五比 m 二点一版本的提升也是巨大的,在各个编程测试中都能看到提升,并且在算法优化上可以看到使用了更精细的优化策略来提升效果。 a 阵的能力上 可以看到明显提升了策略能力,尤其是可以顺路接单了,这一点非常不错。不过呢,本次的长本召会测试由于验证没有通过, 所以测试分数并不代表模型性能,建议官方修正一下语料。另外啊,本次测试还有一个惊喜,就是 mini max m 二点五输出速度非常快,可以稳定在一百头克每秒, 因为它激活参数只有十币,这是个巨大的优势,在需要性能的 age 的 场景会有非常的有用。以上就是本期的测试, mini max m 二点五这个能力评价为性价比之选,我觉得是非常值得考虑的。我是牙医,我们下期再见。

这是我们家小姑娘,放假了,已经看动画片两个小时了,不要看了,我就要看。好吧,只能这样了。 嗯?怎么回事?我不是写完作业了吗?还让我学习,算了,继续干,再来 怎么还来,是不是你搞的?呵呵呵,大家好,我是本觉敏。视频开头控制电脑的就是 cloud boot, 现在改名叫做 opencloud。 同样作为一款 ai agent, 看过我之前视频的朋友都知道, cloud boot 需要你坐在电脑面前给他指令和授权,而 cloud boot 是 一款真正的自主 agent, 拥有超长的记忆,就像钢铁侠里面的贾维斯一样,是你随身随地可以召唤的贴身助理。 万丈高楼平地起,我们就从安装和配置开始,因为考的步子权限特别高,而且我们需要他二十小时运行,所以这里我建议大家给他单独准备一台备用机, 最好给他单独的网站和邮箱账号。当然,低功耗高性能而且经营能力特别好的 mac mini 是 首选,这也是他最近卖断货的主要原因。但是大家没必要马上去买。呃,找一台老电脑安装,看适不适合自己再决定是否购买。开始之前,国内的朋友一定要马上去买呃,找一台老电脑安装,看适不适合自己再决定是否购买。开始之前,国内的朋友一定要打开 q 模式。我们来到官网, 这里有很多种安装方式,对于我这样的新手来说,用命令行的方式安装最方便。我们选择 windows, 可用 power shell 或 cmd 安装,我选择 cmd 复制这个命令行,打开终端运行。 安装结束后,我们开始抽象设置,用方向键进行选择,用空格键进行确认,用回车键进行下一步,这里我们同意风险提醒, booting 模式就是 ar 的 入职培训,让它能够更懂你,这里我们选择 quick start 就 可以。模型选择这里 cloud boot 的 创作者虽然很推荐 anthropoid cloud 模型,但是 cloud boot 的 上下文能力比较差, token 数量 很大,所以这里我选择 mini max m 二点一,但由于我使用的是国内的 mini mx r m 二点一, cloud boot 虽然能识别这个模型,但是没有取得它的授权,我们这里暂且配置好,等安装完成后再解决 api k 的 问题。千岛这里我选择用扫码的方式来关联,我们打开 首页,右上角三个点中选择已关联设备,选择关联新设备进行扫码。关联结束后,我们在这里写写出自己的电话号码。配置 skills skills 按需配置就可以,这里我先随便选一个 hooks, 这里可以暂时跳过。安装完之后,我们打开新的 c m d 窗口,输入 cloud boot, get 动 cloud boot。 随后我们来到 c 盘用户你的用户名 cloud boot 文件夹下,找到 cloud boot。 json 文件,用编辑器或者是 记事本打开,按 ctrl f 打开关键字搜索,搜索 mode 到第三个 mode 处,注意我选定的代码,将选定的代码替换成图中的代码,在这里填上你的 api k, 然后保存在同样的文件夹下。找到 office profile json 文件,同样用记事本打开, 粘贴进这一段代码,在这里添加你的 a p i k 之后保存。复制这个 json 文件。打开 agent, 进入 main 登录 agent, 粘贴进刚才复制的 json 文件。相关代码我会放在视频下方或者群里, 之后我们关闭终端,然后我们打开一个新的命令行窗口,输入 clubbot get 位,启动 clubbot, 我 们打开,让它打开它的配置文件夹。 好的,至此,你的贴身助理正式上线了,这期视频就到这里,我们下期视频继续探讨 cloudbot 的 使用。嗯,有用的话欢迎点赞订阅关注我们下期见。

我用 ai 写代码,半个月烧了七百块钱,真不是我夸张啊,用酷 sir 加索尼四点五钱呢,跟漏水一样。然后我发现有一个国产大模型,一个月不到三十块,效果呢,还不输主流的一线模型,它就是上个月刚推出的 mini max m 二点一。 有人会问了,这么便宜,这代码能力到底行不行啊?于是我赶紧看了公测数据,并亲身实测一下。首先我看了它 s w e bench 的 测试榜单,竟然直逼国外的 coco、 jimmy 和 gpt 这几个顶尖的模型。 首先声明啊, s w e 代表的不是那种刷题榜单,测的是真实的开发项目。接着实测环节,我直接用它跟索尼四点五正面对比,同一个项目,同一套提示词,同一套需求,我从下面这五个真实的开发场景测给你看。 首先是从零到一的架构,新项目提示的是开发一个智能 to do list 应用技术站,要求选用前后端分离加数据库。 核心功能呢,是基本的任务管理加 ai 建议,还有些性能和部署的要求。 m 二点一拆事项啊,更细,两者都把所有的功能实现了,但对比页面的美观度, m 二点一的主键没有很好的适配网页的宽度。这一轮索尼九分, m 二点一八分。 第二项,测试 bug 修复能力,针对模拟登录成功后不跳转的 bug 啊,原因有点小复杂,实测下来两个模型都差不多,都要抵 bug 好 几轮才解决,这一项平手都是七分。 让我感到惊喜的是,第三项加新功能,要求将 ai 分 析报告保存下来,供用户下载 pdf。 sony 这边生成的 pdf 直接中文乱码,要我自己去下载字体非常麻烦。 m 二点一呢,直接一步到位生成中文 pdf, 这点啊,我是真没想到。 这里给索尼七分。 m 二点一,九分。第四项,写文档,两个模型都写了规范的几千行的文档。不同点在于索尼更细节派, 比如时序图更贴近代码的逻辑,画的默写格式图啊,有颜色区分,我给九分。 m 二点一呢,更宏观派,图画得更简洁,我给八分。 最后,从多轮的稳定输出维度来看,两者都没有出现比较大的幻觉问题。输出稳定,但索尼偶尔网络抽风要重试。这里我给八分。 m 二点一呢,国内稳定,我给九分。 最后揭晓总分,苏尼四十分。 m 二点一,四十一分。这只是我个人的主观测试结果啊,仅供参考。 说实话,模型能力上啊,他们已经拉不开太大的差距了,但价格上差的是真的多,一个是半个月七百还没到头,用的心惊胆战。另一个呢,每个月才二十九,用我的专属邀请链接,还想八八折优惠,每五小时四十次对话,完全够我大胆的,放心用。 国内访问也稳定响应快,一个字想,那你会为了省钱切换这个国产大模型吗?评论区分享你的看法,关注我,带你了解更多有用的 ai 工具!

我用两天的时间制作了一个完整的商业级 ai 软件制作平台,它不是一个简单 demo, 而是一个集成了 deepsea 处理脚本,拿个 banana 生成脚本中的角色人物,再基于角色和脚本生成分镜图,最终使用 sora 模型生成视频的复杂权限项目。 像这样一个项目,我一个人没有写一行代码,用了两天时间就用 ai 搞定了。你如果不信这是我这两天的代码提交记录,那这期视频我来带大家看看。对于这类商业化项目,用 ai 开发你需要的技巧和必备的工具。 对于专业的程序员,平时写这种复杂项目,我一般都是首选 cloud office 四点五或者 gpt 五点二这种缩塔模型。但这次 ai 漫剧的后端逻辑核心功能, 我全程使用的是 mini max m 二点一加上 color code 完成的。为什么敢用它?因为在测试实战后,我认为 m 二点一完全称得上目前编程领域的缩算模型。在开发这个 ai 慢剧项目中, mini max m 二点一展现出了五个让我印象深刻的 ai 编程特性。口说无凭,我们项目开发中见实力。 虽然官网提供了很多 ai 编程工具的接入方式,我最建议搭配 cloud code 使用。下载一个 c c switch 器,只需要在配置项里填入 mini max 开放平台的 api key 模型,选择 mini max m 二点一, 这样你就可以打开 cloud code, 开始愉快的 ai 编程了。在开发 ai 慢句这个项目中, m 二点一最让我惊喜的第一点就是它先读后写的工程素养。 在执行我给出的每一个 prompt 之前,他做的第一件事永远是调用代码解锁工具去深入阅读我现有代码结构,我最怕的就是有些模型拿到需求看都不看,旧代码上来就写一堆跑不通的代码。 但 m 二点一这一点非常像 g p t 五 code x, 在 动工前会准确的理解上下文和任务目标,而且他的思维链非常清晰简洁,会明确的告诉我他的每一步的思考和执行。这种铆定而后动的编程方式非常专业,但这就引出了第二点, ai 编程的执行效率。 gt。 gt。 五 codex 的 模型很好,但用过的朋友肯定知道它慢也是真慢。但 mini max m 二点一在这方面的尺寸拿捏的刚刚好,它有着对标 cloudthon 四点五甚至 oppo 四点五的响应速度,一旦确认上下文冲突,它就不会进行无意义的减速和废话,直接开始生成代码。 在开发这个项目时,这种不墨迹的特性对我的开发效率提升了很大。第三点也是我觉得它最像自动程序员的地方,就是它的小步快跑策略。 以前用别的模型,经常是他噼里啪啦写了二十分钟告诉我搞定了,结果我一运行五六个报错等着我心态直接崩了。但 m 二点一是写一点测一点,如果构建失败,他会自己尝试修复,确保每一步交付给我的代码都是可运行无报错的。 四种自我纠错的壁画能力,极大地降低了 bug 的 引入概率。第四点是这次开发中最让我震撼的是它的长任务执行能力。大家看这个 ai 漫剧的核心工作流,第一步,调用 deepsea 拆解脚本。第二步,再调用 ai 拆解角色。第三步,调用 nana baba 生图,第四步生成分镜图,最后调用 sora 生成视频。 这是一个设计三个不同模型,面度极长的复杂任务,我当时直接丢给了他这个超长的 prompt。 整个执行过程跑了快三十分钟, m 二点一全程没有掉线。他首先是维护了一个任务列表来保持对全局的掌控,最终跑完的时候,我只修改了两个小 bug, 整个流程就通了,这种稳定性在国产模型里完 还是第一次见到。最后一点是 m 二点一展现出来的代码质量,大家看一下,这个主要的原版封装相当的合理,没有写出那种上千台的面条代码,而且注视写的刚刚好,不像某些模型写一堆无效注视。是的, jimmy 说的就是你。 当然,在前端审美上, m 二点一目前确实还不如 jimmy 三 pro。 前两天圣诞节我测了一个宠物换装应用,这是 m 二点一和 cloud offer 四点五写的,前端两个半斤八两, 但你看 jamming 三 pro 写的这个,这字体布局和配图审美确实高出一截,所以如果特别就前端这一块, mini max 还得加把劲。最后总结一下,虽然这次我主要测试的是外部端,但根据官方文档, m 二代仪其实特别强化了移动端,也就是安卓和 ios 的 开发能力。 如果之后我要出 app 的 版本,我再帮大家测测这部分的能力。就这次体验来说, mini max m 二点一已经脱离了所谓国产平替的概念,在我的工作流里,它已经完全贴贴在 cloud 四点五 front 作为我日常主力模型使用了, 目前 mini max 的 coding plan 也已经上线了 m 二点一的新模型,现在跨年限时优惠中,首月九块九,性价比超高。好了,这个视频的全部内容,如果说你喜欢我的视频,欢迎关注我是一辉,我们下期见。

这个实时跟随手指运动的蜥蜴,虽然不是通过图声视频,但也确实是 ai 生成的,区别在于中间多加了一步代码。是的,我用数学公式定义了蜥蜴的骨骼运动,再通过 web coding 生成代码,最后用渲染引擎渲染为动画。大家好,我是猫学长,今天我带大家拆解如何 web。 一个数字蜥蜴 跟随动画,平面上有两点, a 和 b 相距,一个固定至 l。 假如下一针我移动点, a 到了更远的位置, a 一 撇,为了保持两点距离不变, b 点也得移动到新的位置。我们以 a 一 撇为圆心,做一个半径为 l 的 圆, 这个焦点就是下一针 b 所在的新位置, b 一 撇,他也叫 follow, 跟随动画,一端的位移带动另一端的位移。如果我们把中间的连线换成骨骼,哎,是不是有点感觉了? wave coding 实现,如果有更多节骨骼,就可以模拟部分动物的脊柱,不管是蜥蜴、鱼还是蛇,底层算法都是刚刚描述的跟随运动。接下来我们用 wave coding 生成代码, 我用的是 cloud code 加 m 二点一这个组合。 m 二点一是 mini max 最新推出的编程大模型,有着不逊于 cloud 四点五的跑分。当我们配置好 m 二点一,只要在 cloud code 中输入这段提示词,可以暂停截图。过一会智能体就帮我们写好了代码。再用这套命令启动,你就会看到由数学公式驱动的脊柱运动了。 腿部 i k 动画搞定了,脊柱怎么解决腿部的骨骼运动呢?没错, i k 算法全称是 inverse kinomatix, inverse 是 反向的意思,正向叫 forward kinethematics。 以两个关节的腿为例, f k 就是 给定大腿的旋转角度和小腿的旋转角度,得到末端脚所在的位置。而 i k 就是 反过来以只脚的位置去计算得到大腿和小腿的旋转角度。 幸运的是,我们并不需要自己去修剪,只需要告诉 m 二点一,帮我写个两个关节的 i k 求解器。事实上,这是有解析解的,也就是说,通过数学公式可以直接计算得到角度。 当蜥蜴的身体每向前运动一段距离的时候,我们就让蜥蜴的脚迈到一个新的位置。最后,我们告诉 m 二点一,用 media pipe 实时检测食指的二 d 位置,并将每一针蜥蜴的头部移动到该位置。哒哒实时跟随手指运动的蜥蜴就这么被 y 出来了。