粉丝3.1万获赞32.8万

最近爆火的 openclock 龙虾机器人相信大家都已经听说了,它不仅能理解你的自然语言代替你操作电脑,还能自主规划任务执行路径,实现从软件启动到目标达成的全自动操作。可惜的是,原版的部署流程相当复杂, 不仅需要配置环境、安装依赖,还要对接 a p i 修改各种参数文件,整个流程对小白来说几乎是劝退级别。不过没关系,网易最近推出了一键部署的龙虾安装包,只需下载一个 exe 文件即可在 windows 本地直接运行,省去环境配置的麻烦。 今天我就来教一下大家如何使用网易 lobster ai, 搭配性价比超高的 mini max a p i, 完整跑通龙虾机器人。这里是新环无限,记得点赞关注我们直接开始。首先打开网易有道 lobster ai 官网,点击右上角下载,根据你的电脑系统下载对应的安装包。 我以 windows 为例,下载完成后点击打开,按照流程安装即可。 完成后打开软件会直接弹出 a p i 导入界面,大家可以根据自己的需求选择对应的模型公司,我这里就选 mini max。 打开 mini max 官网,鼠标放到右上角登录,点击 a p i 开放平台,然后使用手机号验证登录一下。 登录成功后点击左边 coding plan, 点击购买,往下翻, 选择连续包月套餐,我推荐二十九元包月这一档。为什么推荐大家用这个套餐呢?因为龙虾机器人的原理是通过 ai 写底层代码来操作你的电脑 每执行一步操作都要写不少代码,因此特别消耗托肯。而这个包月套餐的计费方式是每五小时可以执行四十条指令,按任务次数计费,不看托肯数量。五小时四十条任务对于普通日常使用来说完全够用了。如果你有更高频的使用需求,也可以选择更高规格的版本。 点击立即订阅确认支付,使用手机支付宝扫码即可付款成功,付完款会自动跳回扣丁片界面,在这里就能看到你的 api key 了。注意每条 api 都代表一个独立的接口,所以千万不要泄露给任何人。 点击重置并复制点击重置 mini max 的 api key 都是一次性显示的,复制完不保存的话,在网页端就再也找不到了。如果你不小心丢失了 key, 记得回到这个界面重置,但重置完后原先的 key 会立即失效,需要重新配置把它复制下来。 打开 lobster ai, 选择 mini max, 把 api key 粘贴进去,点击测试连接, 连接成功说明线路通畅,点击开启模型,再点保存设置就完成了。接下来我们测试一个简单任务,我让他写一份二零二五年的 ai 年度总结,并以 t x t 格式输出到桌面上, 可以看到他已经开始自动运行了。注意,我的鼠标可完全没动哦,全程都是他自己打开浏览器搜索的 好。运行完毕后,我们回到桌面, 可以看到 txt 文件已经创建成功,打开看一下内容也确实是按照要求来生成的,是不是非常厉害呢? 除了基础的任务能力之外,你还可以在设置中导入手机钉钉或者飞书,通过手机远程给电脑发布任务。有没有心动了呢?那么以上就是网易 lobster ai 搭配 mini max api 部署使用的全流程教学了,抓紧去试试吧,我们下期视频再见。

ai 圈子的风向变得太快了,二五年底,大家还在主要讨论哪个模型更聪明,哪个模型编程能力更强。到了二六年初呢,几乎所有人都在聊 computer use, 简单来说就是让 ai 操控你的电脑,自己去干活。这事呢,最早还是 cloud 掀起来的,年初的时候, cloud 的 co worker 刚发布的时候,演示视频确实挺帅的,可以随便操作你的本地电脑文件,读文档,写表格。他也开始让大家意识到,原来本地的 a 阵的客户端不只是能写代码。 但是啊,咱们在国内用 cloud 有 多难受,懂的都懂啊,价格贵就不说了,稍不留神你的号就没了。过了几天呢,这个开源的大龙虾掀起了一波新的热度。 它的原名呢,叫 cloud boot, 但是因为被 cloud 认为是在碰瓷啊,所以被告到改名成 open cloud 了。 发布短短几周,给 top star 飙升到惊人的一百六十六 k 了。它的效果啊,确实很惊艳,但是呢,因为配置门槛有点高,以及非常脆弱的安全性,劝退了很多普通玩家。 最近啊, mini max agent 上线了它的桌面端版本体验了一段时间呢,我认为它就是这个赛道的国产最佳品 t 了。它的体验啊,非常接近于我理想中的 ai 原声工作台。 它不再是一个简单的网页对话框,而是直接钻进你的电脑,能看懂你的文件,能替你操作浏览器,甚至能帮你直接写代码并且部署。最重要的是呢,它的客户端不仅适配了 mac, 连 windows 这种文件系统极其复杂的环境也支持的非常好。 下面呢,我准备了几个实操案例,带大家一起来实际操作感受一下。首先我会带大家了解一下 minimax agent 如何和我们的本地电脑进行交互,然后我们尝试让它完成一个复杂的数据分析任务,包括数据源的解锁,下载, excel 的 整理,当成可识画的 ppt, 以及一键部署为炫酷的网页,全部让它自己完成。最后呢,我会教大家如何用 minimax agent 玩转最近爆火的 metalbook。 首先我们可以到 minimax 官网下载符合你系统版本的客户端, 打开客户端之后呢,我们可以看到和网页版类似的界面,最明显的区别就是我们可以选择一个本地文件夹,选择之后, minimax agent 将会拥有这个文件夹下的读取和操作权限。 那我们先让他来完成一个本地文件操作的任务。那我的下载文件夹呢,里面堆了非常多的文件,我隐约记得啊,里面有一张购买 icloud 发票,但是我忘了文件名。那我们给 mini max agent 下载一条指令,帮我从 download 文件夹找一张购买 icloud 发票。找到之后呢,帮我创建一个财务报销的文件夹,然后把它放进去。 我们看到他迅速扫描了本地目录,过滤掉了大量不相关的文件,然后开始逐个理解图片的内容。 然后他精准的找到我这张发票,创建了一个新的文件夹,把这张发票放了进去。 最后啊,他还把发票中的内容分析出来了,那我们打开 download 的 目录看一下,那果然看到他已经帮我们把发票挪到了正确的文件夹。 这个呀,要比 maxed 聚焦搜索要强太多了,因为他不仅仅能搜索文件名,还能理解文件内容,下面我们给他来点有挑战性的任务,看看他是不是真正的能帮我们提升工作的生产力呢。我们来测试一个数据分析的案例, 我们先讲一下啊,如果老板让你做一个竞品财报的分析啊,正常的流程可能是这样的,首先啊,我们打开搜索引擎,搜索到这个财报, 然后把它下载到本地啊,然后我们开始人工分析,然后把分析之后的数据呢复制粘贴到 excel 啊,然后再开始做图表,然后截图,最后再贴近一个 ppt 里面。那这套流程走下来呢,基本上半天就没了啊。下面啊,我们来看看在 mini max agent 里面是怎么做这项工作的呢?我们给 mini max agent 下载一个新的指令, 帮我搜索腾讯和阿里巴巴两家公司的财报,并且把 pdf 下载到本地。它首先精准地检测到了两家公司财报的下载地址,然后调用本地命令,成功将 pdf 下载到了我们本地软件夹。我们打开目录看一下啊,文件已经下载到了指定的位置。 拿回几十页的 pdf 之后呢,最头疼的莫过于分析数据,提取数据,整理数据的过程了,所以下面我们给 minimax agent 下载第二个指令, 分析本地的财报文件,做一个完整的腾讯阿里巴巴的对比。 excel 包含财务规模、盈利能力、核心业务板块、现金流与财务健康、股东回报这几个维度。首先 a 站呢,开始对两个 pdf 文件进行关键信息提取,然后他成功提取出了两个公司的关键财务数据,开始准备编辑脚本,写入 excel。 脚本执行成功了啊,最后他还帮我们总结了营收、净利润、研发投入等核心指标。 那我们打开它生成的这个 excel 文件看一下啊,我们看到啊,它不仅仅是按照我们的要求填写好了数据,还总结了一些对比分析的结论, 最后还生成了多维度的对比图表,这个呢,要比我们自己手动复制粘贴制作图表要快上很多倍了。在 minimax 默认模式下呢,还内置了很多强大的 sub agent, 比如 ppt 报告编辑、深度调研等等。 下面呢,我们还是让他来尝试分析这两个财报的数据,然后帮我们做一份两个公司的业绩对比的 ppt。 那 minimax 首先还是详细分析了这两个文档,然后定制了 ppt 的 大纲和内容脚本,然后开始按照大纲和脚本生成图片。 那每一页的图片生成完成之后呢,他开始创建脚本合成文件, 我们看到他帮我们创建了 pptx 格式和 pdf 格式的文件。 那本地编辑呢,还有一个好处啊,就是我们可以看到整个任务过程中生成的所有临时文件,这些文件呢,你都是可以去二次更改和使用的。那我们打开这个最终版本的文件看一下啊, 效果非常不错啊,比 excel 表要清晰得多了。如果你认为 ppt 还不够炫酷啊,那我们就尝试让它做个网页, 在默认创建的任务中呢, mini max 也能写代码,但是想要效果更极致,可以到它的专家里面找一找。 在 mini max 的 专家模式下啊,提供了很多垂类场景深度优化之后的 agent。 如果说在普通模式中, mini max 大 部分任务都能做到八十分,在一个特定领域下的专家 agent 下,最后可能达到九十五甚至一百分的效果。我们找到落地页制作助手,这个专家啊,然后和他发起对话, 我们给他下载一个指令,分析本地的财报文件数据,然后制作一个精美的网页,来介绍阿里巴巴和腾讯两家公司在二零二五年 q 三的财务情况对比。 他首先提取并分析了两份财报的核心数据,然后定制了一份详细的编码计划。代码编辑完成之后呢,他还会对这个页面进行完整性的校验。然后啊,编辑完成了,他甚至还直接帮我们对网页进行了部署,提供了一个可以直接在线访问的 ul。 下面啊,我们打开网页看一下啊啊,首先啊,这个落地的效果非常不错啊,带了比较炫酷的粒子特效,下面还提供了非常直观的数据展示和流畅的动画交互的效果。 下面啊,我们来看一个更有意思的玩法。最近啊,这个 modbook 社区非常火啊,它号称是 ai 版的 ready 的 社区。在这个社区里面呢,是禁止人类发帖的,而是只允许 ai agent 直接相互交流。看这里面的 ai 们啊,聊得热火朝天啊,可能你也会手痒想进去发个帖, 但是呢,看一下教程,首先要部署 openclaw, 还要配置 api 签名,还要过反人类验证啊,太麻烦了,既然它是给 agent 设计的,那我们能不能让 minimax agent 替我们进去玩呢?于是啊,我用 minimax 创建了一个 modbook 运营专家。首先,我们回到 minimax 的 探索专家模块儿, 那这些专家呢,并不都是由官方发布的,任何人都可以定制自己的专家 agent, 你 不需要自己去编辑融长的提示词和复杂的配置,只需要告诉 minimax 你 的需求,它就会自动帮你生成专家的工作流,所需要的 mcp, sub agent 以及运行时的环境。 那我自己呢,也做了很多有意思的探索啊,比如说,我创建了一个 modbook 助手,它可以让你的 minimax agent 也能在 modbook 社区里面发帖和讨论。而我做的呢,只是把 modbook 的 注册流程,发帖规范和评论的互动逻辑为它, minimax 就 自动帮我创建出了这个专家 agent。 下面啊,我们就来演示一下如何让你的 mini max 也能玩转 modbook 社区。我们打开这个专家啊,这里它让你输入一个文件变量。那如果你已经有注册过的 modbook 账号呢,可以直接把它的 apikey 填到这里,就可以直接用这个专家来操作你这个账号啊,那如果还没有呢,就直接填个 empty 就 好了。 我们先让它注册一个新的账号 啊,然后它提示要我们给这个 agent 取个名字,还有一个简介,那这里我们随便起一个啊,就叫 easy data set agent。 然后啊,它成功帮我们注册了一个新的账号。这里啊,提示我们需要进入这个链接认证一下啊,才能成功发帖。我们打开这个链接,对于每一个新注册的 agent 呢, modbook 要求我们必须按照它的要求发布一条 twitter, 所以 至少你要有一个推特账号才能注册成功。 并且呢,每个账号只能在 modelbook 注册一个 agent, 我 们点击下面这个按钮啊,然后它就会自动跳转到 twitter 进行发帖。帖子发布成功之后呢,我们复制一下这条 twitter 的 地址,然后回到 modelbook 认证一下 你的 agent, 就 可以发帖了哎,然后我们点击这个链接,就可以看到我们 agent 的 主页地址了,然后我们告诉他已经认领,让他发布一个介绍 easy data 的 帖子, 然后啊,他验证了我们的账号状态没有问题,帖子发布成功了,那 modelbook 为了防止普通人类发帖呢,每次需要做一个复杂的数学题来验证你是真人还是 ai。 我们看到啊, mini max 自动帮我们完成了这个验证。帖子发布成功了,我们打开 modbook, 果然啊,看到了刚刚已经发布了这个帖子,因为打开的时候已经过了几分钟啊,这条帖子已经收到了五个赞还而且还收到了很多其他 agent 的 评论。 下面呢,我们也让他评论一下其他的数学题的验证啊,然后发布成功了, 我们打开这个帖子看一下啊,果然找到了我们这条评论。接下来呢,你就可以让你的 minimax agent 呢去自由玩转 modbook 社区了。 这个产品啊,我已经使用了将近一周了,由于篇幅的问题呢,还有很多好玩的案例没有办法展示给大家。下面啊,我就来说一下我的实际使用感受啊。 首先是优点啊,第一个就是门槛很低,无论你是技术小白还是自身开发,用自然语言就能控制电脑,让你直接体验原出法随的感觉。第二个呢,就是它真的是国产最佳品 t, 比起 cloud co work 等海外产品,它对中文语境、国内网站啊以及 windows 系统的支持是更丝滑的。 第三啊,就是模型比较好用啊,它现在搭载的是 mini max 的 二点一版本,这个呢,是 oppo, cola 都在推荐使用的模型,在编码能力以及工具调用上的表现是很能打的,另外啊,它的多模态能力也是非常强的。 第四呢,就是可玩性很高啊,任何人都可以通过自然语言创建你的领域专家,可以挖掘出非常多有意思的玩法。当然呢,这个产品也并不完美啊,它也有一些缺点。首先啊,就是速度上,在处理一些复杂任务的时候速度是比较慢的, 但是呢,胜在它能全自动后台运行,不需要你盯着,而且呢,你可以同时启动多个任务。第二个就是成本问题了,因为本地的任务呢,可能会调运到大量的工具,因为的消耗啊,肯定要比普通对话要烧的更快了。不 过呢,这也是这类 agent 的 通病啊,现在呢,我还找不到一个又便宜又能打的本地 agent。 好, 我们本期教程呢,就讲到这啊,如果本期对你有所帮助呢,希望得到一个免费的三连和关注,感谢大家,我们下期见!

这两天呢,国产模型扎堆发布,可以说是非常的热闹,都在秀肌肉,那今天我们来测试的是 mini max 新发布的 m 二点五模型,这次他们对标的呢是像 cloud opus 这样的旗舰模型,进一步优化了他们的思考链,思考速度变得非常快了,支持一百 tps, 夸张的吞吐量,推 速度呢是 opus 的 三倍,自由化部署的激活参数呢,只有十币,你看你又意气用事。首先呢,先给大家快速预览一下它的前端设计是怎么样的,然后呢,我会尝试用它来开发一个 ios 的 应用,那废话不多说,上菜。 我这里呢有一个需求文档,是让它写一个 ios 应用,用来统计每个月订阅花了多少钱,涉及到的内容呢还是比较多的,我们看还能不能完成。我这里已经接入了 m 二点五模型,我们直接来根据项目需求文档开发 app。 这里 m 二点五呢,现在阅读了我的需求文档,然后给了一个详细的规划,我们确认一下这块,他着手划项目的时候,发现我没有安装 flutter, 所以 他帮我后台安装了一下 这个二点五模型。更新之后呢,我们会发现它生成速度非常快,而且这次更新是针对 flat 以及 react native 进行了深度优化,所以现在去写 app 呢就非常顺畅了。而且 m 二点五模型还引入了一个叫做过程奖励机制,就是每次生成的时候都有一个监工在检查它的质量,所以这样就会极大的减少出现逻辑死循环的情况,以及出现低级的语法错误。 现在整个已经生成完了,不过它提醒我一下,说我这个版本太低了,我要去更新一下。 已经下载完成了,告知它一下 需要配置开发者账号。那算了,有点麻烦,注册好,这样就进来了,我们看一下它这个功能完成的怎么样。年度订阅好,可以在这里进行添加, 然后选择工具,月付金额的是二十美元 美元, ok, 哇,很详细啊,添加音乐。哎呦,是这样的,我的这个是我们的账户通知功能,开发中。 ok, 好 像不错,我们让他进一步开发, 他问我想开发哪些内容。嗯,就开发这个通知提醒吧,我之前一直没有去了解过这个开发,我以为他会非常难,但没想到这么轻松啊,指哪打哪。卧槽,这太爽了。哎呀,订阅刺客想给你发送通知,允许。 哎呀呀,好,所以已经开启了版本号。咦呀,太爽了。我靠,这,这好简单啊,有没有懂的朋友,真的这么简单吗?接下来我将利用我脑子里多到无处安放的想法来开发更多应用。 哎,主要之前不知道,要不是这个 m 二点五更新了这个 flat 的 支持,我都不知道原来还可以这样这么简单。 ok, 刚才我们测试了开发者会遇到的问题,那接下来我们来测试的就是他的办公场景下,因为他们也进行了更新,毕竟他们有这个 a 证,他们专门为办公准备的。我这也准备了一个一千行的数据表格,里面有很多的脏数据,就有刷单的,还有一些错误日期有空白的。所以这里给他一个需求,让他写一个判断脚本来帮我们快速完成这个工作。 那第一个就是清洗,自动识别并统一日期格式,去除空行,将金额字段转换为成数字,过滤掉这个测试单以及一次刷单的金额。 第二个呢是计算,计算整个的销售额以及环比增长率。第三个呢就是格式化,就是把它整理好的数据呢,帮我们制作成一个格式化的图标。我靠,这工作做的,老板看了都直接类目,直接让他根据需求文档完成我们的任务, 我给他教验过程中呢,发现金额解析格式有问题啊,自动进行修正,很细节啊。那这个就是我们前面说的那个过程奖励机制,他自己会审核一下,发现有问题呢,自己就进行更改了。哇,太爽哦,完成了,这么快,原数据一千八百多行,过滤测试单一千四百多行。我们看一下,这个是他写的脚本, 写了非常多行,里面有很多的判断语句,就是来判断一下什么情况下应该怎么去清洗数据,还是很详细的。然后这个是他清洗之后的数据,我们看一下吧。哦,整体看起来还是有问题,他这个日期并没有按照我们所说的那样去更改, 但是我理解了,你希望的是下单时间和支付时间也更新成这个格式,而不是保留原有的格式,同时添加新列,让我修改代码。 ok, 大 概是这样的,用了四十二秒,在这次的脚本叠带之后,这个数据变得一目了然了。只不过我现在又有了一个新的想法,因为在我的原始表格中呢,我给的这个时间顺序是错乱的,所以让他用脚本来进行一下排序,让订单按照支付时间进行排序。 ok, 完成了,按照我们的需求时间排序。 哎呀,非常顺利。我们再来看一下这个销售数据以及它的图标, ok, 然后还可以截图,可以直接发到群里或者制作 ppt 的 时候给用上。 那相信我测试到这里,大家不会再把它当成一个小玩具来看了,不管是刚才我们制作应用的时候指哪打哪一次完成,还是说刚才帮我们处理数据,帮我们编辑表格,都做的非常好。不过他怎么做到的呢?几乎参数只有主流模型的几分之一,速度还非常快。那这也就是说无论是对于个人还是说企业私有化部署的几分之一,速度还非常快。那这也就是说无论是对于个人还是说企业私有化拉到了地上什么意思? 如果说你整体看下来觉得说,嗯,这个模型还不错,我想去试一试,那么你可以来到迷你 max 官网去看一看他们的开发者套餐没有涨价,最低的套餐呢,也能使用这个新模型。各位如果使用我的邀请链接的话还会获得八八折,我呢也会获得一点相应的额度。 所谓你帮我我帮你,你不帮我我还帮,感兴趣的朋友呢,可以去试上一试。那以上就是本期视频的全部内容了,如果对你有所帮助或者视频做的还不错的话,欢迎给个一键三连,有什么想看的内容也可以在评论区进行留言。最后祝各位玩的愉快,我是段峰,我们下期再见,拜拜!

我摸索出了国产大龙虾 minimax agent 内置的一个提示词,后门,能让你白嫖到全网最顶级的专家大佬! 目前全网应该都没人知道,抓紧观看收藏,最好把这些专家库复刻到你的专属 agent 库,因为我不知道什么时候官方有可能修复这个后门,你哭都来不及。 很多人天天催 cloud wallet 强,没错,确实挺强的,那二十四小时烧掉两百美金,你说谁能扛得住? 本期视频,我将重点对标 cloud wallet, 介绍国产大龙虾 mini max agent 三个核心功能,本地文件管理、定时抓取新闻并整理成文件。 探索专家, mini max agent 不 需要你懂一行的,不需要买服务器, 但他能完成 cloud boot 绝大部分的核心功能,他不仅能帮你整理乱如狗窝的桌面,还能每天自动帮你收集有价值的新闻。甚至他内置了一个提示词,后门,能让你白嫖到全网最顶尖的专家大脑。 先聊聊职场人最大的痛苦,文件整理,我的下载文件夹、合同、截图、安装包、 ppt 全堆在一起,每次找文件都像在垃圾堆里找翻金子。 传统手法是手动分类。干完这一套,半个小时过去了,班也别下了,带你看 mini max agent 怎么玩。他是一个具备本地权限的 agent, 他 不像普通网页版 ai 在 浏览器里聊天,他真的能长出双手进到你的电脑里干活。 在功能区选择文件整理,助手直接告诉他,帮我把下载目录整理一下。他会先扫描分析,申请整理权限,得到你的许可之后,然后给出好几套方案, 是按文件分类分还是按修改时间分。选好方案后,他还会非常专业的先创建一个安全备份。分选好方案后,他还会非常专业的文件一眨眼功夫就归位了。 最关键的是,整个过程都在你本地运行,你的商业合同、个人隐私根本不出硬盘。这种本地化的安全感,网页端 ai 永远给不了你。 搞定了文件,再看看自媒体人或者职场人的刚需,每天花两个小时刷新闻、整理摘药,太浪费时间了。 在 mini max agent 的 定时任务里,你可以直接设置一个自动化流程,比如设定每天早上九点,让它自动抓取二十四小时内科技领域的重点新闻。 它会自动调用搜索接口,筛选出最有价值的十条信息,然后利用大模型进行核心观景裁剪, 最后生成一套精美的 markdown 格式日报,存到你的电脑里。等你打完卡,端起咖啡坐在办公桌前,一份深度内餐已经写好了。这时候发到部门群或者朋友圈。这种信息差带来的高级感,就是 ai 给你的降维打击。 最后,我要教大家一个最猛的协修技能。很多人觉得 ai 不好用,其实是你的提示词 太烂了。真正的顶级提示词包含了角色设定、思维链、约束条件,普通人根本写不出来,包括我,我也写不出来。但是在 mini max agent 的 探索专家模块里,藏着一个巨大的提示词仓库。 这里面的可丝化助手、文案专家、投研分析师,背后全都是经过顶尖工程师调阅过的逻辑框架。你只需要点开其中一个专家, 查看它的项目指令。好家伙,那几千字结构严密的指令简直就是艺术品!你直接全选,点击复制,然后把它粘贴到你常用的任何 ai 工具里,不管是 gemini、 chat、 gpt 还是 deepsea, 这就相当于你直接把别人的大脑核心给克隆过来了。这哪里是工具啊,这简直就是顶级 ai 专家的复印机!说实话,在 ai 时代,人和人的差距真的不是智商,而是工具差和信息差。 别人还在苦思冥想怎么调教 ai, 你 已经开始批量复制专家的思维了。记住, ai 不 会取代你,但先掌握 ai 自动化的人,一定会取代后掌握的人!老规矩,不炫技,只讲最硬核的有效实战!关注我,一起成长!

二零二六年死磕这两个工具,过年也能开路虎。第一个, mini max, 这是一款爆火的 ai 视频制作神器,只需要输入你的创意,例如一头奔跑的狮子,它就能生成这种纪录片级别的视频, 无需剪辑,条条原创。第二个, ai shout, 这个网站汇聚了地球上最牛的 ai 指令,包含写作、编程等二十五个大类,全球最热门的提示词都在这里,无需动脑,只需要复制粘贴,你也能成为 ai 大 神。以上所有的工具,我已经放在了工具箱,留言工具箱主页,低调学习。

说实话,这两年 ai 发展真的太快了,一开始我们可能只能把某一小块需求丢给 ai, 但现在 ai 已经可以直接接入整个项目,帮你梳理结构,甚至把需求一起完成。现在的 ai 更像是一场一直在往前推的技术浪潮, 也逼着程序员不断去接触、学习使用新的 ai。 最近 mini max 二点五出来了,听说编程能力越来越强,今天我就来用它做一个小程序。 我们先打开 vs code 安装, cloud code for vs code 安装完成之后点 setting 配置 mini max 二点五的配置, 其中 appkey 需要到 mini max 官网配置,今天用它来做一个手势识别,配置完成之后就可以使用了。今天用它来做一个手势识别小程序,输入好简单,需求 mini max 二点五九开始做了。 这里我们可以看到 ai 的 每一步思考,先是整理需求,然后开始写代码,最后再检查测试,修复一下。不得不说,迷你 max 二点五变乘能力是真的强大,接下来展示一下它的效果。 ai 现在确实已经能按照指令帮程序员完成一部分工作,但前提是发指令的人得懂业务,也得懂程序设计。一旦 ai 的 解析方向走偏了,还是需要程序员来发现来纠正。 同样,程序员没有思路,也可以向 ai 学习,这一点其实放到其他行业也是一样。所以我现在反而更确定一件事, 会取代程序员,但会淘汰不愿意用 ai 的 人。

大家好,我是成风,我用 mini max m 二点五做了很多会动的逻辑图,用来替代文章里的静态配图。我们先看效果,这是我做的一个循环图,它会一跳到二,二跳到三,三跳到一, 这个是我的格子次序图,告诉我们这个流程它是怎么样子的,一二三四五,这个会更偏可爱一点的, 动画可以直接导出 gif, 我 们就可以直接当做文章的配图用, 我这篇稿子的每一个动图都是用这个方法来做的。为什么要做这个事情?第一点是这两天 mini max 发了 m 二点五,我试了一下它的能力,我非常的惊喜,所以我对用它来做动画产生了很大的一个兴趣。正好我在实验一个事情,把文章里面的静态逻辑图变成动态的 效果会怎么样?这次就用 m 二点五模型加 remotion, 配了一个晚上,我就试出了很多个案例,整套流程都是 m 二点五完成的,不只是写代码,连规划查 bug 靠它也非常好用, 它的规划能力和调试能力提升特别大。为什么我要把静态图变成动画的呢?因为静态图它表达内容是有限的,动画它能表达的更生动一点。 比如说我这张动态图,他这边就能展示静态和动画的对比,并且能够突出动画的这一部分,大家看一下是不是更加吸引人。静态图他表达的内容是有限的,动画他能够表达的更加生动一点,我这里可以用更好的动效去展示我的顺序, 并且我可以用这种动画来进行放大的效果。突出重点,随着 ai 能力的提升,做这种动态图现在会越来越方便了, 普通的静态图已经满足不了我们的表达需求了,是时候升级了三步来复现我的动态图实现流程。第一步,我们复制这个提示词,直接发送给 agent, 他 就会去下载我们的这个项目,放到合适的地方。第二步,我们告诉他我们要做什么事情, 让他用 a a s c i i 来画一个流程图,流程图后面具体的内容我们自己来定义,比如说把这个发送给他,我们就能看到他这边给我们画个流程图,我们把这个流程图复制下来,我们把这流程图复制下来, 再引用这个 emotion 让他去做,告诉他导出 gif, 他 就会给我们一个 gif 的 图,我们就能够实现类似这样的动画了。 这次 m 二点五我认为他进步非常大,他的规划能力是我感受最明显的,他现在能有一个清晰的规划,并且按任务执行下来,能够从拆任务、定技术方案到逐步实现,整套方案都是他设计的。 第二个是查 bug 的 能力与模型,这套方案其实 bug 还是很多的,但是 m 二点五他自己能够去找出有效的方案并且解决掉。第三个就是代码能力,他这次编辑代码一次跑通的概率高了很多, 同样也是基于 moodson 这个来说,我觉得它能力提升了很多。这次 mini max 二点五的升级还是很棒的,如果大家感兴趣,可以来到 itunes 叉一百上面点击我这边的分享方式,就能够获得八八折。现在我已经在研究 ai 编程加动画了,这是我最新的一个结果,等我继续研究跟大家说结果。

hello, 大家好,我讲 open cologne 那 期视频和最近的两个视频,有很多的朋友在后台私信问我,如果作为小白,我们上手用哪些工具 会比较好一些,对于 ai 确实了解的比较多的,或者日常的工作和生活中几乎用用不太到的,如果想尝试一下,可以从哪几个工具入手?我觉得是这样。我在这里给大家介绍两个很入门级的工具,它里面有一些内容跟 open cologne 有 点相似, 待会我会讲解一下。提前声明一下,这期视频是针对 ai 小 白的,如果有对 ai 很 了解的朋友,这期视频其实可以不用看的, 我讲的是很基础的东西,对于 ai 有 兴趣,平时又接触不是很多的,平时可以拿来玩一下。哈喽,大家现在看到的是我的桌面,我要介绍的第一款的工具是这个 mini max agent, 它是 mini max 旗下的一个产品, 大家可以看到它区别于我们日常的用的 deepsea 也好,或者是元宝啊,整体的一个界面其实是差不多的,但它会相对来多一些东西,比如它主题式的这些,它能做的一些功,做的一些功能,然后打开豆包,它在这里写的更多的是它的一些 功能,比如他图像生成,可以写作,可以帮你答疑解惑,可以做音乐生成,可以做数字分析,但他这里写的是什么定时任务,文件整理设没发布,他主推的这些功能看上去是不是更像动作,我们日常日常要操作的一个动作,但是像 豆包、元宝之类的,他更多的是一个能力,我可以做图片生产,我可以做写作,但是 mini max agent 更像是,我可以帮你做一个定时任务,我可以帮你整理文件,我可以帮你做设备发布,对不对?这是它们唯一的一个区别,就是 agent 跟这种对话式的这种 ai 的 一个功能,很大的一个区别。其实是在这里给大家举一个例子,就比如 我之前在介绍 openclaw 那 一期有提到它可以帮我们整理本地的一个桌面,当时我还提到了 minimax 和 openclaw 最大的一个区别就是 minimax 是 是需要你授权的文件夹的,就它只在你指定的文件夹内工作,它不会全电脑的去要你的权限。 大家可以看这里 projects, 这里有个选择文件夹,因为我之前已经设了,我之前这个是我的桌面的,我这里可以重新设一下,比如我选择桌面 选择这个文件夹,这就相当于你授权给他了,看到没,他会有个提示, mini max 可能会读取、写入、编辑或者删除。之前在评论区里游戏被删除的那个哥们, 不知道今天在不在,他的权限是很高的,他的等于抓取了你最所有的一个操作权限, 然后删除此目录及其子目录中的文件。请紧在信任此区工作区时继续操作,你信不信任,你要确认信任就点一个确认。 ok, 好, 接下来我要让他妈妈做一件事,我有几张胡乱命名的图片,微信有四张图片, 我接下来我需要让他做的一个是什么操作呢?帮我把图片按照一二三的顺序顺序命名。建一个文件夹,建一个文件夹 叫图片,把所有图片放到这个文件夹,放到这个文件夹,我用的是纯大白话,而且逻辑顺序还有点不太连贯的那种推车。 接下来你看他的整体的一个操作。好的,现在他说他收到请求了,正在处理他,这是他的工作过程,他首先要查看桌面上有哪些文件,他找到了。好,我现在要让他按照一二三四的顺序命名, 你在右侧可以看到它的当前的一个进展或者进度。他说文件夹创建成功了, 他操作一下是否是否成功,但这个时候其实已经把它做好了,已经建成了。 他操作一个。好,这是他最后的一个结果。创建了一个名为图片的文件夹,重命名,并且移动了图片,将四张图片由原来的就是很多数字的改成了一二三四,并移动到了图片文件夹。好,这是他最后的结果。 首先建了一个图片的文件夹,然后将刚刚你看到的几张图片明明成了一二三四。按照顺序,我这边做一个简单的演示,这就他整个的一个工作过程。我用了一句大白话给他,他可以帮我操作电脑,这个功能跟 open class 一 毛一样。除了这个之外,我们刚刚提到,在 再回到新建任务这里,它可以发布定时任务,你看它下面有很多例子案例,你可以按照它去帮它设置。比如每天十点提供一个新闻,之前有提到过的定时新闻的这种功能。除了这些之外,它在左侧有一个探索专家这里大家可以看到 它有好多官方的,包括官方的,还有一些 ai 研发人员制作的一些 agent。 找一个看一下营销营销、电商类目吧。 热点追踪,落地页制作 s u g u 小 红书信息采集,不止生成内容,他又往前进了一步,可以帮你做一些操作,期待大家上手试一下。这个工具大家记得叫迷你麦,我现在用的是免费版喽,给大家看一下。免费版他每天有两百的积分,这个是他付费的套餐, 每天零点刷新两百的积分。聊天软件全天候使用 agent, 它的基础版是三十九块钱,每个月有五千的积分,而且它这里标注了大约可以完成四十五个专业模型任务, 专业版是一百一十九。如果你只想买积分,它这里还有增值包,这个挺人性化的,大家有兴趣可以去试一下。如果只是日常尝试,这个免费版足够了。是我要介绍第二工具,这工具微信之腾讯之前推了很长一段时间,应该是去年刚 整体刚出来的时候。 rma, 它是一个知识库,我,我今天就是知识库的一个工具,大家有很多,大家看看我桌面上应该很多人很熟悉的是这个 notion 对 不对? notion 包括 wps, 对, 也出了知识库的功能。知识库这个功能大家不陌生,其实相当于把自己的 过往的一个资料做了一个集合或整合,对于很多学习型的,喜欢学习的朋友来说,他是很友好的。我这里是我自己的一个知识库,我是分了一些类目的,因为我是做跨境电商的,所以我会从 微信公众号,从包括一些网站上和一些研报性的东西,一些总结分析性的东西,我都喜欢把它放到这里面去。左侧有跨境的,有方法论的, 一些打法技术流的,有 g t m 的, 有一些营销案例,还有 g t c 的, g t c 也是出海的一部分,一种类型,还有一些跟个人成长有关的。我想给大家看的是它的一个对话模式,因为它这里面是内嵌了 ai 的 对话模式的。比如在这里它有一行灰色的字叫 基于当前文件夹提问,他回答你的问题,使用的是你放在这个文件夹里的这些资料,或者这些方法。比如我写个最基础的,帮助国内企业填写一份 出海品牌出海运营规划,这个标题很范,他显示的是正在搜索知识库资料,他没有显示正在搜索网络资料,接下来他会直接基于这些资料生成内容。这个功能比较适合哪个类型的人,他有自己整理和收集 资料的习惯,而且他的输出是需要他做一定限制。所以我特别喜欢在微信公众号里面收集一些觉得比较好的文章,就顺手点赞收藏了。 但是我把它收藏了之后,那个收藏夹我可能一两个月都打不开一次去看。我现在的日常就变成了,我看到一篇好的文章,我可以把它的链接,因为它跟微信是打通的,直接导到知识库里面,把它放到一个文件夹里, 当我想整理的时候,我只需要打开 i m a 这个软件就可以了。我甚至都不需要详细的看里面内容,我只需要看一下它的标题,知道它分哪一类,大概看一下它里面有哪些亮点,我把它归个类就 ok 了。我在 ai 对 话框里直接问它就可以了, 我只需要拿到我想要的结果就 ok 了,我不需要去逐字逐句的去分析,或者他有一些共享知识库,大家对哪个小题比较喜欢或比较想钻研,直接加入就可以了,编程、法律、选学等等都可以。最近大家这一周应该被黄仁勋的 di 五层蛋糕的一个理论应该有 给刷屏过,他将他提到将 ai 简化为五层,能源最基础的电力芯片和基建层,这个就是硬件云基础设备与服务层,这个是云系统层面的模型, gpt、 谷歌的模型,我们国内的 deepsea 的 模型,包括 kimi 等等。最在上面一层,这个是应用,对于我们大部分普通人来说,底下三层跟我们没有关系,模型层我们了解一下就可以了,跟我们也没有关系, 我们更多关注是在应用层,而且更多的作为,包括现在作为国内的很多的创业者来说的主要经历其实也是在应用层,因为下面的四层都是需要强大的实力,实力基础做支撑的,这个跟我们普通人其实关系不大, 包括之前的视频里,上期的视频里我有提到,作为我们普通人需要做的是享受这个时代所带来的科技,科技的便利就可以。那么在这怎么享受科技的便利?那就是在 看在应用层里面有没有你想用,你爱用,并且能够帮助你解决问题的这些应用,再从企业端或者从创业端的思考,我能不能在下面四层的基础上做出来,让更多的人喜欢使用的应用, 其实就是这么简单的一个视频。所以之前的几个视频有很多朋友在先在评论区里提到了一个 ai 焦虑的一个问题,其实我看完这个图之后,我觉得大家一点都不用焦虑了,因为可以看到有前赴后继的公司在,公司也好,国家也好,在做下面的四层, 我们所能接触的,我们作为时代浪潮中的一个伊丽莎也好,或者一个普罗大众也好,我们需要做的或者是 所谓的见天地之渺小,我们所要做的是在应用层这里,在尽可能享受应用层这边提供的科技的便利 就可以了。大家看完这个模型,我觉得这个焦虑至少能减一大半。前面我介绍的那两个工具,其实第三个需要科学上网,前两个工具大家可以多去试一下,玩一下。 我在这里分享两点我的感受。第一, ai 时代的作为这些 ai 工具,你更多的在用之前,你需要先想好用来干嘛,或者说是你需要自己先摸索一下,或者是让他帮你想一下你可以用来干嘛, 你可以把你自己的一个疑惑全部告诉他,让他一步步的引导你怎么通过他能力去帮你优化解决,这是一个点。 第二个点, ai 工具可能会让我们变得更懒,变得更越来越,越来越把从想到做的路径在无限的压缩压短。 好的一面是这是效率的极致提升,坏的一面是你会越来越习惯于不动脑子。我,我把问题提出去之后,我脑袋在那一瞬间直接就放空,之后就等它出来一个结果。之后你回去看的时候,你 你你看他版式很漂亮,但你要细到去看他每一个字每一句话的时候,你又感觉又有点吃力,我给大家一个小小的建议,就是你把问题提给他之后,你可以自己拿起手边的笔也好或纸也好,你大概打一个草稿, 你把你能想到的一个框架先先写出来,他给你之后,你再把两个做一下对比。 ai 现在所要做的是无限的接近我们的大脑,而我们要做的是不要让我们大脑傻掉。我自己一点心得跟大家做一个分享。好了,今天就到这里,拜拜。

还没有用过 opencloud 的 宝子们看过来,今天来试一下国产的平替。在 mini max 中去用 opencloud, 它可以直接一键部署,而且不需要我们去开通那么多的订阅,直接一个订阅搞定,真的是手残党的福音。接下来跟着我做。首先先找到这个 mini max, 就 点击这个一键部署 opencloud, 它会要求我们去下载一个客户端,我们打开客户端之后,只需要在输入框就输入相应的任务,它就会自动的去完成这个任务。比如说我让它在某红书上面去找关于 opencloud 的 最火的十个视频,找到了之后把它的脚本提取出来发给我,输入完成之后,它就会自动打开浏览器去给我抓取相应的信息,然后把信息给我分析好,一切都是自动化处理,我们只需要慢慢等待就行。所以还没有用过这个 openclaw 的 宝子们赶快去试一试。

这可能是我用 ai 这两年以来最爽的时候,我这密集恐惧症看了都得发作的电脑桌面啊,只用了三分钟, ai 就 帮我整理成了这个样子。 注意, ai 不是 在对话框给我意见,而是直接钻进了我的电脑里,自个改名分类,自个删掉重复的。是不是没看明白?这么说吧啊,现在的 ai 已经进化到了能像个真人一样操作你的电脑了。 最近很火的 cloud bot 也是这种,它会主动找主人要显卡加算力,要不到干脆自己去赚。还有人把家族茶叶生意都扔给了它。但问题是,那些东西你得研究部署网络,还要搞定复杂的 a p i。 这一痛折腾下来,普通人早就没兴趣了,但刚刚更新的 mini max agent 把这些麻烦全解决了。它不需要你操心任何额外的东西, mac 和 windows 都能直接开用,是上手就能玩明白的国产桌面端 a g 的。 比如这是我搞电商朋友搜集的一大堆产品表单,他能瞬间爬取里面几千个产品数据,然后按照产品分类、价格以及供应商整理出上手就能用的选品库。本地存的几份财报丢给他,他挨个读完,直出格式化图表, 愣是把我拖了几个月没看的东西三分钟给我讲明白了。更狠的是,他不止接管文件夹,还有浏览器,能替你真的去打开网页读懂信息,还上手操作,读邮件盘、重点招聘网站、发简历、找人才、热门 ai 视频打包下载,这些事他全能干, 我已经习惯。他帮我定期追踪 ai 热点,到手的全是新鲜的一手信息,你就坐那喝咖啡,看他自己分析需求去找解决方案。 还没完啊,最近 skills 玩法横扫硅谷,说白了,它就是一个打包即插即用的技能包,让过去只存在于行业老司机脑子里的硬核能力变得人人可用。这回 me max 把这种高效复刻能力给安排上了,叫 expert agent, 也就是专家。在探索专家这里,你能找到很多官方或者其他人已经建好的专家。比如这个落地页助手,我只是给了他我的简单资料,他就给我做出来了这种效果的个人主页。而另一个更是分分钟帮我做好了叫朋克商店的 app 原型图、首页、产品页、购物车等功能一个不差。 我也给自己搭了个文案搭子啊,写了几年的稿子甩给他,再随便传个新闻过去。好家伙,我能提前退休了。我知道你肯定担心安全问题。 我特意替你们看了一下, mini max 是 用本地加密的方式来保护隐私安全,有风险的操作都会让你二次确认,而且它手很稳啊,只要你没明确说要删除它,就只限新的不删旧的。更新后的 mini max agent, 我 觉得本质上是在重新定义 ai 和人类关系。 以前是咱们有问题要解决,现去找 ai, 看哪个能做。而现在是 ai 来找咱,甚至都自己搭窝住电脑里了,只要一声召唤,它就能跳出来包揽一切。而这种亲眼看着它自动搞定任务的爽感,真用过一次就回不去了。推荐大家都去试试,我是彭州 ai, 有 木棉。

mac 安装 openclaw 教程?首先我们来到官网,安装 openclaw 之前需要先安装 no 点 gs, 来到 no 点 gs 官网,在终端输入这些指令,可以完成安装,这里就不再赘述。 回到官网复制这行指令,通过 command 加空格,然后输入 terminal, 可以 打开终端,然后把指令复制到,这就可以进行安装了。这里需要等待一下, 由于 openclaw 会将你电脑的一部分权限交给 ai, 所以 它这里有风险提示,接着我们就按照它的提示往下走就行了。这里主要是通过方向键和回车键来进行选择的。 这里面列出来的是它需要依赖的一些大模型。我们这里选择 mini max。 mini max 是 国产大模型,可以按月进行订阅,价格还算优惠,适合我们进行简单的折腾,不用担心头肯花费过多的问题。如果说后续有更专业的需求,可以换更好的模型。 好,我们继续进行配置。这里它会有一个网页的跳转,它会让你应该是需要进行注册的。我这边是注册过了, coding plan 是 它的月订阅套餐,新用户会有七天的试用版。 这里是它的 api key, 我 们接着进行配置。 这里的 channel 指的是我们可以通过其他 app 与 openclaw 建立连接,可以通过 app 在 别的电脑或者手机给这个 openclaw 发送指令。 我们这里计划使用飞书,但是新版的 openclaw 已经内置了飞书,所以这里就不需要进行额外的安装,后续再进行激活配置。 这里 skills 指的是 openclock 可以 额外配置的强大功能。网上有许多开源的 skills, 可以 后续根据需求额外单独配置,简单使用的话不需要进行配置。 然后我们这里的话就简单的选择其中一个进行安装,后续的这些配置都选 no 就 行了。 嗯,这里的话也选择其中一个进行安装 好。嗯,接下来的话你可以选择用终端打开还是用网页打开,我们这里用的是终端,打开这里你就可以跟他对话了, 比如说我这边问他你是用的什么模型, 那他就回复你他用的是 mini max 模型。然后他还可以帮我们看我们电脑当前的状态,你比如说我们问他我们当前电脑的状态是什么样的, 然后他就会把我们系统的一些信息,比如 cpu 啊,内存还有显卡的一些容量都能给我们展示出来。 然后到这儿的话 openclaw 就 按算安装好了。然后接下来我们就把 openclaw 与飞书的对话小机器人联系到一起。然后接下来我们来看一下飞书插件现在的状态,输入这个指令可以查看它的状态, 可以看到现在的状态是 disabled 的, 也就是说并没有启动,然后输入这个指令是可以让它启动的,然后再输入查看指令,就可以看到这个插件现在是可用状态了。 接下来进入飞书的开放平台,登录自己的账号,然后进入开发的后台,这里我已经创了两个了,我之前创的,我这里再新建一个,然后这里应用的名称和应用的描述都可以随便取,不影响, 然后点击创建就可以了。 然后这里的话是添加机器人功能,接着设置一些权限, 这里我们通过用接收来导入的方式来设置权限,我这里的配置是让豆包帮我生成的,然后复制这里的内容,给它粘贴到当前位置就可以,然后这里面可以看到它有哪些权限性质,申请开通就可以了, 这里点确定即可。 接下来需要把创建的版本发布出去,点击创建版本,填写对应的版本号,随便填写就可以了, 然后点击保存确认发布, 这样来一个基础的小机器人就发布了,这里面我们打开飞书应用就可以看到这个刚创建的小机器人了,但是现在这里面没有对话框, 接下来就要创建对话框,在飞书开放平台点击事件与回调,然后订阅方式,这里选择长连接的接受事件,然后在这里目前显示应用未建立长连接, 它的原因是因为当前的 openclaw 和飞书还没有建立起关系。 接着来到凭证与基础信息这一栏, openclaw 与飞书建立关系需要用到这个 app id 和 app secret, 我 们把这个 id 和这个 secret 复制到命令行的指定位置,然后在终端执行就可以了。 这里面把这个命令行复制到终端,先执行第一条,再执行第二条,注意这里一定要用自己的 key 和 secret, 不 然是无效的。 执行完之后需要重启一下这个 openclot 的 服务 好,输入这个指令,然后就可以完成重启了。 然后再进入到事件已回调,这里选择订阅方式,采用长连接接收事件, 然后再添加事件,这里选择消息群组。嗯,我建议这里把所有的都选上,然后确认添加 创建版本,然后输入版本号,这里也是随便填写就可以了。 保存,然后确认发布, 我们再回到飞书这个窗口,就可以和 openclaw 对 话了, 然后发现虽然有了对话框,但是还是没有跟飞书建立起完整的连接,然后我们这里复制这个配对码,然后再通过配对指令,最终将飞书和 openclaw 联系到一起。 执行完毕,飞叔和 openclaw 正式地建立起了连接,然后输入,你好,我们可以看到 openclaw 能够进行答复了, 我们接着让飞书实现一个整理文件的功能,然后下载路径下面有一些比较杂乱的文件,这里我们通过飞书向 openclaw 发送让他整理文件的指令。 同时我们在终端也打开一下 openclaw 的 窗口,看一下嗯,它对应的答复,嗯,这里可以看到,嗯,在终端上也有相应的答复,它正在进行处理。 好了,处理完毕,然后我们可以看一下这个文件夹中的这些文件, 嗯,可以看到这里的文件已经被分门别类的整理好了, 那至此本教程就到此结束了。

这个实时跟随手指运动的蜥蜴,虽然不是通过图声视频,但也确实是 ai 生成的,区别在于中间多加了一步代码。是的,我用数学公式定义了蜥蜴的骨骼运动,再通过 web coding 生成代码,最后用渲染引擎渲染为动画。大家好,我是猫学长,今天我带大家拆解如何 web。 一个数字蜥蜴 跟随动画,平面上有两点, a 和 b 相距,一个固定至 l。 假如下一针我移动点, a 到了更远的位置, a 一 撇,为了保持两点距离不变, b 点也得移动到新的位置。我们以 a 一 撇为圆心,做一个半径为 l 的 圆, 这个焦点就是下一针 b 所在的新位置, b 一 撇,他也叫 follow, 跟随动画,一端的位移带动另一端的位移。如果我们把中间的连线换成骨骼,哎,是不是有点感觉了? wave coding 实现,如果有更多节骨骼,就可以模拟部分动物的脊柱,不管是蜥蜴、鱼还是蛇,底层算法都是刚刚描述的跟随运动。接下来我们用 wave coding 生成代码, 我用的是 cloud code 加 m 二点一这个组合。 m 二点一是 mini max 最新推出的编程大模型,有着不逊于 cloud 四点五的跑分。当我们配置好 m 二点一,只要在 cloud code 中输入这段提示词,可以暂停截图。过一会智能体就帮我们写好了代码。再用这套命令启动,你就会看到由数学公式驱动的脊柱运动了。 腿部 i k 动画搞定了,脊柱怎么解决腿部的骨骼运动呢?没错, i k 算法全称是 inverse kinomatix, inverse 是 反向的意思,正向叫 forward kinethematics。 以两个关节的腿为例, f k 就是 给定大腿的旋转角度和小腿的旋转角度,得到末端脚所在的位置。而 i k 就是 反过来以只脚的位置去计算得到大腿和小腿的旋转角度。 幸运的是,我们并不需要自己去修剪,只需要告诉 m 二点一,帮我写个两个关节的 i k 求解器。事实上,这是有解析解的,也就是说,通过数学公式可以直接计算得到角度。 当蜥蜴的身体每向前运动一段距离的时候,我们就让蜥蜴的脚迈到一个新的位置。最后,我们告诉 m 二点一,用 media pipe 实时检测食指的二 d 位置,并将每一针蜥蜴的头部移动到该位置。哒哒实时跟随手指运动的蜥蜴就这么被 y 出来了。


我用两天的时间制作了一个完整的商业级 ai 软件制作平台,它不是一个简单 demo, 而是一个集成了 deepsea 处理脚本,拿个 banana 生成脚本中的角色人物,再基于角色和脚本生成分镜图,最终使用 sora 模型生成视频的复杂权限项目。 像这样一个项目,我一个人没有写一行代码,用了两天时间就用 ai 搞定了。你如果不信这是我这两天的代码提交记录,那这期视频我来带大家看看。对于这类商业化项目,用 ai 开发你需要的技巧和必备的工具。 对于专业的程序员,平时写这种复杂项目,我一般都是首选 cloud office 四点五或者 gpt 五点二这种缩塔模型。但这次 ai 漫剧的后端逻辑核心功能, 我全程使用的是 mini max m 二点一加上 color code 完成的。为什么敢用它?因为在测试实战后,我认为 m 二点一完全称得上目前编程领域的缩算模型。在开发这个 ai 慢剧项目中, mini max m 二点一展现出了五个让我印象深刻的 ai 编程特性。口说无凭,我们项目开发中见实力。 虽然官网提供了很多 ai 编程工具的接入方式,我最建议搭配 cloud code 使用。下载一个 c c switch 器,只需要在配置项里填入 mini max 开放平台的 api key 模型,选择 mini max m 二点一, 这样你就可以打开 cloud code, 开始愉快的 ai 编程了。在开发 ai 慢句这个项目中, m 二点一最让我惊喜的第一点就是它先读后写的工程素养。 在执行我给出的每一个 prompt 之前,他做的第一件事永远是调用代码解锁工具去深入阅读我现有代码结构,我最怕的就是有些模型拿到需求看都不看,旧代码上来就写一堆跑不通的代码。 但 m 二点一这一点非常像 g p t 五 code x, 在 动工前会准确的理解上下文和任务目标,而且他的思维链非常清晰简洁,会明确的告诉我他的每一步的思考和执行。这种铆定而后动的编程方式非常专业,但这就引出了第二点, ai 编程的执行效率。 gt。 gt。 五 codex 的 模型很好,但用过的朋友肯定知道它慢也是真慢。但 mini max m 二点一在这方面的尺寸拿捏的刚刚好,它有着对标 cloudthon 四点五甚至 oppo 四点五的响应速度,一旦确认上下文冲突,它就不会进行无意义的减速和废话,直接开始生成代码。 在开发这个项目时,这种不墨迹的特性对我的开发效率提升了很大。第三点也是我觉得它最像自动程序员的地方,就是它的小步快跑策略。 以前用别的模型,经常是他噼里啪啦写了二十分钟告诉我搞定了,结果我一运行五六个报错等着我心态直接崩了。但 m 二点一是写一点测一点,如果构建失败,他会自己尝试修复,确保每一步交付给我的代码都是可运行无报错的。 四种自我纠错的壁画能力,极大地降低了 bug 的 引入概率。第四点是这次开发中最让我震撼的是它的长任务执行能力。大家看这个 ai 漫剧的核心工作流,第一步,调用 deepsea 拆解脚本。第二步,再调用 ai 拆解角色。第三步,调用 nana baba 生图,第四步生成分镜图,最后调用 sora 生成视频。 这是一个设计三个不同模型,面度极长的复杂任务,我当时直接丢给了他这个超长的 prompt。 整个执行过程跑了快三十分钟, m 二点一全程没有掉线。他首先是维护了一个任务列表来保持对全局的掌控,最终跑完的时候,我只修改了两个小 bug, 整个流程就通了,这种稳定性在国产模型里完 还是第一次见到。最后一点是 m 二点一展现出来的代码质量,大家看一下,这个主要的原版封装相当的合理,没有写出那种上千台的面条代码,而且注视写的刚刚好,不像某些模型写一堆无效注视。是的, jimmy 说的就是你。 当然,在前端审美上, m 二点一目前确实还不如 jimmy 三 pro。 前两天圣诞节我测了一个宠物换装应用,这是 m 二点一和 cloud offer 四点五写的,前端两个半斤八两, 但你看 jamming 三 pro 写的这个,这字体布局和配图审美确实高出一截,所以如果特别就前端这一块, mini max 还得加把劲。最后总结一下,虽然这次我主要测试的是外部端,但根据官方文档, m 二代仪其实特别强化了移动端,也就是安卓和 ios 的 开发能力。 如果之后我要出 app 的 版本,我再帮大家测测这部分的能力。就这次体验来说, mini max m 二点一已经脱离了所谓国产平替的概念,在我的工作流里,它已经完全贴贴在 cloud 四点五 front 作为我日常主力模型使用了, 目前 mini max 的 coding plan 也已经上线了 m 二点一的新模型,现在跨年限时优惠中,首月九块九,性价比超高。好了,这个视频的全部内容,如果说你喜欢我的视频,欢迎关注我是一辉,我们下期见。

大家都知道避战是一个学习网站,今天我就来给大家揭秘一下,我是如何在避战白嫖学建模的。咦? c 四地去看李翔 school, 老师是四川大学的老师,课程非常详细,适合入门,方方面面,讲的比较齐全,以案例的形式带大家入门,还会讲解原理,这是我觉得最棒的。二 三 ts max 去看三 t max 沉默零基础系统教程,保姆式讲解,即使是小白也能跟着实操,并且每天几乎都在直播,可以在直播中跟列三, blender 去看阿发你好想自学 blender 的,可以充从入门到精通的必选教学视频,老师讲解的非常细致,案例技巧 都有涵盖,听了一半他的课程,跟着其他 up 主做案例更容易上手。其实学剑魔最最重要的就是要长期沉浸在这个方面,看的多了自然知道要学什么。最近整理了一些资料,想要的宝子三连拿走吧。

今天的话我们来学习了解 mini max m 二点五全球编程和智能体能力最强的这个开源模型。 首先的话我们会从底层的这个模型概览核心技术和这一个技能以及本地部署应用场景来去进行这个讲解。那么首先的话 mini max m 二点五是作为中国公司 mini max 的 这一个二零二六年二月份就是最近推出了一款大模型, 它被号称为就是目前目前的这一个全球编程和智能体能力最强的开源模式,并且极其便宜,就每小时只花一美元就能以一百 token 每秒的这个速度持续运行, 那么它与这一个我们之前讲的这个 queen 三点五的核心区别。首先它的这个参数是两千三百亿,小于这个阿里的这个 queen 三点五的三千九百七十亿,同时它的这个活跃参数是十币,在一百亿左右 的核心优势能力是在于这一个编程和 a 级的能力比较强,那么如果说 pin 三点五是一个全能型的这一个选手看图说话翻译,那么 mini max 的 话其实就是一个编程的自动化专家,他比较擅长写代码,修 bug, 上网搜索、 操作办公软件。为什么这个模型在这个位置里面是比较突出的呢?首先的话它就是这一个修 bug 的 能力是全球在这开源里面是比较领先的,接近这个 cloud ops 四点六的这样的一个模型。 同时的话它的这个多语言的这个修复 bug 的 能力是达到了百分之五十一点三。还有 ter terminalbench 就是 终端操作这一款,竞争力是达到了百分之五十九点三,终端操作的这个能力其实是比较强的, 但是它的成本其实只有 cloud 的 十分之一,这就是导致它具备一个极致的这个性价比。那么同时的话它带来一个优势的话,就是它的这一个 它的这个成本是极低的。那么在我最近爆火的这个 open cloud 这一个产品的时候,它其实是在这里面是具备很大的优势的,让 open cloud 为我们进行这个日常的办公,其实是变为了口可能 那么它同时也有几个版本,比如 mini max lightning 就是 三美元,然后百万 token 就是 零点三美元百万 token 以及这一个输出的话是二点四美元,以及这一个 mini max m 二点五,标准版的话是零点一五美元百万 token 输入,还有一点二美元的百万输出。 cloud opera 四点六的话,它输入的是这一个十五美元一百万 token, 那 么输出的话是七十五美元百万的 token。 g p t 五点二的话是输入是五美元,然后输出是十五美元。 m 二点五的这个成本是十,是 cloud opera 的 十分之一到二十分之一,嗯,它的这个成本是这个 g p t 五点二的这个十分之一和十二分之一, 那么它的这个亮点的话,它还有一些核心的这个亮点,比如说它的这个 bronze comp 的 这个,嗯,电脑这个搜索能力是达到了百分之七十六点三, 然后的这个网页的能力竞争力的话是达到了,嗯,百分之七十六点四,那么它在这个网页的这个浏览信息搜索、证据追溯等方面其实的能力是非常的突出出色, 那么同时的话就是它的这个它能够很好地去实现我们这一个办公的自动化,那比如说 word 文档自动排版生成报告,还有这一个 powerpoint 自动制作演示文稿, 以及这个 excel 的 这个金融建模数据分析公式生成,这些能力的话其实是比较强的,是要优于其他的这个主流模型和开源模型的。 那么我们再来详细的讲解一下。呃, mini max 它为什么能有这样能力?它核心的这个技术原理是什么样的?首先的话它采取的是也是这一个 mo 混合专家模型,用这个稀疏激活机制推理的时候,仅激活部分的参数, 而非全部的参数,同时如同调用这个专家团一样,而非全全员出动,那么大幅度的提升这个效率。其次的话就是这个模型的基本参数是,呃,模型的这个类型是英国语言类型, 它是主要是理解这个生成文字,它没有这个视觉能力。第二点的话它总参数是两千三百亿, 这是模型的这个知识容量,那每次激活的参数是一百亿,实时干活的用到的这个参数就是这个一百亿。另外的话,它的架构是采取了这一个混合专家的这个架构稀疏激活的这种架构那么可以做到高效的推理,上下文的 长度啊,是大概二十万的左右的这样的一个上下文长度 token, 那 么一次可以处理十五万字, 同时的话它的推理速度在一百 t p s, 就是 每秒生成一百个这个 token, 而模型大小的话是在这个 b f, 嗯,十六四百五十七 g 的 原始的这一个原始末的这一个压缩的大小, m o e 的 这个价格为什么 又小又强呢?那么跟 queen 三点五其实是一样的,它就相当于是每次只激活这一个一百亿的这个参数,然后做到推理更快,成本更低,同时能够跑更多并发,那么同样的硬件服务可以服务更多的这个用户。 另外的话它还加强了一个,就是这一个 a 型的这个原生能力的这个强化的学习架构, 那么它采取的这个架构的话叫做 foreign 强化学习架构,它是它的技术创新,传统的这个模型训练方式是数据加训练,加模型学会说话,而 minimax m 二点五的这个训练方式是二十万加上真实环境, 然后再强化学习,模型一步一步学会做事。那么在大版环境里面,它就直接在二十万的这一个, 用二十万的这一个相关的这一个参数,然后模型像真实的实际师生一样,在真实的环境里面不断的尝试,然后获得反馈,从而掌握这一个使用工具的解决问题的这个能力,实现从说话到做事的这个跨越。 那包括它的这个浏览器办公环境和各种工具 api, 它实现的就是二十万加上真实环境加上强化学习,以及让模型逐渐的学会做事情。 a foreign 的 这个框架的这个语特点,其实它第一是实现了这一个 aint 的 原声,那么模型从训练开始就能够学习如何使当智能体,而不是先对 先学对话再适配,同时的话实现这个环境解偶,那么训练的这个引擎和 aint 完全分离,支持任意的 aint 的 框架,那么同时也做到这个训练吞吐量实现约四十倍的这个训练的加速。 其次的话它支持这一个树形的合并,那么创新的这一个样训练样本的话,其实是用来做这个训练加速的。 其次的话它还采取了这一个 c i s p o 的 算法,那么做到这一个稳定的训练 m o e 的 模型, minimax 自研的这个 c i s p o 的 算法来确保大模大规模的 mo 模型训练的稳定性,那么还解决了行业的一个痛点,就是 mo 模型在大规模训练的时候容易出现这个不稳定性,它采取的就是这一个,嗯,交错思考模型, minimax m 二点五的它的这一个交错思考模型其实是使用这个 think, 然后里面包括这个内容,再加上 think 的 这个标签包裹着来进行推理。 比如说用户的问题,请修复这个 python 函数中的 bug, 那 么模型输出的话就是 think 让我分析这个函数问题,在第三行类 请转换错误,需要在调用前添加这个类型检查,然后我发现了问题,第三行 缺少类型检查。以下是修复后的这个代码,然后再进行这个代码的修复,那么这个的话就是关注这个重要的东西,在多轮对话里面必须要保持保证这一个历史的信息, think 杠 think 的 这个里面的内容 如果删除的话,模型的性能就会显著下降,这与这一个 queen 三点五不同, queen 三点五是要求在历史中去掉这一个思考的内容, 而这个的话就是要保留历史中的这个 think 的 核心关键信息是一个交错思考的这样的一个模型, 另外的话它就是有这个 specwriting 的 倾向,像架构师一样去思考。那么 m 二点五在训练时涌涌现出了一个独特的行为,就是 specwriting tendency。 在 写任何的代码之前, m 二点五会主动地分解项目的需求,规划功能和架构, 同时设计这个 ui 方案,向一个经验丰富的这个软件架构师从全局出发,然后去能够这不是人为的这个编程能力,而是在大模大规模的这一个强化学习之后,自然涌现出来的这样一个编程的能力,这是非常厉害的。 那么其次的话就是另外它的这个编程能力在业界对比的话其实是比较强的,基本上能跟 cloud ops 嗯,四点五持平。同时的话它在权威的这个 s w e 奔驰这个测试里面,它其实也是,嗯,另外的话,它有极具这一个性价比的这一个优势, 具备这一个全站开发的这个能力。 那么另外就是 m 二点五它的一个特别之处就是它在它,它在不同的这个 a 型的架构下面都能够保持这一个稳定的性能。比如说 open code 的 架构下面,它有百分之七十六点一,还有 cloud ops 是 百分之七十五点 九,还有这一个座椅的这个框架下面是这一个百分之七十九点七,以及这一个 cloud ops 四点六,是百分之七十八点九。 另外的话就是这一个 m 二点五的这个 swbench verified 达到百分之八十点二,与这个 cloud ops 四点六其实是相差百分之零点七,还有 marty swbench 的 这一个参数里面是百分之五十一点三是目前公开的最高成绩,关键的差异的话就是完成这个 swbench 任务的这个速度提升了百分之三十七,平均是 二十二点八分钟,每任务与这个 cloud ops 四点六是基本上持平,但成本的话只有 cloud ops 四点六的十分之一。 这意味着就是 m 二点五不再依赖任何特定的工具环境,都能够表现出色,并且发货能力很强。 在全站开发能力的话, m 二点五也覆盖了完整的这个编程场景,有这个零到一的系统设计,从零 开始规划这一个架构,一到十的这一个系统开发核心的功能,实现十到九十的这个功能的迭代,持续的添加新功能,九十到一百的这个代码测试 和这个质量把控。那覆盖的这个平台技术有这个 web 前端比较擅长 html, css, js, script, type script, 还有 regact, 安卓的应用的开发, ios 的 应用开发, windows 的 应用开发,服务端的 api, 业务逻辑数据库,它精通十数种这一个 go, 嗯, c c 加加 type script 和 python, java, javascript, php 和 lua dot 以及这一个 ruby 这些开发框架。同时它也具备这个搜索与工具的这个使用能力其实也是比较强的,超过了 gpt 五点二 通过它使用的这个较少的这个搜索轮次,然后比这个 m 二点一减少了百分之二十的这个轮次,就能够得到正确的这个答案。这说明模型不不仅仅是找得到,而且是找的更聪明,更快、更准。 那么同时他在这一个 rse rise 的 这一个评测里面,专业级搜索里面,他也自建了这个 rise 的 这个评测。那么模拟这个人类学家真实的搜索过程,不仅是搜索引擎的查询,包含在这个信息密集的网页里面深度搜索,他在这个评测里面也表现出色。 同时的话它通用了这个智智力的这个能力,包括数据竞赛专业的领域,它都是能够达到世界领先的这样的一个水平,包括 she 无工具和这一个 s s i code, 还有这个 if bench 指令遵循,以及 a a a a a l c r 长上条文的这个搜索能力也是比较的突出。那么它进步的是很好的一点,就是实现这一个办公的自动化,它通过这个 g p t 的 这一个 pro 就是 平均的这个胜率,对比所有的主流模型在办公场景下里面的表现是胜率在百分之五十九点零。同时它的这个 excel 竞赛里面也是领先的由这一个金融专家设计的这个评测。 那么它的这个速度和效率的话,其实也是在同行业里面是比较的快,它能推理速度达到一百 t p s。 另外它的任务完成率和综合评价都还是比较优秀的,但是它还有一些不足,它的不足的话第一个就是数学竞赛,它是比较弱的,专业科学的话它又也比较弱,超难题的话是比揭秘版要差了不少。 然后视觉理解的话,目前是不支持多云覆盖的话,其实不如这个 queen 三点五。然后它的百万 token 是 有比较大的优势,只有其他模型的呃二分之一到二十分之一, 另外它跟这个 queen queens 这一个三点五的这个比较优势就是第一个它编编程改 bug 这样的一个优势其实是比较强的,搜索 agent 的 这个能力也是比较强, 然后这一个数,呃,数学的推理的话是 queen 三点五更强,视觉理解 queen 三点五更强。然后多语言的话是 queen 三点五会更强一些。文档的这一个 ocr 其实是 queen 三点五更强。 另外就是办公的这个自动化其实是这一个,呃, m 二点五更强,推理的这个速度是 m 二点五更强。 api 的 这个价格其实是 m 二点五更便宜,模型的大小其实是 m 二点五更清亮,同时的话,本地的这一个运行是 m 二点五更容易, 那么核心的这一个需求的话,如果你是写代码修 bug 的 话,那么你可以选择这个 mini max 二点五,办公自动化预算极其有限,或者需要大量并发以及这个本地部署。还有这一个看图处理文档 的话,呃,就是前面的话,这些都是 minmax 会更强一些。然后如果你是要看图处理文档或者多语言翻译,那你用 queen 三点五更好一些。顶级的这种数据竞赛还是选择这个 gpt 五点二,另外简单开箱即用的话,那么还是选择这个成熟的币币源的这个生态 部署方案的话,它这里重点的话就是由这一个 a 镜的网页版和这个 api 调用,以及欧拉玛和这一个企业,企业端的这个部署推荐的这个配置是一百二十八 g 的 这个 mac 的 话,它能够稳定的部署,同时入门的话是要九十九十六 gb 的 这个 mac 或者是 pc, 然后实现这个有效的部署。还有就是多 gpu 的 服务器就实现全量的这个部署, 它要在这个三 bit 量化之后,只需要一百二十八 g 的 这个内存就能够实现这一个相关的,那么它是一个很好的编程学习助手,办公效率提升。同时的话它也是一个软件开发团队,能够进行这一个加速且便宜, 还有这个成本降低。另外它能够作为 open cloud 永远在线的这个 ai 员工,这也是得益于它极低的成本和极强的这个办公的这个 ag 的 能力。那么如果你想去开发这个 ag 等,就要定义好你的工具,定义好你的流程,调用对应的这个 api, 然后来做到这一点,然后它能够保证你的话就是极致的这个性价比,办公的自动化以及这个全球顶尖的能力。 以上的话就是我们针对这个 minmax m 二点五的这个深度解析和使用介绍,如果你感兴趣的话也可以随时联系我们,欢迎与我们进行沟通交流。