小米模型降价百分之九十九,直接和 deepsea 硬钢,看来 deepsea 给的压力还是挺足啊。那小米的 mimo 和 deepsea 相比到底怎么样呢? 今天咱们就详细聊聊小米 mimo v 二点五 pro 和 deepsea v 四 pro 这两款国内顶尖大模型,帮大家分清两种的定位和适用场景。首先看基础信息, 两者上下文都做到了百万头肯,而且全部开放 m i t 开源协议,个人和企业都能自由商用,门槛很低。参数上, deepsea 整体规模更大,不过小米这边额外做了图像、语音一体的全模态,而 deepsea 目前只支持纯文本交互, 这是两者最直观的区别。接下来看核心能力比拼。第一块是智能体 app 的 能力,这一块小米眉目优势非常明显,在多项权威评测里得分更高,而且执行任务时投分利用力更高,能省下接近一半的调用成本,非常适合搭建 自动化工作流、智能助手等一类产品。第二块是代码的专项,榜单里表现拔尖,软件工程、算法编程、 实战写代码的能力目前位居行业潜力,是程序员开发团队的首选。第三块数学与逻辑推理,同样是 deepsea v 四 pro 更强数理计算、复杂推理的实测成绩非常亮眼,很适合科研和数理分析。总结一下,首先两款大模型都是国货之光,都很优秀, 如果你的需求涉及图片、语音、多媒体交互,或是要做智能体,首选小米 mini。 如果是专业编程开发、数学科研、纯文本内容创作、深度逻辑推演,那 deepsea 会更加适合你。关注我,了解更多最新资讯和实用技术。
粉丝6909获赞9.4万

最近 openroot 被一个名叫亨特阿尔法的神秘模型给霸榜了啊,很多人都在猜测这玩意到底是谁家模型,那么直到十九号上午终于被小米给认领了, 这个神秘的模型就是小米最新的 miimo vr pro 模型。小米接连发布了三款大模型,并且开启了一段时间的免费试用。可能有很多平常不关注大模型的朋友感到非常的好奇,想知道这个玩意到底该怎么样去使用,那么今天这期视频我将教会大家怎么用上小米的大模型。 好,那我们废话不多说,直接开始。先说最简单的用法,就是把它当成普通的聊天大模型来使用。如果你使用的是小米手机,可以直接打开小米自带的浏览器,点击中间的 ai 图标,就能够直接使用小米的 mini 大 模型。当然不是小米的手机也没关系,我们可以直接来到小米 mini 的 官方网站, 然后点击 web demo, 可以 看到左边有一个侧边栏叫做 memo chat, 我 们点击就可以和大模型进行聊天了,然后左上角还有可以切换模型。如果你只是把大模型当成聊天工具,那么网页端就差不多够用了,但是如果你想让他帮你处理文件,调用工具,接入工作流的话,那就要把它接入智能体了。 接下来我会教大家怎么把它接入智能体上面。智能体这个词可能听起来有点复杂,但大家不要被吓住了。智能体也就是 agent, 它是一个以大语言模型 l l m 为大脑,能够自主规划、记忆并使用工具来完成目标的一个智能系统。 传统的 l l m 本质上还是你问一句,他答一句,比如豆包千问菜的 g p t 这一类,你给他一个问题,他就返回一段内容,基本上也就结束了。但是 a 卷的不一样,他不只是负责回答,他还会接着往下做。 你给他一个目标之后,他会自己理解任务规划步骤,然后一边执行一边根据结果继续调整,直到把这件事情做完。 比如你让他帮你整理一个文件夹里面的资料,顺便提炼重点,再写成一份总结,他就不只是简单的给你一句建议,而是真的会一步一步的把这件事情往下做。所以简单来说,普通的 ai 更像是在跟你聊天,而 a 检测它是真正的在帮助你干活。 像 open code codex 以及 cloud code, 还有前段时间爆火的 open clone, 都属于智能体,目前 open code 提供了免费的密膜大模型的使用,我们以 open code 为例,演示一下怎么把大模型接入智能体。在安装 open code 之前,我们首先需要安装一下 node js, 我们来到 loggs 的 官网,根据对应的系统下载安装包,把 loggs 安装好之后,接着我们打开终端,输入下面这串命令,这样我们就完成了安装,再输入 open code 就 能够直接进行启动,我们跟它对话试一下,可以看到它已经开始回应我们了。 那么接下来我们把模型切换到 m 模模型,按住 ctrl 加 p, 或者使用斜杠 model s 命令切换使用模型。 这里我们直接搜索 mimo, 可以 看到 opencode 为我们提供了两个免费的模型,选中之后就可以看到这里的模型已经发生了改变,这样我们就可以开始对话了。 这里我让他帮我生成一个小霸王游戏的 svg 动画,放在我的桌面上可以看到他已经在接受命令之后开始工作了,我们看看效果如何。 前面我们使用的是 open code 为我们提供的免费大模型,通常他会以降低速度或者是一些其他的方式来限制你的使用,并且免费期一过就不能够再继续使用了。所以接下来再给大家演示一下怎么接入小米的 api key 来进行使用。在 open code 里面输入斜杠 connect, 我们这里可以搜索模型提供商,这里可以接入各种各样的大模型,像亲爱的 g p g gmail 等等,我们直接搜索小米。然后我们来到小米官网,点击 api access, 然后点击申请 api key, 我 们创建一个 api key, 把 api key 复制回到终端回车,这样我们就能够选择模型来跟它进行对话了。 这里必须要保证你的账户余额充足,不然是不能够进行对话的。 ok, 以上就是使用小米密墨大模型的全流程啊,感谢您的收看,如果你喜欢这期视频,记得给我点亮收藏,后续我也会分享更多跟 ai 相关的知识,我们下期视频再见!拜拜!

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

小米正在快速成为世界第一,今天是迷魔大模型降价第三天,他已经冲到了奥本如的排行榜的第七位,世界第七。最新一天的世界第七位是非常强的一个成绩,因为他之前已经完全掉出世界前二十了,在世界前二十里面看都看不到他,但他仅仅通过降价就重新回到了世界第七, 而且随着时间推移,我相信他很快可能在这周之内就重新登顶世界第一都有可能,但不仅即便不是世界第一,也会进入世界前三。我觉得他因为他效果,在同样的价格下,他是比这个 davidson 要更强一点的。 davidson 为四, 但很奇怪的是, davidson 的 四维斯 black 还能排在世界第二,那小米的 v 二点五居然根本就看不到他的痕迹。我都不知道为什么, 为什么会有这么多人用这个 v 四 flash, 居然就不用小米的 v 二点五呢? v 二点五的 flash, 或者它不叫 flash, 它也叫,就叫普通的 v 二点五。现在小米的活跃程度到了什么程度呢? 我现在配了在这个 oppo 扣的里面。配了这个小米的米某之后,我发现哪怕现在大半夜的它都调不通,但这可能小米的服务器有问题,也有可能是掉太多了,但它它都没有显示四二九二,直接显示了异常终止。 比如他在十七分的时候,本来现在在十二分的时候到十七分五分钟时间,他居然一一个回复都没有,到,最终他就被莫名其妙被扣的终止掉了。只能说现在小米确实用起来了,但有的人会觉得小米的这个被用了这么多,他可能信用卡会不够,其实根本就不用担心 小米,他不仅买了很多因为他的卡,而且他还投资了摩尔县城,摩尔县城他是有很多这种大规模的战机群,是可以对标菊花的征程九五零的,所以在性能上、在算力上是有保障的,是没问题的。只能说希望小米赶紧建设吧,不要再出现这种问题了。

小米 mini 大 模型突破一万亿, toon 在 国内算什么水平啊?为何盘古大模型没有公布自己的调用量呢? toon 啊,是 ai 信息处理的最小单元,也可以简单离页为流量,调用量越大,就代表该模型被用户使用的越多。我们来看一下最近一周的国内排名啊,第一呢是千万三点六 plus, 四点六万亿。第二呢就是小米的 mini, vivo pro, 三点零八亿。 所以说呀,小米的一万亿 token 呢,已经达到了国内头部玩家的水平。而华为的盘古大模型呢,它不是单一模式调用啊,而是模型加平台模式,尤其是在工业、医疗、气象、金融、政务等专业领域啊,提供可落地的完整的 ai 解决方案。 他呢,不仅有自己的盘古大模型系列啊,还继承了千万 deepsea 的 模型。就在上周啊,国内大模型调用总量为十二点九六万亿啊,老美呢,为三点零三万亿。我们呢,已经连续五周啊超越老美了, 这个数据啊,说明我们的 ai 产业强大的竞争力,而在这一切庞大数据的背后啊,算力支撑才是七寸, 我们希望啊,除了华为的阿达拉斯之外呢,还有其他公司也加入进来,一起把我们自己的 ai 底座做强做实做大。

先说结论,小米 miimo 确实降价了,而且降的不少,但降幅百分之九十九这个说法,咱们得打个问号,因为没人知道它原来到底卖多少钱。 credit 是 怎么回事? 小米搞了个中间层,叫 credit, 你 先买套餐,比如三十九元,一个月给你六千万个 credit, 然后用的时候按 credit 扣。降价之前, pro 模型要扣两个 credit, 长文本甚至要扣四个。 降价之后,小米说取消了四倍 credit 的 计费方式,但具体 pro 模型现在是扣一个还是两个,官方没说清楚, 直接看价格更实在。小米公布了 token 价格,输入缓存命中零点零二五元每百万 token 输入缓存为命中三元每百万, token 输出六元每百万 token 输入只要两分五厘钱就能买一百万个 token。 和 deep seek 比怎么样?巧了, deep seek v 四 pro 的 价格完全一样。小米这是明摆着对标 deep seek, 价格完全对齐, 那到底降了多少?小米说最高降幅百分之九十九,如果这是真的,那原来 pro 模型的输出价格应该是六百元每百万 to 肯左右。 但问题是小米从来没公布过原来的官方价格表,所以百分之九十九降幅这个数字只能信一半。 普通人该怎么选?如果你追求简单透明,小米和 dipsic 价格一样,选哪个都行。如果你担心被套路,别买套餐,直接按量付费,这样就是明确的价格,没有 credit 换算的弯弯绕。 最终结论,小米 mimo 降价是真的,价格也确实便宜,但降幅百分之九十九的宣传,因为缺乏原价数据,没法完全验证,和 dipsic 比价格完全一样。 credit 机制有没有猫腻?官方没把降价后的换算比例说清楚,这是个隐患。

五月二十七日,小米宣布 mini v 二点五系列 api 永久降价,最高降幅高达百分之九十九,并且不再区分上下文窗口长度。小米 mini 负责人罗福利随后发文揭秘了降价的技术底气,其 推理框架新增了针对所有的分层 k v 缓存优化,这项优化让缓存托克容量提升了五倍,相当于降低了百分之八十的缓存成本。同时,得益于模型架构中极端的一比七稀疏比例, 小米将原始推理成本压到了远低于行业平均水平,从而把结构性成本红利直接让渡给开发者。目前,在最新定价下,小米的生产推理引擎已接近满负荷运行,但依然能够维持数值平衡。官方也表示,只有底层架构优化跟上,才能避免流血降价。这次降价不仅打破了成本底线, 更意味着大模型正通过极致的推理优化到 b 底层 ai 硬件价值重估平价算力,将真正引爆全球规模化的推理应用需求。

ai 圈在先,降价风暴小米正式宣布密某 v 二点五系列 api 永久降价,最高降幅达到百分之九十九,取消复杂的上下文差别定价,统一计费。同时 token 套餐加量不加价额度直接翻五至八倍,在校用户全额重置额度。 靠着滑动窗口注意力缓存扩容和集群优化三大底层技术硬降成本, tds 还限时免费开发者落地, ai 成本直接砍到底。

今天 vr 圈最狠的价格战来自小米 mini 微二点五系列 a p r 从今天开始永久降价,最高降幅达到百分之九十九,而且取消长文本意价,所有上下文统一计费。 旗舰模型 mini v 二点五 pro 的 价格被直接打穿,缓存命中、缓存未命中和输出价格都进入极低区间。更关键的是, token plan 也升级了,六美元到一百美元,四档套餐不涨价,但可用额度提升到原来的五到八倍。 同时,所有仍在有效期内的历史套餐额度全量重置,相当于老用户也直接吃到这次降价红利。另一边,小米的百万亿 tocan 创造者激励计划提前收官, 全球五十四万多人申请,最终二十四万多人获批,一百万亿 tocan 已经全部发完。这说明大模型 api 的 竞争正在从模型参数转向推理成本、缓存效率和开发者生态。 对创业者和开发者来说,问题变了。当模型调用越来越便宜,你会把哪些 ai 应用重新做一遍?关注我,并在评论区留下你的判断。

小米 mimo 大模型 api 永久降价,最高降幅百分之九十九五月二十七日,小米宣布对 mimov 二点五系列大模型 api 实施永久降价,最高降幅达到百分之九十九。本次调价不再区分上下文窗口, 同时优化计费方案,同等价格下,开发者可使用的 token 用量提升至原来的五到八倍。雷军也公开表态,欢迎更多开发者介入小米 mimo 大模型,进一步降低 ai 应用的开发成本。

兄弟们,跟你们说个事情哈,昨天看到小米 mayo v 二点五降价,脑子一热就充了最便宜的四十块套餐,想着四十一亿 credits 怎么都够造的对吧? 其实到现在为止,我也就用了六七个小时,已经用掉百分之四十多了,你以为我干了啥大工程呢?其实就是让他读了个 github 仓库的代码,再扫了扫我电脑里的文件,就这点事,照这速度估计也就够用两天。所以打算入这个套餐的朋友注意下消耗速度啊,太惨爆了!

太炸裂了!小米这次直接把大模型价格打到了空气价,老用户额度全部充至原来几十万, top 的 额度突然变成百亿级。更离谱的是,小米直接宣布 mini 永久降价,最高降幅百分之九十九,输入百万 top 只要两分钱!你要知道, dbc 个前脚刚把价格砍到四分之一,小米后脚就直接把地板给掀了。但真正恐怖的还不是便宜,而是小米开始完全能 ai, 文字、图片、音频、视频全都能一起理解。以前 deepsea 像文字聊天高手,而现在 vivo 更像全能数字员工。更关键的是,小米这波不是单纯降价,而是在疯狂扩大开发者生态。因为 ai 时代最后拼的不是谁模型最贵,而是谁先把 ai 彻底铺满全世界!

deepsea 钢灰刀,小米就把刀架在了自己脖子上,前者降百分之七十五,后者降百分之九十九。两家中国公司几天把大模型 api 打到全球最低价,为什么 deepsea 和咪猫都在降?不是两家打架,是他们同时想明白了一件事,大模型 api 不是 奢侈品,是水电煤, 谁先让开发者用上瘾,把应用建在你的接口上,谁就赢了。偷看根本不靠卖钱,赚钱靠的是你留在它生态里的数据 少有反馈,还有下一代模型需要的真实使用场景。所以不是谁更便宜,是谁先让你离不开。现在跟随我的脚步获取福利,最多拿价值两百块的 token 换算一下,差不多一百九十亿。 token 什么概念?对于普通的 ai 用户来说, 起码来说半年的算力是不用发愁的。第一步,浏览器打开秘报官网,点注册手机号就行。第二步,进控制台左边菜单,找 a p i 密要点,创建生成的,替复制下来, 这跟 deep six 的 用法一模一样。第三步,也是最容易漏的一步,填邀请码,注册页或者设置里有个邀请码入口,填别人的码,你和对方都多拿十块。降价不是内卷,是技术真的进步了,让每个人都能用上最好的模型。

小米这次是真不讲武德 t f c 刚宣布永久降价,雷总拍板跟进。小米 vivo v 二点五全系 a p i 价格永久下调,降幅达到百分之九十九,彻底取消长短上下文,价格差,以前长窗口贵好几倍,现在全部统一定价,标准版缓存命中,只要二分钱,每百万头可嫩。 pro 版二分五 将近三块的事现在两分五就能解决,直接把大模型当白菜卖了,同时偷坑套餐加量不加价,用量直接翻五到八倍,三十九块的最低档套餐能跑五亿多。偷坑?这是什么概念?以前用 vivo 写东西心疼钱, 现在随便用,成本低到可以忽略不计。 tbc 和小米两家联手把大模型价格打到了全球地板价,让 vivo 不 再是巨头的玩具。

聊聊 miimo 大 模型吧,普通人现在主要接触的更多应还是 lm 模型,多模态模型暂不做本次参考。目前市面上的主流模型,国外无非是 cloud、 emote 诞生 gemini、 gpt、 groc, 国内主要的 glm、 deepsea、 qn、 dobao、 kimi。 但是经过前两年的混战后,大家使用大模型基本都跟公司采购和个人习惯趋于稳定,而国内网络的现状让国内 ai 大 模型能力独立竞争。 在这样的条件下,雷军组建自己的大模型团队, mimo 诞生。 mimo 第一代产品 flash 发布时,和其他开源 ai 一 样,我们 同步进行跟进,并在内测社区对模型进行测试和问题反馈。初代模型能力下, mimo 整体推理能力并没有解决当时所有模型的长链路思考、大数计算、上下文专注度、思考循环等等常见问题。 但是他当时有一个共识的优点,思考速度非常之快,也就是如此快速的思考能力,第一批测试者迅速将 mimo 的 测试模型推到 openroot 的 榜单第一, 每个人轻松百万级别的投币消耗让咪某团队连续几天高强度运转更新,迭代速度十分之快。长达两周的模型测试之后,咪某的能力肉眼可见的提升,随之咪某宣布延长免费期到一月二十日。而伴随咪某长达一个多月的免费使用,第一个迭代下,咪某的推理能力较快的追上了国内领先 批队,正式入局 ai 大 模型市场。一月二十日,咪某正式发布,开始收费。不过在当时 ai 的 token 消耗主要依赖于用户问答形式消耗的环境下,咪某其实并不占据优势,但随着 openclaw 开始爆火,一个我称之为 token 燃烧器的软件引爆全球。 如果不是因为贡献者是一位非 ai 公司的独立开发,我严重怀疑这个软件是 ai 公司造出来烧 token 收钱的。而有了这个 token 燃烧利器, open router 的 免费模型中,推理能力占优的模型开始出名。三月十一日,神秘模型 hunter alpha 命名上线,上线凭借强大的模型能力连续霸榜 open router。 三月十九日, mimo 团队正式官宣,认领 hunter alpha, 终结了对这个横空出世的模型的猜测。这次免费使 mimo 完成了能力训练,并积累大量经验用于构建 micro。 而月底,不知道是为了提高知名度还是继续强化模型能力,韦总再次宣布免费。自此 mimo 正式完成大模型布局, 开始大规模收费,中期发布 token plan。 最后总结一下,目前对咪咪的应用评价为,可以使用能力不错。 token plan 个人观点,定价稍高,如果 token plan 定价有优惠,可以直接上。非理能力和助手能力都处于领先,但个人习惯不主推这个模型。 雷总经常发布免费试用,可以多关注下,体验下能力。这时可能有人要问,盘古大模型也讲讲,这个就得多随嘴了,你知道 good top 和 q win 吗?啥不知道,那老规矩后面没必要听。

五月十五号,微软已经开始取消大部分员工的 cloud code 的 内部许可,截止日期六月三十日就到。六月三十号之后,大家都没法使用 cloud code 了。六月三十日呢,也是微软团年的最后一天,什么概念呢?就是微软现在已经 不愿意为员工的 vip 定价买单了。仅仅在六个月前呢,微软还在做一个完全相反的事情,二零二五年的十二月,他把 cloud code 开放给数千名员工,包括了工程师、产品经理、设计师,鼓励所有人用 vip coding 的 方式来重塑 工作流,员工呢,也非常的喜欢这个工作,当然了,可能消耗透支量呢,也指数型的上升。六个月之后呢,微软自己是服输了,因为这个透支量,一句话说的话就是烧 token 已经比员工更贵了。 y c 的 合伙人 tom blumfield 在 一次 bash talk 就是 分享会上说一句话,如果你的 a p i 账单不让你心痛,说明你烧的不够。类似的话,詹曾皇也说过, 希望每招一个员工的费用,其中他的薪资的一半会匹配对应的 ai a p i 的 使用 token。 那 为什么微软会取消 web coding 呢?其中一个原因呢,就是微软自己在推自己内部产品叫 coopart, 这产品呢,目前看呢,其实是有点受冷的,原因呢,就是 color code 的 使用量太大了。实际上微软呢,并不是孤立这一段时间呢,很多的公司呢,都为透看的销量犯愁,比如说 uber 的 cto privin 就 曾经透露,公司二零二六年全年的 ai 编程的预算在前四个月就烧光了。因为呢,应用深度学习的副总裁 brian 曾经在采访中说过一句,对我的团队来说,算力的成本远远超过员工的成本。那为什么这么多公司,特别小公司还在用 web coding 呢?因 这里面的一个核心逻辑是, web coding 对 于大部分的初创公司来说,是在替代人力成本,而不是增加人力成本。比如说 yc 的 合伙人达恩达湖曾经就说过一句话,一个人配上 ai 工具,就等于过去一支大工程师团队。这里面的核心逻辑呢,是替代而不是增加。微软呢?作为一个大公司,他不可能裁员百分之八十 全替换成 ai coding。 而目前的团队增加了这部分的 ai coding 之后,也没法快速的让自己的业务以两倍、三倍甚至五到十倍的做增长。所以微软也好,我 y c 说的初创公司也好,他们烧的本质上不是一种价值的 token, 微软的 token 呢,是给原班人马副驾加油,相当于增加了额外支出。而 y c 说的初创公司的 token 是 替代原本的驾驶员。另外,前段时间有个新闻就是 meta 裁员,那裁员之前呢? zacabark 的 团队呢,是一直用自己的 vip coding 的 方式呢,去蒸馏员工的能力,所以呢,让整个裁员变得更加的丝滑,让很多的技巧跟技能呢,是沉淀在团队里面。那这个事情你应该怎么理解呢?我觉得对于很多的 ai 创业者来说呢,其实是一个颠覆性的机会,因为很多大厂,因为 因为它的结构性的原因,因为传统业务,因为 incumbent 就是 既有业务团大难掉头,导致它的成本结构并没法做大幅度的变化,没法自我革命,反而呢,对于创业公司来说,没有这样的压力,可以用一个更小的团队,更多 white coding 的 实力来实现大公司的能力。那另外方面呢,对于很多大公司来说,他要想改革呢,就没有那么容易, 因为他的业务呢,是相对来说比较稳定的,裁员呢,又会造成很多的社会恐慌。对他们来说,选择更低成本的构建模型以及 coding harness, 反而是更好的选择。 像 s 账号上面的一个网红 sick dot dev 说的, my company's cloud account got exhausted now my legendary manager is asking if we can build our own l l m like cloud to reduce costs。 就是 类似他们一样的,很多公司的 cloud 的 账户已经用完了,公司的管理层呢,在思考如何寻找更低成本的大模型的方案。这个呢,就对于无论是 deep sea 还是像我们这样的高性价比的模型公司的一波新的市场奇迹。

那今天想跟大家聊一聊最近这个小米的这个 mimo 模型啊,这个调用量冲到了全球第一,单月贡献了一点四十五万亿 token, 这个是怎么做到的?这个真的挺让人惊讶的,所以我们今天就来聊一聊背后的故事。咱们第一个要聊的就是为什么它能够成为大家首选的这个推理引擎啊?就是它这个 model 本身到底厉害在什么地方? 就是这个 model 它是小米自研的嘛?对,然后它有一个旗舰的版本和一个全模态的版本。它的旗舰版呢是有一点零二万亿的参数,但是它在推理的时候只需要激活四百二十亿。 它的这个全模态的呢,是有三千一百亿的参数,但是它在推理的时候只需要激活一百五十亿,所以它的效率还是很高的。它的这个呃稀疏混合专家的这个技术路线,所以它能够做到非常非常大的模型,但是它又不会在推理的时候把你的资源全都吃光。那这个模型它在这种实际的任务当中表现又怎么样呢?它这个旗舰版呢,在那个 s h v h pro 上面是百分之五十七点二, 已经非常非常接近那个 gbt 五 point 四了。然后它的这个呃 cloud evo pass three 是 百分之六十四,它的这个 token 消耗是比同类的这些大模型都要低百分之四十到六十,它在这个 artificial analysis 的 这个智能指数里面是全球第六, 国内第二。就是它这个实际的任务的完成率是要比这个 g r m 五 point one 和这个 kimi k two point six 都要高的,所以它就是非常非常适合这种 做这个 ai 智能体的这个首选的推理引擎。就说这个 m m o, 它在一些关键的技术点上面,它到底是怎么做到这么强的?它就是用了这个混合注意力机制,它是这个局部的滑动窗口,注意力和这个全局的注意力是交错的,所以它能够既能够 压缩这个 kpi cache, 又能够处理这种超长的上下文,那它这个旗舰版就可以一口气处理一百万 toc, 这确实很夸张啊,这个上下文长度,对,然后它还呃用了这个多 toc 预测,还有这个轻量化的前馈网络,让它的这个推理速度有三倍的提升。它还支持非常多的工具的原声调用,它是跟这个主流的这个开源的框架都是深度集成的,它的 这个多模态的版本还可以处理图片、音频和视频。它的这个中文的 tts 也做的核心的这个模型呢, 就是因为 hermes, 它本身是一个非常追求自进化和这个跨绘画记忆的一个 agent 的 框架嘛。那这个东西其实对模型的要求是非常高的,就是你要有超大的上下文, 然后你要能够非常高效地去记住这些东西,处理这些东西,那正好就是 memo 可以 非常完美地契合,这个听起来是一个天作之合呀,没错没错,而且就是 memo 不 光是在这个任务完成率上面有百分之四十七的提升,在延迟上面有百分之三十二的降低。它还通过了这个 nos portal 给全球的开发者提供了非常方便的免费的接入。 然后它的这个调用的价格只是国际上那些同类的闭源模型的五分之一,所以它就是真正的让这个 ai 智能体变得好用,而且便宜, ok, 对, 所以 这也直接带动了 hermes 的 这个全球的 token 调用量暴涨,对,就它的性价比和它的这个适配度都是非常非常领先的。然后咱们再来讲讲啊,这个 mimo 在 生态布局上面的一些动作啊,就这次这个开源和这个合作,小米到底是怎么玩的?就是最近小米把这个 mimo v two five 这个系列 全部都开源了,然后它是用的是 mit 的 协议嘛,就是你几乎什么都不用受限,就可以全球的开发者都可以非常随心所欲地去下载,去商用,这就一下子就把这个门槛降到了最低,这确实挺大胆的这个操作。然后更有意思的是,它还搞了这个 orbit 一 百 t token 的 这个计划,就是它在一个月的时间里面免费的发放一百万亿的 token 啊,就是 不光是个人开发者,还有这个 agent 框架的团队,芯片的厂商,他们都可以来申请,你就可以得到非常高额的这个额度的免费的投票。而且它是跟这个主流的这个推理框架和七家芯片厂商都是在开源的当天就已经完成了适配,就它整个这个流程就是让你创新的这个团队可以无缝的接入,你觉得就是这一套生态布局的这套操作,小米到底想要呢? 得到什么?其实小米它就是把这个几乎所有的主流的国产芯片和国际上的一些芯片全都拉进来一起适配,然后它就是为了让这个模型可以随处都能用它的这个 orbit 计划的这个海量的 token, 它就是为了吸引全球的这个创新团队都来用它的这个平台,它的这个 mit 协议更是让大家彻底地打消了这个商业化的顾虑。 所以它的重点其实并不是卖模型本身,对,就是它要让大家都用起来,然后它的这个硬件和它的这个 ai 一 起形成一个闭环,它的这个未来的这个商业模式是靠这个开发者和这个硬件的这个结合来进行一个双向的绑定, 它的这个核心还是要抢占这个生态的话语权,而不是说靠我这一个模型来赚钱。最近这段时间就是这个咪某这么大规模的开源,你觉得在行业里面和开发者之间掀起了哪些新的波澜? 就这个短短半个月的时间,这个一百万亿的这个免费的 token 就 已经发出去了八成,然后全球的这个日调用量直接飙到了接近三千万亿。就是这个 oppo rot 上面这个榜单直接就是第一,就是大家真的是用行动在投票。这波确实挺震撼的,就是大家都觉得这个对于初创公司和独立开发者来说,这简直就是及时与就是大大降低了他们的试错门槛,然后这个生态的适配又做得这么好, 大家用起来也非常的流畅。但是有一些人也会担心说这个东西,呃,模型的这个能力和这个币源的大模型还是有一些差距的, 包括这个审核的机制,包括这个 token 的 有效期,包括这个实名认证,这些事情可能还可以再优化,但是整体的反馈还是非常正面的,包括这个资本和这个行业都是非常认可的。然后咱们来来到第三部分啊,咱们来聊一聊这个 mimo 未来的一些可能的发展方向啊。对,这个你觉得它最有可能在哪些方面会有比较大的突破?呃,我觉得就是 首先就是这个团队的迭代速度是非常快的。对,然后他们也有很明确的目标,就是要做这个 agent 时代的这个首选的模型,所以我觉得他们在技术上面会持续的去发力,比如说他们的这个多模态的融合能力啊,会持续的升级。 那可能未来的话就不只是说这个图文啊,语音的这种多模态可能会有更丰富的这种输入输出的形式,那这个也是跟现在这个行业的需求是非常相关的哦,这都是很让人期待的一些升级。然后包括他们也在做一些模型,做的更清亮啊,能够跑在这个边缘设备上,这样的话就可以让这个终端的用户也可以享受到这种大模型的能力。 再加上他们有这么大的一个硬件的生态和这个数据的生态的加持,所以我觉得他们在产业的落地上面和这个生态的壁垒上面是会有比较大的动作的。 对,我觉得这是一个非常值得关注的方向。哎,你觉得就目前来看,阻碍这个咪蒙大规模落地的核心难题都有哪些?呃,我觉得最明显的就是在一些需要深度推理,或者说需要跨领域的这种复杂的任务上面,他和这个国际上最顶尖的闭源模型还是有一些差距的, 就他的这个自主纠错啊,包括一些这种高阶的能力还是需要加强的,这个确实会影响一些专业场景的使用体验。对,然后另外就是他的这个国内的调用的价格其实比一些同类的开源的模型要贵啊, 所以这也是为什么有很多小的团队可能在免费期结束之后就会流失,再加上就是这个频繁的升级和这个很高调的营销,也让 社区里面有一些声音觉得说这个技术的积累和这个开发者的忠诚度还是需要时间来检验的。你觉得这小米的这个米某这个大模型会怎么样去改变中国的 ai 在 全球的格局?呃,它就是首先它的这个技术上面的一些突破,比如它的这个超长的上下文和它的这个多模态的能力啊,已经让这个国产的大模型第一次在这个国际的榜单上面冲到了前列, 然后它的这个实际的任务的能力也已经可以跟这个顶级的闭源模型去叫板了。再加上它的这个非常激进的开源的策略 和它的这个芯片的适配,以及它的这个开发者的激励计划,也让全球的这个创新的力量都开始涌向了中国的这个 ai 的 生态。对,确实是一个产业协调的一个新的局面。然后包括这个端云一体的这个战略,让它能够在自己的这个非常庞大的智能硬件的生态上面不断的去打磨这个模型,也让这个硬件和这个 ai 之间形成了一个互相促进的一个闭环。 对,所以这个也会加速中国的标准在全球的这种扩散,也让中国的 ai 从一个追赶者变成一个规则的参与者,甚至规则的主导者。哎,说到这,其实我们已经可以看到了, 就是这个 mimo 带来的不仅仅是一个技术和生态的改革,更多的是它有可能重新定义智能时代的标准和想象力。好了,那么这期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见。拜拜。

看到雷军甩出的王炸,我总算知道梁文峰为什么妥协了。五月二十七日凌晨,小米官宣自家大模型 mymove 二点五系列 api 永久降价,最高降幅百分之九十九。 五天前, deepseek 刚宣布 v4 pro api 降价,最高可达百分之七十五,热度仅维持一周。小米直接正面开大,甚至更狠,每百万 token 零点零二五元,且不区分上下文长度。 这是二零二五年以来, deepseek 靠性价比筑起的护城河,第一次被正面击穿。时间回到二零二四年,雷军开出千万年薪,挖来了 deepseek v 二核心开发者、天才少女罗弗利。自从接上梁文峰的左膀右臂,小米大模型就像装上了火箭。 十二月、二月、三月,小米像下饺子一样发布大模型,混合专家架构,万亿参数,百万 to 上下文,像极了 deepseek 的 孪生兄弟。 最绝的是二零二六年三月, openroot 上冒出两个匿名模型, hunter alpha、 heli alpha。 外界都在疯传 deep seek v 四即将发布,结果雷军却在微博亲自认领。 就像科技媒体三十六课文章里写的,罗弗利的加入,使得 deep seek 的 基因被小米直接复刻,匿名测试的打法也被小米学得炉火纯青。中国 ai 实验室的技术路线已经趋同到分不清你我。 前段时间, deepsea 破天荒地宣布对外开放融资。要知道,自 deepsea 诞生第一天起,梁文峰坚持不融资、不站队,也不急于商业化。 他曾说过,公司的核心目标是实现通用人工智能,而资本会干预技术稀释控制权。但当他带领着研究员在无人区里探路时,巨头们却在后面开出八位数年薪疯狂挖人。 而一核心贡献者郭达雅被阿里腾讯自劫疯抢, v 二 v 三核心作者罗弗利被雷军收入麾下,不出意外的话,这份名单还将继续增加。 所以梁王峰罕见妥协了,以五百亿美元估值对外开放融资,这一方面是给核心成员手中的期权定价,另一方面也为更为激烈的竞争备足子弹。或许在残酷的商业竞争面前,所有纯粹的技术理想主义都将迎来折中。

小米密密被严重低估了,我实测发现他反应又快又强,这条视频全程无加速,直接用密密激活。小白龙系统启动中,正在运行自检,进入系统之后,他主动开始自检,可以看到右上角他在准备进行自检操作,正在检查文件读写能力。让我感到吃惊的是,这个小米密密真的是挺快的, 而且所有的工具调用都是成功正常,中间是白龙马的记忆节点, 正在检查热点面板。哇,这个太酷炫了,咪某给我调出一个网络热点追踪系统,他检查完今天的热点之后,他就把整个页面收起来了,看到了吧,执行全部成功,都是绿色的。 正在检查视频模式,他现在在上网找一个视频,然后再准备进行播放,检测他的视频功能,上网搜索需要时间。 哇,这么快就打开了,这个速度还是可以的,挺强的。在检测完成之后,他就把视频给关了,这已经是后来者居上,弯道超车了。我们来让他做点事情吧, 你打开 b 站上面那个雷军唱 are you ok 的 视频,按下空格键说话松开就发送了, 你们看,他已经搜索到了,他在理解、分析和判断。搜索到打开了,真的强啊, are you ok?

最近很多人都在说豆包好像越来越不好用了,但是你可能不知道的是,你现在用的豆包可能并不是最强的豆包,就算在豆包软件里面打开了专家模式,它也不一定等于满血状态,因为网易端和 app 端本质上就是一个面向普通用户的产品入口,它中间可能会有模型路由,身份为限制系统 端,这些都会导致你在使用它的时候受到非常多的限制。那么接下来这期视频我将教大家如何调用满血版本的豆包,并且给他搭上 skills, 以及搭配上我们的本地知识库,去构建一个属于我们自己的工作流,还能白嫖到自己每天送给你的百万 token。 在开始之前,你需要先准备好三样东西,第一,配置好你的 share studio。 第二,创建一个火山引擎的账号,进入火山翻作的控制台。第三,创建一个 api key, 并且开动你要使用的豆包模型。首先先配置好我们的 share studio, 点开我们的软件,然后点击右上角的设置齿轮往下翻,翻到我们的火山引擎,这样一下你就可以看到他自己的模型选择,还有自己可以填的 api 密钥。 然后就是准备火山引擎账号,进入火山换车的控制台来之后在我们的右下角找到开通管理,然后点击我们想要开通的模型, 根据我们的需求直接选择开通。然后在开通之后,我们可以参加这个自己给的写作奖励活动,他每天会给你送大约五百万的 token。 然后就是 api 密钥的创建,看下我们的 api 密钥管理,然后创建我们的 api 密钥, 然后名字都可以自己取,创建完成之后,这个 api 密钥的数字就是我们需要在前面 char studio 里面填的东西, 点开我们的模型管厂,然后这边我选择的是 c 的 二点零 pro 的 模型。选择好密钥之后,在右上角找到我们的 api 接入,选择我们刚刚创建的密钥,点击接入, 好像这样我们就已经是完成了。然后回到我们的 share studio, 让我们刚刚创建的密钥复制上去,打开我们的豆包模型,这样它就出现在我们打开列表里, 然后回到首页,点击添加助手,我们可以看到系统这边内置了非常多的提示词,助手我们可以根据自己的需求选择。然后这边呢我选的是市场经理做我们的演示动画,然后就是起用我们的豆包, 当然你要是有其他家的 ai api 的 话,也可以直接在这边选择。调用之后我们就完成我们配置,我们可以在这里面进行 skills 配置,很简单,直接从我们文件夹里面把它拖进来就直接可以安装好了, 并且你要是有比较标准的工作流的话,你可以在地导入本地的知识库,像这样也是很方便的,直接从文件中导入。 最后总结一下,如果你只是偶尔聊天,又玩一玩的豆包,当然是没有问题的,但如果你想更接近满血的豆包,想把它接入自己的工作流,那就可以用 tear 丢丢来调用豆包的 api。