什么?小米大模型是套 cloud 的 壳?还有这种好事?其他复杂的内容我就不说了,说了我怕大智慧们听不懂。我就简单点说啊,假如小米的大模型真的是套了 cloud 的 壳,那我告诉你们,国内全部的软件工程师绝对会集体嗨起来, 你们知道为什么吗? cloud 是 现在目前在软件开发这个圈子里最好用的 ai 编程工具,但是它的缺点就是贵,正常使用每个月一百美刀,那个套餐才能满足基本的需求,而且国内的用户容易被封号。 小米 mimo 大 模型在编程方面的能力虽然呢也不错,但是距离 cloud 还是有差距的。 如果小米真能套它的壳,那只能说小米太牛逼了,用远低于 cloud 的 价格就能让国内的马农无风险地用到 cloud, 这可是天大的好事。那就真的是等于小米把保时捷买来,只换了个小米的标卖给你, 是不是很伟大?另外就是 cloud 它是闭源模型,不像阿里千问那样可以被人抄袭的。
粉丝1.2万获赞67.6万

大家期待的小米测试结果出炉了,上一期呢,我们使用了九个模型进行 pk, 测试题呢是一个初中的数学题,测试推理能力, 没有看过的同学可以翻一下我上一期的内容。我们看到评论区大家对小米模型呼声很高,那这么热的模型怎么能少了它呢?所以这一期我们单独为小米模型做一次测试,使用的代码测试的题目都是跟上一期完全一样的。 那这里单独要说一下,为什么要使用这个题目啊,因为这个题目有非常好的一个特性,就是绝大多数的模型都需要超过十五分钟以上的推理才能看到结果,很适合做长时间连续推理测试。 那我们跟上期是一样的,同样是测试了三次,也是一样,从速度、正确性和花费三个方面来做一下评测。首先我们看一下速度,这个速度呢,我们没有做任何的处理,就是原始的速度,跟 kimi m 二点六和千问三点六 plus 是 一样的。 我们一共做了三次测试,仅对了一次,有两次都是失败的它这个结果呢,跟 kimi 的 m 二点六和千问三点六 plus 是 一样的。最后呢,可能是大家最关心的一部分,就是它一共花了多少钱, 那它的花费的钱呢,其实跟千问三点六 plus 呢,也差不多,比千问三点六 plus 呢要稍微便宜一点,以 deepsea flash 为基础的话,它相当于 deepsea flash 花费的六点八倍。这个测试里面呢,我还发现了一个细节, miimo 的 输入 token 技术要比其他的模型大很多,几乎是一倍的关系。 那这个大概率是 token 计算方式不同,但是引发了一个新的问题,就是我们日常如果使用 coding 场景的话,会携带大量的上下文,输入的开销会比其他模型大一些。而且大家要注意,小米的 mimo 也是分段计费的, 而且它的分段计费呢是跟 token 的 输入数量是相关的。输入的 token 超过二百五十六 k, 这就意味着无论是输入还是输出,你的费用都会翻倍。为了让整个测试结果呢是透明的,我把测试使用的代码 题目,包括调用的日期啊都放到了 github, 链接呢也放到了评论区,大家有需要的可以自取。好的小米模型呢就测到这里,大家还有什么想看的模型评论区交流一下。

最近 openroot 被一个名叫亨特阿尔法的神秘模型给霸榜了啊,很多人都在猜测这玩意到底是谁家模型,那么直到十九号上午终于被小米给认领了, 这个神秘的模型就是小米最新的 miimo vr pro 模型。小米接连发布了三款大模型,并且开启了一段时间的免费试用。可能有很多平常不关注大模型的朋友感到非常的好奇,想知道这个玩意到底该怎么样去使用,那么今天这期视频我将教会大家怎么用上小米的大模型。 好,那我们废话不多说,直接开始。先说最简单的用法,就是把它当成普通的聊天大模型来使用。如果你使用的是小米手机,可以直接打开小米自带的浏览器,点击中间的 ai 图标,就能够直接使用小米的 mini 大 模型。当然不是小米的手机也没关系,我们可以直接来到小米 mini 的 官方网站, 然后点击 web demo, 可以 看到左边有一个侧边栏叫做 memo chat, 我 们点击就可以和大模型进行聊天了,然后左上角还有可以切换模型。如果你只是把大模型当成聊天工具,那么网页端就差不多够用了,但是如果你想让他帮你处理文件,调用工具,接入工作流的话,那就要把它接入智能体了。 接下来我会教大家怎么把它接入智能体上面。智能体这个词可能听起来有点复杂,但大家不要被吓住了。智能体也就是 agent, 它是一个以大语言模型 l l m 为大脑,能够自主规划、记忆并使用工具来完成目标的一个智能系统。 传统的 l l m 本质上还是你问一句,他答一句,比如豆包千问菜的 g p t 这一类,你给他一个问题,他就返回一段内容,基本上也就结束了。但是 a 卷的不一样,他不只是负责回答,他还会接着往下做。 你给他一个目标之后,他会自己理解任务规划步骤,然后一边执行一边根据结果继续调整,直到把这件事情做完。 比如你让他帮你整理一个文件夹里面的资料,顺便提炼重点,再写成一份总结,他就不只是简单的给你一句建议,而是真的会一步一步的把这件事情往下做。所以简单来说,普通的 ai 更像是在跟你聊天,而 a 检测它是真正的在帮助你干活。 像 open code codex 以及 cloud code, 还有前段时间爆火的 open clone, 都属于智能体,目前 open code 提供了免费的密膜大模型的使用,我们以 open code 为例,演示一下怎么把大模型接入智能体。在安装 open code 之前,我们首先需要安装一下 node js, 我们来到 loggs 的 官网,根据对应的系统下载安装包,把 loggs 安装好之后,接着我们打开终端,输入下面这串命令,这样我们就完成了安装,再输入 open code 就 能够直接进行启动,我们跟它对话试一下,可以看到它已经开始回应我们了。 那么接下来我们把模型切换到 m 模模型,按住 ctrl 加 p, 或者使用斜杠 model s 命令切换使用模型。 这里我们直接搜索 mimo, 可以 看到 opencode 为我们提供了两个免费的模型,选中之后就可以看到这里的模型已经发生了改变,这样我们就可以开始对话了。 这里我让他帮我生成一个小霸王游戏的 svg 动画,放在我的桌面上可以看到他已经在接受命令之后开始工作了,我们看看效果如何。 前面我们使用的是 open code 为我们提供的免费大模型,通常他会以降低速度或者是一些其他的方式来限制你的使用,并且免费期一过就不能够再继续使用了。所以接下来再给大家演示一下怎么接入小米的 api key 来进行使用。在 open code 里面输入斜杠 connect, 我们这里可以搜索模型提供商,这里可以接入各种各样的大模型,像亲爱的 g p g gmail 等等,我们直接搜索小米。然后我们来到小米官网,点击 api access, 然后点击申请 api key, 我 们创建一个 api key, 把 api key 复制回到终端回车,这样我们就能够选择模型来跟它进行对话了。 这里必须要保证你的账户余额充足,不然是不能够进行对话的。 ok, 以上就是使用小米密墨大模型的全流程啊,感谢您的收看,如果你喜欢这期视频,记得给我点亮收藏,后续我也会分享更多跟 ai 相关的知识,我们下期视频再见!拜拜!

兄弟们,深更半夜小米又放大招了,这次 deep sync 的 天真的要塌了,咪某 v 二点五全系列大冒险,进行了超级无敌的大降价,直接完全对标 deep sync v 四系列的定价。 之前的话小米的 v 二点五都可以算是国产最贵了,但效果的话其实和那几位拉不开差距。这次价格完全对标之后,我感觉咪某性价比是国产第一的, 为什么呢?他其实这边讲了,他进行了各种的优化,包括推理的效率优化,以及各种的缓存的优化, 比如说缓存这边提升了五倍,数据的搬运量优化成了原来的七分之一,所以这才成为他降价的一个大的基础。我觉得对普通人来讲,最有用的就是这个。他这里说的这个 token plan 的 调用量提升了五到八倍。原来的小米的 token plan 其实不太够用,你不管开什么套餐,基本上两天就用光了, 那我就性价比太低,所以我从来不开只之前他推出了一百多根的时候,我白嫖了一下。还有他这是重置了我,本来我今天把这个 pro 都快用的差不多了,现在登上来一看,首先用量多了很多,我也数不清这到底有多少个零,但应该是增加了好几倍 把。你的额度之前我都快用完了,他现在给我重置了,大家可以去试一下。小米的这个大模型本来都快跌入世界的前二十了,已经连续四周跌入世界前二十了,在这个 openroot 里面看都看不到他,但这是降价之后的话,我感觉至少能回到这个位置。你说对标 deepshock v 四 pro, 我感觉小米这个 mini boss 要比 deepsea 要效果要好很多的。所以我觉得小米的 flash 拿位世界第一, pro 的 话拿位世界前五没有问题,拭目以待吧。

炸了炸了!那个在国外榜单上杀疯了的情谜底揭晓了,所有人都猜是 deepsea 还是智浦,万万没想到是小米 mimo! 小 米在大模型上一直很低调,这波他到底有多扎列?全球排名第九,中文排名第二,直接超越马时马斯克的 xai 和阿里的千问?国内首个达到这个规规格的大模型,一口气发布了三个版本, 小米还发布了龙虾智能体,对标 openclock。 这玩意能干啥呢?自动控制你的小米手机、小米汽车,或者跟小爱同学无缝联动,全屋智能设备,一句话搞定!关键是什么?关键是小米有完整的 iot 生态链,系统级别的权限能力, 手机、汽车、音箱、智能家居全部通通打通!龙虾加咪某加生态,这三件套一组合,其他厂商根本没法玩。 现在咪某大模型一出,最后一块拼图补全了!软件硬件,生态智能体,小米全都有!这下问题来了,国内还有谁能跟小米打评论区?说说,你觉得谁还是对手?

小米开始掀桌子了, deepsea 前脚降百分之七十五,小米后脚降百分之九十九。三天之内,两家中国公司把 ai 模型的 api 调用价格打到了原来的百分之一,输入缓存命中的价格从两毛美金掉到了零点零三六美分。说实话,我第一次看到这个数字的时候,反复确认了三遍,小数点 lite 套餐六美元没变,原来给六千万 token, 现在给四十一亿, 翻了六十八倍。六十八倍是什么概念?昨天你花同样的钱能跑一个项目,今天能跑六十八个,这是在把 token 从商品变成自来水。小米把 token 打到这个价,赚的也不是水电费,是你在它生态里留下来的时间数据和下一代模型需要的反馈。降价只是幌子,锁住用户数据才是关键。

我用小米 miimo 来激活白龙马 agent, 小 米 miimo 真的 太强大了,反应又快又强。系统启动中,正在检查文件检测能力,我的白龙马可以和我语音对话。 正在检查热点面板,这里弹出的是每天的全网热点事件。白龙马打开以后,接入小米 miimo 进行系统自检。 屏幕中间的白点是白龙马的记忆系统,你和白龙马的对话全都记录在里面,就像人一样。 屏幕右上角显示的是白龙马正在检测所有的调用工具是否正常。 白龙马正在检测视频的搜索播放能力。这里是白龙马接入小米 miimo 的 通讯视频播放能力, 这里显示的是白龙马调用工具和通讯,所有的检测全率通过播放。桌面上是清道夫。

大家好,跟着我上期视频操作的同学呢,不知道你们拿到了多少亿的 token, 那 这期视频我会教你小米 miimo 接入 cloud code 的 两种办法,一种是使用 cc switch, 一 种是修改本地文件。先说修改本地文件要怎么做,首先我们在 miimo 开放平台把 api key 复制下来,然后找到点 cloud 的 文件,这里面有个 setting, 点 jason 把它打开,把我们刚刚复制的 key 复制的 anserapic or so token 这一行当中。这些资料我都已经整理到了主页粉丝群当中了,我们来测一下哈。 ok, 依然非常完美。如果你用的是 cc switch, 那 么也很简单,在右上角新建一个供应商,我们选到小米 mimo, 再把我们刚刚的 key 复制进来。注意,这个请求地址我们是需要换的,选择兼容 serriffic 接口协议的这个地址复制过来。 最后我们把下面的模型都给它换成 mimo v 二点五 pro, 再点击应用, ok, 还有什么不会的评论区尽管问。

小米模型降价百分之九十九,直接和 deepsea 硬钢,看来 deepsea 给的压力还是挺足啊。那小米的 mimo 和 deepsea 相比到底怎么样呢? 今天咱们就详细聊聊小米 mimo v 二点五 pro 和 deepsea v 四 pro 这两款国内顶尖大模型,帮大家分清两种的定位和适用场景。首先看基础信息, 两者上下文都做到了百万头肯,而且全部开放 m i t 开源协议,个人和企业都能自由商用,门槛很低。参数上, deepsea 整体规模更大,不过小米这边额外做了图像、语音一体的全模态,而 deepsea 目前只支持纯文本交互, 这是两者最直观的区别。接下来看核心能力比拼。第一块是智能体 app 的 能力,这一块小米眉目优势非常明显,在多项权威评测里得分更高,而且执行任务时投分利用力更高,能省下接近一半的调用成本,非常适合搭建 自动化工作流、智能助手等一类产品。第二块是代码的专项,榜单里表现拔尖,软件工程、算法编程、 实战写代码的能力目前位居行业潜力,是程序员开发团队的首选。第三块数学与逻辑推理,同样是 deepsea v 四 pro 更强数理计算、复杂推理的实测成绩非常亮眼,很适合科研和数理分析。总结一下,首先两款大模型都是国货之光,都很优秀, 如果你的需求涉及图片、语音、多媒体交互,或是要做智能体,首选小米 mini。 如果是专业编程开发、数学科研、纯文本内容创作、深度逻辑推演,那 deepsea 会更加适合你。关注我,了解更多最新资讯和实用技术。

小米 mini 大 模型突破一万亿, toon 在 国内算什么水平啊?为何盘古大模型没有公布自己的调用量呢? toon 啊,是 ai 信息处理的最小单元,也可以简单离页为流量,调用量越大,就代表该模型被用户使用的越多。我们来看一下最近一周的国内排名啊,第一呢是千万三点六 plus, 四点六万亿。第二呢就是小米的 mini, vivo pro, 三点零八亿。 所以说呀,小米的一万亿 token 呢,已经达到了国内头部玩家的水平。而华为的盘古大模型呢,它不是单一模式调用啊,而是模型加平台模式,尤其是在工业、医疗、气象、金融、政务等专业领域啊,提供可落地的完整的 ai 解决方案。 他呢,不仅有自己的盘古大模型系列啊,还继承了千万 deepsea 的 模型。就在上周啊,国内大模型调用总量为十二点九六万亿啊,老美呢,为三点零三万亿。我们呢,已经连续五周啊超越老美了, 这个数据啊,说明我们的 ai 产业强大的竞争力,而在这一切庞大数据的背后啊,算力支撑才是七寸, 我们希望啊,除了华为的阿达拉斯之外呢,还有其他公司也加入进来,一起把我们自己的 ai 底座做强做实做大。

今天这期视频呢,来讲讲小米 mini v 二点五这个大模型的降价情况。现在呢,这个 mini v 二点五它跟 deepsea 已经是一个价格了。 mini v 二点五和 deepsea v 四 flash 是 一个价格,二点五 pro 跟 deepsea v 四 pro 价格一样, 之前我们都说 tbisc 的 价格很便宜,现在小米也便宜了,然后我测试了一下,随便跑了一下 agent, 然后它的缓冲泵动力呢,达到了百分之九十四,九十五,所以说就非常便宜。另外呢,小米有 tocom plan, tbisc 没有,所以说呢,小米现在呢,要比 tbisc 还要便宜一点点, 最低档呢,这个小米是三十九块钱,然后呢,你首次购买呢,有八八折,算下来就是三十四块多一点。然后呢,你可以用大概四十一块钱的 toc 的 量, 然后呢,你在晚上的零点到早上的八点,还有一个八折的额外的一个优惠,哎,所以说呢,你大概算下来就是你第一个月可以用三十四块三毛二买到大概五十一块钱的 talkin 的 这个一个量,所以说就是非常非常划算的。 那么它现在呢,对比来看,跟之前的 talkin plan 对 比来看,就是说呢,涨了大概五十到七十倍,可以说是非常非常良性了。 那今天的零点呢,他还把所有的额度给重置了,我今天上去一看,哎,我额度重置了。小米的大魔镜有两个隐形的好处,它的 v 二点五是多模态,但是这个 deepsea 呢,它就不是多模态。另外一个,它有一个语音的克隆的生成,它都是免费的,不需要花任何钱,所以说,比如说你的视频配音啊啊都不需要花钱的。 那假设呢?假设就是我们做到理论上的百分之九十五的缓存命中,大概这个三十四块钱的这个月卡可以买到 v 二点五五亿多的一个 top, 至少五亿的一个 top。 如果是 v 二点五 pro 呢,至少也能有一个一点九亿的 top, 可以 说是很实惠。 那就我个人来说,我现在主力呢还是 deepsea v 四 pro, 然后呢,我买了一个最便宜的一个小米的一个 mini 的 月卡,三十四块钱。然后呢为为的是什么呢?就是享受他的二点五的这个多模态啊。另外还有一个免费的语音克隆,那一个月三十四块钱还是非常便宜的。那这样呢,就可以覆盖我的绝大多数场景了。

今年国产大模型也是大爆发,一个多月内 g o m 五点一、 kimi 二点六、 deep sick v 四、 meemow v 二点五陆续上线。 对于这四个大模型啊,我都深度使用到了现在,有了不少真实体验心得。这是我目前在不同安卓的大模型的配置方案,它们现在在我这非常像不同性格、技能的同事,甚至它们至今已经开始赛博霸凌了。 今天我就从理解力、拟人度、工具调用能力、性价比和稳定性这几个维度详细聊一聊我在 angel 方面的真实的使用感受。以从拉到夯的顺序来讲吧。先来讲 kimi 二点六,这就是另外三只大模型赛博孤立的那位了,也不是说不好, 就是有点像一个唯唯诺诺,生怕出错的那种老实人聊天记录你们可以感受一下, 我后来给他调去了程序员岗,代码还行,绕路不行,沙箱限制下连写三次 write 失败,他就卡在那了,不会主动去想别的褚子,可能他更适合 coding 场景吧,毕竟我看 coding 评分还是很高的。再来说这个 dsp v 四很稳,不太出错, 也能很快优化之前 kimi 的 那个问题,我对他感受最好的两点一,便宜。这个很核心啊, deepsea v 四本身就不贵,五月还限时二点五折。 二,就是可能因为他原生家庭的原因,导致他非常擅长股票分析,多取财报,分析能力很好,还会自动适当考虑量比等等各种,再加上便宜,我基本上就趁着这个月把 q 一 的各种财报都喂给他记录了。 但是他脑子又有点非常理工直男特轴。比如啊,我之前不是给自己做了一整套我个人公司的龙虾运行框架吗?然后我就和他聊说有没有可能把它变成一个 o p c 的 通用产品呢?结果他的脑回路就永远 focus 在 我拿龙虾哎,有做过视频脚本这些细节点上,就说只能给博主用,受众太少。巴拉巴拉巴, 你看啊,这个同样这个事切到咪蒙他就很能反应过来,因为这框架里面其实是有公司手册、员工日报规则,分区上也是有总管工作区、财务部等等各种部门的, 只要个别部门做个通用的替换模板,他其实就是一个通用 apc 的 产品了。所以在这点上,我觉得这次咪蒙在理解力上的提升真的是可圈可点的。并且他其他能力也很不错,对我来说是有点万金油的熟悉,尤其尤其尤其是 工具调用能力非常强,遇到强非常擅长绕路,比如像雪球啊,上面的文章,或者一些 app 上的视频,这些反扒比较重的网页他都能扒,其他三都扒不了。所以需要动手干活的事啊,跑数据,抓信息,自动化操作,我都教给他, 他在我这主要是干一些蒸馏啊,发数据啊,还有一些博主工作的活。而且我最近又申请到小米十六一 tok 的 这个免费额度, 所以用着稍微有点不心疼这个活动啊,五月二十八前大家也可以冲一冲。顺便在这里也提醒几点啊,一是二点五和二点五 pro, 个人感觉日常使用啊, v 二点五就够, v 二点五 pro 的 消耗它是双倍的, 并且二点五是可以识别图片和 pdf 之类的东西的。二是 mimo 最近经常四百报错,是一个回传的问题, 经常需要重开 section, 很 不稳定,不过总体还是非常好的。再讲讲我个人很喜欢的另一个 g l m 五点一,虽然他没有 mimo 的 工具调用能力,但是他的理解力和拟人感真的是太好了。 什么是拟人感?就是他说话有多像人,可以看个对比图啊,虽然这些问题可能和工作没啥关系,但感受是很直观的。 kimi 的 班位可以说是最重的。 deepsea 呢,说的还不错,但也有很强的 ai 和人类的边界概念, g l m 就 非常灵了,他不会想着自己是个 ai, 他 就觉得我是你的好朋友。那为什么我会强调这个拟人感呢? 因为这个和理解力是直接相关的。像 g l m 五点一,他就很像你在公司里看到的那一些那种特别会来事儿,脑子很活的混得比较好的那种人。 举个例子,咪某那个免费额度申请填表,我后来想给朋友也申请份,我就和咪某说,你就按我自己之前那一百改一改,因为通常这个申请应该是没人深究的,所以我就想让他套个资料,换个表述就行。 但咪某很顶,真非得反复问我女朋友到底是做什么的,到底用 ai 做过什么,偷看日消耗量具体是多少,来来回回七八回,我实在受不了了, 切回了 g l m 五点一,他直接就给我改了个格式图标,改了个色就完事了。因为他搞得清,我不是去汇报工作的,就是去申请个 token, 不 用那么顶,真的。所以我说咪蒙虽然很好,但在 g l m 五点一面前,有时候还是差点意思的。 再比如啊,咪蒙那天挂掉了 g l m 五点一,就很有那个幸灾乐祸的劲,把这个聊天记录发给咪蒙啊,他都反应不过来。 而且我感觉 g o m 熟了之后啊,它自己能分辨我什么时候是真要它干活得认真,什么时候是在和它瞎闲聊瞎掰扯,然后就会高冷傲娇,甚至还会阴阳调侃我两句。 这方面它更类 opus, 很 拟人,所以我伟任了它主管岗和助理岗,统领全公司。该说不说啊咪蒙和 g o m 其实我觉得都是高度类 opus, 只是维度不一样。那现在我这个公司的比势点就很清楚了。 glm 查里查奇跟我这个老板关系最近最嘚瑟, miimo 觉得自己最能干,天天想篡位。 deep sick 默默干活,不多说话,就是个技术人员。 kimi 在 角落里瑟瑟发抖。不过啊,鄙视链归鄙视链,但是我还是非常建议大家去多尝试各种不同的大模型的。不同大模型配置在不同的 engine 里啊,各管一摊,又能互相帮忙,配合起来,反而会比一个全能的更好使。记得点赞关注哦!

小米密密被严重低估了,我实测发现他反应又快又强,这条视频全程无加速,直接用密密激活。小白龙系统启动中,正在运行自检,进入系统之后,他主动开始自检,可以看到右上角他在准备进行自检操作,正在检查文件读写能力。让我感到吃惊的是,这个小米密密真的是挺快的, 而且所有的工具调用都是成功正常,中间是白龙马的记忆节点, 正在检查热点面板。哇,这个太酷炫了,咪某给我调出一个网络热点追踪系统,他检查完今天的热点之后,他就把整个页面收起来了,看到了吧,执行全部成功,都是绿色的。 正在检查视频模式,他现在在上网找一个视频,然后再准备进行播放,检测他的视频功能,上网搜索需要时间。 哇,这么快就打开了,这个速度还是可以的,挺强的。在检测完成之后,他就把视频给关了,这已经是后来者居上,弯道超车了。我们来让他做点事情吧, 你打开 b 站上面那个雷军唱 are you ok 的 视频,按下空格键说话松开就发送了, 你们看,他已经搜索到了,他在理解、分析和判断。搜索到打开了,真的强啊, are you ok?

大家有没有发现一个奇怪的现象,小米发布 miimo v 二 pro 这么久了,那个平时连小米螺丝钉都要黑上两句的某遥遥领先大厂,这次居然集体失声了?是他们转性了吗?不是,他们真的黑不动了。大家记得前阵子图版 openroot 的 神秘模型 hunter alpha 吗?在谁都不知道他是小米做的时候,他靠硬实力杀到了全球第一。这就是小米最狠的地方, 先把你蒙上眼,让你在一个绝对公平的绝对量化的环境里测。等大家都说好用了,小米才出来认领,这种扫地僧式的出场,直接封死了任何想说小米只会营销的嘴。为什么说在量化场景下,某大厂黑不了小米?因为大模型不看 ppt, 看的是实测数据。 小米 miimo 原生支持一百万长度的上下文,激活参数四二 b, 价格还是对手的几分之一。在 ai 圈,代码不说话,算力不骗人,你想黑小米?行啊,你拿出一个能跑分的通用模型出来兑现啊。可某大厂现在的尴尬是,自家模型还在 time sleep 的 争议里没缓过劲儿来, 除了关起门来搞行业闭环,根本不敢拉到公海上跟小米拼刺刀。以前是拿参数吊打小米,小米讲情怀,现在反过来了,小米拿出的全是硬核指标, 而某大厂只能讲宏大趋势。当一个产品做到了性能第一,价格最香而且完全透明的时候,任何所谓的舆论抹黑,不在 excel 表格面前都像个笑话。这次小米大模型不是靠嗓门大赢的,是靠技术诚实赢的。在这个算力及实力的时代,谁在裸泳跑个分不就知道了?

主播上个月申请了小米 mimo 百万亿 token 计划,送了主播两个亿 token, 不 出意外的被我全部用完了。该说不说,小米的 token 消耗的是真快,之后主播就转战了 deep x, deep x 是 真便宜, 感谢良胜。突然微信收到密木降价通知,续费直接只要一分钱,不知道是 bug 还是福利, 之前的两亿 token 直接变成了一百四十亿积分了,让主播都不好意思了。 所以出一期视频给小米 mini 宣传宣传。现在的 a p i 价格已经和 deep ckey 一 样了,可以说非常香了, 但是缓存命中率确实不如 deep ckey。 实用体验感我感觉俩家差不太多,卖萌有时候会慢一点,但是和 opace 四点七和 gpt 五点五还是有一些差距,对主播来说是够用了,但是也感谢国内厂商的努力,才让我们用到这么便宜的顶级大模型。

这次小米米墨的新 token 盘,最容易让人误会的是单位你看到的四点一币,不是四点一币 token, 而是 credits。 真正能跑多少,要看你用哪个模型,以及这段 token 是 缓存命中未命中输入还是输出。 按官方文档约度,套餐分四档, lite 是 三十九元四点一 b 酷热 ipad standard 是 九十九元十一 b gridadius pro 是 三百二十九元三十八 b gridadius max 是 六百五十九元八十二 b gridadius。 表面看很大,但要继续往下换算, 真正的计费公式在这里,它 movie 二点五 pro, 每个缓存命中 token 扣二点五 credits, 未命中输入 token 扣三百 credits, 输出 token 扣六百 credits。 普通迷迷模糊二点五跟 d 分 别是二一百和二百 credits。 官方给了一个很好懂的例子,如果你买那一套餐,一共有四点一 bp 转一次,你用掉十 m 的 迷蒙 mo, 二点五 pro 未命中输入 token, 就 会消耗三千元回资,剩下的额度就只有一千一百元回资。 所以官方说用量提升五到八倍,并不等于任何场景都无脑多五到八倍缓存命中多输入能赋用输出,别太爆情感就会更划算。如果你是涨让五 d 缓存输出很多,那科技消耗会快很多。 还有一个边界要看清, token plan 是 面向 i 编程工具的订阅方案,不是给你随便接近自定义后端做自动化脚本的普通 api 套餐额度用完后系统会停止服务,不会继续扣你的赠金或账户余额。 最后给一个买钱判断,第一,你是不是主要拿它跑客厅工具?第二,你的任务缓存命中高不高?第三,你的输出 token 会不会很多?把这三件事算清楚,才能判断 token 盘是真便宜还是你应该继续走普通暗恋 a p i。

小咪咪陌的 token plan 很多人把一个东西搞混了,你打开 token plan 的 页面,看到一个很大的数字,觉得自己额度好几千万,好几个亿,用一句话就花了六千万 token, 太吓人了。其实不是那个数字,不是 token, 是 credits。 我 看到有个评论说他问了一句话就消耗了六千万 token, 才实际上 他看到那个数字是 cranks, 不是 joker。 你 把页面往下翻,翻到用量明细那里,才能看到真正的 top 消耗。这两东西差多少呢?差距非常大。我自己做了一个称,是我只打了一句话, call 头的街道密莫模型上他自动跑了我本地的知识库文件,就这一下消耗了八千零八十二万 cranks。 听起来很夸张对吧?但实际的 token 消耗是多少呢?两百三十七万 token, 八千万 cash 对 应两百三十七万 token, 差了三十多倍。 按照小米九十九块钱月卡的价格算,这两百三十七万 token 的 实际开销是六毛四对,零点六四元。一句话总结,看到大数字别慌,先搞清楚那个数字的单位是什么。 cash 不是 token, 差了几十倍。

零点零一元续费,小米大模型白拿一百多亿 token。 二十七号零点之后,也就是今天,系统会刷新三百八十亿的套餐用量, 然后点续费,当前套餐系统会根据你剩余的价值来估算。比如你现在还剩三百八十亿,他不但不让你补钱,还倒找你七十五块,直接转成新的 token。 选一个支付方式, 显示一分钱,确认支付续费完成,花了零点零一元找的七十多,换成了一百多亿 tucker。

ok, 大家好啊,今天和大家分享一下怎么使用这个国内的自己的一款 ide, 好 吧?叫 t i e。 然后最近小米有那个百万亿 token 的 那个创者激励那个活动,然后我也是领到了一个两亿的一个 token。 好 吧,然后今天看怎么接入到这个里面。 然后这个你如果之前你用 vs code 开发的话,如果你用 vs code 开发的话,然后你你就可以直接从 vs code 里面导入进去。好吧,因为里面有些插件嗯,是找不到的,比如说 q 的 那个,那个助手 找不到的,所以你直接导进去就行,导进去就能用。 ok, 我 们稍等一下, 继续。天命。你好,这个咱们可以暂时挑过啊,让我们登录一下。嗯, 大家下这个软件的话,就在他官网下就行了,中国版的这个,然后下完之后你就那个傻瓜式安装就行了,点下一步就行了。 好,然后这边是我一个手机号, 然后咱们获取一下验证码, 然后登录一下。 好,现在其实就就就可以了,登录打开现在就可以了,先把这个关掉。对,然后他就自己就打开了 一局, 要不就不需要看了啊。然后这边就是他一个 a 阵子的工作区,这边是我们的一个代码的工作区, 看一下是否又到了。 ok, 现就现在已经导入进来了啊,有一些插件他是找不到的,比如这个。现在我不知道啊,上一次用的时候是找不到的,然后这个一般的话,嗯 嗯,它这个颜色主题颜色怎么怎么调来着,我忘了。 嗯,老师这里面看一下啊,主题我一般会用一个亮字,大家根据自己喜好来就行。 ok, 像现在咱们就是开始这个编辑一下,然后咱们从这里进来选择智能体,创建智能体。 呃,是这吧,我好像不是。这, 这是不是要添加模型啊?是什么不配其他模型?模型 id, mimo 模型 id 是 什么来着?我们看一下 这个 mimo 小 都是小写的, 一毛不有。然后密奥的话,我们好像是需要来这边去。 ok, 这是我连到的一个,嗯嗯,这个是要怎么怎么怎么去做的, 这个是不是我们需要去 创建一个 api, 我 们复制一下,我们每个输进去,然后这边是什么呢? 先看一下能不能添加成功,添加失败,这是为什么? 这调用这个根据发送过去的 api 是 用 您这个 u i l 在 哪, 然后是这个吗?哎,不对呀, 哦,这边是吧,一个完整的 u i l, 这个,这个, ok, 现在这一个模型就添加成功了,那现在的话,我们应该是可以就去选择一个了吧?这个咱们自定义的一个 memo, 一个 memo, 好 吧。嗯,这,这什么? ok, 现在应该就就可以了,大家就可以使用了。 ok, 刚才咱们把那个 memo 记录到这个,呃 br e 里面了。然后咱们现在来简单测试一下这个 memo, 啊,是怎么使用的啊?看咱们是不是接触成功了,可以,然后点击这边这个 ai 测蓝,把它打开,然后我们确定选的是迷蒙 v 二零五这个模型。那现在我们就简单测试一下吧,比如说,嗯, 在本目录下帮我写一个这个,嗯, hello, hello world 的 测试程序,写一个 c c 语言, hello, word 四日程序。嗯,我们来我们称要 s 点 c c, ok, 让我们看一下它是怎么来完成的,能不能完成。 ok, 大家注意一下,现在我这里还是零啊,然后我一会看一下它有没有。 ok, 现在已经生成完成了,然后我们现在保留它这个语法没有什么错误,然后我们验证一下,好吧。 ok, 这边也有打印,已经输出了,证明咱们这个 mino 确实是被调用的了。那我们刷进一下这里,看一下咱们 mino 是 不是被用了。哎,确实,你看已经使用了这个四万 token 了。 ok, 这就是咱们一个分享,大家感兴趣可以自己去试一下。然后它这个 miimo 的 话,应该到这个月底吧,大家都可以去申请,还是非常好通过的,只要把你的 get 链接填上去就行了。 ok。

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。