最近看到很多人说小米的大模型还有 deepsea 大 模型很贵,打个你好就要花不少钱。但我不是这样的,我某天用 deepsea 跑了,一点一,一个 token 花费十三点二三元,算下来,每百万 token 只要零点一一九元。 还有一次用小米的大模型花了三千五百万 token, 按照小米米某月卡最低档三十四块多的价格来算,这三千五百万 token 花费四点八元,每百万 token 零点一三七元,确实是大降价。 我花一分钟把这个事说清楚。 ai 大 魔仙收钱,分三块,缓存位命中、输出,缓存命中。你第一次发一段内容给 ai, 他 得从头读一遍,完整算一次。这个过程叫缓存位命中,价格是三块钱,每百万投坑。但同一段内容你再发第二次,第三次的时候,系统发现你发的东西和之前一模一样,他就不重新算了,直接从缓存里调,结果这个过程叫缓存命中。 缓存命中的价格是多少?零点零二五,差了一百二十倍。所以那些说打个你好就花了多少钱的人,测试的是什么场景? 第一次到 a p i 发一句你好, ai 回复全程缓存未命中,这当然很贵。简单来说就是你让 ai 听一本书, ai 第一次读会花不少钱,因为这对 ai 来说是新内容,每百万头啃三块钱。但之后再让 ai 根据这本书的内容和你交流,就是旧内容了,每百万头啃零点零二五元。现在你明白了吗?打个你好测试花了多少钱没有意义。
粉丝60获赞980

小米的这个七个亿的 toc 已经到账了啊,这个是小米最近推出的百万亿 toc 创造者激励计划,这个普通人也可以申请啊,你只要是按照他这个要求去填写一些相关的信息就可以了。我这个审核的就半天时间他就通过了,然后他就给你发了个邮件, 这个是昨天下午三点发的啊,然后今天上午就到账了。这七个亿 toc 你 如果单独订阅的话,相当于 五十美金一个月的,这个额度啊,足够使用了。小米最新出这个 mini v 二 pro, 这个模型还不错啊,在这个权威榜的 rfc 上排名也比较靠前啊, 它是在国产跟 kimi k 二点六并列第一对吧?五十四分,你看第一的这个 gpt 五点五也就六十分,差距也不是特别大。当然我现在还没有正式开始用,我一般是用在这个 hms 里面,帮我推送一些这个 x 上的一些最新的信息,接下来评测的最新结果我也会给大家跟进一下。 这波雷总还是非常大气的,咱也不能差事,对吧?专门给他拍一条视频,支持一下小米迷谋,加油!

我找到了一个免费使用 cloud code 的 办法,不需要自行购买,墨星厂商的扣丁 plan 也可以使用。今天分享给大家,我刚刚成功领取到了小米赠送的七亿 token, 够我使用一段时间了。 看完这个视频,你也可以领取并进入到 cloud code 之中。这就是小米最近推出的创造者百亿 token 激励计划。我们只需要填写五道题目就可以免费申请领取。 我们申请这个活动只需要下面两步,第一步,打开活动官网,然后填写页面中的问题。前三道题随便填写,但真正卡人的就是第四题。 因为很多小白不知道如何使用 agent 或者 ai 构建项目,但没关系,我已经将我成功申请使用的项目描述可进入到 cloud code 的 详细步骤,写入到了文档之中想要的评论区留言。 我们在完成题目提交申请之后,我们就只需要等待审核。审核通过之后,我们会收到小米官方的邮件,邮件中会包含开放平台的地址。我们进入到开放平台,首先需要进行登录,如果你还没有注册过小米账号,可以先使用手机号进行注册。注册完成之后,你也可以使用手机号进行登录。 登录完成之后,我们可以点击右上角的头像,选中个人中心,然后再绑定我们申请使用到的邮箱。绑定完成之后,我们再点击控制台,然后再点击左侧的订阅管理, 我们就能看到我们领取的 token plan。 在 这里我们可以申请 token plan 的 专属 api key。 下面就是将我们领取到的 token plan。 通过 cc switch 接入到 cloud code 之中,我们需要打开 cc switch, 然后点击加号添加一个新的模型供应商。在这里我们选择小米 miimo, 选中之后我们向下滑,然后将上面申请到的 api key 填写在这里。注意这个请求地址需要改成这个,因为这是 token plan 的 专属请求地址,具体的地址我已经放在文档中了。下面的模型最好也贴换成小米最新的 mimo v 二点五 pro 模型。 配置完成之后,我们点击保存就可以了。添加完成之后,我们点击骑用小米 mimo 的 配置就可以了。 我们可以打开终端,启动 cloud, 然后检查我们的配置是否生效。 token 我 们已经成功领取到了, cloud code 也接通了。如果你想知道如何使用 cloud code 实战,麻烦点个关注,我们下期开始讲解实战内容。

零点零一元续费,小米大模型白拿一百多亿 token。 二十七号零点之后,也就是今天,系统会刷新三百八十亿的套餐用量, 然后点续费,当前套餐系统会根据你剩余的价值来估算。比如你现在还剩三百八十亿,他不但不让你补钱,还倒找你七十五块,直接转成新的 token。 选一个支付方式, 显示一分钱,确认支付续费完成,花了零点零一元找的七十多,换成了一百多亿 tucker。

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

今天凌晨呢,小米旗下的大模型 miimo v two pro 宣布降价,说法是最高降幅百分之九十九,但实际情况呢,是和 deepsea v 四 pro 的 价格是完全一样。而 miimo 的 v 二点五,它的所谓的 flash 模型跟 deepsea v 四 flash 呢,价格也是几乎完全一样。 这个价格呢,基本上已经属于跌到脚踝了,因为 deepsea 在 周末刚宣布把它的 v 四 pro 模型呢,原本限是二点五折的优惠的永久化,这种地板价的价格呢,以我们自己的附属的, 呃,接下来看呢,基本上只是电费和一些运营费用。那 dips 为什么价格能降那么低呢?也是因为它做了一系列优化,比如说 m o e 架构,比如说 k v k 式压缩,比如说投机解码和多头痕的预测, 包括缓存的复用量化和低精度的部署。这些呢,我在前面几期的视频号上都分享过。当然呢,即使把这些都做完之后,也没法做到现在的报价。所以呢,更可能的原因是 dips 呢,已经通过 公司二方科技提供了硬件的自主权,就拥有了所有的 g p u, 所以呢,已经作为沉没成本,而他只是要覆盖他的运营成本,就是电力和运营费用而已。那 d p c 的 长期逻辑是 agm, 所以 他把价格压到这么低的核心的目标是把电容量做起来,能成为全球使用量最高的模型公司之一。目前从 oppo rata 的 收益来看,确实也是这么 回事。小米呢,可能是更加激进一点,因为小米的核心的利润并不来自于大模型,而模型呢,又是他在二手市场上讲故事的很重要的支点,所以呢,他愿意以不盈利的方式持续亏损作为战略性投入 来获取时长的声浪。同时呢,因为他在生产店中的站位,未来的手机、汽车、 iot 机器人这些终端都需要低成本的模型,与其采用别人家的,不如用自己的模型。所以呢,虽然两家的降价逻辑并不相同,但是结果指向了同一价格, deepsea 先动,小米 mimo 贴身跟上。问题在于,这个价格一旦被这两家公司同时铆定,就很难再往上走了。所以呢,结论就是,那些能力不如 open ai and fava, 价格又打不过 deepsea, mimo 的 中间场上可能会率先被挤压出海桌,国内资源大冒险的大厂以及模型创业公司,迟早都要被拉出来表个态,到底是否跟进? 而这个价格战呢,目前还没有波及到市场。另外一端就是预参加 g p t cloud 和 jimmy, 原因呢,是市场正在分层,对于价格敏感的开发者跟中小企业,会被 deepsea 跟 mmo 低价带走。但是对合规性多模态能力,包括编程能力有特定需求,大客户 暂时可能还会留在国家区间,但是这个用户呢,其实比较有限,而且呢,集中在欧美国家和发达国家。所以接下来呢,大模型市场可能会分成两个阵营,一端是集低价的基础设施层,负责提供便宜稳定可 规模的头肯。另一端是高溢价偏能力层,继续卖最强推、最强 a 阵、最强多模态和企业级安全能力。而两端都够不着的场上既没有成本优势,又没有能力避雷,大概率就是人出局 了,而即使是短期油箱的分层,随着模型技术能力的提升,低价格的模型并表示能力回差,反而呢,可能会不断的升级,不断侵蚀所谓的高溢价高能力的模型。所以呢,未来的市场份额一定会被低价甚至免费的模型占住,而所有的其他模型会竞争的百分之十的最复杂的应用场景。

小米开始掀桌子了, deepsea 前脚降百分之七十五,小米后脚降百分之九十九。三天之内,两家中国公司把 ai 模型的 api 调用价格打到了原来的百分之一,输入缓存命中的价格从两毛美金掉到了零点零三六美分。说实话,我第一次看到这个数字的时候,反复确认了三遍,小数点 lite 套餐六美元没变,原来给六千万 token, 现在给四十一亿, 翻了六十八倍。六十八倍是什么概念?昨天你花同样的钱能跑一个项目,今天能跑六十八个,这是在把 token 从商品变成自来水。小米把 token 打到这个价,赚的也不是水电费,是你在它生态里留下来的时间数据和下一代模型需要的反馈。降价只是幌子,锁住用户数据才是关键。

今天这期视频呢,来讲讲小米 mini v 二点五这个大模型的降价情况。现在呢,这个 mini v 二点五它跟 deepsea 已经是一个价格了。 mini v 二点五和 deepsea v 四 flash 是 一个价格,二点五 pro 跟 deepsea v 四 pro 价格一样, 之前我们都说 tbisc 的 价格很便宜,现在小米也便宜了,然后我测试了一下,随便跑了一下 agent, 然后它的缓冲泵动力呢,达到了百分之九十四,九十五,所以说就非常便宜。另外呢,小米有 tocom plan, tbisc 没有,所以说呢,小米现在呢,要比 tbisc 还要便宜一点点, 最低档呢,这个小米是三十九块钱,然后呢,你首次购买呢,有八八折,算下来就是三十四块多一点。然后呢,你可以用大概四十一块钱的 toc 的 量, 然后呢,你在晚上的零点到早上的八点,还有一个八折的额外的一个优惠,哎,所以说呢,你大概算下来就是你第一个月可以用三十四块三毛二买到大概五十一块钱的 talkin 的 这个一个量,所以说就是非常非常划算的。 那么它现在呢,对比来看,跟之前的 talkin plan 对 比来看,就是说呢,涨了大概五十到七十倍,可以说是非常非常良性了。 那今天的零点呢,他还把所有的额度给重置了,我今天上去一看,哎,我额度重置了。小米的大魔镜有两个隐形的好处,它的 v 二点五是多模态,但是这个 deepsea 呢,它就不是多模态。另外一个,它有一个语音的克隆的生成,它都是免费的,不需要花任何钱,所以说,比如说你的视频配音啊啊都不需要花钱的。 那假设呢?假设就是我们做到理论上的百分之九十五的缓存命中,大概这个三十四块钱的这个月卡可以买到 v 二点五五亿多的一个 top, 至少五亿的一个 top。 如果是 v 二点五 pro 呢,至少也能有一个一点九亿的 top, 可以 说是很实惠。 那就我个人来说,我现在主力呢还是 deepsea v 四 pro, 然后呢,我买了一个最便宜的一个小米的一个 mini 的 月卡,三十四块钱。然后呢为为的是什么呢?就是享受他的二点五的这个多模态啊。另外还有一个免费的语音克隆,那一个月三十四块钱还是非常便宜的。那这样呢,就可以覆盖我的绝大多数场景了。

小米模型降价百分之九十九,直接和 deepsea 硬钢,看来 deepsea 给的压力还是挺足啊。那小米的 mimo 和 deepsea 相比到底怎么样呢? 今天咱们就详细聊聊小米 mimo v 二点五 pro 和 deepsea v 四 pro 这两款国内顶尖大模型,帮大家分清两种的定位和适用场景。首先看基础信息, 两者上下文都做到了百万头肯,而且全部开放 m i t 开源协议,个人和企业都能自由商用,门槛很低。参数上, deepsea 整体规模更大,不过小米这边额外做了图像、语音一体的全模态,而 deepsea 目前只支持纯文本交互, 这是两者最直观的区别。接下来看核心能力比拼。第一块是智能体 app 的 能力,这一块小米眉目优势非常明显,在多项权威评测里得分更高,而且执行任务时投分利用力更高,能省下接近一半的调用成本,非常适合搭建 自动化工作流、智能助手等一类产品。第二块是代码的专项,榜单里表现拔尖,软件工程、算法编程、 实战写代码的能力目前位居行业潜力,是程序员开发团队的首选。第三块数学与逻辑推理,同样是 deepsea v 四 pro 更强数理计算、复杂推理的实测成绩非常亮眼,很适合科研和数理分析。总结一下,首先两款大模型都是国货之光,都很优秀, 如果你的需求涉及图片、语音、多媒体交互,或是要做智能体,首选小米 mini。 如果是专业编程开发、数学科研、纯文本内容创作、深度逻辑推演,那 deepsea 会更加适合你。关注我,了解更多最新资讯和实用技术。

我找到了一个免费使用 cloud code 的 办法,不需要购买模型,厂商的 coding plan 也可以使用。今天分享给大家,我刚刚成功领取到了小米赠送的 talking 余额,够用一段时间了。看完这个视频,你也可以领取并接入到 cloud code 之中。 这个就是小米推出的创造者百亿 token 激励计划。链接我已放入评论区,只需要五步就可以免费申请领取。首先我们点击立即申请前三项,按照我们的实际情况进行,填写 你的邮箱常用的开发工具。然后目前使用的底层模型。第四项和第五项是需要我们重点填写的。第四项,我们可以将我们的日常项目进行包装,利用 ai 进行润色描述, agent 或者 ai 驱动的具体成果 写的越丰富,通过率也就越高。第五项,可以上传我们 ai 平台的账单截图,还有终端运行日记等, 这个最多支持五个文件,可以上传图片或者是录屏都可以。在最后可以覆盖我们 github 的 演示地址。 点击提交,系统会在三个工作日内提交评估结果,之后会收到这样的一个小米 miimo 创造者激励计划。然后我们在这里点击开放平台地址, 我们点击控制台,这样平台送给我们的余额已经到账。我们选择 api case, 新建 api case, 填写 api k 名称,选择比较好记忆的名称,点击确认即可,这时会弹出一个 k, 它只会显示一次,我们要把它提前复制好。接下来我们使用 cc switch, 我们在添加中添加新供应商。以下是 cloud 供应商,我们选择小米米某。需要注意的是,供应商名称官网链接已经填写就绪,我们只需要在这里粘贴我们刚才复制好的 api k 即可。 我们要注意是否请求地址与以上保持一致。还要注意的是目前主流模型有 v 二 pro, 如果想体验小米最新模型,我们可以把这里换成 v 二点五 pro, 点击添加, 这样即可生成。我们点击旁边的这个按钮,点击起用。我们在终端输入 cloud, 这样我们就会发现 mini v 二 pro 已经被我们正常使用了。以上就是全部内容,如果有什么问题,我们可以在评论区沟通,我们下集再见。

小咪咪陌的 token plan 很多人把一个东西搞混了,你打开 token plan 的 页面,看到一个很大的数字,觉得自己额度好几千万,好几个亿,用一句话就花了六千万 token, 太吓人了。其实不是那个数字,不是 token, 是 credits。 我 看到有个评论说他问了一句话就消耗了六千万 token, 才实际上 他看到那个数字是 cranks, 不是 joker。 你 把页面往下翻,翻到用量明细那里,才能看到真正的 top 消耗。这两东西差多少呢?差距非常大。我自己做了一个称,是我只打了一句话, call 头的街道密莫模型上他自动跑了我本地的知识库文件,就这一下消耗了八千零八十二万 cranks。 听起来很夸张对吧?但实际的 token 消耗是多少呢?两百三十七万 token, 八千万 cash 对 应两百三十七万 token, 差了三十多倍。 按照小米九十九块钱月卡的价格算,这两百三十七万 token 的 实际开销是六毛四对,零点六四元。一句话总结,看到大数字别慌,先搞清楚那个数字的单位是什么。 cash 不是 token, 差了几十倍。

直接应粉丝要求讲一下克里普拉应该怎么去选。先说结论,目前是小米的米某,首先需要明确一点,就是这个东西的实用性非常强,所以说最好你能自己学会怎么去选。现在是五月三十号,如果说你一个月之后再看这个视频,用的就只能是思路了,不要直接抄作业。 我们之前有一节讲过模型怎么选,这个选 callenplan, 或者说 callenplan 的 前提就是选模型。今天我们再次抄一遍,因为短短两个星期,实际上选择的方案就已经完全不同了,国内和国外都有新的选项出现。首先我们还是打开我们的 open source, 第一步看用量,大家都用了,基本上不会太出错, 我们直接打开这个用量的一个排行榜,这里实际上需要注意的是飙升的,首先是咱们国内的小米 mini, 五 v 二零五的这个 pro 飙升百分之四百七十五,现在这个时间节点,如果你问我只能选一个 call 零 plan, 那 你选什么?那当前时间节点我会直接告诉你,就是这个小米的 mini。 还有一个飙升的模型是这个 gimli 的 三零五 flash, 也是飙升了百分之三百六十多。看完用量的话,我们要打开我们的第二网页, 这个网页之前也已经讲过了 design arena, 它这个的话是一个模型评测的一个方法论,简而言之就是 ai 的 一个逗乐场。然后让咱们人类来投票进行一个排名, 我们直接点开这个排行榜,代码分类上展开,正常情况下我们直接看这个喜爱排名与价格这个图就行了, 这里有个观念,就是这个 mimo 的 这个,嗯,价格它还没有更新,更新的话这个图会显得非常漂亮。还有个问题的话是这个图它是用 e l o 去发的,对于新模型的对单次数不多的情况下还不太友好, e l o 大家懂的都懂,我们到下面看一下, 这边先看这个 e l o 的 排名吧, l o 的 几个排在上面,然后是我们看的 kimi, kimi 的 这个 k 二点六,实际上在前一段时间还是国产的第一名,但是现在有了新的变化。接下来的话就是这个智步的 glm 五点一,它是现在当前时间节点国产的第一名, 可以看到这个胜率的话是比这个 kimi 二点六呃高了将近五个百分点,然后因为它的这个对战场次还不多,它的这个呃误差范围是有个上下呃一点三左右,然后就算它减掉这个一点三,然后这个 kimi 二点六加上这个零点八,它还是要比 kimi 二点六要强的了, 目前国产当之无愧的利益了已经是它的。问题是这个智普的这个 koopa 买不到,并且还贵, 然后再往下看,就看到我们这一期推荐的这个 mini 了,小米的这个二点五 pro 和这个二点五完全不是一个东西, 建议只用这个二点五 pro 可以 看到这个二点五打了这个一万多场,胜率维持在呃百分之五十四点八,这个其实有点拉了,但是它的这个 pro 三千多场的话,就这个胜率就干到这个六十一点八,这个胜率实际上是非常不错的,那我们还是直接按这个胜率排名吧, 我们按生育排名的话,可以看到这个第二名突然多出来一个这个 gmail 的 三 pro pro, 这个东西就是我们说的这个内外模型都有变化,之前谷歌动态的场景还行,但是编码场景一下掉队太久了,这次又追上来了。再往下看的话就是我们国产的第一 em 五点 e, 然后是 mini 的 v 二点五 pro 和这个千万三的一个四百二 b 的 一个模型,可以看到 kimi 的 这个 k 二点六已经跌落神坛了,等待下一波吧。这个模型的话,其实就是一个你追我赶的过程, 往下看一看,然后是我们的这个 deepsea v 四的一个 pro, 这个 g p d 五点五属实是有点拉了,等这个五点六吧,应该是下个月会发。 然后看到了我们的这个 mini max 的 一个二点五,都说这个 mini max 是 国产最垃圾的,这个毫无争论,但是那实想说的是,二点七和我二点五是没有关系的,我们看看这个 mini max 的 二点七在哪里哦,在这里 这个东西比 mimo 二点五还要拉,甚至比它自己的这个二点一还要拉。之前选型那节我们就已经讲过了,这个二点五在编码场景下是大于二点七的,我不知道为了什么,这些东西升级的时候都是直面实力,看上去这个智力排名提高了,实际干活就拉了。 最经典的就是这个 closed opus 的 这个四点七和这个四点六比起来就是一坨,所以大家用的时候一定注意,不是最新的模型就是最好的,最新的可能跑分涨,智力高了,但是真是干活落了,因为为了更高的智力分,显然内画的重点就不在编码场景,或者说非常有精益。 ok, 这个模型的胜率我们就看到这里,因为这个网站呢,这个价格更新的不紧,而且是用这个 elo 画的这个三点图,我们想要这个胜率,我就用这个当前最新的价格和胜率画了一个图。 可以看到这个线上最夸张的就是这个 mimo v 二点五的这个 pro, 它比这个 oppo 四点六便宜了二十多倍,看这张图,它的这个性价比实际上已经拉爆了。讲一下为什么这么夸张啊,就是这个 mimo 这个二点五系列的一个调价公告,在这个五月二十七发了一个,这个降价幅度还是有点夸张的, 数据上反正看上去是无敌了,但是需要注意的是它这个未命中缓存的一个情况,这个未命中缓存的这个输入和这个缓存命中的输入差价是一百二倍,这个现在这些网站统计这个混合百万 token 的 时候,是拿这个输出输出加权算了,没法考虑到这个未命中输入倍率的问题。然后还有一个是这个未命中率的问题, 所以说这个地方实际上还是会有点要注意的。我们的这个散点图的这个数据来源来源于这个 adc 四 g 广的也是一个比较权威的 啊。作为我们 k 零 pro 的 一个选择方案,第一还是看钱包厚度,如果说你只要最好不看价格,那还是可 low 的, 不过现在可以以便宜一倍的价格买到只差一点点的 g 三的一个 pro。 还有一个点是我们已经讲过了的,就是假如你真的要省钱,应该是要买两个 k 零款,一个贵但是能空间,一个便宜但是量大 可乐的套餐。还有个问题是它只能接自己的生态,我们实际干活的时候使用这个 oppo 的 也是有原因,我们需要同时用多个提供商的模型,那种聚合的提供商要么提供不了最新的模型,要么就是给不到合适的价格,中转站更是不要碰。也是那个缓存的问题,这个成本你算不明白的。 说到这个成本问题,其实我们要比的还不是价格,是成本。说到之前我就已经讲过了,价格不等于成本,但是这个成本我们自己很难算明白,主要是两个模型比第二个价格要贵十倍,实际上的话成本就是一样的。 还有这个缓存的问题,拿这个 me 某来举例,缓存和不缓存这个价格差了一百二十倍,假如它的缓存命中做的不好,那么其实数据上看是无敌了,便宜也是真便宜了,就是没有那么夸张,还有个缓存等着你呢。然后我们成本分期的话,也可以参考这个网站, 可以看一下 mini 在 哪个位置,然后这个是 mini max ibisc 这面还是比较贵的,它这个不全,因为算这个成本,它是跑一系列的评测就算了,所以说的话它只会跑部分热门的模型。 这边有一个问题啊,就是他们模型提供商会为了提高智力评级降低这个编码能力的,最经典的就是这个呃, mini max 的 一个二点七,我们直接看这个智力与成本,可以看到这个 mini max 的 这个二点七是在这个绿色空间,然后在这个位置我们找一下它的二点五在哪里, 好没有?我们压一下 可以看到出来了。然后在这个地方 他的这个怎么说呢?他的这个智力上,实际上从跑分上来看是提高了。看一下他这个跑分的逻辑啊,他这个东西,呃,实际上是有一系列的评测的一个数据库,一系列的评测标准 啊。就这里他会让各个模型去跑这些的这里面的任务,然后去把这个花费算出来, 算出来了之后基于这个花的这个 top 数量,然后和这个得分的这个成果去做了一个这个智力和花费的这个三点多。但是我不知道这个东西是不是有知识库污染问题啊?比如说这个模型,新一代模型都学习过他的这些知识库了,那现象上看是这个智能指数的评分高了,但是高分低能。 所以说真正算成本的话,其实要用这个网站去算,就是需要他们去记录这个对账的 top 用量,然后来算成本。逻辑上来讲的话可以解决,但是目前没有,所以说只能我们自己来选。 我们其实还可以去参考这个 open go 的 套餐啊,就是我们虽然自己有可能算不明白这个账,因为国内有的是按四收费嘛,比如说那个 mini max, 它的是五小时团购期,然后有的是按这种 top 用量,还有的发明了新的计量单位啊,我们其实自己算明白,我们可以看这种,嗯, 比如说这个 open code, 它的话实际上它自己有个固定的价格,然后它会绑一些模型在上面,然后它会把这个模型每五小时你能请求的这个数量大概的帮你算算 啊,我们自己算不明白,但是这种聚合提供商实际上它能算明白,我们只要大概的参考它的这种表格,我们能心里大概知道每个模型的这个比例在哪个地方,然后我们就能反过来去买我们的这个 code 啊。 最后的结论是当前时间节点,如果说你只选一个蔻灵 pro 的 话,那么国内就是这个小米,但是更建议大家选俩一强一弱互补,弱的话就是这个 deepsafe mini max 里面去选强的话,现在建议就是这个 m 二点五的一个 pro 或者这个 dm 五点一,要么就选这个性价比大满的,要么就选最强的。 ok, 这节就到这里汇报一下这个后续的一个计划。首先是我自己会继续更新实战相关的视频,该阶段应该是实战相关的,然后很多小白想学习的这个呼声也比较高,这种需要从零开始讲概念的扫盲类的视频,我就直接用 ai 开始做了。

ai 圈在先,降价风暴小米正式宣布密某 v 二点五系列 api 永久降价,最高降幅达到百分之九十九,取消复杂的上下文差别定价,统一计费。同时 token 套餐加量不加价额度直接翻五至八倍,在校用户全额重置额度。 靠着滑动窗口注意力缓存扩容和集群优化三大底层技术硬降成本, tds 还限时免费开发者落地, ai 成本直接砍到底。

dpc 刚把价格打到地板,小米直接砸穿了地心。五月二十七日,小米 mini v 二点五系列 api 永久降价,最高降幅百分之九十九,输入缓存命中最低只要两分钱,每百万托更 说出最低两块钱什么概念。以前跑一个 ai 项目可能要花几千块,现在几十块钱就够了。雷军凌晨亲自发文,欢迎更多开发者进入。从二五折到一百分之一,国产大模型正在变成水电煤独立开发者的黄金时代真的来了。

先说结论,小米 miimo 确实降价了,而且降的不少,但降幅百分之九十九这个说法,咱们得打个问号,因为没人知道它原来到底卖多少钱。 credit 是 怎么回事? 小米搞了个中间层,叫 credit, 你 先买套餐,比如三十九元,一个月给你六千万个 credit, 然后用的时候按 credit 扣。降价之前, pro 模型要扣两个 credit, 长文本甚至要扣四个。 降价之后,小米说取消了四倍 credit 的 计费方式,但具体 pro 模型现在是扣一个还是两个,官方没说清楚, 直接看价格更实在。小米公布了 token 价格,输入缓存命中零点零二五元每百万 token 输入缓存为命中三元每百万, token 输出六元每百万 token 输入只要两分五厘钱就能买一百万个 token。 和 deep seek 比怎么样?巧了, deep seek v 四 pro 的 价格完全一样。小米这是明摆着对标 deep seek, 价格完全对齐, 那到底降了多少?小米说最高降幅百分之九十九,如果这是真的,那原来 pro 模型的输出价格应该是六百元每百万 to 肯左右。 但问题是小米从来没公布过原来的官方价格表,所以百分之九十九降幅这个数字只能信一半。 普通人该怎么选?如果你追求简单透明,小米和 dipsic 价格一样,选哪个都行。如果你担心被套路,别买套餐,直接按量付费,这样就是明确的价格,没有 credit 换算的弯弯绕。 最终结论,小米 mimo 降价是真的,价格也确实便宜,但降幅百分之九十九的宣传,因为缺乏原价数据,没法完全验证,和 dipsic 比价格完全一样。 credit 机制有没有猫腻?官方没把降价后的换算比例说清楚,这是个隐患。

这次小米米墨的新 token 盘,最容易让人误会的是单位你看到的四点一币,不是四点一币 token, 而是 credits。 真正能跑多少,要看你用哪个模型,以及这段 token 是 缓存命中未命中输入还是输出。 按官方文档约度,套餐分四档, lite 是 三十九元四点一 b 酷热 ipad standard 是 九十九元十一 b gridadius pro 是 三百二十九元三十八 b gridadius max 是 六百五十九元八十二 b gridadius。 表面看很大,但要继续往下换算, 真正的计费公式在这里,它 movie 二点五 pro, 每个缓存命中 token 扣二点五 credits, 未命中输入 token 扣三百 credits, 输出 token 扣六百 credits。 普通迷迷模糊二点五跟 d 分 别是二一百和二百 credits。 官方给了一个很好懂的例子,如果你买那一套餐,一共有四点一 bp 转一次,你用掉十 m 的 迷蒙 mo, 二点五 pro 未命中输入 token, 就 会消耗三千元回资,剩下的额度就只有一千一百元回资。 所以官方说用量提升五到八倍,并不等于任何场景都无脑多五到八倍缓存命中多输入能赋用输出,别太爆情感就会更划算。如果你是涨让五 d 缓存输出很多,那科技消耗会快很多。 还有一个边界要看清, token plan 是 面向 i 编程工具的订阅方案,不是给你随便接近自定义后端做自动化脚本的普通 api 套餐额度用完后系统会停止服务,不会继续扣你的赠金或账户余额。 最后给一个买钱判断,第一,你是不是主要拿它跑客厅工具?第二,你的任务缓存命中高不高?第三,你的输出 token 会不会很多?把这三件事算清楚,才能判断 token 盘是真便宜还是你应该继续走普通暗恋 a p i。

对不起了梁胜,雷军给的实在太多了,一觉醒来以为出 bug 了,百万头肯变成百亿头肯。五月二十七日,雷军官宣小米猫某永久降价,降幅百分之九十九,同时老用户额度全量重置 转角。 deepsea 刚把价格砍到四分之一,小米直接跟进,把大模型价格打穿了,地板输入百万 token 零点零二元。比 deepsea v 四更低更狠的是,小米 mini 是 多摩态输入,也就是说,你的文字、图像、音频、视频他也能理解实践真正的内容全流程自动化,而不是 deepsea 单单文本输入。这波操作到底是恶性价格战,还是说雷总想做普惠大众的 ai 呢?