现在是小米的 max 阅读套餐啊,这个十六亿的 token 是 小米送,然后从昨天早上八点钟开始吧,到现在差不多四点八亿,快五亿了,也就三十多个小时。五亿 token, 这还是在它这个运算速度受影响的情况, 就是它的这个运算速度跟 calculator 里面的这个就是包月的,这个模型的运算速度还是没法比, calculator 里面有一个叫做 auto 的 这种模式,就这个模式可能比这个小米啊,比千万的 plus 这种运算速度,至少我觉得至少得快十倍或者八倍、七八倍这样子 的。就是如果说这个小米的这个大模型,只要算力够的话,一天烧掉七八个亿或者十来个亿的 token 不 在话下。然后我用这个 小米的 miimo, 这个是 miimo 二点五 pro, 然后这边是一个千万三点六 plus, 然后他们昨天晚上分别做了两个重构的任务,就是非常长的任务,基本上这两个做的都差不多,就是我没想过小米的这个模型其实做出来的这个效果也不错, 但是这两个模型都没有完全的把任务全完成,因为这个涉及到的文件确实挺多的,可能得几十万行代码吧, 他得扫描十几万行代码,那现在这个项目接近二十五万行代码,光文档就有十三万行,所以说体量非常大。这个重构呢,也是重构这个所有的这个命名就是很多变量名,他在写的过程当中命名不规范,然后我就写了一个命名的规范这个文档,让他们重新的把所有的命名全部规范一下, 说为什么这个项目没有上线就重构啊?是因为就是过去,比如说我们做一个项目的话,可能一两年或者两三年就写了一堆的代码,然后史山代码这个时候就有一些比较 大拿吧,技术大拿,或者说是有点洁癖的这些人,他就喜欢去重构这些东西,就是把那些分散在各个角落重复被写的这些功能,然后浓缩到一个工具里面,或者浓缩到一个函数里面, 让所有的业务都去掉这个函数以后每次我想去改点什么东西的话,我就直接在这个函数里面改,其他的这些业务就跟着都变了,大概就是这么个意思吧,重构就是这么个意思,过去你要想重构的话,写出大量重复代码的话,得花很长时间,很多人 才会出现这种问题。但是 ai 恰恰相反,就是它很快就能写出来一堆东西,然后你就会发现你的需求是一个个提上去的,然后它就一个个给你完成,最后你会发现这个需求和那个需求之间它有一些共用的东西,那这个时候你就必须得让它抓紧重构,如果不重构的话 就是属于恶性循环,你的代码会越来越乱,越来越乱,第一是你自己也梳理不清楚,第二就是 ai 也会越来越糊, 就是你的这个项目架构,特别是这个底子如果不好的话,那后面你给他提个需求,他得查一大堆东西。所以比如说我要改一个人的头像,那么这个头像就得在一个地方去改,以后我再上传头像,或者在裁切头像,或者在干其他的事情, 就只要和头像相关的都到这个模块下面去做,如果不这样的话,你这边业务这个页面上有个头像,你想在这改一下,然后你又换了个页面,也在那也改一下,他很快就给你写出来,然后很快就能实现。 你在写的过程当中你好像觉得没什么,但是慢慢你会发现,比如说原来那个头像是切成方的,那我又现在又想把它切成这个长方形的,那这个时候这边切了正方形的,然后那边那个长方形的可能还没动,它还是长方形的,这就会导致就是有可能你的界面不一致什么之类的,反正就是大概类似这样的问题 吧。所以说 ai 写代码只要你发现了有一些重复性的东西的话,它重复在改相同的错误,比如说这个页面上的错误跟 另外一个页面上的错误基本上是一致的,但是他改完这另外一个没变,那就说明这两个地方他是有重复的,两两部分代码就是实现了两次,相当于说是甚至实现三次都有可能。 因为我们的这个需求不可能是一下子就提的特别清楚的,而且架构也不是一下子就能设计的特别完美,所以说这个就是在不停的写,不停的改,然后不停的重构,好在就是重构还不错,然后这个小米的这个 执行呢,一晚上跑下来整个也没断,就他可以跑六七个小时,七八个小时,千问其实也可以跑六七个小时、七八个小时,这两天千问他没有断,就是以前我不是说上个视频,我不是说这个千问就跑着跑着就断了吗?就是算力,这个叫什么?到了到了一个算力上限了, 他就断了这两天。这个千问三点六 plus 就是 这几天啊,还不错。我也不知道是因为我装了小米的原因还是怎么样的,反正就是这两天他没有因为这个算力给我限制了。 小米这个 miimo 二点五 pro 的 这个模型也是一直没有那个断掉过,就是用下来还是蛮稳定的,就白天的时候会有点慢,晚上十二点之后到凌晨的那段时间,它是算力低谷,然后那个时候它是零点乘一个零点八的系数吧,然后整个的这个 算下来的结果我觉得不错,因为我的任务实在是太长了,所以说它是会丢掉一部分东西,但是你再去审核一遍的话会发现,然后再让它去补充这些业务,就一次可能比如列了七八个任务,它就会给你完成三到五个, 然后有些是完成了一半,最后你问他完成了吗?他告诉你只完成了这几项,然后你再接着让他继续完成。那这个过程其实蛮长的,就是从昨天早上八点一直到今天晚上八点三十多个小时吧。呃,有二十多个小时就是完成两个长任务。其实我觉得还不错,毕竟这个人家是白给的嘛,咱也得这 也不能说是完全无脑夸啊。但是确实还不错,就是作为一个卖手机的,卖汽车的,然后做了个大模型,能达到这种水平,就我觉得是不输千问三点六 plus 的, 然后他给的这个 max 的 套餐,我在这个平台上也看了一下。卧槽,这个有点贵啊,这一年合五千多, 五六千吧,然后一个月大概十六亿的 token, 按照这种使用量的话,如果说它的速度不限制的话,我估计这个 十六亿的话,可能也就三四天就能这个给它用光了。但是啊,就是这个项目是这样的,就是在初期的时候野蛮生长的,这个过程当中肯定会消耗很多 token, 但是随着这个功能稳定下来之后,它可能就用不到那么多 token 了, 因为我已经有好多个这个编程账号了,都花了钱的它可能用不到了,我也不会盲目的去一下子买太多账号吧,先看看吧,因为这个项目基本上也到了一个收尾的阶段,所以 说就给大家汇报一下,我觉得如果说你想用 mimo 去编程没有问题,这绝对不是个玩具,这应该是一个工业级的比较可靠的一个大模型了,特别是编程,我觉得还不错。
粉丝2366获赞1.1万

今天咱们录一个特别简短的一个教程啊,就是说昨天小米发的这个免费的创作者激励,他免费给的 token, 大家该怎么配,该怎么在工具里边用,有些人不太清楚,咱们简单介绍一下。 嗯,昨天那个免费激励的这个计划申请率还挺高的,只要你申请,基本上百分八九十都能通过啊,没听说是谁申请了没通过的。他给的最基础的套餐就是这个 token 里的这个两亿的这个套餐,就是价值六十多还是九十多八十多那个, 哎,我连续包月,这是美元,美元大概九十多吧,这一个套餐免费给两亿 credits, 大 概。如果说你不是使用这个 pro 版本的话,它是一对一的,相当于两亿 token, 如果说使用 pro 的 话,相当于是一对二的,大概它就是对应一亿 token。 这个基本上平常不怎么用的话,这个使用量的话是够了,如果说平常老用的话,这个估计一两天就用完了。 嗯,我来说一下这个,简单介绍一下这个配置的过程吧。先是说这个 tree, 这个 tree 的 这个里边配置自定义的这个模型,然后新建一个窗口,在这里边有一个添加模型, 直接添加进来以后,进来以后是这样一个页面,因为我刚才打开了所有弹窗啊,进来以后这个页面,然后添加模型,然后随便随便选,因为它后边是支持一个自定义请求地址的, 这个地址就是小米这个地址直接粘进来就可以,但是他要注意一点是小米只给到了 v a e 这一块,后边这个 chat communication, 后边这个都没给,所以说要自己手动拼上这一块才能真正的请请求到模型这一块的话,就选择其他模型,然后直接 输入这个模型的 id, 这个模型 id 就是 这个小米,呃, miimo 可以 看一下这个文档,文档里边我们就看一下这个 glotcode 里边吧,但这个里边能看到这个模型 id 都是这种 mimo 杠 v 点 v 二点五杠 pro, 就 直接直接输上 v 五杠 v 二点五,二点五杠 pro。 这个为什么说已存在?是因为我下边已经配了这个 openai 的 这个模型了啊,所以说这个,呃,你们自己配的第一个的话是肯定不会存在的。 然后后边的话就可以把这个小米上边把小米网站上给的这个生成的这个 api 直接复制进来,就可以看到这个,呃,直接添加模型,把这个地址钻进来,然后 add complications, 这样配置完了以后再把这个 c 要粘进来,然后一键添加模型,然后这个地方就有了。然后左下角这块看到模型这里边就是我刚新加的那两个,这样就相当于可以直接使用了。 呃,替换掉这些里边需要排队这些,所以就相当于都是免费用的嘛。然后第二个咱们要说的是这个 open code, open code 界面了,需要 some models, 我弹出来一个框,它下面也带有一个连接的服务商, ctrl 加 a, 然后我这里边进来以后就是小米 里边就可以看到,哎。小米的 token plane, china 地区的,中国地区的,然后新加坡地区的,欧洲地区的,呃,一般的这个大陆的账号就是这个,呃,小米的国内地区的,直接点这个以后输入 api k 直接回车 之后你再进,最后再这个进这个模型里边就可以看到小米这些体验,所小米就能看到小米 togpla 里边这一个中国区的一些模型。我这有一个别的账号是香港区的,所以这有两个, 所以说这一块的话都跟那个 open globe 是 确实好用。然后第三个咱们就说的就是这个 cloud code, color code, 我 现在是习惯用这里的这个插件啊,这个挺简单的,这个 color code 的 这个配置方式呢,就是修改,根据这个我先根据小米的这个文档来说一声吧, 文档里边一进到这个文档里边可以找到集成扩展,里边有 color code, 点击进来以后这个就是配置的地方。从这一步第一个就是修改这个 setting jason, setting jackson, 就是 autopilot 的 一个个配置的一个文件,还有一个就是改一下这个 drclod 的 jackson, 我 们打开一下 都是在用户目录下的,这就是主目录,就是跟那个 windows 一 样,在用户主目录下有一个 close 点点 close 的 文件加有个点 close jason 的 一个文件。咱们先检查一下这个点 close 文件里边配置的这个东西,它需要配置一个呃,自动完成这个 on board 的 这个,这个参数 你看进来以后看到我这个之前是已经用过别的模型了,所以他进来是 tree, 这是 tree, 所以 说没有问题。然后还有一个就是这个点 glow 的 文件夹下边的 setting jason, 然后回到这个里边,点 glow 下边有个 set setting the jason, 这个里边 就是按照小米这个配就可以,只需要配置这些,把 biosil 改成小米的刚才那个 biosil, 当然你要注意的是这是 osmic 的, 不是那个 open i 格式的,小米提供了两个格式的这个地址,还有一个就是这个认证的 token, 把这两个改了以后直接粘进来就可以, 之后的话我这里边配置的其他的信息不需要关注。我就是因为我之前用过,所以这个它没有的话也可以正常用。 所以说今天的这个三个工具的配置基本就讲完了。一个是 tree 添加魔镜里面就可以自定义, 一个是 open code, 在 这里边可以直接连接,还有这个 cloud 就是 改一下配置文件,直接运行就可以, 所以就是今天的这个讲解内容就到这了。

ai 圈刚刚发生的一个小事件,但其实信息量特别大, ai 模型刚发布就被识别出 dna。 嗨,大家好, ai 编程工具 curser 想必大家都不陌生,它刚刚发布了一个新模型,叫做 compressor 二, 官方宣传非常直接,更强,更便宜,甚至在部分测试里超过主流模型。听起来非常猛, 但发布没多久,开发者就发现了一个细节,在模型的 id 里出现了 kimi k two point five 的 标识。同时就有人对比了这个 tokenizer, 发现行为模式跟 kimi 高度一致。 在 ai 圈,这基本等于一个信号,这个模型很可能不是丛林训练的。很快,科瑟的联合创始人就发文确认了,他们测试了很多底座模型,发现这个 kimi k two point five 是 表现最强的一个。 而 composer two 是 在这个基础上啊,做了持续的预训练,又进行了高算力的强化学习, 规模扩大了四倍。也就是说,这不是直接调用模型,而是基于墙底座的二次训练。这里简单的说一下 kimi, 他 来自中国公司温氏的 ai, 特点也非常的明确,他有这个超强的这个超长上下文的理解能力, 然后它的推理成本相对来说比较低,所以在业内,它经常被当做底座模型。有点像不是自己种菜,而是先买到最好的食材,再做一道更复杂的菜。 更有意思的来了 kimi 的 官方账号,随后也转发祝贺,直接表示很高兴看到 kimi 成为 composer two 的 foundation。 这基本说明这是一次公开的技术合作。那为什么还是引发争议?其实问题并不在技术,而在表达方式。如果一开始科 sir 就 说,哎,我们基于某某型做增强,呃,我觉得行业完全可以接受, 但如果用户理解成是完全自研的,这个预期就会完全不同。而真正值得注意的是背后的行业变化。因为现在 ai 的 产品竞争已经越来越少的公司是从零开始训练模型的, 大家比的是谁选的底座更好,谁训练的更聪明,谁把产品体验做到极致。换句话说,未来拼的可能不是谁造出了最聪明的大脑,而是谁会利用聪明的大脑。 所以这件事的核心其实不是有没有用 timi, 而是一个现实,未来很多 ai 产品可能都建立在同一批模型之上。那问题来了,你觉得这种二次开发算不算真正的技术能力?

小米最近开放了 miimo 百万亿 token 创作者激励计划,今天这条视频不止看申请流程,我会直接把 miimo 接近 cloud code, 看看它能不能当一个可用的代码模型来跑。申请入口就在活动页 这里,需要填小米 miimo 平台邮箱,再选择你常用的开发工具,比如 cloud code code x cursor 这一类 工具选项不用纠结,重点是说明你真实在用 ai 做开发。下面这部分是项目和使用场景,说明你可以写平时怎么用 agent 写代码改页面做自动化,也可以上传 cloud 账号截图或账单, gigab 项目链皆有的话也一起补上, 提交之后等邮件通知就行。通过以后进入控制台就能看到赠送的 pro 阅读套餐。真正关键的是这里的专属 a p i t 以及 open ai 和 andropic 两种兼容入口, 只要协议兼容,后面就可以接到很多现有工具里。 memo 的 套餐价格本身不算便宜,所以这次我更关心它和 cloud 官方 opus 模型之间到底有多大差距。接下来用 c c switch 新增一个供应商,把 cloud code 的 请求切到小米 memo 配置时,先新建小米 memo, 然后填 a p i t, 这里不要把密钥暴露出去,直接从控制台复制就可以。供应商名称只是本地标识,方便后面在不同模型之间切换。 base ur l 按平台给的 andropik 兼容地址填写。健全方式选择 a p i t。 模型映设里把默认模型指向 mimo v 二点五 pro, 保存以后再把这个供应商起用。现在打开 clockcode 可以 看到当前绘画已经切到了 mymo v 二点五 pro, 到这一步接入基本完成,后面就看他面对真实前端任务时表现怎么样。我这里准备了一个前端页面测试任务,并且起用了 frontend design 插件, 参考对象是 hugging face 上的烧命 mi m o mi m o v 二点五 pro 页面,让他做一个小米 mi m o v 二点五 pro 的 介绍页,提示词很直接,根据这个模型页面设计一个介绍页, 这个任务能同时考察信息、提取、页面结构、视觉层级和前端实现。不只是简单回答几个问题,生成过程中可以观察两点,第一,他有没有抓住 mymo v 二点五 pro 的 核心参数和卖点。第二,页面是不是像一个完整产品页,而不是把文字随便堆在一起。 最后打开本地页面标题模型参数,百万上下文 token 规模,还有下载模型、技术、博客、 api 平台这些按钮都做出来了。 整体看, cloud 官方模型在国内会遇到网络和账号问题,上手门槛比较高。而像这种难度不大的前端任务,把小米 miimo 接近 cloud code 做平替是一个不错的选择。

哈喽,大家好,我是贤,很开心呢,在这来给大家分享。作为一个连续充了两年的一个科室用户,作为小白呢做了一个 web coding 的 一个应用 app, 并上架了 app store 的 市场,整个数据的话还是非常可观的。今天呢,我就带大家用 cursor 去安装 cloud code, 去做一下你人生的第一个 skill。 话不多说,现在就开始我是用 cursor 来安装的 cloud code 和 c c switch, 然后在 c c switch 里边去关联我想去用的一些模型。所以首先第一步呢,我们先打开 cursor, 在科室里面呢创建一个项目文件夹,在输入框里面可以这样去输入这个内容,让科室儿帮你去安装。之后呢,它整个程序就可以跑起来了,快的给你安装好。然后这个界面呢就是它安装好以后的一 cloud code, 整个图形 logo 出现的时候呢,就是安装成功了,也可以直接去告诉他帮我安装 c c switch, 那么整个的这个程序它就可以给你跑起来了,跑完之后呢,在你的整个的应用的桌面里面就能看到这个 c c 四位置这个图标,点击这个图标,然后就可以启动了,你就可以进行这个模型的一个添加和 skill 的 添加,可以去接现在主流的,那么如果没有可选的呢,就选择自定义配置, 那么有两个方式,一个方式呢就是 a p i 的 一个接入获取的话,一个是它官方渠道的,第二个呢是需要这个 a p i 的 一个服务商有这几个推荐的。然后第二个呢,你可以使用国内的一个模型,比如说 deepsea, 智普啊, mini max 等等,这里呢我给大家来操作一下 mini max 工商名称和官网链接和 api k, 充完之后呢,你就可以去创建你自己的这个 api k, 整个这个 api k 呢它的密钥呢是非常长的一些字母和数字组成的,点开这个复制之后呢,去到刚才我们打开的这个 c c switch 里面选好的 mini max api k 这个位置,我们去把它粘过来。现在大家看到的就是这个添加好的这个 mini max, 点起用以后,它就能够显示当前的这个模型,是 max api 的 一个模型。分享一下我现在的一个工作的一个区域的划分。首先左边这个呢是一个虾子,让龙虾去做一个 clr 的 一个自动化的一个部署,如果有 clr 你 都可以去在这个地方让 虾子去给你对接一下,然后中间这块就是我的 id 的 一个工具,右边这一块就常用的一个 ai chat 的 一个对话框,和 ai 工具的一个分区。然后推荐给大家 想看的 cursor 里面 cloud code 交互页面,作为小白的话,安装 cloud code 插件这个应用扩展这个地方去搜索官方已经放好的这个插件,安装好之后它不会立马的显现出来,在它的应用扩展这个地方有一个箭头下拉下来有一个 cloud code, 点开以后和交互的这个页面就打开了,下面呢它有这个输入框,在这个地方进行一个对话,也可以去打开你的电脑的终端,有什么需求,然后我要做什么 可以直接在这个地方说。接着给大家去演示一下在 ctrl 它这个交互界面里面的一些原则。右下角这个 black mode 非常重要的一个功能,它会给你反馈一些你现在要做的这个需求的场景 的一些问题,进行一个头脑风暴的一个对接啊。制作一个 skill, 只用 notebook lm 里面的一个笔记,然后我希望你能够抓取我笔记本里面的一个数据,给我生成一个 skill。 这个地方再给大家推荐一下我用的这个 template, 我 觉得特别好,它非常有帮我制作一个 skill, 然后是骨骼产品里面的 lm, 然后 有许多我之前用过的一些笔记,然后你帮我进行一个 skill 的 一个输出,抓取这个 skill 里面的数据,然后给我生成一个 skill 并封装这个 skill。 现在呢,把它给发送它前面呢,其实是对我整个 skill 的 结构做了充分的一个了解, 然后在规划之前呢,它可能需要有些问题是需要问我的,那么这个弹窗呢,里面是一个获取的一个数据获取的方式,那么数据获取的方式呢?他就问我整个这一块 i m 里面是没有公开 api 的, 无法直接程序化地抓取数据。我希望用哪个方式去让他去了解我笔记的内容?会给我的 ai, 然后呢,让他去帮我分析一下这几个选项。制作好了之后呢,我可以直接去给 cloud code 说帮我去总结笔记,那么就会调用刚才我让他去生成的整个这个 skill。 这时候又弹窗笔记主题,你的 notebook lm 笔记主要是关于什么领域的? 将帮助我设计合适的一个 skill 的 结构和出发的一个条件。它这个地方呢,是希望我能够帮助他理解我整个设计的这个 skill 的 结构和出发的一个条件,可以就是把整个这个输入啊,处理啊,输出啊, prom 的 这个模板啊,自动化流程 给我打包成一个 skill, 然后非常的偏向于 agent 的 一个行为安装位置,这里非常重要,就是你的 skill 希望安装在哪里,那么肯定是选第一个全局的,这样的话呢,你就是在做接下来的一些 ai 工具和一些做一些 ai 项目的时候,都能够反复地去调用你现在生成的这个 skill 灵魂真的是在线了。选了这个 plan mode, 相当于 ai 和你一起去思考 skill 我 应该怎么写,然后去引导的你。中间的过程中的话,你还可以思考一些问题丢给你的 ai, 然后去把你这个 skill 做得更完善一些,关键问题都有了一些答案了, 那么它就会把你这个答案和问题给你总结出来,然后一步一步的去给你去实现和规划。然后第一步需要我配合的是什么?要把我的这个笔记本选择这个相关的内容, 然后全选复制粘贴到这个对话框里面,多次的去粘贴这个笔记的内容,内容越多越完整,生成这个 skill 的 质量就会越多。 做的你做 skill 的 一个流程,一个方式,它哪些场景,具体的你都怎么操作的,完完全全都输入给它,它就会给你生成这个非常结构化的这个 skill, 它告诉你可以多次去粘贴这个笔记的内容,然后内容越多呢,你生成这个 skill 的 质量就会越高, 我并不知道要粘贴哪里,那么这个时候我可以把截图截给他,整个笔记的页面内容是这些,我需要把哪些内容去复制粘贴到你这个对话框里呢?然后呢,我们根据它的这些提示呢,然后把它 需要的这个内容呢,你给它粘过来就可以了。设置完之后,它就会问你整个的 skill 是 否要放在你电脑的这个文件夹下面,这个时候选 yes 正在生成的 skill 的 这个主文件图标里一个选中的一个状态, 然后呢,下面再生成整个这个详细模式的一个参考文件 c q 的 一个样式,然后就出来了啊,两大核心的原则,策略,用户输入的文本策略, 防止幻觉呀啊,检查假设法呀。其实这公式的本质是迭代的一个过程啊,它先生成一个组的文件,下面呢再去生成这个详细模式的一个参考文件,它已经写完了,整个 c q 的 已经生成完毕了,它的文件结构是一个组的 c q。 然后两大原则,七大策略,应用场景, 去打开一个新的 cloud code。 然后呢去说帮我写一个房子幻觉的题词,看看是否有些变化,因为这个 skill 已经写到你的从句里,只要能够提到这个梯子词,刚才说的梯子词幻觉, prompt 等等这些关键词的时候,它都能够触发刚才我去封装的这个 skill。 嗯,结果出来了一个通用的防幻觉的题词模板,基于文档和知识库的一个问答的场景防幻觉。然后他写好了,我去规则一二三说出一个格式,引用回答和执行度使用说明是在这个场景里面啊,做法核心的原则, ok, 搞定,下期呢,继续给大家一起来探讨一下,在做项目上有没有其他更巧妙的一些方法,谢谢大家的收看,然后我们下期再见。

今天在 gitop 上发现这个在 cut 中接入自定义模型的项目,这里说的很明显了,现在看一下效果。我这里自定义接入了摩塔的大模型,这里使用一下,看一下效果。 先发一个简单的需求, 点击发送,然后就是等待响应,趁着等待的时间,我们看一下这个项目攻击的配置, 这里大家根据自己要接入的模型动态调讲配置就好了。 升球好了,我们看一下效果吧。 这里可能是我接入的是免费的模型,电球能力不是太好,所以页面有一点丑,但是我们自定义模型功能也是实现了。好了,今天就到这了。

最近 deepsea 不是 更新了一个 v 四 pro 版本吗?然后主播想把自己科斯尔模型改成最新的那个 deepsea v 四 pro, 然后我在科斯里边配置好 deepsea v 四 pro 的 api 之后,兴气勃勃地每每想使用国产又便宜又好用的模型后,结果发现科斯尔好像不能正常地使用 deepsea v 四 pro 模型。当 newchat 并开启第一个问题时,他可以回答, 但是一旦开始,后续的问题直接就会报错。 provide a return error error message the reasoning content in the thinking mode must be passed back to the api。 于是主播去 google 了一下,想搅一搅网校有没有解决方案,结果发现社区里也有很多人都在吐槽这个问题, 而且也没有搅到一个可行的解决方案。于是主播决定自己写一个代理程序来解决这个问题。根据报错信息猜测, deep seek v 四的 thinking 模式有个强限制, 他返回的思维链必须原样传回去,但是 cursor 目前不机器传回 ds 的 reason content。 于是主播写了个代理程序,中间调戏过程就不说了, 代理程序写好之后,理论上直接把 sir 设计里的 base url 改为代理程序监听的地址就行了。可惜 sir 很 傲娇,不让连本地直译网代理你走,本地代理直接就给你四百零三 forbidden 了, 只能使用公网 ip 访问。于是主播用 cloud fear 打了个隧道,穿透内网,将 base u v l 换成映秀岛本地代理的公网地址。这次 koser 终于认了,我再使用 deep seek 杠 v 四杠 pro 模型进行后续的对话,也能正常使用了。 感觉 cursor 官方没有更新支持 deep seek v 四 pro 模型的话,目前只能通过这种补丁方式来使用了。代理代码我已经开源在 github 了,叫 cursor 杠 deep seek 杠 v 四杠 proxy, 配置就改一个 u r 料,两分钟搞定。链接我放在置顶评论和视频简介里了,如果你也碰到了这个问题的话,需要的兄弟们自己去拿。我把文件都打包好了,根据 redmi 说明操作,一键启动就可以了。

大家有没有发现一个奇怪的现象,小米发布 miimo v 二 pro 这么久了,那个平时连小米螺丝钉都要黑上两句的某遥遥领先大厂,这次居然集体失声了?是他们转性了吗?不是,他们真的黑不动了。大家记得前阵子图版 openroot 的 神秘模型 hunter alpha 吗?在谁都不知道他是小米做的时候,他靠硬实力杀到了全球第一。这就是小米最狠的地方, 先把你蒙上眼,让你在一个绝对公平的绝对量化的环境里测。等大家都说好用了,小米才出来认领,这种扫地僧式的出场,直接封死了任何想说小米只会营销的嘴。为什么说在量化场景下,某大厂黑不了小米?因为大模型不看 ppt, 看的是实测数据。 小米 miimo 原生支持一百万长度的上下文,激活参数四二 b, 价格还是对手的几分之一。在 ai 圈,代码不说话,算力不骗人,你想黑小米?行啊,你拿出一个能跑分的通用模型出来兑现啊。可某大厂现在的尴尬是,自家模型还在 time sleep 的 争议里没缓过劲儿来, 除了关起门来搞行业闭环,根本不敢拉到公海上跟小米拼刺刀。以前是拿参数吊打小米,小米讲情怀,现在反过来了,小米拿出的全是硬核指标, 而某大厂只能讲宏大趋势。当一个产品做到了性能第一,价格最香而且完全透明的时候,任何所谓的舆论抹黑,不在 excel 表格面前都像个笑话。这次小米大模型不是靠嗓门大赢的,是靠技术诚实赢的。在这个算力及实力的时代,谁在裸泳跑个分不就知道了?

兄弟们,今天给你们讲一个科 sir 的 骚操作,他直接让我从复制粘贴工程师变成了全站嘴炮王者!直接打开顶级模型 opus 四点七加 max 模式,项目做得比送外卖还快!看这满满的额度,你确定一个月造得完吗?还没用上的抓紧去试试!评论区扣个编程,我放在主页了。

大家好,我们打开我们的 costo 工具,然后将这个工具最大化,我们首先来看一下它最支持的一些模型,最新的模型那么支持的看见没有?这个特别是我们的 oppo 支持的最新十四点七,当然说其他模型大家也可以看一下, 而且我们的 costo 现在支持支付宝支付,我们在左下角,当然说你要自己用你的账号去登录啊,登录完以后点 左下角右边的这个配置文件啊,进入到这个,我们通用这个文件在这里,我们这里是 free plan, 就是 免费的版本啊,那么你如果说想升级,那么 update two pro 专业版,点一下 upgrade, 那 么它就会打开我们的一个支付页面,那么支付这里来说,我们现在已经支付了,允许可以支付宝支付啊,你点击支付宝,然后填写相应的信息,那么就可以订阅了。 填写好信息以后,那么我们就会跳转到支付宝,那么在这里的话,你就登录支付宝,然后就可以扫码支付就可以了 啊,我这里现在在手机上,那么扫码支付啊,扫码成功啊,已确认,然后最终那去支付就可以了 啊,我输入我自己本地的密码啊,同意支付,那么这样的话,我们这样支付宝代扣开通成功啊,将绑定,当你购买产品和服务的时候,从绑定的这里去支付, 然后就会跳到我们 qq, 那 么 cn, 它的一个首页在我们刚才买的是二十块钱一个月的啊,那么你可以升级 pro 加啊,这是每个月六十,然后更多的一些服务, 那么这样的话,你就可以在我们 control 这里使用,那么我们本身左下角啊就变成原来由 free, 然后变成是 pro facial p r e 的 这样一个版本,然后就可以使用它的一些商业的功能了。

今天我们做一个真实场景的模型对比测评,背景是这样的,我们拿到了小米百万亿 token 激励计划,需要配置小米模型到 hermes agent, 但配置完之后一直报四百零一错误。 invalid api key 问题是,这个 key 明明是正确的,用 curl 直接调用小米 api 是 成功的,那问题到底出在哪里? 先用千问三点六 plus 来排查,他反复检查 api key, 重启 gateway, 整合环境变量文件,来回交互了十几次,始终没有找到真正原因。 用户都急了,怎么还是 api key 的 问题?切换到 deep seek v 四 pro, 它直接追踪原码,发现根音是 config eml 里配置的 base 下划线 url 对 内置 provider 无效。 hermes 走的是内置注册表的默认地址, 必须通过环境变量小米下划线 base 下划线 url 来覆盖一个问题。一次定位小米自己的 miim 模型也能直接解释这个问题,说明它对 hermes 架构的理解同样到位。 结论,在真实复杂问题上, deep seek v 四 pro 和 miim 的 表现明显优于千万三点六 plus, 模型选型还是要看真实场景下的实战能力。

最近 openroot 被一个名叫亨特阿尔法的神秘模型给霸榜了啊,很多人都在猜测这玩意到底是谁家模型,那么直到十九号上午终于被小米给认领了, 这个神秘的模型就是小米最新的 miimo vr pro 模型。小米接连发布了三款大模型,并且开启了一段时间的免费试用。可能有很多平常不关注大模型的朋友感到非常的好奇,想知道这个玩意到底该怎么样去使用,那么今天这期视频我将教会大家怎么用上小米的大模型。 好,那我们废话不多说,直接开始。先说最简单的用法,就是把它当成普通的聊天大模型来使用。如果你使用的是小米手机,可以直接打开小米自带的浏览器,点击中间的 ai 图标,就能够直接使用小米的 mini 大 模型。当然不是小米的手机也没关系,我们可以直接来到小米 mini 的 官方网站, 然后点击 web demo, 可以 看到左边有一个侧边栏叫做 memo chat, 我 们点击就可以和大模型进行聊天了,然后左上角还有可以切换模型。如果你只是把大模型当成聊天工具,那么网页端就差不多够用了,但是如果你想让他帮你处理文件,调用工具,接入工作流的话,那就要把它接入智能体了。 接下来我会教大家怎么把它接入智能体上面。智能体这个词可能听起来有点复杂,但大家不要被吓住了。智能体也就是 agent, 它是一个以大语言模型 l l m 为大脑,能够自主规划、记忆并使用工具来完成目标的一个智能系统。 传统的 l l m 本质上还是你问一句,他答一句,比如豆包千问菜的 g p t 这一类,你给他一个问题,他就返回一段内容,基本上也就结束了。但是 a 卷的不一样,他不只是负责回答,他还会接着往下做。 你给他一个目标之后,他会自己理解任务规划步骤,然后一边执行一边根据结果继续调整,直到把这件事情做完。 比如你让他帮你整理一个文件夹里面的资料,顺便提炼重点,再写成一份总结,他就不只是简单的给你一句建议,而是真的会一步一步的把这件事情往下做。所以简单来说,普通的 ai 更像是在跟你聊天,而 a 检测它是真正的在帮助你干活。 像 open code codex 以及 cloud code, 还有前段时间爆火的 open clone, 都属于智能体,目前 open code 提供了免费的密膜大模型的使用,我们以 open code 为例,演示一下怎么把大模型接入智能体。在安装 open code 之前,我们首先需要安装一下 node js, 我们来到 loggs 的 官网,根据对应的系统下载安装包,把 loggs 安装好之后,接着我们打开终端,输入下面这串命令,这样我们就完成了安装,再输入 open code 就 能够直接进行启动,我们跟它对话试一下,可以看到它已经开始回应我们了。 那么接下来我们把模型切换到 m 模模型,按住 ctrl 加 p, 或者使用斜杠 model s 命令切换使用模型。 这里我们直接搜索 mimo, 可以 看到 opencode 为我们提供了两个免费的模型,选中之后就可以看到这里的模型已经发生了改变,这样我们就可以开始对话了。 这里我让他帮我生成一个小霸王游戏的 svg 动画,放在我的桌面上可以看到他已经在接受命令之后开始工作了,我们看看效果如何。 前面我们使用的是 open code 为我们提供的免费大模型,通常他会以降低速度或者是一些其他的方式来限制你的使用,并且免费期一过就不能够再继续使用了。所以接下来再给大家演示一下怎么接入小米的 api key 来进行使用。在 open code 里面输入斜杠 connect, 我们这里可以搜索模型提供商,这里可以接入各种各样的大模型,像亲爱的 g p g gmail 等等,我们直接搜索小米。然后我们来到小米官网,点击 api access, 然后点击申请 api key, 我 们创建一个 api key, 把 api key 复制回到终端回车,这样我们就能够选择模型来跟它进行对话了。 这里必须要保证你的账户余额充足,不然是不能够进行对话的。 ok, 以上就是使用小米密墨大模型的全流程啊,感谢您的收看,如果你喜欢这期视频,记得给我点亮收藏,后续我也会分享更多跟 ai 相关的知识,我们下期视频再见!拜拜!