二零二六年三月全网七大国产大模型 ai 编程套餐怎么选?一个视频给你说清楚。首先声明,本视频无任何广告,请放心使用。在正式开始分析之前,我先出结论,综合实力最强可以直接闭眼入的首选是智普 ai, 他首发独占了目前最聪明的 glm 五点一模型,这个模型目前在编程方面是国产最强,没有之一,并且白送能让 ai 直接帮你操作电脑的 mcp。 普通人直接买四十九块钱一个月的 like 版,一个月能用两万多次,查资料、写文章、做 ppt 基本用不完。 如果你只是想要一个高性价比的龙虾方案,绝对的性价比之王,一个月只要二十九块钱一年也才二九零,不用去抢名额 就能拥有独占的 mini max m 二点七模型,反应速度极快,学生党或者只是想轻度尝鲜的用户, 闭眼买这个二十九元的 start 套餐就行。习惯用豆包体系的可以看字节方舟,它四十块钱一个月起步,独家支持最新的豆包 size 二点零模型,买套餐还会送很实用的 open core 插件,但你要注意避个坑,它目前不支持最新的 g o m 五模型,模型选择上会稍微有点局限, 对于有大量阅读需求的人,长文本刚需者专属选 kimi, 四十九块钱起步,途展 kimi k 二点五,如果你每天要让 ai 帮你读几百页的 pdf 或者写万字长文,选它最合适不过。官方一直不公开具体的调用次数限制,用起来像开盲盒, 而且 asynch 速度也会有区分。剩下几个平台,普通人可以先观望下。阿里百店没有平价套餐,起步就是两百块的 pro 版。腾讯会员和百度千帆属于大杂烩平台,主要是接入别家模型撑场面, 比如百度能用到 d c k v。 三点二,腾讯首月只要七点九元,除非你想花一份钱体验各种不同的模型,否则不用专门去开通。 最后总结一下,兜里的钱到底怎么花,想花最少钱体验顶级 ai, 选二十九元的 mini max, 想要最聪明、功能最全, 买四十九元的智普重度处理藏私料,选四十九元的 timi, 如果确定要长期用,直接买包年最划算。最后提醒一句,现在官方封号极严,千万别去买什么共享号,直接买官方平价套餐最稳妥。
粉丝1006获赞4403

别睡了,大的来了! deepsea v 四、 glm 五、 mini max 二点五就像商量好的一样,都在刚刚突然就发布了,全都是爆炸升 级。在前端页面审美方面,三个模型基本都已经向 jimmy、 nike 三看齐了。相同的提示词下,我感觉 mini max 这个效果最好,无论是配色、动效、字体还有功能完整性都是最强的,让我又忍不住说出那句话,前端又要施! 而且官网提供了免费的一整能力更全面,比如生成三 d 科普动画的能力, 这个就是模拟了机械键盘轴体的按压动画,物理效果相当不错。以及制作 ppt 和动态海报的功能,制作完成后都是可以修改,所有元素都能点击之后再次进行对话。这次 g l m 的 配套能力基本都和 oppo 四点五看 齐,相当强悍。目前 deepsea 新模型还在会读测试官网已经看到可以支持一照的上下文,所有的模型都可以在各自的官网使用。好了,关注我,了解更多爱干货,感谢大家观看!

g l m 五, mini max, k 二点五三个模型用哪个写扣的比较好一点?我看了一下这个,三个都差不多,这个我自己用的感受是这样,排名是 g l m 五好一点,那 mini max 我 觉得它的性价比会高一点,速度会快一点,因为它模型轻。我现在用的是 mini max 二点五, m 二 是 m 二点五的模型做我的写代码的机做模型有些比较复杂的问题,那可能还会要用更好的模型去用。

昨天评论区里面有人问我说小米的模型到底谁在用?有谁会用小米的模型?但是我直接就把话放在这告诉你,现在小米 miimo v 二的模型目前测下来至少是比 mini max 二点七要强的多的多的,我给你看下实测啊,你看这个是昨天晚上,我凌晨一点啊, 我在让他帮我装这个这个叫 open viking 的 东西,我让他对比,对比完之后他给了一个对比的结果,然后做了一些解释,然后他问我要深入研究吗?我说直接帮我部署,给完指令之后他说需要我配置 open viking 和 open claw 的 集成吗?我说需要,我需要解决这个 open claw 的 设计问题, 我们看下这个时间啊,一点十一分,在这之前都是我问一句,他答一句,我问一句答一句,因为在一点十一之前,你们看一下这个尾椎用的是 mini max 二点七的模型,然后我觉得这样太浪费我时间了,我还是把这个 to come play 给买起来了, 咪某 vr 模型 to come play 再给你们看下时间,我是二六年四月四号一点十三分,凌晨一点十三分,我订阅了一个十二的,我说需要解决这个问题, 这个时候还是这个迷你 max 二点机的模型答复我,他说确认之后我帮你去配置,我说我要配置火山引擎的, 我这个时候已经去配置了这个咪某的模型,但是呢没配好,然后我重新配了之后,一点二十六之后我告诉他我要弄火山引擎,你接下来看我的消息,他说好的用火山引擎,我帮你配置,我说 finish, it automatically, 我 说全自动把它解决掉,你就看后面全是咪某自己跑的, 这么长一串消息,全都是米诺自己跑完的,一直跑到说 openviking 部署完成,唯一是这这个文件系统直接操作,这还有问题,然后 他继续操作,继续操作到这,他说实际问题现在已经可以通过 openviking 搜索功能解决了,写入功能的 api 还有一些小问题,但是现在已经可以用了,也就是说他到现在这一分钟为止,一点四十分已经能满足我的使用了,只是还有一些瑕疵的小问题他没有解决, 那时候我已经睡着了。所以我想重点说的是,从我这开始 finish, it automatically 一 直到这这段全是他自自我解决问题当中没有问过我任何一句屁话,把问题解决掉,满足我的需求。这个就是小米 mini 模型和 mini max 二点七的模型的区别在哪?质谱的我还没测,接下来测一下,我会告诉大家的。

前端开发者必看同一 ai 开发工具, tray 切换三款不同大模型,用完全一致的提示词开发同一套前端工程框架。失测差异全公开,只讲事实,不参主观判断, 先明确测试标准,确保公平性。一、开发工具统一使用 tray, ai 开发工具二、提示词完全一致,均为通过豆包先生成的用于细化整体前端工程搭建的 markdown 文件提示词, 核心需求为 view 三 plus、 v i t t five plus、 element plus plus、 pinia plus、 view router。 企业级后台管理系统开发 提示词细节覆盖、项目初识化、核心页面开发、路由配置等全流程。三、测试指标,仅统计生成文件数量,实际耗时两项核心数据,不评价代码质量,只呈现客观结果。 实测开始逐模型呈现数据。第一款, glm 五模型,同样的提示词,时间原因,我们加快六十倍速播放 生成文件数量三十四个,覆盖前端工程框架全核心文件,实际耗时约二十一分钟。前端页面展示 实测开始,逐模型呈现数据。第二款, kimi k 二点五模型,同样的提示词,时间原因,我们加快四十倍速播放 生成文件,数量二十二个,满足前端工程框架基础开发需求,实际耗时约十二分钟。前端页面展示 实测开始,逐模型呈现数据。第三款, minimax m 二点七模型,同样的提示词,时间原因,我们加快三十倍速播放 生成文件数量二十四个,覆盖前端工程框架核心模块,实际耗时仅八分钟,耗时最短。前端页面展示 基于实测数据客观总结三点,一,文件产出量 g l m 五模型生成文件数量最多,覆盖最全面。二、开发效率, minimax m 二点七模型耗时最短,效率优势显著。 三、综合表现, kimi k 二点五模型文件数量与耗时均处于中间水平,表现均衡。 相同工具、相同提示词、相同需求下,不同模型的产出效率及文件覆盖度差异明显。作为前端开发者,你更看重 ai 生成的文件覆盖率还是开发效率?评论区留下你的真实使用体验。

今天算力排行榜前六全是中国大模型,这是我们二月份拿到第一名以来,这个第一次有这样的盛况啊。我们来看一下是哪些大模型 啊。首先第一名是小米的 mimo vr pro 啊,它前一周匿名上榜后啊,现在一直霸榜。第二是今月星辰,也是受了这个小龙虾的影响。第三是 deepseek, 第四是 g m g l m 五啊,就是智普的那个模型。第五是 mini max 二点五。第六是 mini max 二点七啊,其实 mini max 呃,在过去五周一直是周榜的第一 啊,然后现在它两个模型分开了,然后两个模型如果一加,它其实还能排在第二。总体上来说,算力未来就掌握了 ai 时代的核心的定价权力。

大家好,年前有点偷懒了啊,我们国内的大模型确实发展挺快。 呃,年前这个 mini max 和智谱呢,本身都已经发布了,但是有点偷懒了,没有及时来进行测试,我们还是回到 最原始的那个测试啊,动态爬虫,我们看一下这一次他们能不能够取得成功,把这个需求搞过来。前面的这个配置都已经搞好了, 因为前面好几个版本其实更新都没有解决这个问题啊。他这个通用大模型呢,本身确实进步挺快,但是编程能力呢?呃,在这个网络编程这一块一直没有突破这个网络爬虫,动态爬虫的, 希望这一次他们两个都能够取得成功啊。 智普怎么好像没什么动静?这会儿 都是采用它们最新版本 mini max 二点五,这个是五,就 buy 它了。嗯,不知道啥情况,智普在这里怎么这么久还没有,一直在这思考。 这个好像先对以前的版本确实有变化,他怎么还会去测试这个版本?这个按道理跟 partson 的 版本关系不大,它这个生成代码这边还是没有动静, 我记得前面那几个版本反应都还比较快的这个 beta 版本,这个 beta 是 不是有问题?一直还没动静, 这究竟什么问题呢?没搞明白。 ok, 这边已经有代码了, 给他安装一代。 ok, 给他安装啊。 哇,终于开始动了,这什么情况?完全没搞明白。这边还有干嘛?又在干嘛?这个是什么东西? 这个有点奇怪哦,为什么会这么久?这个完全没搞懂, 看样子第一个没成功,现在又在写第二个。测试脚本 自己的编码啊,检查这个编码啊, 检测的反爬虫终于好, 还使用百度的 ipi。 我 这倒是另外一个思路, 看一下啊,失败了。 真的假的, 这就搞定了? 我们先来看一下这个, 这应该是刚才那一个。 对呀,哦,刚才不是那个谁的。 这边还在点赞,原来刚直屏的是智普的 哇,这个 webfatch 在不停的尝试新工具啊,看看这个 wifi 能不能成功啊。你看它迭代了好多次了, 现在感觉把问题简单的问题复杂化了。 这个又半天没动。这个字符 怎么跟以前好像不一样啊。以前四点五,四点六,四点七,不会这样,卡在这里半天 啊,又开始有动静了。 mini max 一 直在尝试,一直在尝试。这搞得有点复杂了。你搞那么多 好吧,又在生成 csv 文件的那个。还是搞这么多脚本。就是还没见动静,没有结果呀,好奇怪。 这边再更新解析逻辑,看看能不能成功,哎,代码好像获得了。 ok, 这个 csv 已经生成了, 看看能不能成功啊。 这边又给它出错了,还在给的, 这边在修复代码,因为代码有语法错误。嗯, ok, 更正的。 这么自信,我就把你删掉了。 ok, 它这个直接的命令直接点。这个还是看一下啊。 mini max 这两个按钮有区别啊。来,开始抓起 试一下。 这是要干嘛? 看一下这个目录下面有没有,哎,有了,看一下对不对 哦,是个空的,再来一次。这什么鬼,保存目录 还是不对,因为只是一个验证目录,我估计还是有问题。 显然不对啊,还是个空的,搞了半天还是不对。 再看一下这边,看一下。安装一袋,哎,他用了这个一袋,看样子好像抓到一点,看下有没有成功啊? 先试一下哦。抽出款浏览器失败,它没有真正安装 这个掉入死胡同了,我相信它搞不定。 嗯,它自己来安装了,看一下你能不能搞定。 这个叠带了无数次,这个脚本,你看它这里是有的,它明显还是有问题, 这都叠带了好多轮呐。我觉得还是有点遗憾啊,编程能力这一块没有非常显著的提升感觉。再来试一试, 把这个关掉啊,这个是他的 哈,没有抓取到任何成还是失败 还是失败?你看这边还在动, 他还下载了音乐, 我看一下有没有下载音乐。没有没有。好吧,我觉得 mini max 还是失败的啊,我不再尝试了, 看看这个用 chrome 能不能搞定。 这个实在不想试了,这跟 core 的 差距还是有点大,像现在 jammer 三它也能自己搞定的,也算很快的,所以编程能力这一块明显还是有比较大的差距。 那现在就非常期待 deepsea 四点零呢。 哎,所以我就说他搞不定这个,算了,还是有问题。这个配置浏览器的配置稍微复杂一点, 还是比较遗憾,不管是智普的还是 mini max, 二点五这个最新的版本都失败了。好,谢谢大家。

哈喽,大家好,现在 ar 发展这么快,大家对一些 ar 编辑工具用的熟不熟啊?反正我这边用了好多 ar 编辑工具了,比如说像 kiro 啊,像 cursor, 还有 windows 这些软件。其实,哎,说回来,它们都是一些大冒险的 智能体吧,真正牛逼的还是它里面内嵌的模型,哎,不过模型和模型之间的差距真的超级大,我现在用的那个叫欧帕斯啊,哇,真的巨强,当然也有些巨拉的,比如说像呃什么 mini max, glm 这些个模型, 其实我还充了会员,我靠,会员还挺贵的,一个月好几十呢,但是差距挺大的。然后呢,我对我比较了解的,知道我是做一些算法类的 一起工作吗?然后呢,算法的话其实不只是写代码吗?有的时候会有些调研性的工作。然后呢,我之前用那个 mini max 啊, 我调了一两天都调不通,虽然说不至于,嗯,代码有一些一级错误吧,但是调不通。然后后来我用的这个欧法斯,我靠,真的好强,差不多十几分钟就给我调通了,然后算法代码训练过后都训起来了, 哎,所以我觉得差距真的蛮大的。嗯,然后我最近不过,不过他有个缺点就是实在是太贵了。我靠,嗯,我之前买的就是一百刀的嘛, 然后呢,可能没用多久,也就两三天就用完了,这额度就用完了,所以我现在都很省着用,一般就是除非那种比较比较比较难的这种任务才会用到它。 然后不过我这两天就调研到一个,就是说欧巴斯啊,一个月无限使用的一个这么一个东西,就有有些人在卖嘛,我准备就这两天调研调研吧,大家可以加一下我创那个欧巴斯的那个群, 大家可以加一下。如果说我觉得比较好的话,我就推荐给大家,大家到时候对吧?反正一个月无限使用就正常用呗。不过,呃,如果比较好的话,价格也比较合适的话,大家可以自行去购买或者去使用,大概就这样吧,今天分享一下,拜拜。

最近 c 蛋子很火,我也试了试,确实不错,没想到今天国产模型扎堆更新了。 d c 最新版 迷你 max 二点五。 g l m 五都更新了,千万可能光顾着发红包去了。宽三点五还没出来,我就用这个最简单的提示词测一测,看看表现如何。 mini max 率先完成任务。这个界面有点太简单了点。这是啥玩意?松开鼠标,小鸟直接不见了,感觉有点不咋地。下一个 deep sea, 这个界面稍微有点复古,也不是很好看的样子。 他的球倒是可以正常运动,只是力度上有点不太合理,只能说比前面好点吧。监问的编程模型应该也好了。没看到预览,我还想下载网页打开呢,结果仔细一看是拍散文件,无语,再来一板吧。 g l m 太慢了,它默认开了 agent 模式。那就再等等它。 timi 二点五也没发布多久,干脆也试试。对了,豆包我也试了一下,也已经完成了。它这个界面配色倒是不难看,不过太简单,而且飞出去的鸟也看不清。 千吻又出幺蛾子了,还以为更新新模型了。是我想多了,直接看效果。这个界面跟豆包有点像,感觉两个差不多,都一样的,不咋的。 g l m 五真是太慢了。 p m 二点五也生成完了,这初始页面有点问题,重置一下就好了。它这个算是有点游戏的样子,像模像样的,不过都是同样的问题,没办法,打到后面的十块, 居然后来車上了,虽然都不咋地,但比前面都强一点。 g l m 居然还没弄完, 怎么又报错了?别人几轮的活都干完了,他还在慢吞吞改错,居然还有报错,绝了,不等了,你们自己去试试吧。

很多程序员的工具链里,终端 ai 助手已经成为了标配。不过说实话,想找一个用起来比较顺手,不用魔法并且稳定的方案,其实不太容易。最近我发现了一个叫 iflow c l i 的 工具,内置国产大模型,还支持 skills 啊,我用起来比较舒服。大家好,我是海拉的编乘客,今天我使用 i flow 给大家演示两个用法,一个是在日常生活中用它来写一些想法验证啊,写一些 poc。 老规矩,我们不打开 ide, 不 手写代码。第二个,我们使用 skus 来对我们代码仓库做一个体检。 好,那我们先打开 icl i 的 官网,在这里进来之后呢,我们先安装复制这一个命令,然后粘贴到你的终端中。 好,紧接着我们需要登录,我们敲斜杠 else, 然后选择第一个登录, 接着我们选择默认的模型啊,也就是 g l m 四点七。 好,我们语音输入,你是什么大模型啊?这也是我最喜欢问的。好,它现在说是 g l m 四点七大模型啊,也就是说我们可以在 iphone 里面使用多个大模型。 在日常的开发中呢,我们会经常做一些想法上的验证,比如说验证某个技术方案行不行啊?老板甩过来一个需求,说,这个淘宝上边的搜图,哎,拍张照片搜到对应的这一个商品,能不能做?我们先进入目录, 我们叫 image search。 接着呢,我们开启 i flow, 我就直接和他聊,老板说什么需求呢?老板说淘宝上面的这个搜图是怎么做的,是吧?那我们问一下他。 呃,我想问一下,类似于淘宝上面拍照搜物啊,搜到某一个商品啊,这个背后的原理是什么?这个专业术语叫什么啊?请回答我一下,谢谢。 我们通过刚刚描述很虚的需求啊,就可以拿到一个术语叫做以图搜图啊。紧接着我们就直接把需求告诉他, 我想做一个以图搜图的这一个,呃, poc 啊,我想请你帮我列出这种最小的需求是什么? 好,我们看一下,这里有一个以图搜图的最小 poc, 核心需求如下,有一个,上传图片特征,提取 相似图片解锁。然后呢,技术组件呢,建议使用 python, 图像模型呢?建议使用 clip, resnet 和 mobile net。 还有一个向量数据库啊,有一个 fast 和一个。呃, milos 啊, 前端呢?简,建议我使用简单的 html, 后端框架呢,使用 fast api 啊,这个包括选型做的都还可以。 呃,这里我有一些不明白的地方,就是图像模型和向量数据库,因为我其实在写 poc, 我 并不完全需要一个数据库,我只需要让他帮我写文件,最后帮我解锁就好了。这一个数据库呢,可能并不是一个必选的像, 而这一个图像模型呢,这里面涉及到很多个模型,我也不知道哪个模型好,但是在写 poc 的 时候呢,我现在需要验证这一个图像解锁是不是 ok 的, 我并不需要做到非常非常精准的图片解锁, 我需要把这一个 poc 跑完。至于模型我们选择什么模型,还是后面选择单独的某一些模型做一个 fight, 这些呢,都是可以在后面考虑的,不属于我们 poc 的 部分,所以我需要问他。 这里我有两个问题啊,第一个问题是模型上的选择,其实我更想选一个比较小的啊,能够跑完这一个是 poc 的 啊,一个模型就好了。然后呢,请你给我一些建议。第二个问题是,我觉得销量数据库其实并不是必要的,我们可以先把东西存在本地,对吧?然后我们就 可以完成这一个 poc 了。呃,你先不要帮我实现它,不要写代码啊,我们验证一下,我们聊一聊, 在实际的过程中,和 ai 聊天的时间应该是占到整个开发比重的四分之三。呃,我的建议是大家尽量花更多的时间和 ai 聊通了。然后呢,再去落实 好。我们大致扫页,针对 poc。 他 建议这一个清亮模型啊, mvnet v 二 resnet efficient net 这个我都不明白。 open clip 啊,这个我是明白的,但是 open clip 我 印象中它的汉语知识不是很好,并且呢,我们只需要做以图搜图,并不需要做一个文字搜图,所以说这个 我们选一个中间一点的吧,选一个四十五的。然后我们看到问题二,向量数据库的必要性啊,说 poc 间呢,确实不需要向量数据库啊,他认同我了。 好,这里面我们看一下,通过 npy 加鱼弦相似度就可以搞定了啊,零依赖,代码简单。然后呢,一千张以上图片会慢啊,慢呢?估计就是解锁方面吧,我觉得这个不是什么大问题。 然后建议方案模型存储后端前端,然后启动时加载模型,从本地 m p y 加载特征库,然后上传图片,提取特征,与所有特征计算相似度啊,这个看起来都还挺 ok 的, 那我们切到一个 呃 plan 模式吧,我们把我们的开发计划再深入的聊一聊。我现在呢,想请你使用呃, esnet 啊,来帮我。这个模型。 后端呢,使用这一个 fast api。 前端呢?呃,我建议你使用这种单页的一个呃页面,然后呢,我希望通过 fast a p i 把这一个网页 host 住啊, 接着呢,样式上我建议你美化一下啊,用一个类似 vs 的 高高科技感的暗黑模式。 然后我们再想一下,在这一个数据流这一边,有一个启动时加载模型,从本地 npy 加载特征库, 然后上传图片,提取特征,与所有特征计算相似度。这里面还漏了一个情况,需要补充一下,我们可以先写,还需要写一个脚本,把这一个几千张图片把它转化成特征库,才能 在上传特征库的时候提取特征,返回 topk。 结果啊,所以说这里面还漏了一点, 是这样子啊,呃,还有一个需求是我需要你,呃,写一个脚本对吧,可以把对应的图片转换成一个,呃,特征 特征库对吧?好,记得一定要开 plan 模式。 他说图片库的数据来源是什么?需要网上下载样本图片的方案吗?啊,这里我已经准备好了, 大家可以看到这里面有 image 啊,我把它这一个移过来, 在这里我们选择 type something。 你说。接着呢,前端页面需要一个拖拽上传图片啊,实时预览上传的图片, 要把它缩小一点。 接着呢,显示相似度的分数,这个需要的点击查看大图呢,我觉得没有必要,然后我们再提交答案,这个时候呢,他就开始做了 技术栈后端前端存储,还有这个计算啊,运行相似度没有任何问题。 呃,有一个 build features 啊,通过特征库来构建脚本啊,也没有什么问题。 核心功能拖拽啊,返回暗黑色的这个科技感 ui, 现在我们可以看到,作为 poc 的 话,一整个规划是比较靠谱的啊,那我们就直接选择第一个, 呃,看一下这个功能特性上面都好,是吧。我们好,我们接下来安装一下依赖 啊,我们大致扫一眼这一个 view feature 这一块有没有问题啊?大致扫一眼,通常情况下不会有问题,但是难说。 好,我们先构建对应的这一个 feature, 接着呢,我们可以给大家看一下对应的这一个图片里面是什么啊,都是些小猫小狗啊 啊,我现在都已经感受到我的这一个风扇在狂转了。 好,这里面已经,哎,已经做完了是吧?然后他写了两个文件来看一下啊,在 matedata 里面写了一些,应该是原数据,然后在这一个,呃, features 啊, py 里面啊,有十四兆啊,它应该是把这一个图片提取成某某些特征啊,它就和人类一样,人类不能像相机一样记住每一个像素,但是人类呢,也是通过照片上的特征来区分的啊。我们启动服务, 能启动吗?哎,能启动能启动,我们打开好拖拽图片。 ok, 接下来我们验证一下啊,我们选一个蓝猫, 把它截图保存下来。哎,蓝猫原来是俄罗斯的, 打开一下,接着呢,我们点击选择把这个图片读过来。哎,我们可以看到,基本上都可以找到懒猫了。 这个输入法真的是变了,选一个吧,选一个放下来保存,接着以图搜图 搜索。哎,我们可以看出来,那这一个小狗就被搜出来了。 poc 写完了,我们还想知道 poc 距离真实的生产还有多远? 我现在想问一下这一个,如果说我真的要做这种宠物上面的解锁呀,对吧?这个搜索到对应的宠物还有哪些这种非常呃硬核的工作是需要做的啊,我觉得是不是 呃 poc 距离生产还是有一段距离的啊?请你和我聊一聊 poc 层面啊,使用的是这一个 oxford, 还有点意思,它是不是读到了哪些原数据 真实呃,生产需要真实场景的图片啊,手机随手拍,各种角度,光照复杂,宠物遮挡,被主人抱着躲在沙发后啊,这确实是 多宠物同框,这也是,然后模糊低分辨率,这是看起来就是非常多啊,然后数据清洗式,这一块标注式,一块数据增强技术啊,构建更大更多样化的做一些模型的特化,就是模型现代化, 这个生产需要 fight, 然后目标检测,注意力机制,聚焦宠物的关键部位, 多尺度的,多尺度的特征啊,这看起来太多了,太多东西需要做了。现实的建议是先做 mvp, 然后逐步打磨,不要一开始就想做的完美啊,这也是符合咱们这一个就是基本要求的。可以看出来, flog 加 glm 四点七给出的这一个建议啊,都是比较重肯的啊,有哪些东西要做啊?有哪些东西是比较硬核的代码啊? poc 的 最核心的部分可能也就几十行几百行代码, 但是要真正的把一整套做出来还是需要很庞大的这一个工作量的。 在上一个项目中呢,我们写的是 poc 啊,写 poc 的 时候呢,就需要 web 扣定一些,氛围编成放松一些。 但是当我们在加功能啊,想让这一个代码变得更稳定一些的时候,那我们就需要加入一些这种质量审核。我之前写了一个 skills, 那 我们打开这个 skills 来看一下,这个 skills 是 我专门用来检查代码的,那 基于代码整洁之道,聚焦七个高收益的检查维度。比如说命名,一定要是有意义的,命名函数要尽量的短小啊。就是,而且要单一职责,尽量减少重复, 尽量规避过度的设计啊,一些魔法数字,还有结构清晰度和 项目规范。呃,每一个问题都会给他排上不同的级别输出的格式呢?是像这种有原则、有位置,有级别,有问题,有建议啊。然后有两个 reference, 并且这里面会开启多个 a 键来扫描这个,这里面我们让他帮我全面做一下审查汇总的报告。每一个维度开一个 a 键 啊,但是要串行完成,不要并行。如果开四五个 sub a 键的长时间跑的话,会遇到并发症问题啊。我们建议他一个维度开一个 a 键的串行完成,一步一步做。 iphone 目前还没有开放并行,但是在他们的论坛里面有并行的体验卡,如果大家有需求的话,可以去看一看, 大概二十多分钟就把任务跑出来了。呃,跑了接近七十五个问题啊,应该是非常给力的,高优先级的大概有十二个,中优先级的有二十九个,我们看一下,大致扫一眼吧, 有些命名啊,这个项目规范啊,我们往后拉一拉看 啊,高优先级,看看删除组建或实现集功能啊,这就没写,是不是然后 mcp test 啊,我这个也是没写。 嗯,这个检查确实是挺到位的。然后消除重复的文件,更新逻辑, 这里面有重复的代码哎,看起来符合我的认知。然后提取关键业务,敞亮, 重构核心业务函数啊,总的说来还是不错的啊。这里面包括有这个 run, open code, s t k streaming 啊,这个函数呢,要提取 event buffer, event handler, session manager 这些类。呃,都是蛮符合我的理解的。 用了几天,我的感受是够用,而且比较省心。市面上大部分固定 a 键呢,有的功能它都有,比如说 m c p, 工作流 skills, 开箱就能干活,登录就能使用。另外,零点五版本加了两个非常实用的功能, 一个是 hooks, 可以 用来做一些提醒。一个是 restore, 如果你搞砸了,你可以回退。当然,我也建议大家用好 git, 这样子你可以做一个双重保险。那我在体验的过程中呢,也有一些不足。 c l i 的 这一个界面上的细节, 我觉得可能还需要打磨一下,比如说我看不到上行和下行的 token, 在 写大一点文件的时候,我非常想知道他在写文件还是卡住了 i f o 官方与社区,他也希望社区能够涌现一些类似于欧曼 open code 的 这样 强大的编排系统。怎么说来,如果你喜欢在终端里干活, i f o 绝对值得你试。如果你也在使用 i f o, 欢迎来聊聊你的使用体验。我是海陆编程课 ai 永不眠,我们下期节目再见。拜拜。

哈喽,大家好,这期视频我们用川 e 来对比看一下现在国内比较热门的两个模型, g e m 四点七和 mini max。 二点一文档中录记的时候打错了,不要在意,我们以普通人的视角出发, 看看能不能编写一些日常使用的工具,因为大部分人只是想要尝试或者编写一些小工具来帮助自己,所以我使用了吹翼,因为里面可以免费使用 g a m 和 mini max, 这对于只想尝试的人来说比较好,没有额外的配置下载就能用。 这是我用于测试的题系词。我们先测试写桌面应用,因为网页边写的测试很多了,我这边就不测试了,测试一些其他方面的效果。这是我输入的题系,因为普通人唱戏的话,大部分时候也就是一句话, 接下来是春意里面优化的提示词,因为时间问题,我这边已经把应用生成好了,我们直接看对比,这是 g e m 的, 我仅仅让它们生成到可以运行出来的第一版功能上,多多少少有些小问题 要进行多轮对话来进行修复。 g e m 基本一次就能让软件正常运行,不过显示上有些问题,再让它改了一两次,然后得到现在这个样子, 不知道大家对这个界面可以打几分?我们再来看 mini max, mini max 这边通过三四轮的对话,然后才可以正常运行,不过效果也还是不错的, 对于 mini max 你 可以打几分?接下来我们测一个稍微小旧一点的东西,终端应用,我让它编写一个本地音乐播放器, 下面是创意优化的提示词,一样的,我们直接看对比,这是 g e m 的, 我觉得不好的一点是他直接把我所有的文件夹列了出来,不过可以再告诉他修改,问题不大。我这个开启播放音乐是可以正常播放的,因为 mac 系统的原因,我录制不了系统声音,所以我们再来看看迷你 max 的 表现。 mini max 这边是直接帮我定位到了系统的 music 文件夹,不过文字显示有点小问题,要动一下才能显示 一样的可以正常播放。好了,总结一下,如果你只是想开发一些小工具来帮助你日常使用,你通过几轮简单的对话还是大概可以做出来的。 但是在我测息的过程中还是发现了一些问题,比如开发桌面端应用,两者都是使用的 electron, 在 安装依赖时会有源下载不动的问题,这个时候你可以告诉它下载不动,它会给你换源,但是有时候普通人并不知道是在下载, 只知道是没有反应,所以还是可以看一点基础的知识,这样在出问题的时候能大概知道,当然也可以在社区进行询问,慢慢的也就知道了。好了,这期视频就到这里,下期视频我们来看看在星球手机应用这方面的表现怎么样,我们下期视频见。

最近把国产大模型都玩了一遍, g l m minimax kimi 会员全开,国外的 gemini cloud codax 也在高强度使用,纯个人真实体验分享 文学创作。 cloud 大 于 gemini 等于 codax 大 于 g, l m 大 于 kimi 大 于 minimax lot 依旧最强,行文和结构最像,真人用着最舒服。 kimi 大 于 minimax cloud 依旧最强,行为和结构最像,真人用着最舒服。代码编辑 codex 大 于 cloud 大 于 gemini 大 于 g l m 大 于 x me 大 于 kimi 大 于 minimax 我 个人更习惯 codex 配合 review 叉 b u g 很 准。 cloud 不是 不行,是 token 太烧,不敢多用。日常任务, cloud 小 于 minimax 大 于 g l m 大 于 kimi 大 于 minimax cloud 任务规划很细, gemini 提示词和图片生成更舒服。 codex 脚本归类也很强。国产里 g l m 综合最强,但经常缺货,不稳定,明显算力不够。 kimi 之前很能打,最近没更新,慢慢落后了。 minimax 虽然复杂,任务一般,但量大管饱,反应超快,我现在简单任务全靠它。不同观点,欢迎评论区聊。

呃呃, 大家好,今天我们来测一下 step 三点五 flash 这个模型。这是一个没什么人关注的模型,但是也是我们国产的哟, 官方表示它在小餐数量的前提下,实现了较高的智力水平。这是一个一百九十九币餐数量的模型,在国产开源模型里算是比较小的那一档。 官方的扳指 mark 里,代码部分的得分有七十四点四,属于是相当不错的水平,同时智能体的能力也很不错,在国产模型里属于出类拔萃,触类旁通 测试已经给你们跑完了,使用的是昂斯洛斯的 iq 三叉叉 s 量化的模型,该量化下模型的大小是七十八 g, 模型本身不支持多模态,只支持文字的输入。 这是一个混合专家模型,激活参数量是十一 b, 所以 推理速度方面也是相当快,属于可以接受的一档。 这里我们可以看到是三十三个 tokens, 每秒回到测试得分部分,最终得分是七十八点一分,超过了 dsp 三点二和 cldsonnet 四, 去掉上下文和多模态的话的是分七十四点一,甚至超过了 cloudsonnet 四点五。从得分的分布情况来看,这是一个问答和代码能力都非常强的模型,可以看到中英文创意写作得到十七分,其中中文八点七分,英文八点三分, 应用文写作则是十八点五分,大家可以自行查看子项分数,数学几何和物理则是十八点八分。最后是代码能力得到了十九点八分,虽然算不上顶尖,但是也算是可用。 下面我们来看看他的代码任务的展示,并拿出千万三二十七币的筹密模型作为对比,在 svg 动画方面,两个模型算是各有千秋,虽然存在诸多问题,但是毕竟是一个很困难的项目。 下面是手机操作系统,其实两者的最终实现效果似乎差不多,都是开源小模型的第一梯队水平。 python 六边形小球任务我个人觉得还不错,但是 cloud opens 则是打了个五点五的低分。 总的来说, step 三点五 flash 是 一个非常厉害的模型,在各个方面的表现都非常出色, 不支持多模态有些可惜就是了。如果我们把几个国产模型拉出来的,我们可以发现 step 三点五其实和他们差不多。注意,这里的 step 三点五 fly 是 经过了很大的量化,性能肯定是有下降的,但是即便如此, 得分也超过了 cloud 四,这意味着大家可以在家里完全离线和百分之一百隐私的场景下使用和 cloud 四一样的模型。曾几何时,这可算是一种奢望呢?

大家好,我是安索杰集团的 kelly。 最近中国大模型在海外火出拳了,像 overralter 这类平台,数据显示,二零二五到二零二六年月至暗面 mini max、 智普、 g l m 这些国产模型掉用量一路猛涨,全球排名都很靠前,核心原因特别实在,性价比碾压。 g p t 四 turbo 输出百万 tokin 要十美元, 咱们国产模型只要十到二十块人民币,价格差了快三到七倍。为啥能这么便宜?关键是西部绿电成本极低, 新疆青海风电、光伏电价比美国数据中心电价便宜一半还多,再加上东数西算把算力往西部转移, 电力企业跨界建制,算中心算电协同,直接把成本打下来了。不过有些说法确实夸张了,大家别被带偏。比如所谓狂飙二十万星的 ai 框架, github 上根本查不到,明显是虚构的。说全面反超美国模型也不客观,调用量大是因为便宜, 真比复杂推理多,模态能力咱们跟 g p t 四、 cod 三还有差距,而且绿色电力经销这种说法也不严谨, 咱们就是靠低成本律电做出高性价比 ai 服务出口。另外也要清醒,风光发电不稳定,东数西算还有网络延迟问题,高端芯片也受制于人,美国还可能出台限制政策, 想走得更远,就得推进算电协调,完善算力基建,用 ai 优化储能调度,打造零碳算力品牌。对我们普通人来说,开发者可以多测试国产模型降成本,企业在非核心场景替换使用, 投资者可以关注算电携同相关企业。总的来说,中国大模型靠能源优势实现性价比出海是真的,但这只是阶段性胜利,把成本优势变成生态优势, 突破芯片和算法瓶颈才是长久之道。我是安索杰集团的 ki, 我 们集团已经搭建好全球渠道,如果需要协助碳中和,请与我们联系,我们下期见。

嗯,准备好你的咖啡,我们要开始拆解今天这份就是极其硬核但也极其精彩的投研资料了。 今天我们要为你深度挖掘的,是摩根试探里在二零二六年三月八日刚刚发布的一份重磅研报。对,这份报告的主角是目前市场上热度极高的中国人工智能领军企业,也就是 minx, 它的股票代码是零幺零零点 h k。 没错,如果你是一名在资本市场里呃,寻找确定性增长机会的股票投资者,或者你仅仅是对科技前沿有着极度的好奇心,那这期深度解码你绝对不能错过。其实你可以想象一下, 我们现在正坐在外资投行的交易台前,首边呢,就是这份最新出路的机构内部简报。 我们的任务就是帮你把这些密密麻麻的财务模型研讨会记,要翻译成能直接影响你投资决策的大白话。这份报告开篇就给了一个非常明确的信号, 大摩重生了对 minimax 的 增持评级,而且目标价直接给到了九百九十港元。你要知道,报告刊写时,也就是三月六日,它的收盘价还在八百五十点五零港元,这意味着华尔街最顶尖的分析师认为 它还有超过百分之二十的巨大上涨空间,这个绝对不是个小数目。确实是这样。报告的核心逻辑呢,大概可以概括为四个发力点,就是平台价值、智能水平提升、需求暴增以及效率改善。我们先呃,我们先从平台价值聊起吧。 看惯了传统 internet 公司的投资者都知道,以前我们看一家平台行不行,主要看它的流量入口有多大。对,也就是看日活月活这些数据。 但 minimax 在 这次路眼里抛出了一个完全颠覆的概念,也就是这份报告里最让我兴奋的地方。怎么说,在人工智能时代, minimax 告诉机构投资者,忘掉单纯的流量吧, 未来的平台定义在于,你能不能推动智能边界的突破。智能边界的突破?这个听起来有点抽象,这是一个非常底层的思维转换。 你想啊,如果一种全新的智能能力能够催生出以前根本不存在的产品品类,那才是真正的平台护城河。呃,等一下,我在这里必须扮演一下魔鬼代言人了。 如果流量不再是唯一的,唯一的护城河,对吧?其实很多人都有这个疑问。对呀,我们以前常说得流量者得天下,难道现在只要技术够牛,用户就会死心塌地用下去吗?这是一个非常犀利的问题。 mini max 的 答案是,在这个日新月异的赛道上,全球的开发者非常现实,他们只会用脚投票,你技术好,我今天用,你,明天别人技术更好,我就走。所以,其实是没有什么情怀可言的。没错, 所以真正的粘性不是靠流量惯性,而是靠急速且持续的模型迭代。 只要你的模型进步最快,性能最可靠,开发者就会把你的技术深深潜入到他们的底层业务里,一旦潜入,那个替换碳温就极高了。完全正确,这就像是长在别人业务的骨头里了。我明白了, 这就好比以前我们投资房地产,看中的是这块地段的天然人流量。现在我们投资人工智能平台,看中的是这块土地上能以多快的速度长出以前不存在的超级物种,以及开发者在这块地上建房子的沉没成本。这个比喻非常铁切。 那既然提到了模型迭代,我们就得聊聊报告里极度强调的一个点,就是从 m 二模型向 m 三模型的跃升。对,大模在这里用词非常强烈,说 m 三系列的设计目标是实现真正的全球第一梯队能力。 这里面有一个核心的战略切换。战略切换是指从注重性比上转向注重绝对性能吗?就是这个意思。 m 二时代,因为资金和算力资源有限公司打的是性比上和速度的战衣,做出一款跑得快不烧钱的产品去占领时长, 先活下来再谈发展。对,但现在到了 m 三,他们追求的是一种阶梯式、跨越式的能力爆发。报告里提到了两个听起来挺高大上的词儿,一个是端到端输出,另一个是多模态输入。 对于我们非技术专业的听众来说,这到底是个什么概念?这和我们现在用的 ai 有 什么本质区别?没问题,我给你打个最简单的比方, 以前的 ai 像是一个分工明确的流水线车间,比如你让他看图说话,他得先把图片翻译成代码,再把代码转成文字,最后生成语音读出来,中间经过了好几道工序。没错,中间要经过好几个中间商,很容易错误,而且速度慢。 端到端就是砍掉了所有中间商原始数据进去,最终结果直接出来,像人类的大脑一样进行直觉化反应。那多模态呢?多模态就是给 ai 装上了眼睛、耳朵和嘴巴, 他不再仅仅是个只会处理文绉的打字员,他能同时听懂你的语气,看懂你发来的视频,然后直接甩给你一段他自己写的代码或者生成的长视频。哇!一旦爱慕三把这两个能力结合起来,他的商业想象空间简直是指数级的,绝对的。 而且提到商业想象空间,最能刺激投资者神经的绝对是报告里透露的这组商业化数据。说实话,我看到这个数字的时候吓了一跳。 mini max 的 年化经常性收入,也就是很多科技公司最看重的核心指标,在短短两个月内,从二零二十五年十二月里一亿美元 疯狂飙升到了二零二六年二月的一点五亿美元,两个月暴涨百分之五十。这种斜率在现在的软件行业里简直堪称教科书级别的爆发啊,确实非常惊人,而且我们要看透这背后的收入质量。 大摩特别点出,这种爆发不是靠烧钱补贴换来的,而是他们的代码计划和开放平台带来的。而且报告里说,这些收入本身就带着正向的毛利率,这点直观重要。这就印证了我们刚才说的, 全球的开发者正在用真金白银为他们的技术迭代买单,生态的雪球已经滚起来了。报告还提到,今年一月和二月, 算力词源的消耗量也出现了包发式增长。这里我想请听众朋友们科普一下,报告里反复出现的这个算力词源,或者日内常说的 token 到底是什么? 为什么它的增长能让华尔街这么兴奋?词源,你可以把它理解为人工智能处理信息的基本计价单位,就像咱们说话时候的音节,或者拼图里的一个小碎片,也就是说,它是一个工作量的衡量标准。对的, 你让人工智能读一篇文章或者写一段代码,它就是按处理了多少个词源来计算工作量的词源消耗量暴涨了六倍。意味着真实的商业世界里,用户和开发者正在极其高频海量地使用 minimax 的 服务, 这反映的是最真实的刚需。没错,没有比这个指标更能说明用户活跃度的了。不过,在这一片大好的增长数据中,我留意到一个极其反直觉的操作公司,在他们非常受欢迎的海螺应用炸漆板后,突然按下了暂停键。是的, 他们把全部精力都转向了下一代架构的研发,把一个当前正在疯狂赚钱、快速增长的产品停掉,去憋大招,这难道不是一种激起某闲的自杀式行为吗?万一用户跑了怎么办? 表面上看,这确实非常激进,但如果你站在整个科技发展史的宏观视角来看,这是一个极其高明的降维打击策略。怎么讲?暂停局部微调是为了集中所有火力攻克我们刚才说的端到端和长视频生成。这些硬核技术 一旦 v 三系列落地,那将是质的飞跃。这就好比你的对手还在研究怎么把马车造得更快, 你已经闭门造出了第一代内燃机汽车。所以,只要新一代产品能带来颠覆式的体验,之前积累的开发者生态不仅不会跑,反而会更加死心塌地。正是这个逻辑, 这需要极大的战略定力。好,接下来我们要进入所有基本面。股票投资者最关心也是这份报告里,我觉得最像魔术的一个部分,利润空间与成本控制。这部分的数据确实非常有意思, 我们刚才说了,他们的算力磁源消耗量暴涨了整整六倍,按常理说,算力消耗这么大,成本肯定也得跟着上天吧?但大摩在报告里白纸黑字写着,它的单次推理成本居然下降了百分之五十以上。 在硬件没有大降价,算力依然紧缺的情况下,这是怎么做到的?这个剪刀叉,正是 mini max 建立起恐怖互成和的关键。 大模分析主要有两个原因,第一是底层的架构优化, mini max 展现出了极其卓越的软件工程化能力,也就是说,它们能用更少的计算资源刨出同样甚至更好的结果。对, 第二个原因就是规模效应带来的赋载均衡。赋载称衡能不能用咱们生活中的例子解释一下?当然可以。就就好比你投资修建了一条极其昂贵的高铁线路, 刚开始一天只跑几趟车,车上还没坐满,这个时候平摊到每一张车票上的固定成本肯定是极高的,甚至要亏本儿没错,但是当你的乘客,也就是磁源需求量暴增六倍之后,你的高铁每天满负荷运转,趟趟爆满, 这个时候平摊到每位乘客上的固定成本自然就断崖式下降了。这个比喻太妙了,也就是说,他们庞大的用户机盘和极高的使用频次,反而成了他们压缩单次服务成本的最强武器。是的, 这其实向市场传递了一个极其强烈的信心。在这场比拼资金效率的人工智能淘汰赛里, mini max 已经掌握了定价权的主动。处于超高速增涨期的企业定价的打磨采用的是现金流折现模型,也就是我们常说的 dcf 方法。 他们在模型中设定了百分之十五的加权平均资本成本,以及百分之三的涌续增长率。稍等,这里必须打断一下。对于很多不看财报的听众来说,加权平均资本成本听起来像天书, 你能不能用大白话解释一下这百分之十五的数字,还有最终得出的五十六倍的市销率,到底在向普通投资者传递什么情绪? 简单来说,你可以把这百分之十五的资本成本看作是华尔街给科技公司设定的一个风险惩罚系数。风险惩罚系数对,因为科技行业变化太快,投资风险高,所以大摩用了一个非常严苛的标准来折算他未来的赚钱能力。 但令人震惊的是,即使在这么严苛的惩罚系数下,大魔依然得出了九百九十港元的目标价,这相当于给了他未来预期营收五十六倍的估值溢价。没错,五十六倍! 这意味着投资者不仅是在赌他能在这个赛道里活下来,他们是拿真金白银压住 mini max, 能够彻底称霸这个赛道,赢家通吃。 这说明,在顶级投行的眼中,他凭借着不断迭代的技术、暴增的经常性收入,以及深不可测的成本控制能力,已经具备了成长为下一代基础制高点的潜质,完全正确。 当然了,任何投资都是有风险的,报告也客观提示了需要关注的变量,比如市场竞争、家具或者价格战之类的。对,如果他的模型底价性能落后于同行,那估值肯定会成压。 但整体来看,只要他的技术底带速度能继续领跑估值体系,就依然有向上冲估的空间,真是非常痛快的拆解。 今天我们一起通过这份研报把这厚厚的数据洋葱拨开,看到了这家企业跳出流量内卷的战略眼光,也看到了他们冲击全球技术制高点的勃勃野心。确实, 从短短两个月暴增的营收,到算力紧缺背景下惊人的成本摇展,所有这些真金白银的数据, 最终撑起了这个千亿估值可立的庞然大物。这家公司用实际行动向次本市场证明了真正的商业价值,在于如何以最荆棘的成本、最快的速度,把前沿智能转化成解决真实世界问题的产品。 这也是每一个关注科技股的投资者必须看清的时代趋势。那么,在节目的最后,我们想给你正在收听的你留下一个值得深思的问题, 当像 mini max 这样的人工制设基础设施企业,凭借着不断下降的成本和飙升的智能水平,开始把触角延伸到各行各业时,它将会如何重新洗盘整个软件生态乃至传统行业的利润池? 这是一个非常宏大的命题。是的,仔细看看你目前的股票账户,你持仓的那些传统科技公司,究竟会成为这场技术浪潮的受益者,还是需要赶紧转型,以应对新一代智能平台的降维打击, 这绝对值得你在这个周末倒上一杯咖啡好喝,复盘推演一番。感谢你加入今天的深度探索,保持好奇,保持敏锐,我们在下一次的信息拆解中再见!