粉丝2253获赞1.3万

智普啊,发布了 glm 五点零,为了测试它的能力啊,我用它构建了一套可以无限运行的 ai 开发系统。我用这个系统运行了长达十个小时,从晚上十点到早上八点, ai 做了几十次 getmate 的 提交, 开发了一个 ai 漫剧生成工具,有前后端有数据库,可以用户注册和登录,还接入了大圆模型,图片生成模型,视频生成模型。通过这个视频,你会学到如何构建这样一个无限运行的 ai 开发系统,并了解到 glm 五点零的惊人开发能力。 整个过程我都只是输入简短的 prompt, 没有亲自阅读或修改任何一行代码。我一直在旁边玩着游戏,等他干活, 尤其是我视频最后会讲的,他把整个项目的所有模块联合起来,然后端到端的 bug 修复错误,非常的牛逼。他不只是单纯的写代码,他甚至自行在浏览器中验证每个功能的正确性,找出 bug, 然后自行在浏览器后端数据库第三方的 api 之间联合调试,找出问题,修复错误。 那赶紧进入正题啊,相信对你会有所启发。我使用的工具是 cloud code, 并且把模型切换为 g l m 五点零,具体方法可以看我之前这一条 g l m 四点七的视频。 那我们首先要搭建一套能无限运行的 ai 开发系统,说是系统,其实就是几个文件,做法非常简单,我把一篇来自 astonopy 的 神级文章发给 ai, 让他自己去学习,根据这篇文章做出这套系统 文章叫长时间运行智能体的有效调度编排框架。那过程中 ai 做出了一些操作预期的举动,他通过 m c p 打开浏览器, 通过这篇文章的页面找到一个配套的 get up 仓库,打开仓库的代码文件进行学习。而我事先都不知道这个代码仓库的存在,最终他创建出了这一些文件。 我解释一下最重要的几个,帮你理解一下这套系统的工作方式。 task 点 jc 文件,其实就是一个任务列表,每个任务都有它的描述,并且会标记是否已经完成。和我们人类工程师每天上班一样, ai 每次从这里面领取一个任务, 完成后就做一个标记,这样他的 ai 同事啊,就知道项目进展到哪里。 progress 点 txt 文件,每次 ai 完成任务啊,或者任务失败后,都会在里面留下工作日期,这也是为了给其他 ai 同事提供一些信息。 log 点 m d 文件,这里面全是提示词,用来指导 ai 根据固定的规范流程工作。和我们人类工程师的开发流程类似, 第一步,跑一个脚本,来初识化整个项目的环境。第二步,在 task 里面领一个任务。第三步,就开始开发。第四步,测试和验证。 第五步,更新 progress 和 task 文件。第六步,用 git 提交代码。那如果中间遇到困难,需要人工介入,它就要及时向人求助。那在以前一些长期运行能力不强的模型中啊, 这么长的开发流程,一旦工作上几十分钟,模型就会逐渐混乱,不再按照规定的流程工作,而如今完全没问题啊。视频后面我们会看到, glm 五点零,即使在长达一个小时的工作,提交了几十个 commit 后,仍然很好地遵循开发规范。 然后呢,我让他写一个脚本,用来无限时间的运行。这一套开发流程背后的原理很简单,就是把 cloud code 放到一个 while 循环里面,这样一来,人不在电脑旁边的时候没法手动 prompt, ai 就 可以执行这个脚本,让 ai 无限的工作。它之所以有效,有几个原因啊, 第一,我们这套流程每次只要给 ai 说一句,完成下一个任务,不需要更具体的指示, ai 就 能通过 task 和 progress 文件知道自己现在应该做什么。 第二,每个 task 都很小, g l m 五点零足够的强大,每一次 y l 循环里面,他只是领取一个很小的任务,并且严格的测试,成功率极高。第三,每完成一个任务,模型的上下文都会被清空,所以模型始终保持在最聪明的状态。 第四, g l m 五点零非常可控,严格按照工作规范执行,每次小任务都会进行 commit, 所以 即使出错,我们可以轻易地回滚到旧版本。 好,现在我们这套系统有了,接下来就要开发软件,我们先来设计一下它的功能和架构。这个软件的用途是一句话,生成长视频。我让 ai 把整个项目的开发需求拆成了三十一个任务,放到 task 文件里。 这是 ai 设计的软件,架构不复杂,但五脏俱全。再看一下 ai 画的业务流程图啊,帮助大家理解我们要开发的这个软件具体的功能。 首先,用户会创建一个项目,然后用大圆模型生成每一个分镜的文字描述,然后再用图片模型生成每个分镜的图片,再用视频模型生成。视频开发的流程比较长啊, ai 做了几十次提交,我就选几个精彩的给大家讲。 在 ai 做到第十九个任务的时候,为了测试 glm 五点零的能力呢,我产生了一个大胆的想法,我让他一口气做了一个多小时,完成了十一个任务,干完一个又一个,中间我没有任何干预, 给大家倍速感受一下效果。他一直在写代码,并且每次都遵循我们的开发规范,每个任务都完成,测试一个,一个任务,单独提交代码,拿一个具体的任务作为案例啊。他现在领取了任务三十,任务目标呢是实现响应式的布局,也就是让 u i 在 手机端和桌面端看起来不一样。 他现在正在修改代码,然后验证项目能 build 通过。然后他现在把浏览器的大小变成了手机屏幕大小。打开了我们的应用,他点击了一个按钮, 他对页面做了一次截图,用识图的 m c p 判断是否正确。再打开了一个新的页面,再做了一次截图,并检查是否正确。然后在 progress 里面仔细描述了自己所完成的工作,然后把这个任务标记为完成,他就按这么一套方式疯狂的干完了每一个任务。 要接入数据库的时候呢,他主动提出需要人工帮助,并且一步一步地给我说明,告诉我如何去这个 superbase 平台啊,点哪里创建项目,配置数据库,获取 api key。 尽管我没怎么用过 superbase, 仍然轻松地操作下来了。中间我还犯了错误,给他提供了错误的 key, 也被他及时发现,最后他还让我帮他去注册一个测试账号,然后他自己打开浏览器,输入账号密码,验证登录功能,可以正常使用。那像 superbase 这种外部的系统啊,超出了 ai 的 控制范畴。 g o m 非常明确的给我提供指引,让我协助他完成开发工作,一个不了解后端的人,也能在他的指引下完成数据库的配置。 他开发完后端一系列 c r u d api 后呢,声称对每一个 api 都进行了测试,但所有的 api 都是需要 os 的, 前端也还只有一个空白的页面,所以我就很好奇他哪里来的 os 权限,怎么完成测试,是不是在忽悠我? 于是我问了他一下,他用简短的语言,漂亮的格式向我解释。他说他打开浏览器,登录了刚才创建的测试账号, 然后通过一个叫做 browser evaluate 命令,在浏览器可以执行任意的 javascript 代码。然后他写了一些临时的 js 代码,就在浏览器里运行,调用我们的后端 a p i, 这样就能有 office 了。非常聪明的做法,我还怕他在骗我,我检查了一下录像,确实如他所说,他打开浏览器疯狂测试, 中间还真测试出不少问题,他就自行查看后端的报错日期,自行修复。最终三十一个任务全开发完后,啊,我也懒得去人工验证这个项目是不是已经可以用了。在往常的开发中啊,到最终阶段,因为已经把 前端、后端、数据库、第三方 api 全部连起来了,那第一次的集成测试啊,就会非常头痛,因为任何地方都可能出错,往往需要浪费大量的时间再把错误找出来发给 ai, 让 ai 去修复。但这一次我非常大胆,我只说了一句话, 请你完整测试一遍流程,确保功能可用。大概就是从早上七点十分开始,他自己在浏览器上疯狂测试,花了一个小时提交了这么多改动,用来修复 bug。 我看他在浏览器上像人一样一步步操作我们的产品,通过截图和视觉能力来判断是否符合预期。遇到问题的时候呢,他就自己查询后端的报错,检查各种 api 的 状态,综合分析出问题。最终他总算顺利的生成出了第一个视频,端到端的把整个应用全部打通了。 他修复的每一个 bug, 做的每一个 feature, 其实我都不清楚是什么情况,但我想知道的话,我只要找到他的 commit 记录,看一下他在 progress 文件里写了什么。这也是这套流程的强大之处,一切都是可追踪的。 我们让 glm 五点零一边开发项目,一边在开发过程中发现问题,让 ai 来增强我们这一套自动化的开发系统,左脚踩右脚,螺旋升天,我相信这就是未来开发者的工作方式。总结来说, glm 五点零已经远远超出了单纯抠顶的范畴,而是能对软件工程的每一个环节进行自动化,提升效率。 gm 五点零在超长任务上非常出色,已经达到了能让我放心的交给他连续运行一个小时的程度。横向对比的话,我个人认为 gm 比刚发布的 oppo 四点六弱一点,但在一些方面可以超过 gbt 五点三。 重点是价格便宜非常多,但现在过于热门啊,供不应求,抠钉套餐非常难抢。那我们这个项目呢?虽然现在端到端全部打通了,但最终深层的视频效果还有很大优化空间。点赞到一万,我可以开源出来,让感兴趣的人进一步优化它。

呃,这个视频来讲一下这个质朴 api 的一个调用,可以批量的去生成一个内容啊,只需要调取这个函数。呃,这个内容本来是不想讲的,因为这个质朴的 api 的文档写的很清楚, 但是有网友还在问这个智普的 api 怎么调用啊?所以这个内容还是来讲一下这个智普的 api 的话,目前是有一百万的一个头肯的免费的额度吧。如果你去认证的话是四百万 啊,像我这里是没有认证啊,没有认证的话是一百万,我已经用掉一点了,所以在这里只有九十多万。呃,我们可以点开他的一个控制面板啊,我们在这里可以看到完成这个实名认证的话,可解锁四百万的一个抖坑。但是如果你不是频繁的使用 用的话,目前的一百万已经足够使用了。这个的话就是他调用的一个文档,首先你要去按照这个库啊,这个库的按照的路径就在这里啊,他这里都是写的很明白的。 然后我们一般调用的是这个同步的一个调用,一步的调用的话,嗯,是返回的内容不一样, 我们使用这个代码去使用就可以了,但是他返回的信息不是直接的一个文字,他还有另外的一个内容,他返回的内容有一些是不是我们想要的啊?你可以去尝试一下,我这里就不去演示了,这个是他官方的一个文档啊,我们来看一下我们调整后的一个代码, 调整后的一个代码就是这样,我把这个调用的一个 a p i。 呃,你可以放到这来。呃,也可以放到这来,这里的话就是一个前集的一个 a p i。 嗯,你放到这里面的话,就是局部 调用的话,你就把这个 api 填上来,填上来以后你要问什么你就在这里,当然你也可以直接写到这里来,因为这里是调用这上面的一个函数的。呃,我们可以去生成一下,而生成的话他这里演示的是错误的,因为我这个 api 并不是这个真实的 api, 我们可以把这个 api 放到这里来, 我们可以再去生成一个 api 的一个密要,然后用完之后可以删除他。我们找到这个控制面板,然后我们查看这个 api, 然后我们去新建一个 api, 随便吧。然后这个 abi 去复制,复制以后把它放到这里来,然后我们去生成,我们可以看到他这里就是一个回复啊,如果你要批量的去生成这个 个内容的话,你可以读起数据库或者这个 excel 里面的一个提示词,然后让他批量的去升 产,自己要把这个提示词放到这里来就可以了,你可以啊,通过循环的一种手段啊,批量的去生成这个内容 啊,这个就是质朴 api 的一个调用,这个内容是没什么好讲的,就是对这个官方的 api 的一个文档的一个啊,修改他返回的一些内容是我们不需要的,不需要的话我们就把这个中心内容提取出来就可以了啊,这个就进行一个返回啊,这个内容就讲到这里。

哈喽,大家好,这期视频给大家带来一个可漏的扣的快速安装指南,我用的是吉普 glm api 配置可漏扣的一个方案,大家可以根据自己的实际情况可以选择一些国产的大模型来配置这个可漏扣的。安装之前需要有一个前置的条件, 大家可以看一下这些,前边的工作要做好准备,那下面我们进行我们安装的第一个阶段就是验证 note g s 的 安装环境是否存在,大家可以直接搜索终端,打开终端之后输入一串验证版本号的命令符, 它会直接出现版本号,只要出现版本号就说明你的这个环境是存在的,大家可以进行下一步,要是没有这个安装环境,可以直接去 note g s 的 官网去下载一个, 大家可以根据自己系统选择对应的下载的版本。布置好这个安装环境之后,就可以进行第二步,全局来安装一个 coloco 的。 同样的打开终端输入命令符, 因为网络的原因,每个人的时间可能不一样,通常是一到两分钟就可以安装完成, 大家可以验证一下是否安装成功。好这一串命令符同输入到这个终端里,按回车 会显示一个版本号,我的是二点一点三九,那说明这个可洛克的已经是安装完成。第二阶段就是获取一个 api k, 那 我们用的是智普的一个方案,大家打开官网去申请一个智普的账号, 注册完毕后,我们进入个人征信,点击 api k, 添加新的 api k, 出现这样一个界面,为了方便起一个自己能记得住的名字,点完确定之后,它会生成一串字母,这就是我们智普的 api k, 相当于 呃上网的一个钥匙,这个 api k 相当于一个账号和密码,不要分享给其他人。这步完成之后,我们的 api k 就 有了。第三阶段就是配置环境,在终端里面输入这一串字母, 会进入到一个环境变量的配置的编码工具,这里边会有一些界面语言,编码套餐, api k 和编码工具的一个选择,大家摁上键下键就可以勾选这些选项,点击回车时进入到它的页面 选择 api k。 进入到这个界面之后,这里会要求你输入你的 api k, 六二 l 这些配置,因为我之前已经是配置过嘛,大家可以根据它的提示添加 api k 和六二 l。 配置完环境变量之后,我们就可以启动可拷库等,同样的还是在终端里边输入可拷的命令,它会跳出一个这样的界面, 系统询问是否给这个可拷的授权的一个界面,大家直接选 yes, 然后回车就可以。 回车之后就会出现这个小黄人的界面,你可以跟他输入一个简单的招呼,他回复我,他是可 logo。 那 到这就是所有的安装流程就已经完成了,大家要是还有不会的,可以在评论区里边打教程,我发给你关键的指令的代码。 后续我还会出一些有关可 logo 的 实际的应用场景,包括做一些 sky, 或者是写一些爆款文案,大家有兴趣可以关注我。

想用千问,又想用 deepsafe, 还得一个个申请 key 掉接口,太麻烦了!今天教你一招,零成本一个接口搞定所有顶尖模型!这就是刚刚升级的树眼智能模型广场,它最大的革新就是大局统一 api 看这里,只需要配置一次 deepsafe 智普 mini max, 主流大模型随便切,不用再为每个模型单独写代码,效率直接起飞。

想让 cloud code 用上智普 g l m 五,别翻文档了,一行命令就够。为什么用 xcloud 的 智普不用改环境变量,不用研究配置文件? cloud code 的 工具能力还在,智普的代码理解更强,装了 x command 的 话,十秒内搞定全部适配。 操作很简单,去智普开放平台复制 api key, 回到终端,敲 xcloud 的 智普首次会让你粘贴 key, 然后就能直接用了。让它重构代码,分析性能,生成数据库表,响应又快又准。 cloud code 原本的功能一个不少,替换一次就永久生效。试试 xcloud, 智普国产模型也能这么丝滑,不要忘记一键三连!更多命令技巧欢迎关注 x command, 我 们下期再见!

给大家分享三个可以免费使用智普 glm 四点七 ai 编程大模型的方法,记不住的同学记得点赞收藏。第一个就是 idea 中的插件,点击 settings 中的插件市场,我们搜索 code body, 在 这里我已经下载好了, 有些名字可能比较像,大家一定要下载这个官方的哈,下载完了之后点击确定和应用,然后我们在右侧呢就会看到这个 code body 的 插件,在这个地方我们可以选择 glm 四点七,这个是免费的,而且这还有其他的模型,比如说 kimi, 还有 deepsea, 这些都是免费的,还有这个 混元。第二种免费使用 gm 四点七的方式就是 open code, 这是它的官网,然后我这里已经下载好了一个在 open code 的 这个编程软件中,在这里可以选择 gm 四点七,这里还有一些其他的免费的模型,比如说 gucci, mini max, 这里都是免费的,还有 gbt 五。第三 种免费使用 gm 四点七的方式就是 build 伊美达的官网,我们登录之后呢,可以在设置中创建自己的 api key, 在 这里可以生成你的 api key, 然后你就可以愉快的使用 gm 四点七了。以上就是免费使用 gm 四点七编程大模型的方式,大家不要觉得 gm 四点七免费就怀疑它的能力,它可是我们国内开源 ai 编程大模型第一名, 在各个维度可以说都是顶级的存在,因为它是开源的,所以说像英美达他也会用自己的服务器去部署这个大模型供大家使用,也是希望更多的人可以用英美达的产品吧。大家可以薅一波羊毛,我是不吃辣, chris 关注我,带你了解更多 ai 相关的开源项目和工具。

兄弟们今天研究了一下 open code 它的安装和应用,给大家汇报一下。它的安装很简单啊,就是把这个放到命令行里头安装就行了。但是在这个之前的话呢,如果你的电脑没有装这个 note g s 的 话,你需要去安装一下这个, 先去安装一下这个 note g s, 然后安装完了之后呢,我们就可以做这个安装了啊,就是这个命令哈,我们来安装一下 它,这个要等一段时间哦。 好,现在现在安装好了,我们直接在里头敲 open code 就 可以启动了。 那现在这个界面我们已经进入到 open code 这个里边了。呃,目前来讲的话呢,我们可以用这个模型来去看一看,匹配一下它有哪些模型可以选。这个里头有几个 免费的模型,比如说。呃,这个智普的四点七,这个其实可以的啊,大家可以试试一个国内的一个呃,很著名的模型, kimi 的 二点五现在也能用了, kimi 二点五最近也很强。呃,那我们在这里头给大家介绍一下,就说如何。呃,把更多的模型放进来。 首先的话呢,我们知道那个 gemini 它最近比较火嘛,然后它也推出了自己的一个工具叫 antigraviti, 对 吧? 我们把这个给它加进来。 antigraviti 呢它,呃,这个里头有两个模型是可以免费用的啊, gemini 三和 cloud opera 四点五啊,这个都是很很顶尖的模型了。 那但是呢,他这两个模型吧,你可以用他的给的额度有限啊,大概你用上一两一两个小时他就额度就用完了,但是呢,我们至少是可以免费用啊,这个还是挺好的,他大概过一段时间他又把这个额度给你恢复了,就这样 安装的时候也很简单哈,安装的时候呢,我们就把这把这个给他 copy 一下,然后在这个里头安装就可以了。 那等一会呢,它就安装好了,到这我们这个就安装好了,我们现在重新打开一个窗口去启动它, 我们在这启动的时候啊,启动刚才这个,在这个界面,我们把这个模型供应商选择谷歌, 我们选这个 anti gravity 的 这个登录方式,然后敲回车 project id 这个地方,直接回车,这个地方要登录一下自己的谷歌账户, 然后把刚才这个生成的这个粘贴到命令行, 敲回车, 我们点一下这个,我们把生成这个放在粘贴过来,然后回车, 我们重新打开 open code, 然后现在这个里头呢,就应该啊 有谷歌的模型了啊,看到没有?我们现在已经把它加好了, 但是这个里头的额度有限哈,如果你想敞开用的话呢,你就就用这个 open router 的, 我们也可以给它接上 open router 的 斜杠 connect, 然后这个里头我们就可以看到它,我们可以接很多种模型,比如这里头我们找一找 open router, 然后撬回车,这个时候呢我们需要一个 api k, 对 吧? 呃,那这样的话呢,我们就需要去登录一下啊,登录一下自己的这个 open ai, 然后比如说我已经登录到 open router 里头了,然后我们创建一个,嗯,创建一个 api k, 对, 那拿这个然后 copy 过来, 这时我们看到我们已经加了很多了 这个,这个底下 openroot 的 底下的所有的模型我们都可以使用它会,嗯,这个费用会寄到你那个 openroot 的 账户上。 现在我们这个里边的模型已经很清很多了啊,大家就可以选择去用就用就行了。好,今天分享就这么多,谢谢大家。

免费了,不要三四九九,也不要九块九,不包手机的平替智普的开源项目 open auto gm, 配合它的开源模型 auto g o m 九 d, 咱们也能实现手机 agent 的 自由。我用手上这台安卓手机和 mac 电脑搭好的环境,让他来帮我购物, 这是执行效果,提示词是在淘宝上找到帮宝适黑金刚 l 码最低价的商品,加入购物车,然后发微信告诉我商品选好了。我来看看。这套开源方案和豆包手机最大的区别有三点,第一, 一,运行级别不同。开源方案只能在前台运行,豆包手机可以在后台自己默默的运行。第二,手机的便携性不同。开源方案手机和电脑必须用数据线连接,或者是在同一个 wifi 下,豆包手机可以只拿着手机到处走。三、智能程度不同。 开源方案接的是九 b 参数的小模型,能完成大部分的基础场景,但是极限智能比不上豆包手机。推荐两种适合的使用场景。 场景一,操作电脑忙不开的时候,比如快下班时提前叫车,当同事还在等车的时候,你已经上车回家了。场景二,需要在手机上多个 app 之间切换,收集数据,分析并且最终操作手机的场景。比如说在双十二购物选择最低价格商品时,我的微信收到消息了,任务完成。 牛逼!那么这么牛逼的手机, a 镜的方案会不会很难配置呢?完全没问题,我摸索了一套极简方案,只需要一行命令和一句话就能配置好。 首先看我这期视频,一行命令把 cloud code 安装好,然后打开 cloud code, 告诉他这句话,一路点同意就能安装完成整个配置过程,需要用数据线把安卓手机 在电脑上这么简单都能就能搞定,快去配置一套试试吧!你还有什么场景想用手机 app 来解决的?详细的安装过程和常见问题我会总结成文档,方便大家查看。关注我,玩转 ai 编程。

这些海报封面信息图,全是用最新国产开源模型 g l m image 生成的,一张只要一毛钱。你可能也用过不少生图工具,目前在这个领域啊,基本上呢,就是 banana, banana 的 天下,效果呢,确实很强,但也有一些无法回避的问题, 价格贵,要用受限部署呢,还不开放,对开发者和中小产品方都不太友好。但现在破局者来了,智普啊,联手华为,给我们带来了一个开源界的国产平替 g o m image。 我 用 g o m 四点七呢,搭了一个网站,调用官方 a p i 啊做了实测,你看这些啊,文字清晰,排版精准,直接都可以商用了,而且啊,价格亲民,一张图呢,只要一毛钱。 不过这事最牛的地方其实不在于模型本身,它背后啊,是真正的国产全站自主可控。这句话听起来啊,可能有点宏大,我来给你拆解一下它呢,不仅仅是开源了一个模型代码,而是从底层的算力开始,就 实现了全面突围。整个模型呢,从数据处理到大模型训练,全程跑在华为的升腾芯片上, 用的框架也是咱们自己的升思 minus pro 框架,这在以前啊,是很多人不敢想的,大家总觉得顶尖的 ai 模型必须得靠国外的显卡才能跑起来,但今天智普和华为联手,证明了我们已经能在自己的土地上,用自己的算力训练出世界前沿的大模型。 这难道不就是 ai 生图领域的华为时刻吗?智谱的 g l m image 可以 说啊,是真正开启了国产算力的新格局。 本期的案例啊,我已经整理出来了,还不会本地部署的朋友们呢,也可以去智谱清颜的 app 或者官网点击 ai 画图智能体左下角呢?选好 g l m image, 让我们一起感受最前沿的国产算力表现吧!

hello, 大家好,我是迪迪,今天想跟大家分享一个食谱的最新的一个模型,那它最新上的这个模型呢,叫 glm 五,那这个模型有多强?那个架构上面又做了哪些升级?和 cloud gpt 五以及 gimna 比起来又是怎么样的一个情况? 我们先来看一下它的大的背景,就是去年的十二月份,它是出了 g l m 的 四点七的模型,那总的参数呢,达到了三百五十五的比脸,那现在只过了两个月的时间,它就达到了整个参数七百四十四比脸,参数量呢,其实直接翻倍了, 但就要注意的是,其实参数量翻倍了,就并不等同于推理的成本翻倍。这两套其实都用的是 m o e 的 一个架构,也就是 mixture of experts 的 架构,什么意思呢?就是模型虽然有几百的列的一些参数,但每次推理的时候呢,它只有小部分的一些专家会被激活,所以 gm 四点七,每次推理的时候呢,只激活三十二变量的一个参数。而 gim 五呢,它每次的话是有四十变量的 parameter 会被激活。所以说虽然说整个模型的参数变大了,但是其实整体的推理成本增长还是比较有限的,而且比较可控的。 那从两个架构图上面来看,其实是有三个关键性的一个变化,跟大家分享一下。第一个呢,是注意力机制的一个全面升级,可以看到 g i m 的 四点七呢,用的是 grouped query attention, 也就是 g q a, 那 这个是目前比较主流的一个做法, 那 g i m 呢,它用的是 multi high latency attention m l a 加上了 deep seek 的 sparse attention d s a。 那这个 isigma 不是 去提出来的,核心的优势呢,其实就是能够大量的去压缩 k v cash 的 大小,在上下文推理的时候呢,能够既省并且又快一些。所以智普相当于这一次直接是把这一套方案它的一个框架给拿过来用了,说明 mla 在 行业里面还是比 较认可的。第二个大的一个层,它的一个大幅度的扩容, 专家数量呢,是从一百六十个增加到了二百五十六个。而每个专家的一个输入的维度呢,是从啊五千一百二十到了六千一百四十四个。 另外呢,中间的投影的维度呢,也是从一千五百三十六到了两千零四十八。但激活的策略还是没有变,就是每个 token 只激活八个专家和一个共享的专家,也就是说模型整体的知识容量变大了,但推理之后,它的开销,它的支出其实增长的非常有限,这就是 mo 一 这个了业的一个精髓所在吧。 第三个呢,就是整体的结构其实更加矮并且胖了。那 gim 可以 看到它是由九十二层的 transformer blocker 来组成的,而 gim 五呢,它是由七十八个层,相比来说,它整体被压缩了, 那每一层其实变得更宽了。 embedding 的 维度就是从五千一百二十变到了六千一百四十四,那字表示从 一百五十一 k 到了一百五十五 k。 所以 总体来说呢,这些简层增宽的设计的思路,设计的架构,说明啊,智普在训练架构模型的时候,更好的去追求了训练的速度和并行性, 那接下来我们其实是更关注于每个模型它之间的一些性能的比较,那这样的话我们在才能在真正的工作场景里面去挑选出哪个是真正适合于我们用的一些模型。 这边其实总共就比较了五个主要的模型,包括 gim 四点七五啊 cloud, 它当时是用的 opus 四点五,以及 gimn 三 pro 和 gpt 五点二的 x high。 那 在这里我们主要来看几个跟我们比较相关的。一个是 software engineering bench verified, 它代表就是 coding, 那 在这个 coding 的 情况下,啊五的这个模型比四点七的有明显的增加,但是还是略低于 cloud 以及 hpt, 就是看 agent 的 能力。这个 browse camp 这个网页浏览的任务上面可以看到 g o m 拿到了七十五点九分,直接超过了所有的一个选手,包括对手的啊 cloud 和 g b t 的 六十五点八啊。还有呢就是像 vending bending bench, 它代表的是什么?就是衡量的是模型在模拟商业场景中的一个实际的收益能力,怎么样去理解呢?它的就是能够真正帮你的商业去落地。这边可以看到啊 gimna pro 的 这个明显是高于其他的,包括有五千四百七十八美元。 那 g i m 呢,相比于五比四点七显著了增高了很多,那在这个领域呢,也是有明显的一个上升。就我们来看一下这个 humans latest exam, 它也是啊,遥遥领先,高过了其他所有的一个模型,这个其实就是一个人类最后的一个考试。对整体来说,它的出现 对比于自己以前的四点七模型,其实都是有显著的一些地位的提升, 那国产模型和国际的一些顶尖模型的差距其实非常小的,在部分的 benchmark 上面, glm 五其实已经有一些反超。那第二呢?就是 mle 加 mal 的 这一套技术其实正在变成行业的一个共识,无论是我们 deepsea 啊,智普,还是其他的一些团队,大家都找着这种大的一些,参数低的一些,激活的一些方向去走。 第三个的话, agent 的 能力其实会成为一个新的竞争焦点,你会发现所有的 benchmark 里面都有大量关于代码的修复 啊,终端的一些操作,网页的浏览工具的调用这些测试,那谁的 agent 的 能力更强,其实很有可能在应用层里面能够更先脱颖而出,然后在下一轮的竞争中拥有绝对性的一些优势。今天想跟大家分享的就是智普的 gm 五的一些拆解。

你知道怎么白嫖今天智普发布的一个最强冰城大模型 glm 五,下面我就来给大家讲一个白嫖 glm 五的一个方法。 首先我们打开微修 studio 这个开发工具,然后在它的左边找到 extension, 也就是插件的扩展中心, 然后我们输入 k i l o 搜索,就能搜索到 k i l o call 的 ai call d 键头这个插件,点击它, 然后我们再安装这个插件,装完之后就会在这个开发工具的左下角有一个 k i l o call 的 一个小图标,我们点击它,点击它进来之后,在它的最下面, 在它最下面你看就能看到一个最点 a i g l m 五 free 的 一个大模型,我们选择它就可以开心的白嫖啦,是不是很简单? 据说这个智普的 glm 五编程大模型是比酷的叉五点三和 opus 四点六都还要强,所以大家感兴趣的赶快去体验一下, 因为啊,大家如果有什么看到免费的拼成模型,可以大家一起在评论区分享一下,别独享好东西,大家一起共享好不好?

最近我在做一个 mac 端的 mcp 工具啊,它可以把不同的客户端通过 mcp 的 能力去调取你的日历啊,提醒事项啊这些 客户端的产品。然后比如说你直接在客户端说一句,整理我最近一周的日程,然后发送到我领导的邮箱,并同步信息给我, 这样子的话他会,他就会去看你的日程,然后写一篇邮件给你领导,然后再到通讯录去找我的电话号码,并给我发送信息,他会自动完成这一步流程。对,然后我做了一个引导页, 对,然后我最近在参加一个模型的一个分册活动,然后我直播把它丢了一个链接,这个把链接给他,然后他就直接帮我写了这一整套东西出来。对,然后我是运行一下,哎呦,在哪里?在这里 点运行。 ok, 我 感觉这个东西长得就跟我设计稿已经差不多了吧,基本差不多,然后看下一页效果也觉得挺好的。再下一页, 然后这里我就简单列了一个列表,然后他就会根据我的功能自动把我排布出来,然后这里也是用的液态玻璃,效果。 ok, 点下一步准备就绪,然后他就会告诉你这里托盘有个图标,可以点进去配置。 ok, 然后这里可以看到这个就是我做的界面,而且这个界面也是我一开始用设计稿做完给他的,这个就是我的界面,我把所有界面都写在这里,然后也是发一条链接,他就去帮我生成, 然后我点切换,他也可以看到我所有的列表开始进行的切换,这里可以看到我起用的工具,还有调用的次数,然后这里我还没做处理,就是他会被屏幕太长被截取掉, ok, 就 这样子。

你好,我是陈博士。智普 ai 那 个二十元的编程套餐,到底是真福利,还是个甜蜜陷阱?月付只要二十块,却能用掉价值上万元的算力, 听起来是不是太美好了?但别急,这事没那么简单。智普 ai 的 抠定 plan, 定价低到原价, api 的 零点一折,表面看是白菜价,实则可能埋着大雷。 为什么?因为程序员可不是普通聊天用户啊。举个例子,你写个函数自动补全,可能就吃掉上万头啃。 要是边调试边高频调用,算力消耗速度轻松达到普通用户的三到五倍,系统根本扛不住这种硬核使用。超售的后果已经来了。 从今年初开始, glm 四点六和四点七的 api 并发连接数被砍到只剩一,不少企业客户反馈,调用频繁失败,生产环境直接告急。这不是谣言,而是真实发生的限流事故。对比一下更吓人。 cloud pro 月费二十美元,每五小时最多发四十条消息,而质朴二十元人民币却给一百二十次调用,价格低七倍,额度还高三倍, 性价比失衡高达二十一倍,这账怎么算都离谱。说实话,这不像在做产品,更像一场豪赌,用弊端客户的利润去补贴 c 端用户的烧钱狂欢。招顾书里写得清清楚楚, 百分之二十二点一的成本是算力支出,而这个低价套餐正在加速把公司拖进亏损泥潭。有意思的是,全球三分之二的算力现在都用在推理上,资源越来越紧, 可智普还在推无限量套餐,这就像在干旱季节开免费水龙头。当算力变成稀缺品,这种低价狂欢注定撑不了多久。从一月二十三号起,智普每天只开放百分之二十的新订阅名额,老用户优先续订。 这已经不是什么饥饿营销了,而是赤裸裸的算力告急,信号系统真的快跑不动了。当然, glm 四点七模型本身确实强, swbench 登顶也让人振奋。但问题来了, 如果连基本的 api 都频繁超时调用失败,再牛的模型也只能是空中楼阁,看得见摸不着。说到底,智普 ai 因为这个二十元编程计划过度消耗算力,不仅暴露了商业模式不可持续,还拖累了正常 api 服务。 零点一者的头肯,程序员的高负债并发症降到一,这不是福利,是系统性风险,建议开发者别太依赖它的免费层,企业用户更要认真评估 s l a 保障智普若不赶紧回归理性定价,再强的技术优势,也可能被运营失误一口吞掉。

我去,兄弟们,今天大模型啊,可能要爆发了,一定要关注一下。就在刚刚,智普宣布从今天开始对 gm 康宁 pro 的 套餐价格进行了调整,整体涨幅百分之三十起。取消了啊,首购优惠保留按季按年定月的优惠,从今天开始正式生效了。昨天晚上啊,云服务商优克德也宣布了涨价,兄弟们,涨价的逻辑开始延伸到了大模型这一块,势必啊, 懂了吗?还有一点,大模型在年前这么积极,肯定春节期间有更大的动作,我觉得啊,这一块必须重视起来,拿着过节反而可以。兄弟们,关注我,不迷路,带你吃肉!


这个智普简直太强势了,四天股价翻了一倍,我的天呐,简直不可想象!你们知道他最新发布的这个 grm 五有多强势吗?这个模型啊,是对标 astropics 最新的 cloud 版本的, 它上线了之后涨了百分之三十的价格,但是当天刚发售,就所有算力被抢购一空,这件事情在中国软件身上没有发生过的。你什么时候见过一个中国软件被国外的人抢着买,把算力全买空了,没有发生过这种事情 啊,这个世界简直变化太快了。就你知道现在还有人说 ai 是 泡沫,是伪需求了对不对? 至少在抠定这个领域,大家是真金白银在买呀,因为它能替代程序员呀,它能大幅度节省公司的成本和开支啊,这绝逼不是伪需求啊,这是真真切切的需求啊。