粉丝149.6万获赞2811.5万

兄弟们,智普 g l m 五上线后,流量爆发式增长, g l m codeplay 更是上线即受气,算力都不够用了。智普发公告称,团队在全力协调算力资源,加速完成扩容部署,关联的是云浮商和国产算力。二、 双良节能公告最近获得了 spacex 三个订单,就遭到了监管几事,原因是信不信不完善。虽然订单不是直接供应,而且也只有不到一千四百万,但也是国内为数不多真正供应 spacex 的 公司,应该不至于像巨粒一样吧。 三、协创数据计划一百一十亿采购服务器,用于为客户提供云算力服务。四、深圳研发了人工智能加先进制造业行动计划,要以 ai 芯片为突破口,做强半导体产业。中信国际也表示,存储器、 bcd 供不应求,都在涨价,关联的是科技半导体。

智普啊,发布了 glm 五点零,为了测试它的能力啊,我用它构建了一套可以无限运行的 ai 开发系统。我用这个系统运行了长达十个小时,从晚上十点到早上八点, ai 做了几十次 getmate 的 提交, 开发了一个 ai 漫剧生成工具,有前后端有数据库,可以用户注册和登录,还接入了大圆模型,图片生成模型,视频生成模型。通过这个视频,你会学到如何构建这样一个无限运行的 ai 开发系统,并了解到 glm 五点零的惊人开发能力。 整个过程我都只是输入简短的 prompt, 没有亲自阅读或修改任何一行代码。我一直在旁边玩着游戏,等他干活, 尤其是我视频最后会讲的,他把整个项目的所有模块联合起来,然后端到端的 bug 修复错误,非常的牛逼。他不只是单纯的写代码,他甚至自行在浏览器中验证每个功能的正确性,找出 bug, 然后自行在浏览器后端数据库第三方的 api 之间联合调试,找出问题,修复错误。 那赶紧进入正题啊,相信对你会有所启发。我使用的工具是 cloud code, 并且把模型切换为 g l m 五点零,具体方法可以看我之前这一条 g l m 四点七的视频。 那我们首先要搭建一套能无限运行的 ai 开发系统,说是系统,其实就是几个文件,做法非常简单,我把一篇来自 astonopy 的 神级文章发给 ai, 让他自己去学习,根据这篇文章做出这套系统 文章叫长时间运行智能体的有效调度编排框架。那过程中 ai 做出了一些操作预期的举动,他通过 m c p 打开浏览器, 通过这篇文章的页面找到一个配套的 get up 仓库,打开仓库的代码文件进行学习。而我事先都不知道这个代码仓库的存在,最终他创建出了这一些文件。 我解释一下最重要的几个,帮你理解一下这套系统的工作方式。 task 点 jc 文件,其实就是一个任务列表,每个任务都有它的描述,并且会标记是否已经完成。和我们人类工程师每天上班一样, ai 每次从这里面领取一个任务, 完成后就做一个标记,这样他的 ai 同事啊,就知道项目进展到哪里。 progress 点 txt 文件,每次 ai 完成任务啊,或者任务失败后,都会在里面留下工作日期,这也是为了给其他 ai 同事提供一些信息。 log 点 m d 文件,这里面全是提示词,用来指导 ai 根据固定的规范流程工作。和我们人类工程师的开发流程类似, 第一步,跑一个脚本,来初识化整个项目的环境。第二步,在 task 里面领一个任务。第三步,就开始开发。第四步,测试和验证。 第五步,更新 progress 和 task 文件。第六步,用 git 提交代码。那如果中间遇到困难,需要人工介入,它就要及时向人求助。那在以前一些长期运行能力不强的模型中啊, 这么长的开发流程,一旦工作上几十分钟,模型就会逐渐混乱,不再按照规定的流程工作,而如今完全没问题啊。视频后面我们会看到, glm 五点零,即使在长达一个小时的工作,提交了几十个 commit 后,仍然很好地遵循开发规范。 然后呢,我让他写一个脚本,用来无限时间的运行。这一套开发流程背后的原理很简单,就是把 cloud code 放到一个 while 循环里面,这样一来,人不在电脑旁边的时候没法手动 prompt, ai 就 可以执行这个脚本,让 ai 无限的工作。它之所以有效,有几个原因啊, 第一,我们这套流程每次只要给 ai 说一句,完成下一个任务,不需要更具体的指示, ai 就 能通过 task 和 progress 文件知道自己现在应该做什么。 第二,每个 task 都很小, g l m 五点零足够的强大,每一次 y l 循环里面,他只是领取一个很小的任务,并且严格的测试,成功率极高。第三,每完成一个任务,模型的上下文都会被清空,所以模型始终保持在最聪明的状态。 第四, g l m 五点零非常可控,严格按照工作规范执行,每次小任务都会进行 commit, 所以 即使出错,我们可以轻易地回滚到旧版本。 好,现在我们这套系统有了,接下来就要开发软件,我们先来设计一下它的功能和架构。这个软件的用途是一句话,生成长视频。我让 ai 把整个项目的开发需求拆成了三十一个任务,放到 task 文件里。 这是 ai 设计的软件,架构不复杂,但五脏俱全。再看一下 ai 画的业务流程图啊,帮助大家理解我们要开发的这个软件具体的功能。 首先,用户会创建一个项目,然后用大圆模型生成每一个分镜的文字描述,然后再用图片模型生成每个分镜的图片,再用视频模型生成。视频开发的流程比较长啊, ai 做了几十次提交,我就选几个精彩的给大家讲。 在 ai 做到第十九个任务的时候,为了测试 glm 五点零的能力呢,我产生了一个大胆的想法,我让他一口气做了一个多小时,完成了十一个任务,干完一个又一个,中间我没有任何干预, 给大家倍速感受一下效果。他一直在写代码,并且每次都遵循我们的开发规范,每个任务都完成,测试一个,一个任务,单独提交代码,拿一个具体的任务作为案例啊。他现在领取了任务三十,任务目标呢是实现响应式的布局,也就是让 u i 在 手机端和桌面端看起来不一样。 他现在正在修改代码,然后验证项目能 build 通过。然后他现在把浏览器的大小变成了手机屏幕大小。打开了我们的应用,他点击了一个按钮, 他对页面做了一次截图,用识图的 m c p 判断是否正确。再打开了一个新的页面,再做了一次截图,并检查是否正确。然后在 progress 里面仔细描述了自己所完成的工作,然后把这个任务标记为完成,他就按这么一套方式疯狂的干完了每一个任务。 要接入数据库的时候呢,他主动提出需要人工帮助,并且一步一步地给我说明,告诉我如何去这个 superbase 平台啊,点哪里创建项目,配置数据库,获取 api key。 尽管我没怎么用过 superbase, 仍然轻松地操作下来了。中间我还犯了错误,给他提供了错误的 key, 也被他及时发现,最后他还让我帮他去注册一个测试账号,然后他自己打开浏览器,输入账号密码,验证登录功能,可以正常使用。那像 superbase 这种外部的系统啊,超出了 ai 的 控制范畴。 g o m 非常明确的给我提供指引,让我协助他完成开发工作,一个不了解后端的人,也能在他的指引下完成数据库的配置。 他开发完后端一系列 c r u d api 后呢,声称对每一个 api 都进行了测试,但所有的 api 都是需要 os 的, 前端也还只有一个空白的页面,所以我就很好奇他哪里来的 os 权限,怎么完成测试,是不是在忽悠我? 于是我问了他一下,他用简短的语言,漂亮的格式向我解释。他说他打开浏览器,登录了刚才创建的测试账号, 然后通过一个叫做 browser evaluate 命令,在浏览器可以执行任意的 javascript 代码。然后他写了一些临时的 js 代码,就在浏览器里运行,调用我们的后端 a p i, 这样就能有 office 了。非常聪明的做法,我还怕他在骗我,我检查了一下录像,确实如他所说,他打开浏览器疯狂测试, 中间还真测试出不少问题,他就自行查看后端的报错日期,自行修复。最终三十一个任务全开发完后,啊,我也懒得去人工验证这个项目是不是已经可以用了。在往常的开发中啊,到最终阶段,因为已经把 前端、后端、数据库、第三方 api 全部连起来了,那第一次的集成测试啊,就会非常头痛,因为任何地方都可能出错,往往需要浪费大量的时间再把错误找出来发给 ai, 让 ai 去修复。但这一次我非常大胆,我只说了一句话, 请你完整测试一遍流程,确保功能可用。大概就是从早上七点十分开始,他自己在浏览器上疯狂测试,花了一个小时提交了这么多改动,用来修复 bug。 我看他在浏览器上像人一样一步步操作我们的产品,通过截图和视觉能力来判断是否符合预期。遇到问题的时候呢,他就自己查询后端的报错,检查各种 api 的 状态,综合分析出问题。最终他总算顺利的生成出了第一个视频,端到端的把整个应用全部打通了。 他修复的每一个 bug, 做的每一个 feature, 其实我都不清楚是什么情况,但我想知道的话,我只要找到他的 commit 记录,看一下他在 progress 文件里写了什么。这也是这套流程的强大之处,一切都是可追踪的。 我们让 glm 五点零一边开发项目,一边在开发过程中发现问题,让 ai 来增强我们这一套自动化的开发系统,左脚踩右脚,螺旋升天,我相信这就是未来开发者的工作方式。总结来说, glm 五点零已经远远超出了单纯抠顶的范畴,而是能对软件工程的每一个环节进行自动化,提升效率。 gm 五点零在超长任务上非常出色,已经达到了能让我放心的交给他连续运行一个小时的程度。横向对比的话,我个人认为 gm 比刚发布的 oppo 四点六弱一点,但在一些方面可以超过 gbt 五点三。 重点是价格便宜非常多,但现在过于热门啊,供不应求,抠钉套餐非常难抢。那我们这个项目呢?虽然现在端到端全部打通了,但最终深层的视频效果还有很大优化空间。点赞到一万,我可以开源出来,让感兴趣的人进一步优化它。

又是深夜发布,今天突然发现智浦开源了 glm 五大模型,没想到年前的开源大模型市场还会出来这个网站从前几天 cloud ops 四点六和 gbt 五点三 codex 的 发布可以看得出来,二零二六年商业大模型趋势将从能写代码升级成能构建生产机系统, 没想到的是开源大模型这么快就跟上了,熬夜测试了几个小时,本期视频我们就来看看 glm 五都有哪些亮点,以及都能做些什么事情。 二零二五年使用大模型编程的过程中,我发现虽然 ai 已经可以做出一个个很好看的前端页面了,但是真的让他去做一个生产能用的系统或者是一个庞大的任务,经常写着写着 ai 自己就圆不回来了。 但这次 glm 五真正能做出生产可用而不是单纯好看的系统,并且遇到复杂系统需求会自己拆解,可以长达数小时的不断自动运行完成这个系统不会出现越写偏离越大的情况。我直接拿两个案例来演示一下,工具用的依旧是 copy code 用的是质朴官方这个 model 的 key 配置文件的话,其他都和之前保持一致, 模型替换成 glm 五即可。很多公司应该都有自己内部的企业级后端脚手架,不仅能统一开发规范,并且开发只需要引入对应的依赖和无需关注各种中间件的配置细节就能直接使用。 我之前写过 glm 五来生成 glm 二十一加 spring boot 三的企业级后端脚手架,编辑提示词开始执行,可以看到这次 glm 五在分析完任务之后,会以对话的形式来询问生成项目的细节问题, 宇宙包含哪些模块的 start 给了多个选择,接着询问项目的认证框架,最后确定报名的生成规范,等这些全部完成之后,就开始任务的拆解。 glm 五将脚手架拆分成了十四个大的模块,制定了十五项具体的实施步骤以及最终的验证方式,没问题之后,就开始让 glm 五开始构建系统了。 glm 五这次针对多阶段长步骤的复杂任务的优化做得太好了,整整十五个模块,花了一个多小时全部生成完成。整个过程不需要人去做额外的辅助工作。 除了代码生成之外,当在验证过程中遇到翻译失败的情况,它会自动分析日制,不断修复代码并重复验证,直到全部跑通。我们可以来看看最后的脚手架项目,所有的 start 按模块划分,比如 base 模块定义了统一的异常,统一返回信息, log 模块引入至框架搞定日制生成规范,做好 trace id 生成逻辑以及日制切面等配置。同理,像 mybatics 统一配置 radix mq 的 配置都做成了 start, 要使用直接引入对应的依赖即可,这是真的能很好的用起来的项目了。 接下来再做个全站的业务系统,做一个支持高频发的购票系统,能支持秒杀业务的场景。这次让他把前后端的项目全都生成,前端使用 vivo, 后端使用 jdk 二十一加 spring boot 三。 这里有个比较有意思的点,一开始我在提示词中将 jdk 二十一写错成 jdk 八了, jmm 在 分析需求的时候就发现了这个问题,并给了我几组匹配的 jdk 和 spring boot 的 版本。 手动调整之后, glm 五给出了十分详细的技术报告。整体的代码生成过程还是和之前一样,不需要人去做额外的操作就可以生成出完整真正可用的代码。现在前后端代码就生成完成了,我们来看一下。 先看一下后端代码,秒杀业务的逻辑写的十分严谨,其中高密发解决方案中包含了多级缓存、库存预扣、业务下单、分布式锁结果限流、动态余额等方案。前端页面是一个包含购票和秒杀的 h 五系统,我们来参与一下。秒杀 手速快,直接抢到票。智普在官方公告中提到了国产芯片万卡集训这个概念,意味着这次 gm 不 仅模型能力强, gpu 底座也是国产自己的。 去年过年来了个 deepsea, 今年过年来了个 gm 五,不知道二零二六年大模型究竟能发展到什么地步啊?以上就是本期视频的全部内容了,我是鱼仔,我们下期再见。

最近智普大模型出名了,一月底在深圳策略会刚交流过,新发布的 g o m 五在 call 顶 agent 上表现非常好,洗车问题也是完全答对,发布没多久,官网的 call 顶直接卖断货,连 max 套餐都卖光了,相比对按贵的离谱的头肯费,性价比特别高。目前, g o m 五已完成于升腾、 摩尔县城含五、 g、 昆仑星、木兮、岁元、海光等国产算力平台的深度推理适配,通过底层算子优化与硬件加速, g o m 五在国产芯片级群上已经实现高吞吐 低延迟的稳定运行。别问我怎么知道这么多的,因为公司头官杨总这两天更新了很多朋友圈,大家赶紧拥抱起来吧!

在海外社区猜测不断的匿名模型 pony alpha 被证实为今天智普发布的 glm 五的测试版,而 glm 五是面向 agentic engineering 打造的新一代的机座模型,在拥有常规的流式输出方阵、 callign、 mcp 等能力外,新增了适配 excel 的 ai 插件,可以生成格式表、修复公式错误以及跨工作表的自动操作, 那在编程能力跑分上相较于四点七有了较大的提升。而在与 cloud code 的 评估集合中,使用体验接近 cloud opus 四点五,那在价格上对比, cloud opus 四点五、四点六以及 gbt 五点二依然保持着国产模型的量大管保的特色,而且官方还有限定款。性价比方面。

就在今天,智普重磅发布最新编程模型 g l m 五,它专为复杂系统工程和智能体任务而设计。与上个版本 g l m 四点五相比,其参数规模从三千五百五十亿扩展到了七千四百四十里, 包含大约四百亿活跃参数,使用的预训练数据量也从二十三万亿个 token 增长到了二十八点五万亿 token。 其最新 benchmark 结果显示, g l m 五已经能够在推理代码和智能体能力上全面对标国际顶尖模型。 从结果可以看到, cloud opus 四点五和 gpt 五点二虽在部分基础中仍保持微弱领先,但 glm 系列模型已实现了显著的追赶趋势,在综合能力和性价比上形成了有力的竞争格局。此外,从股票投资爱好者最关注的 vending bench 测试结果,也就是测试 ai 商业决策能力的基准测试结果 可以看到, glm 五模型是和比较激进的投资策略。如果你是具备冒险精神的投资者,那么不妨尝试让 glm 五模型成为你的理财投资顾问。 目前, g l m 五已经可以通过欧拉玛的云端模型直接调用,同时你也可访问 z 点 ai 智普官网进行实际测试,欢迎各位分享你的使用反馈。

gm 五终于发布了,听说非常强,我也想试试他到底是不是真的有那么强,我第一时间就拿我维护了一年有上千真实用户的三倍插件给他上上强度, 直接挑战开发中最头的那三个难题。第一,极万行代码项目的全景理解。第二,多层嵌套的复杂 ip 逻辑。第三,真实用户的需求迭代。 我们这次的开发环境依然是 vs code 加 code code。 我 首先让 g m 五先理解一下项目整体的技术细节以及功能特点, 这里有一个非常关键的点是 g m 五在发现问题的时候,它会自动的去检测这个错误,然后自动的去修复,接着它就会去读取我相关的一些文件, 然后形成了一个完整的技术分析报告。大家可以看到它上面把这个技术的分层架构都写好了,哪些是处理 api 调用,哪些是处理交互以及数据持久化的。然后接下来就是我 api 的 调用逻辑,他每一个点他都列的很清楚,说实话他列的这个技术报告比我这个作者写的还清楚。接着我就让他基于用户反馈形成一个英文字母导出的功能,比如这是一个 英文的视频,它有一个英文的 ai 字幕。以前的话我们这个插件它是没办法获取英文字幕的,因为当时我是只支持了中文字幕的处理,就比如现在它这个英文字幕是没有的,现在这个英文字幕导出的功能,它不仅仅是增加一个按钮,更主要的是它需要去重构底层的一个解析逻辑。 就比如说我这个接口,它的数据是怎么返回的,我需要怎么去处理中文和英文字幕的选择?那 gm 五 他在思考之后就开始进行执行,然后直接去帮我编辑处理了相关的代码逻辑,大家可以看到他每一步他是怎么做的,这里都写的很清楚,然后最后他就帮我完整的实现了我需要导出英文字母的这个功能。我整体体验 gm 五的功能, 我觉得他真的是更加智能的,就像是一个支撑的系统架构师来帮助我便携代码一样。大家可以看到,现在在 g m 五帮我修复了英文字母下来之后,现在这个字母就可以获取成功了。 说实话, ai 编程最难的从来都不是写新代码,而是维护老代码。十三代码,我之前开发的飞书多表格、马克当预览插件,现在也有几百个付费用户,代码里面其实也有不少的十三代码平时没有大 bug, 我 根本就不敢 动它,生怕改动了之后影响用户的使用体验。不知道大家在用 ai 写代码的时候有没有遇到类似的问题呢? 但是啊,我最近观察到,不管是 cloud ops 四点六还是 gpt 五点三 codex, 它们都不再去卷升程速度,而是全面转向了 agintending coding 发展,简单来说就是更加专注于解决真实项目需求的能力。而 gm 五 就是目前开元界首个跟上这一趋势的模型。 gm 五整体表现都不错,在科奥的欧布斯四点六跟 gpt 五点三科特斯之间很多成绩甚至都感觉不到差距,但是我发现 gm 五有时候的响应速度确实有点慢,这点希望以后能提升一下, 再给大家说个心里话,其实三个月前我就开通了 gm codeine 的 套餐,我当时用的还是 gm 四点六,短短三个月时间,我们的钱还是那份钱,但是手里的工具却一次比一次强, nice! 我 眼看着他从四点六进化到四点七,再到今天可以跟科尔的 off 四点六扳手腕的系统架构师 gm 五 厉害!这种养成系的快乐真的太爽了!用过 gm 扣顶破烂套餐的老用户应该都懂,这次 gm 的 进步让我再次看到了国产模型的硬实力,大家赶紧去试试 gm 五吧! 好了,以上就是本期视频的全部内容,记得点赞和关注我哦!我是超超,我们一起学研,一起变强,我们下期再见!拜拜!

嘿,朋友们,最近的 ai 圈子那叫一个热闹啊,简直了,就在这短短半个月里,感觉中国的大模型公司就像商量好了一样,接二连三地放出了大招。 先是智普 ai 扔出了他们的 glm 杠五,紧接着越知暗面的 kimi k 二点五也来了, 这可真是神仙打架啊!不过呢,你可别以为他们俩是差不多的东西,表面上看都是大魔球,但骨子里那可完全是两条路子。怎么说呢,这就好比一场武林大会, glm 五就像是那种稳扎稳打的少林长拳,一招一式都力道十足。而 kimi 呢,就像是飘逸灵动的武当剑法,剑走偏锋,出其不意。所以,今天啊,我们就来好好地扒一扒,看看这场华山论剑,到底谁更胜一筹。 好,那咱们就正式开始。今天呢,我们会这么聊,首先看看这两位选手的基本情况,就是所谓的报价门。然后呢,深入聊聊他们背后的设计理念,也就是他们的武功心法。 接着,咱们得看看实战,对比一下他们的跑分成绩。当然了,最精彩的还是他们的独门绝技,这部分也会揭秘一下,哦,对了,还有一个特别硬核的故事,关于灵英微达芯片的,这个很有意思。 最后,也是最重要的,我会给你一份非常实用的选择指南,帮你决定到底该用谁。行,那咱们就出发好!第一部分,咱们先来过过招,看看这两位 ai 重量级选手的基本参数。所谓知己知彼嘛,先摸清他们的底细 来,咱们先看左边的 glm 杠五,你看这个总餐数量,七千五百四十万亿, 这你可以理解成它的脑容量,或者说指使库大小非常庞大。但更有意思的是,这个激活仓鼠有四百四十亿,这说明什么呢?说明它在思考一个问题的时候,会调动非常多的脑细胞,想得特别深,逻辑性很强。再来看 kimi 二点五, 他的总参数量更夸张,直接干到了一万亿。不过呢,他每次激活的参数是三百二十亿,这说明他追求的是快和准,效率有限。而且 kimi 有 个天生的绝活,就是原生知识多模态,也就是说,你给他图片视频,他都能直接看懂。 好,你看到这些数字的差别了吧?其实啊,这些数字背后藏着的是两种完全不同的设计思路。打个比方,一个呢,像是外科医生手里的精密手术刀, 另一个呢,则更像是我们平时用的那种多功能瑞士军刀。我觉得这个比喻还挺形象的,你看啊, g r m 五,就像那把手术刀,它的路子是少而精, 他内部的专家数量不多,但每一个都是顶尖高手,专门解决那些需要深度思考的难题,比如说写非常复杂的代码,或者解高数题,这种是他在行。 而 kimi 呢,它就是那把瑞士军刀,里面藏着各种各样的小工具,它有很多很多个专家,每个专家负责一小块领域,这就让它变得特别全能,处理各种杂七杂八的任务都有人有疑,特别是像我们前面说的,处理图片视频这种事,它天生就会 聊。完了理念,咱们就得来点实际的了,对吧?是骡子是马,拉出来溜溜,看看他们在各种标准测试里跑分怎么样。哦,这里要先说一下, 因为 glm 五刚发布没多久,所以有些分数吧,还是根据它上一代模型估算的,但没关系,我们还是能从中看出很多东西的。 你看啊,在写代码和做数学题这两项上,俩家伙基本上是棋逢对手,难分高下,都属于第一梯队的水平。但是呢,到了这个高难度推理测试,叫 hle kimmy k 二点五的优势就比较明显了,领先了一截。 至于网页浏览能力,目前来看也是 kimmy 暂时领先。不过嘛, gm 五的最终成绩还没交上来,所以咱们可以先观望一下。 虽然有一些数据还没出全,但是你看路拓社的这个评价就很有分量了。他们说 g l m 五的代码能力已经非常接近 cloud 的 最新的 opus four point five 了,在某些地方甚至比 google 的 gemini 三 pro 还要强。 哇,这个评价可不低啊,这说明什么?说明 g l m 五绝对是顶级的玩家,实力是毋庸置疑的。 那么问题来了,到底是什么样的底层技术,让他们俩的表现和风格差这么多呢?行,那咱们就钻到引擎盖下面去看看他们的内部构造。 其实啊,这两款模型都用了一个共同的秘密武器,这个技术叫做混合专家架构,也就是 m o e。 你 别被这个名字吓到,其实很好理解,他就不像以前那种一个大模型啥都干,结果啥都干的一般。 m o e 呢,更像一个非常聪明的项目经理, 手底下管着一大堆不同领域的专家,你有什么问题他就马上判断,然后把任务派给最懂这个事的专家去处理。为了让你更好理解,咱们再用一个去医院看病的例子。你看啊,第一步,你输入的指令就好像你带着问题走进了医院。 第二步,模型里有个叫路由器的东西,一看你的情况就知道你该去哪个科室。 然后第三步,他就把你直接带到最对口的医生,也就是那个专家模型那里,专门解决你的问题。你看这样是不是又快又转业,效率一下子就上来了。 虽然说大家用的都是 mo i 架构,但 kimi 二点五显然不满足于此,他把这个团队协助的概念可以说是玩出了花,他能干嘛呢?他能同时派出超过一百个小助手,也就是智能体来帮你干活。 这个绝活呢,叫智能体群集,你就把它想象成一个超级项目经理,带着一支由一百多人组成的突击队, 你给他一个复杂的任务,他会立刻把任务拆解成无数个小块,然后让这一百多个小助手同时开工。就像千军万马一样,他最多能同时调用一千五百次工具。 最终的结果是什么?完成任务的速度最高能提升四点五倍。你想想,你要是做个市场调研,或者搜集海量资料,这简直就是神系啊,效率完全不是一个级别的。 那 kimi 有 这么厉害的招数? joe can one have 有 啥独门绝技呢?当然有,它解决的是我们用 ai 时一个特别头疼的问题,就是失忆。你有没有感觉跟很多 ai 聊着聊着,他就忘了你前面说个啥了,跟个金鱼似的,记忆只有七秒, 但 glm one have 不 会。它有个叫思维保留的功能,它能牢牢记住你们俩对话的整个逻辑链条,就算你们聊了几十个回合,它都能保持思路清晰,前后一致,这就让它特别适合干那种需要长期合作的复杂项目,绝对是个靠谱的搭档。 好技术聊得差不多了,接下来啊,咱们要说的这个故事,可能比技术本身还要精彩。 这是一个关于成本速度,更是一个关于在逆境中求生的故事,主角就是零英伟达这个概念。 智普 ai 在 发布 glm 五的时候,说了一句非常硬气的话,这个模型完全没有使用英伟达的芯片进行训练。 哇!这句话一出来,分量可不轻,他直接掀开了一个关于技术自主和国产替代的宏大篇章。 事情是这样的,就在今年一月份,智普 ai 被美国列入了那个所谓的实体清单,这意味着他们再也买不到顶级的英伟达芯片了。对任何一个 ai 公司来说,这都几乎是灭顶之灾。 但是他们没倒下,他们做了一个非常果断的决定,转身就用了整整十万张咱们国产的华为升层芯片,硬生生搭起了一个超级算力集群。然后,就在这个完全灵英伟达的平台上, glm 五诞生了。 这不仅仅是一个模型的发布,它更像是一种宣告,就算面临封锁和压力,我们自己也能行。 那么用国产芯片这条路带来了什么最直接的好处呢?一个字儿,钱就是成本。你看啊, ai 的 计价单位是 token, 你 就把它大概理解成一个汉字或者一个英文单词。 glm 五处理一百万个 token 只要零点一一美元, kimi 呢,是零点六美元也还行,但你再看看国外的顶级模型 cloud 三 opus 要多少钱?十五美元,你没听错,是十五美元。 这么一笔 glm 五的价格优势简直是碾压级别的,比 cloud 便宜了一百多倍。 当然了,天下没有免费的午餐,有的必有失,这里面就有一个成本和速度的取舍。 glm five 呢,它就像一个耐力超强的马拉松选手,跑得不快,每秒大概生成十七八个字。 但是呢,它超级省钱,特别适合那种不着急要结果的在后台跑的大任务,比如生成一篇长篇大论。 而 kimi k i 图点 five 呢,他就是个百米飞人,速度快的惊人,每秒能蹦出三十九个字,几乎是你打字速度的两倍。所以他特别适合做那种需要实时反应的聊天机器人。简单来说,一个帮你省钱,一个帮你省时间。 好了,说了这么多,从技术到理念,再到背后的故事,最关键的问题来了,对你来说,到底该选谁呢?别急,接下来我就把前面所有的信息给你捋一捋,做成一份终极选择指南,保证你看完就明白。 那么什么情况下,你应该毫不犹豫的选择 g l m 五呢?听好了,第一,你的预算特别有限,或者你的用量非常非常大,成本是首要考虑因素。 第二,你需要让 ai 帮你写超长的东西,比如写一本小说,或是生成一整个项目的代码。第三,你正在做一个复杂的项目,需要一个能记住所有上下文逻辑不掉线的 ai 伙伴。 最后一点,如果你的项目有硬性要求,必须使用国产自主的硬件和技术,如果这些点你中了任何一个,那 glm 五就是为你量身打造的 好,那反过来,什么情况下你应该选择 kimi k 二点五呢?也听好了,第一,你要处理的不仅仅是文字,还有大量的图片、图表,甚至要分析视频。 第二,你的任务特别复杂,可以拆分成上百个小任务,让 ai 同时去干,发挥它智能体群级的威力。第三,你正在做的产品是个聊天机器人,用户的体验至上,一秒钟的延迟都不能忍。 最后,你需要让 ai 一 口气读完一本超厚的书,比如一次性给他扔进去两百多万字的内容,让他分析。如果你的需求是这些,那别犹豫了, kimi k 二点五就是你的不二之选。 所以你看,非常有意思。一个模型是在压力和坚韧中淬炼而成的,而另一个是在纯粹的技术创新和想象力中诞生的。 可以说, glm 五走的是一条自主坚韧的底层突围之路。而 kimi k 二点五呢,则代表着那种天马行空,追求极致应用体验的创新之路,它们代表了两种截然不同的发展路径。 那么,未来的 ai 究竟会由哪条路来定义呢?或者说是两条路最终会合二为一?这个问题我想值得我们每一个人去思考。

你还记得之前在 ai 圈里悄悄走红的 pony alpha 吗?真实身份现在揭晓,它正是智普 ai 的 新一代旗舰模型 glm 五。之前把 pony alpha 当画名开展匿名测试, 二月十二日模型正式发布后,智普港股股价午后暴涨近百分之四十,公司总市值一度逼近两千亿港元,折合人民币约一千七百七十七亿元。 官方数据显示,在编程能力的关键精准测试中, glm 五的表现已经可以对其 cloud ops 四点五在某些开源模型的评分上超过了 gemini 三 pro。 不 过,这个模型有个非常明显的特点,它是个专家型助手。对于专业人员来说,在真实的、复杂的开发场景中,它能显著提升效率,完成那些系统级的常识任务。但对于没有编程基础的小白用户,只是简单的给句指令,可能就有点玩不转了。 这也意味着,大模型正从新奇玩具转向生产力工具,在行家手中更能释放自身价值。

母亲言新出了个模型啊,怎么样?这个模型他说说非常厉害。 jim 五吗?我看看啊,像有的官方说的,他的 humanity last exam exam 评分是比较高的啊,就拿这个评分来说啊啊,其实我们测一下会有很大的问题,你看一下这个屏幕,我看看 我们呃抽取了 horamis 的 mass 数据集,大概是一千多道,然后去测这个质朴清源拿这个呃正比奈,正比奈 flash 作为这个评判遇到一个什么问题呢?我发现他在解答这种数学类的问题的时候,他的思考时间头肯输出了将近两万,也就是说他两万还在思考都没有输出完, 所以说我们这个他根本就测不了,在我们看来,然后即使测的了的话,一次回答的成本大概在呃五毛钱左右,就一个问题大概在五毛钱,而且还两万都没有出答案,所以我们在想会不会是我们的测试出了问题, 于是我们又到了他的这个官方上,就试验了一下啊,现在还在跑是吧?我们这个数据集从呃几分钟之前就开始跑,呃直接停掉,然后我们可以往上拉,一直拉一直拉,就你就说他这个思考过程无限的延长,无限的思考,他虽然这个回复的内容是正确的,但是他貌似陷入了一个死循环的过程。 就是你是让他回答了一个问题是吧?数学问题, melodies 里边的一个数学 max 类别的问题啊,问题其实不复杂,他是一个单选,他有两两种类型,第一是选择题,第二是那个检查题。我们在问给他这个数学问题的时候,问了两道到三道,基本就是无限循环,然后他的费用基本在无限上涨, 所以我们我们也可能比较怀疑像这种评分它虽然很高,有没有可能它的思考过程会非常的长,可能是无限的,也他可能把这个给忽略了,他能思考一个问题,思考五分钟出了一个答案。我们也测了一下,像 jimmy、 nike 这种可能也就几秒钟就出答了,所以它会存在这样一个差异点, 所以说它这个评价体系稍微有点问题。也不算吧,我们后续可能还会对这些整体评价再整体测评一下,至少我们现在现在来看还是跟大家想的差别很大, 太大了。数学问题你要等个十几分钟去给你解出来。那我都做完了,你自己都做完了,哈哈哈,考试都结束了是吧?该交卷了。对,我们也建议在啊,我们建议在回答的时候还是把这种时间这个综合的都考虑进去。

智普,全球范围内对 g i m 五的需求积增。全网寻找算力合伙人智普二月十六日发布消息,近期由于全球范围内对 g i m 五的需求积增, 并发访问量突破了既有规划的上限,导致服务出现排队、响应延迟及卡顿现象,影响到部分用户的体验,智普对此深表歉意。 智浦称,尽管公司已经多次对国产芯片集群进行扩容,并限量发售了 g i m coding plan 套餐,但依然无法彻底解决当前供不应求的局面。 为了给用户提供更极致的智能体验,智浦启动算力合伙人招募计划。一、芯片厂商智浦愿开放核心技术接口, 联合开展针对 glm 五的底层优化。二、算力伙伴与推理服务商共建更高病发、更低延迟的推理网络。三、其他形式的算力合作。

谁说国产 ai 只会开会?郑州研讨会才刚散场,真正的重头戏就开演了。二月十日,光核组织集结头部算力模型厂商,启动联合公关,打造算力加模型加场景闭环。 二月十一日,智普 ai g l m 五开源海光 d c u 同步适配,直接把闭环落到了实处。 g l m 五拿下开源 s o t a 海光,实现 day 适配, 双方深度协同,让国产算力的价值充分释放。这也正是郑州会上倡导的开放生态系统公关的核心内涵。从百家联工到企业落地,国产 ai 生态正在全面开花,未来可期。

今天用智浦新发布的 glm 开发了一个新项目,基于 spring boot 的 酒店管理系统,这个项目已经开源到 github 了,还附带一个项目论文,关注同名微信公众号即可获取。 最近后台很多人私信想要我的产品说明书,想让我出一个详细点的教程,现在就带大家做一个完整版的项目。首先明确要做什么,怎么做产品,应该有哪些功能,解决了什么问题。我把这个产品说明书的内容概括分为以下部分, 明确开发技术站、技术架构、功能模块、数据库设计以及 ui 风格。这几点确定下来就可以大大降低 ai 写代码出现的幻觉。所以很多时候幻觉的问题不单单是模型的问题,跟人也有很大的原因。 然后这里我用到了一个文档专家的智能体,让他基于我们已经确定的要求生成完整详细版的产品说明书。那么 ai 就 更清楚要做什么,该怎么做,所以前期多做一些准备,就能尽可能避免后面形成的十三代码。 经过了连续三十六分钟的编码, glm 五完成了整个项目前后端的开发。整体功能分为两个用户角色,普通用户和管理员。 普通用户可以注册登录预定客房,查看订单。管理员可以管理用户信息,维护客房信息,查看所有订单数据,统计分析。 最后主包想跟大家说, ai 时代如何使用工具提高自己是一门必修课,一定要尽可能多地去尝试使用各类 ai 工具。

t t c a i 资讯分享开源模型开始接管工程智普正式开源 g l m 五参数扩展至七百四十四 b 激活四十 b 在 coding 与 agent 能力上达到开源 sota artificial analysis 全球第四、开源第一 v bench 等多项基准领先开源模型长城 agent 任务执行能力接近 cloud ops 四点五,并已完成国产芯片适配。大模型竞争正从写代码升级为写工程 agentec engineering 进入实战阶段。记得点赞关注哦!

ai 编程拥有架构能力了?我对 ai 编程的能力一直很乐观,老粉都知道,但说实话,过去一年里我们看到的 ai 编程本质上还是高级代码不全,在加固能力上还是不如人类。但最近啊,硅谷的风向变了, algorithpic 和 open ai 都不再吹嘘一句话生成网页了,而是开始强调 algorithmic coding, 让 ai 像真正的工程师一样,花时间去解决复杂的系统性问题,不是替你写代码,而是替你做工程。今天我用最新发布的 gim 五模型做了个实测,让它从架构上分析我之前已经上线应用市场的真实项目 photoshop 的 app。 测完之后,我的第一反应是, 国产大模型也拥有架构能力了。今天就分享一下这次实测的过程。我把整个项目的代码库喂给 gim 五,然后写下提示词,请分析这个项目的架构,找出潜在的问题和优化空间。我在 c c 接入了 gim 五模型, g i m 花了大概五分钟,给我返回了一份详细的架构分析报告。我挑两个最让我意外的发现来说吧。第一个,它发现了一个隐藏的现成安全问题, 你看这段代码在 model 层里直接调用了震动反馈和音效,看起来没问题,对吧?但 g i m 五指出, swift data 的 model 不是 现成安全的,如果在后台现成访问,这个方法可能会导致崩溃。它不仅指出了问题,还给出了重构方案, 让我把 ui 相关的逻辑抽到 surface, 用依赖注入的方式解偶这个问题。我自己 review 代码的时候完全没有注意到。 第二个更绝,他发现了一个潜在的内存泄露,这里引用了 task, task 又引用了它,形成了循环引用,而这些都是真实存在的架构问题,不是那种简单的表面优化。架构分析完,我想试试 gm 五理解并修改现存项目的能力。我的 app 有 一个功能,用户可以删除当天的专注记录。 我直接让 jm 五根据我的代码上下文做出修改,改为可以删除单条转注记录,只是描述了需求而已,它就顺利完成了修改。 以前我说看好 ai 编程,指的是 ai 能提高开发效率,能写出可用的代码。但 arjun take 规定之后是个转折点, 从此 ai 将开始独立承担复杂任务。它不是简单的你说一句,我写一段,而是 ai 能主动分析问题,定位 bug, 提出优化方案,甚至能做架构级别的审查。 ok, 以上就是我对新模型 gm 五的实测,如果你有什么看法,欢迎在评论区交流。

我去,兄弟们赶紧看一下消息,这对于国产算力、算力租力啊重磅的利好消息!就在今天,智普啊发消息说了自己算力不足,要启动啊算力合伙人招募的计划。发消息这样说的,由于全球需求激增,访问量突破了上限,导致了服务出现排队,出现了延迟卡顿的现象。尽管啊智普多次对国产芯片集容权进行了扩容, 但是依然无法彻底解决当前供不应求的局面。我的乖乖兄弟们,这对于国产算力、算力租力来说就是利好的消息,兄弟们,如果在这个假期 质谱算力的问题依然没有解决的话,那么节后回来算力租赁,国产算力肯定啊,大概率直接挑拨开了,像尤克德、首都铜牛、伊米康这些肯定会的,懂了吗?兄弟们,关注我,不迷路,带你吃肉!

今天这期节目,我们就来探讨一下这个刚刚发布的智普 g m 五这个大模型,嗯,看看它到底在技术上面有哪些新的突破,然后在实际的工程应用当中,它又有哪些炼眼的表现,以及它在行业当中到底是一个什么样的水平。没错没错,这个也是最近 ai 圈里面非常火的一个话题,那我们就直接开始吧。 咱们先来讨论一下智普 g m 五的发布,以及它在国际上面的表现到底怎么样?还有就是它的这个发布到底带来了哪些影响?是这样的,智普 g l m 五它其实刚刚发布就引起了非常大的轰动,它一开始的时候是以内测版本的形式出现的,那个时候它的名字叫做 pony alpha, 嗯, 在海外技术圈已经是非常火了,然后它在 open router 上面的热度也是直接冲到了第一。这个 pony alpha 还真是挺引人瞩目的,连股价都被带动了吧,就是在官方还没有正式宣布之前,它就已经让相关公司的股价连续两天大涨,成为了港股 ai 板块的一个最大的催化剂。 嗯,然后等到二月十二号的时候,最新的这个 artificial analysis intelligence index 四点零榜单出来了, g l m 五它是以五十分的综合得分并列全球第三, 仅次于 g b t 四点六、 g b t 五点二和 cloud opus 四点五,哇,它也是目前排名最高的国产大模型之一,听起来真的很厉害啊。然后我们要聊的是这个 glm 五,它在系统架构和工程化上面的一些突破,它是怎么在这个 agencic coating, 也就是智能体编程这个上面跟上甚至在某些方面引领国际潮流的。 说到这个,其实在二月十一号 g r m 五正式发布之前,它就已经以 pony alpha 的 身份在 open reader 上面掀起了一阵风波,被很多海外的开发者称为是最强的开源代码模型。大家都在说它的推理深度和工程化能力已经非常非常接近闭源的顶尖水平了。 看来这次国产大模型真的是在技术讨论里面走到舞台中央了。完全没错,现在硅谷那边大家都在关注的就是 agent coding, 像 gpt 五点三, codex 和 cloud opus 四点六,它们都把重心放在了这种长时程的复杂的工程任务上面。嗯,那 grm 五就是国内第一个真正意义上跟上这个前沿的大模型,实现了从传统的对话式的代码生成到端到端的系统工程的跨越。 这个模型到底在实际的项目里面和专业的评测里面,到底有哪些让人眼前一亮的技术亮点呢? grm 五它是一个非常厉害的模型, 比如说你要去搭建一个高并发的电商库存系统,它不仅仅能够帮你生成所有的代码,还包括了漂亮的 ui 界面,然后包括 reddit 的 缓存、消息队列、数据库锁,它全部都帮你搞定,甚至写出来的代码直接就能上线, 非常的高效。这听着已经不像是一个工具了,这像是一个全站的工程师啊。是,而且他在处理这种复杂的开源项目的报错的时候,他能够自动地去分析依赖规划修复的步骤,然后最后给你一个可执行的补丁。嗯,他的这种能力其实在专业的评测里面也是非常非常突出的。 比如说他在 s w e bench verified 上面拿了七十七点八分,就已经很接近 opus 四点六的八点零九分了。然后他在 terminal bench 二点 o 上面是开源第一, 在 vending bench two 的 经营模拟里面,它也是拿了第一。哇,它的这个 coding 和 agent 的 能力已经是开源的 s o t a 的 水平了。就是说这个 g l m 五它到底是用了什么样的新技术,能够让它在系统架构和智能体的任务上面能够达到世界领先的水平呢?呃,核心就是它采用了这个 m o e 的 稀疏架构, 这个架构的优势就在于它非常擅长处理长城的依赖和复杂的逻辑。嗯,所以 g l m 五在面对那种需要记住很多步骤,或者是说要调用很多工具的这种任务的时候,它能够非常完美地去执行。 然后它的整个设计思路也是完全是针对这种系统架构和智能体的场景去做的一个优化。所以就是说这是国产大模型第一次在真实的工程实践当中能够有这样的表现吗?对,没错,就 g l m 五出来之后,海外的开发者也是非常的惊讶,他们说本来以为开源界没人能接住 agnication g 棒,直到测了 g l m 五。 所以这也意味着中国在这个稀疏架构、代码能力和智能体这几个领域已经正式地进入了全球第一梯队。那整个行业的竞争也从以前的这种通用的能力的比拼,慢慢地转向了这种垂直场景的落地和实际的工程化能力,下面咱们要聊的这个话题啊,是国产算力的突破和芯片的适配, 就是 g l m 五到底在这方面做了哪些事情,能够让它在国产的芯片平台上面跑得又快又稳。这就不得不提到, g l m 五其实在发布的时候就已经跟七家主流的国产芯片平台做了深度的适配,包括华为的升腾、摩尔现成、韩五、 g 昆仑心木曦穗源还有海光, 然后对这些平台都做了算子级的优化,所以它能够充分地发挥国产算力及群的优势,实现高吞吐、低延迟的推理。 那这样的话,就把中国造的这个大模型的方案推到了一个全新的高度。这么说的话,那华为升腾和摩尔县城还有海光这几个在支持 g l m 五的时候,分别都做了哪些比较关键的优化呢?先说这个华为的升腾, 升腾在 g l m 五开源发布的同时,就做到了 day 零的全流程适配,嗯,在推理方面呢,它用的是 ibis 八百 a 三,然后 w 四 a 八的这种混合精度量化,把这个七百四十四 b 的 模型能够高效地部署在单机上面。 同时它还通过一些像 lightning indexer, sparse, flash attention 这样的一些融合算子,进一步地去加速了端到端的这个推理的速度。 ok, 而且它也兼容了像 v l l m a sand s glam 主流的一些推理引擎, 这优化力度真的很到位啊。其他的平台是不是也有类似的这种亮点呢?当然有啊,比如说这个摩尔县城,它是基于 s g long 的 推理框架,在 m t t s 五千上面也是做到了对零的适配和验证啊,那海光的 d c u 呢?也是让 g m 五在上面跑得非常的吞吐和非常低的延迟, 所以整体的这个国产芯片对大模型的承载能力是有一个非常大的跃升的,看来国产芯片的发展也是突飞猛进啊。然后我们要说的就是这个 glm 五在实际的使用场景当中,到底有哪些令人惊艳的表现? 它在技术实力上面到底跟这个 cloud opus 四点五相比有哪些映同在实际的评测当中呢? glm 五在工业级的后端开发,复杂的任务规划、多轮的调试以及连续的工具调用等等这些工程化的场景当中,嗯,它的表现是可以和 cloud opus 四点五直接去进行对比的, 然后整体的这个使用体验也是达到了目前开源的 s o t a 的 水准。能不能举一个实际的例子,让我们感受一下 grm 五在这个真实的项目当中到底有多强?可以啊, 比如说在 terry live 实景地球学习与旅行推荐这个全站开发的测试当中, grm 五它是可以从需求分析到代码编辑到三维图形的实现,到交互设计,它全部都可以一个人干 哇。最后交付的是一个功能完整,界面非常漂亮的一个三 d 地球应用,这个效率是远远超过传统的这种开发模式的。这么说的话, g l m 五在智能写作和全站开发这两个领域到底展现出了什么样的过人之处呢?是这么回事儿,就是 g l m 五它能够自动地去拆解复杂的分析任务,然后生成这种非常专业的报告, 还能把关键的信息都给提炼出来。嗯,在全站开发当中呢,它也是能够把开发者从这些底层的技术细节当中解放出来,让大家更多地去关注创新和创意。整个的这个项目推进的速度也是非常快的,所以被很多人称为是超级生产顺利引擎。 那 g l m 五在代理编程的能力上面和使用成本上面,到底跟这个 cloud ops 系列相比有哪些优势呢?这就要提到海外的一个博主,他的网名叫 ai code king, 它做了一个实测,就是在代理编程这个场景下面, g l m 五拿到了五百八十九分,这个分数是高于 cloud opus 四点五的五百八十五分的,是目前全球第一。 这个 g l m 五的这个分数真的是很能打呀,那它在费用上面是不是也有很大的惊喜?没错,更厉害的是完成同样的一个编程任务, g l m 五的推理成本只要零点一四美元哦,这还不到 opus 四点六的推理成本六点三九美元的四十分之一。 所以以前的话,可能大家会用 oppos 来做这个复杂的任务规划,然后用一些便宜的国产的模型来做执行。但是现在的话, g r m 五已经可以单独的去承担这个大脑的角色了,真正的实现了国产大模型对顶级闭源模型的一个替代,听起来非常不错啊。然后我们再来说一下 pony alpha 的 爆火, 以及质朴的这个市值的飙升,这背后到底有哪些关键的事件呢?这件事情其实是非常戏剧化的,就是 g i m 五,它一开始的时候是以 pony alpha 的 这个身份在海外的平台先火起来的。对,而且是在没有任何官方的预告的情况下,它在 open router 上面上线了, 然后仅仅用了二十四个小时就冲到了热度榜的第一名。看来是这个 pony alpha 这个神秘的身份,还有它超强的性能,直接就点燃了整个社区的热情啊。 对,没错, openrater 的 官方也是特别的提到了,它在编程、智能体的工作流推理和角色扮演这几个方面都是非常强的,尤其是它的这个工具,调用准确率是非常高的。 嗯,然后等到这个消息传出来,说这个可能就是智普的 glm 五之后,公司的股价在两个交易日之内就被资金推得非常高,市值一度突破了一千五百亿港元。哇, 就直接成为了港股科技股里面的焦点。所以就是说,智普 g l m 五的这个技术突破,到底是怎么影响了资本市场对整个港股 ai 板块的这个估值的呢?就是二月十一号, 智普官方正式地宣布了 pony alpha 就是 g l m 五。嗯,这个时候就是技术预期落地了嘛,所以这个也成为了二零二六年年初港股 ai 赛道里面最有标志性的一轮行情。 这应该也是属于比较少见的,就是海外的这个技术热潮反过来带动了港股的这个估值的提升吧。对,这是国产大模型第一次出现这种海外的技术热度倒逼港股的估值。嗯,然后市场的这个交易逻辑已经从原来的那种追赶者 变成了现在的这种 mo 一 架构开源 sota 这样的一个硬核的突破,这也意味着资本市场对 ai 公司的这个定价权已经开始从财报往技术预期去进行转移了。 ok, 我 们今天聊了这么多,关于 g l m 五的技术的突破,工程化的落地,以及它在行业里面的位置,然后包括它对国产大模型和这个 ai 芯片生态的一个推动。好的,那本期节目咱们就到这里啦。啊,感谢大家的收听,咱们下期再见,拜拜。拜拜。

大家好,今天呢给大家介绍的是智浦最新发布的 ai 大 模型 glm 五,那 glm 五呢,它是拥有一款啊,七千四百四十亿参数的啊,超大规模的混合专家模型,底层框架使用的 mo 一 框架,它的上下文窗口长度呢可以达到两百 k 左右。 然后呢, gm 五呢,在全国权威的这种 artificial alliance 榜单中也是位列位列全球第四的,在开源界的话也是处于第一名,并且呢在多项的这种编码测试中也是获得了开源索塔的成绩,它的性能的话是超过了 啊,谷歌的 gmail 三 pro, 实际的体验的话毕竟于这种 cloud ops 四点五。 而且呢这次智普的这个 ai 呢,也是接近把它的 ai 呢都扩展到了一个多模态领域,支持多模态理解,然后呢,呃,而且能处理这种超成本或是复杂工程,以及说做 a 境的开发。 那今天呢,我们会用啊二十万字的文档带大家去深入去了解一下 glm 五它的技术原理, 还有底层的一些啊架构啊。这篇文章呢,是通过 cursor 编辑的文章,一共是十一个间谍。然后这个篇文章是通过 opencode 加 midmax 编辑的文章,嗯,也是大概十个章节左右。 那首先我们来看一下这些章节的目录大概的内容啊,这个这里呢,我将这个文档呢做成一个简单展示的一个网站啊,简单给大家说一下这些网站。这个 gm 发布这次的内容,首先是对于行业发展来说,嗯, mate 在 之前的是开元领域是领先的, 那 g m 现在是呃在开源领域是呃做到了第一,那闭源模型就是三大这个 ai 公司啊, open ai、 ostracape 跟谷歌,谷歌啊,但是嗯,我们看到过 g m, 它追赶速度还是比较快的, 然后这次的呃突破性的成就也是比较高的。首先是模型的参数扩大了,然后结合了多模态 以及说上下文窗口长度,能输入整本书或者是整个项目,整个代码仓库啊,还就是在工程化的这种 ai 编程领域,那也是获得了一些突破 啊。第三部分是这第三部分是 g m 的 发展史啊,那可以看到距离上一次发布 g m 四点五的话已经差不多一年了,然后呢这个 g m 五的话是二月份才发布的, 然后它里面的技术创新和架构设计呢,主要是设计包含这个混合加专家模型的优化,因为它这里包含有二百五十六个专家,然后呢进行灵活的调度。其次呢就是它借鉴了 tiffany 的 啊些数处理机制,然后做了一些局部的一些优化, 然后也做了自己层面一些创新,比如说引入了 slam 框架,它可以去增强这种啊,训练,训练啊,增强,提高训练的效率,然后这 slam 的 话是一个一步强化学习框架,然后呢它也做了各种层面的一些优化, 然后呢在性能评测或者对比里面呢,它的这个编码分得分的话也是超过了 gsm pro, 这是他,嗯,大模型评分后面,然后行业几方的话也是目前啊,就是大家通用的大模型的解决方案,比如金融指挥啊,都这这些领域的东西,然后这是他大概的内容。

别再沉迷于让 ai 生成贪吃蛇或者简单的着陆页了,说实话,那也只能算 ai 玩具,根本上不了生产线。 glm 五发布的今天 ai 编程大模型,正是从前端切图在进化到了系统架构师时代。 现在的趋势不是谁画图好看,而是谁能搞定 aintiq system。 以前测模型我都让他写前端网页,这次我直接上强度,给他提了一个真实的生产级需求。我要求 glm 五开发一个 live o s 的 个人指挥舱。注意,我没有让他只写一个 to do list, 而是让它生成了一个包含日程、消费、健康学习的完整个人管理系统,并且接入了 ai 能力。 glm 五展现了惊人的 a n t 和长城规划能力。 但这里他没有着急写代码,而是像资深架构师一样,先自主拆解了前后端架构,并在长达一小时的构建中始终保持上下文连贯。他清楚地知道第一步写的数据结构要怎么配合最后一步的 ui 渲染。如果 live os 是 看规划,那接下来我告诉他这个需求。金融看板就是看它搞定顽固 bug 的 能力。 做这种复杂的 c v 波动率计算报错是常态,普通的 ai 遇到报错就摆烂,但 glm 五具备极强的自我反思机制,大家看,遇到报错它没有停,而是自主分析日制定位根音。它不只懂前端审美,更拥有深度的后端工程能力, 直接把系统彻底跑通。这种代码逻辑密度,以前你只能在可洛的 opus 四点六这种顶尖闭源模型上看到,但现在, glm 五直接对标可洛的 opus 四点六,把复杂的系统工程能力带到了开源世界,感兴趣的朋友快去试试吧!