在海外社区猜测不断的匿名模型 pony alpha 被证实为今天智普发布的 glm 五的测试版,而 glm 五是面向 agentic engineering 打造的新一代的机座模型,在拥有常规的流式输出方阵、 callign、 mcp 等能力外,新增了适配 excel 的 ai 插件,可以生成格式表、修复公式错误以及跨工作表的自动操作, 那在编程能力跑分上相较于四点七有了较大的提升。而在与 cloud code 的 评估集合中,使用体验接近 cloud opus 四点五,那在价格上对比, cloud opus 四点五、四点六以及 gbt 五点二依然保持着国产模型的量大管保的特色,而且官方还有限定款。性价比方面。
粉丝2.8万获赞18.5万

智普啊,发布了 glm 五点零,为了测试它的能力啊,我用它构建了一套可以无限运行的 ai 开发系统。我用这个系统运行了长达十个小时,从晚上十点到早上八点, ai 做了几十次 getmate 的 提交, 开发了一个 ai 漫剧生成工具,有前后端有数据库,可以用户注册和登录,还接入了大圆模型,图片生成模型,视频生成模型。通过这个视频,你会学到如何构建这样一个无限运行的 ai 开发系统,并了解到 glm 五点零的惊人开发能力。 整个过程我都只是输入简短的 prompt, 没有亲自阅读或修改任何一行代码。我一直在旁边玩着游戏,等他干活, 尤其是我视频最后会讲的,他把整个项目的所有模块联合起来,然后端到端的 bug 修复错误,非常的牛逼。他不只是单纯的写代码,他甚至自行在浏览器中验证每个功能的正确性,找出 bug, 然后自行在浏览器后端数据库第三方的 api 之间联合调试,找出问题,修复错误。 那赶紧进入正题啊,相信对你会有所启发。我使用的工具是 cloud code, 并且把模型切换为 g l m 五点零,具体方法可以看我之前这一条 g l m 四点七的视频。 那我们首先要搭建一套能无限运行的 ai 开发系统,说是系统,其实就是几个文件,做法非常简单,我把一篇来自 astonopy 的 神级文章发给 ai, 让他自己去学习,根据这篇文章做出这套系统 文章叫长时间运行智能体的有效调度编排框架。那过程中 ai 做出了一些操作预期的举动,他通过 m c p 打开浏览器, 通过这篇文章的页面找到一个配套的 get up 仓库,打开仓库的代码文件进行学习。而我事先都不知道这个代码仓库的存在,最终他创建出了这一些文件。 我解释一下最重要的几个,帮你理解一下这套系统的工作方式。 task 点 jc 文件,其实就是一个任务列表,每个任务都有它的描述,并且会标记是否已经完成。和我们人类工程师每天上班一样, ai 每次从这里面领取一个任务, 完成后就做一个标记,这样他的 ai 同事啊,就知道项目进展到哪里。 progress 点 txt 文件,每次 ai 完成任务啊,或者任务失败后,都会在里面留下工作日期,这也是为了给其他 ai 同事提供一些信息。 log 点 m d 文件,这里面全是提示词,用来指导 ai 根据固定的规范流程工作。和我们人类工程师的开发流程类似, 第一步,跑一个脚本,来初识化整个项目的环境。第二步,在 task 里面领一个任务。第三步,就开始开发。第四步,测试和验证。 第五步,更新 progress 和 task 文件。第六步,用 git 提交代码。那如果中间遇到困难,需要人工介入,它就要及时向人求助。那在以前一些长期运行能力不强的模型中啊, 这么长的开发流程,一旦工作上几十分钟,模型就会逐渐混乱,不再按照规定的流程工作,而如今完全没问题啊。视频后面我们会看到, glm 五点零,即使在长达一个小时的工作,提交了几十个 commit 后,仍然很好地遵循开发规范。 然后呢,我让他写一个脚本,用来无限时间的运行。这一套开发流程背后的原理很简单,就是把 cloud code 放到一个 while 循环里面,这样一来,人不在电脑旁边的时候没法手动 prompt, ai 就 可以执行这个脚本,让 ai 无限的工作。它之所以有效,有几个原因啊, 第一,我们这套流程每次只要给 ai 说一句,完成下一个任务,不需要更具体的指示, ai 就 能通过 task 和 progress 文件知道自己现在应该做什么。 第二,每个 task 都很小, g l m 五点零足够的强大,每一次 y l 循环里面,他只是领取一个很小的任务,并且严格的测试,成功率极高。第三,每完成一个任务,模型的上下文都会被清空,所以模型始终保持在最聪明的状态。 第四, g l m 五点零非常可控,严格按照工作规范执行,每次小任务都会进行 commit, 所以 即使出错,我们可以轻易地回滚到旧版本。 好,现在我们这套系统有了,接下来就要开发软件,我们先来设计一下它的功能和架构。这个软件的用途是一句话,生成长视频。我让 ai 把整个项目的开发需求拆成了三十一个任务,放到 task 文件里。 这是 ai 设计的软件,架构不复杂,但五脏俱全。再看一下 ai 画的业务流程图啊,帮助大家理解我们要开发的这个软件具体的功能。 首先,用户会创建一个项目,然后用大圆模型生成每一个分镜的文字描述,然后再用图片模型生成每个分镜的图片,再用视频模型生成。视频开发的流程比较长啊, ai 做了几十次提交,我就选几个精彩的给大家讲。 在 ai 做到第十九个任务的时候,为了测试 glm 五点零的能力呢,我产生了一个大胆的想法,我让他一口气做了一个多小时,完成了十一个任务,干完一个又一个,中间我没有任何干预, 给大家倍速感受一下效果。他一直在写代码,并且每次都遵循我们的开发规范,每个任务都完成,测试一个,一个任务,单独提交代码,拿一个具体的任务作为案例啊。他现在领取了任务三十,任务目标呢是实现响应式的布局,也就是让 u i 在 手机端和桌面端看起来不一样。 他现在正在修改代码,然后验证项目能 build 通过。然后他现在把浏览器的大小变成了手机屏幕大小。打开了我们的应用,他点击了一个按钮, 他对页面做了一次截图,用识图的 m c p 判断是否正确。再打开了一个新的页面,再做了一次截图,并检查是否正确。然后在 progress 里面仔细描述了自己所完成的工作,然后把这个任务标记为完成,他就按这么一套方式疯狂的干完了每一个任务。 要接入数据库的时候呢,他主动提出需要人工帮助,并且一步一步地给我说明,告诉我如何去这个 superbase 平台啊,点哪里创建项目,配置数据库,获取 api key。 尽管我没怎么用过 superbase, 仍然轻松地操作下来了。中间我还犯了错误,给他提供了错误的 key, 也被他及时发现,最后他还让我帮他去注册一个测试账号,然后他自己打开浏览器,输入账号密码,验证登录功能,可以正常使用。那像 superbase 这种外部的系统啊,超出了 ai 的 控制范畴。 g o m 非常明确的给我提供指引,让我协助他完成开发工作,一个不了解后端的人,也能在他的指引下完成数据库的配置。 他开发完后端一系列 c r u d api 后呢,声称对每一个 api 都进行了测试,但所有的 api 都是需要 os 的, 前端也还只有一个空白的页面,所以我就很好奇他哪里来的 os 权限,怎么完成测试,是不是在忽悠我? 于是我问了他一下,他用简短的语言,漂亮的格式向我解释。他说他打开浏览器,登录了刚才创建的测试账号, 然后通过一个叫做 browser evaluate 命令,在浏览器可以执行任意的 javascript 代码。然后他写了一些临时的 js 代码,就在浏览器里运行,调用我们的后端 a p i, 这样就能有 office 了。非常聪明的做法,我还怕他在骗我,我检查了一下录像,确实如他所说,他打开浏览器疯狂测试, 中间还真测试出不少问题,他就自行查看后端的报错日期,自行修复。最终三十一个任务全开发完后,啊,我也懒得去人工验证这个项目是不是已经可以用了。在往常的开发中啊,到最终阶段,因为已经把 前端、后端、数据库、第三方 api 全部连起来了,那第一次的集成测试啊,就会非常头痛,因为任何地方都可能出错,往往需要浪费大量的时间再把错误找出来发给 ai, 让 ai 去修复。但这一次我非常大胆,我只说了一句话, 请你完整测试一遍流程,确保功能可用。大概就是从早上七点十分开始,他自己在浏览器上疯狂测试,花了一个小时提交了这么多改动,用来修复 bug。 我看他在浏览器上像人一样一步步操作我们的产品,通过截图和视觉能力来判断是否符合预期。遇到问题的时候呢,他就自己查询后端的报错,检查各种 api 的 状态,综合分析出问题。最终他总算顺利的生成出了第一个视频,端到端的把整个应用全部打通了。 他修复的每一个 bug, 做的每一个 feature, 其实我都不清楚是什么情况,但我想知道的话,我只要找到他的 commit 记录,看一下他在 progress 文件里写了什么。这也是这套流程的强大之处,一切都是可追踪的。 我们让 glm 五点零一边开发项目,一边在开发过程中发现问题,让 ai 来增强我们这一套自动化的开发系统,左脚踩右脚,螺旋升天,我相信这就是未来开发者的工作方式。总结来说, glm 五点零已经远远超出了单纯抠顶的范畴,而是能对软件工程的每一个环节进行自动化,提升效率。 gm 五点零在超长任务上非常出色,已经达到了能让我放心的交给他连续运行一个小时的程度。横向对比的话,我个人认为 gm 比刚发布的 oppo 四点六弱一点,但在一些方面可以超过 gbt 五点三。 重点是价格便宜非常多,但现在过于热门啊,供不应求,抠钉套餐非常难抢。那我们这个项目呢?虽然现在端到端全部打通了,但最终深层的视频效果还有很大优化空间。点赞到一万,我可以开源出来,让感兴趣的人进一步优化它。

好的兄弟们,我现在的建议是所有有口令需求的。嗯,赶紧去充智浦的这个套餐,他现在还有优惠、限时特惠等,后面估计会供不应求,会被挤爆。因为今天晚上他这个 g m 五发布的实在是太猛了, 排行直接排到了全球前三,在抠定的一些榜单,甚至部分榜单拿到第一,我也在推上刷了很多关于他的这些测评。你看 glm 生成的这些 ui 设计、交互动效都有了非常大的提升。 关键是它的价格实在是太便宜了,二十块钱一个月,要什么自行车,赶紧去充吧。今天晚上真的是过年了, mini max、 智普、 deepsea 全都在发。哎呀,进化的速度实在是太快了,太快了,顶不住,太难顶了啊。不说多了,赶紧去充,这个套餐还有优惠。

几千台设备的生命周期管理,十二张数据库表的互相关联,完整的 r b a c 的 全员体系加发货单的审批流程。正常来说,这种企业系统呢,至少要三四个人搞一个多月。但是我刚看到智普刚刚发布了 g m l 五啊,说是开元界的第一个系统架构师的模型。行,那别客气了,咱就试一试。这里我用的是 c c switch 加 colossco 的 方式, 把 colossco 的 底座模型呢切换成了 g m l 五,直接把我整理好的这份 pl 文档呢丢给他,从零开始,看他到底能不能接得住。虽然是用 colossco 的 跑的跑的,但核心模块的逻辑呢,还是 g m 五输出的。 能看到,他先是把整个项目呢拆成了四个阶段,先搭什么,后搭什么,前后端怎么配合排的很清楚。这个规划质量和我之前用原生可拉的 office 做项目的体感呢是差不多的。然后呢,他就开始噼里啪啦干活了。首先是构建 spring boot 的 后端架构, 用户认证,设备档案批次管理,一个模块接一个模块往上加,后端搭完了呢,再构建 nexgs 的 前端,因为工程量确实不小啊,这一步他自己足足写了一个多小时。这个小时里呢,我没怎么管他,他自己呢,就在终端里跑, 先后端再前端,最后生成了出纸化数据库的脚本。用过 a g 的 写过代码的朋友都知道,这个节奏呢,是最考验模型脑子乱不乱的, g m 二五呢,全程逻辑在线,这一点呢,十分难得。前端写完了,最终运行的时候呢,报了个错,依赖版本冲突, 我让他看了一眼,这个报错信息呢,他改了个配置文件,重新安装了一遍就 ok 了,也就是说写了这么久,只修改了一次呢,他就能直接撞起来,想想啊,也是很厉害的。最后后端 spring boot 的 启动成功, api 返回正常数据,前端页面呢,也能正常跑起来。十二张关联表,完整的 r b a c 的 权限体系,发货单、审批状态机,这些呢,全都跑通了。 后面其实就和平时开发项目差不多了,遇到问题呢,就让他去定位修复,你会发现,这就跟一个靠谱的开发同事做极速编程啊,没什么区别。到这你可能会觉得这些不都是正常操作吗?对啊,这就是正常操作。但问题是呢,以前做到这些呢,只有可乐和 gpt 一个柜一个闭园,而且随时都有可能会被封号儿。 现在 gm 五作为一个开源的模型呢,也能做到这样的全载工程能力和这样的质量交付,实在是不容易。而且大家别忘了,从算力底座到上层架构,这可是跑在国产芯片万卡级群上的成本呢,那是绝对可控的。所以,这种能掌握在自己手里的生产力,你们不想去试试吗?

想让 cloud code 用上智普 g l m 五,别翻文档了,一行命令就够。为什么用 xcloud 的 智普不用改环境变量,不用研究配置文件? cloud code 的 工具能力还在,智普的代码理解更强,装了 x command 的 话,十秒内搞定全部适配。 操作很简单,去智普开放平台复制 api key, 回到终端,敲 xcloud 的 智普首次会让你粘贴 key, 然后就能直接用了。让它重构代码,分析性能,生成数据库表,响应又快又准。 cloud code 原本的功能一个不少,替换一次就永久生效。试试 xcloud, 智普国产模型也能这么丝滑,不要忘记一键三连!更多命令技巧欢迎关注 x command, 我 们下期再见!

ai 编程正在发生变化,过去大家更关注页面生成和代码补全,但现在前沿模型开始强调更长步骤、更复杂任务的执行能力,编程的重点正在从写代码转向构建系统。如果让开源大模型质朴, g o m 五从零 开始,帮我搭一个可以运行的创业系统,它能做到什么程度?具体来说,我想做一个 ai 职场技能订阅平台。这是一个具备真实商业逻辑的产品模型,它需要用户注册、登录、订阅逻辑、课程权限控制,这不是一个页面,而是一个产品。 打开智普官网,选择最新发布的 g o m 五模型,点击 agent, 点击全站开发,输入完整提示词并发送。现在,系统会开始自动规划与构建。在代码输出之前,模型首先进行任务拆解与数据库结构设计, 明确用户模块、订阅模块、课程管理模块之间的关系,并规划数据存储与权限边界。这一步体现的是构架思维,而非页面拼接。随后,平台构建完成,首页结构清晰。点击注册,立即注册, 输入注册信息,完成注册并登录。点击课程库,可以看到内置课程内容,并支持课程搜索内容筛选。 会员页面包含完整会员流程,点击立即开通,扫码支付后即可开通会员,再点击去学习,进入课程库学习课程。整个流程形成闭环,构建过程中出现环境与依赖问题时,系统能够根据日制进 行分析并调整配置,完成排错与部署。对我来说,这种自我修正能力比单纯生成代码更有价值。这次用智普 g o m 五实测创业系统,重点并不在于生成多少代码,而在于是否具备长步骤规划与系统构建能力。 从结果来看,它已经能够完成完整产品雏形的搭建。当 ai 能够帮助普通人把一个创业想法变成一个可运行系统时,编程的门槛正在被重新定义,这才是我认为最值得关注的变化。

重磅的 pony alpha 神秘面纱终于揭开了,果然就是质朴 g l m 五啊!参数达到七百四十四 b, 也就是七千四百四十亿参数激活四百亿,预训练数据二十八点五, t 扣定和 a 阵的能力全都取得开源搜塔啊,使用体感完全是逼进可洛的 opus 四点五。其实就在它还是那个测试模型,大家都在猜,那期间 大家就发现它编程能力直逼可洛的 opus 四点五了。所以现在看来,谁说开源比不了 b 源,而真让这次发布意义翻倍的啊!是海光 d c u 确认了对零的深度适配, 也就是说,中国最强的开源模型,在中国领先的 g p gpu 芯片上发布即可用光伏组织汇聚的超六千家啊!这生态伙伴现在形成的国产算力纵深真金碧玺比了 这一回的对零适配里头,海光 d c u 团队是深度协同智普 ai, 凭借 d t k 这些字眼软件占的优势,重点去优化底层算子和硬件加速,让 glm 五在海光 d c u 上实现高吞吐、低延迟稳定运行。 所以啊,现在咱 ai 大 模型真的正在向着更高参数、更广场景迈进。底层算力的适配能力完全是决定性因素了, 决定模型的落地效率的关键因素。回到模型啊, g l m 五的技术底座同样是非常震撼,全新 slam 一 步强化学习框架 可以怎么样让智能体从长城的交互中持续优化?还首次集成了 deepsea 之前说的那个 sparse attention, 也就是稀疏注意力机制,用这个机制在长文本效果无损的前提下去大幅压缩部署成本,现在开元旗舰都做到这水准了啊,赶紧推啊!所以二零二六春节到, ai 大 战果然是史上最热闹一届!你算吧, defv 一个 v 四这传的啊,千万三点五这基本你都看见了!迷你 max m 二点二会不会全都扎堆登场啊?中国最强的一批大模型,正在同一个窗口期集体亮剑的 glm 杠五怎么样?携手海关 dcu 这支重拳,注定中国 ai 震撼的一声响!

今天我们要聊的是最近一段时间,各大科技公司不断的发布各种 ai 大 模型产品,然后这些产品呢,也越来越多的应用在我们的日常生活当中啊,似乎大家都能够感受到 ai 给我们带来的便利了。没错没错, 这个变化真的是特别明显,那我们就直接开始今天的讨论吧。我们先来说一说最近一段时间 ai 大 模型密集的发布啊,尤其是最近这几个月有哪些重大的事件,或者说有哪些重大的产品,让大家觉得这个 ai 普惠时代真的来了。 最最明显的就是二月十四号字节跳动发布了豆包大模型二点零。对,其实从今年一月份开始,已经有至少四家头部的科技公司发布了全新的大模型,而且速度比二零二四年快了一倍, 这些东西你都能在央视新闻的报导里面,包括各大发布会的海报里面看得到 哇,这个速度真的有点让人应接不暇了啊。对,那现在这些 ai 的 大模型都有哪些让人眼前一亮的使用的功能啊?或者说有哪些产品的创新,让它们真的能够深入到我们的日常生活当中。现在的这些大模型已经不只是在实验室里面的 demo 了啊, 比如说豆包的多模态,它可以理解图片、视频等等的一些信息,然后智普的 glm 五,它可以帮律师来审核合同,效率提升百分之四十。还有这个可零三点零,它可以让一个完全不会剪辑的人在十分钟之内做出一个四 k 的 视频, 包括腾讯的混元图像三点零,它可以在三天之内修复一百万张老照片,真的是非常非常多的 场景都可以用到,太厉害了,那这些东西确实让普通人也能够感受到 ai 的 这个力量了。嗯,而且你看分屏展示、 g m m 五合同审核演示、可零视频生成的界面,以及用户修复老照片的前后对比, 真的就是 ai 已经实实在在的变成了我们每个人都可以操作的工具了,听起来确实很方便。紧接着我们再来讲一下,有哪些数据可以说明 ai 大 模型已经被广泛的应用了,或者说这些数据背后反映了一些什么样的趋势。 其实到二零二五年年底的时候,国内的 ai 用户已经突破了六亿,就是平均每两个人当中就有一个人在使用 ai, 然后每天都有一个新的 ai 服务通过国家的备案, 到年底一共有七百四十八款 ai 产品通过了这种安全的审核。你可以看到这个动态的用户增长曲线以及备案的柱状图,就会发现大家对于 ai 的 需求真的是爆发式的, 而且主要集中在民生的领域,有百分之八十的 ai 应用都在民生领域,这么看来 ai 确实已经普及到我们生活的方方面面了。那我们现在来探讨一下, ai 大 模型能够真正地走进千家万户,背后到底是哪些生态逻辑在共同作用。最最根本的就是市场的需求拉得非常的猛, 六亿多的用户都在用 ai 来学习、工作和娱乐,那这个技术也在不断的积累,包括专家都在说二零二五年的春节是一个分水岭,就之前大家都是在拼技术,那现在大家都是在拼落地, 再加上非常完善的监管,每天都有新的 ai 产品通过备案,安全有保障了,大家用起来才会放心。确实是这样,那我们现在来展望一下 ai 大 模型的普惠趋势 及大家的一些实际需求,就是现在这个东西已经普及到什么程度了,然后大家最希望 ai 能够帮助解决哪些实际问题?现在这个大模型已经不是说即刻的玩具了,它真的是变成了大家手机里面的一个常用工具。 那大家在评论区里面提的需求,比如说修复老照片呀,自动写工作报告呀,这些都是点赞非常高的。 然后我们也会挑一些大家最关心的需求来做专门的视频解读。好的,今天我们聊了很多关于这个 ai 大 模型,从实验室走到我们的日常生活,然后被越来越多普通人使用的这么一个过程, 真的是让人感觉到科技的进步给我们带来的这种普惠的力量。行,那这期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。拜拜。

tiktok 一 周热点汇总第一百零四期,本期的内容呢,包括了智普新一代的旗舰模型, ai 编程助手配置管理器、 ai 渗透测试工具、 安全的 python 解释器和深度金融研究智能体。最后呢,还是分享两份资料,那马上就要过年了,也提前祝大家新年快乐,马到成功,马上有钱,哦对了,还要说一句啊,因为下一周呢,刚好是过年的这个假期期间, 所以呢,我就想停更一次,这里跟大家请个假。那话不多说啊,我们进入正式内容,如果觉得内容不错呢,别忘了点赞和关注。目前来看啊,二零二六年的春节啊,注定是一场 ai 大 战,前面的元宝发红包,千问送奶茶。而打响模型大战第一枪呢,就是智普, 他刚刚发布了新一代的旗舰模型 glm 五。 glm 五呢,这一次的核心口号啊,是从会写代码到能完成任务。 其实呢,今年的几个模型发布啊,都在不断的强调一点,就是啊,从代码到工程的一个进化,都希望呢可以端到端的去完成完整的应用的开发, 所以呢,大家也都在强化编程的能力和 agent 的 能力。那官方发布的几个视频呢,我们都能看到,效果非常的不错,比如呢,像开发的这种学术版的 tiktok, 还有呢,可以联机对战的大富翁的游戏,当然啊,这些呢,都是官方展示的效果,其实大家都懂的。 那再稍微来看一下 glm 五的基本参数情况,七百四十四 b 的 总参数,四十 b 的 激活参数,使用了二十八点五 t 的 预训练数据。 然后呢,是 deepsea 同款的吸收注意力机制,那集成了这个 dsa 技术以后呢,能够让它在保持长上下文能力的同时呢,大幅的降低推理成本,那它的能力呢,基本上和 cloud ops 四点五呢是一致的,目前呢是开源模型的第一,这个呢是我让 glm 五自己生成的介绍, 而且呢,这里我引入了一个对比的外援,就是呢,几乎和 glm 五同步发布的 mini max m 二点五,我呢用 cloud code 和同样的提示词来看一下它们分别的输出效果, 那你觉得它们的谁的表现更好一些呢?当然呢,我这个视频呢,并不是一个深度的测评,大家看一乐就可以了。那说实话呢,智普和 mini max 这个上市啊,确实是立竿见影。当然呢,有好它也有坏, 虽然现在的模型能力是更好了,但是呢,它的价格也确实贵了。之前我开的这个 glm 扣丁 plan 呢,当时是八百多一年, 而现在呢已经是一千两百多了。那顺便提一句啊,如果有朋友想买的话,可以用一下我的邀请码,那我可以得到这个官方的邀请返现。那最后呢,作为开源模型,那这一次 glm 五呢,在本地的运行方面其实是非常不友好的, 在 l m studio 里面,最小的这个 g g u f 的 版本啊,也要一百七十六 g, 我 真是不行啊,我的本地是保不了。那有实力的朋友啊,可以自行去验证体验一下。 c c switch 呢,是一个开源的跨平台的桌面应用程序,它专门呢就是为各种 ai 编程助手呢,去提供统一的可适化的配置与管理入口。一开始呢,它是专门给 cloud code 做的,后来呢,逐渐地扩大到了支持各种常见的 ai 控件工具,像 codex 啊,还有 jimmy c i, 它解决了传统的靠手动编辑配置文件来去切换 api, key 模型,还有 mcp server 等参数的繁琐流程, 让开发者呢,可以通过一个界面就能够切换和备份,还有管理所有的配置。那现在呢,如果真的是外部定制的重度用户的话,那你肯定呢,不能光用一个模型的控制 plan, 因为呢,肯定是不够用的。 而如果你开了多个以后呢,那 cc switch 呢,确实还是蛮实用的,使用上的话,比如像我是 mac 的 话呢,就直接通过 pro 来去安装和使用,那他做了这样可直观的界面啊,所以对于动手能力不太强的这种非专业人群来说呢,是比较友好的, 尤其是那些啊非程序员,但是对外不抠钉很感兴趣的爱好者。另外呢,看他项目的页面的各种赞助啊,也能够感受到项目得到了用户还有甲方爸爸的双重认可。 所以呢,很多时候啊,真的把一个实用的小东西做好,也可以获得非常不错的效果和收益。本项目是一个开源的全自动化的 ai 渗透测试工具,核心的目标呢,就是自主的去发现并验证外部应用的可利用漏洞, 那填补日常开发与年度这种测试渗透之间的安全缺口。他不单是做这种扫描漏洞列表,还会呢像人类的红队工程师一样去分析代码来去验证漏洞啊,是否真实。 他呢,就像是你招了一个全年无休的一个红队黑客,二十四小时的在线的去帮你挖洞,那他呢,会将白盒的原码分析和黑盒的动态利用啊去相结合,分别呢用四个不同的阶段和不同的 a 阵他去执行动作, 使用的话呢,可以直接克隆项目到本地,然后呢执行项目的脚本,他会自动的完成相关刀客的下载,还需要呢,自己提前准备好大模型的 key。 要注意的是啊,它现在不支持 bash url 的 设置,所以呢只能使用 cloud 或者是 open ai, 再就是 open router。 另外呢这类工具啊,还是很费 token 的。 monty 呢,是 pentetic 团队啊,用 rest 编写的一个极简的安全的 python 解释器的实现, 专门呢为 ai 系统的嵌入式代码执行场景而设计。它的目标呢不是去替代完整的 c python, 而是呢提供一个高速安全受控的环境,让 ai 生成的 python 代码呢,可以在内部安全的去运行。 那它的核心特征呢,包括了像安全刹箱啊,急速的启动速度啊,还有受控的执行子集和多语言的绑定。那在智能体 a 阵它的执行场景当中啊,经常会有一些需求,比如像执行模型生成的脚本, 同时呢还要去保证这些动作的一个安全。那传统的方式呢,就是启动完整的 python 和容器的沙箱,那这么呢,要么带来安全隐患,要么呢就是启动的开销比较大。那 monkey 的 设计呢,就是为解决这类场景下去提供一个更安全,更轻的,更容易嵌入的一个方案。 那本项目呢,是一个开源的自制的智能体,专门呢是面向深度的金融研究和自动的分析去构建的,他能够把复杂的财务问题啊,去转化成结构化的研究计划,然后呢自动的去获取数据,再去进行分析与验证,最后呢得出可信的结论和输出完整的任务流程。 那要使用项目呢,你需要首先安装半,那安装的话呢,可以执行项目给出的一键安装脚本,之后呢再把项目克隆到本地,然后呢执行半 install, 接着呢再把点 env example 复制成点 env, 再去里面去修改一些配置, 其实主要呢就是配置大模型的 api key, 还有各种使用到的数据源的 api key, 那 配置好了以后啊,执行半 star 就 可以运行了, 那在整个流程当中啊,他强调的是要先去思考,再去行动,接着呢要进行自我的检验,以确保呢结果的可信性。 那这个呢,正是金融分析所必须的一个特质。那这里要注意啊,其实他的数据呢,是要依赖于外部的数据源的输入的,而这里面他使用到的 data set 呢,其实很多都是要收费的,而且这类金融的数据源其实还是很贵的,所以啊,我感觉在上手投资的这个门槛上还是比较高的。 最后呢还是分享两份资料啊,第一份呢是理解机器学习从理论到算法,那本书呢,对机器学习的基本思想 还有呢,将这些原理啊转化为实用算法的数学推导,进行了全面的理论的表述,想多了解这些底层知识的呢,可以去学习一下。那第二个是全球 ai 平台市场的全景与趋势洞察报告,从去年开始呢, ai 行业的关注核心呢,正在逐步的做迁移, 从模型呢,更多的去转向了 a 阵的和应用,所以呢,后续的 ai 应用平台呢,肯定会卷的越来越厉害。那这个方向呢,也确实啊,值得多做关注。那有需要的朋友呢可以告诉我。以上呢,就是本周的全部内容,再一次呢,祝大家新年快乐,我们下次再见。

中国这些 ai 厂商太坏了啊,昨天二十四小时之内啊,中国三个旗舰大模型同时炸场,这完全都不让人过年啊,去年的 deepsea 就 一家赶着春节发布,但是今年呢,全上了, 但是大家千万不要觉得这只是几个新模型的发布啊,比这几个模型更重要的是,从这几个模型的更新内容上面,我们能够看到二零二六年 ai 发展的一个重大的转型,那就是所有的厂商都在拼一个全新的能力,叫 agentic。 那 为什么是 agentic? 为什么所有的模型都在拼了命地去打造 agentic 的 能力? 原因呢?很简单,因为 agentic 才是在二零二六年真正的生产力。今天呢,我就尽量把这个问题用小白都听得懂的话跟大家详细的讲一讲,希望呢,能够对大家有所帮助。 先说一下 agentic 到底是啥啊?你现在用 ai, 你 不管用豆包,用 deepsea, 还是用拆 gpt? 其实很多时候啊,你都是这么去问的,对吧?你说句话,然后他回答你,然后你再说句话,他再回答,说白了呢,就是一个高级聊天框。但是 agentic 完全不一样, 你不用一步步的去问啊,你只要给他一个总目标,比如说你跟他说,帮我把这个软件里所有的 bug 找出来,修好,然后通过测试, 然后他就开始自己干了啊,他自己去修代码,自己定义问题,自己去修改,方案,自己去改,自己跑,测试没通过就自己调整,一直到全部搞定。而在整个过程中,你不用一步步的去提问,也完全不需要插手。 打个比方啊,传统的 ai 就是 一个前台,你问什么他就答什么,但是他不会主动帮你做任何事情。而 agentic ai 呢,他就是一个能独立干活的员工,你把任务交给他,他自己搞定,而在中间遇到的任何问题,他都会自己去解答。这就是 agentic 的 核心,他能自主完成复杂的任务。你有没有注意到一件事, g l m 五,它的口号是什么呢?是从 web coding 到 agent, 而 mini max m 二点五的口号是为真实世界的生产力而生。而 devic 虽然说没喊口号啊,但是一照的上下文,本质上就是在给 agent 铺路。 同一天,三家公司不约而同地压住同一个方向。为什么?因为 agentic 的 能力才是真正的生产力,尤其是在二零二六年。如果你想让 ai 真正成为你的数字员工,你就一定要知道什么是 agentic。 你想一想啊,一个只能聊天的 ai, 你 愿意为他付多少钱?大多数的人的回答就是,最好免费。因为事实上,现在各家的聊天机器人确实也在疯狂的打价格战,越来越便宜,甚至几乎都是免费。 但是,如果是一个能够帮你自主完成工作的 ai 呢?如果他一个小时可以呢?帮你做完一份财务报告,帮你搭一个网站,帮你处理完一整天的数据分析?那你觉得他就算不免费,你是不是也愿意去用? 企业的答案就是,愿意用,而且愿意给很多钱。这个逻辑啊,很简单,只有 agent 能力足够强,模型才能够帮用户干活,用户才愿意付费,公司呢,才能够活下去。但你可能会问啊, agent 能力到底靠啥实现呢?答案就是编程。 你看看最新这些模型的评测, s w e 奔驰考的就是真实项目里面自主修 bug, 其实就是编程 browscap, 它考的是自主操作,浏览器搜索信息,提取内容,浏览器的自动操作本质上也是编程。而工具调用考的是自主决定调用哪个接口,传什么参数,怎么处理返回结果。这还是编程?甚至啊, deepstack 把上下文啊拉到了一照最直接的术语场景啊, 也是让 agent 才能够在超大型的大码项目里面持续工作,而不至于失意。所以你有没有发现,这一天发布的所有的模型,大家在拼的其实都是编程能力,都是 agent 能力。而 agent 能力强不强,很大程度就取决于编程能力强不强,因为编程就是 agent 的 底层引擎。 而想明白这一点之后,我想再往前推一下啊,我想抛一个暴论,这个世界上的绝大部分事情,本质上都可以归结为编程。我知道,这听起来呢,非常的离谱啊,但是你跟着我的思想捋一捋, 编程的本质是什么?其实就是把一个需求通过一系列精准的步骤,然后变成一个可执行的结果。而我们现在的社会已经深度的数字化了,你每天点的外卖,刷的短视频,转的账,打的车啊,背后全是代码在驱动,你的工作,你的消费,你的社交,你的娱乐,几乎全部跑在软件系统上面。 而编辑和操作软件,它本身就是编程。所以呢,当 ai 的 编程能力足够强的时候,它能够影响的范围啊,就远远超过你的想象。我举几个例子你就明白了,比如说做 ppt, 写报告,你觉得跟编程有关系吗?其实本质啊,就是一种结构化的信息处理加格式化的输出, 你把散乱的素材整理成有逻辑的内容,再按照固定的格式排版出来,这个过程呢,跟写的数据处理程序没有区别。而且 ppt 本质上就是一个电脑的软件格式啊,所以任何一个 ai 编程的软件,它都能写 ppt, 像 glm 五啊,像 m 二点五,这一次呢,都在卷。所谓的 office 能力,就是直接生成 word 呀, pdf 啊, excel 文件,就是因为这些事情的底层驱动啊,和编程没有区别。 而财务对吧?财务的建模本质就是数据处理加工式的这个逻辑,一张 excel 表,里面几百个单元格,互相引用,层层计算,这本身其实就是一个程序在运行。 m 二点五呢,专门跟金融行业的资深专家合作去训练这个能力。再说一个你可能完全想不到的就是医生开方, 比如说你去看一个医生啊,他给你望闻问切,实际上就是在收集数据,然后根据你的症状组合,在脑子里面匹配对应的症型,然后开出方子。而这个过程呢,其实跟收集输入、匹配规则、输出结果在逻辑上完全一样。 甚至做饭啊,菜谱,其实就是一个程序,输入原料,按照步骤执行操作,控制火候和时间这些参数,输出一道菜。所以你看那些做菜比较好的那些电器啊,比如说一些好的电饭煲,它里面都会用程序这个词,就是设定程序,然后按照程序来给你煮饭, 你说大厨凭感觉,但实际上它的背后就是几千次重复执行形成的参数经验,你用这个视角来重新看世界,你就会发现,几乎所有的事情都可以拆解成输入,处理输出,而这就是编程。 所以,当 ai 的 agent 能力越来越强,尤其是编程能力越来越强的时候,它能渗透的领域是无限的,它不仅仅是帮程序员去写代码,而是帮所有的人把事情做成。这就是为什么所有的模型都在拼命地提升 agent 能力,因为这条路的尽头就是通用的生产力。 之前在视频里我也聊过 opencloud skill 系统,很多人呢,觉得 skill 很 强大,确实强大,但是 skill 再强大,它的底层驱动还是模型的 agent 能力。 你可以这么理解啊, skill 呢,是一份工作说明书,而模型的 agent 能力呢,就是执行这份说明书的人。说明书呢,写的再好,执行的人能力不强啊,那结果也不会好。所以今天这三个模型的进步,对于每一个用 ai 工具的人呢,都有直接的意义。 模型的 agent 能力多强一分,你手里的 ai 工具就能多帮你干点活,它的性价比呢,就会更高。所以二零二六年啊, ai 的 竞争完全不是比谁更能聊天。而对于我们每个普通人来讲, agent 时代它真正的意义就一句话, 不是让你去学编程,而是 ai 替你编程,直接替你把工作完成。以上来自我的 ai 成长圈的日课,已经加了成长圈的朋友可以去看一下,我是 c 哥,点赞关注,咱们下期见!

三十秒看今日 ai 圈大事,这些有趣可玩应用游戏,竟然都由它开发!国产模型智谱 glm 五来袭,让大模型从写前端代码迈进写工程,完成系统大任务,编程使用体感逼近 opus 四点五, 不仅帮助程序员,同时还能作为 ai 助手的底层模型,帮助打工人将文本素材直转为 ppt 或图表文件,尤其擅长复杂系统工程与长城 a 阵的任务。 另外,同日 mini max 与 deepsea 也上线了新模型。再来视频翻译配音上,这个工具在做多语言翻译配音的同时,能将嘴型表情也自然契合。 for one week ai 语音上, most tts 八 b 号称可做十分钟至小十级多人对话,语音控制音色的同时,把握更细的语音节奏。 i'm a memory 智能体上,视频智能体 nimo video 会自动追热点,拆解结构,创作同款效果。 ui 设计也有智能体的帮忙,谷歌设计工具 stitch 继续扩能力 ide agent 输入想法,智能体就能出具多款 ui 方案与 ai 碰撞创意。今日还有以下信息值得关注, ever ai 每天带你了解 ai 新鲜事!

很多人说,模型发布就是敲一天锣,第二天照旧。但股价这东西,听锣鼓只是表面,它真正闻的是味道,你接下来能不能真的把钱赚回来? 二零二六年二月十二日,一天两升锣,智普 g m 五点零登上台, mi max 把 m 五点二退到前排,同一天,恒生指数还跌了百分之零点八六,但这两家股票却逆势上蹿,智普收四百零二十八点六八, mini max 收五百八十八港元,单日涨幅超过百分之十四点六二。这说明市场在给模型升级,这条主线重新贴标签, 那差别在哪里?谁把确定点和收款码做的更硬?智普走的是预热确认再定价,二月九日十日,匿名模型线索先把开发者论坛点着,二月十二日官方确认,再叠加提价,资金就敢加码。也就是说,这不是纯情绪,是能不能赚回来的。预期被抬高了, mi max 也涨得不错,但统计上更偏软,异常收益大于百分之十四。原因其实很朴素,公开证据链更多,靠转述确认点更平滑。再加上上次股价高波动短样本 噪音更容易把信号盖住。所以别只盯着发布会那一摞,真正盯的是发布后能不能交作业、 api 付费、企业订单续费率、毛利推理成本取现,再加上一条合规和 ip 治理。我是波导,欢迎关注。

gm 五终于发布了,听说非常强,我也想试试他到底是不是真的有那么强,我第一时间就拿我维护了一年有上千真实用户的三倍插件给他上上强度, 直接挑战开发中最头的那三个难题。第一,极万行代码项目的全景理解。第二,多层嵌套的复杂 ip 逻辑。第三,真实用户的需求迭代。 我们这次的开发环境依然是 vs code 加 code code。 我 首先让 g m 五先理解一下项目整体的技术细节以及功能特点, 这里有一个非常关键的点是 g m 五在发现问题的时候,它会自动的去检测这个错误,然后自动的去修复,接着它就会去读取我相关的一些文件, 然后形成了一个完整的技术分析报告。大家可以看到它上面把这个技术的分层架构都写好了,哪些是处理 api 调用,哪些是处理交互以及数据持久化的。然后接下来就是我 api 的 调用逻辑,他每一个点他都列的很清楚,说实话他列的这个技术报告比我这个作者写的还清楚。接着我就让他基于用户反馈形成一个英文字母导出的功能,比如这是一个 英文的视频,它有一个英文的 ai 字幕。以前的话我们这个插件它是没办法获取英文字幕的,因为当时我是只支持了中文字幕的处理,就比如现在它这个英文字幕是没有的,现在这个英文字幕导出的功能,它不仅仅是增加一个按钮,更主要的是它需要去重构底层的一个解析逻辑。 就比如说我这个接口,它的数据是怎么返回的,我需要怎么去处理中文和英文字幕的选择?那 gm 五 他在思考之后就开始进行执行,然后直接去帮我编辑处理了相关的代码逻辑,大家可以看到他每一步他是怎么做的,这里都写的很清楚,然后最后他就帮我完整的实现了我需要导出英文字母的这个功能。我整体体验 gm 五的功能, 我觉得他真的是更加智能的,就像是一个支撑的系统架构师来帮助我便携代码一样。大家可以看到,现在在 g m 五帮我修复了英文字母下来之后,现在这个字母就可以获取成功了。 说实话, ai 编程最难的从来都不是写新代码,而是维护老代码。十三代码,我之前开发的飞书多表格、马克当预览插件,现在也有几百个付费用户,代码里面其实也有不少的十三代码平时没有大 bug, 我 根本就不敢 动它,生怕改动了之后影响用户的使用体验。不知道大家在用 ai 写代码的时候有没有遇到类似的问题呢? 但是啊,我最近观察到,不管是 cloud ops 四点六还是 gpt 五点三 codex, 它们都不再去卷升程速度,而是全面转向了 agintending coding 发展,简单来说就是更加专注于解决真实项目需求的能力。而 gm 五 就是目前开元界首个跟上这一趋势的模型。 gm 五整体表现都不错,在科奥的欧布斯四点六跟 gpt 五点三科特斯之间很多成绩甚至都感觉不到差距,但是我发现 gm 五有时候的响应速度确实有点慢,这点希望以后能提升一下, 再给大家说个心里话,其实三个月前我就开通了 gm codeine 的 套餐,我当时用的还是 gm 四点六,短短三个月时间,我们的钱还是那份钱,但是手里的工具却一次比一次强, nice! 我 眼看着他从四点六进化到四点七,再到今天可以跟科尔的 off 四点六扳手腕的系统架构师 gm 五 厉害!这种养成系的快乐真的太爽了!用过 gm 扣顶破烂套餐的老用户应该都懂,这次 gm 的 进步让我再次看到了国产模型的硬实力,大家赶紧去试试 gm 五吧! 好了,以上就是本期视频的全部内容,记得点赞和关注我哦!我是超超,我们一起学研,一起变强,我们下期再见!拜拜!

又是深夜发布,今天突然发现智浦开源了 glm 五大模型,没想到年前的开源大模型市场还会出来这个网站从前几天 cloud ops 四点六和 gbt 五点三 codex 的 发布可以看得出来,二零二六年商业大模型趋势将从能写代码升级成能构建生产机系统, 没想到的是开源大模型这么快就跟上了,熬夜测试了几个小时,本期视频我们就来看看 glm 五都有哪些亮点,以及都能做些什么事情。 二零二五年使用大模型编程的过程中,我发现虽然 ai 已经可以做出一个个很好看的前端页面了,但是真的让他去做一个生产能用的系统或者是一个庞大的任务,经常写着写着 ai 自己就圆不回来了。 但这次 glm 五真正能做出生产可用而不是单纯好看的系统,并且遇到复杂系统需求会自己拆解,可以长达数小时的不断自动运行完成这个系统不会出现越写偏离越大的情况。我直接拿两个案例来演示一下,工具用的依旧是 copy code 用的是质朴官方这个 model 的 key 配置文件的话,其他都和之前保持一致, 模型替换成 glm 五即可。很多公司应该都有自己内部的企业级后端脚手架,不仅能统一开发规范,并且开发只需要引入对应的依赖和无需关注各种中间件的配置细节就能直接使用。 我之前写过 glm 五来生成 glm 二十一加 spring boot 三的企业级后端脚手架,编辑提示词开始执行,可以看到这次 glm 五在分析完任务之后,会以对话的形式来询问生成项目的细节问题, 宇宙包含哪些模块的 start 给了多个选择,接着询问项目的认证框架,最后确定报名的生成规范,等这些全部完成之后,就开始任务的拆解。 glm 五将脚手架拆分成了十四个大的模块,制定了十五项具体的实施步骤以及最终的验证方式,没问题之后,就开始让 glm 五开始构建系统了。 glm 五这次针对多阶段长步骤的复杂任务的优化做得太好了,整整十五个模块,花了一个多小时全部生成完成。整个过程不需要人去做额外的辅助工作。 除了代码生成之外,当在验证过程中遇到翻译失败的情况,它会自动分析日制,不断修复代码并重复验证,直到全部跑通。我们可以来看看最后的脚手架项目,所有的 start 按模块划分,比如 base 模块定义了统一的异常,统一返回信息, log 模块引入至框架搞定日制生成规范,做好 trace id 生成逻辑以及日制切面等配置。同理,像 mybatics 统一配置 radix mq 的 配置都做成了 start, 要使用直接引入对应的依赖即可,这是真的能很好的用起来的项目了。 接下来再做个全站的业务系统,做一个支持高频发的购票系统,能支持秒杀业务的场景。这次让他把前后端的项目全都生成,前端使用 vivo, 后端使用 jdk 二十一加 spring boot 三。 这里有个比较有意思的点,一开始我在提示词中将 jdk 二十一写错成 jdk 八了, jmm 在 分析需求的时候就发现了这个问题,并给了我几组匹配的 jdk 和 spring boot 的 版本。 手动调整之后, glm 五给出了十分详细的技术报告。整体的代码生成过程还是和之前一样,不需要人去做额外的操作就可以生成出完整真正可用的代码。现在前后端代码就生成完成了,我们来看一下。 先看一下后端代码,秒杀业务的逻辑写的十分严谨,其中高密发解决方案中包含了多级缓存、库存预扣、业务下单、分布式锁结果限流、动态余额等方案。前端页面是一个包含购票和秒杀的 h 五系统,我们来参与一下。秒杀 手速快,直接抢到票。智普在官方公告中提到了国产芯片万卡集训这个概念,意味着这次 gm 不 仅模型能力强, gpu 底座也是国产自己的。 去年过年来了个 deepsea, 今年过年来了个 gm 五,不知道二零二六年大模型究竟能发展到什么地步啊?以上就是本期视频的全部内容了,我是鱼仔,我们下期再见。

外行人搞 ai, 要搞就搞最新的智普青年在春节前推出了新版本 g l m 五,并继续开源。今天看到了它的算力资源紧张,估计并发量激增。那我今天就来试试这个模型。我用罗拉木私有化部署起来了,看看效果, 改天用它来试试。对接 call 爸的最后祝各位新春快乐!

今天用智浦新发布的 glm 开发了一个新项目,基于 spring boot 的 酒店管理系统,这个项目已经开源到 github 了,还附带一个项目论文,关注同名微信公众号即可获取。 最近后台很多人私信想要我的产品说明书,想让我出一个详细点的教程,现在就带大家做一个完整版的项目。首先明确要做什么,怎么做产品,应该有哪些功能,解决了什么问题。我把这个产品说明书的内容概括分为以下部分, 明确开发技术站、技术架构、功能模块、数据库设计以及 ui 风格。这几点确定下来就可以大大降低 ai 写代码出现的幻觉。所以很多时候幻觉的问题不单单是模型的问题,跟人也有很大的原因。 然后这里我用到了一个文档专家的智能体,让他基于我们已经确定的要求生成完整详细版的产品说明书。那么 ai 就 更清楚要做什么,该怎么做,所以前期多做一些准备,就能尽可能避免后面形成的十三代码。 经过了连续三十六分钟的编码, glm 五完成了整个项目前后端的开发。整体功能分为两个用户角色,普通用户和管理员。 普通用户可以注册登录预定客房,查看订单。管理员可以管理用户信息,维护客房信息,查看所有订单数据,统计分析。 最后主包想跟大家说, ai 时代如何使用工具提高自己是一门必修课,一定要尽可能多地去尝试使用各类 ai 工具。

大家好,今天呢给大家介绍的是智浦最新发布的 ai 大 模型 glm 五,那 glm 五呢,它是拥有一款啊,七千四百四十亿参数的啊,超大规模的混合专家模型,底层框架使用的 mo 一 框架,它的上下文窗口长度呢可以达到两百 k 左右。 然后呢, gm 五呢,在全国权威的这种 artificial alliance 榜单中也是位列位列全球第四的,在开源界的话也是处于第一名,并且呢在多项的这种编码测试中也是获得了开源索塔的成绩,它的性能的话是超过了 啊,谷歌的 gmail 三 pro, 实际的体验的话毕竟于这种 cloud ops 四点五。 而且呢这次智普的这个 ai 呢,也是接近把它的 ai 呢都扩展到了一个多模态领域,支持多模态理解,然后呢,呃,而且能处理这种超成本或是复杂工程,以及说做 a 境的开发。 那今天呢,我们会用啊二十万字的文档带大家去深入去了解一下 glm 五它的技术原理, 还有底层的一些啊架构啊。这篇文章呢,是通过 cursor 编辑的文章,一共是十一个间谍。然后这个篇文章是通过 opencode 加 midmax 编辑的文章,嗯,也是大概十个章节左右。 那首先我们来看一下这些章节的目录大概的内容啊,这个这里呢,我将这个文档呢做成一个简单展示的一个网站啊,简单给大家说一下这些网站。这个 gm 发布这次的内容,首先是对于行业发展来说,嗯, mate 在 之前的是开元领域是领先的, 那 g m 现在是呃在开源领域是呃做到了第一,那闭源模型就是三大这个 ai 公司啊, open ai、 ostracape 跟谷歌,谷歌啊,但是嗯,我们看到过 g m, 它追赶速度还是比较快的, 然后这次的呃突破性的成就也是比较高的。首先是模型的参数扩大了,然后结合了多模态 以及说上下文窗口长度,能输入整本书或者是整个项目,整个代码仓库啊,还就是在工程化的这种 ai 编程领域,那也是获得了一些突破 啊。第三部分是这第三部分是 g m 的 发展史啊,那可以看到距离上一次发布 g m 四点五的话已经差不多一年了,然后呢这个 g m 五的话是二月份才发布的, 然后它里面的技术创新和架构设计呢,主要是设计包含这个混合加专家模型的优化,因为它这里包含有二百五十六个专家,然后呢进行灵活的调度。其次呢就是它借鉴了 tiffany 的 啊些数处理机制,然后做了一些局部的一些优化, 然后也做了自己层面一些创新,比如说引入了 slam 框架,它可以去增强这种啊,训练,训练啊,增强,提高训练的效率,然后这 slam 的 话是一个一步强化学习框架,然后呢它也做了各种层面的一些优化, 然后呢在性能评测或者对比里面呢,它的这个编码分得分的话也是超过了 gsm pro, 这是他,嗯,大模型评分后面,然后行业几方的话也是目前啊,就是大家通用的大模型的解决方案,比如金融指挥啊,都这这些领域的东西,然后这是他大概的内容。

别再沉迷于让 ai 生成贪吃蛇或者简单的着陆页了,说实话,那也只能算 ai 玩具,根本上不了生产线。 glm 五发布的今天 ai 编程大模型,正是从前端切图在进化到了系统架构师时代。 现在的趋势不是谁画图好看,而是谁能搞定 aintiq system。 以前测模型我都让他写前端网页,这次我直接上强度,给他提了一个真实的生产级需求。我要求 glm 五开发一个 live o s 的 个人指挥舱。注意,我没有让他只写一个 to do list, 而是让它生成了一个包含日程、消费、健康学习的完整个人管理系统,并且接入了 ai 能力。 glm 五展现了惊人的 a n t 和长城规划能力。 但这里他没有着急写代码,而是像资深架构师一样,先自主拆解了前后端架构,并在长达一小时的构建中始终保持上下文连贯。他清楚地知道第一步写的数据结构要怎么配合最后一步的 ui 渲染。如果 live os 是 看规划,那接下来我告诉他这个需求。金融看板就是看它搞定顽固 bug 的 能力。 做这种复杂的 c v 波动率计算报错是常态,普通的 ai 遇到报错就摆烂,但 glm 五具备极强的自我反思机制,大家看,遇到报错它没有停,而是自主分析日制定位根音。它不只懂前端审美,更拥有深度的后端工程能力, 直接把系统彻底跑通。这种代码逻辑密度,以前你只能在可洛的 opus 四点六这种顶尖闭源模型上看到,但现在, glm 五直接对标可洛的 opus 四点六,把复杂的系统工程能力带到了开源世界,感兴趣的朋友快去试试吧!

炸了!硅谷被耍惨了!神秘 pony alpha 竟是国产 g l m 五的马甲!全网猜了整整一周的神秘 ai 模型终于揭开谜底, 硅谷大佬们猜的是壳二五马甲才是大厂秘密武器,结果全错,这波直接被国产 ai 智普拿捏! pony alpha 就是 智普春节大招, g l m 五,更狠的是,他直接开源了! 要知道二零二六年可是智能体工程时代,国外 gpt 科尔还藏着掖着,咱国产 glm 五直接成的首个开源基础设施,这波操作直接拉满排面。别以为它只是普通的 ai 写代码,实测之后才发现,这模型根本不按常理出牌, 让它做卫星信号模拟程序。它压根不只是画图,居然懂多普勒效应,卫星转圈、信号波纹扩散的动画,全按物理规律来,直接生成可交互的网页,这理解能力绝了! 再加大难度,让他实时化交通信号灯工作原理,不到三分钟,动态交通流模拟图就出来了,绿灯放行,红灯排队,车辆速度随机变化,逻辑言辞和缝。网友都直呼着要么是 a g i, 要么是把题目背透了。 网友的实测更炸裂,一行提示词生成全新网站,还有人让他做全功能媒体播放器,解码播放列表,深色模式全配齐编,一晚才十五兆,这效率谁看了?不忙 我也亲测,让他做火柴人,开放世界游戏,他居然先跟我敲定技术战玩法风格,全程像个专业架构师。我中途临时加需求加荆棘系统加射箭,近战加背包 npc, 他 全接住,最终效果直接拉满体验感觉了, 甚至让他造个 mac 系统,不仅界面还原,上面的应用居然真能打开 glm! 我 的实力可不是吹的最难的编程榜单上,他拿下开源最高分,真实体验无限逼近科二 opus 四点五, 核心杀手锏更是藏在底层某架构,让他聪明又清凉。全新 slam 框架彻底改变训练模式,以前 ai 靠背题考试,现在他像人一样实习做项目,边做边选。 更让人骄傲的是,他还适配了国产半导体半壁江山的芯片,华为升腾、韩五 g、 昆仑芯片,再到模型,国产 ai 生态彻底跑通,完整闭环,这才是真正的硬核实力。 特斯拉前 ai 总监预言的智能体工程时代,居然被国产模型先落地了! glm 五开源后,软件工程二点零真的要来了! 以后写代码可能不用竹行敲,只要定好需求, ai 就 像包工头一样,把项目全搞定。传统马农时代或许真的要变天了,但别慌, ai 包办的只是繁琐的实现,人类的审美判断力,还有提出好问题的能力,才是永远的护城河。这波国产 ai 的 逆袭,直接让硅谷刮目相看。你觉得 glm 五会颠覆编程行业吗?关注我,带你拆解更多 ai 玩法,让你不被时代淘汰!

ai 编程拥有架构能力了?我对 ai 编程的能力一直很乐观,老粉都知道,但说实话,过去一年里我们看到的 ai 编程本质上还是高级代码不全,在加固能力上还是不如人类。但最近啊,硅谷的风向变了, algorithpic 和 open ai 都不再吹嘘一句话生成网页了,而是开始强调 algorithmic coding, 让 ai 像真正的工程师一样,花时间去解决复杂的系统性问题,不是替你写代码,而是替你做工程。今天我用最新发布的 gim 五模型做了个实测,让它从架构上分析我之前已经上线应用市场的真实项目 photoshop 的 app。 测完之后,我的第一反应是, 国产大模型也拥有架构能力了。今天就分享一下这次实测的过程。我把整个项目的代码库喂给 gim 五,然后写下提示词,请分析这个项目的架构,找出潜在的问题和优化空间。我在 c c 接入了 gim 五模型, g i m 花了大概五分钟,给我返回了一份详细的架构分析报告。我挑两个最让我意外的发现来说吧。第一个,它发现了一个隐藏的现成安全问题, 你看这段代码在 model 层里直接调用了震动反馈和音效,看起来没问题,对吧?但 g i m 五指出, swift data 的 model 不是 现成安全的,如果在后台现成访问,这个方法可能会导致崩溃。它不仅指出了问题,还给出了重构方案, 让我把 ui 相关的逻辑抽到 surface, 用依赖注入的方式解偶这个问题。我自己 review 代码的时候完全没有注意到。 第二个更绝,他发现了一个潜在的内存泄露,这里引用了 task, task 又引用了它,形成了循环引用,而这些都是真实存在的架构问题,不是那种简单的表面优化。架构分析完,我想试试 gm 五理解并修改现存项目的能力。我的 app 有 一个功能,用户可以删除当天的专注记录。 我直接让 jm 五根据我的代码上下文做出修改,改为可以删除单条转注记录,只是描述了需求而已,它就顺利完成了修改。 以前我说看好 ai 编程,指的是 ai 能提高开发效率,能写出可用的代码。但 arjun take 规定之后是个转折点, 从此 ai 将开始独立承担复杂任务。它不是简单的你说一句,我写一段,而是 ai 能主动分析问题,定位 bug, 提出优化方案,甚至能做架构级别的审查。 ok, 以上就是我对新模型 gm 五的实测,如果你有什么看法,欢迎在评论区交流。