如何借助 ai 为自己赚钱?这期视频看完立刻上手!就在今天,国产大模型智谱发布了 g l m 五点一,它直接刷新了全球开源模型的最佳成绩,甚至在核心能力上追平了 g p p 四 o 和 cl o 的 这些顶尖的闭源模型。这意味着,一个属于我们普通人的超级个体时代真的来了。 今天一个视频给你说清楚,一、 g l m 五点一到底有多强?二、我们到底该怎么抓住这波红利?在开始前先放个深水炸弹, 推出了请护 o p c 社区,只在聚集更多艺人、公司、创业者,助力大家达成互识、互享、互助的机制。加入社区的创业者有机会获得请护前沿馆的独家报道、全网宣发及全方位的创业扶持。感兴趣的朋友留下 o p c 三个字母,现在开始。一、 glm 五点一到底有多强? 第一,他是个能独立工作八小时的超级员工。以前的 ai, 你 问一句,他答一句,稍微复杂点的任务他就断片了。但 glm 五点一能自己规划、自己执行、自己纠错,连续工作八个小时,这意味着什么?意味着你可以在睡前给他布置一个任务,比如把这一百份行业报告读完,给 我总结成一份 ppt, 或者帮我分析过去一年的销售数据,找出问题,你安心睡觉。第二天早上醒来,他已经把一份完整的成果交到你手里了, 这相当于你免费多了一个不知疲倦的助理。第二,他是个顶尖的程序员,他的代码能力已经追平全球最强水平。以前你想做个小程序、小网站,要么得花几年学编程,要么得花几万块找外包。 现在你只需要用大白话告诉他你的想法。比如帮我做一个家庭记账的网页,他就能从零开始,自己写代码,自己调试,甚至自己部署上线。普通人不再需要懂代码,也能把自己的创意变成产品。 二、普通人到底该怎么抓住这波红利?我们给大家指三条明路。首先,从执行者转型为审核者,别再花大量时间去搜索、去筛选信息了,把复杂的任务丢给 g l m 五点一,让他帮你完成信息降噪。 你的角色要从写报告的人变成审核报告的人,把你的精力集中在决策、审美和人际沟通这些 ai 暂时无法替代的领域。 其次,成为超级个体,把想法直接变成产品,不要只学提示词,要学产品思维。你不需要知道代码怎么写,但你需要知道你想做什么。利用 g l m 五点一的编程能力,试着让他帮你写个小游戏,或者一个简单的工具,你会发现你的创意可以直接变现。 最后,利用开源优势搭建你的第二大脑。你可以把 g l m 五点一部署在本地,把你的读书笔记、工作文档、客户资料都喂给他,打造一个完全属于你,只为你服务的专属顾问。 说到最后,只想告诉你,这不仅仅是一个新工具,这是你弯道超车的绝佳机会。点赞、收藏加关注,请护前沿,管世界,前沿在线带你抓住时代红利!
粉丝5370获赞1.3万

你能想象吗?刚刚在 swbench pro 这种专门测真实工程能力的基准里,超过 cloud opa 四点六拿到索塔的模型,居然是一个国产模型, 并且它已经开源了,它就是智普的 glm 五点一。那更关键的是什么呢?它这次呢不只是更会写代码了,而是在长城任务处理的这个场景也有了重大的突破。 你可以看到官方的一些测试 case 当中,它可以自己连续工作七八个小时,从拆解需求,写代码,调试优化, 全程都可以自己往下推进。那说起智普呢,其实我从 g l m 四点五这个时代呢,就开始使用它们家的这个产品,从一开始它可以去完成一些小任务,到后来它能够去完成一些中等的复杂一点的这个任务,再到后来它们家的这个 coding plan 直接限售了 啊,我可以明显的感觉到,智普的这个模型呢,确实是越来越强了,在不断的去追赶并且缩小它与海外的这些币源模型,顶级模型的一些差距。那所以说今天这个视频呢,我就想用这个 glm 五点一来做一下真实项目的测试,看一下我们这个国产第一,台元第一到底好不好用。 那这个呢,是我自己在用的一个小工具啊,它是一个视频下载器,平时呢我就拿它来下载某音啊,小破站啊,还有这个油管的视频。所以说今天呢,我就想用这个 g l y 五点一把这个工具网站做成一个完整的副业产品。那视频结束之后呢,这个网站应该会具备 登录注册啊,积分系统,视频下载、文案提取以及 ai 改写这方面的能力,并且呢我想的是在改写这一块啊,用户可以去按照平台啊,字数啊,受众啊风格去定制, 还可以直接去与 ai 对 话进行非常详细的定制化的一个改写。然后啊,就是艾米后台也得一起给我做出来啊,包括这个用户啊,订单啊,积分啊,操作记录等等,这些都可以非常轻松的进行一个管理。所以说这次任务啊,这个视频 g l m 五点一能否顺利完成,我们拭目以待。 那这次呢,我们就在 cursor 当中去使用 g l m 五点一啊,因为我之前用的是这个 pro 套餐,所以说呢,我可以在第一时间去体验它们最新的模型。接下来的话呢,我们就参考这篇文章,把 g l m 五点一啊配置到这个 cursor 里面去,随便说句话,看到回复呢就表明已 经接入成功了,那我们接下来输入这段提示词,那如果有参考图片的话呢,也可以在这个时候直接贴给他。那这边呢,我再跟大家分享一个小技巧,就是不要让它说一下自己对这个需求的理解啊, 以及他目前有哪些地方。是啊,需要和我们二次确认的,看一下他到底能够理解到什么样的一个程度啊,是不是和我们已经对齐了, 那这个阶段我们和 ai 全部拉齐以后呢,再让他继续往下做,整个后面的这个过程啊,就会丝滑很多。那我中途呢,还会去让他帮我想想产品的一个功能有没有什么漏洞啊,有没有闭环啊,包括商业化运作这方面啊,有没有什么不足等等,但凡是在这个产品的开发过程当中,你可以想到的任何问题,你都可以在这个阶段和 ai 沟通, 等到他给出了这个详细的实施方案,完美匹配了你的这个阶段的需求啊,你就可以让他开始工作了。那我们第一阶段确认完毕了之后呢,他这边也没有开始直接写代码啊,而是呢先帮我们拆了一整套完整的这个任务流程。 那这一点呢,我觉得是非常的关键啊,因为真正的这种工程能力啊,其实不在乎你写的有多快,而是你能不能够把一件复杂的事情拆的非常的细致啊,拆的非常的对。那接下来的话呢,我们就让他一块一块的往下做啊,比如说我们可以先做视频下载这一块 啊,他会先去确认我们想要去支持的哪些平台,然后呢给出这个接口设计和处理的一个流程,再到这个文案提取啊,他也会去考虑用什么样的一个方式来解析字幕啊,是直接抓接口啊,还是做 啊这个视频转文本的这样的一个处理。那到了 ai 改写这里呢,他甚至还会去帮我们把这个改写的策略啊设计了出来,我觉得这些其实已经不是单纯的去写代码了,做这个业务实现,对吧?而是他开始在帮你做 啊,非常详细的这种产品的设计啊,在积分系统这一块,其实我一开始也没有给到他一个非常详细的这种扣减的规则, 只是说我希望用户在使用某些功能的时候呢,可以去消耗他的这个积分,然后他自己呢就帮我设计了一整套的这种构建逻辑啊,你比如说下载消耗多少啊?然后改写对话,改写消耗多少?不同的这个模式呢,还会有一个差异化的计费。那虽然说呢,这个也不一定是最终的最完美的这个解决方案吧,但是呢,他至少是 在县级段给了我一个可以直接拿来用的出版整个过程下来,我最大的一个感受就是他不是在等你指挥,而是在主动推进,很多时候我们只需要给他一个方向,然后他自己呢就会去把中间那块给你脑补上。另外我还发现了一个事情,就是我这里面不是会 用到 ai 大 模型做这个改写和对话嘛,那我发现呢,我之前的这个 coding plan 可以 直接拿来用,也就是说我们平时携带嘛,包括这里的 api 调用,都是可以走同一个 plan, 甚至呢我们还可以把这个 g l m 五点一接入到龙虾啊,也是同一个 plan, 性价比特别的高。 那最后呢,我又让它基于现有产品做了一套后台管理系统啊,比如说这个用户列表啊,订单记录啊,积分流水啊,甚至还有这里的改写记录,对吧? 尤其是下面的这个系统配置,这里啊,我们之前的这些改写功能,其实用户选的各种策略,它背后对应的都是提示词,那它增加了很多配置的一个类型,就是尽量让这个配置表可以在未来做到大局通用。那比如说这里的任务类型啊、状态啊、平台啊、风格啊, 其实都是走的刚才的那个配置表。那这一块我觉得还是挺加分的啊,因为很多 ai 它到了这一步可能就开始摆烂了啊,或者是它自己自由发挥了。 那你像这个 glm 五点一呢,它能够在这么长的一个任务当中啊,在你没有明确要求的这种情况下面,把整体的这个系统往可扩展、可维护的这个方向去做设计啊,我觉得是非常的难得。 那比如说你后面如果想要去新增一个品牌,新增一种风格,新增一种改写的策略啊,你直接在这里加一个配置就 ok 了啊,非常的丝滑。那这一点呢,我觉得其实已经有点接近正常后端工程师,它在做 呃系统设计的时候这样的一个思路了啊,就是非常的有怎么说啊,活人感。那当然这个中途呢,也是会出现一些这样或者是那样的 bug 啊,比如说这个视频下载失败了,然后封面无法解析等等等等。但是呢,我们都是可以通过和 ai 描述问题来解决问题的。那 做完这个项目之后呢,我其实有一个挺明显的感受啊,就是 ai 编程这件事情呢,真的是在发生一个很大的变化。以前呢,我们用 ai 可能是让他去帮我们写代码,做代码补全,但是现在的话呢,你是把一个完整的任务直接丢给他, 让他自己去做,从理解需求到拆解步骤,再到执行修问题,最后交付结果。这中间呢,其实我们已经不再是写代码的那个人了啊,而是更像一个分配任务的人。那这也就是大家所说的这个 long horizon, 当 ai 可以 自己去持续工作几个小时甚至更久的时候呢, 它所改变的就不是一个简单的效率问题,而是在颠覆我们整个做软件做项目的一个方式。所以说如果你现在也在做自己的项目,不管是工具还是副业啊,真的是可以去尝试一下这个 g l m 五点一这个最新的模型。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频再见, peace。

断档第一!就在刚刚,智普 g m 五点一登顶 swbench 等一众硬核榜单,连 happy face 的 ceo 都发文祝贺。在编程能力三项综合测试中, g m 五点一也达成了开源模型第一,国产模型第一的成就直逼 clop 四点六和 g t 五点四 外,网上已经开始疯狂安利了。所以今天六博士就和大家一起拆解这个被称作新晋国产元神的 gm 五点一究竟有什么创新点?他的实战能力到底如何呢?点赞收藏,方便回看!接下来一起进入本期云祖会 gm 五点一的强大可以总结成一个词,长城任务能力。什么是长城任务?简单说就是那些不能靠一句提示词解决,需要跨步骤、跨工具、跨时间持续推进的工作, 比如开发一个完整的应用,或者重构一个老项目。 ai 模型评测机构 m e t r。 研究显示,在编程领域, ai 能完成的任务复杂度呈指数级增长, 每七个月就翻一倍。行业的共识是,单人回答已经不够看了。正如 m i t tech review 和顶级资本所判断的,二零二三至二零二四年的 ai 是 对话者,而二零二六至二零二七年的 ai 正成为执行者。 交付单位正在从一个回答变成一个项目。以前的模型像个聪明但健忘的实习生,走几步就要人提醒,稍微复杂点就丢上下文忘约束你,让他忘了你删不之前说的数据库规范。 而 glm 五点一的目标是让它能独立交付,对最近非常火的 harness engineering 无疑是锦上添花。长城任务能力才是检验模型智能的下一个标准。 口说无凭,我们来实测一下,我们直接拿号称宇宙最强的 cloud opus 四点六和 glm 五点一做对比 来,我们现在开始丛林手搓一个植物大战僵尸。我们可以看到,在搭建整个游戏框架的时候,居然五点一完全自主规划并执行模型,创建了五乘九的方格,按照类别创建植物僵尸并设计游戏机制。来看看,不错啊,感觉有模有样了。 那我们来考验一下他的长城任务能力,让他再优化更新一下游戏输入提示词,增加观察选择、返回菜单按钮功能。 可以看到,虽然整体美工上因为没有着重设计,稍微有些简陋,但在游戏机制和体验上, g o m 五点一完美复现了植物大战僵尸的核心内容。而且体验最好的是它中间遇到翻译报错时能自己查日期,改代码,重新跑通,全程无需人工介入。 反观 core 这边,实在出乎我的意料,一开始点开始游戏进去没画面修正以后,美术风格也不如 g l m 五点一。接着我们来再看其他四个案例的对比, 刚刚看到的四个案例,不论是火山爆发还是月球围绕地球旋转动画, g l m 五点一都是全流程一次过,而 cloud 在 火山喷发和机械表案例第一次喷不出画面。 所以说结果就见仁见智了。至少从以上五个案例上看, g i m 五点一是更好的那个。 为什么 g i m 五点一能扛住长任务,不跑偏,不锻炼核心有三点。第一,更强的长城规划与目标保持 模型,不是你说一步他做一步,而是能把复杂目标拆解为多阶段可执行计划,并在长链路执行中始终围绕最终交付推进,减少跑偏、遗忘、约束或陷入局部坠油。 第二,更稳的多工具协同、代码编辑、环境调试、 api 对 接环节衔接稳定。过去开源模型长任务后半程容易断裂,而现在 g m 五点一能自主排查修复,不用停下来等你。 第三,更好的上下文一致性,这是他能对标 cloud op 四点六的关键点。在多轮交互后期,模型啊仍能稳定追踪已完成的内容,当前阶段和下一步的关键动作,有效解决了上下文中的稀释效应。 这一切的背后,是 g l m 五点一引入了 multi turn 强化学习和过程质量评估体系,它在可能性、自适应、纠错、工具使用与推理三个维度实现了进化。对比 k 二点五等竞品,它不再是需要盯着的聪明应届生,而是给目标就能独立交付的老员工。 试完 g l m 五点一之后,我装那愣了一会。之前编程啊,我更愿意用 cloud, 但这次试了 g l m 五点一之后呢,确实不得不感叹,国产模型的进步啊,真的很大。 以前我觉得 ai 再强,它也只能做碎片化的工作,我作为拆解任务把控权局做决策的人,位置啊是安全的。但当模型啊开始自主规划、自主执行、自主纠错、自主交付时,我突然意识到自己的可替代性啊,在迅速上升。 我并不想呢,贩卖焦虑,但你体验过之后,肯定能明白我想表达的是什么。最后, g m 五点一墙归墙,但你这抠钉 pen 的 速度啊,实在是有一点供不应求了,赶紧给服务器扩扩容吧。

接下来演示一下复制这串代码,打开 power shell 窗口,右键粘贴回车,根据提示,大家就把这个网址完整选中,右键复制后 点击 connect 连接,在这里选择 g a m 五点一 cloud, 我 们输入一个指令,它模仿淘宝首页写一个 html 文件。 好的,这样就已经完成了代码的编辑,我们点击复制按钮,将整个 html 整个代码复制下来,在桌面右键新建文件,新建一个文本文档,求命名为淘宝 html, 修改扩展名,点击右键打开方式选择,选择记事本,点击确定,右键粘贴刚才复制的代码,点击保存,然后关闭,双击打开这个网页。我勒个痘,这和真正的淘宝网还有什么区别呀? 简直可以说一模一样, ai 时代真是令人吃了一惊又一惊,而且现在各大厂商各大模型都在争相开颜,抢占市场,这就是我们普通人学习的机会,记得关注我学习更新 ai 大 模型的最新动态。

不是谱子五点一按什么价卖的? bro a p i 又涨一次价,涨得跟 colod opus 一个价格了。不是现在咱们这边的 a p i 已经可以和对面的 a p i 卖一个价了吗?而且最关键的是,之前他财报已经体现过了,这么卖是有结果的,因为 g l m 五出来之后连续做的一件事,马不停蹄的 就是在涨价,也就是说对标克劳德的同时,把它最主要的商业模式做精做强,把大模型做的不可什么脱离啊,依赖性极高,然后再逐渐的提高。护城河里头,无论是价格还是使用规则, 那克劳德是很霸道的,动不动就给你说啊,这你也不能用,那你也不能用墨尔法尔,这的话你可以调 a p i, 那 的话你不能用订阅账号使用,总之各种规则,但是大家还是离不开,因为他把那个对吧模型制呢,给你干到天花板了。所以现在谱子这道是越走越正了呀,不。

今天晚上九点钟左右,最新的 clock code 公布了一个 gm 五点一的一个公测的一个模式,然后我就赶快的去重新新建了一个 api, 然后用了这个 gm 五点一, 感觉还不错,确实它在这个工具调用,还有它在任务运行上 以及长时间处理任务的这个能力上都要比 gm 五,就是我最近用比较多的一个模型要强。可以看到我问了他一个问题,我问他他的优势在哪地方, 他告诉我在工具集成上,编程能力,还有一个多智能体写作以及持久记忆上可能会有一定的优势。 然后直接所以我直接让他连一个这个我的 unity 的 一个 mcp, 让他在这下面帮我去做一些跟游戏开发相关的事情, 然后发现他很快的就习得了一个 skills, 而且他应该是进行一个并行的这么一个模式, 所以我觉得现在这个模型的一个趋势就是会越来越强,在这个长期记忆和这个工具调用上都会越来越好。 嗯,但是呢,有个问题就是要看你的需求是什么样子的,如果你是专注一个 coding 的 这么一个情况下,我认为这个五点一是个很好的选择,就是他可能会啊,在回答你问题的时候去专注于这个代码层面,他可能不会专注你个具体的问题的,就是回答上, 所以我认为他是对一个这个代码开发者是相对友好的,然后, 嗯,相对来说,如果你要去做一些其他的事情,对吧?呃,也不一定说用这个 gm 五点一可以切换成其他的,对应的稍微便宜一点的东西也可以, 但是不得不说新新出来这个五点一我还是很喜欢用的,然后就期待在大家的一个评价。

大家好,今天我们来深度解读智普刚发布的 glm 五点一,一个能独立工作八小时,编程能力达到 cloud opus 九十四点六的开源模型。这不是渐进式进步,这是开源模型的范式跃迁。先来看智普这半年的迭代速度,从去年底的 glm 四点五,到今年初的 glm 四点七,再到二月的 glm 五, 然后三月二十七号 g l m 五点一就上线了,距 g l m 五发布才一个多月。而且智普这次发布非常低调,没有发布会就在用户群里说了一句, coding plan, 全体用户直接升级,但成绩是实打实的。 artificial analysis 综合能力开源第一, s w e bench 代码工程能力开源第一, open router 用量开源断档第一。三个维度同时登顶,说明这不是偏科,是全站突破。 g l m 五点一最核心的突破不在于能回答多难的问题,而在于能独立工作多久。过去所有模型的交互模式都是分终极的,你给指令,他给回答, g l m 五点一打破了这个限制,能在单次任务中持续自主工作长达八小时,完成规划执行、迭代优化的完整壁画。 具体来说,他在三个方面实现了质变,第一,长城规划与目标保持,你给他一个目标,他自己拆除执行路径做到第十步,还记得第一步定的约束。第二,多工具协调,不是会做一步,而是能跑完全程。第三,上下文整合,不再出现做到一半忘了前面约束的问题。 来看技术架构, glm 五点一的总餐数量是七百四十四币,采用二百五十六个专家的猫易架构,但活跃参数只有四十币, 相比上一代活跃参数仅增加了八 b, 能力却实现了飞跃式增长,这说明架构效率极高。三大关键技术,第一, deep seek space attention 稀疏注意力机制,在保持二百 k 上下文的同时,大幅降低部署成本。第二, slime 亦步强化学习框架,这是质朴自研的 r l 训练框架,代号史莱姆已经开源,它让模型能在优化碰壁时主动切换策略,而不是反复尝试同一个方向。 我们把三代模型放在一起对比, glm 四点七十三为五 b 参数,三十二 b 激活定位高性能编程模型, glm 五完成了从三百五十五 b 到七百四十四 b 的 架构跃迁,编码评分三十五点四,而 glm 五点一在同样的七四四 b 架构下,通过 slm 二 l 和 dsa 的 技术创新,把编码评分拉到了四十五点三,相比 glm 五提升了百分之二十八。长城任务能力的变化最为显著, g l m 四点七是分钟级, g l m 五也是分钟级提升,而 g l m 五点一直接跳到了八小时级,对,其目标也从 s n a 四点五一路追到了 opus 四点六。这印证了一个重要趋势,模型能力的提升不再单纯依赖参数规模, 而是靠更聪明的训练策略和架构优化。来看三个震撼案例,第一个睡前交给 g l m 五点一,一份架构草图。 早上醒来,一套完整的 linux 桌面系统已经做好了,历时整整八小时,执行了一千二百多步,产出了桌面窗口管理器、状态栏、应用程序、 vpn 管理器、中文字体支持游戏库等等配套文件四点八兆,这相当于一个私人团队一周的开发量,而且全程没有人参与 模型,甚至自己写了回归测试,还跑过了第二个案例,更硬核 g l m 五点一对向量数据库做了六百五十五轮自主迭代优化,它不是简单微调参数,而是完成了一整套优化链,从全库扫描切到 i v f 分 桶, 引入半精度压缩,加入量化粗排做两级路由,再到提前减脂,每一次跳跃都伴随着短暂的性能下降。 因为模型在探索新方向时暂时打破了约束,然后再调回来,这个打破修复循环本身就是有效优化的标志。最终查询村土从三幺零八 qps 推到了二幺四七二, qps 提升六点九倍。第三个案例,在五十个真实 m l 计算赋载上, g l m 五点一自主编写 treaton kernel 和 cody kernel, 运用 cobbloss 融合 shared、 memory、 tiling、 cody graph 等优化,超过二十四小时不间断迭代,最终取得三点六倍几何平均加速比。而 touch 到 compile 的 max auto tune 模式只有一点四九。 在 gpu 内核优化这个高度依赖专家经验的领域, ai 已经展现出端到端的自主工作能力。来看硬指标,在 s w e bench pro 最接近真实软件开发的精准测试中, g l m 五点一刷新全球最佳成绩,首次实现国产模型超越 colog 的 oppo 四点六。这个测试要求模型在真实 github 仓库里定位并修复高难度 bug。 综合三项最具代表性的代码评测,平均结果,全球模型第三,国产模型第一,开源模型第一, 量化到 cloud code 编码评分, glm 五点一拿到四十五点三分。 cloud opus 四点六是四十七点九分,达到了 opus 的 百分之九十 四点六,相比 gim 五的三十五点四分提升百分之二十八。最后看价格, glm 五点一的输入价格,每百万 token 只要一美元,输出三点二美元, 输入成本是 cloud opus 的 五分之一,输出成本更夸张,仅为 opus 的 七分之一点八。 gpt 五点四的四分之一,简单说就是百分之九十四点六的 opus 能力。 百分之二十的价格,有意思的是,智谱同时还涨了百分之十。涨价后, g l m 五点一在抠定场景的价格已经接近 cloud sonic 四点六,这是国产大模型首次在核心场景与海外头部厂商价格对齐。敢于涨价,本身就是对能力的自信。 g l m 五点一已全面开源 api, 通过 big model 开放平台和 z a i 接入, z a i 的 聊天产品已经上线 g l m coding plan, 全部用户都可以使用, 兼容 cloud code、 open code 等主流开发工具,开源权重在 github huggingface 和 model scope 上都可以下载。总结一下,从 glm 四点七到 glm 五,再到 glm 五点一,开源模型正在经历一条清晰的能力跃迁, 从效率工具到大众创造,到自主执行,再到持续交付。 glm 四点七让模型会写代码, glm 五让模型像工程师一样执行任务。 glm 五点一则把目标推向了让模型像资深工程师一样持续工作八小时, 交付完整成果。长城任务是检验模型智能的下一个标准,当一个开源模型能独立搞定中高级工程任务,我们需要的不仅是更强的模型,更要重新思考人类工程师的不可替代性在哪里。感谢观看,我们下期再见!

就在一小时前,智普正式宣布将旗下最强的编程模型 glm 五点一开源作为一款性能仅次于 gpt 五点四和 oppo 四点六当前开源阵营中编程能力最强的大模型,此次智普的开源确实来得有些出人意料。 此外,智普还演示了 glm 五点一超强的自主完善加自我迭代能力模型在连续八小时不间断编程过程中,居然自主构建出了一个完整的 linux 桌面环境,并生成超过五十个可运行的桌面应用,整体可用性相当高。 这一结果不仅展示了其工程稳定性,也体现了其在复杂系统构建上的持续推理与执行能力。 消息发布后,网络反馈同样热烈,有人直呼这才是真正的先进生产力。也有人开始向 cloud 发问,开源模型已经强大到这个程度,闭源阵营是否也该有所回应,拿出新的策略?

我只花两小时,用智谱出的 g l m 五点一模型,就做出了这个能快速搜集全网高价值大学专业课学习资料的软件。只要你上传自己的培养方案 pdf, ai 就 会自动解析出你大学四年需要学习的全部课程。随后他会根据我们给他预设的信息源,以及他能够解锁到的其他渠道,去搜集所有高质量的课程资料。中国的、官方的、民间的、文档的、视频的都有。你可以通过资料来源、知识点、 资料形式等等分类方式快速查找这些资料。对于所有资料, ai 都会为你生成一份儿摘药,方便你快速决定要不要仔细研读。软件儿的所有源代码和开发过程中用到的奇制词。最真实的开发记录我都放到了 github 上,大家可以随意学习二次修改。 接下来我就给大家实战教学一下怎么用可拉的 code 和智普最新的 g r m 五点一模型,从零开始,快速把这个像模像样的软件给做出来。第一步是核心功能实现,我们心里要有一个大概的设计,软件的核心功能和页面基本布局想好就行, 其他的东西都可以,后边再一步一步完善。我把初步的想法先告诉了 g l m 五点一,把思考程度调到最高,然后就开始期待它的发挥。一个很有用的经验是给大家一些能参考的东西。我前段时间用的一个开源的 r s s 阅读器就非常不错, 这种三栏式的设计我非常喜欢,我就把这个软件的代码也喂给了 g l m 五点一,让他参考。下边是我用到的完整提示词,大家可以截图保存一下。经过 g l m 五点一四十多分钟的全力奋战,最终出来的结果也很是不错,其中有相当一部分时间我看他都在理解我给他的科研代码, 这个工作态度我非常满意。我自己倒也没闲着,前面用 ipv 看雍正王朝,右边的另一台电脑上也用了 ai 在 跑着我的科研任务基本功能一轮做好之后,第二步就 是额外功能的添加。比如这个软件现在的 ai 程度我觉得还不太够,我希望能够自己来配置,让它用什么样的大魔性 a p i。 比如效果不错的智普 g l m 五点一。 另外我又想到了一个新功能,让用户上传自己的培养方案 pdf, 然后自动解析有哪些课程。要是能够预先设定一些我觉得比较权威的信息源,是不是搜索的效率还能再高一些。把我之前视频里讲的资料获取途径都放在这个软件里,就非常不错。我把我想到的好多新功能都一股脑的告诉了 g l m 五点一。开发过程我真的感受到了一种跟 g l m 五点一并肩作战的快乐。 最后一步就是细节的调试与完善,大操快办总是容易产生一些小小的问题,这个用世界上最贵的大模型也避免不了。不慌,我们就把这些问题都一个一个找出来,然后告诉 g l m 五点一就可以了。什么软件窗口上方无法拖动? api 配置之后测试连接不太成功, ai 专利提取不准,这些小 bug 的 修复速度都很快,只要你能够给 ai 指出来,喝口水的功夫就解决了,又是经过了一段我一边看雍正王朝, 一边等 g l m 五点一给我出结果的时间,这个软件终于是比较符合我心目中一点零版本的样子了,可以拿出来发布。最后给大家总结一下这三步,就是从零开始歪不扣定,做出一个比较可用的软件产品的通用步骤了,希望能对大家产生一定的参考价值, 大家千万也不要被我讲的步骤给束缚了。在跟 ai 一 起工作的时候,我们完全没有必要按部就班,未来我也希望大家能跟我一起把这个软件做得更加完善,我是希望大家都跟我一起歪不扣定的好同学。欢迎大家在评论区参与讨论,补充更多信息。

智普 g l m 五点一到底能不能硬钢 plus 的 代码王座?这篇包含跑分、实战痛点和使用边界的思维硬核评测,直接把底牌揭开。一句话总结,这是目前最极致的偏科平替,看完你就知道该怎么用它。踩不踩坑。 先看过场数据,底座七千四百四十亿参数底层直接融合了异步强化学习和 deep sea 的 稀疏注意力机制,标称二十万超长上下文,极数上面直接拉满, 跑分直接逼进地表最强。官方测试中, g l m 五点一的编程得分达到四十五点三分,相比上一代直接飙升百分之三十,距离目前公认的代码天花板 opus 四点六仅差了不到三分。单看测试水准,他已经稳稳占据世界第一梯队。 但跑分不等于体验,这是很多开发者最容易踩坑的地方。实战反馈表明,他的代码生成确实有巨大进步,但代价较为惨烈。 这是一款典型的侧向升级产品,为了强吃代码能力,它大幅度牺牲了日常动用、任务处理和创意扮演能力。如果你拿它写文案,表现甚至不如上一代的 glm 五, 更致命的是长文本陷阱,纸面数据标称支持二十万上下文,但在实际高压环境下,一旦你灌入五到七万托盘的庞大代码库模型,偶尔就会出现逻辑混乱,甚至直接发疯。在处理极长代码项目的极限稳定性上,它目前还无法完全替代 os。 既然有缺陷,为什么海外开发者还在疯抢?因为它的杀手锏是白菜价和伪装介入。在当前热门的 cologold 这类智能体开发环境里, 你只需要改个环境变量接口就能零成本把它当成 opus 来用。最关键的是它的 api 倒用价格只有 opus 的 几分之一,这是绝对的降维打击。最后直接给使用。结论,强烈推荐个人开发者和中小团队把它作为主力平替。 日常的写代码修 bug, 写中小型函数用它绝对超值。但是如果你需要重构超过七万头肯的祖传复杂代码,或者需要处理高度复杂的通用写作,请立刻闭坑老实实加钱去用 opus, 或者直接退回 glm 五。

哈喽大家好,欢迎收听我们的播客啊,今天咱们要聊的呢是这个智普公司啊,在本周发布的这个最新的开源模型啊,叫做 g l m 五万,那这个模型呢,其实它在云端使用的这个价格啊,比之前的这个 g m m 五 turbo 要高出来百分之八到百分之十七左右,这也是该公司自二零二六年以来第二次上调价格。 其实在今年的一月份的时候,智普刚刚在香港上市。对,没错,那其实这次提价呢,和这个阿里、腾讯他们其实是一样的,都是因为这个市场对于这种智能代理服务的需求暴涨,然后再加上这个投资者对于这个盈利的一个催促吧,而且他们在今年的二月份的时候,已经把这个编码方案的价格提高了百分之三十,并且在三月份的时候公布了这个二零二五年的这个亏损会扩大到四十七亿元人民币。 但是呢,即使是这样,他们的股价反而一度大涨了百分之三十五,在四月八号这一天,又因为这个区域市场的这个普遍上涨,又涨了超过百分之十八。 那他们这个 ceo 呢,也表示说非常有信心他们这个基于云的这个模型的业务会迎来一个指数级的增长。那同时呢,他们也在这个新模型上面着重地加强了这个编码和这个长周期任务的这个能力。他说这个新模型的这个编码的性能已经可以和这个 astroplex 的 这个 cloud opens 四点六相媲美。咱们今天第一个要聊的呢,就是这个提价背后的市场需求和盈利的压力啊,那咱们就开门见山的问一句啊,就是 二零二六年智普的这个价格的上涨,到底和这个市场上对于这种大模型的需求有多大的关系?呃,我觉得可以说是直接相关吧,因为这个二零二六年开始,这个智能体就是所谓的 openclaw 这种应用突然火起来了,然后导致大家对于这种大模型的调用量是爆发式的增长。你想国内的这个日军 tok 消耗从二零二四年的这个千亿级, 到二零二六年的这个二月已经涨到了一百八十万亿,就这是很恐怖的一个增长,而且尤其是在 openclaw 上面,就是一个月就翻了四倍多。哇,这个数字真的吓人。对,然后就是因为这个复杂的任务啊,比如像这种自动编程啊,这种对他的这个投肯消耗又是远远超过这种简单的问答,所以就导致这个优质的大模型就变成了一个稀缺资源。 大家的这个市场的焦点也从说我要去抢这个低价,到说我要去抢这个谁能够帮我解决实际问题,所以这个时候质朴它的这个碳其实也是顺理成章的事情。对,那所以说就是最近这段时间大家也看到了这个芯片的供应啊,包括这个能源的价格啊,都不是很稳定, 那这些东西会不会直接影响到质谱的这个运营成本呢?肯定会啊,那你想这个 gpu 也好, hbm 内存也好,它都是需求远远大于供给,那这个时候这个芯片的价格就 涨得非常厉害,而且你这个买到手的周期也变长了。哦,那确实是个挑战,然后包括你这个数据中心的这个电力消耗啊、冷却啊、照明啊,它本来就占这个大头,现在这个能源价格又波动, 所以这个时候智普他其实也是为了去缓解这个不断上升的算力成本和这个基础设施的成本,他才不得不去提价呀。所以说这个最近这段时间不光是智普,大家其实都在提价嘛。对,这个你觉得这种整个行业的这种集体的动作背后到底是一个什么样的逻辑?现在就是这个大模型的这个赛道,其实已经从拼价格 变成了拼能力,那你这个头部的公司,你有技术、有市场,你就可以掌握这个定价权,那大家其实都是在这种算力紧张和这个商业化的压力下面,大家其实都放弃了这种价格战,开始往这个 靠服务、靠价值去要利润这个方向去走了。所以这一波其实包括智普的这个多次提价,其实都是这个行业走向成熟的一个标志。然后咱们再来说说这个模型本身的升级啊,这个 glm 五万,它在这个编码能力上面到底提升了多少?有哪些让人眼前一亮的这种实际的表现,这个你绝对想不到,就这个新的模型,在这个权威的这个测试里面,它的这个得分比上一代直接高了将近三成 啊,就几乎就是追平了目前这个世界上最厉害的这个闭源的模型。然后在这个实际的工程开发当中,它可以一口气完成从需求分析到漏洞修复的全流程, 它甚至可以处理那种非常非常复杂的跨文件的重构,包括这种多模块的开发,这个听起来就已经不是一个辅助的工具了,这已经是一个真正可以下场干活的一个,对,没错,而且它就是在这个 litecode 的 这种难题上面,它的这个通过率也比之前要高出来一大截,然后它可以连续工作八个小时不停歇产出两万行代码, 就这个已经是相当于一个小型的团队一个月的工作量, ok, 对, 所以就是这个确实是让这个 ai 真正的可以成为一个开发的主力。这个模型在处理这种长周期的任务的时候,它是怎么做到让这个上下文能够高效的利用上的?就它这个模型啊,首先它的这个窗口大小是可以支持到二十万 tokens, 然后呢它的这个输出呢,也可以一口气生成十三万 tokens, 就 这个已经是远远超过了同类的其他的模型, 这样的话就对于这种大的项目就太友好了,没错,而且它用了这个 deepsea 的 这个稀疏注意力机制,它这个不仅让这个处理超长的文本的时候效率提升了百分之十五,而且它的这个推理成本也降低了百分之二十。 然后呢再加上它的这个新的这个交叉思考的这个技术,它可以边推理边修正自己的错误,所以它这个在这种长周期的任务上面的稳定性比之前要高了百分之四十,幻觉问题也有了明显的改善,就是它的这个事实性的错误,它 负的减少。对,那你觉得就是这个 g r m 五万在整个生态的适配性和应用性上面,它到底做到了一个什么样的程度?就是它的这个 api 是 完全跟 open 兼容的,所以你老的项目几乎不用改什么代码就可以直接用。 然后呢,它又支持多种量化方案,所以你不管是在云端还是在边缘,还是在你本地的这种环境下面,都可以非常灵活的去部署。哦,那这个确实方便了不少,而且它是全量开源的。然后呢,用的是 mit 的 协议,你爱怎么用怎么用,它又做了跟国内的七家主流的芯片进行了深度的适配。 所以就说你不管是从数据的安全啊,还是从这个合规的角度来讲,还是从这个成本的角度来讲,对于企业用户来讲,都是非常有吸引力的。它的这个调用的价格只是国际上同类的最好的模型的八分之一, 所以这个性价比是非常非常高的。我们现在来聊第三部分,就是这个市场影响,那这个就很直接了,就是智普这次提价之后,股价到底有什么反应?呃,在公布了这个提价和这个新的模型之后,智普的股价在四月八号那天 直接跳空高开,然后盘中一度涨了百分之十八,最后收盘的时候也有百分之十四以上的涨幅,它的这个市值也一举突破了三千九百六十亿港元。 同时呢,这个港股的这个 ai 应用指数当天也大涨了百分之四左右。哎,那这个涨的确实挺猛的啊,那有没有什么其他的这个市场的信号也值得关注的?嗯,然后就是这个卖空的这个股数也大幅的减少了,从二月底的这个高点到四月初已经下降了百分之九十六,就是空投基本上已经全线撤退了。同时呢就是 a 股的这个相关的概念股也出现了这个集体的涨停潮,就是整个市场的情绪是非常非常乐观的。 那你怎么看这个最近的这个智普的这个提价和他的这个新的商业模式给整个行业带来的变化?呃,其实我觉得就是首先就是这个智普他在今年的一季度把他的这个 a p i 的 价格上调了百分之八十三,然后他的这个调用量反而增长了四倍, 他的这个年度经常性收入已经飙升到了十七亿元,同时呢他也从这个按量付费转向了这种订阅加套餐的这样的一个模式啊。那其实这种价格的提升和这种商业模式的改变,其实既反映了大家对于这种高质量的大模型的稳定啊,也让大家看到了这种 行业的发展的一个新的方向。你觉得就是这个智普的这一波提价会给国产的大模型这个行业的格局带来哪些根本性的变化?嗯,我觉得就是 首先就是智普的这一波提价其实直接就结束了这个行业的这个价格混战啊,那大家现在开始要拼的是谁能够真正的解决复杂场景下的需求,那它也带动了整个行业的这个价格的体系,跟国际巨头去接轨,那这个也加速了那些没有核心技术的小的玩家 退出,所以说这个行业的门槛就变得更高了,对,没错。然后同时呢,就是呃,大家的这个竞争的焦点也会慢慢的往技术自研啊,往生态的建设啊这方面去转移。那 比如说像这个 g m m 五万,它完全是基于国产的芯片去训练的吧?那这个也推动了整个产业链的自主创新啊,那整个行业也会往这个价值驱动啊,以及生态主导这样的一个方向去进化。哎,聊到这,其实今天我们从智普这个最新的这个模型的升级,聊到了它的提价,然后聊到了整个行业格局的变化。其实 归根结底我们还是在说一个事情,就是技术的进步和市场的需求到底怎么样去共同推动这个行业往前走,对不对?那智普这波操作到底能不能引领这个行业走向一个新的方向?其实还是要看整个市场和用户到底买不买账。 ok, 那 么我们这期节目就到这里了,然后感谢大家的收听,咱们下次再见,拜拜。拜拜。

一个被忽略的 ai 能力,今天被智浦新模型点破,这才是软件工程的未来。就在今天,智浦放出大招, g l m。 五点一发布,再次拿下全球第一 s w e beach 测试中刷新全球最佳成绩,超越 oppo 四点六和 g p t。 五点四。此外, g l m 五点一能持续工作八小时,它不只是一次回答,而是自主规划执行,还有测试 中间如果出错会自行修复,最终交付完整的成果。这意味着什么?他踩中了 ai 下一个核心赛点,长时间任务能力。

别再盯着全 g p 的 尾灯看了,国产大模型来了个 g r m 五点一,直接拔高了国内 ai 大 模型的能力。发师之前俊仔也用过多个大模型,最大的痛点是什么?短视,也就是长城任务根本干不了, 要么只能陪你聊聊天,要么执行个简单指令。第三步他就忘了第一步的需求。但智普这次发布的 g r m 五点一核心绝技,就是能拆解任务用的工作记忆和逻辑推理能力,将长城任务拆成阶段目标,一口气把一件复杂的事从头做到尾。来 看这个实测,给他一个需求,搭建一个带用户系统和数据看板的内部工具,看他先花时间规划输出技术方案,然后一个阶段一个阶段推送,中间有一个接口问题,他自己排查修复,全程我没有介入, 最后交付的东西能跑能用。再看看这个实测,以前要做这个,得切好几个软件写半天,现在直接给 g r m 五点一下一个指令。他 不是只给你写一行代码,而是规划了整个工程,从底层逻辑到 u i 设计,他自己在脑子里淘了一遍,然后直接把成品甩给你。这哪是写代码,这是在指挥千军万马。俊仔真觉得技术变迁正在指数级加速啊。当 ai 能处理跨文件、跨时间,甚至能自我纠错完成长城任务时, 程序员仅仅会写代码,不是护城河了。未来区分普通工程师和专家的可能不再是敲键盘的速度,而是你定义问题,驾驭这些超级智能体的能力。智普这一步迈得很大,但也提醒了我们,是时候升级自己的操作系统了,是时候接上智普新发布的 g r m 五点一的 a p i 了,它能颠覆你的工作流。

可我们浏览器里的书签、历史记录、下载文件一多,每次查找起来都要来回的点击切换,真的很麻烦。 正好最近智普上线了 g i m 五点一模型,截至目前, g i m 五点一在最接近真实软件开发的精准测试中,超过了 g p t 五点四和 cloud office 四点六,成为专业软件开发领域的顶尖模型,直接冲上全球开源模型的冠军宝座。今天就让他帮我开发一个用来搜索书签还有各种记录的插件, 看看他的长任务处理能力到底行不行。首先我把需求文档直接扔给 g l m 五点一,让他开始开发整个项目。我发现他没有上来就开始写代码,而是先进入了规划模式,制定出了一个超详细的实现计划,从 每个模块的详细功能到最终的测试验收,每一步都写的清清楚楚,这个规划能力在其他的国产模型里还真没见过。 整个开发过程中,我没有再给他提任何新的要求,全程都是他自己在推进,自己整理代办、改代码,自己构建验证,每一步要干什么都是他自己决定的。第一次在国产模型身上感受到这种可以撒手不管的体验,确实有点惊喜。 不到一小时,整个项目就开发完成了。我看了一下后台,这个小项目大概消耗了二百四十万头,很整体测试了一遍需求文档里写的功能,像根据访问次数排序,拼音简缩、多语言适配什么的,一次性全部都完美实现了。插件开发好之后,为了用起来更方便,可以给他配置一个快捷键, 以后想找书签或者各种记录的时候,直接按快捷键打开插件,输入名称搜索,用上下箭头选择 回车直接打开,一气呵成,全程不需要操作鼠标,真的超级方便。通过这次实测, g m 五点一给我最大的感觉就是它真的有自己的规划和判断能力,遇到问题能自己修正,做到了真正的自主工作。你只需要给他一个需求文档,中间敲几次回车确认, 然后就能得到一个真正落地可用的小工具。如果你也像我一样,经常需要让 ai 帮你写点小项目,智普刚刚发布的 g m 五点一真的很不错,大家赶紧去试试吧!我是共享客,关注我,解锁更多 ai 小 技巧!

就在上周五,智普直接在用户社群里扔了颗深夜炸弹, callinplay 全体用户即将用上最新旗舰 g o m 五点幺。拿到更新后,我第一时间上手实测,特意挑了个很考验功底的实操场景,让它从零生成一个赛博复古风的网页游戏。要求一步到位,先设计完整游戏逻辑, 写出全套 h t m 摇加 css 加 g s 赛码,加上像素风 u i 动画特效、计分系统、死亡判定,最后还要自动生成一份可直接运行的说明文档,高 告诉我怎么打开、怎么调试、怎么扩展功能。看着步骤不算难,但懂点开发的都知道,这种从头到尾连贯下来的复杂任务,最吃模型的常上要闻理解和全程专注力。而 g m 五点幺拆解需求特别稳, 全程牢牢盯着核心目标,不会写着写着跑偏漏掉关键细节,写代码时结构清晰不混乱,就连最后配套的运行说明、调试指南都写的特别完整。这一点真的很出乎我意料。 因为之前我也用过一些主流编程大模型,但凡牵扯多文件逻辑,长链路编辑还要配套交付,大多写到后半段就开始往前面的逻辑界面、动画逻辑经常对不上, 最后交付的东西根本跑不起来。但 g i m 五点幺不一样,全程能记住整个项目的结构,从需求理解、代码编辑、界面设计到交付说明,一整条链路丝滑衔接,这种扎实的长城落地能力 真的拉开了很大差距。这确实是目前编程能力第一梯队的模型,尤其是在复杂任务的持续执行和完整交付上,体感差距非常明显,个人觉得能媲美国产的 oppo 的 四点六了。 我们为什么要关注这件事情?因为长城任务能力是检验 ai 智能的新标准。 g m 五点幺突破明显复杂,目标自动拆解,长链路,不跑偏,不掉目标代码,网页 api 无缝切换, 全程记忆,进度连贯推进。直白讲,越来越像靠谱的全职工程师。现实问题随之而来,当 ai 能稳定承接中高阶工程任务,人的不可替代性还剩多少 头部企业全在压这条赛道,能力越强,肉眼可见,尽早吃透用好这类工具,才是接下来的核心竞争力。现在 g i m 五点幺已面向 g i m c d play 用户开放,性价比超高,闭眼入不亏,你准备好了吗?

智普呢,它是第一家登陆资本市场的国产独立通用大模型公司。首先我们来看一下公司的盈利模式,公司的收入按照云端部署和本地部署分成了三块,第一块呢是云端部署,就是通过提供 a p i 接口,通过计量头肯的消耗量 来收费的这么一个模式,或者是提供订阅式的服务来收费的模式。那么这一块业务呢,二零二五年的收入是一点九亿元,同比呢是增长了百分之二百九十二。 第二块呢,是企业级智能体啊,这块业务可以理解成在线下将大模型和企业的业务流程相结合,从而帮企业提供自动化执行或辅助决策的需求。这个业务呢有点定制化的感觉。那么这块业务二五年的收入是一点六五亿元 啊,同比增长了百分之二百四十八啊。第三块业务呢是企业通用大模型,这块业务就是线下帮企业本地化部署通用大模型啊,企业呢,用这个本地部署的大模型再做二次应用 或者开发。二五年呢,这块业务的收入是三点六五亿元,同比增长了百分之七十以上呢,就是公司目前主要的三块业务以及盈利模式,而且目前国内的大多数模型厂商的盈利模式呢,也就是以上三种。而智普目前主要的文本大模型有三个,分别是 g i m 五点一、 g i m 五和 g i m 五点一呢,刚刚是在四月八号发布了,相关的数据还比较少 啊。 gm 五呢,是二月份发布的啊, gm 五 turbo 呢,是针对龙虾场景深度优化的高性能版本, 那么这两个模型呢,已经是上线了一段时间了啊,重点来看一下这两个模型在 open router 上面啊,最近一个月,全球大模型 token 的 第二辆排名中啊,智普的 gm 五 turbo 排名全球第十, gln 五排名全球第二十,如果是去掉几款免费的模型呢,排名还可以往前再靠一点啊。在龙虾爆火之后,仅从钓量来看,智普呢,算是挤进了全球大模型的第二梯队。 一般来说呢,国产大模型厂商的 top 款价格都比较便宜啊,一般是国外的五分之一到十分之一。 从智普今年公司的策略来看的话,公司是已经完成了多轮的提价动作,那么在四月八号公司发布了新模型五点一版本的同时呢,公司是再次宣布提价,那么在提价之后,公司的模型在编程场景下的透空价格 已经是接近了呃, adrippic 旗下的 cloudsonnet 四点六的水平了,算是实现了国产大国行与海外头部厂商在核心生产力场景下的价格对齐。

二零二六年四月四日黄老师日记回顾由 ai 助手为您生成抖音探索搜索包含科奥关键词的视频,找到六个相关视频,下载两个用于学习分享主题包括 ai 工具教程和短视频营销。 opencloud 更新查询到最新版本为二零二六年四月二日,新功能包括 android 支持和 test flow 增强,重要修复了 gateway 执行,还回问题,建议使用 android 或遇到问题的用户升级。 教育深度思考企业开始绕开大学抢人,吉利和腾讯等公司面向高中毕业生开放岗位。 ai 公司高价风抢文科生,月薪可达二点五万到四万元。大学教育面临三大问题,现代化建设可能是破局。关键 ai 高效学习法单扣提出的四步法建立框架,深入理解、练习反馈、验证输出, ai 画学习地图, ai 做通俗讲解、 ai 当私教刷题 ai 做费曼检验精准学、高效学、闭环学。 今日概览完成抖音视频两个 open cloud 更新一次深度讨论两场关键洞察五个以上记录美好生活,每一天都值得被记住, ai 助手小白为您服务!

智普啊,发布了 glm 五点零,为了测试它的能力啊,我用它构建了一套可以无限运行的 ai 开发系统。我用这个系统运行了长达十个小时,从晚上十点到早上八点, ai 做了几十次 getmate 的 提交, 开发了一个 ai 漫剧生成工具,有前后端有数据库,可以用户注册和登录,还接入了大圆模型,图片生成模型,视频生成模型。通过这个视频,你会学到如何构建这样一个无限运行的 ai 开发系统,并了解到 glm 五点零的惊人开发能力。 整个过程我都只是输入简短的 prompt, 没有亲自阅读或修改任何一行代码。我一直在旁边玩着游戏,等他干活, 尤其是我视频最后会讲的,他把整个项目的所有模块联合起来,然后端到端的 bug 修复错误,非常的牛逼。他不只是单纯的写代码,他甚至自行在浏览器中验证每个功能的正确性,找出 bug, 然后自行在浏览器后端数据库第三方的 api 之间联合调试,找出问题,修复错误。 那赶紧进入正题啊,相信对你会有所启发。我使用的工具是 cloud code, 并且把模型切换为 g l m 五点零,具体方法可以看我之前这一条 g l m 四点七的视频。 那我们首先要搭建一套能无限运行的 ai 开发系统,说是系统,其实就是几个文件,做法非常简单,我把一篇来自 astonopy 的 神级文章发给 ai, 让他自己去学习,根据这篇文章做出这套系统 文章叫长时间运行智能体的有效调度编排框架。那过程中 ai 做出了一些操作预期的举动,他通过 m c p 打开浏览器, 通过这篇文章的页面找到一个配套的 get up 仓库,打开仓库的代码文件进行学习。而我事先都不知道这个代码仓库的存在,最终他创建出了这一些文件。 我解释一下最重要的几个,帮你理解一下这套系统的工作方式。 task 点 jc 文件,其实就是一个任务列表,每个任务都有它的描述,并且会标记是否已经完成。和我们人类工程师每天上班一样, ai 每次从这里面领取一个任务, 完成后就做一个标记,这样他的 ai 同事啊,就知道项目进展到哪里。 progress 点 txt 文件,每次 ai 完成任务啊,或者任务失败后,都会在里面留下工作日期,这也是为了给其他 ai 同事提供一些信息。 log 点 m d 文件,这里面全是提示词,用来指导 ai 根据固定的规范流程工作。和我们人类工程师的开发流程类似, 第一步,跑一个脚本,来初识化整个项目的环境。第二步,在 task 里面领一个任务。第三步,就开始开发。第四步,测试和验证。 第五步,更新 progress 和 task 文件。第六步,用 git 提交代码。那如果中间遇到困难,需要人工介入,它就要及时向人求助。那在以前一些长期运行能力不强的模型中啊, 这么长的开发流程,一旦工作上几十分钟,模型就会逐渐混乱,不再按照规定的流程工作,而如今完全没问题啊。视频后面我们会看到, glm 五点零,即使在长达一个小时的工作,提交了几十个 commit 后,仍然很好地遵循开发规范。 然后呢,我让他写一个脚本,用来无限时间的运行。这一套开发流程背后的原理很简单,就是把 cloud code 放到一个 while 循环里面,这样一来,人不在电脑旁边的时候没法手动 prompt, ai 就 可以执行这个脚本,让 ai 无限的工作。它之所以有效,有几个原因啊, 第一,我们这套流程每次只要给 ai 说一句,完成下一个任务,不需要更具体的指示, ai 就 能通过 task 和 progress 文件知道自己现在应该做什么。 第二,每个 task 都很小, g l m 五点零足够的强大,每一次 y l 循环里面,他只是领取一个很小的任务,并且严格的测试,成功率极高。第三,每完成一个任务,模型的上下文都会被清空,所以模型始终保持在最聪明的状态。 第四, g l m 五点零非常可控,严格按照工作规范执行,每次小任务都会进行 commit, 所以 即使出错,我们可以轻易地回滚到旧版本。 好,现在我们这套系统有了,接下来就要开发软件,我们先来设计一下它的功能和架构。这个软件的用途是一句话,生成长视频。我让 ai 把整个项目的开发需求拆成了三十一个任务,放到 task 文件里。 这是 ai 设计的软件,架构不复杂,但五脏俱全。再看一下 ai 画的业务流程图啊,帮助大家理解我们要开发的这个软件具体的功能。 首先,用户会创建一个项目,然后用大圆模型生成每一个分镜的文字描述,然后再用图片模型生成每个分镜的图片,再用视频模型生成。视频开发的流程比较长啊, ai 做了几十次提交,我就选几个精彩的给大家讲。 在 ai 做到第十九个任务的时候,为了测试 glm 五点零的能力呢,我产生了一个大胆的想法,我让他一口气做了一个多小时,完成了十一个任务,干完一个又一个,中间我没有任何干预, 给大家倍速感受一下效果。他一直在写代码,并且每次都遵循我们的开发规范,每个任务都完成,测试一个,一个任务,单独提交代码,拿一个具体的任务作为案例啊。他现在领取了任务三十,任务目标呢是实现响应式的布局,也就是让 u i 在 手机端和桌面端看起来不一样。 他现在正在修改代码,然后验证项目能 build 通过。然后他现在把浏览器的大小变成了手机屏幕大小。打开了我们的应用,他点击了一个按钮, 他对页面做了一次截图,用识图的 m c p 判断是否正确。再打开了一个新的页面,再做了一次截图,并检查是否正确。然后在 progress 里面仔细描述了自己所完成的工作,然后把这个任务标记为完成,他就按这么一套方式疯狂的干完了每一个任务。 要接入数据库的时候呢,他主动提出需要人工帮助,并且一步一步地给我说明,告诉我如何去这个 superbase 平台啊,点哪里创建项目,配置数据库,获取 api key。 尽管我没怎么用过 superbase, 仍然轻松地操作下来了。中间我还犯了错误,给他提供了错误的 key, 也被他及时发现,最后他还让我帮他去注册一个测试账号,然后他自己打开浏览器,输入账号密码,验证登录功能,可以正常使用。那像 superbase 这种外部的系统啊,超出了 ai 的 控制范畴。 g o m 非常明确的给我提供指引,让我协助他完成开发工作,一个不了解后端的人,也能在他的指引下完成数据库的配置。 他开发完后端一系列 c r u d api 后呢,声称对每一个 api 都进行了测试,但所有的 api 都是需要 os 的, 前端也还只有一个空白的页面,所以我就很好奇他哪里来的 os 权限,怎么完成测试,是不是在忽悠我? 于是我问了他一下,他用简短的语言,漂亮的格式向我解释。他说他打开浏览器,登录了刚才创建的测试账号, 然后通过一个叫做 browser evaluate 命令,在浏览器可以执行任意的 javascript 代码。然后他写了一些临时的 js 代码,就在浏览器里运行,调用我们的后端 a p i, 这样就能有 office 了。非常聪明的做法,我还怕他在骗我,我检查了一下录像,确实如他所说,他打开浏览器疯狂测试, 中间还真测试出不少问题,他就自行查看后端的报错日期,自行修复。最终三十一个任务全开发完后,啊,我也懒得去人工验证这个项目是不是已经可以用了。在往常的开发中啊,到最终阶段,因为已经把 前端、后端、数据库、第三方 api 全部连起来了,那第一次的集成测试啊,就会非常头痛,因为任何地方都可能出错,往往需要浪费大量的时间再把错误找出来发给 ai, 让 ai 去修复。但这一次我非常大胆,我只说了一句话, 请你完整测试一遍流程,确保功能可用。大概就是从早上七点十分开始,他自己在浏览器上疯狂测试,花了一个小时提交了这么多改动,用来修复 bug。 我看他在浏览器上像人一样一步步操作我们的产品,通过截图和视觉能力来判断是否符合预期。遇到问题的时候呢,他就自己查询后端的报错,检查各种 api 的 状态,综合分析出问题。最终他总算顺利的生成出了第一个视频,端到端的把整个应用全部打通了。 他修复的每一个 bug, 做的每一个 feature, 其实我都不清楚是什么情况,但我想知道的话,我只要找到他的 commit 记录,看一下他在 progress 文件里写了什么。这也是这套流程的强大之处,一切都是可追踪的。 我们让 glm 五点零一边开发项目,一边在开发过程中发现问题,让 ai 来增强我们这一套自动化的开发系统,左脚踩右脚,螺旋升天,我相信这就是未来开发者的工作方式。总结来说, glm 五点零已经远远超出了单纯抠顶的范畴,而是能对软件工程的每一个环节进行自动化,提升效率。 gm 五点零在超长任务上非常出色,已经达到了能让我放心的交给他连续运行一个小时的程度。横向对比的话,我个人认为 gm 比刚发布的 oppo 四点六弱一点,但在一些方面可以超过 gbt 五点三。 重点是价格便宜非常多,但现在过于热门啊,供不应求,抠钉套餐非常难抢。那我们这个项目呢?虽然现在端到端全部打通了,但最终深层的视频效果还有很大优化空间。点赞到一万,我可以开源出来,让感兴趣的人进一步优化它。

昨晚,智普突然扔了个大招,距离 glm 负五发布才一个多月, glm 负五点一直接杀到编码能力暴涨百分之三十,得分从三十五点四直接跳到四十五点三。 cloud op 四四点六,才四十七点九,差距已经肉眼可见地在缩小。六个月前,这个差距还是十几分,现在只差二点六分,达到 cloud op 四四点六的百分之九十四点六。在实际编码场景中,这个差距几乎可以忽略, 有人甚至说应该直接叫 g l m 负五点五。还有用户测试发现, g p t 负五点三都没搞定的问题, g l m 负五点一直接解决了。看数据, s 大 愈减, bench verified 得分七十七点八,开元模型最高 turmnobench 二点零,得分五十六点二,超过詹姆奈三点零。 pro 擅长复杂系统工程和长城 agent 任务使用体感逼境 cloud opus 四点五,这是目前国产编程模型的天花板。说价格, cloud opus 按量计费每百万 token 大 概十五到七十五美元。 g l m 负五点一,通过 coding plan 使用 light 套餐,三美元起步,按量计费每百万 token 只要一元, 用 cloud 十分之一的价格,获得百分之九十四点六的体验。使用方式超级简单。如果你已经在用 g l m coding plan, 只需要找到配置文件,比如 cloud code 的 sighting store js, 把模型名改成 g l m 负五点一就行了。 一行配置无缝切换,支持 cloud code、 cursor、 open cloud 等主流。 coding agent 质朴也很坦诚,说了两个现实问题,第一,高峰期可能限流, 每天下午两点到六点,系统负债最高,编程任务会被优先保障,非编程场景可能会排队第二。高峰期消耗三倍额度,非高峰期只按一倍抵扣,建议错峰使用,体验会好很多。重点来了,现在到四月底, g l m 负五点一 在非高峰期只按一倍抵扣,这个福利期间用起来超级划算。三美元的 lite 套餐,日常开发完全够用。 pro 和 max 套餐适合重度用户,发布几小时内已经大量用户上手体验, x 上好评不断。 有人说稳定性比 g r m 负五好很多。有人说长链路 a 阵这任务终于不崩了,从三十五点四到四十五点三的百分之三十暴涨,不是吹的,是实打实的工程能力提升。如果你是国内开发者,不想翻墙用 cloud, 又想要接近 opus 的 编码能力, g l m 负五点一目前是最佳选择,尤其适合复杂工程任务和长城 a 阵开发。 g l m 负五点一国产编程模型的天花板编码能力直逼 cloud, opus 价格只要十分之一。邀请码在评论区点赞加关注,赛博杨千焕明天见!

智普股价一度暴涨百分之十八,逼近历史新高,不是概念炒作,是硬核实力兑现。智普正式发布新一代开源模型 glm 五点一, 全球唯一达到八小时及持续工作的开源模型,你睡觉的八小时,是模型上班的八小时。同时宣布再度提价百分之十,再扣定场景的缓存命中 coco, 价格已接近 antropic 旗下 cloudsonnet 四点六水平。这是国产大模型首次在核心场景实现于海外头部厂商的价格。对其更炸裂的是,在最接近真实软件开发的 swebench pro 精准测试中, glm 五点一实现国产模型首次超越 opps 四点六,刷新全球最佳成绩,全球模型第三、国产第一、开源第一,三大代码评测精准全面领跑。同时,空投正在大撤退,智谱迈空谷数较高点下降百分之九十六点八五, 几乎降值冰点。从年初至今,智普 a p i 价格累计上涨超过百分之八十,但付费都肯需求不降反增,量价齐升,定价权正在从概念变成现实。管理层二零二六年底, 十亿美元二目标正在快速兑现。当国产大模型开始用涨价证明价值,用硬指标超越海外巨头,用业绩回应质疑,市场的定价,逻辑就该变了。这就是为什么智普能涨,不是炒预期,是算账。