最近智普大模型出名了,一月底在深圳策略会刚交流过,新发布的 g o m 五在 call 顶 agent 上表现非常好,洗车问题也是完全答对,发布没多久,官网的 call 顶直接卖断货,连 max 套餐都卖光了,相比对按贵的离谱的头肯费,性价比特别高。目前, g o m 五已完成于升腾、 摩尔县城含五、 g、 昆仑星、木兮、岁元、海光等国产算力平台的深度推理适配,通过底层算子优化与硬件加速, g o m 五在国产芯片级群上已经实现高吞吐 低延迟的稳定运行。别问我怎么知道这么多的,因为公司头官杨总这两天更新了很多朋友圈,大家赶紧拥抱起来吧!
粉丝3.2万获赞3.5万

智普啊,发布了 glm 五点零,为了测试它的能力啊,我用它构建了一套可以无限运行的 ai 开发系统。我用这个系统运行了长达十个小时,从晚上十点到早上八点, ai 做了几十次 getmate 的 提交, 开发了一个 ai 漫剧生成工具,有前后端有数据库,可以用户注册和登录,还接入了大圆模型,图片生成模型,视频生成模型。通过这个视频,你会学到如何构建这样一个无限运行的 ai 开发系统,并了解到 glm 五点零的惊人开发能力。 整个过程我都只是输入简短的 prompt, 没有亲自阅读或修改任何一行代码。我一直在旁边玩着游戏,等他干活, 尤其是我视频最后会讲的,他把整个项目的所有模块联合起来,然后端到端的 bug 修复错误,非常的牛逼。他不只是单纯的写代码,他甚至自行在浏览器中验证每个功能的正确性,找出 bug, 然后自行在浏览器后端数据库第三方的 api 之间联合调试,找出问题,修复错误。 那赶紧进入正题啊,相信对你会有所启发。我使用的工具是 cloud code, 并且把模型切换为 g l m 五点零,具体方法可以看我之前这一条 g l m 四点七的视频。 那我们首先要搭建一套能无限运行的 ai 开发系统,说是系统,其实就是几个文件,做法非常简单,我把一篇来自 astonopy 的 神级文章发给 ai, 让他自己去学习,根据这篇文章做出这套系统 文章叫长时间运行智能体的有效调度编排框架。那过程中 ai 做出了一些操作预期的举动,他通过 m c p 打开浏览器, 通过这篇文章的页面找到一个配套的 get up 仓库,打开仓库的代码文件进行学习。而我事先都不知道这个代码仓库的存在,最终他创建出了这一些文件。 我解释一下最重要的几个,帮你理解一下这套系统的工作方式。 task 点 jc 文件,其实就是一个任务列表,每个任务都有它的描述,并且会标记是否已经完成。和我们人类工程师每天上班一样, ai 每次从这里面领取一个任务, 完成后就做一个标记,这样他的 ai 同事啊,就知道项目进展到哪里。 progress 点 txt 文件,每次 ai 完成任务啊,或者任务失败后,都会在里面留下工作日期,这也是为了给其他 ai 同事提供一些信息。 log 点 m d 文件,这里面全是提示词,用来指导 ai 根据固定的规范流程工作。和我们人类工程师的开发流程类似, 第一步,跑一个脚本,来初识化整个项目的环境。第二步,在 task 里面领一个任务。第三步,就开始开发。第四步,测试和验证。 第五步,更新 progress 和 task 文件。第六步,用 git 提交代码。那如果中间遇到困难,需要人工介入,它就要及时向人求助。那在以前一些长期运行能力不强的模型中啊, 这么长的开发流程,一旦工作上几十分钟,模型就会逐渐混乱,不再按照规定的流程工作,而如今完全没问题啊。视频后面我们会看到, glm 五点零,即使在长达一个小时的工作,提交了几十个 commit 后,仍然很好地遵循开发规范。 然后呢,我让他写一个脚本,用来无限时间的运行。这一套开发流程背后的原理很简单,就是把 cloud code 放到一个 while 循环里面,这样一来,人不在电脑旁边的时候没法手动 prompt, ai 就 可以执行这个脚本,让 ai 无限的工作。它之所以有效,有几个原因啊, 第一,我们这套流程每次只要给 ai 说一句,完成下一个任务,不需要更具体的指示, ai 就 能通过 task 和 progress 文件知道自己现在应该做什么。 第二,每个 task 都很小, g l m 五点零足够的强大,每一次 y l 循环里面,他只是领取一个很小的任务,并且严格的测试,成功率极高。第三,每完成一个任务,模型的上下文都会被清空,所以模型始终保持在最聪明的状态。 第四, g l m 五点零非常可控,严格按照工作规范执行,每次小任务都会进行 commit, 所以 即使出错,我们可以轻易地回滚到旧版本。 好,现在我们这套系统有了,接下来就要开发软件,我们先来设计一下它的功能和架构。这个软件的用途是一句话,生成长视频。我让 ai 把整个项目的开发需求拆成了三十一个任务,放到 task 文件里。 这是 ai 设计的软件,架构不复杂,但五脏俱全。再看一下 ai 画的业务流程图啊,帮助大家理解我们要开发的这个软件具体的功能。 首先,用户会创建一个项目,然后用大圆模型生成每一个分镜的文字描述,然后再用图片模型生成每个分镜的图片,再用视频模型生成。视频开发的流程比较长啊, ai 做了几十次提交,我就选几个精彩的给大家讲。 在 ai 做到第十九个任务的时候,为了测试 glm 五点零的能力呢,我产生了一个大胆的想法,我让他一口气做了一个多小时,完成了十一个任务,干完一个又一个,中间我没有任何干预, 给大家倍速感受一下效果。他一直在写代码,并且每次都遵循我们的开发规范,每个任务都完成,测试一个,一个任务,单独提交代码,拿一个具体的任务作为案例啊。他现在领取了任务三十,任务目标呢是实现响应式的布局,也就是让 u i 在 手机端和桌面端看起来不一样。 他现在正在修改代码,然后验证项目能 build 通过。然后他现在把浏览器的大小变成了手机屏幕大小。打开了我们的应用,他点击了一个按钮, 他对页面做了一次截图,用识图的 m c p 判断是否正确。再打开了一个新的页面,再做了一次截图,并检查是否正确。然后在 progress 里面仔细描述了自己所完成的工作,然后把这个任务标记为完成,他就按这么一套方式疯狂的干完了每一个任务。 要接入数据库的时候呢,他主动提出需要人工帮助,并且一步一步地给我说明,告诉我如何去这个 superbase 平台啊,点哪里创建项目,配置数据库,获取 api key。 尽管我没怎么用过 superbase, 仍然轻松地操作下来了。中间我还犯了错误,给他提供了错误的 key, 也被他及时发现,最后他还让我帮他去注册一个测试账号,然后他自己打开浏览器,输入账号密码,验证登录功能,可以正常使用。那像 superbase 这种外部的系统啊,超出了 ai 的 控制范畴。 g o m 非常明确的给我提供指引,让我协助他完成开发工作,一个不了解后端的人,也能在他的指引下完成数据库的配置。 他开发完后端一系列 c r u d api 后呢,声称对每一个 api 都进行了测试,但所有的 api 都是需要 os 的, 前端也还只有一个空白的页面,所以我就很好奇他哪里来的 os 权限,怎么完成测试,是不是在忽悠我? 于是我问了他一下,他用简短的语言,漂亮的格式向我解释。他说他打开浏览器,登录了刚才创建的测试账号, 然后通过一个叫做 browser evaluate 命令,在浏览器可以执行任意的 javascript 代码。然后他写了一些临时的 js 代码,就在浏览器里运行,调用我们的后端 a p i, 这样就能有 office 了。非常聪明的做法,我还怕他在骗我,我检查了一下录像,确实如他所说,他打开浏览器疯狂测试, 中间还真测试出不少问题,他就自行查看后端的报错日期,自行修复。最终三十一个任务全开发完后,啊,我也懒得去人工验证这个项目是不是已经可以用了。在往常的开发中啊,到最终阶段,因为已经把 前端、后端、数据库、第三方 api 全部连起来了,那第一次的集成测试啊,就会非常头痛,因为任何地方都可能出错,往往需要浪费大量的时间再把错误找出来发给 ai, 让 ai 去修复。但这一次我非常大胆,我只说了一句话, 请你完整测试一遍流程,确保功能可用。大概就是从早上七点十分开始,他自己在浏览器上疯狂测试,花了一个小时提交了这么多改动,用来修复 bug。 我看他在浏览器上像人一样一步步操作我们的产品,通过截图和视觉能力来判断是否符合预期。遇到问题的时候呢,他就自己查询后端的报错,检查各种 api 的 状态,综合分析出问题。最终他总算顺利的生成出了第一个视频,端到端的把整个应用全部打通了。 他修复的每一个 bug, 做的每一个 feature, 其实我都不清楚是什么情况,但我想知道的话,我只要找到他的 commit 记录,看一下他在 progress 文件里写了什么。这也是这套流程的强大之处,一切都是可追踪的。 我们让 glm 五点零一边开发项目,一边在开发过程中发现问题,让 ai 来增强我们这一套自动化的开发系统,左脚踩右脚,螺旋升天,我相信这就是未来开发者的工作方式。总结来说, glm 五点零已经远远超出了单纯抠顶的范畴,而是能对软件工程的每一个环节进行自动化,提升效率。 gm 五点零在超长任务上非常出色,已经达到了能让我放心的交给他连续运行一个小时的程度。横向对比的话,我个人认为 gm 比刚发布的 oppo 四点六弱一点,但在一些方面可以超过 gbt 五点三。 重点是价格便宜非常多,但现在过于热门啊,供不应求,抠钉套餐非常难抢。那我们这个项目呢?虽然现在端到端全部打通了,但最终深层的视频效果还有很大优化空间。点赞到一万,我可以开源出来,让感兴趣的人进一步优化它。

家人们,国产 ai 又炸大新闻了,智普 g l m 到五横空出世,直接引爆行情。二月十二日,科创人工智能 e t f 华宝五八九五二零蒙拉百分之四点零二,一举收复二十日均线,势头超猛。成份股彻底狂欢,尤克德二十厘米涨停, 星辰股份涨于百分之十五,鑫源股份涨超百分之十二,微盛信息、星环科技等跟涨不停,权重股含五 g 也涨超百分之三,全板块赚钱效应拉满立好,直接叠满 buff 一 致谱凌晨发布 g l m 到五,此前匿名代号 tony alpha 在 海外封神,被夸最强开源代码,模型 技术逼近国际顶级水平,还适配华为、升腾、韩五 g 等七大国产芯片,跑通国产算力方案二字节。 cds 二点零火到海外,马斯克都发文感叹模型发展速度太快,直接带火整个 ai 赛道,机构也给足信心。中信证券说,国产算力有望复刻,美股涨牛, 海外管制到逼国产化提速,国内芯片已经实现算力突围,产业链机遇满满,想布局国产 ai。 科创人工智能 etf, 华宝五八九五二零,一键打包国产 gpu esic 龙头,半导体占比进半,进攻性拉满。还是融资融券标地,直接买 etf 或选连接基金。 a 类零二四五六零 c 类零二四五六一,紧跟国产 ai 风口躺赢。

今天这期节目,我们就来探讨一下这个刚刚发布的智普 g m 五这个大模型,嗯,看看它到底在技术上面有哪些新的突破,然后在实际的工程应用当中,它又有哪些炼眼的表现,以及它在行业当中到底是一个什么样的水平。没错没错,这个也是最近 ai 圈里面非常火的一个话题,那我们就直接开始吧。 咱们先来讨论一下智普 g m 五的发布,以及它在国际上面的表现到底怎么样?还有就是它的这个发布到底带来了哪些影响?是这样的,智普 g l m 五它其实刚刚发布就引起了非常大的轰动,它一开始的时候是以内测版本的形式出现的,那个时候它的名字叫做 pony alpha, 嗯, 在海外技术圈已经是非常火了,然后它在 open router 上面的热度也是直接冲到了第一。这个 pony alpha 还真是挺引人瞩目的,连股价都被带动了吧,就是在官方还没有正式宣布之前,它就已经让相关公司的股价连续两天大涨,成为了港股 ai 板块的一个最大的催化剂。 嗯,然后等到二月十二号的时候,最新的这个 artificial analysis intelligence index 四点零榜单出来了, g l m 五它是以五十分的综合得分并列全球第三, 仅次于 g b t 四点六、 g b t 五点二和 cloud opus 四点五,哇,它也是目前排名最高的国产大模型之一,听起来真的很厉害啊。然后我们要聊的是这个 glm 五,它在系统架构和工程化上面的一些突破,它是怎么在这个 agencic coating, 也就是智能体编程这个上面跟上甚至在某些方面引领国际潮流的。 说到这个,其实在二月十一号 g r m 五正式发布之前,它就已经以 pony alpha 的 身份在 open reader 上面掀起了一阵风波,被很多海外的开发者称为是最强的开源代码模型。大家都在说它的推理深度和工程化能力已经非常非常接近闭源的顶尖水平了。 看来这次国产大模型真的是在技术讨论里面走到舞台中央了。完全没错,现在硅谷那边大家都在关注的就是 agent coding, 像 gpt 五点三, codex 和 cloud opus 四点六,它们都把重心放在了这种长时程的复杂的工程任务上面。嗯,那 grm 五就是国内第一个真正意义上跟上这个前沿的大模型,实现了从传统的对话式的代码生成到端到端的系统工程的跨越。 这个模型到底在实际的项目里面和专业的评测里面,到底有哪些让人眼前一亮的技术亮点呢? grm 五它是一个非常厉害的模型, 比如说你要去搭建一个高并发的电商库存系统,它不仅仅能够帮你生成所有的代码,还包括了漂亮的 ui 界面,然后包括 reddit 的 缓存、消息队列、数据库锁,它全部都帮你搞定,甚至写出来的代码直接就能上线, 非常的高效。这听着已经不像是一个工具了,这像是一个全站的工程师啊。是,而且他在处理这种复杂的开源项目的报错的时候,他能够自动地去分析依赖规划修复的步骤,然后最后给你一个可执行的补丁。嗯,他的这种能力其实在专业的评测里面也是非常非常突出的。 比如说他在 s w e bench verified 上面拿了七十七点八分,就已经很接近 opus 四点六的八点零九分了。然后他在 terminal bench 二点 o 上面是开源第一, 在 vending bench two 的 经营模拟里面,它也是拿了第一。哇,它的这个 coding 和 agent 的 能力已经是开源的 s o t a 的 水平了。就是说这个 g l m 五它到底是用了什么样的新技术,能够让它在系统架构和智能体的任务上面能够达到世界领先的水平呢?呃,核心就是它采用了这个 m o e 的 稀疏架构, 这个架构的优势就在于它非常擅长处理长城的依赖和复杂的逻辑。嗯,所以 g l m 五在面对那种需要记住很多步骤,或者是说要调用很多工具的这种任务的时候,它能够非常完美地去执行。 然后它的整个设计思路也是完全是针对这种系统架构和智能体的场景去做的一个优化。所以就是说这是国产大模型第一次在真实的工程实践当中能够有这样的表现吗?对,没错,就 g l m 五出来之后,海外的开发者也是非常的惊讶,他们说本来以为开源界没人能接住 agnication g 棒,直到测了 g l m 五。 所以这也意味着中国在这个稀疏架构、代码能力和智能体这几个领域已经正式地进入了全球第一梯队。那整个行业的竞争也从以前的这种通用的能力的比拼,慢慢地转向了这种垂直场景的落地和实际的工程化能力,下面咱们要聊的这个话题啊,是国产算力的突破和芯片的适配, 就是 g l m 五到底在这方面做了哪些事情,能够让它在国产的芯片平台上面跑得又快又稳。这就不得不提到, g l m 五其实在发布的时候就已经跟七家主流的国产芯片平台做了深度的适配,包括华为的升腾、摩尔现成、韩五、 g 昆仑心木曦穗源还有海光, 然后对这些平台都做了算子级的优化,所以它能够充分地发挥国产算力及群的优势,实现高吞吐、低延迟的推理。 那这样的话,就把中国造的这个大模型的方案推到了一个全新的高度。这么说的话,那华为升腾和摩尔县城还有海光这几个在支持 g l m 五的时候,分别都做了哪些比较关键的优化呢?先说这个华为的升腾, 升腾在 g l m 五开源发布的同时,就做到了 day 零的全流程适配,嗯,在推理方面呢,它用的是 ibis 八百 a 三,然后 w 四 a 八的这种混合精度量化,把这个七百四十四 b 的 模型能够高效地部署在单机上面。 同时它还通过一些像 lightning indexer, sparse, flash attention 这样的一些融合算子,进一步地去加速了端到端的这个推理的速度。 ok, 而且它也兼容了像 v l l m a sand s glam 主流的一些推理引擎, 这优化力度真的很到位啊。其他的平台是不是也有类似的这种亮点呢?当然有啊,比如说这个摩尔县城,它是基于 s g long 的 推理框架,在 m t t s 五千上面也是做到了对零的适配和验证啊,那海光的 d c u 呢?也是让 g m 五在上面跑得非常的吞吐和非常低的延迟, 所以整体的这个国产芯片对大模型的承载能力是有一个非常大的跃升的,看来国产芯片的发展也是突飞猛进啊。然后我们要说的就是这个 glm 五在实际的使用场景当中,到底有哪些令人惊艳的表现? 它在技术实力上面到底跟这个 cloud opus 四点五相比有哪些映同在实际的评测当中呢? glm 五在工业级的后端开发,复杂的任务规划、多轮的调试以及连续的工具调用等等这些工程化的场景当中,嗯,它的表现是可以和 cloud opus 四点五直接去进行对比的, 然后整体的这个使用体验也是达到了目前开源的 s o t a 的 水准。能不能举一个实际的例子,让我们感受一下 grm 五在这个真实的项目当中到底有多强?可以啊, 比如说在 terry live 实景地球学习与旅行推荐这个全站开发的测试当中, grm 五它是可以从需求分析到代码编辑到三维图形的实现,到交互设计,它全部都可以一个人干 哇。最后交付的是一个功能完整,界面非常漂亮的一个三 d 地球应用,这个效率是远远超过传统的这种开发模式的。这么说的话, g l m 五在智能写作和全站开发这两个领域到底展现出了什么样的过人之处呢?是这么回事儿,就是 g l m 五它能够自动地去拆解复杂的分析任务,然后生成这种非常专业的报告, 还能把关键的信息都给提炼出来。嗯,在全站开发当中呢,它也是能够把开发者从这些底层的技术细节当中解放出来,让大家更多地去关注创新和创意。整个的这个项目推进的速度也是非常快的,所以被很多人称为是超级生产顺利引擎。 那 g l m 五在代理编程的能力上面和使用成本上面,到底跟这个 cloud ops 系列相比有哪些优势呢?这就要提到海外的一个博主,他的网名叫 ai code king, 它做了一个实测,就是在代理编程这个场景下面, g l m 五拿到了五百八十九分,这个分数是高于 cloud opus 四点五的五百八十五分的,是目前全球第一。 这个 g l m 五的这个分数真的是很能打呀,那它在费用上面是不是也有很大的惊喜?没错,更厉害的是完成同样的一个编程任务, g l m 五的推理成本只要零点一四美元哦,这还不到 opus 四点六的推理成本六点三九美元的四十分之一。 所以以前的话,可能大家会用 oppos 来做这个复杂的任务规划,然后用一些便宜的国产的模型来做执行。但是现在的话, g r m 五已经可以单独的去承担这个大脑的角色了,真正的实现了国产大模型对顶级闭源模型的一个替代,听起来非常不错啊。然后我们再来说一下 pony alpha 的 爆火, 以及质朴的这个市值的飙升,这背后到底有哪些关键的事件呢?这件事情其实是非常戏剧化的,就是 g i m 五,它一开始的时候是以 pony alpha 的 这个身份在海外的平台先火起来的。对,而且是在没有任何官方的预告的情况下,它在 open router 上面上线了, 然后仅仅用了二十四个小时就冲到了热度榜的第一名。看来是这个 pony alpha 这个神秘的身份,还有它超强的性能,直接就点燃了整个社区的热情啊。 对,没错, openrater 的 官方也是特别的提到了,它在编程、智能体的工作流推理和角色扮演这几个方面都是非常强的,尤其是它的这个工具,调用准确率是非常高的。 嗯,然后等到这个消息传出来,说这个可能就是智普的 glm 五之后,公司的股价在两个交易日之内就被资金推得非常高,市值一度突破了一千五百亿港元。哇, 就直接成为了港股科技股里面的焦点。所以就是说,智普 g l m 五的这个技术突破,到底是怎么影响了资本市场对整个港股 ai 板块的这个估值的呢?就是二月十一号, 智普官方正式地宣布了 pony alpha 就是 g l m 五。嗯,这个时候就是技术预期落地了嘛,所以这个也成为了二零二六年年初港股 ai 赛道里面最有标志性的一轮行情。 这应该也是属于比较少见的,就是海外的这个技术热潮反过来带动了港股的这个估值的提升吧。对,这是国产大模型第一次出现这种海外的技术热度倒逼港股的估值。嗯,然后市场的这个交易逻辑已经从原来的那种追赶者 变成了现在的这种 mo 一 架构开源 sota 这样的一个硬核的突破,这也意味着资本市场对 ai 公司的这个定价权已经开始从财报往技术预期去进行转移了。 ok, 我 们今天聊了这么多,关于 g l m 五的技术的突破,工程化的落地,以及它在行业里面的位置,然后包括它对国产大模型和这个 ai 芯片生态的一个推动。好的,那本期节目咱们就到这里啦。啊,感谢大家的收听,咱们下期再见,拜拜。拜拜。

兄弟们,智普 g l m 五上线后,流量爆发式增长, g l m codeplay 更是上线即受气,算力都不够用了。智普发公告称,团队在全力协调算力资源,加速完成扩容部署,关联的是云浮商和国产算力。二、 双良节能公告最近获得了 spacex 三个订单,就遭到了监管几事,原因是信不信不完善。虽然订单不是直接供应,而且也只有不到一千四百万,但也是国内为数不多真正供应 spacex 的 公司,应该不至于像巨粒一样吧。 三、协创数据计划一百一十亿采购服务器,用于为客户提供云算力服务。四、深圳研发了人工智能加先进制造业行动计划,要以 ai 芯片为突破口,做强半导体产业。中信国际也表示,存储器、 bcd 供不应求,都在涨价,关联的是科技半导体。

hello, 大家好,我是阿兰,欢迎来到科技商学频道。 大家好,我是老 a。 老 a, 最近国产大模型圈可是炸了锅啊,智普 g l m 五和字节的 c 点四、二点零被称为双子星,你怎么看? 阿兰,你说的没错,这两款模型确实代表了国产大模型的新高度。智普 g l m 五的代码能力已经达到了世界第一梯队,和 g p t 五并肩作战。 听说 glm 五之前还被大家误以为是 cloudsonnet 五或者 deepsea v 五,这说明它的表现确实让人惊艳啊。没错,这款模型在代码能力和智能体表现上都取得了 soata 成绩,真实编程场景的使用体验已经逼近 clouds opus 四点五。 官方说它标志着人工智能开发从 vibcodeen 变格为 agentient engineering。 这个说法很有意思, 能具体解释一下。简单来说,就是从之前那种凭感觉写代码变成了更系统、更工程化的 ai 开发模式。 glm 五的代码能力实现了跨越式提升,擅长复杂系统工程与长城 agent 任务。 那它的实际表现到底怎么样呢?有没有什么具体的例子?有,开发者测试让它做一个 opc 一 人公司互动平台,实现自动接单商业闭环。 结果它设计了工作台、智能体等多个板块,在任务市场中还可以让 agent 自动接单完成任务,功能非常齐全。听起来很厉害啊,那它在多智能体方面的表现如何? 之前的开源模型在处理复杂环境、多节点的任务时和闭源模型还有差距,但 glm 五建立了新的 benchmark, 有 开发者用它复刻了篮球巨星小镇,效果非常好, 它还能完成从克隆项目配置、环境安装、依赖运行到修复错误的完整流程,即使失败了,也会重新审视目标、调整命令,再次尝试。这确实是很大的进步。那它和上一代 glm 四点七相比,提升在哪里呢? glm 五的参数规模是上一代的两倍,从三千五百五十亿提升至七千四百四十亿,训练数据量从二十三万亿增至二十八点五万亿 tokens。 更重要的是,它开始具备完成大任务的耐心,也开始具备在复杂系统中维持一致性的能力。如果说 g l m 四点七是开源代码能力的达标,那 g l m 五更像是第一次真正走进可用区间。 那它的价格怎么样?开发者们的反应如何?有开发者算过, glm 五的输入成本比 opus 便宜六倍,输出成本便宜十倍,而且它是开源的,模型权重遵循 mit license, 这对开发者来说是很大的利好。 很多公司都在囤 token, 智普的算力卡现在都很难抢了。看来国产大模型的春天真的来了。除了 glm, 五字节的 c 氮次二点零也很亮眼啊。 没错, c 电四二点零在视频生成方面已经拿出了接近全球第一梯队的表现,在生成稳定性、动态一致性和常持续控制上都有很大提升。智普 glm 五和 c 电四二点零一起构成了国产模型领域的双子星, 这对国产大模型来说意味着什么呢?这说明国内头部团队在多模态底层架构与训练工程上已经具备了正面竞争的实力。国产模型训练范式、数据策略以及算力调度能力都在整体成熟, ai coding 这个最能体现模型真实能力的赛道里,差距正在被持续压缩。 看来马年确实是国内 ai 玩家们策马奔腾的一年啊!没错,智普 glm 五开了个好头,希望更多国产大模型能跟上步伐,让我们一起期待国产 ai 的 更多突破! 好的,今天的科技商学就到这里感谢大家的收听,我们下期再见!

各位朋友大家好,这两天 ai 圈可是有个大新闻,咱们国产的算力巨头海光信息和顶尖的大模型公司智普 ai 联手搞了个大动作。 智普 ai 刚刚发布了他们全新的 g l m 五大模型,几乎就在同一时间,海光信息就宣布,他们自家的深度学习加速卡,也就是 d c u 已经完成了对 g l m 五的 day 配,而且还做了联合精调。 啥叫对零适配呢?简单说就是模型发布当天,硬件就能立马跟上,直接跑起来无缝衔接,这速度简直像百米冲刺, 这可不是简单装个驱动就能搞定的事儿,背后是两家团队在底层软件和硬件上下了硬功夫,海光靠的是他们自研的 d t k 软件站,深入到算子和硬件加速层面进行优化,目标就是让 g l m 五在海光 d c u 上跑得又快又稳,实现高吞吐低延迟。 这意味着什么?意味着以后我们用国产的大模型搭配国产的算力芯片,就能享受到不输国际大厂的流畅体验。 尤其是在需要实时响应的场景里,比如 ai 实时对话或者复杂任务处理,这体验感一下子就上来了。不知道大家还记不记得,以前咱们搞 ai 大 模型总有点儿心病,得看别人脸色。现在可不一样了,海光和智浦这次合作就像是给国产 ai 生态打了一剂强新针, 核心目标就是打造一个纯正的国产大模型加国产算力的闭环。 g l m 五本身也不是吃素的,听说它在编程和智能体能力上表现特别亮眼,接近甚至在某些方面超越了国际顶尖水平, 是冲着实实在在的生产力工具去的。能驾驭这种级别的模型,本身就证明了海光 d c u 的 硬实力, 这不仅仅是能跑,而是跑得好、跑得稳、跑得快的标志。有分析就指出,这种深度协同其实是在构建我们自己的 ai 技术护城河。那么我们把眼光放远一点,这次合作仅仅是开始吗? 二零二六年整个算力市场会怎么走?机构们的看法倒是挺一致的,景气度将持续上行。北京市已经明确说了,到二零二七年要累计建成二十万批规模的算力, 这可不是小数目,背后是实打实的政策和需求驱动。再看全球,微软、谷歌、 mate 这些科技巨头对二零二六年的资本开支计划一个比一个乐观, 预计投入 ai 算力和基础设施的钱会大幅增长,这说明全球对 ai 算力的渴求根本没有降温的迹象。具体到投资上,机会可能出现在哪呢? 我给大家梳理几条线。首先是国产算力核心环节,像海光信息、韩五 g 这样已经具备芯片研发和商业化能力的公司,在国产替代的大趋势下机会明显,特别是能参与到生态构建中的企业。 其次是基础设施与关键部件,算力集群建的越多,对光模块、夜冷解决方案、先进电源存储等需求就越大。 去年光模块企业向新益盛中继续创涨幅惊人,就是因为它们是算力规模扩张中不可或缺的一环,液冷技术也因为散热需求升级,从可选变成了必选。 最后是应用落地与硬件创新。随着算力基础磋识, ai 应用的商业化落地会加速,谁能解决真实痛点,谁就能冒头。 同时, ai 眼镜、 ai ping 这类端侧 ai 硬件在二零二六年也可能迎来创新爆发。当然了,机会背后也要看到挑战。目前关于海光 dcu 运行 glm 五的具体性能数据,比如和国外主流芯片对比到底怎么样,还有待更多透露。 未来,海光能否持续复制这种 day 零适配模式,吸引更多主流模型加入,以及下游客户是否愿意大规模采用这套国产组合拳,都是需要观察的关键点。投资嘛,既要看到趋势,也得留意具体的进展和业绩兑现。 总而言之,海光信息和智普 ai 的 这次联手,是国产 ai 生态协调、效率提升的一个强烈信号。它告诉我们,在算力这个决定 ai 未来的核心赛道上,中国力量正在加速奔跑,努力把主动权握在自己手里,二零二六年的 ai 江湖,注定会更加精彩。

大家好,欢迎收看今日 ai 日报,今天我们将为您带来一系列最新的 ai 资讯,感受人工智能领域的蓬勃发展与创新活力。 首先来关注智普 ai 的 重大突破。智普于二月十二日凌晨正式开源了新一代机座大模型 glm 五, 其底座参数规模达七四四 b, 在 权威编程基础测试中拿下开源模型全球最高分,真实编程场景体验逼近 cloud ops 四点五。该模型面向 agentient engineering 打造,具备强大的工具调用能力和长城规划记忆能力, 可实现一句话输入到完整交付物能,为复杂系统工程与长城 a 整的任务提供可靠生产力。 接着是 entropic 的 重磅融资消息,北京时间二月十三日, entropic 完成了三百亿美元巨轮融资, 头后估值三千八百亿美元,成为全球第二家两万亿级 ai 独角兽。本轮融资由新加坡主权基金、 g i c 等联合领头,微软、英伟达同步加注。此次融资将进一步助力 entropic 在 ai 领域的研发与拓展,其发展前景备受瞩目。 再来看看企业合作动态。二月十三日,沙特阿美与微软签署谅解备忘录,计划基于微软 azure 云平台探索人工智能驱动的工业解决方案,以提升运营效率,增强全球竞争力。 双方将在数字主权和数据 resiliency、 运营效率与数字基础设施等多个关键领域展开合作,推动能源领域的数字化转型。 在政策标准方面,工信部于二月十三日对人工智能关键基础技术、办公智能体应用接口规范等一百六十二项行业标准给予公示, 这将有助于规范我国人工智能相关技术与应用,推动行业健康有序发展,为 ai 产业的高质量发展提供坚实的标准支撑。 教育领域也有新进展。二零二六年春节前夕,由十四五中华优秀传统文化创新教育研究总课题组等机构联合研发的中小学传统文化 ai 智能体启动上线测试。 该智能体一托国产主流大模型矩阵构建,融合知识库,围绕三百个人文教育主题,实现了从知识灌输到能力看究的范式转移,将于三月面向国内第一批传统文化人工智能教学实验基地开放。 最后关注一下太空计算领域。二月十二日消息,三体计算星座实现了新尖组网突破,通过载轨携同完成了十个人工智能模型应用的部署与验证, 探索了深空探测、智慧城市建设等场景的太空计算创新应用。三体计算星座是千星规模太空计算基础设施,目前整体载轨算力达五 p o p s, 是 全球算力规模最大的太空计算星座,正推动太空科研范式改革。 以上就是今日 ai 日报的全部内容,我们将持续为您跟踪报导,期待下次再见!

大家好,今天呢给大家介绍的是智浦最新发布的 ai 大 模型 glm 五,那 glm 五呢,它是拥有一款啊,七千四百四十亿参数的啊,超大规模的混合专家模型,底层框架使用的 mo 一 框架,它的上下文窗口长度呢可以达到两百 k 左右。 然后呢, gm 五呢,在全国权威的这种 artificial alliance 榜单中也是位列位列全球第四的,在开源界的话也是处于第一名,并且呢在多项的这种编码测试中也是获得了开源索塔的成绩,它的性能的话是超过了 啊,谷歌的 gmail 三 pro, 实际的体验的话毕竟于这种 cloud ops 四点五。 而且呢这次智普的这个 ai 呢,也是接近把它的 ai 呢都扩展到了一个多模态领域,支持多模态理解,然后呢,呃,而且能处理这种超成本或是复杂工程,以及说做 a 境的开发。 那今天呢,我们会用啊二十万字的文档带大家去深入去了解一下 glm 五它的技术原理, 还有底层的一些啊架构啊。这篇文章呢,是通过 cursor 编辑的文章,一共是十一个间谍。然后这个篇文章是通过 opencode 加 midmax 编辑的文章,嗯,也是大概十个章节左右。 那首先我们来看一下这些章节的目录大概的内容啊,这个这里呢,我将这个文档呢做成一个简单展示的一个网站啊,简单给大家说一下这些网站。这个 gm 发布这次的内容,首先是对于行业发展来说,嗯, mate 在 之前的是开元领域是领先的, 那 g m 现在是呃在开源领域是呃做到了第一,那闭源模型就是三大这个 ai 公司啊, open ai、 ostracape 跟谷歌,谷歌啊,但是嗯,我们看到过 g m, 它追赶速度还是比较快的, 然后这次的呃突破性的成就也是比较高的。首先是模型的参数扩大了,然后结合了多模态 以及说上下文窗口长度,能输入整本书或者是整个项目,整个代码仓库啊,还就是在工程化的这种 ai 编程领域,那也是获得了一些突破 啊。第三部分是这第三部分是 g m 的 发展史啊,那可以看到距离上一次发布 g m 四点五的话已经差不多一年了,然后呢这个 g m 五的话是二月份才发布的, 然后它里面的技术创新和架构设计呢,主要是设计包含这个混合加专家模型的优化,因为它这里包含有二百五十六个专家,然后呢进行灵活的调度。其次呢就是它借鉴了 tiffany 的 啊些数处理机制,然后做了一些局部的一些优化, 然后也做了自己层面一些创新,比如说引入了 slam 框架,它可以去增强这种啊,训练,训练啊,增强,提高训练的效率,然后这 slam 的 话是一个一步强化学习框架,然后呢它也做了各种层面的一些优化, 然后呢在性能评测或者对比里面呢,它的这个编码分得分的话也是超过了 gsm pro, 这是他,嗯,大模型评分后面,然后行业几方的话也是目前啊,就是大家通用的大模型的解决方案,比如金融指挥啊,都这这些领域的东西,然后这是他大概的内容。

谁说国产 ai 只会开会?郑州研讨会才刚散场,真正的重头戏就开演了。二月十日,光核组织集结头部算力模型厂商,启动联合公关,打造算力加模型加场景闭环。 二月十一日,智普 ai g l m 五开源海光 d c u 同步适配,直接把闭环落到了实处。 g l m 五拿下开源 s o t a 海光,实现 day 适配, 双方深度协同,让国产算力的价值充分释放。这也正是郑州会上倡导的开放生态系统公关的核心内涵。从百家联工到企业落地,国产 ai 生态正在全面开花,未来可期。

最近有网友问我,世界大模型第一股智普的 glm 五发布了,说它是全球最好用的开源模型,编程能力堪比 cloud, 是 真的吗? 先说结论是真的,中国清华系智普最新的 glm 五模型已经在编程能力上比肩 cloud 了,全球开源模型中排名第一,虽然还有微小的差距,但是我们在快速的追赶中, 我是杨乐多大白话讲 ai 这款 glm 五到底强在哪?用三点跟大家说清楚。第一点,开源模型世界领先。目前这款 glm 五在全球的开源排名中,编程能力排名第一,综合能力排名第四, 也就是在全球范围内把代码公开,让大家免费使用的模型里面, g l m 的 编程能力是最强的。第二点,代码能力逼近顶尖水平,目前编程全球最强的就是 cloud 模型,而 g l m 五在编程的使用体感上 已经跟 cloud 相差无几了。第三点,他专门擅长处理复杂的任务逻辑,也就是一个不会代码的人,可以跟他进行多轮对话后生成一个复杂的产品,甚至不用写一行代码就可以实现。 我们客观的看,差距确实还存在,但是你要知道,一年前我们的 ai 代码编程能力比全球顶尖水平差了十倍不止, 而现在我们基本上跟他们近在咫尺了,并且 glm 还是一个开源的模型,开源的模型意味着全球的开发者都可以免费的使用它,并且在上面进行二次创作和修改。 而 cloud 是 闭源模型,只能通过付费调用它的 api 来进行使用,并且不能对其进行二次的修改和调整。做一个比喻啊, cloud 就 像是高墙内的武林高手,没有人知道它是怎么实现的, 他的武功不外传,你们只能看。而 glm 五呢,就像一个武林盟主把所有的武功秘籍全部都公开了,那你想想谁的影响力更大,谁会进步的更快呢? 这就是中国 ai 的 速度,中国至普系的 glm 一 年时间走完了别人三到五年要走完的路,中国在不断的这,这背后就是中国的 ai 的 硬实力,也是中国 ai 选择开元路线的再一次胜利。

就在刚刚,智浦扔出一枚重磅炸弹,旗舰大模型 glm 五正式发布并开源。更炸裂的是,海光 dcu 居然实现了地灵同步适配!模型刚出炉,国产算力就已经跑起来了, 这可不是简单的能用,而是深度协同底层打通 glm 五啊!参数膨胀至七百四十四倍, 训练数据堆到二十八点五 t 更首次集成了 deepsea 稀疏注意力机制,部署成本大幅跳水脱坑,效率直冲云霄。这还是我们熟悉的国产模型吗?但最让我惊讶的不是 g l m 五本身,而是它旁边的算力伙伴海光 d c u 这次跟智普堪称并肩作战,用 自研的 d t k 软件站来给 g l m 五做底层算子优化和硬件加速,让这款旗舰大模型在国产芯片上跑出了高 高吞吐低延迟的硬核表现。过去我们总在喊算力卡脖子,模型与芯片各玩各的,今天智普加海光 dcu 的 组合拳,直接把这个行业痛点砸的粉碎。 接下来就看这套算力加模型加场景的铁三角如何攻城略地了。全球 ai 竞争,中国不再只是追随者!

春节档不只有电影,还有国产 ai 大 模型层出不穷。智普 ai 重磅推出新一代旗舰模型 g l m 五, minimax 同步上线 minimax 二点五,这两款大模型的性能双双对标国际顶尖水平, 编程与智能体能力实现跨越式突破,迅速引爆全球 ai 圈。智普与 minimax 的 共同合作,受益供应商全解析 核心算力供应商优克德作为两家企业的核心算力合作伙伴,优克德与智普 ai 签订五年二十亿元算力长约,提供五万张显卡集群,超四千七百匹算力规模,支撑 g l m 五的训练、推理与私有化部署。 同时为 mini max 搭建万卡级算力资源池,保障模型高频调用与弹性扩容,从训练到上线,全流程稳定赋能。优克德的液冷算力集群云原声调度系统,完美匹配两款大模型的超大算力需求,既降低训练成本,又提升推理效率, 成为国产大模型算力自主化的标杆案例。服务器与集群交付神舟数码是智普领航级合作伙伴,也是升腾总经销商,独家交付 g l m 五训练集群,神舟困态服务器成为模型训练首选,同时为 minimax 提供服务器硬件与集群部署服务。 联通芯片算力与模型三层架构,保障万卡集群高效运行。神舟数码打通产业链上下游, 成为两款大模型基础设施的核心交付方。智算云与液冷支撑蓝云科技凭借 g p u 算力云架构与液冷技术,同时服务智普与 mini max, 为智普提供原声带智算云平台,缩短 g l m 五训练周期,为 mini max 搭建可自愈云原声解决方案,降低运维难度,以高效散热与智能调度解决大模型算力工号与稳定性难题,是两家企业底层算力环境的共同保障。数据与合规服务, 人民网通过战略投资与业务合作,同时服务两款模行,为 mini max 提供 a i g c 内容审核服务,保障内容合规,为智普提供合规数据支撑与版权服务,助力 g l m 五在法律、办公等场景安全落地。 在数据安全与合规成为 ai 发展底线的当下,人民网成为两款模型合规运营的核心后盾。记得点赞、收藏、关注,每天解读热门赛道!

说一条消息,立好的智普 ai 国产大模型携手海光 dcu, 也就是国产大模型适配国产 gpu, 强强联手,珠联璧合。两家公司,智普华章,港股海光信息 护士,你们去关心一下。因为我不做,所以说我觉得这条信息很有用,因为前两天有同学让我解读智普华章,我解读了, 如果想了解,去我的直播回放,土豆熟都有去看一下我的直播回放解读这家大模型公司。 没想到立豪的消息这么快,直接立豪我们沪深大 a 的 海光信息, 仅此而已。呃,你觉得对你有用?请评论点赞关注我们下期见,拜拜了你。另外,今天早上十点半的老粗脱口秀故事会直播 依然在进行,喜欢的可以来找我。好吧,等待我二月二十五号正式回归,大号解封,小黑子,这次别投了,我会谨言慎行,注意注意。好了,下期见,拜拜零零零。