一分钟 a i 资讯天津智博会开幕,聚深智能手势独立馆七百四十余家企业参展,四百余款机器人集中亮相,无人加油、工业巡检等场景落地。聚深智能规模化落地提速。 called mikos 独立破解五十六年数学难题,与 open ai 解法不同, ai 数学推理展现原创能力,获顶尖数学家认可。米塔 ai 开启付费订阅,六月起月费七点九九美元起, 覆盖图像视频生成。 c 端 ai 变现正式开启。谷歌 jamming 二点五全家桶发布 pro 版,支持深度思考,达成数百万颗 ai 芯片合作。端侧算力布局加速 a i 手机有 i o t 落地提速。阿里平头哥发布按八九零推理,芯片能效比超 a g 零零两倍。国产算力在天利器、飞格零三人形机器人两百小时零故障,工业级稳定性突破商业化量产零件。 支付宝 top 配上线 ai 智能体,自主完成支付,智能体从工具变基础设施。 mini max m 三即将发布,架构全面升级,性能对标 g p t。 五点五主打高效推理。 openai codex 货品企业编码 a 整治领导者, godzilla 认证 ai 编程,主导企业研发。
粉丝46获赞266

兄弟们今天给大家带来有着大号机械师二代之称的九号全新 m 三系列的深度评测。 m 三九五和 m 三一百两款车型全域焕新升级,定位都市高品质专业电摩。这款车精准对标油膜转电摩的出行人群,大多注重骑行质感,钻研车辆参数的群体, 大家选车最看重续航、骑行质感和储物空间,而全新 m 三系列直接把所有需求全部拉满。首先核心底盘直接下放 m 五同级 a 叉 c 架构的车架,车身钢线相比前代大幅提升,高速骑行不发飘,过弯稳定性极强,日常城市道路都能轻松驾。 减震配置也十分扎实,三十三星长行人前减震搭配七级可调后减震,不管是过减速带还是坑洼路面,滤震效果出色,骑行舒适性直接拉满。全系标配 a l c 全镜光幕照明系统,远光亮度达八万 cd, 照射距离远超老款,晚上骑行、雨天逆光出行, 视野都足够清晰,骑行安全性拉满。再来说说大家最关心的动力续航, m 三一百搭载三千瓦九号电池电机搭配压缩控电控 峰值动力强劲,零到五十加速仅需七点六秒,极速可达七十公里每小时,二十度陡坡轻松攀爬。配备七十二伏三十五安九号专用大动力电池,用料扎实,寿命更长,全速真实续航八十四公里,低速骑行续航更是突破一百公里。 m 三九五搭载 两千三百瓦电机,极速六十五公里每小时,满足日常通行完全够用。搭配七十二伏三十二安铅酸电池,全速续航八十六公里,日常代步毫无续航焦虑。自动方面,两款车型各有优势, m 三一百配备 双通道 a b s、 t、 c s、 e、 a、 b s 三大加持,搭配前后大铁板和四活塞卡钳,紧急自动,不打滑不侧滑。 m 三九五前后双活塞卡钳自动限行稳定,日常骑行足够安心。 车身采用一百三十度原生斜踏设计,一米六五到一米九的身高都能轻松驾驭。六百一十五毫米加长坐垫,双人乘坐宽敞不拘束。这里提醒大家,全系后割脚为手动开启, 结构稳固,收起后车身更整洁美观。智能配置搭载真智能三点零系统,感应解锁自动锁车 app, 远程控车投屏导航已经齐全,骑行便捷性拉满。配色有幻影银、熔岩橙、战斗黑、光谱白,主推幻影银和熔岩橙,颜值吸睛, 回头率超高。综合来说,全新九号 m 三系列就是六千档的六边形全能战士底盘,动力安全,续航舒适,全面升级。不管是日常通勤还是追求骑行自感,选它都不会出错。看完你们觉得它怎么样?评论区留下你们的看法!

ai 日报二零二六年五月二十八日 ai 大 模型一、小米 memo v 二点五系列 api 调整定价,小米对旗下大模型 api 价格进行调整,行业相关动态受关注。二、 minimax m 三大模型即将发布,架构升级西语科技新款大模型 m 三即将上线,架构完成升级。 三、 openroot 完成闭轮融资, ai 模型平台 openroot 完成融资,多家机构参投。四、智普 g l m 系列持续迭代,编程能力表现突出。智普 g l m 不 断更新,编程能力表现亮眼。 五、百川智能展示医疗大模型与 ai 家庭医生产品,百川智能推出专业医疗大模型及配套 ai 产品。六、面壁智能端侧大模型开源,可在手机运行。面壁智能联合清华开源端侧大模型体积小巧,性能出色。 agent 应用 七、支付宝 ai 支付支持主流智能体框架,支付宝 ai 支付落地多类场景上线相关服务。 八、 ai agent 升级为任务执行工具, ai 智能体可自主处理工作,助力企业提效。九、字节跳动布局 ai 专用芯片字节持续投入算力基础设施建设。十、 快手可领 ai 商业化提速快手 ai 业务商业化推进,智能体技术落地多场景。十一、谷歌发布 ai agent 行业报告谷歌发布报告,梳理 ai 智能体发展方向、芯片算力。 十二、美观科技市值增长,存储市场需求旺盛,美观股价走高。十三、 h b m 成本占 ai 芯片组件成本较高,高端存储芯片为 ai 硬件主要成本构成。十四、华为自研芯片技术持续推进华为公布自研芯片技术,推出多款产 品。十五、摩尔现成 ai 芯片通过国家安全可靠测评摩尔现成 ai 芯片通过权威评测,为该品类首次纳入对应体系。 十六、机构预测全球 ai 基础设施投入增长,业内机构预测全球 ai 基建投入将保持增长。十七、 spacex 规划建设太阳能电池工厂 spacex 新建光伏工厂,服务旗下项目。政策行业 十八、工信部发布光伏组建国标。二零二七年实施两项光伏行业新标准发布,二零二七年正式实行。十九、司法部二零二六年推进人工智能相关立法律法规,保障行业发展。二十、 我国聚深智能专利数量全球领先,全球智能机器人相关专利中,我国占比超一半。国际新闻二十一、中东区域局势缓和,油价变动相关区域局势趋于稳定,能源市场价格调整。 二十二、以色列公布相关行动进展,中东部分区域局势受关注。二十三、瓦努阿图启动气候应急决策太平洋岛国瓦努阿图应对环境问题。二十四、 spacex 推进太空数据网络建设, spacex 开展航天合作项目。二十五、英国出台对俄相关管理措施, 多国出台跨境经贸管理政策。二十六、韩国首尔一设施发生意外,韩国一处城市设施出现事故,当地开展善后。二十七、 悉尼灯光节表演出现设备问题。澳大利亚一场户外表演出现故障,未造成人员受伤。二十八、菲律宾与日本开展高层互动,菲律宾与日本推动双边合作。 二十九、美观科技市值创新高,多家机构看好存储行业。三十、日本通过相关法案引发讨论。国内新闻。三十一、相关领导赴浙江调研大宗商品枢纽建设,推进大宗商品流通枢纽项目建设。 三十二、长兴科技科创版 ipo 获通过,上半年业绩预计向好,长兴科技上市申请顺利通过。三十三、工信部发布汽车标准化工作要点,重点完善新能源车、智能汽车相关规范。 三十四、国内五 g 基站与用户规模增长,五 g 网络建设推进,应用场景丰富。三十五、前四月高技术制造业利润增长,国内高技术产业营收向好。三十六、我国首台全站自研 robot taxi 量产下线,小鹏汽车推出自研自动驾驶出 租车。三十七、央行开展逆回购操作,维护流动性。央行保障金融市场流动性平稳。三十八、全球减贫与发展论坛在北京举行。北京举办国际论坛,成立合作联盟。 三十九、四川发布人工智能专项方案。四川推动人工智能与行业融合发展。四十、中信证券资本市场论坛在上海举办。上海举办行业论坛,围绕经济科创交流。

hello, 大家,昨天 mini max 工程师发了一张图片,介绍了一下 m 三版本对 m 二版本的技术变化。我用模型生成了一篇研报,我们一起来看一下这个技术变化会立好哪些方向吧。 它这个核心问题是,这个如果成立的话,哪些行业能够受益? 他给了一个一句话的结论啊,如果这个成立,他最直接立好的不是单纯算力越多越好的这种硬件趋势,而是所有依赖上下文整个产业链,低延迟、低成本推理的应用行业。 他列出了一些最值得关注的收益方向,有六个 办公软件,包括高效推率、云等等。然后第二条,他说这个方案图,就上面这个图片想表达什么,大概拆成了五步流程, 以及图中性能数据的含义,我们一起来看一下啊。这个场景,那 m 三相比 m 二加速大约有六九点七倍,对行业的主要力好,大概有这些。 然后办公软件和生产力的套件有这么多,接着是多模态内容的生产,还有高效推理云。接着看是不是有 m 三版本的发布, 还有一些风险和不确定性,关于投资和产业的跟踪框架,大概会跟踪四个变量模型里给出来的。 嗯,成本和质量可能都会有明显的改善,包括稀疏选择是否在复杂推理代码、法律和金融常问当中能够保持准确性。 嗯,接着是一些风险和不确定性,它大概举了六个方面, ok, 差不多就是这些啦。你们还有什么想看的好玩的新闻和标题,都可以在评论区告诉我,拜拜。

下午好,我是佑一,我来给大家播报今天的 ai 信息差。百度智能云百嗝工作流模块全面开放,计算与云原声等核心功能同步升级,该升级只在提升企业 ai 应用的部署效率,降低开发成本。 unimax 发布 m 三模型技术简报,引入稀疏注意力机制 m s a 长上下文,响应速度提升高达十五点六倍。 m s a 机制指在使超长上下文 ai 代理部署经济可行,显著降低计算成本。 mini max 承诺 m 三系列将提供多模态领域的前沿级智能支持,拓展应用边界。王者荣耀在 s p 二看两千零二十六发布会上宣布与乐文集团战略合作, ai 解说功能已上线。 和平精英公布两千零二十六暑期版本革新计划,将推出 ai 明星队友和 ip 联动等新模块。 阿里创意千问 coen 三点七 max 在 编程竞技榜排名第二,仅次于 cloud opus。 四点七,阿里云推出限时五折优惠和一百万 token 免费额度,新用户可在百链平台使用。该模型的高性价比定价,降低了开发者进行 vip coding 的 门槛。 qq 推出 a 二 a 协议,使不同框架公司和平台上的 agent 能互相通信并协调行动。 visa 推出 intelligent commerce, 为 ai partners 提供 api 和标准,支持 agent 的 安全交易。 mastercard 推出 agent pay, 提供安全可扩展的支付基础设施,推动 agent 的 经济发展。 interrupt 两千零二十六会议正式发布 langsmouth engine 和 sandboxes, 现已公开可用会议,包含来自 linkedin、 rippling、 cisco 等团队的二十三场讲座回放,供开发者学习。 微软 m a i image 二点五在文本到图像排行榜排名第三,与 google nano banana 二持平。模型在渲染文字风格化、插图和商业视觉方面显著进步,但仍落后于 open a i image 二。 该模型已在 arena 上线,未来两周内将登陆 m a i playground 和方锥。今天的播报就到这里了,我是佑一,我们明天见。

国产 ai 模型又亮出了一张王牌,在 mini max 上周刚刚发布的 max 的 支持下,一个晚上的时间我就把自己抖音号一百多条作品复刻成了影视巨峰同款的飞书数据看板,并且根据具体数据还做出了新一期内容的十个选题,还平 了分。你以为我是熬夜干这个事情的?完全没有,我只是把我的作品列表发给了他,然后再给了他一句话,剩下的部分就是由一只 ai agent team 来帮助我完成的了。 我们直接跳到这个成品展示,大家现在看到的就是我的内容运营分析仪表盘了,那你们可以看到这几个虚荣的数字,有总观看、总点赞、总分享、二万五累计粉丝增量。那下面的还有一些部分就是播放趋势,用户互动趋势,题材播放量对比,题材互动占比,这些全部都是动态实时更新的。那再往下我一百多条作品的 明细表,每一条都给我标记好了发布时间,视频的题材播放量,完播率,五秒二秒的数据等等,还有封面点击率, 那更觉得是他现在还能自动根据我目前的数据给我筛选了十个选择题,并且进行了打分。我跟你说,真的到这步的时候我真的惊到了,因为我让他干的事是分析数据,那他在分析的过程中,他自己又多干了一件我没有让他干的事情, 就是根据我历史一百零一条作品的表现反推出说柱子哥下一期做什么样的内容大概会爆。那直接给了我十条的选题的角度,再到预计的受众差异化的核心优胜率的评级, 九个维度全部都给我打满了。比如说他给我推的第一条五星选择题是 entropic 五个月的估值翻倍,第二条是 entropic 在 企业端首次反超,全部都靠的团队。那确实,现在也是当下 ai 圈的真热点, 而且跟我历史数据表现好的这些题材入驻是完全可以对得上的。这就是多 a 卷协助的一个价值。那一个 a 卷是做不到这个的,因为他眼里只有说用户让我干的事。但是一直 ai 团队不一样,他们之间是会互相启发,互相补位的,所以我就直接服了,这个确实挺厉害,这功能 我跟你说真的,我自己花一周时间在飞书,你的手搓都可能搓不出这个效果,而刚好飞书也开放了 c l a, 所以 真的很好用。那我做的事情是什么?我就拖了一个十一 kb 的 markdown 文档,并且说了一句话,就是请把这份数据整理成飞书多维表格,并利用你多 a 卷特性进行综合研判。 那 marvis 收到以后,没有上来马上就干,而是先把数据扫了一遍,然后告诉我说,你这报告还是很专业的,有多少条作品,多少个主题, 一个月时间的最终颗粒度很细,我想开两路并行,他就启动了 a 卷一是负责把数据写进非书多位表格,然后 a 卷二到四分别是从内容策划、商业价值、粉丝运营三个角度同时做圆盘,最后汇总给到我这边。 那么看到这里,很多老观众就会问,柱子哥,铁柱老师,这个 mars 它到底是个什么东西呢?你这么理解就可以了,它是 mini max 上周刚发布的一个桌面端 ai 工作团队, 不是 gbt 那 种你问一句答一句的聊天软件,而是你桌面上多了一个有项目经理,有执行人,还有专门挑刺儿的质检员的这种小公司小团队,所有事情你只要跟项目经理对话就可以,然后他就操控底下几个 a 卷,同时帮你干活, 那它的优势在哪?我就觉得有四个点是真正的差异化,不是参数,而是机制。第一个就是它的这个 a 卷 team 的 这个特性多, a 卷并行, 每个 agent 还可以扮演不同的角色,比如说我刚才那桌就是 code verify 呀, general 这三个角色一起上。第二个对我来讲也很重要,叫做 produce verify, 这名字听起来很高级,说白了就是一句话,写代码,这个 agent 它不能自己 code review, 就 不能自己审核自己。 所以在全部做完了以后, varify 会用一个全新的独立的上下文窗口重新读,重新查,看看你这个整个项目里面有没有错漏,就是一个非常好的复审和自查的这么一个机制。我在跑第一遍的时候就对这个 varify 非常有感觉,因为 h 一 第一次是把数据写进非书的时候,字断对的不齐, 这个 varify 直接就打回去让他重写了。第三个特性三层的记忆,它可以全职的记住你是谁, a 选记住他干过什么 session, 记住这次到第几步了,这意味着什么呢?意味着你不用从头 再去跟他解释。第四个就是 i m 系统的集成,它现在和飞书整合的非常好,我们现在可以直接在飞书群里面,艾米尔斯让他直接开干,不用切到电脑上,也不用切其他的窗口。 我们现在进入实操环节,来看一下到底是怎么做的。实际上整个流程非常简单,第一步就是把这个 mini max 给它挡下来。第二步到它的窗口里面,把你的数据丢给他,把你的作品列表拖到他的对话框里面,告诉他说请把这份数据整理成非书多页表格,并且利用多 a 卷特性进行综合研判。说完这句话我就去玩手机就睡觉去了。 那第三步实际上是比较重要的,就是我们看 marvis 在 这个时候干什么,他自己是在配置非书的 cla, 这个 cla 是 真的很好用,他在自己用命令行去给我创建非书的多维表格, 那这个是我。如果放在以前,我可能要打开飞书的开放平台,然后申请自荐应用,然后再配 app id, 就 像 open call 刚出来那会,你要跟他进行非常复杂的对接,看很多的教程。我说实话,我那个时候真的没跑通,但是你看现在阿比斯,他直接把这整套开发流程当成自己的工具用,我什么都不用懂,他自己跑就可以了。 那在之后的八分钟,三个 a 卷都在那并行干。 a 卷一来写表, a 卷二在分析哪类小题的点赞比较高, a 卷三呢,在算哪类视频的商业价值最高,而 a 卷四在猜粉丝什么时候最活跃,他们偏好哪种类型的内容,他 们之间是互相不会去抢资源的。那次完成了 verify 就是 最终复审以后,我打开飞书这个看板就已经在那边了。当然了,柱子哥这次拿他干的是看板,但是 mavis 能干的活远远不止于此。在一个窗口里,他可以给你分析 excel, 写 pdf 学术报告,做 ppt 演示文稿,丢什么文件,他都能给你处理。 比如说我就在我的手机上把我的作品数据发给他,他就可以给我生成一个甲方就能看的 ppt, 看这里面有什么关键数据,什么值得亮点提炼一下,它也支持设定定时任务。比如说我就跟他说,你现在每天早上九点把昨天的 ai 日报给我发过来,结果他现在真的每天早上九点就照做。而且我们现在可以在很多的手机软件上面艾特他,直接干活,不需要去切其他的窗口, 越用越懂你,你的 ppt 风格,你的文档结构偏好,他会不断的进步。所以 ai 时代是已经过了谁的模型更聪明的那个阶段。其实大家都挺聪明的, 那下一个阶段是什么?是谁能在你睡觉的时候,有一支团队可以把你的任务完成,而且还互相 review? 那 marvis 给你的答案是什么呢?说白了一句话就是不是又一个更聪明的 ai agent, 而是 ai team 时代的一个工作台。 那这个答案能不能立得住?我用了一个晚上帮你们验证过了,确实还不错,你们自己也可以试一下。好,上就是本期视频的全部内容,希望会对你有所帮助,我们下期视频再见。

来看看贵重车型到手了啊, m 三一百,全新发布的新车型啊,已经到底哈,没裁剪看看啊, 这个车现在大部分地区还没货,大客户特殊照顾,先到了,今天晚上正式发布。价格啊, 这个车的配置有点高,高的有点过分啊,这还没装起来啊。 具体的详情关注一下今天晚上的新品发布会啊。 m 三,关于 m 三的这个一百的这个具体情况关注今晚上发布。

中国这些 ai 厂商太坏了啊,昨天二十四小时之内啊,中国三个旗舰大模型同时炸场,这完全都不让人过年啊,去年的 deepsea 就 一家赶着春节发布,但是今年呢,全上了, 但是大家千万不要觉得这只是几个新模型的发布啊,比这几个模型更重要的是,从这几个模型的更新内容上面,我们能够看到二零二六年 ai 发展的一个重大的转型,那就是所有的厂商都在拼一个全新的能力,叫 agentic。 那 为什么是 agentic? 为什么所有的模型都在拼了命地去打造 agentic 的 能力? 原因呢?很简单,因为 agentic 才是在二零二六年真正的生产力。今天呢,我就尽量把这个问题用小白都听得懂的话跟大家详细的讲一讲,希望呢,能够对大家有所帮助。 先说一下 agentic 到底是啥啊?你现在用 ai, 你 不管用豆包,用 deepsea, 还是用拆 gpt? 其实很多时候啊,你都是这么去问的,对吧?你说句话,然后他回答你,然后你再说句话,他再回答,说白了呢,就是一个高级聊天框。但是 agentic 完全不一样, 你不用一步步的去问啊,你只要给他一个总目标,比如说你跟他说,帮我把这个软件里所有的 bug 找出来,修好,然后通过测试, 然后他就开始自己干了啊,他自己去修代码,自己定义问题,自己去修改,方案,自己去改,自己跑,测试没通过就自己调整,一直到全部搞定。而在整个过程中,你不用一步步的去提问,也完全不需要插手。 打个比方啊,传统的 ai 就是 一个前台,你问什么他就答什么,但是他不会主动帮你做任何事情。而 agentic ai 呢,他就是一个能独立干活的员工,你把任务交给他,他自己搞定,而在中间遇到的任何问题,他都会自己去解答。这就是 agentic 的 核心,他能自主完成复杂的任务。你有没有注意到一件事, g l m 五,它的口号是什么呢?是从 web coding 到 agent, 而 mini max m 二点五的口号是为真实世界的生产力而生。而 devic 虽然说没喊口号啊,但是一照的上下文,本质上就是在给 agent 铺路。 同一天,三家公司不约而同地压住同一个方向。为什么?因为 agentic 的 能力才是真正的生产力,尤其是在二零二六年。如果你想让 ai 真正成为你的数字员工,你就一定要知道什么是 agentic。 你想一想啊,一个只能聊天的 ai, 你 愿意为他付多少钱?大多数的人的回答就是,最好免费。因为事实上,现在各家的聊天机器人确实也在疯狂的打价格战,越来越便宜,甚至几乎都是免费。 但是,如果是一个能够帮你自主完成工作的 ai 呢?如果他一个小时可以呢?帮你做完一份财务报告,帮你搭一个网站,帮你处理完一整天的数据分析?那你觉得他就算不免费,你是不是也愿意去用? 企业的答案就是,愿意用,而且愿意给很多钱。这个逻辑啊,很简单,只有 agent 能力足够强,模型才能够帮用户干活,用户才愿意付费,公司呢,才能够活下去。但你可能会问啊, agent 能力到底靠啥实现呢?答案就是编程。 你看看最新这些模型的评测, s w e 奔驰考的就是真实项目里面自主修 bug, 其实就是编程 browscap, 它考的是自主操作,浏览器搜索信息,提取内容,浏览器的自动操作本质上也是编程。而工具调用考的是自主决定调用哪个接口,传什么参数,怎么处理返回结果。这还是编程?甚至啊, deepstack 把上下文啊拉到了一照最直接的术语场景啊, 也是让 agent 才能够在超大型的大码项目里面持续工作,而不至于失意。所以你有没有发现,这一天发布的所有的模型,大家在拼的其实都是编程能力,都是 agent 能力。而 agent 能力强不强,很大程度就取决于编程能力强不强,因为编程就是 agent 的 底层引擎。 而想明白这一点之后,我想再往前推一下啊,我想抛一个暴论,这个世界上的绝大部分事情,本质上都可以归结为编程。我知道,这听起来呢,非常的离谱啊,但是你跟着我的思想捋一捋, 编程的本质是什么?其实就是把一个需求通过一系列精准的步骤,然后变成一个可执行的结果。而我们现在的社会已经深度的数字化了,你每天点的外卖,刷的短视频,转的账,打的车啊,背后全是代码在驱动,你的工作,你的消费,你的社交,你的娱乐,几乎全部跑在软件系统上面。 而编辑和操作软件,它本身就是编程。所以呢,当 ai 的 编程能力足够强的时候,它能够影响的范围啊,就远远超过你的想象。我举几个例子你就明白了,比如说做 ppt, 写报告,你觉得跟编程有关系吗?其实本质啊,就是一种结构化的信息处理加格式化的输出, 你把散乱的素材整理成有逻辑的内容,再按照固定的格式排版出来,这个过程呢,跟写的数据处理程序没有区别。而且 ppt 本质上就是一个电脑的软件格式啊,所以任何一个 ai 编程的软件,它都能写 ppt, 像 glm 五啊,像 m 二点五,这一次呢,都在卷。所谓的 office 能力,就是直接生成 word 呀, pdf 啊, excel 文件,就是因为这些事情的底层驱动啊,和编程没有区别。 而财务对吧?财务的建模本质就是数据处理加工式的这个逻辑,一张 excel 表,里面几百个单元格,互相引用,层层计算,这本身其实就是一个程序在运行。 m 二点五呢,专门跟金融行业的资深专家合作去训练这个能力。再说一个你可能完全想不到的就是医生开方, 比如说你去看一个医生啊,他给你望闻问切,实际上就是在收集数据,然后根据你的症状组合,在脑子里面匹配对应的症型,然后开出方子。而这个过程呢,其实跟收集输入、匹配规则、输出结果在逻辑上完全一样。 甚至做饭啊,菜谱,其实就是一个程序,输入原料,按照步骤执行操作,控制火候和时间这些参数,输出一道菜。所以你看那些做菜比较好的那些电器啊,比如说一些好的电饭煲,它里面都会用程序这个词,就是设定程序,然后按照程序来给你煮饭, 你说大厨凭感觉,但实际上它的背后就是几千次重复执行形成的参数经验,你用这个视角来重新看世界,你就会发现,几乎所有的事情都可以拆解成输入,处理输出,而这就是编程。 所以,当 ai 的 agent 能力越来越强,尤其是编程能力越来越强的时候,它能渗透的领域是无限的,它不仅仅是帮程序员去写代码,而是帮所有的人把事情做成。这就是为什么所有的模型都在拼命地提升 agent 能力,因为这条路的尽头就是通用的生产力。 之前在视频里我也聊过 opencloud skill 系统,很多人呢,觉得 skill 很 强大,确实强大,但是 skill 再强大,它的底层驱动还是模型的 agent 能力。 你可以这么理解啊, skill 呢,是一份工作说明书,而模型的 agent 能力呢,就是执行这份说明书的人。说明书呢,写的再好,执行的人能力不强啊,那结果也不会好。所以今天这三个模型的进步,对于每一个用 ai 工具的人呢,都有直接的意义。 模型的 agent 能力多强一分,你手里的 ai 工具就能多帮你干点活,它的性价比呢,就会更高。所以二零二六年啊, ai 的 竞争完全不是比谁更能聊天。而对于我们每个普通人来讲, agent 时代它真正的意义就一句话, 不是让你去学编程,而是 ai 替你编程,直接替你把工作完成。以上来自我的 ai 成长圈的日课,已经加了成长圈的朋友可以去看一下,我是 c 哥,点赞关注,咱们下期见!

九号新品发布会定到五月二十九日,这次发布会将会发布全新 m 三 d 一 等多款重磅新品,其中最受大家期待的全新 m 三全能六边形战士七 k 档性能王中王 x 车架技术下放,专业级安全架控,扭转缸度达到四百二十 m d, 较前代提升 百分之三十二三十三新九十毫米长行程,液压弹簧前减震,高制动,黄金组合,安全避险,快人两步从通道发誓, a b s 配合 t c s 和 e f s 防抱死、防侧滑、高自动碟刹、卡钳、套筒等三幺零零前二百四十毫米厚,二百毫米大碟盘钳,对置 四活塞活塞卡钳,高亮度,八万 cd 大 灯,暴雨逆光也清晰。高性能超级动力,零延迟,专业级响应, 十二寸三千 w 九号定制无刷电机,峰值功率四千一百瓦,二十度爬坡能力,山区载物爬坡无压力,七点六秒零到五十千米每秒,加速极速七十 千米每小时,支持颜属控玩家模式。全新人机适配不同身高原声一百三十度斜踏适配一点六五到一点九零米不同高度,升高用户高能实力,专业通行王九号电动全新 m 三系列。

熔岩橙色兄弟们,九号全新 m 三系列五月二十九日晚上七点正式发布,除了有适合专业级架空的全新 m 三系列,这次发布会还会有机甲潮 酷款 n 一、 适配城市高效店铺款 m 一, 还有新国标猎装神车 fc 五系列一次性全更新,五月二十九日锁定九号新品直播发布会一定要耗住首发羊毛哦!

我丢, mini max m 二点七这是要卷上天呐!能力提升不说,还加量不加价!各位, mini max 昨天已经发布了 m 二点七了,他这个发布简直是太狠了,就是在掀桌子掀车最炸裂的福利吧!我之前的二十九块钱的那个 star 的 版本也已经升级了,从原来的我是五小时四十次的,现在已经变成了五小时六百次了, 这相当于之前的十五倍,甚至超过了我以前充值过的那个幺幺幺九原版本的那种 max, 他 之前是三百次,甚至超过了他的一倍! mini max 这是要相当于把 ai 当成自来水让我们用了,便宜到让我们随便造!你的小龙虾还不赶快用上 再说硬实力吧! m 二点七他发布这次来最大的亮点呢是模型进化能力。 mini max 搞了叫 a 件 honda 的 框架, honda 如果写工程的懂的应该都懂, 让 ai 自己写代码,自己修 bug, 自己优化自己。他在代码测试上面 s w e 半曲里面的跑分呢,也是高达百分之五十六点二二的,接近于全球顶尖水平。现在的 ai 已经不仅仅是工具了,我成了自己干活的同事了, 他原来的 call 店 plan 呢,他也已经改名成 talk plan。 这就意味着 mini max 不 再是紧盯着代码,而是要通知所有生产的场景,价格他已经打到底了,能力也已经进化到很高了。这个羊毛我们也起薅!

当你用数码评测的方式来评测 ai 会发生什么?好了,我现在手上拿到的就是最新推出的 mini max m 二模型,那我们首先来做一个简单的开箱。 首先我们先来看产品的外观,一如既往地保持了简洁科技的外观,在对话框的下面还有一个产品 a 帧的功能案例,那本次发布的 m 二呢?会更偏向于专业的生产的用户,你可以理解为是手机的 pro 版或者说是 ultra 版,那更注重了代码编辑能力 和一些 a 帧的功能。那我们也是对 mini max m 二进行了一个跑分,在 bachmark 中的代码修复能力获得了六十九点四,略高于 deepsea v 三点二的六十七点八,仅次于 cloud 四点五和 gpt 五的思考模式, 并且在模拟智能体的操作 top 版中也是斩获了七十七点二分。各家的排名基本与之前一致,但差距被进一步拉开。聊完了参数,我们来聊一下模型,我们手中测得的最大模型支持 api 输入 talk 量为二十万四千八百个,但如果从更专业的代码层面,这个量已经完全够用了, 那如果你是关于一些书籍的知识整理,那可能会需要更高的输入头等量,那这边也希望工程师能够进一步的扩大。 ag 的 能力是近一年来大摩星厂商追逐赛道之一,你可以理解为一个能帮你做很多实际落地应用的助手。 我尝试让 mini max 做了一份未来十五天的黄金走势 ppt 分 析报告,当我以为它会跟常规的生成 ai ppt 的 应用类似的效果的时候, 我发现是我年轻了,整个耗时大概一个小时。他做了一个极其详尽的黄金走势分析,包含了美元汇率、美联储政策、股市表现、 央行储备等技术指标,还考虑了用户受众、美元指数、通胀率,还包括了像摩根大通的黄金走势分析。这种感觉就好比我本来是希望 mini max 做一道高中的题目,他硬生生用了一个研究生的解法来完成了这个任务。 第二种比较有意思的用法是我让 agent 制作了一个儿童绘本,内容是恐龙主题的图鉴 minimax, agent 会独立完成这个任务,并且中途还会询问我 需要包含哪些恐龙,需要多少页数,那我告诉他大致需要二十页左右,那这是 ai 整理的大纲,他还借助了 ai 绘图的功能来生成恐龙的图片,让我选择了几种不同的风格。既然是儿童读物,那我肯定会偏卡通一些。 最后我还花了二十五找了打印店,把 ai 生成的绘本打印了出来,那整体制作的还是我觉得比较可爱的, 然后打开的时候,像这边会有欢迎来到恐龙世界,然后他用 ai 生成了一些比较可爱的像这种恐龙图案,那像这个霸王龙就不是很凶狠。 那在书本上还有一些像恐龙知识小贴士,比如像恐龙大小对比,然后生活时间等等。通过一些简单创作就可以让例如将来你的孩子来阅读你用 ai 创作出来的书籍,你可以加入一些你想让他学习的知识,或者说想对他说的话,我觉得这是非常有意义的一件事情。 那接下来我们来聊一个生产力方向,编写代码的能力。常规的写代码我们从层级来分,可以分成项目构建、问题的修复,以及一些通用任务开发。 那也是正巧啊,我们最近在开发一个智能客服系统,就是可以通过控制鼠标和键盘自由的点击桌面上的一些电商平台来进行客服的回复。其中一个非常关键的问题就是得通过一个叫 ui automation 的 python 包读取多个窗口层级下的窗口名称。大概层级关系是这样的, 从逻辑上来讲还是比较复杂的。那我也是跟最新的 deepsea v 三点二做了一个简单的对比,双方在复杂逻辑的层面下都可以很好的完成指令并完成操作。 但在调用对象属性的时候, deepsea 会调用一个跟窗口名称没有关系的类目,然后导致无法读取窗口的框组名称。 而 minimax m 二则基本可以保持正确。整体的对话风格的话是偏详细的,通过一个代码问题输出的文本量大概是 deep sea 的 两倍左右。在我测试多轮对话中,我还发现了一个问题,在多轮对话中,虽然前面纠正过了 deep sea 的 调用方法,但在第四轮以后,他依然会忘记前面纠正过的内容, 从按照一个错误的代码进行输出。那这一点比较有可能是部分厂商为了节省成本,没有把前面对话的 token 重新作为一个输入端而导致的。 而 mini max 则在测试长文本内容的时候,我测试到第七轮的时候,依然可以正常进行前面内容的记忆。除此之外,我还尝试了代码环境的问题修复,在安装环境的时候,我们遇到了一个问题, 提示 touch 里边没有一个叫注册数节点的属性,那 mini max 给我们推荐了三种解决方法,分别是降级 non pad 版本、重新安装指定版本的 touch 或者 transform 等架构清理 pad 等。 并且经过我们的测试,这个是可以集成到 color 环境中的,只需要将 sdk 放到 openai 的 接口处,并将 uir 替换成 mini max 的 地址就可以直接使用了。 那综合考虑, mini max m 二的 a p i 价格仅为 cloud 的 百分之八,我更推荐一些企业端的用户,或者说是专业程序员来使用,会比较划算。那如果你对 a 境的比较感兴趣, 目前这两周 a 境的是限时免费,可以登录体验。好了,这就是本期全部内容,感谢你的收看。这边大杯鲜奶,我们下期再见!


中国 ai 领域又迎来重磅消息, mini max 公司刚刚发布了其旗舰编程模型 m 二点五。 这个号称全球首个原生为智能体场景设计的生产级模型一经发布就在资本市场掀起轩然大波。这家获得阿里巴巴和阿布扎比主权财富基金支持的 ai 新贵,在二月十二日发布 m 二点五后,股价在香港市场一度暴涨百分之二十四, 最终收盘仍保持百分之十四点六二的涨幅,公司市值逼近两千亿港元大关。技术层面, m 二点五延续了前代的高效架构,虽然参数规模更大,但仅使用一百亿激活参数, 实现了更低的内存占用和更快的推理速度,每秒一百个 token 的 吞吐量据称已经超越部分国际领先模型。这款专为全站编程开发设计的模型, 在 excel 处理研究、自动化和 ppt 创建等生产历场景中表现尤为突出。 mini max 官方更是大胆宣称, m 二点五的综合性能直接对标国际顶尖模型 cloud opus 四点六。值得注意的是, mini max 创始人严俊杰曾是商汤科技高管,这家成立仅两年的公司已在全球两百多个国家和地区积累了超过两亿用户。 今年一月,在香港轰动性的 i p o 中, mini max 募资六点一九亿美元,首日股价就翻了一倍多。在当前激烈的 ai 编程助手市场竞争中, mini max m 二系列凭借出色的编程基础测试表现和更具竞争力的价格,正在向国际巨头发起挑战。这次 m 二点五的发布,无疑为中国 ai 产业又添了一把火。