三个月啊,三代起见,千万从三点五到三点六,再到这两天阿里云峰会上刚发布的三点七 max, 这个迭代节奏啊,其他厂商是很少见的。二月份千万三点五刚出来的时候呢,百万 to cap 八毛钱,当时给我最大的感受呢,就是便宜还能打。后来三点六出来了,我接到了 hermes 框架里,跑了两周多做 ag 的 任务,明显感觉呢,模型在工具调用和上下文推理上呢,是更稳了。 现在三点七 max 来了多个第三方评测里,国产第一推理和 ag 的 能力上部分指标甚至超过了 cloud ops 四点六,但跑分呢,它只是一个维度,我更在意的是它实际干活的时候,差异到底体现在哪里。 我自己做了两个测试啊,第一个,我扔了一段很长的 promontory 给千万三点七和 cloud ops 四点六,让它们各自从零搓一个完整的二 d 的 物理引擎,碰撞重力,多个预设场景全塞进了一个 h t m 文件,不允许任何的外部依赖。 你们看啊,千万三点七的成本率呢,是很高的,但跟 opus 四点六呢,还是差这么一点。不过你要知道啊, opus 是 目前公认编程能力最强的模型之一, 千万三点七能打到这个程度呢,可以说是稳稳的站在第一梯队了。关注我的人都知道,我最近做了个工具,可以在可拉到桌面端里把底层的模型换成第三方呢。我第一时间呢,把千万三点七接进去,跑了一圈,发现它在工具调用上呢,有一个很明显的特点,同样的任务啊,千万三点七在执行的时候会主动调用 ask user question 的 工具, 多次确认问题参数,格式规范,选项覆盖呢,也很全面。看起来呢,是多了几轮交互,但反过来呢,总轮次是更少了,这样呢,就大大减少了后面的反攻。 官方这次定位呢,也很明确,叫全能的智能体的基座什么意思啊,不只是聊天聪明,是真的能长时间的独立干活。他们自己呢,也做了两个极端测试,同一个代码优化任务呢,给了多个顶级的模型去跑,有的跑到了三倍就停了,有的跑到了七倍。前面三点七呢,跑到了十倍,连续自主编程了三十五个小时, 开上 ai 去模拟经营一家创业公司,跑完一整年,招人,签合同,识别恶意客户,控制成本千万。三点七的营收呢,是上一代三点五的将近六倍。官方管这个叫做长城持续推力,也就是长时间干活,不掉链子, 还能越干越聪明。千万三点五出的时候呢,我就说过,性价比这条路呢,算是走通了,现在三点七出来,我觉得可以再加一句,阿里在 a 阵的这条路呢,也开始找到感觉了。至于能走多远呢,我还会继续更新。你们有在用千万的评论区聊聊你们的题感?
粉丝1.9万获赞25.0万

五月十九日阿里云官宣峰会将于五月二十日举行,通一千万官网晒出预热海报,透露重量级新朋友即将亮相。同日,千万三点七杠 max 杠 preview 与千万三点七杠 thinking 杠 preview 正式开园, 上下文窗口扩展至二十五万六千,代码能力超越 gpt 四点五。

今天,阿里发布全新一代千万旗舰模型千万三点七 max。 在 权威三方榜单中,千万三点七 max 表现与当前最强模型分数接近,位列国产模型第一。阿里云面向 agentech 时代全面升级。在模型层,千万三点七面向当下智能体,全新设计 核心能力持续突破,可胜任复杂编程、多智能体协助生产及办公自动化等任务。实战中,千万三点七 max 在 全新的硬件平台上,仅凭任务说明从零起步,自主工作三十五小时,实现了一个推理关键内核的自我进化,性能比官方版本提升十倍。 近三个月内,千万旗舰大模型已稳定迭代三个版本,不断抬高国产模型的性能上限。

阿里的千问三点七 max 这次彻底掀桌子了,直接把压力狠狠拍在了 cloud 和 gpt 的 脸上。别再比谁更会写诗了, 当一个 ai 能自己写代码,自己看报错,连续不断地跑任务,而且成本被压到了一个极度离谱的区间时,这就不再是技术秀,而是商业屠杀。 now performance wise the coin 3.7 max is performing strongly across multiple benchmarks like terminal bench 2.0 swayed bench which scores a 60 6 as well as many other agent and coding benchmarks you can see that there's massive gains and it is basically on par with models like opus 4.6 max kimi k 2.6 in certain cases even surpassing it and i personally believe that this is the best chinese model that is out there right now it also demonstrates exceptional strength on difficult reasoning evaluations alongside strong multi lingual capabilities, but what's wild is that alibaba is now genuinely entering conversations alongside proprietary giants like entropic, google and open ai because this is the closest quinn has been in the frontier race the quin 3.7 max now scores a 56.6 on the artificial intelligence index that is a 4.8 point boost in terms of overlapping the quin 3.6 max preview this is with major gains in scientific reasoning coding and agency capabilities if you want。 一 旦这条廉价高病发的路线跑通, 大模型之争将直接从谁达的更聪明变成谁能更便宜、更久更稳定的把活干完。大家好,我是进化中的阿晨,这期咱们不念枯燥的参数表, 直接把千问三点七 max 这次录出来的硬盘给你拆个干干净净。先把总判断放前面。千问三点七 max 根本就不是用来陪你聊天的,他盯上的是智能体这块大蛋糕。说人话就是,以后你不是向他问问题, 而是把一个复杂的项目直接扔给他。他就像一个不需要睡觉的赛博包工头,自己调用工具写代码调试改错,一条龙服务普通人。别被什么多智能体协助吓到,落到你我身上就是以后你想做个小工具,搭个内部系统,写套自动化流程, 再也不用求爷爷告奶奶找人排期了。先让 ai 把股价和出版跑出来,成本几乎忽略不计。你以我在夸张,真正让我倒吸一口凉气的 是他的耐力和身价。 plod opus 4.7 as well as gbt 5.5 on a real long horizon agile coding task where models had to iteratively improve a self training tetris spot across pen autonomous loops where quinn actually achieved the biggest improvement with a fifty six percent gain at the lowest cost, which was a dollar and thirty cents now this is massively outperforming opus 4.7 which had gotten a 28 percent gain, but it costed about twelve dollars and fifteen cents and gps 5.5 had incurred a seven percent gain, but was a lot cheaper at around two dollars and eighty five cents。 在 一个长周期的智能体编程任务里,让模型连续十轮去改进一个机器人。 天问三点七 max 拿到了百分之五十六的提升。花了多少钱?大概一点三零美元。对面摆着的是国外的神级模型 cloud opus。 四点七提升只有百分之二十八,却要烧掉你十二美元多 gbt, 五点五更是只有百分之七的提升。这叫什么?这叫性价比屠杀 未来。你想把 ai 接入公司的工作流,沉闷就是生死线。一个任务跑一百轮,一千轮模型再聪明,如果每跑一轮都在烧钱,普通团队早就破产了。而阿里打出的明牌就是,我能跑,我便宜,我还能连轴转。 官方实测,它可以支撑长达三十五个小时的自主执行,连续调用一千两百次工具不会干两步就失忆,也不会跑一半就开始胡说八道。当你睡觉的时候,这个几毛钱成本的数字员工还在疯狂帮你修 bug, 这就完了吗? 前端程序员可能要捏把汗了。不仅能超网页原型,他甚至能用代码给你手捏出一个带底部菜单、计算器、画图板,全能用的马克 o s 熟面系统。 他能把一堆散落的组建按照交互完美拼合在一起。更恐怖的是,他连物理逻辑都能啃下来。 to create a realistic aquarium, and this is something that tests how well the model is obviously in 3ds, but how it's able to manage the physics of all of the individual fishes, and you can see this is one of the better generations, i have seen the fins properly move for each of the different fishes, you can see the ui control with the panel yeah, the rendering system and real time optimization what's really cool? is if i am to enable the feeding mode, i can actually click on the different or the top of the water and you can see that there is food actually being dropped into the aquarium, and this is where the fishes all rise up to eat up the food that's a small little feature, but the fact that is able to actually pull that out and specifically able to evaluate how well, this long perform front end engineering task is able to incorporate things like spatial reasoning you have different visual elements and the quality is definitely nice to see and the fact that it's able to literally generate all this in a single prompt is nice to see。 你 看这个三 d 水族箱,它生成的不只是一个空壳子,当你点击水面头时,鱼群会自动上浮去抢。 他自己写出了鱼群的物理引擎和觅食逻辑,甚至顺手做出了时间速度和昼夜切换的控制面板。他在尝试理解真实世界的空间关系和交互反馈。当然,阿晨从不无脑吹,这玩意现在也有硬伤。 第一,他是沉瞎子,目前没有多模态能力,处理不了图片和视频。第二,审美有时候会翻车,做出来的网页可能土掉渣。第三,他极其依赖你的提示词,你给一句模糊的废话,他就糊弄你。你给细致的规则和交互逻辑,他就是顶级的工程助手。别拿他当神笔,马良 把它当成一个听话、便宜、能反复返工的苦力。总结一下,千问三点七, max 的 出现意味着帮我搭个 demo, 写个自动化脚本,这种活正在被彻底重新定价。下一阶段的模型战争,拼的不再是智商, 而是耐力、价格和执行稳定性。会聊天的 ai 当然有用,但真正能重构商业护城河的是这种便宜耐跑、能一轮能把任务死磕到底的 ai 工人。我是进化中的阿晨,抛弃劳动力思维去驾驭这群赛博牛马,咱们下期见!

open n e 内部通用模型刚刚自主解决了埃尔德时八十年未解的数学难题,这标志着 ai 从套公式进化到了真正的自主推理。 后面还有千问三点七登顶国产第一,以及腾讯最新的搜法翻译模型开源。 open n i 又在数学领域丢了核弹,他们的一个内部通用推理模型,自主搞定了埃尔德时提出的单位距离经典难题。 这个问题已经困扰了数学界八十年。最硬核的是,这模型不是数学专精版,而是通用模型,它给出了长达一百二十五页的推演, 连菲尔兹奖得主 timothy gowers 都承认,这是 ai 首次自主实现重大数学突破。负责该模型的 normal brown 已经放话要尽快发布,看来奥系列的真正完全体快要藏不住了。 国产模型梯队重新洗牌。在最新的 artificial analysis 全球榜单中,阿里 q w 三点七减 max 以五十六点六分的成绩超越了 kimi k 二点六和 deep sea v pro max, 正式问鼎国产第一,全球排名第五。目前它的性能已经极其接近 g p p 五点五和 cloud opus 四点七。 阿里云百炼也宣布即将上线该模型的 api, 开发者们可以准备好压测了,看看这波 max 更新在潮文本和复杂逻辑上到底有多稳。编程这件事正在变成对其直觉。 google 最近在推广所谓的 webcoding, 也就是利用 gemini ai studio 的 超长上下文, 直接通过对话和反馈来构建应用。有开发者实测,只需要把需求和简单的设计想法丢给 jemal, 几分钟内就能搓出一个完整的 android app。 这种模式下,你不需要写每一行代码,而是作为意图审核员去调整 web, 这对于原型开发和全站入门者来说,效率简直是降维打击。腾讯混元今天开源了 i p r 翻译模型,这波对端测设备非常友好,它包含一点八 b 到三十 b 三个尺寸, 其中七 b 和三十 b 版本在多项翻译任务上拿到了开源。搜他最亮眼的是一点八 b 小 模型,通过一点二五减比特极端量化体积压缩到了四四零 n b, 在主流手机芯片上就能跑。本地推理开发者如果要做离线翻译或者超低延迟的应用场景,这个嗨 m t 二绝对是目前的最优选之一。算理通账太疯狂了!最新消息显示, anthropic 每年要支付约一百五十亿美元 用于租用马斯克旗下的 x i i 数据中心算力克拉斯集群,这笔巨款几乎占了他们融资额的大头。 虽然 antropica 背后有亚马逊和谷歌撑腰,但为了维持 cloud opus 四点七的领先地位, 他们不得不向竞争对手买蒜利。只能说,在 agi 烧钱大战面前,没有永远的敌人,只有永远的 h 幺零零和 b 二零零。 aws 开发者看过来,阿玛松 bedrock agent 阔现在正式集成了 mcp model context protocol 服务器, 这意味着你可以更轻松地将 aws 的 各种 api 服务作为工具挂载给 agent。 同时,他们还推出了 agent core runtime, 只在通过更智能的上下文管理来突破传统上下文窗口的限制。对于在 aws 生态内构建复杂 agent 工作流的团队来说, 这套全家桶式的更新能省掉大量手写胶水代码的时间。最后看个 ai 改变科学的案例,北京大学与阿里达摩院的合作研究登上了 nature。 他 们利用自研 ai 模型处理了超过七 tb 的 开源卫星影像, 识别出全国三十一点九万处光伏设施和九点一六万台风机,绘制了首张全国尺度的高精度风光设施分布图。这不仅是地理信息学的突破,更为精准的双碳规划提供了上帝视角。谁说 ai 只能写代码?他现在正帮我们重新审视地球的能源格局。 以上就是今天 ai 圈的硬核资讯, open nine 的 数学突破可能预示着下一代推理模型已经成熟,而 qw 三点七的强势表现也让我们看到了国产模型的后劲。如果你觉得今天的分享有干货,别忘了点赞关注观众,老爷们,咱们明天见,拜拜!

old research 是 用一句话讲的,就是你给定 ai 一个目标,然后 ai 不 断地通过去做实验,看指标,做实验,看指标,然后这样不断地去迭代,最终找出一条最优的能够达到你的目标的路径。这么一个过程,实际上它是一个 meta optimization。 哈喽,大家好,我是老黄,最近研究 capathy 的 old research 项目特别的火, 他两周前上线,现在在 github 上已经有五万两千星了。很多人用 auto research 这个思路去做了很多疯狂的事情,比如说让 ai 去自动化的把一个千万三百九十七 b 的 模型不断地优化,量化,最后让它能够在本地的 macbook 上跑起来,并且能够达到五点五 tokens per second。 还有人呢,用 auto research 不 断地去让 ai 加速他的 gpu 的 核函数,使得他的训练效率现在比平时快了十倍。这些都是这两周内真实发生的事情。 但我发现还是有很多朋友不知道 auto research 这个框架它到底在做什么,以及说它在什么样的场合底下比较有用。那么今天我就可以做一期视频,把这个事情讲清楚。那么 auto research 是 用一句话讲的,就是你给定 ai 一个目标,然后 ai 不 断地通过去做实验,看指标,做实验,看指标,然后这样不断地去提 携带,最终找出一条最优的能够达到你的目标的路径。这么一个过程,实际上它是一个 meta optimization, 那 么它一整个循环的内部呢?长这个样子。首先在每次 older research loop 开始的时候呢,你会让 ai 去读取 so far 的 一个上下文,就是之前做哪些实验,呃,有哪些动作是成功的?有哪些动作是不成功的?接着呢,根据这个实验结果以及你想要 ai 优化的目标, ai 去 propose some changes 提出变更。比如说如果你要优化一个神经网络的话,那么它可能是把某些层挪到另一些层前面,或者它去优化您 betting 或者 tokenizer, 接着呢,它就 commit proposal, 并且开始 run 这整个流程。 我们就用 karpai 最原始的那个 repository 来讲一下 older research 到底怎么 work 的。 它是用 older research 来优化它的一个叫做 nanochat 的 模型,就是一个极简版的 g p t。 二,你会看到这整个项目的设定实际上是跟神经网络的训练有关的,那我们也是可以把它推广到其他不同的任务上面去,我们在讲的时候就会用它最原始的那个设定。 那么在 old research 开始的时候呢,你需要让 ai 读取你的呃,实验的上下文就是说 so far 你 到底做了什么事情,哪些东西 work, 哪些东西不 work, 哪些东西跑崩了,全部都记录在一个文档里面,让 ai 去读。 读完之后呢,根据你给定 ai 的 目标,那比如说如果你是神经网络训练的话,那你就是希望 ai 能够提高它在验证级 validation set 上面的表现,比如说降低 validation loss, 然后呢, ai 就 根据它刚才读取的上下文 propose 一个改变, 然后呢,它就把这个改变 come 了,然后开始训练神经网络,或者说如果你是做什么核函数的优化的话,那它就是改变并且开始跑实验。如果这个神经网络的训练,或者说这个实验崩了呢?首先尝试能不能把这个东西修复了, 如果能修复它呢?那么就继续跑,那如果不能修,也要把这个不能修复的事实给记录下来,那么就说明这个尝试它不是因为没有提升,而是因为一些其他原因而崩溃了。 如果它几次都修不好,就先让它过去,那如果这个实验没有跑崩了呢?你就可以看到一个结果,那么你就把这个结果给记录下来,记录到 resource 啊 t s v 里面。 在记录完结果之后,你就要去比较这个结果跟当前最优的结果,呃,比起来到底怎么样?如果它确实优化了我们想要的那个指标,比如说 validation 上面的 performance, ok, 那 么这就是一个好的优化。我们就把这次的改变保留下来,把它推到我们的主分支上 merge 进去。 但如果这一次的改变并没有给我们带来比现在更好的提升,那我们就把它记录下来,但我们不会把它保存进我们的主分支里面。 ok, 那 么进行完一整个流程之后,你就又回到让 ai 读上下文,然后提出变更,提交训练,然后这么一个 look 不 断循环下去, ok, 那 么这就是一个 auto research 循环。当你跑完了这么一个循环,那你就会进入下一个循环。这里面其实你可以看出一点,就是说任何能够有可量化指标的 流程,我们都可以用 auto research 去让 ai 帮我们找到,去提高,然后达到我们这个可量化指标的一个最优的路径。那这个东西取决于你到底有多少的时间和 tokens, 我 个人感觉它实际上是一个范式上的突破,虽然它看起来好像跟我们已有的一些框架非常相似, 但它厉害的地方在于就实际上生活中有很多任务是可量化的,并且它能够带来很多的经济价值。比如 说你的代码的速度是可量化,然后你的 p n l 是 可量化的,然后呢,你去做,不管是广告投放还是什么的,你的 r o i 都是可量化的,流量是可量化的,所以我觉得很快我们会看到 old research 在 各个领域开花结果。我目前发现最有意思的一种玩法呢,就是说你把一篇文章, 就是或者说 best practice 丢给 ai, 然后让 ai 根据这个文章的思路去用 older research 这个框架帮你完成一件事情,比如说帮你把千万三百九十七币,呃,不断地压缩优化,最后让它能够在你的本地机子上跑起来,并且五点五 tokens percent 这个事情就是 非常疯狂,但是现在已经有可能了。今天就跟大家分享到这里,下一集呢,我会跟大家分享一下我自己用 auto research 以来,觉得大家有什么优点,什么缺点,然后我自己呃对 auto research 的 一些调整,今天就这样,谢谢大家,拜拜。

哈喽,大家好,给大家看一下新的千万三点七 max 做出来的粒子效果,我们刷新一下页面,可以看到这个百万星系的粒子效果非常的好看,它可以直接做到一个漫游,各种各样的暂停放大, 还有加速减速,放大缩小都还是蛮不错的。我刚才试了一下,大概这样子的,一个百万星系的这样子一个粒子的效果, 他是只做了八百行左右的代码,思考的力度是好像是思考了五千多还是六千多个托肯最后面才去写的代码, 虽然这只是个小 demo, 但是可以看得出来千万三点七他现在在不管是 a 卷的能力,思考的强度,还有就是这种前端代码的编写上面确实是达到了一定的水平。 但是也值得注意的是,今天我们测的是一个短途的任务,在这种长城的比如说跨三四个小时的任务下面他的这个表现我们目前还没有测,等到后续可以给大家更多的一些测试,再给大家这个模型能不能用的一些反馈,谢谢大家。

在这个时代,阿里云全站就绪。阿里云今天是中国唯一的完整打通五层全站的云厂商和 ai 厂商, 我们也希望致力于为 agtech 时代的工作赋能而持续升级优化。这五 ai 芯片将在 a 零提供千万的模型服务。我想这个结果正是通云哥在模型云芯片层面深度协同的一个体现。 我认为我们站在了一个非常重要的历史节点,第一个是构建编排,支持 a 阵的开发和应用。第二个是让 a 阵能够像人一样去使用丰富的云的产品。阿里云就是最 a 阵化的一朵云,让我们的 token 能够产生智能,然后这些智能能够驱动 action。 那今天呢?我们应该重磅地发布千万模型,三点七,全面地升级地进行原生的 agenigmatic 能力,包括工具掉落共,包括我们的 coding, 包括我们的 long horizon, 包括我们的 harnessed 等等。 我们的目标是打造一个 agent 时代的推理服务。百炼的定位在今天已经不止只是一个模型 api 的 服务平台,它是 agent 的 推理服务平台,把这些底层的能力封装成企业可以直接使用的关键的能力。 成千上百成亿的 agent, 能用好 ai, 用好模型、用好云呢?答案就是全新的千万云官网。它是一个为 agent 而生的全新服务方式, 代表着我们面向未来的服务主张,正是能够为自主执行、自主决策的 agent 提供服务。

别划走,这几条 ai 资讯可能就是你下一个副业!第一条,国产大模型终于在全球顶级竞技场站稳脚跟!阿里突然甩出 qm 三点七预览版,完本领域全球第十三,世界领域全球第十六,双料国产第一, pina 榜单前十五里唯一的中国模型!阿里这次真的藏不住了,赶紧开源,让我们用第三条 ai 智能体 a 正值阵势,进入使用阶段,能自主完成多步骤编制任务,程序员效率将大幅提升。谷歌 jammy 三点五 plus 来了! 专攻智能体和编程,能独立完成复杂长周期任务。 pro 版下月发布,这是要抢程序员饭碗啊!第三条,医疗 ai 重大突破!医疗 ai 从黑箱诊断升级为透明推理,上交和瑞金医院发布 cxmind 的 胸片诊断不再只给答案,而是给出完整推理链,七十万张影像验证,五项维度全部第一! ai 真正能进临床核心工作流了,医生终于敢用了!关注我,明天继续笑看 ai 圈每日科技简报,让你笑这涨知识!

今天是五月二十一日,周四,欢迎收看 ai 日报。屏幕上是今天的主要内容,下面请看详细报道。 第一条 open day 推理模型自主推翻近八十年几何猜想 open day 正式宣布,其内部通用推理模型自主推翻了由埃尔德时在一九四六年提出的离散几何核心猜想。 过去近八十年间,学界一直认为正方形网格构造是最优解,但新模型发现了一类表现更优的新结构。 这项成果已经通过外部数学家的严格审查与验证,被视为人工智能在科学探索领域的重大突破。第二条千问正式发布 quan 三点七杠 max 面向智能体时代 千问团队正式发布新一代旗舰模型 clean 三点七杠 max, 该模型专为智能体时代设计,重点强化了编程开发、办公自动化以及长周期任务的自主执行能力。 官方测试显示,其在多项高难度推理与 agent 评测中表现领先,预计近期将通过阿里云百炼 api 向开发者全面开放调用。 第三条 deepsea 组建专项团队研发编程智能体 deepsea 正在北京组建一支全新的工程团队,代号 h a r n e s s, 专门负责从零开发自家的编程智能体 deepsea code, 该项目将直接竞争 cloud code、 codex 和 cursor 等主流工具,招聘要求明确指向精通智能体循环上下文工程及 m c p 协议的核心人才,显示出 deepseek 在 垂直代码场景加速落地的决心。 第四条媒体报的 openai 拟于九月提交 ipo 申请,多家媒体透露 openai 正在紧锣密鼓的推进上市计划,公司目前已聘请高盛和摩根士单类作为投行顾问,并可能在几天到几周内秘密向监管机构递交招股文件, 市场普遍关注其估值走向,若顺利推进,今年九月或将成为这家全球头部 ai 企业正式登陆资本市场的关键节点。 第五条,阿里云发布真五 m 八百九十芯片与盘九超节点服务器阿里云在峰会上发布了基于自研真五 m 八百九十芯片的盘九 a l 一 二八超节点服务器, 该硬件采用自研互联架构,可将一百二十八张 ai 芯片组成一台计算机,主打满足智能体场景下的高病发推理与大模型系列需求。 同时,平台层也完成了向智能体云的重构,提供沙箱执行与多智能体协调能力。本节目内容均整理自公开报道,具体进展请以官方信息为准。

阿里云峰会再放大招,一口气亮出了两大核心王牌,分别是全新的真五 m 八九零 ai 芯片,以及重磅升级的千问旗舰模型 q n 三点七 max, ai 基础设施的布局直接拉满。首先我们来看硬件芯片端, 随着真五 m 八九零 ai 芯片正式亮相,阿里云现在真正实现了完整闭环,拥有了从自研 ai 芯片到云端算力服务的全链路垂直整合能力。这也就意味着,接下来阿里可以直接给企业客户提供一套从底层硬件到上层云服务的一体化 ai 解决方案。 除此之外,还有一个关键信号,平头哥后续有独立 ipo 的 规划。这一步其实非常关键,不只是品牌和资本的升级,更能彻底放开平头哥的商业化潜力,让他的芯片服务不再局限于阿里内部生态, 未来可以服务全行业、全市场的企业客户,也给阿里的未来带来了更大的想象空间。再说说软件模型层面,这次上线的千问旗舰 q 三点七 max, 可以 说是精准踩中了当下企业 ai 落地的所有痛点。 它核心主打三大能力,超长距离的自主任务执行、多框架全面兼容,还有企业级工作流自动化。 这几个核心场景刚好就是目前各行各业企业落地 ai 最刚需、最主流的方向,也完美匹配了阿里云深耕正企中小企的客户结构,实用性和落地性都非常强,不是空有参数的纸面升级。最后再提一个长期战略重点, 大家应该还记得阿里去年官宣的三年三千八百亿重磅投资计划,现在回看,这笔巨额投入并不是口头口号,正在一步步扎实落地。 从新一代 ai 芯片迭代、千万大模型持续升级,再到全新服务器系统的陆续发布,所有动作都指向一件事, 阿里云已经把 ai 基础设施定为了未来中长期增长的核心引擎,全力压住国产 ai 底层算力与模型的自主发展。聊完技术和战略,我们再看资本市场怎么给阿里打分。最近三个月,阿里港股和美股整体是震荡回调的状态,大概跌了百分之十左右。 主要原因很简单,市场在消化巨额 ai 投入带来的短期利润压力,去年全年净利润下滑近百分之二十,自由现金流也转负了。 说白了,阿里现在是牺牲短期利润硬砸 ai 未来。但有意思的是,一到关键节点,资金立刻用脚投票。上周财报刚批露 ai 收入 a 二二已经八十亿,年底要冲三百亿,美股当天直接大涨百分之八。 这次峰会发布真五 m 八九零和 qwn 三点七 max 之后,港股盘中也是快速拉升,成交量放大。明显能看出来,市场对阿里芯片加云加模型全站 ai 路线其实是非常买账的, 目前机构态度也很一致,九成以上都是强力推荐买入。大家的共识是,短期看阿里还是投入期波动期,但中长期三到五年,它已经从电商公司彻底变成一家 ai 基础设施公司, 真武芯片加千问旗舰加平头哥独立 ipo 预期就是它未来估值重估的三架马车。 一句话总结,短期股价有震痛,长期估值看 ai, 现在的阿里不是在烧钱,而是在买一张国产 ai 时代的头等舱机票,以像素之威洞察科技财富风向。 觉得干货实在,点个关注,带你看透各行各业背后的财富底层逻辑,咱们下期再见!

各位粉丝朋友们,我是闪电,今天 ai 圈炸锅了,就在刚刚结束的阿里云峰会上,阿里正式发布了新一代旗舰大模型 q n 三 gigmas, 直接登顶国产大模型第一,性能已经追平 g p t 十二的全球最强版本。这件事对 a 股的影响比你想象的要深远的多。先给大家用大白话讲清楚,这次突破到底牛在哪。以前的大模型说白了就是会聊天,你问他答, 但这次的 q n 三点七 max 不 一样,它是专门为智能体时代设计的全能机座最震撼的一个案例,它在完全没有人类根愈的情况下,自主工作了三十五小时,调用了一千一百五十八次工具,从零开始,给一个全新的芯片写了个计算内核,最后还把性能优化了十倍。这意味着什么? 意味着大模型正式从会说话进化到了会做事以后,他能直接帮你写代码、做报表、跑流程,甚至独立完成复杂的工程项目,这才是 ai 真正能创造价值的地方。 那这件事对 a 股有什么影响?核心机会集中在三大板块,我给大家梳理的明明白白。第一梯队,确定性最强的算力基建商大模型,每升级一次,算力需求就指数级暴涨。阿丽已经说了,未来五年 ai 相关资本开支可能远超三千八百亿, 最受益的就是数据港,阿里收入占比超百分之九十,刚签了一百六十亿的十年订单。还有浪潮信息给阿里云供了百分之七十以上的 ai 服务器支撑,千问百分之九十的训练任务, 光模块的中继续创,天服通信也会跟着受益。第二梯队,弹性最大的千问生态合作伙伴 q 问,三点七的智能体能力要落地,必须和行业场景结合, 像金融 it 的 恒生电子电商、萨斯的光云科技、智慧交通的千方科技、九旅信息化的时机信息,这些和阿里深度绑定的公司会最先拿到商业化的订单。 第三梯队,整个国产大模型产业链的景气度都会被带起来。阿里跑这么快,百度字节,腾讯肯定会跟着加大研发和算力投入, 整个 ai 板块的逻辑会被重新强化。最后必须给大家泼一盆冷水。这个消息其实已经提前发酵了,很多概念股最近都涨了不少,小心有资金借力好出货。而且智能体技术还在早期, 大规模商业化还需要时间,短期别追高那些纯概念炒作的小票。总的来说,这次发布是国产大模型进入智能体时代的里程碑,长期看好那些真正有核心技术深度绑定阿里生态的龙头企业。想第一时间获取最新的 ai 投资机会,记得点赞关注,咱们下期接着拆解。

家人们,近期 ai 圈迎来了重磅的消息,阿里云正式的官宣,发布了通一千万的全新的旗舰大模型, 这款模型呢,经过全面的深度优化,在全球的权威盲测的榜单中拿下了国产模型的第一名,在逻辑推理、代码编辑、长文本的处理上都实现了质的飞跃。同时呢,他突破了技术的壁垒,可独立完成数十个小时的超长复杂的智能体的任务, 还搭建起了一站式的 ai 模型服务平台,汇聚了数百款的主流模型。此次升级呢,标志着国产通用大模型啊,正式迈入了高阶的智能体时代,大幅的缩小了与国际顶尖模型的技术差距。 你认为这款国产顶尖的大模型是否真正能够比肩海外的顶级 ai 呢?评论区说说你的看法。好了,今天的视频分享就到这里了,我们明天见喽!

哎呀,昨天五月二十号,阿里悄悄放了个大招,推出了新一代的千万旗舰模型,叫 q w n 三点七简 max。 这名字听着有点绕,但说白了就是咱们国产的大模型又升级了。 最近有个盲测,就是不告诉你哪个是哪个,让大家凭本事比结果他排第一。 更厉害的是,推理速度快了整整十倍,还能自己连续干三十五个小时的复杂活。最关键的是,它还能自我进化,就像人一样,越用越聪明。可能不少中老年朋友一听 ai 大 模型这些词, 就觉得离咱挺远,是年轻人玩的东西。其实啊,真不是这么回事。 回想咱们年轻那会儿,家里刚有黑白电视的时候,谁想过几十年后连冰箱都能联网,电饭煲都能,手机控制技术这东西就是一点一点往前走的, 今天觉得新鲜,明天就成家常便饭了。现在这个 ai 进步,看着是在实验室里跑数据, 实际上跟咱们的生活早就挂钩了。比如孩子们上班忙, ai 能帮他们写材料、做方案,效率高了,压力就小了, 回家陪咱的时间自然也多了,再往后,咱们自己也能用上。想查个高血压该注意啥,不用翻半天书,直接问就行。想跟孙子视频动动嘴就能拨通。 将来智能养老设备普及了,跌倒自动报警、吃药准时提醒,这些都不是梦。所以说啊,对新技术,咱们别一听就摇头,更别一上来就怕不用非得搞懂他咋工作的,但可以试着了解他能干啥。 支持国产科技,不是喊口号,而是给自家孩子,给咱们自己的未来多留一条方便路, 国家科技强了,最终受益的还是咱老百姓,日子越过越省心,生活越来越安稳,这才是科技该有的样子。感谢收看天风说,欢迎在评论区留下您的看法,记得关注,不迷路,下期再见!

阿里发布新一代千问旗舰模型,先别急着站队,先看这波变化会改什么,先判断会不会改到你的选择。阿里发千问 quan、 三点七 max 分 别夺得国内文本与视觉双向第一。 近三个月内,千问旗舰大模型已稳定迭代了三点五、三点六、三点七三个版本,研发周期大幅缩短,模型面向智能体设计、 实现编程推理等核心能力突破,能自主干三十五小时活,提速十倍上阿里云百列调用千万三点七 a p i 实测你的长城自动化。如果这周就要选编,你会站立刻跟还是继续等?

五月二十,阿里巴巴发布全新一代千万旗舰模型 quan 三点七 max。 在 三方机构 arena 全球大模型盲测总榜中, quan 三点七 max 超过 kimi k 二点六、 deep seek v 四 pro g l m 五点一与 g p t cloud gemini 最强模型接近,位列国产模型第一。美经记者现场了解到,千问三点七面向当下智能体 agent 全新设计,实现了编程、推理等核心能力的持续突破, 甚至可全自主完成三十五小时的超长城智能体复杂任务。在一个全新的芯片平台上, quan 三点七 max 通过自主编程和超一千次工具调用,实现了一个关键内核的自我进化,推理速度较原版本提升十倍。 在二零二六阿里云峰会现场,阿里云宣布面向新兴模型推理技术体系。 据了解, quan 三点七 max 模型 api 即将上线阿里云百炼。同时,千问三点七系列还将推出 quan 三点七 plus 等不同版本,模型 拥有极强的多模态推理视觉理解能力,实现从编程智能体到视觉智能体的全覆盖,为下一代 ai 提供全能智能体新基作。