粉丝1.5万获赞7.4万

金华传奇姚盛宇这次真的立功了, gemini 一 夜杀进全球前七!谷歌刚刚放出 gemini samsung think 升级版,在 code forces 算法竞赛中打出三千四百五十五的高分,直接冲进人类前十。什么意思? 全球只有七个人能赢他?但真正可怕的不是分数,而是他的思考深度。这一带, deep think 强化的是多路径推理能力,面对复杂问题,他会同时展开多种假设路线,进行分层验证和一致性检查,而不是简单链式输出。这让他在 a r c a g i。 二上直接冲到百分之八十四点六, 几乎把这个公认最难的通用智能机准打到天花板,在人类最后考试 h l e 中裸跑百分之四十八点四。要知道,这类题目强调跨领域抽象推理,不是刷题型模型能搞定的。 更狠的是实战数学家让他审查高深论文,他找出人类同行评选都忽略的逻辑漏洞。工程演示中,他能把一张草图自动建模成可三 d 打印的结构文件, 在材料实验中还优化出超过一百微米薄膜的晶体生长方案。甚至在前端层面,他可以单文件生成完整 three js 场景,做光线追踪级物理模拟。这已经不是会写代码的 ai, 而是一个能建模、能验证、能优化的推理系统。 三个月时间,全领域刷爆 s o t a。 从两千七百分到三千四百五十五分,这不是升级,这是跃迁。问题来了,当 ai 已经能站到世界前十的算法水平,我们还要怎么重新定义顶级思考力?关注星智源,秒追 a s i。

全球几十亿人,只有七个程序员能赢得过 ai! 就 在刚刚,谷歌发布 gemini 三 deep sync 专用推理模式的重磅升级,成为当前地表最强推理大模型。而这一波王炸背后的推手,就是清华物理系的传奇大神姚舜宇。但先别急着对号入座,此姚舜宇非彼姚舜宇。 大家熟知的那个刚成为腾讯首席 ai 科学家的是姚顺宇,而谷歌的这位姚顺宇是前 frapack 的 大神,也是清华特等奖得主。看来姚顺宇这个发音自带学霸霸法,以后给孩子起名都有思路了吧。收回正题,这个模型到底有多强呢?在编程竞赛里, 他直接干到了三千四百五十五 l, 这分数啥概念呢?全球所有人类程序员中,只有七个人比他更强。在人类终极测试 nrcai 四点六和 gpt 五点二创下新纪录。 更牛的是, deepening 不 光会考试,他还能当教授,搞科研。比如一个数学家让他审一篇高深的数学论文,结果他竟然发现了一个连人类专家都没察觉的逻辑漏洞。杜克大学用它成功设计出一款尺寸超一百微米的薄膜,工艺 超过了以前所有的方法。更酷的是,他还能当你的神笔马良,你随便画个草图,比如一个笔记本支架,他就能立马帮你分析、建模,生成专业的三 d 打印文件。以前可能要好几天才能搞定的设计,现在分分钟搞定,这效率真的让人细思极恐啊!


朋友们太炸裂了!爽文男主啊,都不敢这么写!九五后,天才少年姚顺宇正式任职腾讯的首席 ai 科学家,同时接任大模型部的负责人和 ai infora 部 负责人。而这个刚毕业一年的学生,前段时间刚从 openai 离职,网传虽以年薪一亿入职腾讯,虽然腾讯辟谣了,但绝对是天文数字。 姚申宇高中斩获了全国信号赛的银牌,二零一五年以安徽省理科第三名,高考七百零四分进入清华姚班。本科毕业之后呢,进入普林斯顿深造,二零二四年获得计算机科学博士学位,同年八月加入 open i 担任研究员,是重磅产品 operate deep research 的 核心贡献者,为语言智能体方向的开启和发展砥定了重要基础。四位数框架让 ai 能解决复杂问题, react 成为全球构建语言智能体的主流方法。这波薪水和职级都是天花板 级,腾讯呢,不仅仅是打破了排资论辈,更是印证了这两句老话,自古英雄出少年,二十一世纪什么最贵人才?关注我,一分钟读懂 ai 未来!

你可能很难想象,腾讯刚刚认命的首席 ai 科学家只有二十七岁。今天中国 ai 圈最炸的一条消息,主角是九八年出生的姚顺宇,出任腾讯首席 ai 科学家。注意,不是专家顾问,不是首席研究员, 而是首席 ai 科学家,而且同时兼任大语言模型负责人和 ai 英菲尔负责人。换句话说,一个九八年出生的年轻人,直接站到了中国互联网巨头 ai 主线的正中央。很多人第一反应是,他谁啊?是不是又一个天才少年的故事?但我告诉你, 姚顺宇不是普通的学霸模板,他更像是 ai 时代的架构型人物。我们先从他的起点说起。合肥一中 n o y 银牌七百零四分,安徽高考理科第三进清华姚班。这套履历放在任何年代都是天选之子。但真正有意思的不是这些成绩, 而是他的气质。他在清华摇班,一边当联席会主席,一边联合创办了清华学生说唱社。你很少看到一个顶级算法生一边搞理论,一边搞 freestyle。 他 自己说过一句话,我特别喜欢。他说我不再像那种一直往一个点深挖的人,我更喜欢看很多乱七八糟的东西。 这句话后来几乎精准预言了他整个研究方向。很多人不知道,姚胜与大三之前几乎没有做过 ai。 他 原本学的是计算机视觉,后来去 mit 交换,接触到认知科学心理学,才第一次认真思考一个问题,语言能不能成为智能的核心主体。 于是博士阶段,他做了一个在当时并不主流的选择,从视觉转向语言和强化学习。这一步,在今天看来,几乎是踩中了整个大模型时代的主航道。真正让他在 ai 圈封神的,是一系列你可能没听过的名字, 四位数 t o t react c o a r a 简单翻译一下,他在干什么?别人关心模型会不会答题,他关心模型能不能自己想,自己试,自己改、自己干活。 一句话总结,他是最早那一批把大模型当智能体,而不是聊天工具的人。二零二四年博士刚毕业,他直接进了 open ai, 而且不是打杂, 是 operator、 deep research、 computer、 user agent 这些核心方向的贡献者。但真正让他在全球 ai 圈出圈的,是今年四月份的那篇文章 the second half ai 的 下半场。他说了一句非常狠,但现在越来越被验证的话, ai 的 主线正在从模型训练转向定义任务与评估体系。 反正人话就是模型越来越像水电煤,真正拉开差距的是你让 ai 干什么,以及你怎么判断它干的好还是不好。注意,这已经不是一个纯科学家的视角了,这是产品系统、商业视角。在一次访谈里,姚顺宇自己也说的很直白,以前我想的是能不能创造一个爱因斯坦, 后来我发现,人类的组织本身就是一个值得被智能重构的系统。然后他抛出一句话,如果能做一家基于 a 精神的万亿美元公司,是一件非常有意思的事。所以你今天再看这条新闻,它的意义不在于腾讯又挖了一个 open ai 的 人, 而在于一个九八年出生,深度参与定义 a 型的范式的人,开始进入中国大厂的核心决策层,意味着 ai 的 竞争正在从谁模型更大变成谁更等任务系统评估落地,也意味着下一代 ai 领军人物可能真的不是七零后、八零后, 而是这批九五后、零零后。姚少宇的转场不只是个人职业的下半场,而是整个 ai 时代从会说话转向会干活的下半场。我是硅谷没强,关注我,带你了解硅谷每天的最新动态。

一月十号,北京中关村搞了一场神仙局。清华主办的 h i n s 前年峰会,请来了中国大模型圈最能打的四位技术大神, 腾讯混元的姚顺宇,月字暗面的杨紫林,阿里的林俊阳,还有字谱的堂姐。这几位不是九零后天才,就是学术老炮,平时各忙各的,难得聚在一起,这事可好了,全部聚齐,那不为发布新产品,只为聊一件事情,咱们中国的 ai 下一步该怎么做? 那今天我们就来给大家扒一扒这场闭门会议都说了啥。首先问大家一个问题,你现在用的 ai, 像写文案、做 ppt、 查资料,你觉得是该由腾讯、阿里这种大厂来做,还是交由一堆创意团队去折腾呢? 腾讯的姚迅宇就直接表态了,咱们普通人用的 ai, 其实真的不需要太聪明,像我们平时用的豆包啊,通一千问,问个天气,写个周报就能搞定了。但是企业不一样,他们很怕 ai 说错话,比如合同漏了一个条款,那可能就是几百万的坑。所以企业愿意花更多的钱,也要用上最强的模型。 所以他说,做 c 端应用,还是模型公司自己最在行。像雀 g、 p、 t、 豆包、 geminis 这些自家模型团队一手调教的模型一升级,产品就立马跟着变。而那些第三方做的 ai 工具,例如像 minus 这些呢,他就想靠外部调用就能够把效果做大。干过大厂的 其实太难了,可是到了企业端呢?反过来,每一家行业要求都不一样,医院、工厂、银行他们都得定制专属的 ai。 所以 b 端呢,有可能会是大模型打底,小应用满天飞的局面。一句话总结就是 你我用的 ai 大 概率还是大厂包圆了,那企业用的那就是百花齐放,谁专业谁上。那接着就看粤字暗面的杨紫林,这哥们说话是有点硬核的, 但是核心就一句,现在训练的 ai 太烧钱,太费数据了,能不能省着点干更多的活呢? 比如他打了一个比喻, scaling log, 不是 拼的是谁的钱多,而是看谁能够把电变成智能的,效率更高。现在网上好的数据很快用完,那再去堆数据卷不划算怎么办?他抛出了两个杀手锏,第一个就是提高托肯的效率,说白了就是让模型学得更聪明, 花更少的算力,学会更多的东西。他们搞了一个叫 monon 的 新的优化器,比行业用的十年的 eden 快 一倍,意思就是说同样的智能水平,数据量只要一半。 第二就是搞上下文难题,你有没有遇过一种情况,就是 ai 聊着聊着就忘记了前面说什么,他们出了个 kimi 的 liner 新架构,就能让 ai 一 口气处理上百万字的长文本, 速度比以前快六到十倍,还更准。杨紫林说做模型,其实就是在建构一种世界观,每一个模型的输出的内容,就像不同的人写文章,他有性格,有风格,那未来 ai 拼的不是谁在榜单上面的分数更高,而是谁更有品位,更有个性,这才是真正的差距。那 阿里的林俊扬呢?他的看法跟姚俊宇差不多,模型公司自己做产品天然有优势,但是他们的重点是在未来。他讲了阿里同意的三个目标,第一就是搞真正的多模态,不光能够看图听声,还能够自己生成图片、音频、视频, 理解和输出一手抓。第二个呢,就是从答题机器变成自主代理,让 ai 自己能够定目标,拆解任务,试错、学习,像人一样主动干活。 第三就是让 ai 走进真实的世界,也就是具身智能,让它不只会聊天,还能够操控机器人任路搬东西。那 这个时候呢,智普的堂姐就站出来泼了一盆冷水了,大家别高兴太早,其实咱们跟美利国的差距还是没有缩小呢,为什么呢?人家的算力储备比我们高一大截,那做产品的同时还能留一堆算力来搞 前沿的研究,那咱们呢,很多算力都拿来做业务,真正用来闯出一条新路的太少了。他提出一个狠招,就是 可验证奖励的强化学习。比如做数学题, ai 自己做完能检查对错,不需要靠人来打分。他们现在的 g、 l m 四点七就是用这招,那模型在 数学编程上实现自我提升。但是更难的是,怎么让 ai 在 没有标准答案的事情上,他们自己也能够找到方向呢?比如说写小说,谈感情、做决策,这才是未来真正的考验。 这场会议啊,四位大佬没有去争谁强谁弱,谁对谁错,而是认真在思考一件事情,中国的 ai 到底缺了啥?未来拼的是啥?我们屡一屡哈。第一路线已经分家了,腾讯、阿里。模型就是产品 拼整合拼效率,越字暗面拼的就是智能效率,省着来用资源跑出更远。字谱拼的是自我进化,想打破现有的训练模型的天花板, 那第二就是中美的差距不在模型的大小,而是在效率和探索的自由。我们擅长改作业,但是我们真正新出题人的环境跟人还是不够的。那第三就是以后 ai 比的可能不是比谁分数高,而是谁更像人, 有思想,会做事情,能成更长远的打算。最后我们回到普通人,这些事情离你远吗?一点都不,每一次你用 ai 写东西、查资料,背后都是这些人炒出来、试出来、磨出来的结果。 中国的 ai 能不能走出自己的路,不能只看技术,更要看我们愿不愿意给那些不挣钱但是很重要的探索,多一点时间和耐心。 那这一场闭门会议,没有发布产品,没有刷榜单,但老实说,这才是真正拉开序幕的信号。 ai 大 战才刚开头,我们下期再见!

一点五万亿估值刚到手,三个顶尖科学家就说不干了?这事我越查越血压飙升。马斯克刚拿下人类历史上最有创新能力企业家的头衔,转头就给全世界上了一课,什么叫卸磨杀驴?得?原来所谓的创新秘诀不是尊重人才,是会整人。 事情是这样的,马斯克把 spacex 和 xiai 两家公司合并,一个发火箭,一个搞人工智能,两边整合到一起, 估值直接冲到一点五万亿美元,荣登全球独角兽榜首。听起来是不是挺美?结果呢?合并协议刚签完,三个顶级科学家转身就走了。其中有一个叫吴怀宇, x a i 的 核心成员,他给出了理由时,身体出了问题,得了莱姆病, 长期高强度工作引发的应激反应。这病他以前也得过,怎么以前不辞职,偏偏这时候辞职?我仔细查了一下背后的故事,更气人了。 原来并购之后,马斯克搞了一出人事变动,吴怀宇以前是独立负责人,自己说了算。现在呢?给他安排了一个上级,让他向另一个华人张国栋汇报工作。两个本来平起平坐的人,硬生生整出一个上下级关系好吗?这不是明摆的让你难受吗? 有人说吴怀宇现在走太可惜了,再撑一撑,等十倍 cx 上市,原始股能让他赚的盆满钵满,但说实话,像他这种级别的人,根本不缺钱。你们知道现在顶尖 ai 人才的薪酬价位吗?有的公司挖华人科学家,起步就是八千万美金, 有的开到两三亿,个别的十几亿都有。他们早就过了为钱工作的阶段,现在是为理想为兴趣在干活。 所以当你连最基本的尊重都给不了,人家凭什么陪你干下去?马斯克以前是怎么干的?还记得他收购推特吗? 四百亿美金买下来,转头一刀砍掉百分之九十的员工,一万多人直接缩减到不足一千人。他管这叫提高效率,效率是提高了,人心呢。现在网上有人帮他辩解,说这是必要的人事调整,不是内斗。 这话我听着就想笑,把原本独当一面的科学家硬安排到别人手下汇报工作,这叫调整,这叫整人。你以为这些科学家是什么?是可以随意拆装的螺丝钉吗? 最让我气的是,这些顶尖科学家里不少是华人,他们在美国拼命干活,给美国公司创造价值,结果呢?资本家一翻脸就让你卷铺盖走人。你以前的功劳不好意思,那是公司的,你以后的前途那是你自己的事。有人说马斯克是人类历史上最伟大的企业家, 我只能说他确实很会一件事,就是用最小的代价榨干人才的剩余价值。说到底,资本的逻辑从来没变过,当你有用的时候你是核心资产,当你爱事的时候你就是多余人员。一点五万亿的估值背后是无数个被牺牲的个体。 马斯克现在的确风光,但一个企业只会用并购加裁员的套路做大做强,根基是脆弱的。科学家不是零件,人才不是消耗品。今天能让吴怀宇走,明天就能让张国栋走,后天呢?还有谁愿意给一个随时翻脸的老板卖命?这不是情绪,这是规则。
