粉丝525获赞352



这绝对是我今年听过最让人后背发凉的一句话。 brett edcock 说,他们刚刚把过去几年积累的价值连城的十万行 c 加加控制代码全部删了。 如果你是程序员,你现在可能已经开始手抖了,但这恰恰就是人形机器人领域正在发生的核聚变。今天我们要聊的主角是目前硅谷人形机器人赛道最狂野的独角兽, figure ai 的 创始人 brett edcock。 这家伙是个传奇,先是做了一家招聘网站,卖了几个亿,转头就去造电动飞机 archer aviation 并成功上市,现在又一头扎进了人形机器人这个深坑。在 peter dimes 的 这期访谈里, brett 抛出的信息量大到甚至有点反商业常识。如果你想看懂未来五年的硬科技趋势,这期视频你必须看到。最后, 我们先从那消失的十万行代码说起。这不仅仅是一个技术选择,更是一场关乎几十亿美金的好赌。在传统的机器人开发逻辑里,你想让机器人倒咖啡,你需要写代码,告诉他手抬高三十厘米,向前移动二十厘米,手指收缩力度是多少。 这种基于规则的 c 加加代码, fager 之前写了几十万行,它们很精准,但也极其脆弱。只要咖啡杯的位置稍微偏了一厘米或者光线暗了一点,这一堆代码就可能直接报错,机器人就傻在那了。 brett 在 访谈里透露,他们做了一个极其激进的决定,山库他们发布了全新的 helix 二模型,这是一个纯粹的端到端的神经网络系统。什么叫端到端? 就是输入是摄像头看到的像素输出,直接就是电机需要的扭曲,中间没有人类写的规则,没有如果 a 发生,就执行 b 的 逻辑判断,全靠 ai 自己悟。 这背后的商业逻辑其实非常反人性。因为对于一家创业公司来说,那些 c 加加代码是你的资产,是你花了无数工程师的工资堆出来的, 删掉他们等于承认过去的资产归零。但 brett 的 判断是基于代码的机器人是死路一条。为什么?因为真实世界的复杂度是无穷的,你不可能穷尽所有的规则,只有让神经网络像人类一样,通过海量数据去学习物理世界的规律,才有可能实现真正的通用。 这就引出了他们最新的硬件产品, figure 零三。很多人看机器人发布会,只看他长得帅不帅,动作灵不灵活。但在 brett 眼里, figure 零三的设计哲学变了。 以前是先造个机器人,再想办法往里塞 ai, 现在是反过来,因为 helex 二这个神经网络模型需要特定的数据输入,所以他们是为了这个 ai 模型重新设计了一具躯体。 这导致了几个巨大的变化。首先是成本,飞格零三的制造成本相比上一代直接砍掉了百分之九十。你能想象吗?在硬件领域实现摩尔定律级别的降本,他们去掉了昂贵的液压,去掉了复杂的转动,改用自己研发的电机和执行器。其次是软化, 为了让 ai 更好的感知世界,他们在手指上装了触觉传感器,甚至在手掌心里装了摄像头。这听起来很诡异,为什么要手掌长眼睛?因为当机器人去抓取一个物体时,那个物体会被手挡住,头顶的摄像头看不见,这时候手心的眼睛就是唯一的感知来源。这种设计完全是服务于数据采集的。 讲到这里,你可能觉得不可思议,但更疯狂的还在后面,他甚至打破了我们对常识的认知。 brett 在 访谈里漫不经心地透露了一个重磅炸弹,他悄悄成立了一个新的 ai 实验室,叫 hark。 这事太有意思了, figure 既然已经有了那么多 ai 专家,为什么还要单开一个实验室? brett 的 解释直接戳穿了现在大模型行业的泡沫。他说,现在的 l、 l m, 比如 g、 p、 t 四虽然很强,但它们本质上是语言模型。它们懂莎士比亚,懂写代码,但它们不懂物理世界。 你让 g p t 四指挥机器人走出门,它可能会指挥机器人直直地撞向一堵透明的玻璃墙,因为在文本数据里,它学不到玻璃是透明但坚硬的。这个物理常识, hark 的 任务就是搞定这种物理推理。 brett 举了个例子,他们让 hark 的 ai 从零开始设计一个怪兽卡车的 cad 模型。 ai 不 仅要理解卡车这个词,还要理解结构力学,理解怎么操作 cad 软件。这不仅是让机器人动起来,这是要让机器人拥有工程师的思维。 bret 的 野心不仅仅是造一个听话的保姆,他是想造一个能理解物理世界,甚至能自我设计的硅基物种。这直接导向了 bret 那 个最让人兴奋也最让人恐惧的终极判断。机器人制造机器人。 他在访谈里提到, faker 的 工厂正在部署自己的机器人去生产下一代机器人,这不仅是省人工费的问题,这是一个指数级增长的飞轮。如果你能用机器人二十四小时不停歇地生产同类产能,将不再受限于人类工人的招聘速度和培训周期。 brett 预测到两千零二十六年,也就是明年, 我们就可能看到 figure 的 机器人进入家庭进行 alpha 测试。虽然他很谨慎地说,要等到他敢把自己的新生儿交给机器人抱的时候,产品才算真正成熟,但这个时间点比所有人预期的都要快。 这里还有一个非常有意思的数据对比,很多人担心机器人太贵买不起。 brett 说,当产量上来后,一个机器人的成本可能只需要二万美元。 想想看,二万美元买断一个能工作十年,每天二十四小时待命的劳动力,如果你是租用,可能每天的成本只有十美元,这比任何国家任何职位的最低工资都要低的多,这带来的经济冲击是核弹级的。 当然, brett 也非常坦诚的聊到了竞争,他直言不讳的说, figure 在 全球范围内唯一的对手就是中国,他去过中国,感受过那种创业孵化器一样的氛围,那种所有人都在拼命赢的状态。 但他认为 figure 的 优势在于垂直整合,因为他们自己做电机,自己做零巧手,自己训练模型,这种端到端的控制力让他们能比依赖供应链的对手跑得更快,这其实也是特斯拉当年的逻辑。 最后,我想聊聊 brett 的 那个科幻梦想,他说他在 speedrun star trek, 也就是在加速实现星际迷航里的未来。他想象的未来不是我们每天苦哈哈的干活,而是机器人帮我们搞定一切物质生产,人类去探索星辰大海。 这听起来很鸡汤,但当你看到飞哥的工厂里那些没有生命的金属手臂正在组装他们同类的头颅时,你会意识到这不仅仅是梦想,这是正在发生的工业革命。 关注我,拆解更多优质 ai 播客访谈内容。如果这个视频对你有启发的话,也强烈推荐您去看播客原片。

在拉斯维加斯 c e s。 现场,那个膝盖高度、步态蹒跚的小机器人,用一种幼崽般的志气俘获了所有人的好感。你以为英伟达终于收起锋芒,开始做温情科技了?真相往往藏在感性的反面,这种可爱其实是最高明的认知设计,它通过消除攻击性 让你放下警惕,因为真正巨变的不是他的身体,而是他理解世界的方式。这小家伙站上舞台前,并没有经历漫长的现实试错,那个被称为 g r zero t 的 ai 大 脑,已经在英伟达的数字世界 universe 里独自演练了无数次。当你惊叹他的灵感和犹豫,他其实早已通过超级算力,看透了成千上万种可能失败的路径。人类靠肉身试错, 而他靠算力预演未来。老黄真正在做的是重构全球工业的权力,他的野心早已不是卖芯片,而是要成为所有机器人的灵魂供应商。这具摇摆的金属骨架只是如饼庞大算力母体下的一根触须。 未来的造物者们,无论你是造汽车的,还是搞重工的,都将面临同一个现实。你们负责编织糗,而英伟达负责定义灵魂。这不只是一次产品迭代,而是一场生存底座的交接。 旧时代,我们靠汗水和经验换取真理。新纪元系统用预演的算力终结所有不确定。当机器学会了在落脚前就看清前路, 竞争的终点就不再是勤奋,而是你是否接入了那套最强大的系统。我们不必恐惧,工具变强不是为了取代人,而是让人终于能从枯燥的机械计算中解脱出来。 物理人工智能的引擎已经点火,你不一定要坐在驾驶位,但至少要看清它正在驶向哪里。

我想看一下。来来来,大家一起看。 系统是人工系统,开始 ai 技术的快速发展与军用机器人的大量出现,正在深刻改变着未来战争的形态。根据相关报, 这太厉害了哦,但是回到台湾呢?好像回到另外一边的世界。

要说今年春晚最惊艳的还是机器人表演,从去年的转手卷升级到了练武术,旋风腿和空翻可以说是一气呵成,完美又稳定。 听说有四家机器人公司参与了演练,这技术不得不服,真真切切让咱们看到了国家机器人的发展速度,仅仅只用了一年的时间,不敢想象再过一年,咱们国家的机器人会发展成什么样子。有网友问,这么厉害的机器人能不能上战场? 我觉得照这样的发展速度肯定能,但不是耍铁拳铁腿近距离搏击,而是要像战士一样拿着武器去战斗。 有权威人士说,他能够精准完成各种复杂的动作,将来战场作战能够大显身威。万网都在说咱们的科技,春晚正通过机器人展示中国创新、中国创造 国。话说回来,即便是要上战场,战场上不需要春晚这些花里胡哨的动作,实战要的是奔跑速度快,有耐力,还能够抗干扰、抗打击。 从春晚舞台的精彩武术动作到未来战场的实战需求,国产机器人的每一步突破都在告诉我们, 中国的机器人技术正从经验表演走向多元应用,从试验时的不可思议变成咱们生活和国防里触手可及的硬核市场。这速度,这实力,值得咱们狠狠点赞!

openai 的 路线可能是错的,各位,这句话不是我说的,而是两千零二十五年硅谷机器人赛道最诡异的一个信号。 当所有人都在为叉 gpt 的 能力欢呼时,机器人领域却正在经历一场静悄悄的崩盘与重生。你以为马斯克的擎天柱机器人马上就要进场打螺丝了, 但现实是,他们被迫停产重造,这背后藏着一个百分之九十九的人都忽略的致命细节,而这个细节可能决定了未来五万亿市场的归属。 这期视频的含金量极高,我们不仅复盘了整个两千零二十五年硅谷机器人圈的混战,更重要的是我们拿到了硅谷最前沿创业公司的一手内幕。如果你想看懂未来十年的硬科技趋势,这期内容绝对值得你反复观看。 今天我们要聊的主角不仅有特斯拉、英伟达这些巨头,还有一家在硅谷抑菌突起的华人公司 dino robotics。 他们的创始人不仅把上一家公司卖了几个亿,更是低卖的出来的顶级科学家。为什么我要特意提他们?因为他们正在做的事情,狠狠的打了大模型万能论一记耳光, 好让我们把时间轴拉回,从最底层的问题开始拆解。各位,你们有没有想过一个问题,为什么两千零二十五年突然成了所谓的基础模型元年?这事其实特别反常, 按理说 chad 的 gpt 两千零二十二年就火了,为什么给机器人装个脑子要花整整三年?要回答这个问题,我们得先扒一扒机器人的黑历史。不夸张的说,过去六十年,人类在机器人这件事上,基本就是在盲人摸象。 最开始是一千九百六十一年,那时候的机器人就是个瞎子。在通用汽车的工厂里,那个叫 unit 的 大家伙,他的工作逻辑简单粗暴,向左移三十厘米抓,向右移五十厘米放,只要零件偏了一厘米,他就抓瞎了。 这种死记硬背的编程逻辑,统治了工业界几十年。到了九十年代,科学家们觉得不行,得让机器人看见。于是有了 slam 技术,也就是扫地机器人的老祖宗, 它能扫描房间,建个地图,然后规划路径。听起来很美,对吧?但最觉得来了这种技术,在干活这件事上简直就是灾难。举个最简单的例子,叠毛巾这事,对你来说可能连脑子都不用动,但对机器人来说,这堪比登天。 传统的做法是先算出毛巾四个角的三 d 坐标,然后规划手臂怎么动。但问题是,毛巾是软的,你手一碰它就变形了, 坐标全乱套了两千零一十年,伯克利的一帮天才试图用这种方法教机器人叠毛巾,结果呢,叠 一条毛巾平均耗时二十四分钟。这就是所谓的前大模型时代的尴尬。后来大家又试了模仿学习,就是让人带着机器人手把手教,但这效率低的发纸,你教他抓杯子,他学会了,换个碗他又废了。再后来是强化学习,让机器人自己试错,就像 alpha go 下围棋一样, 但围棋可以在电脑里下一亿盘,现实里的机器人要是试错一亿次,那光是修机器人的钱就能把公司赔光。直到两千零二十五年,这一年发生的三件事,彻底改变了游戏规则。 第一,大语言模型终于够用了,他不再只是会聊天,他懂了常识,他知道鸡蛋是脆的,要轻拿,知道叠衣服要先折袖子。第二,算力便宜了,以前租几千张 h 一 百显卡那是天价。 现在随着英伟达产能释放和云厂商价格战,创业公司也能烧得起钱了。第三,也是最容易被忽视的一点,硬件供应链熟透了。 这得感谢两千零二十四年,那一波人形机器人的泡沫,把电机减速器的价格在大洋彼岸的中国打成了白菜价。这三股力量汇聚在一起,催生了一个新物种, v l a 模型,也就是视觉语言动作模型。这东西有多恐怖?他把看、想和动这三件事塞进了一个神经网络里。 你跟他说把桌上的苹果放进篮子,他不需要再去算什么坐标,他直接通过摄像头看到苹果大脑里的大模型,告诉他这是苹果,然后直接输出指令给机械臂,这就是所谓的端到端。 但是最吊鬼的事情发生了,有了这么强的脑子,为什么特斯拉的 optimus 还在跌跌撞撞?这里就要提到那个让无数投资人夜不能寐的概念,具身鸿沟。 特斯拉的逻辑是典型的大力出奇迹。马斯克觉得我有几百万辆车在路上跑,我有全世界最强的 fsd 自动驾驶数据。我把这套逻辑搬到机器人身上不就完了吗? 他甚至想用人类在 youtube 上的视频来训练机器人,但他忽略了一个致命的问题,人手和机械手根本就不是一种东西,你在视频里看到一个人行云流水的切菜,那个手部肌肉的微操力度的反馈是摄像头拍不出来的。机器人看了这种视频,就像你看迈克尔乔丹打球一样,脑子觉得学会了手,说,你在逗我? 这就是巨深红沟,数据再多,跨不过这个红沟,全是噪音。所以我们看到两千零二十五年初,马斯克还信誓旦旦说要量产五千台,结果年终就停产重设计。甚至在最新的演示里, optimus 依然被质疑是有人在远程遥控,这不仅是技术的尴尬,更是路线的危机。 这时候,另一派玩家登场了, figure ai。 这家公司简直是资本市场的宠儿,估值一年翻了十五倍。他们原本是 open ai 的 亲密战友,直接把 gpt 四接入机器人,那个演示视频你们可能都看过,机器人能听懂人话,还能给你递苹果,简直神了。 但就在两千零二十五年二月,最戏剧性的一幕发生了, figure ai 突然宣布和 open ai 分 手,要自己搞大模型。为什么? 因为他们发现,单纯靠语言大模型是控制不了身体的,大脑再聪明,小脑不协调,走两步还得摔。于是他们搞出了一个 helex 模型,用了系统一加系统二的架构。简单说,系统二负责思考我要干什么,像大脑皮层,系统一负责控制肌肉,怎么干像小脑, 这才是符合生物学逻辑的进化方向。但即便如此, figure ai 依然面临着巨大的落地难题。讲到这里,你可能觉得不可思议,但更疯狂的还在后面,它甚至打破了我们对常识的认知。在硅谷有一家叫 dina robotics 的 公司,他们做了一个极其反直觉的决定, 当所有人都在追求通用人形机器人,恨不得让机器人今天会炒菜,明天会修车的时候, dina 的 创始人 linda 和 york 却带着一群顶尖科学家在死磕。一件小事,叠毛巾。 我去他们实验室的时候,特意跟他们的机器人比了一场叠衣服。虽然我速度比他快,但这玩意能二十四小时不睡觉的干啊!丹娜的逻辑非常反共时,他们认为与其做一个什么都能干,但什么都干不好的通才不如先在一个垂直场景里把数据质量做到极致。 他们发现了一个惊人的 scaling law 缩放定律,在机器人领域,数据并不是越多越好,这和做 chat gpt 完全不同。做 chat gpt, 你 把互联网上的垃圾文本喂给他,只要数据量够大,他自己能学会过滤。 但在机器人领域,如果你喂给他一堆质量不高的物理互动数据,他的动作就会变形,甚至产生幻觉。 diana 发现,只要在叠衣服这一件事上,让机器人彻底理解了柔软物体的物理特性,这种学习能力是可以迁移的。 就像一个精通钢琴的人去学吉他会非常快,他们把这叫做原学习能力。这就是为什么他们敢说先让机器人在洗衣房里把活干好,积累下来的那个脑子以后去干别的。降维打击,这其实揭示了两千零二十五年机器人赛道的三大门派之争。 第一派是以特斯拉和 figure 为代表的全站集成派,他们信奉的是暴力美学,觉得只要模型够大,数据够多,硬件自己造,就能产生智能涌现。 这就像是在赌博,赌注是几百亿美金,赌的是量变引起质变,在物理世界依然奏效。第二派是以低囊为代表的垂直突破派,他们更务实,追求小而美的数据, 先在垂直领域跑通商业闭环,再图谋天下。这就像是特种部队,不求人多,但求每一个数据点都是真实的物理反馈。 还有第三派,那就是想做卖产人的英伟达和谷歌。英伟达的野心最大,黄仁勋想做机器人界的安卓,他推出了 g r 零 t 项目,明面上是开放,实际上是想把所有人都锁死在英伟达的生态里。你想用我的模型?行,那你得用我的芯片,用我的仿真平台,用我的全套工具链。 这招生态锁死极其凶狠。而谷歌呢,走的是科研开源的路子, rt 系列模型发了一堆论文,看似在大公无私的推动行业进步,实际上是在争夺技术标准的话语权。 各位看到这里,局势已经很明朗了,这不仅仅是技术的比拼,更是商业模式的殊死搏斗。特斯拉赌的是规模效应, figure 赌的是通用智能, dina 赌的是数据质量,而英伟达赌的是生态垄断, 谁会赢?现在下结论还太早,但有一个信号非常值得玩味,亚马逊已经悄悄部署了一百万台机器人,虽然他们还不够智能,但这庞大的数量级意味着,一旦基础模型突破,亚马逊可能会是那个瞬间完成物种爆发的隐形巨头。对于我们普通人来说,这意味着什么? 我不认为家庭保姆机器人明年就能走进千家万户那不现实。但是在商业场景里,在洗衣房、在后厨,在物流仓库,机器人的身影会越来越常见。黛娜的创始人告诉我,他们预计在两千零二十六年就能在商业场景大规模铺开。 至于家庭端,也许只要几百美金。买一个能帮你叠衣服、收拾屋子的机器人,并不是遥不可及的科幻故事,而是未来两三年内就能看到的消费电子产品。最后我想说的是, 两千零二十五年这场机器人混战,表面上看是巨头们的游戏,实际上是在重塑物理世界的运作方式。这背后的逻辑其实非常反人性。他要求我们放弃对像人一样思考的执念,转而去理解物理世界的数据本质。 关注我,拆解更多优质 ai 播客访谈内容。如果这个视频对你有启发的话,也强烈推荐您去看播客原片。

春晚语术机器人身手不凡,似乎已经无所不能了,真的是这样吗?其实,这些机器人,这些标准流畅的动作,是寓编程与寓训练的工程秀,换句话说,就是通过多次事先演练反复训练的结果,并不具备实用价值。 平板机器人呢,是典型的表演型智能,而非实用级智能机器人。图瑞奖得主杨立坤不久前在二零二零年达沃斯论坛上曾经有过这样的一段客观的评论, there's a lot of companies building humanoid robots and they do those kinds of you know the pre kung fu, and you know impressive thing this is all pre computed okay, none of those companies absolutely none of them has any idea how to make those robots smart enough to be useful right it's a big secret of robotics industry you can train them on very narrow tasks and you have to collect lots and lots of data the same way you know people thought they would build automobiles and it's expensive and it's only practical for a small number of our tasks and you don't have robots that you know have nearly as good as a common sense as your huskets let alone human intelligence right, so that's the challenge for the next few years right the getting system to really understand the real world and the problem is that the approaches that have been successful for language do not work for data to really understand the real world and the problem is that the approaches that have been successful for language you have to use something else。 杨丽坤指出,从能力维度来看,当前人形机器人的综合水平呢,可能还远不及小学生,我们人类可以通过观察、试错来快速适应环境,机器人却只能重复预设的动作,对于物理规则、因果逻辑等等,可以说是缺乏认知。 我们看到的春晚机器人热潮,是工程能力的集中展示,而非 ai 技术的一种本质突破。 这晚机器人的每一个走位、每一次互动,都来自提前标定的轨迹、海量数据的综合训练,而非机器人自主学好的结果。 这晚机器人的完美表现仅能够在封闭可控的舞台环境中实现,一定要面对突发情况,例如观众意外闯入, 任务流程调整,机器人便会陷入失灵,无法像人类一样随机应变。下面是二月三号发生在成都凯德商场语数机器人表演上人的视频。这些语数机器人呢,刚刚在王力宏的成都演唱会上大显身手, 但是在商场的现场表演中,却出现了设计安全的情况。成都凯德广场内,一商户组织的人形机器人在表演时意外碰到一位老人,现场画面显示,机器人与老人双双倒地,引发众人围观。 这是商户相关工作人员告诉荔枝新闻,当时老人在围观机器人表演时,被向他走来的机器人惊吓到,想跨步避开,结果意外与表演中的机器人相碰, 老人倒地后被送往医院软组织挫伤。目前商家正在医院积极配合顾客治疗,妥善处理善后示意。 从这段视频中可以看出,面对突发情况时,机器人是缺乏应变能力的。创新在商业化的进程中,安全首先是需要考虑的。无论春晚机器人多么火热,人性机器人目前呢,仍旧处在商业化探索的关键起步阶段, 如何让 ai 从虚拟数据世界走向物理世界,是目前人形机器人发展的关键,也就是我们所说的 facebook ai 的 发展速度。 黄旭勋在二零二五年,也就是去年的 gdc 大 会的压轴环节,曾经发布了一个小小的实体机器人步路。 这个小机器人呢,没有炫酷的表演,却能根据环境的变化来实时调整动作,自主避障,自主完成任务,每一个反应均来自这个小小机器人自己的实时的推理。我们来看一看这个小小机器人的表现如何? how are you doing? how do you like? how do you like your new physics engine? you like it huh yeah i bet i know tactical feedback rigid body soft body simulation super real time can you imagine just now what you were looking at is complete real time simulation? this is how we're going to train robots in a future? just so you know blue has two computers, two nvidia computers inside look how smart you are yes you're smart okay alright, hey, blue listen how about let's take them home? let's finish this keynote, it's lunchtime are you ready? let's finish it up we have another announcement you're good you're good just stand right here stand right here stand right here alright good right there that's good alright stan。 对比春晚机器人的炫酷表演,机器人捕路呢,看似朴素,却代表了非这口 ai 的 发展方向。 春晚的机器人秀是起点而非终点,是域,编程的繁华是过度而非中局。 当机器人能够摆脱预设脚本的束缚,拥有真正的物理适应性与决策自重性,我们才能够让机器人从表演到工作, 我们才能够迎来人与机器共创的智能时代。而这场关乎于未来的科技马拉松也才刚刚开始,让我们共同期待。