00:00 / 02:43
连播
清屏
智能
倍速
点赞18
BMX运动智能AI自行车机器人小轮车自主学习算法进化黑科技术 #机器人 #快递机器人 #bmx #自行车机器人 #智能机器人 当一辆自行车无需人手操控,就能蹦跳着跃上平台、抬起前轮单轮行驶,甚至连贯完成特技动作时,你或许会以为是特效加持 —— 但这正是机器人与人工智能研究所(RAI Institute)研发的 “超移动载具”(UMV)的真实表现。这款融合了 AI 与机械工程的自主机器人自行车,不仅打破了人们对两轮交通工具的认知,更以 “运动智能” 为核心,勾勒出未来移动机器人的发展蓝图。 UMV 的惊艳表现,源于其精妙的硬件设计与前沿的 AI 算法。从结构上看,它采用轻量化碳纤维车架,整车重量仅 15 公斤,却能爆发出超越专业小轮车骑手的弹跳力。车身核心在于 “大脑与肌肉” 一体化模块:上方的可活动机械臂集成了车载计算机、高能电池与定制化驱动系统,既像人类的躯干一样协调平衡,又能像弹簧般实现能量储存与释放 —— 进行蹦跳动作时,机械臂快速上扬预载能量,再猛地拉动车身腾空,落地时精准伸展缓冲,让 15 公斤的车身能轻松跳起 30 厘米,连续 10 次上下高台的成功率高达 98%。 相较于传统两轮机器人,UMV 的核心突破在于抛弃了依赖陀螺仪的平衡模式,转而采用强化学习算法实现自主控制。这种学习方式酷似人类的成长过程:系统通过数千次模拟训练与两万次真实场景调试,在成功完成动作时获得 “奖励”,失败时积累经验,逐渐摸索出平衡车身、转向、控制速度的最优策略。无需手工编写复杂控制代码,AI 就能自主掌握原地定车、倒车、连续特技等难度动作,甚至能根据地形调整姿态,平稳着陆高难度跳跃,最长定车时间可达 5 分钟,展现出媲美运动员的精准操控力。 RAI 研究所的研发团队表示,UMV 的设计初衷是展示 “运动智能”—— 让机器既具备车轮的高效移动能力,又拥有腿式机器人的灵活适配性。这一技术突破已引发多个行业的关注:在物流领域,UMV 的地形适应能力可赋能配送机器人,使其轻松跨越台阶、路沿石等障碍,解决 “最后一公里” 配送难题;在工业巡检中,其小巧灵活的身形与自主平衡能力,能让机器人进入狭窄空间或崎岖厂区,完成设备检测任务;在抢险救援场景中,轻量化与高机动性的结合,可让机器人快速穿越灾害现场传递物资,降低人员风险。 目前,UMV 已从技术原型向实用化迈进。研发团队正与物流企业合作,将其核心技术迁移至小型化配送机器人。
00:00 / 01:10
连播
清屏
智能
倍速
点赞2
机器人会自己动嘴唇了!通过人工智能AI大模型学习控制面部动作 #机器人 #机器学习 #人工智能 #科技 #深度学习 在机器人学领域,如何让仿人机器人摆脱“僵硬感”并跨越“恐怖谷效应”,一直是科研人员面临的终极挑战。以往的机器人,如知名的Sophia或Ameca,其面部表情和口型同步大多依赖于工程师预先设定的动作库或复杂的运动学方程。然而,哥伦比亚大学创意机器实验室(Creative Machines Lab)研发的EMO机器人,通过一种全新的AI驱动模式,彻底改变了机器人“动嘴唇”的技术逻辑。 EMO最显著的技术突破在于它不依赖任何预设的表情脚本。其动嘴唇的能力主要源于两套高度复杂的神经网络:“自我建模”模型和**“表情预测”模型**。 首先,EMO经历了一个被称为“自我探索”的阶段。在没有任何人类干预的情况下,它对着镜子随机驱动面部皮下的26个微型执行器。通过内置的摄像头,机器人会实时观察自己面部皮肤的拉伸、皱褶以及嘴唇的开合情况。利用视觉到动作(Vision-to-Action)算法,EMO在后台自动建立了一套物理映射:它不仅知道每个电机转动的度数,更通过深度学习理解了这些动作在视觉上产生的具体效果。这就像人类婴儿通过尝试各种发声和表情来熟悉肌肉控制一样,EMO通过这种方式完成了初步的“具身认知”。 在掌握了基本的面部控制后,研究团队引入了自监督学习(Self-supervised Learning)。EMO观看了数小时的YouTube视频,这些视频涵盖了人类说话、唱歌以及各种细微情感表达的画面。 通过变分自编码器(VAE)和Transformer架构,EMO开始将音频信号的频率特征与视频中人类嘴唇的几何变化进行像素级的匹配。它学到的不是“怎么说英语”或“怎么说中文”,而是一种通用的**“声学-动力学”关联**。这意味着,当EMO听到一段从未听过的音频(无论是歌剧还是某种方言)时,它的AI模型能实时预测出对应频率下,嘴唇应该呈现的物理形状。这种基于像素学习的方法,捕捉到了人类说话时那种不规则的颤动和细微的过渡动作,使得其嘴唇运动具有极高的自然度。 EMO另一项杀手锏是其预判能力。在人际交流中,哪怕只有几百毫秒的延迟,也会让机器人显得呆滞。EMO的预测模型通过对人类面部先兆特征的实时监控,能够在对方真正开口或做出表情之前的840毫秒,就通过概率分布计算出即将发生的动作。
00:00 / 00:34
连播
清屏
智能
倍速
点赞15
00:00 / 01:29
连播
清屏
智能
倍速
点赞28
00:00 / 01:04
连播
清屏
智能
倍速
点赞390
00:00 / 01:55
连播
清屏
智能
倍速
点赞23