粉丝508获赞4892

我一直觉得 ron 维是最有艺术气质的视频模型,但是每次听到有人吐槽他,他真的太拉垮了,心里也是非常的无奈。就在我们还在讨论 solo 和 vivo 的 时候呢, ron 维就像卷王附体一样,直接甩出了王炸的卷,能连四点五模型。这一次呢,不是挤牙膏, 是一脚踩进了新世界的大门。我帮大家扒一扒这次更新的几个变态的细节,看完你手里的模型,瞬间就感觉不香了。 在著名的评分网站上面, justine 四点五呢,现在的分数直接飙到了一千两百四十七分,这是什么概念呢?意思是他现在直接把谷歌的 vol 三和 openai 的 solo two 直接按在地上摩擦?他是目前地球上你能找到的最强视频模型,没有之一。 以前呢, ai 视频水流动起来像果冻,人,走起来呢像飘着。 jennifer 四点五呢,这次彻底补课了物理学,它生成的液体流动物体重量感,甚至头发丝随风飘动的惯性,真实到让你怀疑是不是拿摄影机实拍的。 玩过 ai 视频的都知道,最怕的就是人物转个头就换脸,或者走着走着衣服就变了。 jennifer 四点五的仪式性也是强到离谱,哪怕是复杂的运镜,大幅度的动作,主角还是那个主角,细节还是稳的一比, 再也不用担心你的男一号变成替身了。最良心的是,画质提升了这么多,生成的速度竟然没有变!如果说你是视频创作者,想要电影级别的这么多,生成的速度竟然没有变!如果说你是视频创作者,想要电影级别的这么多,生成的速度竟然没有变!如果说你是视频创作者,你现在非常好的选择。

就在昨天,全世界所有的安卓手机都可以用上真 ai 了,中国的智谱正式宣布啊,他们把全世界第一个为手机而生的通用 agent auto gm 给开源了,是的,完全免费开源了。也就是说,从今天开始,世界上任何一台安卓手机啊,都可以用 ai 来完全操控了。 ai 会自己看屏幕,理解界面,然后自己规划思考, 最后模拟出你手部的点击,滑动输入,帮你完成各种各样的操作,而你全程都不需要碰屏幕,完全交给 ai 就 可以了。现在我跟 ai 说帮我点三杯冰美式, 看,他就可以自己思考自己操作了,一步一步点击,完全不用我管,我们再试一个,如果让他对比一下这个显示器在哪个平台更便宜,帮我决定一个,自己下单。然后你看啊,他是真的开始了多步骤操作,现在淘宝搜了一下,然后把价格记下来,然后再去京东搜了一下,把价格记下来,结果还去拼多多看了一圈,然后真的帮我选了一款真的很便宜很便宜的款,这个羊毛真的给它薅到了, 操作的过程就跟真人人手一模一样。最后我们再试一个超级无敌难的版本,我下周六要去长春玩,帮我总结一下这个页面上推荐景点,然后在高德地图上收藏一下这个景点,看一下门票的价格,然后再去一二三六订一张上午实验从北京去长春的高铁票,然后再把香味信息整理好给我,他就开始自己干活,自己搜索,一个一个搞, 打开一二三零六开始帮我看动车票了,而我自己只需要最后付款那一步看一下,确认一下就可以了,你看这个过程是不是真的超级夸张,这个已经不是简单的那种自动化脚本了,而是真的完全用 ai 来去驱动,也就是一个住在你手机里的数字生命。我觉得这个才是我心里面的 siri 该有的样子。 这次可以做到这么猛的效果,也是因为 autim 他 们用上一套视觉语言模型,他可像人一样自己去看懂屏幕上内容,知道哪里是按钮,哪里是输入框,然后再模拟人的点击、滑动、输入这些操作。所以理论上它是可以操控任何一个 app 的, 根本就不需要其他厂家的配合,而是直接变成了一个人类的用户。 我看一下开源社区他们的界面啊,现在已经支持了五十多款主流的 app, 大家关心的微信、淘宝、抖音、 b 站、携程这些全部都可以用。而自古这次把它开源了,我觉得这个意义真的非常重大,因为它解决了一个大家都很关心的问题,隐私问题。如 如果要操作我的手机,那我的聊天记录、支付密码怎么办?而现在因为代码是开源的,所以你可以完全把它部署在你自己的手机跟电脑上,我们就是一台五零九零显卡去跑的, 所有的数据都在你的本地,根本就不会上传到云端。而且有了开发的社区,大家一起去完善这个项目,速度只会越来越快,可以做的事情也越来越多。而从今年开始,像 google、 苹果,还有其他那些巨头大厂,大家都在试着让 ai 真正学会操作手机这件事情, 没想到智普直接在年底就开园了,现在每个人都可以下载来直接用了,所以我觉得二零二六年的手机市场跟 ai 市场啊,应该又会迎来一波腥风血雨了。