粉丝60.5万获赞846.9万

就在昨天,全世界所有的安卓手机都可以用上真 ai 了,中国的智谱正式宣布啊,他们把全世界第一个为手机而生的通用 agent auto gm 给开源了,是的,完全免费开源了。也就是说,从今天开始,世界上任何一台安卓手机啊,都可以用 ai 来完全操控了。 ai 会自己看屏幕,理解界面,然后自己规划思考, 最后模拟出你手部的点击,滑动输入,帮你完成各种各样的操作,而你全程都不需要碰屏幕,完全交给 ai 就 可以了。现在我跟 ai 说帮我点三杯冰美式, 看,他就可以自己思考自己操作了,一步一步点击,完全不用我管,我们再试一个,如果让他对比一下这个显示器在哪个平台更便宜,帮我决定一个,自己下单。然后你看啊,他是真的开始了多步骤操作,现在淘宝搜了一下,然后把价格记下来,然后再去京东搜了一下,把价格记下来,结果还去拼多多看了一圈,然后真的帮我选了一款真的很便宜很便宜的款,这个羊毛真的给它薅到了, 操作的过程就跟真人人手一模一样。最后我们再试一个超级无敌难的版本,我下周六要去长春玩,帮我总结一下这个页面上推荐景点,然后在高德地图上收藏一下这个景点,看一下门票的价格,然后再去一二三六订一张上午实验从北京去长春的高铁票,然后再把香味信息整理好给我,他就开始自己干活,自己搜索,一个一个搞, 打开一二三零六开始帮我看动车票了,而我自己只需要最后付款那一步看一下,确认一下就可以了,你看这个过程是不是真的超级夸张,这个已经不是简单的那种自动化脚本了,而是真的完全用 ai 来去驱动,也就是一个住在你手机里的数字生命。我觉得这个才是我心里面的 siri 该有的样子。 这次可以做到这么猛的效果,也是因为 autim 他 们用上一套视觉语言模型,他可像人一样自己去看懂屏幕上内容,知道哪里是按钮,哪里是输入框,然后再模拟人的点击、滑动、输入这些操作。所以理论上它是可以操控任何一个 app 的, 根本就不需要其他厂家的配合,而是直接变成了一个人类的用户。 我看一下开源社区他们的界面啊,现在已经支持了五十多款主流的 app, 大家关心的微信、淘宝、抖音、 b 站、携程这些全部都可以用。而自古这次把它开源了,我觉得这个意义真的非常重大,因为它解决了一个大家都很关心的问题,隐私问题。如 如果要操作我的手机,那我的聊天记录、支付密码怎么办?而现在因为代码是开源的,所以你可以完全把它部署在你自己的手机跟电脑上,我们就是一台五零九零显卡去跑的, 所有的数据都在你的本地,根本就不会上传到云端。而且有了开发的社区,大家一起去完善这个项目,速度只会越来越快,可以做的事情也越来越多。而从今年开始,像 google、 苹果,还有其他那些巨头大厂,大家都在试着让 ai 真正学会操作手机这件事情, 没想到智普直接在年底就开园了,现在每个人都可以下载来直接用了,所以我觉得二零二六年的手机市场跟 ai 市场啊,应该又会迎来一波腥风血雨了。

嗨,家人们。内心有点小激动,所以虽然感冒了,但我们还是一起录个视频来聊一下,我们一起来看一个在手机上可以说是划时代的全新的 ai 交互方式。那我先在电脑端给手机一个指令,让他呢在美团上帮我去定一个下周六晚上的火锅餐厅的位置, 我们实际拿我的手机来看一下,注意,这是我自己的手机,相信粉丝们都知道老演员了。 打开了美团,进入了搜索框,他自己输入了火锅,进行了搜索,进去餐厅的 list, 他 选择了一家可定的餐厅,你看他进去应该定做了,这边有个 cheeky 的 点是我设计的是下周六,而不是今天或者明天, 我们看他移动这个时间罢了,有点厉害。哎,他选择对了,下周六,接下来应该又比较简单去确认,然后最后一步应该是要我自己去 confirm。 ok, 那 我们再来实操,看一个也是我日常非常高频操作的一个场景啊。我让他帮我去打开小宇宙,然后找到 linux podcast 的 最新播客,并且要加入到播放列表 正面。我觉得第一个难点就是他去打开我这个 app 的 抽屉,因为我的 app 不 像很多手机一样是放在桌面的,它隐藏在这个抽屉里面。 就这一关,他居然能挑战成功,还是比较厉害的。后面接下来我觉得打开 app, 然后像之前一样输入 landspodcast, 找到这个播客应该都不是很难,他找到这个播客了,然后应该会进去。接下来有个难点就是找到这个播客,并且加入到播放列表, 因为我们这个播放列表他其实并没有显示出来,我们看他怎么操作,这个应该不是他在试错, 他进入直接播放了,我们看他把我们这个播客点开了,并且进入到了播放列表,所以是成功的。 ok, 那 看完家人们觉得震撼,而且两个都不是 demo, 全是实打实的操作。更关键的是,这就是我日常用的自己的一台手机啊,并不是一个为 ai 特别定制的手机或者工程样机。 那实现这些的全靠智浦最新开源的 auto g l m, 它可以把我们每个人的手机都变成一台 ai 手机。我个人觉得本次开源可以说是一个里程碑的事情,甚至我把开源的 auto g l m 称为 ai 手机的破局者。那这次的 auto g l m 到底破局在哪呢? 我们先看现状,现在你要做个 ai 手机,很显然是以全世界为敌啊,手机厂商他肯定围缴你,那手机上的应用厂商肯定也得和你拼命, app 天天不就是为了挣个用户流量入口吗?现在你倒好,做个 ai 手持入口变成 ai, 那 么 auto gm 这一步的开源就走得可以说是一举几试,开源了手机厂商手也就没有那么担心自己被取代,更好的是咱俩还能一起合作开发,好兄弟一起走。而且还有最重要的点, ai 时代会有很多全新的 ai native 的 app 出来,那毫无疑问,这些 app 肯定是会拥抱 auto gm 的。 gt, gt 设计肯定天然就适合 ai 手机这种交互方式,所以我说 otoglm 是 ai 手机破局者这一点 完全不夸张。那说了这么多,最后我们给 otoglm 一个极限场景来拉利测试,我给他一个复杂的任务,看它整体的完成度如何,而且我把电脑和手机桌面同时放在一起,电脑端呢,大家可以看一下它整个任务拆解和具 获取手机端完成的一个过程。那手机端呢?我们直接可以看一下这个交互的一些情况。 ok, 那 我把指令给到他,我呢希望去阿勒特滑雪那去小黄书找攻略,并且去携程上找到基九,我们看他开始打开小黄书去搜攻略了。这些搜攻略什么去小黄书点进去,应该是属于对他来说比较简单的人,我觉得他肯定是能够完成的。 他找到帖子了,他还会慢慢去滑动这个图片,然后去读图片里面的内容。他读完以后觉得已经读到了详细的一些信息了,你看接下来他又怎么干?他找到了第二个笔记,是一些门票的价格,你看他在读图片,他去尝试找到一些实用的信息,但没想到这边发的都是风景图, 不接,找不到具体的信息和内容。好像在小黄上他觉得收集了足够多的信息了。我们看下一步,因为携程上首先简单的这种输入城市,包括基酒的起飞跟降落的目的地,我觉得应该都不是很难, 我们看他怎么去调用这些信息的。前面他搜索应该会有一些将军山这些滑雪景区的指示给到他,所以他可能朝这个方向去收了将军山国际滑雪这个区域, 他给了我们一些酒店的一个推荐,接下来他应该是想去给我们订机票了,像这种有突然的弹出来的页面,我看前面他也是能够很好的去点击掉,他就不会误触点掉了,你们看他看到了我是从上海到北京的,之前预设的, 他应该会去改这个目的地吧,我猜他还蛮聪明,你看我之前搜索狂友拍摄这些字样,他去读取,然后他觉得这个应该不是就自己手动输入阿勒泰,他应该准确定位到了从早到晚的这些机票,应该会选择早上吧,不会选个大中午或者傍晚吧, 这个应该是他整体完成了, ok, 给了我们一系列的推荐,我觉得整体的执行还算是一个八十分左右的一个水准吧,毕竟是给我交付了一个完整的攻略,加上推荐的酒店和机票。从我们实测的这个案例来看,基本上很多手机上操作没什么大问题, 其实我们正常用手机也没那么多复杂的操作,像我日常用的软件也就十几个正常的点,按筛选的一系列的操作,也就 ai 大 概率是能够完美的去执行。最后我觉得 ai 手机毫无疑问是 ai 认证去落地的很好的一个场景,所以很多大模型墙纸、手机墙纸可以说是蓄势待发。 而欧托 g l m 本次开源基本上是打响了发力枪,让我们期待一下这场 ai 手机的马拉松。 ok, 那 本期内容就到这了,我是北达眼镜哥,我们下期再见,拜拜。

没有想到都跑手机的朋友们,恭喜你省了三千五,因为就在昨天的时候,支付把它的 autgrm 开圆了,它可以直接机关你的手机屏幕,替你思考点击输入场景,覆盖了五十多个高频的中文 app, 比如说微信、淘宝、抖音、美团这些核心的场景,它都是可以跑的。 我拿它做了两个小测试,有亮点,当然也有吐槽点。首先第一个点外卖,它是真的可以跑通,比如说你想在美团上去下单,然后到加购,下单路径是很顺畅,你会产生一种错觉, 好像手机里面住了一个非常懂你小助手一样。第二,他的一个跨平台笔架是很实用的,我可以让他对比淘宝和京东同款拖鞋,他能够自己搜,自己去对比,最终给出你的一个结论,这就不是什么聊天机器人了,这相当于一个端侧 a 阵的他真真正正的上桌了。更关键的是什么?他居然很克制, 比如说他碰到了支付或者验证码之类的敏感操作呢?它会自动停止让你接管,很聪明,不会约借。但有一点很值得吐槽,就是现在的形态对普通人是不够友好的,你要用电脑通过 a、 d、 b 去控制手机体验,实际上更像是你在电脑面前远程控制着你自己的手机,就很奇怪。大家如果想要试试,可以找我拿下开源地址 和它的一个部署教程。智普啊, autolm 开源,我想说的是,它的价值不是在完美的体验,而是说它释放了三个信号。第一, ai 手机的异件可能要被打下来了, 以后的 ai 体验不一定要靠很贵的硬件,说不定就是靠的一个开源框架加它的一个端侧的能。第二就是大厂的 for a 阵固城河开始变浅了,开发者和极客们可以直接拆改做出来自己的版 本。第三呢,无障碍和轻量自动化领域绝对是要爆了。对于一些操作是很方便的人群来说,语音加 ai 操作就等于手机自由。欢迎大家评论区留下你的想法。

火爆全网的豆包手机今天正式开园了,没错,从现在开始呢,任何人都能够拥有属于自己的 ai 手机操作员。就在前几天呢,智普突然放出了一个大招,把整整研究了三十二个月,能像真人一样去操控手机的 autolm 连模型、代码框架全部免费公开。重点来了,它的能力呢,几乎和豆包手机是一模一样的。为了证明不是噱头,支付还给出了一段官方的演示,只要给 ai 一个任务,规划行程,发送消息,完成购票结果。 autem 展示出的操作呢,让所有人倒吸一口凉气。 自动打开了不同的 app, 自动精准的定位页面,自动输入内容,自动滑动界面,自动选择行程和时间,自动完成了下单流程,整个过程稳准,像真人一样自然流畅。重点是呢,它的推理链路全 全程都是透明的,每一步都能看得见。另外,开源之所以会被全网刷爆,原因还有两个,第一就是安全,代码给到你,数据留在本地,手机里面发生的一切都在你的掌控范围内,不需要担心外传后台上传隐私的风险。第二呢,就是门槛低,任何人都能把它装进想要装的应用里。就像当年安卓开源,让智能手机从少数 咱的玩具变成了所有人的标配。而奥特 g m 开源呢,意味着 ai 的 操控设备呢,即将走向全民普及。智谱呢,把奥特 g m 公布出来,不是独占技术,而是把真正的创新呢,诞生在每一个愿意动手的人手里。

手机圈子天又塌了,豆包手机的发布让我们的智能手机变成了逗逼手机,让所有人见识到什么叫真正的 ai 手机。但是我们同时也见识了资本的力量,一号发布,二号微信立马封杀,紧接着阿里这些巨头也全部跟上,共同抵制。 九号智普 ai 突然宣布将核心产品 auto g l m 彻底开源,这意味着任何手机厂商,任何开发者都 都能立刻拥有制作、训练 ai 手机的能力。但有件事很耐人寻味,智普 ai 和字节并没有商业关联,反倒是阿里也腾讯、美团这些巨头是它的核心投资方。这波大义灭亲还真是挺有意思。 智能手机取代按键手机用了小十年,现在有了开源技术, ai 手机取代智能手机也许只需要一年。真的是太神奇了,怎么下载,怎么配置?怎么让你的手机变成 ai 手机?问下豆包去吧!

最近豆包的 ai 手机非常火,但是现在智普又把它的奥头 g r m 的 项目开源了,用这个项目直接就可以把一个普通的安卓手机变成一个 ai 手机,只要给它一个指令,它就能执行刷短视频、订票、订外卖、订酒店,这下子就厉害了。之前是因为豆包搞封闭性的 模型开源之后,我相信就会有越来越多的安卓的手机厂商跟进,如果安卓的手机厂商形成了一个联盟,那么这些大公司或者说这些应用未必就能对抗的住。但是我觉得这个事未来一定是个趋势,以后的手机一定会成为一个私人的助理,里面装上这种 模型,然后作为助手解决各种各样的问题,就算是想要延缓它也只是暂时的。所以在未来三四年之内,其实我们每个人都会有一个私人助手, 能伴随这个人一生在手机上,在家里面,可能后台都是一个 ai 的 agent, 对 你这个人了如指掌,从衣食住行、习惯喜好,甚至可能比你自己还了解你,因为一辈子都在跟他聊天,所以这个就会改变我们每个人的生活工作的模式。 我相信未来像这样的技术会越来越多,所以手机厂商未来可能价值现在是被低估了,如果手机厂商真的能够通过这种端侧的模型控制入口,他的估值可能就可以对比到今天的大型的互联网公司。


接下来我将演示如何花一下午让自己的手机变成智能 ai 手机。我们这里用到的是十二月九日智补开源的一个 a two g r m 项目, 这个开源项目在网上也是掀起了巨大的讨论,将其称之为新一代人机交互革命的开始。我们将演示这个进入抖音,然后搜索四川日报,点赞并收藏的并评价祖国万岁这个功能。大家可以看到我这里的手机是没有任何操作的,他将自己跳转到抖音,然后去搜索四川日报。 这里另外补充这个,这个项目需要这个显卡,要求比较高,要五零九零级以上,所以部署在云服务器上是最好的选择。他进入了四川日报,然后选的应该是会选第一个视频, 他为什么不动?因为他会等所有的视频加载完成,才会进入第一个页面。他开始进行点赞操作,然后收藏。这是他的第二个第二个动作。不不不, 我们可以看到他这里主播万岁是没有评论上的,但是他的动作还没有停,我们看他会怎样操作。 ok, 他 已经将祖国万岁打出来了,然后发出去,整体项目就已经完成,他输出了一个任务,完成结果 他开始了六步,第一步就是进入抖音应用。第二步,搜索找到四川日报官方账号。第三步,打开了四川日报的视频内容。第四步,然后第四步,点赞,第五步,收藏。第六步,发表评论。所有操作均已完成。

就在前几天大火的豆包手机被各大 app 联合封杀后,智普直接就掀桌子了,都不让用是吧?我直接就把相关技术都开源了,以前只有大厂才能搞的 ai 助手,现在人人都可以拿来用。要知道豆包手机和市面上你能看到的 ai 助手都不一样,它 是刻在系统底层的代码,能在各种不同的 app 里来回跑,让他点个外卖,发条微信,想要买什么东西,豆包都会给你找出最低价, 甚至它还能帮你完成游戏的每日任务,而且这些任务都是可以在后台进行的,这简直就是我梦想中的 ai 手机。但也就是因为豆包实在是太能干了,什么都让你干了,用户根本就不会点开我们的应用,那我们还怎么活下去? 于是各大 app 说着保护用户安全和隐私,立马就封杀了豆包手机。眼看 a i 手机的火苗要被掐灭了,是否接过了火种,宣布正式开园?研发了三十二个月的 o t g l m。 这就相当于每个人都可以在自己的手机里做一个能帮你干活的 ai 助手,并且它还支持本地部署, 你的任何操作和数据都只会烂在你的手机里,不会上传到云端,隐私和安全都得到了保障。如果是你,你会支持 a i 手机,还是会坚持现在的手机使用习惯?