粉丝41获赞128

免费了,不要三四九九,也不要九块九,不包手机的平替智普的开源项目 open auto gm, 配合它的开源模型 auto g o m 九 d, 咱们也能实现手机 agent 的 自由。我用手上这台安卓手机和 mac 电脑搭好的环境,让他来帮我购物, 这是执行效果,提示词是在淘宝上找到帮宝适黑金刚 l 码最低价的商品,加入购物车,然后发微信告诉我商品选好了。我来看看。这套开源方案和豆包手机最大的区别有三点,第一, 一,运行级别不同。开源方案只能在前台运行,豆包手机可以在后台自己默默的运行。第二,手机的便携性不同。开源方案手机和电脑必须用数据线连接,或者是在同一个 wifi 下,豆包手机可以只拿着手机到处走。三、智能程度不同。 开源方案接的是九 b 参数的小模型,能完成大部分的基础场景,但是极限智能比不上豆包手机。推荐两种适合的使用场景。 场景一,操作电脑忙不开的时候,比如快下班时提前叫车,当同事还在等车的时候,你已经上车回家了。场景二,需要在手机上多个 app 之间切换,收集数据,分析并且最终操作手机的场景。比如说在双十二购物选择最低价格商品时,我的微信收到消息了,任务完成。 牛逼!那么这么牛逼的手机, a 镜的方案会不会很难配置呢?完全没问题,我摸索了一套极简方案,只需要一行命令和一句话就能配置好。 首先看我这期视频,一行命令把 cloud code 安装好,然后打开 cloud code, 告诉他这句话,一路点同意就能安装完成整个配置过程,需要用数据线把安卓手机 在电脑上这么简单都能就能搞定,快去配置一套试试吧!你还有什么场景想用手机 app 来解决的?详细的安装过程和常见问题我会总结成文档,方便大家查看。关注我,玩转 ai 编程。

嗨,家人们。内心有点小激动,所以虽然感冒了,但我们还是一起录个视频来聊一下,我们一起来看一个在手机上可以说是划时代的全新的 ai 交互方式。那我先在电脑端给手机一个指令,让他呢在美团上帮我去定一个下周六晚上的火锅餐厅的位置, 我们实际拿我的手机来看一下,注意,这是我自己的手机,相信粉丝们都知道老演员了。 打开了美团,进入了搜索框,他自己输入了火锅,进行了搜索,进去餐厅的 list, 他 选择了一家可定的餐厅,你看他进去应该定做了,这边有个 cheeky 的 点是我设计的是下周六,而不是今天或者明天, 我们看他移动这个时间罢了,有点厉害。哎,他选择对了,下周六,接下来应该又比较简单去确认,然后最后一步应该是要我自己去 confirm。 ok, 那 我们再来实操,看一个也是我日常非常高频操作的一个场景啊。我让他帮我去打开小宇宙,然后找到 linux podcast 的 最新播客,并且要加入到播放列表 正面。我觉得第一个难点就是他去打开我这个 app 的 抽屉,因为我的 app 不 像很多手机一样是放在桌面的,它隐藏在这个抽屉里面。 就这一关,他居然能挑战成功,还是比较厉害的。后面接下来我觉得打开 app, 然后像之前一样输入 landspodcast, 找到这个播客应该都不是很难,他找到这个播客了,然后应该会进去。接下来有个难点就是找到这个播客,并且加入到播放列表, 因为我们这个播放列表他其实并没有显示出来,我们看他怎么操作,这个应该不是他在试错, 他进入直接播放了,我们看他把我们这个播客点开了,并且进入到了播放列表,所以是成功的。 ok, 那 看完家人们觉得震撼,而且两个都不是 demo, 全是实打实的操作。更关键的是,这就是我日常用的自己的一台手机啊,并不是一个为 ai 特别定制的手机或者工程样机。 那实现这些的全靠智浦最新开源的 auto g l m, 它可以把我们每个人的手机都变成一台 ai 手机。我个人觉得本次开源可以说是一个里程碑的事情,甚至我把开源的 auto g l m 称为 ai 手机的破局者。那这次的 auto g l m 到底破局在哪呢? 我们先看现状,现在你要做个 ai 手机,很显然是以全世界为敌啊,手机厂商他肯定围缴你,那手机上的应用厂商肯定也得和你拼命, app 天天不就是为了挣个用户流量入口吗?现在你倒好,做个 ai 手持入口变成 ai, 那 么 auto gm 这一步的开源就走得可以说是一举几试,开源了手机厂商手也就没有那么担心自己被取代,更好的是咱俩还能一起合作开发,好兄弟一起走。而且还有最重要的点, ai 时代会有很多全新的 ai native 的 app 出来,那毫无疑问,这些 app 肯定是会拥抱 auto gm 的。 gt, gt 设计肯定天然就适合 ai 手机这种交互方式,所以我说 otoglm 是 ai 手机破局者这一点 完全不夸张。那说了这么多,最后我们给 otoglm 一个极限场景来拉利测试,我给他一个复杂的任务,看它整体的完成度如何,而且我把电脑和手机桌面同时放在一起,电脑端呢,大家可以看一下它整个任务拆解和具 获取手机端完成的一个过程。那手机端呢?我们直接可以看一下这个交互的一些情况。 ok, 那 我把指令给到他,我呢希望去阿勒特滑雪那去小黄书找攻略,并且去携程上找到基九,我们看他开始打开小黄书去搜攻略了。这些搜攻略什么去小黄书点进去,应该是属于对他来说比较简单的人,我觉得他肯定是能够完成的。 他找到帖子了,他还会慢慢去滑动这个图片,然后去读图片里面的内容。他读完以后觉得已经读到了详细的一些信息了,你看接下来他又怎么干?他找到了第二个笔记,是一些门票的价格,你看他在读图片,他去尝试找到一些实用的信息,但没想到这边发的都是风景图, 不接,找不到具体的信息和内容。好像在小黄上他觉得收集了足够多的信息了。我们看下一步,因为携程上首先简单的这种输入城市,包括基酒的起飞跟降落的目的地,我觉得应该都不是很难, 我们看他怎么去调用这些信息的。前面他搜索应该会有一些将军山这些滑雪景区的指示给到他,所以他可能朝这个方向去收了将军山国际滑雪这个区域, 他给了我们一些酒店的一个推荐,接下来他应该是想去给我们订机票了,像这种有突然的弹出来的页面,我看前面他也是能够很好的去点击掉,他就不会误触点掉了,你们看他看到了我是从上海到北京的,之前预设的, 他应该会去改这个目的地吧,我猜他还蛮聪明,你看我之前搜索狂友拍摄这些字样,他去读取,然后他觉得这个应该不是就自己手动输入阿勒泰,他应该准确定位到了从早到晚的这些机票,应该会选择早上吧,不会选个大中午或者傍晚吧, 这个应该是他整体完成了, ok, 给了我们一系列的推荐,我觉得整体的执行还算是一个八十分左右的一个水准吧,毕竟是给我交付了一个完整的攻略,加上推荐的酒店和机票。从我们实测的这个案例来看,基本上很多手机上操作没什么大问题, 其实我们正常用手机也没那么多复杂的操作,像我日常用的软件也就十几个正常的点,按筛选的一系列的操作,也就 ai 大 概率是能够完美的去执行。最后我觉得 ai 手机毫无疑问是 ai 认证去落地的很好的一个场景,所以很多大模型墙纸、手机墙纸可以说是蓄势待发。 而欧托 g l m 本次开源基本上是打响了发力枪,让我们期待一下这场 ai 手机的马拉松。 ok, 那 本期内容就到这了,我是北达眼镜哥,我们下期再见,拜拜。

就在昨天,全世界所有的安卓手机都可以用上真 ai 了,中国的智谱正式宣布啊,他们把全世界第一个为手机而生的通用 agent auto gm 给开源了,是的,完全免费开源了。也就是说,从今天开始,世界上任何一台安卓手机啊,都可以用 ai 来完全操控了。 ai 会自己看屏幕,理解界面,然后自己规划思考, 最后模拟出你手部的点击,滑动输入,帮你完成各种各样的操作,而你全程都不需要碰屏幕,完全交给 ai 就 可以了。现在我跟 ai 说帮我点三杯冰美式, 看,他就可以自己思考自己操作了,一步一步点击,完全不用我管,我们再试一个,如果让他对比一下这个显示器在哪个平台更便宜,帮我决定一个,自己下单。然后你看啊,他是真的开始了多步骤操作,现在淘宝搜了一下,然后把价格记下来,然后再去京东搜了一下,把价格记下来,结果还去拼多多看了一圈,然后真的帮我选了一款真的很便宜很便宜的款,这个羊毛真的给它薅到了, 操作的过程就跟真人人手一模一样。最后我们再试一个超级无敌难的版本,我下周六要去长春玩,帮我总结一下这个页面上推荐景点,然后在高德地图上收藏一下这个景点,看一下门票的价格,然后再去一二三六订一张上午实验从北京去长春的高铁票,然后再把香味信息整理好给我,他就开始自己干活,自己搜索,一个一个搞, 打开一二三零六开始帮我看动车票了,而我自己只需要最后付款那一步看一下,确认一下就可以了,你看这个过程是不是真的超级夸张,这个已经不是简单的那种自动化脚本了,而是真的完全用 ai 来去驱动,也就是一个住在你手机里的数字生命。我觉得这个才是我心里面的 siri 该有的样子。 这次可以做到这么猛的效果,也是因为 autim 他 们用上一套视觉语言模型,他可像人一样自己去看懂屏幕上内容,知道哪里是按钮,哪里是输入框,然后再模拟人的点击、滑动、输入这些操作。所以理论上它是可以操控任何一个 app 的, 根本就不需要其他厂家的配合,而是直接变成了一个人类的用户。 我看一下开源社区他们的界面啊,现在已经支持了五十多款主流的 app, 大家关心的微信、淘宝、抖音、 b 站、携程这些全部都可以用。而自古这次把它开源了,我觉得这个意义真的非常重大,因为它解决了一个大家都很关心的问题,隐私问题。如 如果要操作我的手机,那我的聊天记录、支付密码怎么办?而现在因为代码是开源的,所以你可以完全把它部署在你自己的手机跟电脑上,我们就是一台五零九零显卡去跑的, 所有的数据都在你的本地,根本就不会上传到云端。而且有了开发的社区,大家一起去完善这个项目,速度只会越来越快,可以做的事情也越来越多。而从今年开始,像 google、 苹果,还有其他那些巨头大厂,大家都在试着让 ai 真正学会操作手机这件事情, 没想到智普直接在年底就开园了,现在每个人都可以下载来直接用了,所以我觉得二零二六年的手机市场跟 ai 市场啊,应该又会迎来一波腥风血雨了。

别眨眼啊,只要两分钟的时间啊,你家里的任何一个老破手机就能瞬间变成一个 a i 手机啊,就像最近的这个豆包手机一样,直接帮你在手机上订票、点咖啡,甚至帮你在手机上答题,帮你考试,帮你剪辑视频。 而且啊,这还不是一个功能演示,它是真的开始自己操作手机了。比如说啊,我随手说帮我买一张去上海的高铁票,紧接着你都能看到这个 ai 就 像一个真人一样,在手机上帮你查票、选班次、下单,这所有的完整流程一步步走通。 这是因为啊,智普团队刚才把他们打磨了两年多的核心技术 auto g l m 直接给开源了,这简直是太离谱了啊,要不然很多人说 ai 一 天地上一年呐, 一两周前啊,多少人还在感到稀奇的 ai 操作手机的能力,现在就成了人人可用的开源神器,让 ai 可以 真正的接受任何设备,把结果直接交付到你的手里。 而且啊,这次开源的还不仅仅是一个手机智能体的完整执行框架,还有一个叫做 auto g l m 风九 b 的 大模型啊,这个大模型直接开放给所有人, 它可以用视觉语言模型进行整个屏幕的感知,然后再结合智能的规划能力来生成并执行操作流程。用户只需要用自然语言描述需求,比如说打开某个 app 搜索美食并自动比价,然后呢,就能自动的去拆解用户的意图,理解当前的界面,规划下一步的动作,并且完成整个流程。 而且它还内置了敏感操作的确认机制,一旦需要付钱登录或者收验证码的时候,它就会马上让你二次确认,同时啊,还支持远程控制, 你完全可以一边在外地旅游啊,一边让 ai 在 手机上帮你操作钉钉或者是企微给你的老板汇报工作,他 把一个原来被视为大场合武器的技术,直接变成了所有普通人唾手可得的一个工具。所以啊,巨头们他或许可以去围绞豆包手机,但是呢,他不能围绞千千万万个基于开源框架自建的个性化的智能体。 而且啊,这整个过程呢,可以完全在本地运行,数据根本就不离开你自己的掌控。所以之前很多人担心的被豆包获取一切个人数据的问题啊,就这样迎刃而解了。因为九 b 这样的小模型啊,完全可以把模型和数据都放在自己本地的电脑上面。 所以从此之后啊,你的手机很可能就再也不是一个手机啊,而是一个长期在线,只为你一个人服务的超级私人智能体。 前几天啊,我看到很多人都在讨论豆包手机和平台入口的这么一个争夺,但是完全没想到这样的一个入口很快就会变成一个全民普惠的能力。就 像 deepsea 把高高在上的 open ai 打得措手不及,甚至是频频降价。这次的 auto g l m 的 发布啊,最关键的地方就是让我们不用再担心某家大厂垄断你的手机操作能力,它就像当年的安卓一样,可以被无数的人模改驯化叠加,最终呢,就会被调教成每一个用户最喜欢的样子。 所以具体怎么才能让你的手机变成 ai 手机呢?非常简单,大家跟着我操作啊,只要打开 github 上面我给的这个项目的网址,然后呢,里面的介绍全是中文的啊。然后你直接开启你老手机的 root 权限,然后下载模型进行操作就可以了,赶紧去试一试吧!关注 c 哥,了解更多 ai 前沿!

大家都知道,最近豆包手机的发布,让阿里、腾讯等大厂连夜开会,纷纷给豆包手机助手设置封禁权限。然后前两天智普开源了他的 auto g l m, 这是一款类似豆包手机助手的软件,既然开源了,那我们肯定要测试一下。 打开应用商城,搜索 auto g l m, 点击安装,这就安装好了。然后我们来测试一下功能,帮我用美团点一份三公里范围内卖的最好的奶茶, 帮我打开微博,进入刘亦菲的主页, 帮我用 qq 音乐播放一首林俊杰的歌曲, 帮我用携程订一张十二月十四日下午北京到上海的高铁票, 整个过程还是很流畅的。要知道豆包手机目前是秒断货,二手市场甚至加价几千再卖。 auto g l m 作为开源的模型,我们还能直接拿框架进行二次创作,比如可以集成到现在热门的人形机器人身上,提升这类具身智能的沟通能力。 随着 ai 的 迅速发展,我们更多地倾向于通过这些大厂开发出来的 ai 落地应用,欢迎一起探索 ai 的 可执行方案。

智普开源项目 openetalk 满麦效果展示这里主播让 ai 给抖音好友打个招呼,这里注意 ai 的 思考方式。

你好,帮我在美团上随便点一份奶茶,不要付款。 是的,你没看错,只需一份命令, ai 便可以自动替我完成从搜寻、点单到下单的一切步骤。而这便是这几日 ai 界的平地惊雷。 而你绝对想不到,我手上拿的仅仅是这一系统的残缺版,而它的完整版能力远超你的想象, 不仅可以自动在多家购物平台中货比三家,筛选出某类商品中的最低价,甚至可以根据你的命令与习惯,替你回复微信、 qq 乃至运营账号。而这便是 auto gm 的 ai 手机助手。 如果你只想像我一样体验残缺版,那么很简单,你搜索 auto g l m 下载就可以了。那么这时啊,就有人会问了,那怎么样才能体会到完整版呢? 不好意思,你可能暂时体验不到了,或者说,哪怕体验了,也有账号被封禁的风险。而这一切,不得不从几天前开始,我愿称之为 ai 界最强,破釜沉舟的 auto g l m 开源。 就在几天前, auto g l m 发布了豆包智能手机,在他的演示视频中,这台手机不仅完全自主地替使用者在各平台间自动评价,甚至能帮使用者完成包括微信回复乃至制作 ppt 等这么多复杂情景。 你可能暂时意识不到这对当前行业的影响到底有多大。来,我打个比方你可能就理解了,当各个平台现在正打得不可开交时啊,各个外卖平台都在给出各种各样的优惠,都在想方设法培养用户粘性时。 现在好了, ai 手机问世了,这意味着你的一切营销、一切用户习惯、设计通通沦为泡影, ai 会自动选出最便宜的那个下单,同样, 竞争将会进一步的移向行业的上游。而很明显,软件巨头也明白这意味着什么啊。某宝、绿泡泡、白狗狗在内的多家公司立马对相关账号进行封禁,堪称史诗级大围脚。 然而他们远远低估了 auto gmm 发起变格的决心,马上, auto gmm 宣布将整套系统开源,是完完全全意义上的开源,意味着凭借它的它开源发布到网上的代码,你可以自己制作出一部豆包手机,这无疑是破釜沉舟, 而当所有人都开始使用,哪怕是软件巨头也无法再对其封锁半分,以丧失大量优势为代价,置之死地而后生。 所以接下来我们不妨预测一下,会不断出现替人安装改良 ai 手机的小商家。紧接着,随着一步步的普及,一步步的传播,软件巨头们将不得不放开对 ai 助手的封锁。而凭借着开源的社会影响力与该行业的从业经验, auto g l m 将会一跃而起,与之相对,包括平调平台、营销设计在内的传统营销行业将迎来缓慢的萎缩。 在这里我只想说,当技术的滔天洪水来临时,填堵只会让其蓄力蓄势的更猛烈,而我们只能学会游泳。 最后,我将下载完整版开源软件的各种步骤,其中可能需要用到电脑啊,需要用到呃,包括租用云服务器、平台等在内的一切操作啊。放在我的评论区,如果你们有软件高手啊,可以根据这个指示好。

没有想到都跑手机的朋友们,恭喜你省了三千五,因为就在昨天的时候,支付把它的 autgrm 开圆了,它可以直接机关你的手机屏幕,替你思考点击输入场景,覆盖了五十多个高频的中文 app, 比如说微信、淘宝、抖音、美团这些核心的场景,它都是可以跑的。 我拿它做了两个小测试,有亮点,当然也有吐槽点。首先第一个点外卖,它是真的可以跑通,比如说你想在美团上去下单,然后到加购,下单路径是很顺畅,你会产生一种错觉, 好像手机里面住了一个非常懂你小助手一样。第二,他的一个跨平台笔架是很实用的,我可以让他对比淘宝和京东同款拖鞋,他能够自己搜,自己去对比,最终给出你的一个结论,这就不是什么聊天机器人了,这相当于一个端侧 a 阵的他真真正正的上桌了。更关键的是什么?他居然很克制, 比如说他碰到了支付或者验证码之类的敏感操作呢?它会自动停止让你接管,很聪明,不会约借。但有一点很值得吐槽,就是现在的形态对普通人是不够友好的,你要用电脑通过 a、 d、 b 去控制手机体验,实际上更像是你在电脑面前远程控制着你自己的手机,就很奇怪。大家如果想要试试,可以找我拿下开源地址 和它的一个部署教程。智普啊, autolm 开源,我想说的是,它的价值不是在完美的体验,而是说它释放了三个信号。第一, ai 手机的异件可能要被打下来了, 以后的 ai 体验不一定要靠很贵的硬件,说不定就是靠的一个开源框架加它的一个端侧的能。第二就是大厂的 for a 阵固城河开始变浅了,开发者和极客们可以直接拆改做出来自己的版 本。第三呢,无障碍和轻量自动化领域绝对是要爆了。对于一些操作是很方便的人群来说,语音加 ai 操作就等于手机自由。欢迎大家评论区留下你的想法。

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓苹果鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包,没有的去下载一个就会弹出资源包,然后打开这个文件包右下角去保存就可以了。 i love you of 1 of 2 1 i love you。

哈喽,大家好,我是知义而行。最近智普开源的手机 agent auto grm 太火了,我第一时间上手体验,发现它和豆包手机一样,能真正实现手机应用的智能操控,不用手动点戳,说句指令就能让它干活。 美团点单能自动搜店选品,关闭广告弹窗,一分半就能搞定下单流程。跨平台比价、预定机票这种复杂操作它也能拆解成步骤,一步步完成。支持微信、淘宝、抖音等五十多个高频应用, 点击、滑动输入都像真人操作,还能应对网络波动、弹窗干扰这些突发情况。更贴心的是支持本地部署,数据隐私牢牢握在自己手里。由于它的操作全是在终端控制台,所以我写了个前端界面来进行连接,方便操控。 不需要手机 usb 插到电脑上,只需要你的手机与电脑在同一局域网,即可有一键扫描功能找到你的手机,而后你就可以给你的 agent 发送任务。看它执行了去支付宝收能量收好友,能量都挺六的, ai 操控手机的时代真的来了,这种所言既可为的体验, 你们不想试试吗? 事情呀! wow, 原来是主人发工资了,三千六百六十六元 o d g o wang, 我 以为是短信验证码呢,哈哈哈, 关哥,快看,主人的手机亮了,是不是有什么重要事情呀? wow, 原来是主人发工资了,三千六百六十六元 o d g o wang 我 以为是短信验证码呢,哈哈哈, 光哥,快看,主人的手机亮了,是不是有什么重要事情呀?


好的,那么现在在我桌面上这个可以移动的窗口呢,就是刚刚部署好的智普的 auto g m 大 模型,然后 右边这个窗口就是我的手机实时的投屏,我现在已经部署好了,所以说我们就直接给它发布一个命令,我在淘宝上找一个一百五十块钱左右的键盘, 我喜欢白色的,帮我加入到购物车 车里面,然后呢再给他一个指令,然后截图发送给我最 进聊天的 qq 好 友,然后他现在就开始执行,然后这个窗口就是我的手机的实时的界面,然后他就已经开始了这个思考过程。 好,那么呢他现在就开始打开淘宝 好,然后他现在打开了搜索框, 然后调用了一个键盘的 app 命令 好,然后他就开始找价格 好,然后他就成功的发现了他的一个推荐商品,刚好是一百五十块钱。 好,那么他现在呢就完成了我这个加入购物车的指令,然后呢看一看他会不会截图再发送我,再发送给我的 qq 好 友。 好,然后他就开始退出, 然后他刚刚点进了一个游戏中心,但他发现了这个对话窗口不是好友,然后他退出去重新打开,然后这一个呢确实就是我的一个好友测试 好了,那么他现在呢?也许,那么他现在呢也选择好了第一张图 好了,那么现在这一个视频呢,就是他执行了一整个任务的过程,但是在过程中呢,我其实是想让他截图游戏键盘的界面,然后发送给好朋友,但是他发错了,现在,但是他最后还是执行好的这个成功执行好这个任务。