粉丝33.5万获赞342.2万

免费了,不要三四九九,也不要九块九,不包手机的平替智普的开源项目 open auto gm, 配合它的开源模型 auto g o m 九 d, 咱们也能实现手机 agent 的 自由。我用手上这台安卓手机和 mac 电脑搭好的环境,让他来帮我购物, 这是执行效果,提示词是在淘宝上找到帮宝适黑金刚 l 码最低价的商品,加入购物车,然后发微信告诉我商品选好了。我来看看。这套开源方案和豆包手机最大的区别有三点,第一, 一,运行级别不同。开源方案只能在前台运行,豆包手机可以在后台自己默默的运行。第二,手机的便携性不同。开源方案手机和电脑必须用数据线连接,或者是在同一个 wifi 下,豆包手机可以只拿着手机到处走。三、智能程度不同。 开源方案接的是九 b 参数的小模型,能完成大部分的基础场景,但是极限智能比不上豆包手机。推荐两种适合的使用场景。 场景一,操作电脑忙不开的时候,比如快下班时提前叫车,当同事还在等车的时候,你已经上车回家了。场景二,需要在手机上多个 app 之间切换,收集数据,分析并且最终操作手机的场景。比如说在双十二购物选择最低价格商品时,我的微信收到消息了,任务完成。 牛逼!那么这么牛逼的手机, a 镜的方案会不会很难配置呢?完全没问题,我摸索了一套极简方案,只需要一行命令和一句话就能配置好。 首先看我这期视频,一行命令把 cloud code 安装好,然后打开 cloud code, 告诉他这句话,一路点同意就能安装完成整个配置过程,需要用数据线把安卓手机 在电脑上这么简单都能就能搞定,快去配置一套试试吧!你还有什么场景想用手机 app 来解决的?详细的安装过程和常见问题我会总结成文档,方便大家查看。关注我,玩转 ai 编程。

从豆包手机被封杀到智谱开源先桌,仅仅十天,中国 ai 圈最精彩的攻防大战来了。先给大家列一下时间线。十二月一日,字节跳动发布了豆包手机助手。十二月二日,绿泡泡开始封号。 十二月三日,豆包被迫下线绿泡泡操作功能。十二月九日,智谱 ai 宣布开源 auto g o m。 整个事件流程呢?在十二月一日开始,字节跳动,豆包团队联合中青推出了一款豆包手机助手。你一听可能觉得不就是手机助手吗?可能各家都有对不对, 但是一看完演示,很多人睡不着觉,他能帮你点外卖、订机票、比价格、回消息,甚至可以替你玩小程序的小游戏,你动动嘴,它就可以自动帮你操作 app, 就 像给手机装上了自动驾驶。这意味着什么呢?过去我买东西需要打开淘宝刷首页,看广告比价。现在呢,你只需要对 ai 说,找件两百块以内的黑色卫衣,淘宝、京东、拼多多比上价格, 然后最便宜的价格就没事了。 ai 呢,它绕过了所有的首页广告以及信息流平台,花费了十几年搭建的流量漏洞瞬间就被穿透, 这才是大厂真正的危机。果然,反击来了,十二月二日,有用户用豆包操作绿泡泡时,账户被封。随后呢,淘宝频繁的跳出人机验证,银行贷在录屏的状态下也被限制登录。七十二小时内,微信、淘宝、银行三道防线全部筑齐。 十二月三日晚上,豆包手机助手团队发布了一条公告,原话是豆包手机助手 pro 模式已经下线,操作,微信等在 m 幺三五上被禁止登录的微信账号正在陆续解封, 请大家等待一段时间,并尝试重新登录。这一步退让呢?其实呢,在很多人意料之中,毕竟豆包 ai 再牛,微信被封,这黑锅也不能背啊,这可是十二亿人的社交基础。所以当时我认为 ai 助手这件事情可能要凉了,但真正的高潮发生在后面。十二月九日,智普 ai 突然宣布 开源 auto g o m。 简单的给大家说一下,这就是一个智普版的豆包手机助手,可以操作各种 app, 而且开源的是完整的 app, 用他们的话说,就是要把这一层能力变成行业通用的底座。 什么意思?大厂可以封一家公司,但是他封不了整个开源社区。技术一旦公开,谁都可以做自己的 ai 助手,华为、小米、 oppo, 甚至是你自己,不需要字节的许可, 不需要中心的手机,更不需要任何人授权。这哪是反击啊,这是直接掀桌子。那么问题啊,有人会问,大厂到底在争什么?表面上是隐私安全,但实际上呢,就是流量入口过去啊,互联网生意的本质是什么呢?注意力经济、 首页广告、信息流广告、搜索排名,每次的点击都是真金白银。 ai 助手呢,直接帮用户完成任务,注意力被截胡了,所以商业模式也被动摇。但开源呢,就像一场技术的民主化, 原来只有大公司能掌握的核心核武器,现在是人人可用,技术的潮水终究是难以抵挡。但是这场攻防战和我们有什么关系呢?因为对于普通人来说,他可能直接决定未来我们要怎么样使用手机。 过去十几年,我们是打开 i、 找淘宝、点美团、刷微信。未来可能变成说一句话, ai 可以 帮你搞定笔架、下单、订票,把那些重复的操作可以交给 ai, 而我们或许能够腾出时间去做更多需要创造力,需要人情味的事。 ai 呢,不是为了让人变懒,而是让人更有时间聚焦于人该做的事情上。 这十天呢,我们看到了围角,也看到开源的反击,看到商业的博弈,更看到了技术的不可能。但唯一可以确定的是,技术的浪潮是真的要来了。我们呢,要学会在潮水中游泳,这比筑墙更重要。我是 x, 更多 ai 相关资讯关注我!

十二月九日,智普正式开园,全球首个支持智能手机全流程操作的 ai 智能体框架 auto g l m 只在推动 ai 手机普及。 该模型具备 phone use 能力,可识别屏幕元素并模拟真人操作,如点击输入支持微信、淘宝等五十加高频应用,完成外卖、点单、机票预定等复杂流程。核心突破 一、云端隔离, ai 操作在虚拟手机执行,与用户物理设备隔离,避免隐私泄露。 二、安全机制,不收集敏感信息,支付等高风险,操作需人工确认。三、开源生态,硬件厂商可基于 auto g l m 快 速开发 ai 助手,打破技术垄断行业意义, 降低 ai 手机研发门槛,推动生态从封闭走向开放,加速 ai 终端普及,未来或推动手机从工具向智能管家转型。


未来,谁将掌控你的手机?短短十天时间,中国 ai 圈发生了一场极其精彩的生死攻防战。从豆包手机助手的惊艳亮相,到大厂门的快速反击,再到制服 ai 的 先桌开园,这场戏看得我是热血沸腾。 十二月一号,豆包手机横空出世。十二月二号,微信开始定点封号。十二月三号,豆包被迫下线微信操作能力。 十二月九号,智普开元,直接掀了桌子。一开始啊,我也没太在意,毕竟手机助手这种东西,不就是像小爱小艺那样,定个闹钟,查个天气吗?但是当我刷到演示视频时,我整个人都震惊了。 他能帮你点外卖,帮你订机票,帮你在淘宝、京东、拼多多全网比价,他甚至还能帮你回复微信消息,帮你玩小程序游戏。过去你想买一件衣服,你得打开淘宝吧,看看首页推荐,刷刷信息流,看看广告, 然后搜索比价,再看看哪款更合适自己,然后才是加入购物车。现在呢,你只需要对豆包手机说,帮我找一件三百元以内的黑色冲锋衣,全网比价最便宜的,加入购物车, 然后豆包手机助手就会直接帮你找出最优解,你直接付款就完了。你甚至都不需要打开淘宝的首页。这哪里是普通的手机助手,这简直就是手机版的全自动驾驶。难怪周鸿祎说 电商和外卖大佬们要彻夜难眠了,他把所有超级 app 十年磨成的流量漏斗一脚踢飞了。资本市场也疯了,中兴通讯直接涨停,据说工程机三千四百九十九元的价格,在二手平台被炒到了上万,你说美团、淘宝、微信这些大厂能干吗? 你绕过了首页,谁看广告?你自动比价,谁还刷信息流?你这动的不是隐私啊,你这动的是人家的印钞机,所以你看不到二十四小时,反击就开始了。 十二月二号晚上,就有用户发现用豆包操作微信时,账号被封了,提示登录环境异常。这些被封的用户全都是用了豆包的微信操作功能。 紧接着,淘宝比价时,频繁触发人机验证闪退和强制登出银行的 app 更狠,检测到录屏或者代理操作,直接拒绝使用。七十二小时内,微信、 阿里银行三条防线全面拉起。理由是安全,但大家都懂,他们这么做到底是为了什么 字节呢?秒怂!十二月三号连夜发公告, pro 模式下线,微信操作被封,账号会陆续解封。毕竟微信是十二亿人的数字,身份证这锅谁也背不起。说实话,看到这条公告的时候,我是有点失望,但万万没想到高潮还在后面。制服 ai 直接掀了桌子, 宣布开源 auto g l m 听不懂技术没有关系啊,你只需要知道,他就是智普版的豆包手机助手。智普把这套自动操控手机的核心技术免费送给了所有人, 代码完全公开,不用大厂授权,不用中兴手机,谁拿去都能造一个自己的豆包手机助手。智普公告里有一句话说的太燃了,大概意思是,这项能力只由一家公司掌握是不够的, 我们希望他成为行业的公共底座,大家一起打磨。意思说的很明白,你大厂能封杀一家公司的产品,但你能封得住成千上万开源社区的开发者吗?封得住无数自建私有化部署的个性化硬件,他吗 这就叫,既然我不进你的门,那我就把围墙给拆了,这才是真正的千桌。这场公房真的到底是什么呢?表面上是隐私安全,微信说你读聊天记录不安全,淘宝说抓取数据不合规, 银行说录屏操作有风险,这些理由对不对?对!但更深次的原因是,流量入口的生死战,真的是你下一眼落在哪里?过去十几年,大厂靠着什么赚钱?靠流量?靠注意力? 打开 app, 先刷首页广告,信息流推荐、搜索排名,每点一次都是钱。现在 ai 来了, 直接绕过这一切直达任务,结果用户的时间被截胡,广告位成了摆设,大厂能不慌吗?这不是隐私问题,这是断财路啊!但技术浪潮是能用风沙挡得住的吗? 开源就是王炸。想想当年 linux 开源击败了微软的围角,成就了云计算和安卓 莱尔玛。开源加速了全球大模型的追赶,每一次开源都是对封闭生态环境的降维打击制服。这一次,就是把 ai 操作系统从少数大厂的私器,变成了人人可用的公共工具。 以后不止自己能做,华为、小米、 oppo, 甚至你自己都能做。大厂封得住一个产品,封得住一个开源社区吗? 微软当年骂 linux 是 癌症,结果后来自己也拥抱了 linux, 还承认自己站错了队。历史总是惊人的相似,二十四年前,微软围搅 linux, 二十四年后大厂围搅 ai 智能体。二十四年前,微软说 linux 是 癌症。二十四年后,大厂说 ai 手机助手侵犯隐私, 二十四年前,纽纽克斯选择了开源。二十四年后,日普也选择了开源。二十四年前,微软以为自己能灭了纽纽克斯,二十四年后,大厂以为自己能封杀 ai 智能企, 结局会怎么样呢?我这里不敢打包票,但我知道大厂能灭一个产品,但灭不了一种趋势。技术、潮流从来就挡不住这场攻防战,将决定我们普通人未来能怎么样用手机。 过去我们买东西要打开淘宝,点外卖要打开美团,聊天要打开微信。未来 ai 助手普及了,你只需要一句话, ai 就 能帮你比价、选品、下单、订票全搞定。 app 界面不重要了,用户注意力分配改变了 互联网商业模式要重写了,那些重复机械的操作交给 ai, 我 们呢?省下时间去做更值得做的事。我相信,虽然历史在重演,但任何反潮流的势力终将被毁灭,谁也无法阻止时代的进步。

别眨眼啊,只要两分钟的时间啊,你家里的任何一个老破手机就能瞬间变成一个 a i 手机啊,就像最近的这个豆包手机一样,直接帮你在手机上订票、点咖啡,甚至帮你在手机上答题,帮你考试,帮你剪辑视频。 而且啊,这还不是一个功能演示,它是真的开始自己操作手机了。比如说啊,我随手说帮我买一张去上海的高铁票,紧接着你都能看到这个 ai 就 像一个真人一样,在手机上帮你查票、选班次、下单,这所有的完整流程一步步走通。 这是因为啊,智普团队刚才把他们打磨了两年多的核心技术 auto g l m 直接给开源了,这简直是太离谱了啊,要不然很多人说 ai 一 天地上一年呐, 一两周前啊,多少人还在感到稀奇的 ai 操作手机的能力,现在就成了人人可用的开源神器,让 ai 可以 真正的接受任何设备,把结果直接交付到你的手里。 而且啊,这次开源的还不仅仅是一个手机智能体的完整执行框架,还有一个叫做 auto g l m 风九 b 的 大模型啊,这个大模型直接开放给所有人, 它可以用视觉语言模型进行整个屏幕的感知,然后再结合智能的规划能力来生成并执行操作流程。用户只需要用自然语言描述需求,比如说打开某个 app 搜索美食并自动比价,然后呢,就能自动的去拆解用户的意图,理解当前的界面,规划下一步的动作,并且完成整个流程。 而且它还内置了敏感操作的确认机制,一旦需要付钱登录或者收验证码的时候,它就会马上让你二次确认,同时啊,还支持远程控制, 你完全可以一边在外地旅游啊,一边让 ai 在 手机上帮你操作钉钉或者是企微给你的老板汇报工作,他 把一个原来被视为大场合武器的技术,直接变成了所有普通人唾手可得的一个工具。所以啊,巨头们他或许可以去围绞豆包手机,但是呢,他不能围绞千千万万个基于开源框架自建的个性化的智能体。 而且啊,这整个过程呢,可以完全在本地运行,数据根本就不离开你自己的掌控。所以之前很多人担心的被豆包获取一切个人数据的问题啊,就这样迎刃而解了。因为九 b 这样的小模型啊,完全可以把模型和数据都放在自己本地的电脑上面。 所以从此之后啊,你的手机很可能就再也不是一个手机啊,而是一个长期在线,只为你一个人服务的超级私人智能体。 前几天啊,我看到很多人都在讨论豆包手机和平台入口的这么一个争夺,但是完全没想到这样的一个入口很快就会变成一个全民普惠的能力。就 像 deepsea 把高高在上的 open ai 打得措手不及,甚至是频频降价。这次的 auto g l m 的 发布啊,最关键的地方就是让我们不用再担心某家大厂垄断你的手机操作能力,它就像当年的安卓一样,可以被无数的人模改驯化叠加,最终呢,就会被调教成每一个用户最喜欢的样子。 所以具体怎么才能让你的手机变成 ai 手机呢?非常简单,大家跟着我操作啊,只要打开 github 上面我给的这个项目的网址,然后呢,里面的介绍全是中文的啊。然后你直接开启你老手机的 root 权限,然后下载模型进行操作就可以了,赶紧去试一试吧!关注 c 哥,了解更多 ai 前沿!

就在昨天,全世界所有的安卓手机都可以用上真 ai 了,中国的智谱正式宣布啊,他们把全世界第一个为手机而生的通用 agent auto gm 给开源了,是的,完全免费开源了。也就是说,从今天开始,世界上任何一台安卓手机啊,都可以用 ai 来完全操控了。 ai 会自己看屏幕,理解界面,然后自己规划思考, 最后模拟出你手部的点击,滑动输入,帮你完成各种各样的操作,而你全程都不需要碰屏幕,完全交给 ai 就 可以了。现在我跟 ai 说帮我点三杯冰美式, 看,他就可以自己思考自己操作了,一步一步点击,完全不用我管,我们再试一个,如果让他对比一下这个显示器在哪个平台更便宜,帮我决定一个,自己下单。然后你看啊,他是真的开始了多步骤操作,现在淘宝搜了一下,然后把价格记下来,然后再去京东搜了一下,把价格记下来,结果还去拼多多看了一圈,然后真的帮我选了一款真的很便宜很便宜的款,这个羊毛真的给它薅到了, 操作的过程就跟真人人手一模一样。最后我们再试一个超级无敌难的版本,我下周六要去长春玩,帮我总结一下这个页面上推荐景点,然后在高德地图上收藏一下这个景点,看一下门票的价格,然后再去一二三六订一张上午实验从北京去长春的高铁票,然后再把香味信息整理好给我,他就开始自己干活,自己搜索,一个一个搞, 打开一二三零六开始帮我看动车票了,而我自己只需要最后付款那一步看一下,确认一下就可以了,你看这个过程是不是真的超级夸张,这个已经不是简单的那种自动化脚本了,而是真的完全用 ai 来去驱动,也就是一个住在你手机里的数字生命。我觉得这个才是我心里面的 siri 该有的样子。 这次可以做到这么猛的效果,也是因为 autim 他 们用上一套视觉语言模型,他可像人一样自己去看懂屏幕上内容,知道哪里是按钮,哪里是输入框,然后再模拟人的点击、滑动、输入这些操作。所以理论上它是可以操控任何一个 app 的, 根本就不需要其他厂家的配合,而是直接变成了一个人类的用户。 我看一下开源社区他们的界面啊,现在已经支持了五十多款主流的 app, 大家关心的微信、淘宝、抖音、 b 站、携程这些全部都可以用。而自古这次把它开源了,我觉得这个意义真的非常重大,因为它解决了一个大家都很关心的问题,隐私问题。如 如果要操作我的手机,那我的聊天记录、支付密码怎么办?而现在因为代码是开源的,所以你可以完全把它部署在你自己的手机跟电脑上,我们就是一台五零九零显卡去跑的, 所有的数据都在你的本地,根本就不会上传到云端。而且有了开发的社区,大家一起去完善这个项目,速度只会越来越快,可以做的事情也越来越多。而从今年开始,像 google、 苹果,还有其他那些巨头大厂,大家都在试着让 ai 真正学会操作手机这件事情, 没想到智普直接在年底就开园了,现在每个人都可以下载来直接用了,所以我觉得二零二六年的手机市场跟 ai 市场啊,应该又会迎来一波腥风血雨了。


大家都知道,最近豆包手机的发布,让阿里、腾讯等大厂连夜开会,纷纷给豆包手机助手设置封禁权限。然后前两天智普开源了他的 auto g l m, 这是一款类似豆包手机助手的软件,既然开源了,那我们肯定要测试一下。 打开应用商城,搜索 auto g l m, 点击安装,这就安装好了。然后我们来测试一下功能,帮我用美团点一份三公里范围内卖的最好的奶茶, 帮我打开微博,进入刘亦菲的主页, 帮我用 qq 音乐播放一首林俊杰的歌曲, 帮我用携程订一张十二月十四日下午北京到上海的高铁票, 整个过程还是很流畅的。要知道豆包手机目前是秒断货,二手市场甚至加价几千再卖。 auto g l m 作为开源的模型,我们还能直接拿框架进行二次创作,比如可以集成到现在热门的人形机器人身上,提升这类具身智能的沟通能力。 随着 ai 的 迅速发展,我们更多地倾向于通过这些大厂开发出来的 ai 落地应用,欢迎一起探索 ai 的 可执行方案。

神功智能闪文智普开源其核心 ai agent 模型 opglum, 该模型被业界视为全球首个具备手机操作能力的 ai agent, 能够稳定完成外卖、点单、机票预定等长达数十步的复杂操作流程。 目前, opglum 已支持微信、淘宝、抖音、美团等超过五十个高频中文应用的核心场景。