就在豆包手机爆火的当下,智浦开源了 auto g l m 手机智能助理项目,让每一台安卓手机都能成为 ai 手机。 auto g l m 通过 a d b 来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作。我用它帮我在小红书上搜索豆包手机话题, 并且收集点赞超过一百的笔记。可以看到,配合一并开源的九 b 小 模型,全程无需人工干预完成了任务。不过目前智能能力还不够,计划后续换成 gemini 三 pro 再试试,看效果能不能更好。
粉丝9346获赞5.6万

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓、苹果、鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包, 没有的去下载一个就会弹出资源包,没有弹出的去首页输入鱼饼大全,然后打开这个文件包,右下角去保存就可以了。

今天给大家分享一个豆包手机同款的开源项目,也就是最近特别火的智普,他们开源的 open oto g l m 是 专门用于控制这种托管手机的智能体。这个是一个框架,也是一个项目,但是这个总体来讲它的亮点大于实践, 主要有两个比较大的创新。第二个就是他们这个框架是可以进行这种手机的 连接,其实它跟按键精灵是差不多的,甚至它比按键精灵要小或者简单很多,实现了电脑和手机的远程操作,可以直接连 usb 或者直接在一个 wifi 里面就可以进行对接和联通。 我也详细梳理了一下这个项目,它开源的话其实并没有开源特别多的东西,像一些 memory 记忆体啊,这些记忆模块都没有开源,而且它只有一个智能体模块,它更像一个 simon, 而不是实际的一个项目。因为他在去年的时候其实是呃发了一个 app 的, 也是 otoglm, 但是在后面就没有特别多的推广了,而且效果也一般。 但是由于这一次豆包手机大火了之后,他借着这个风也做了开源,让大家也看到了这个项目。 我们详细来梳理一下这个项目。首先它的主要的架构就是你可以支持用它自己的本地模型,当然它都是使用的这种 best url 的 方式,你可以用本地的,也可以直接用现成的,但是那个模型必须要支持能元素定位, 现在币源的模型几乎都可以多模态的,最近的微软也开源了一个三 b 的 模型,应该性能也是蛮不错的,做元素定位,而且思考的模型 应该性能也是蛮不错的,但是他没有跟这个模型做一下对比,不知道他们九 b 的 这模型跟这个微软开源的三 b 的 模型比起来怎么样,应该大差不差,因为微软这个模型稍微小一点点,但是测试起来效果还是蛮不错的,而且小了之后才能在我们这种本地的这种显卡上面跑。九 b 还是挺大的,不算小了, 但是他有量化的,不过肯定是需要二十四 g 才能跑的,三 b 的 话做一些量化操作的话,也是可以让他实现在十二 g 内存上面跑的。 我重点比较疑惑的就是它到底有哪些工具和它这个智能体,它是什么样的一个智能体?它智能体只有一个智能体,然后我也没有 memory, 也没有记忆的规则,然后主要就是典型的 react 智能体, 整个流程就是典型的感知、思考、行动的这样的一个循环。然后每一次它做任务的时候或者下发任务的时候,它就会把整个 手机的系统去构建一个上下文,他的系统有什么应用这些,还有他的截图,就构建这样整体的一个上下文,加上你的一个任务规划, 然后他通过思考思考了之后去规划出来一个计划,然后去做执行,每一次执行了之后,他再进行一次思考,然后再进行执行,直到完成任务为止。当然他还有一些敏感操作,比如说验证码,比如说 要进行付款呀,这个是要人工介入的,它会主动的提示你们,我重点是想要知道它有哪些工具,或者可以执行哪些操作,是怎么样执行的?然后我就让它梳理了下,我是用的这个 deepweek 来做的,梳理它的工具也 跟按键精灵是差不多的,甚至比按键精灵要简单很多。首先就是启停指定的应用,然后手机上面关键的那几个按钮,还有就是滑动输入文本,返回上一页,还有点击,这些都都是可以的, 主要用的就是滑动文本和点击这几个,然后启启停应用,切换应用,这都是标准的按键精灵里面的东西。然后就是操作他的其实是一个相当于方寸扣领,点击某一个按钮去调用这某一个工具,然后有一些比较标准的规则, 应该执行前要检查应用,然后最多呢连续的等待三次,验证这个操作是否可以 进行操作。然后就是完成之后检查一下它的准确度,其实整体看起来它是一个 demo 的 形式,它并不是一个特别完整的项目,只是一个 非常简单的 demo, 稍微复杂一点的可能就是它搭起来了这样的一个框架,你自己可以去加一些 memory, 或者说加一些什么东西,然后我去可以放在你的手机里面,可以进行继续的二次开发。 总体来讲这个项目还是不能直接拿来做实际的运行的,可以做二开,这个是可以的。然后我都还专门让它梳理了一下它的记忆模块有没有,它是没有记忆模块的,它只有它模型上下文 token 的 这样一个上下文,然后这些提示词它都是用的中文呢?然后必须遵循的一些规则, 这些提示词其实还可以拿来做一些借鉴这些智能体的提示词借鉴还是蛮不错的。还有像这些执行动作某一个 app, 然后这就是它们方选透的一些东西了,当然做成 mcp 其实也是可以的。

我哥前几天想买那个豆包手机,但又舍不得给黄牛加钱,说是想体验那种干任何事说句话就能让 ai 去做的皇帝感。然后就在网上找了半天,找了个开源项目能在自己手机上部署,问我靠不靠谱。 我看了一下这个 openwater 开源项目模型,确实有那么点靠谱,可以说它已经不是模型了,它是 aint 加模型加手机执行器了。 饭喂你嘴边了,看你会不会张口了。都知道豆包手机其实就是字节跳动。找了中兴通讯代工生产的努比亚 m 幺五三 豆包,找中兴旗下的努比亚生产了豆包手机,那豆包助手服务是不是得运装在手机的系统层里?这和你在应用商店下的豆包完全不一样,系统权限不在一个层面,就跟租客和房东一样,租客虽然进入到这栋房子里,但权限肯定不如房东多, 所以豆包手机才可以跨 app 自动化操作。那 openwater gym 可不可以部署进你手机里,像豆包 os 那 样跨 app 自动化操作,而且不受权限限制呢?在技术上很难,让我哥用上肯定更难。 首先这个开源项目的执行通道用的是 adb 加 accessibility, 豆包手机小米、澎湃、华为、小 e 都或多或少用了 adb, 因为在前几年, adb 靠着可以打字截图、强制开关 app 文件读写、获取数据这些能力深受技术喜欢, 还能进行连续滑动、自定义速度滑动、模拟人类的 pad 滑动等等,不让 app 发现。技术上 ok 的 情况下, adb 当时确实是执行通道的主流。但谁说你和中标公司资质一样你就能中标啊,你手机还要开发着模式,别人厂商可是直接白名单开路, 有内部接口和系统鲜明相助, adb 早落伍了,出来混要有实力,要有背景。你哪个大厂的?你没背景想靠微型做精准点击,但现在每个 app 的 弹窗位置 ui 图形都不一样,隔一段时间 app 更新去换一下,就算 ai 能力强,延迟也高。 不好意思啊,前段时间这里修路忙到被占了,盲人不能精准走路,还是别出来了。我知道 ai 手机可能是未来,但是我哥一个普通人代码都看不全,你敢给你手机装能无障碍通行的 a 进的进来,信息数据盗取怕不怕?后台运行怕不怕? 更何况部署还要服务器或者电脑,何必呢?还让子弹先飞一会儿。欧菲华米这些大厂都还在观望呢,如果都把手机突破了这些 app 的 封锁,那到时候就像外卖大战一样,百家争鸣,你肯定可以用上让你满意的。 但如果豆包手机没突破封锁昙花一现的话,那我讲实话,你就算是钢铁侠贾维斯来了也白搭,听懂了吗?哇哦,你真聪明啊。

相信关注科技圈的朋友啊,最近都注意到了,本周呢有一款最新发布的手机啊,是非常的火热,可以说是一机难求,大家来看一下,就是我现在手上拿到的这款,那从外观来看呢,它其实跟我们平时用的智能手机啊,没有太大的区别,那之所以会受到如此大的关注啊,就是因为它搭载了一款 人工智能大模型,也就是我们所熟悉的豆包。那话不多说,今天我们就带大家来一次沉浸式的开机测评。那刚才登录进来之后啊,我也是按照他的流程设置好了这个豆包语音助手,然后我也下载了一些我们日常常用的一些 app, 我们现在就来跟他做一个这个交互,看看豆包助手能帮我们做到哪些事情。我现在通过这个语音啊,可以直接唤醒豆包,豆包豆包 帮我查找一下携程旅行上关于上海的旅游信息,并帮我生成一份旅游攻略,正在帮你操作,手机结束后会马上告知你。可以看到输入这个指令之后呢,他其实在后台已经在开始帮我执行一些功能,我们可以在这里点进去看一下,我现在是没有触碰到手机的屏幕,但是他已经开始自动的来执行这个信息的检索 来看一下,包括像这样滑动页面,其实都是豆包助手他自己在执行的一些操作。携程旅行上收集到上海的旅游信息,并生成旅游攻略,内容如下,我们来看一下他生成的这份旅游攻略啊,相当丰富啊,刚才看了一下,那我们现在来试试,让他再执行一下任务,豆包豆包, 帮我订一张明早九点从北京到上海的机票,正在帮你操作手机结束后会马上告知你 这里,他会给我一个选项,他列举了一些这个航班,需要我来告诉他我需要哪趟航班。 体验了豆包助手的一些功能之后,我有一个非常明显的感受啊,就是他的这个人机交互的功能还是非常强大的。还有一个比较明显的感受啊,就是目前来说,他在执行任务过程当中呢,这个等待的时间啊,其实还是比较漫长的。比如说我刚才第一个任务,他执行的时间前后加起来大概会有十分钟左右的这样一个等待的时间。 包括这两天我在网上也看到大家的一些评论,比如说他的一些软件兼容的问题,包括一些涉及到安全隐私的问题,我想呢,这可能也是需要在后续的这个真正使用过程当中啊,去进一步的优化或者磨合。目前是其实各位很多的智能体都在里面,但是大部分的智能体都是双方各走各的,事实上智能体他是浮在这个手机的系统上面的, 他不是存在手机系统里面,通过来说,他就有可能在这款手机上面做了最初的尝试,以后能到什么程度,我们还需要观察。从现在他自己没有做系统,所以他对这个系统他要进行改造,他要理解,他也有很长的路啊,要走。

hello, 大家好,最近这个豆包手机助手它很火呀,然后随后这个 auto gm 就 开源了他们这个智浦家的这个手机助手的这个开源项目, 然后我做了一个这样的一个制装包,这样可以让更多的小伙伴可以很方便的就拥有自己的这么一个手机助手。然后大家可以到时候下载这个安装包,然后点那个启动文件,然后在这里 这个,然后点击启动程序。好,这边是有两个模式啊,如果家里有这个 gpu 条件允许的话,可以用这个本地模式去补水,如果没有的话,我们就选择二,这里有个云端,就是直接去对接支付家的 api 啊,现在这个地方是这个 api k 申请的地方,就是大家注册账号之后,在这里新建一个自己的 api k, 然后去复制这个 api k, 然后粘贴到这个位置之后就可以直接用,但是现在默认用的是我自己的,但是大家收到之后我可能会取消掉这个平台,大家可以自己申请,这个是免费的, 然后这样就启动成功了,启动成功之后呢,我们就可以输入我们的这个命令,然后让他去执行,我现在是让他打开拼多多,给我搜一个哑铃,最近在家有点无聊健身了, 然后大家可以看到这个东西打开之后先挑出了一个广告,然后我们的 ai 是 比较聪明的,哎,也不能说聪明吧,是,反正是这个问题他解决掉了,因为他目前这个是采用视觉方案去处理的, 然后这里搜了一下,然后这个任务执行完之后呢,这里会有一个反馈,大家可以看一下, 效果还是不错的,包括响应速度啊,也是可以看这个是任务完成的一个反馈啊,让他打开第二个任务,我让他打开网易云,然后给我播放一首安河桥, 这个估计有个一两秒的出力时间吧,然后呢跳转到了这个网易云,然后大家可以看到这有个 one 搜索出了这个安河桥啊, 然后现在给他打开之后就可以给我们进行播放了,哎,对,就是这个全部过程他都是自己执行的,然后同样他也是输出了一个这样的运行结果。 然后后面我会把这个整个这个一键包发到我们的评论区啊,大家可以去下载交流,包括有任何问问题啊反馈都可以直接来找我。 ok, 谢谢大家观看。

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓苹果鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包,没有的去下载一个就会弹出资源包,然后打开这个文件包右下角去保存就可以了。 i love you of 1 of 2 1 i love you。

火爆全网的豆包手机今天正式开园了,没错,从现在开始呢,任何人都能够拥有属于自己的 ai 手机操作员。就在前几天呢,智普突然放出了一个大招,把整整研究了三十二个月,能像真人一样去操控手机的 autolm 连模型、代码框架全部免费公开。重点来了,它的能力呢,几乎和豆包手机是一模一样的。为了证明不是噱头,支付还给出了一段官方的演示,只要给 ai 一个任务,规划行程,发送消息,完成购票结果。 autem 展示出的操作呢,让所有人倒吸一口凉气。 自动打开了不同的 app, 自动精准的定位页面,自动输入内容,自动滑动界面,自动选择行程和时间,自动完成了下单流程,整个过程稳准,像真人一样自然流畅。重点是呢,它的推理链路全 全程都是透明的,每一步都能看得见。另外,开源之所以会被全网刷爆,原因还有两个,第一就是安全,代码给到你,数据留在本地,手机里面发生的一切都在你的掌控范围内,不需要担心外传后台上传隐私的风险。第二呢,就是门槛低,任何人都能把它装进想要装的应用里。就像当年安卓开源,让智能手机从少数 咱的玩具变成了所有人的标配。而奥特 g m 开源呢,意味着 ai 的 操控设备呢,即将走向全民普及。智谱呢,把奥特 g m 公布出来,不是独占技术,而是把真正的创新呢,诞生在每一个愿意动手的人手里。

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓苹果鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包,没有的去下载一个就会弹出资源包,然后打开这个文件包右下角去保存就可以了。 i love you of 1 of 2 1 i love you。

每天教会大家白嫖一个实用软件,今天教会大家获取的是全网爆火的智普开源 auto glam, 一 款超级好用的 ai 软件, 简直就是今年王炸,内有生活助手、工作助手两个板块,而且完全开源,人人都可以拥有豆包手机。接下来我手把手教会大家如何下载,同时支持手机、平板、电脑三端,操作简单便捷,小白也可以轻松学会。第一步,点我视频分享复制链接, 找到这个软件,打开没有的,下载一个,允许黏贴,它会弹出个资源包,如果没有弹出的话,我们在这里搜索金子工具,找到软件合集,看到这个保存安装就可以使用了。

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓苹果鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包,没有的去下载一个就会弹出资源包,然后打开这个文件包右下角去保存就可以了。 i love you of 1 of 2 1 i love you。

从豆包手机被封杀,再到智普开源整个代码,这十天我看到了中国 ai 最精彩的一幕。十二月一号字节发布了豆包手机,十二月二号,微信开始大飘封号,十二月三号,豆包被迫下线微信的操作能力,十二月九号,智普 ai 直接开源凹凸 g l m 直接掀桌。 这字节,这个豆包手机啊,刚开始的时候,我就以为他跟那个小米的一些小爱同学,或者是一些华为的小 b 一 样,就让他查个天气,定个闹钟啥的。 不过当时那个演示视频,我看完我人都傻了,这哪是什么手机助手啊,这根本就是一个自动驾驶了吧。 对,他不仅能帮你点外卖,他还能帮你比价,比如说我要点个外卖,我要买个两百块钱的毛衣,我只需要给他一个指令,他就自动会去京东啊,会去淘宝啊,会去拼多多,他自动比价,然后他会找到一个最便宜的,直接跳到支付页面,你只要输入密码就行。 怪不得周五一看完视频,直接就说这个美团淘宝的高管看完这个豆包手机之后,他们得连夜开会,我觉得他说太对了,这个会肯定得开啊。你想一想这过去这些年那些超级的 app, 他 们精心设计的一些流量入口,那基本上就轻松绕过去了,那用户都不用看广告了,那其实他们的布局就已经全毁了, 所以说大厂的这个围角反击就特别快。豆包手机发布第二天,十二月二号中心就涨停了,豆包手机在闲人上卖了六千多,但是同一天晚上,微信就开始批量封号了, 因为很多用豆包手机操作的这个微信用户呢,直接提示登录环境异常,你包括这个淘宝也出手了,淘宝还有其他的 app, 在 豆包手机操作的时候,就会疯狂的跳人机验证, 这就是一个大场的反应,在短短的七十二小时内,像什么微信,淘宝还有银行这三道防线基本全立起来了, 有人说这是定点打击,其实这个就是围脖,懂的人都懂,这就是侵犯了别人的利益了呗。其实大家也知道,这也不是什么隐私之争,是人家的流量入口之争,这基本上等于断了人家的财路。而且你想到了十二月三号,豆包就直接发布他的公告,认怂了,下线了他的微信操作能力, 其实这个也在意料之中,毕竟这个微信是十二亿人的一个生态,豆包手机再牛,他也不能让十二亿个人都被封吧。 但是如果每一个 app 一 言不合就不兼容封号,那么这个豆包手机终究只是在自己的 app 里玩,它根本就不会辐射到整个生态。其实我当时就觉得这个豆包手机估计要凉,只是我没想到这个高潮来的这么快,就在十二月九号,智补 ai 直接投下了一个重包炸弹,宣布开源凹凸 g l m 这个就是智补版的豆包手机,而且这是它开源的,不仅是严格版的,它直接把核心模型都亮出来了,再 get up, 大家直接就可以用。换句话说,只要你愿意,你也可以拥有一个自己的豆包手机, 不需要任何人的认可,也不需要任何人授权,你自己把那个部署一下,自己就可以用了,其实这就是闲桌,大厂可以去围缴豆包,但是你没有办法去围缴一个真正的开元社区,也就说你其实可以杀死一个人,但是你没办法杀死千千万万个人。这也让我想起一段话, 最好的防守其实就是进攻。这一幕真的太熟悉了。二零零一年,微软当时就围缴了 linux, 就是 一种癌症,因为那个时候啊,其实微软要围缴这个 linux, 其实不仅没死,而且现在也成为了一个夫妻的一个主流啊。到了二零一四年,微软换了 ceo, 然后他上台就说我们爱 linux。 到了二零二零年,微软直接公开承认当时的决策是错误的,所以说历史还是惊人的相似,像二十四年前,微软说 linux 是 癌症,而像现在啊,大厂又说多宝手机,他侵犯了隐私, 所以说结果是一样的。你现在大厂消灭了一个豆包手机,但大厂消灭不了千千万万个豆包手机, ai 技术的眼镜就从来它就不是某一家公司,它能够阻挡的, 也是当年的微软阻挡不了微软,就像现在大厂其实也阻挡不了豆包手机是一样的。那你说我们说了这么多的大厂的这个豆包手机跟我们普通人啥关系? 关系可太大了。这件事的本质其实是考虑到我们以后是怎么去用手机的,就像我们在之前,其实我们打开手机使用的时候,每一个需求是对着一个 app 的, 未来的话,其实我们基本上只说一句话就可以了。这就意味着过去二十年所建立的一些商业模式,其实基本都没用了, 而且 ai 手机能够帮我们去完成那些重复的机械的那些没有创造性的工作。而对于我们自己来说呢,我们可能会去哎,和朋友去聊一场更长的天,我们去做一个更好的旅行,以及我们可能会去读一个更有趣的书。 说白了, ai 越来越强大,这也不是说让我们人变得越来越懒,其实他更是想让我们去专注一些更有意义的事情而已。这十天我看到了豆包手机的发布,我看到了大厂的围角,我看到了智普 ai 的 开源,我也看到了二十四年前的历史,我相信历史一定是重复的。