这期视频我们集齐了豆包 ai 手机和容外卖这个八 pro 给大家比划比划,那我就先用这两个手机来给我点个外卖吧。豆包这边会问三个问题,送到哪,想吃什么,菜系还有预算范围,告诉他以后他就会像真人一样,慢慢的打开外卖软件, 输入地址,搜索中餐,按照顺序点进千五家店铺查看,用文字形式提炼出几个菜让你去选,然后他会进入店铺下单,遇到口味选项也会让你去确认,最后你只要等付款就可以了。 而悠悠这边地址他会从后台自动获取,当然你得提前给悠悠精准的定位权限。如果你只告诉他想点外卖,他会简单粗暴的给你一些菜品推荐,点进去就可以直达。 当然你也可以把需求说的更详细一些,比如他也能帮你迅速的找到,直接给出连接,那如果你是想喝个奶茶,可能就要更复杂一些,那这个时候荣耀也会进入这种类似自动操作的模式,进入店铺自动搜索,选择对应规格,加入购物车。由于说呀,这个动作会比豆包快很多,但他有时候呢也会给我整漏需求, 而豆包这边收到命令后要花很长时间思考,然后,然后就没有反应了,上面基本都是单线成操作,我们再提升难度。如果我想买个衣服鞋子,让他全平台比价,那这个就会同时涉及到多个第三方平台。 这次荣耀优优直接引用的是识货跟什么值得买, app 提供的信息相当于走了捷径。而豆包会依次打开手机上有的购物平台,依次记录价格并总结,那当然他也是一个一个来啊,不能同时并发。目前用下来,豆包在语音识别上还是没有手机厂商成熟啊,自动识别经常没反应,常人说话才比较靠谱。 不过豆包手机支持生文解锁,理论上这个技术唱出以后,从解锁到 ai 代理,你都可以通过语音来操作,不需要再手动干预了。拥有只能用手机里面现有的素材生成视频。而豆包呢,现在他可以直接用文字去生成视频。不过需要补充啊,每天你只有十个视频的限额。 你可能会觉得让 ai 操作手机非常的鸡肋,但你想啊,最初我们也是这么看 ai p 图、 ai 生成这些功能的。所以优优和豆包,一个从系统内稳健融合,一个从外部激进破壁,让大家看到 ai 在 自动执行方面的潜力,一起提高了 ai 的 能力边界。 这两台手机共同的意义在于,把 ai 操作手机从概念扯进了现实。咱们就等等看吧,说不定哪天就能改变整个行业了。
粉丝91.5万获赞256.3万

昨天看到一组数据,豆包的日活已经突破了一个亿,那说明 ai 已经距离大家的生活越来越紧密了。 最近我也是尝试着一些方法,让自己使用豆包的启动效率变得更高一点。那我们现在比较常用的方式就是用豆包 app, 用对话框去输入信息,跟它互动。 但我现在去找到这个方法,是可以你在尽可能减少交互的情况下,跟豆包进行高效的互动交流。这里是用苹果手机做的演示啊,首先你要用这个快捷指令的功能,然后你新建一个快捷指令, 这个指令里面你搜索豆包,你一定要看到这里面有一个和豆包进行语音通话,它就会实时的聊天沟通。你选择了以后,这里有一个功能,就是让它在 apple watch 上显示,然后你同步打开 抖屏,界面上添加这个快捷方式,就可以跟豆包直接交互,点击,然后唤起豆包。豆包, 我在呢,很高兴和你聊天,我们今天聊点什么好呢?如果你有一块苹果手表,那你连手机都不用掏,你可以直接通过手表上的这个设置快捷方式点开 豆包。豆包, 你在吗?在呢,今天过得怎么样?哇,太好了,见到你 我也很高兴见到你,今天有什么想聊的吗?其实还有一种更高效的,连手都不用操作的接入豆包云助手的方式,就是你有一套苹果的耳机,你把嘿 siri 接入豆包云助手,通过语音的方式就可以打开它,直接跟它进行对话。 ai 离我们的生活越来越近,但是如何降低和它连接的成本,提高跟它接触的效率,这个是我们可以去努力让 ai 跟我们的生活结合得更好的。

来,沿着豆包手机的话题,咱们今天在做第二期啊,来进一步的探讨一下 ai 和手机结合的过去,现在和将来。如果你没看过上一期的内容的话呢,可以点击我的主页找到这个内容,两期连着看,我相信可能你的感受和观点又会不太一样啊。 呃,当然了,我要强调一下,我讲的所有东西都是基于我个人的看法,如果你要不同意的话也没关系,可以在留言区探讨,也可以做你自己的视频呢,来去表达你的观点。那么要讲到 ai 和手机的结合呢?这件事的缘起实际上很早。呃,如果大家还记得的话, iphone 四 s 发布 siri 的 时候,对于整个行业来说是一个重大的观点。 其实 siri 就是 生成式 ai 在 手机上的最古老的应用,它是很反常识的一个观点。语音助手长期以来给大家个概念,它特别傻,特别笨,有点像人工智障,它并不是我们今天所理解的现代 ai 的 这样一种形态。那为什么说它是 ai 和手机最早结合呢? 那是因为从基础定义的角度来说, siri 确实符合生成式 ai 的 定义,它不是依赖正则,不是依赖 if else, 也不是用脚本的方式去给你生成答案的。那但是因为它的能力被严格的限定在了非常狭小的场景之内,同时没有天亮参数的大模型在背后做支撑,所以它的延展性也极差, 所以说人们才会形成一种所谓的人工智障的印象。但是从 siri 的 问世和整个行业逐渐跟进,你就会不难发现,整个手机行业对于如何用好 ai 这件事的思考已经很早之前就开始了,这样的思考不仅仅发生在海外的这一些科技巨头,我们国内的手机公司其实在这方面的思考也一点都不晚。 二零一六年底, magic 搭载了一个很重要的功能叫 magic life, 比如说你跟你朋友聊天说今晚咱俩去哪吃饭呢?他说老地方,那么他根据上下文和你们以前的聊天记录就能知道说啊,大概老地方是在哪里,并且把这个位置发给你。这样的一个场景其实跟 siri 的 语音助手完全不同, 它更多的接近我们今天所理解的现代 ai 的 上下文概念以及主动服务的这样一种形态。虽然很早我们就有了一些探索和一些尝试, 但是因为毕竟当时大模型的能力还没有良好的发展,所以说这样的一个功能也并没有得到特别大的一个广泛的应用。那么这个时间点在推到了这个二零一九年的二零二零年前后,发生了一个重大的变化,那就是 transformer 在 整个人工智能行业当中被认为是公认的未来主干的一个发展的技术架构。 但是虽然说二零年人工智能已经有了一个重大的突破啊,但是手机行业好像还并没有什么改变,然后大家呢,该卷摄像头卷摄像头,该卷 id 卷 id, 好 像发现也没想 ai 到底该怎么去现代化应用,前几年啊,大模型的这个发展速度应该是非常非常的快, 所以让手机行业的人开始再次认真的思考现代 ai 和智能手机深度结合的可能性。 那么考虑到当时的行业状态呢?大家可能会认为说,哎,做个 app 对 吧?把这个大模型封装到一个软件里边,可能是最简单最快的办法,所以接二连三的出现了各种各样的聊天机器人。 那么再后来呢?随着用户对于 ai 的 接受程度越来越高,对吧?那就催生出来了一个新的思考,就是我们有没有可能利用大模型的能力,把传统的软件都挨个重做一遍,比如说录音软件可以重做, p 图软件也可以重做,笔记软件是不是也可以重做?于是我们就看到很多我们熟悉的软件里面加入了大量的这种 ai 的 功能, 甚至有很多新的原生的 ai 的 app 来不断地涌现。那么作为手机厂商呢?呃,他去结合 ai 的 方式,就一下子给你的手机里边多塞上十几个预装的 app, 对 吧?每个都有 ai 的 功能,每个 app 呢,也都只解决一个很具体的问题。 所以说到这为止,貌似 ai 在 手机上已经很普及了,那么我们的用户体验真的有很大的改变吗?其实你仔细想想好像也没有,那是因为这些 app 被改造了之后,可能比以前更好用了一些,但是人和手机的交互范式并没有发生根本性的改变。 具体的来说,用户脑海中有了需求以后,还是需要解锁,通过启动器 launcher, 然后呢,在桌面上把你的需求分流,找到相对应的 app, 然后在 app 里面去完成你的具体工作 啊,也就是真正完成所谓的需求分流和需求选择的依旧是用户的脑袋以及手机的桌面。不仅是人在找服务,而且每一个服务的完成也是自上而下的一条垂直的管线,每个管线之间也都不互相勾连, 这就意味着你完成的每一个动作,每一个数据,其实都沉淀在不同的厂商,不同的 app, 甚至是不同的模型之间,这叫什么呢?这就叫做数据孤岛。那么如果说数据孤岛不能被打破,但是我还想要去进一步的给用户提供更好的体验, 那怎么办?那手机厂商想了一个办法说,那我就做一个中间的聚合层吧,对吧?所谓的聚合层呢,就是通过这些记忆啊,或者是专有名词的包装,来把每一个 app 里边的一些碎片化数据提升到一个横向贯穿的一个应用当中去 啊。然后在这个模式之下,让你感觉到好像我打破了数据孤岛,那产品能力很强,对用户体验的理解很深刻,在短期之内依旧可以达到比较好的效果啊。你比如说典型的代表就是 oppo 小 布的记忆做的确实不错, 对吧?他是这种融合,是不是真正意义上的融合?不是,他是不是基于你的用户的使用历史,形成了一个更加全面、更加精准的用户画像呢?也不是因为在什么时候去记录什么,去存储什么样的记忆,依旧是由用户来发起的, 你可以说这样的方式对你的隐私保护更好,但实际上在 ai 和手机结合的这样一个大的命题之下,其实人们考虑的更多的是体验到底够不够极致。 你看豆包这就发布出来之后,大家反馈就是一个非常典型的代表是吧?人们都认为说,哇,不能这么干,但结果发现用户觉得只要你的体验足够好,其实可能这条线可以画的很激进, 所以用 app 来去搭载 ai 能力的这样一个基本的模式,它的上限就在于你很难彻底的解决服务的主动性问题。 那什么叫服务的主动性?其实就是让手机能够想你所想,知你所知,忧你所忧,在你脑子里边刚刚有一个想法的时候,他就可以恰如其分的把那个结果推送到你面前,这就叫主动性 啊。那么如果你用 app 去搭载,无论你怎么去做,对吧?其实你都很难真正的摆脱人找服务的这样一个困局, 对吧?那么当整个行业发展到这样的程度的时候呢?你就发现,哎,原来做 app 的 人就有一类人不淡定了,是谁呢?那就是模型公司对吧?因为如果你想主动服务,其实意图的理解是非常重要的, 然后这个模型公司就认为说我是最懂用户意图的。跟我聊几句话,我大概就知道你是想写演讲稿啊,还是想要写一篇这个视频的文案。我这么强的能力,结果你们却把我当百度百科去用,拿我当搜索引擎,这他是非常不乐意的。 所以大模型的公司就开始花很多钱去做硬件的尝试和突破,不仅仅是豆包, openai 也在不停的去尝试这个做硬件和可能性,包括像 facebook、 meta 是 吧,也在做这样的事情。在多种力量的这种交汇之下,行业到了一个新的拐点,需要思考下,除了 app 去搭载 ai 以外,有没有第二种 ai 和手机结合的可能, 那就叫做 agentos, 或者是说 agent 和手机结合的可能性就浮出了水面。那么一旦 agent 智能体和手机的操作系统做了结合,真正分流的工作不需要用户来做了, 你只要用自然语言去跟这个助手和这个 os 的 智能体来去说,它就会帮你完成大局的调度, 帮你拆解完核心诉求了之后,帮你完成分流,用一二三四个工具来去完成你的工作。而当他知道你所有的意图,并且帮你完成了所有操作,掌握了你所有的习惯数据以后,他就能解决主动性的问题。 但是在 a 阵的模式之下,你还有那么强的选择权吗?你可能没有了,比如说最近我们在做测试的时候,就比如我想让他点个外卖,他就会一会给你用美团,一会用饿了么,这完全取决于这个公司,这个手机厂商他的 a 阵是怎么设计的,如果他优先级是首先推饿了么的话,或者是叫淘宝闪购,即便你没装这个 app, 他也会扫描你有没有装支付宝,用支付宝的小程序来给你完成同样的这样一个动作,让这个服务停留在阿里系里边,他也不会主动的去帮你调取美团,对吧?所以说这个分流权就产生了转移,从用户和厂商手里逐渐转移给了 agent 和智能体。 虽然用户和厂商要让渡一部分的控制权出来给智能体,但是面对着这种最终体验的大幅提升,这种控制权的让渡几乎是一个不可逆的趋势。你看豆包手机出来了之后,大喊愿意用的人不在少数啊, 所以说豆包手机的所谓的技术预览版,他预览的是啥呢?预览的就是 agent 跟手机结合的空间上限到底能不能被大家接受,我相信再过半年的时间,几乎所有的手机厂商都会大幅度的去增加他们在 agent 上的这个部署能力。 如果你再仔细看的话,你会发现智能体和手机的结合又可以分为两条线,一条线叫做 u i agent, 而另外一条线叫做 os 级别的 agent 或者系统级 agent。 u i agent 的 逻辑非常容易理解,那比如说豆包手机,华为大部分的场景,包括荣耀大部分的场景,还有 oppo 手机里边的一小部分场景,都采用了 u i agent 的 方式来去实现。 呃,他的最主要的特点就是在操作手机的时候,他的动作特别像一个人,他就像一个人手一样在帮你点手机的屏幕,只不过省去了你亲自去点按的那个动作。他感知手机状态的主要方式就是依靠屏幕,也就是屏幕能显示什么,我就能帮你点什么,我就能帮你解决什么样的问题。 别管你看不看得见的点按的过程,但是原理是不会改变的,那同时呢,也会有一些风险的,你比如说如果 ui 突然改版了,他可能就读不懂了,对吧?你比如说这个入口藏得很深,那么他可能也帮你找不到。 所以说要骗这种 a 阵的方式呢,就是要么你封掉它的这个模拟点按的权限,要么就是你直接不停地去变这个你的用户入口,对吧?但是对于一些超级头部的 app 来说,他也不敢随意的改变它的用户,会得到大量的这种用户的反噬, 对吧?那么通过 ui 认证的方式呢?最好的地方就是它的高兼容性,它在手机上自动化操作的结果是立竿见影的,什么都能干,这就意味着你可以用最短的时间,用最高的效率去把智能体呢搬到手机上 啊。但是它有缺点,那就是它非常的慢,当然这个慢是相对的,对吗?因为它要像人一样一下一下去点,那么 ui 加载的话呢?也需要时间,所以这都是它会一步一步变慢的主要原因。 你不可能越过每一步 u i 直接达到你的最终目的,但是这个技术路线,因为它的高兼容性,让它在当下可以得到立竿见影的效果, 对吧?可以让用户很快就能感受到哇! agent 和原来的语音助手和所谓的 app 有 本质上的区别,因为体验的上线确实得到了大幅的提升, 但是他也有他的局限,他的局限就是比较慢,当然这个慢的概念是相对来说的,因为我们刚才讲了,他必须要一步一步点按,还要等这个界面的加载,还要等界面的分析,对不对?所以说其实他并不是最适用于人工智能场景下的一种交互方式。 ui 是 给人看的,但是 ui 对 于人工智能来说就像是一门外语,特别的不习惯,讲起来特别的不自然。那么最贴近 ai 的 这个工作机制的方式是什么呢?就是刚才讲第二种路径,就是 os 级别的 agent, 或者我们叫做 os native agent, 对 吧? 它的核心机制和表现出来特点和我们刚才讲到的那个现象是完全相反的, ui agent 是 看界面点按模拟人操作, os agent 它更像是一个系统在自己操作,它的最大特点就是它不受 ui 的 限制,它特别的快,因为它不依赖屏幕,所以它可以跳过很多步骤,直达最终级的目的。它是通过系统事件,包括你上下文的操作数据来综合进行判断的, 也就是说,理论上只要它有权限,它几乎可以帮你完成任何事。讲到这呢,可能很多人对于大模型所谓的工具调用这个概念呢,还是不是特别的清晰,我给大家举一个最为简单直观的例子, 修改屏幕亮度这件事够简单了吧?但是如果说是 u i agent 去完成这件事,你会发现它的操作过程是打开设定系统,设定这个 app, 然后滑动找到那个屏幕设定,点进去了之后再帮你调整屏幕的亮度,它是按照 u i 一 步一步走的。 但是如果是 os agent, 他 会认为无论是你调屏幕、调音量,还是调震动,还是调勿扰模式,这些对他来讲都是一行行的代码,都是他可以随时调取和调整的工具。 所以他在调整的过程当中,不需要一步一步的点按,会直接在对话窗口里边,直接把这个复杂菜单当中的某一项拽出来,直接放在这个聊天对话框里边,帮你一步操作完成,这是非常非常本质的一个区别。 当然,如果说一个 agent 有 自己系统的权限,这不意外对吗?因为是手机厂商自己做的,手机里边的 agent 如何获取外部的第三方 app 的 一些工具,这才是真正的本质难点,我自己在给自己做一个减肥的软件,这个软件当中呢,我有这个记录一餐饭的能力,也有修改用户档案的能力, 但是这些东西都是写在我自己软件里边的代码,对吗?大模型知道吗?大模型是不知道的,所以在这种情况下,我直接问大模型,我说你帮我记录一下什么什么东西,或者是说帮我调整一下我的营养摄入目标, 大模型就会说我什么都做不了,对吧?你问他我今天吃了啥,他说我也不知道,但是如果我在我的代码当中,通过 to suma 给大模型做一个能力声明, 等于说,哎,你看我这其实有这么多工具,都是现成的,你想用随时来用,并且在权向上给予他这样的一个能力的话,你再去在这个软件当中说帮我记录一顿饭,或者说我今天吃了多少,这个软件能给你的结果就完全不同, 用户只需要说人话。大模型通过工具调用的方式,把手伸到了你自己的 app 的 口袋里, 完成了属于你的定制化的一些操作的动作,而且所有的这些意图解析工具调用,包括执行修改并且保存数据的动作,全部在代码级完成,绕过了所有的 ui 点按, 这就是区别。那么在我的这个 app 里边,在这个很简单的 app 里面,所谓的更新用户的档案,记录一餐饭,调整指标,这些所谓的具体的东西,就叫做一个一个的工具, ok。 那 么在那些头部的 app 里面,超级 app 当中,商家库叫工具,订单库叫工具,购物车叫工具,对 吧?只不过他们每一个工具都比我的这个小 app 工具要复杂一百倍,对吧?也有成千上万的商家,然后购物车里面的这个用户的使用情况也非常的复杂,所以当他把这里边的所谓的购物车工具和商家工具向某一个手机平台去暴露的时候, 你就可以通过 os agent 来直接不用点开 app 就 能搜索哪一家的猪脚饭好吃,哪一家奶茶好吃,它执行起来就变得非常的快,它的特点就和 u i agent 完全相反,而因为恰恰它都是发生在后台的,它可以同时完成丰满牛不相及的不同的任务 啊。只要我这个外卖软件把商家库开放给你,那你就能查商家,如果我再给你个购物车的工具,你就能查完商家之后完成加购, 对吧?但是如果我只给你商家,不给你购物车,那么你就必须得来到我的 app 里边才能完成后续操作。 所以这里我一定要澄清一个重要的概念, ai 时代之下,手机厂商要想接入一个超级平台,他其实要接入的工具是非常之多的。你不能说我接入了一个工具,大家就默认了,认为这个平台上面所有的能力你都可以获取,不是这么回事。一个手机品牌要想接入这么多的超级服务的互联网工具, 工作量是巨大的,所以就一定需要一个高效的接入机制,这个接入机制就叫做 m c p, 你 可以理解为啊,这是个手机品牌对不对?我要接入互联网服务,我做了一大堆的标准接口, usb, 你 们来直接把插头插进来,我就可以直接读取你里面的这些数据,并且提供给用户了, 对吧?而且不仅如此,因为他所有的对接是高度的标准化的,我可以不受平台内部的界面的限制,你比如说当我想比价的时候,对吧?你要是在平台内部,你可能要打开 a 商家,打开 b 商家,比来比去, 对吧?但是如果我通过 m c p 的 方式,我直接将基本的数据拽过来的时候,我就可以在我这个手机里面,根据我和用户的上下文,给你一个高度结构化体验更优的一种展现形式,这就比所谓的 u i agent 那 个体验要好很多了。所以如果 m c p 做的足够好, os agent 做的足够好,它的结果比你打开那个 app 还要好,因为它跟你的上下文高度相关, 我说给我比个价,他把所有东西给你比完了之后,直接呈现出来,而不是说让你点完了 a 再点 b 就是。 在我看来, os agent 加 mcp 才是上线最高的解决方案,才是更加接近 ai 技术本质的一条路线, 也是在我看来 ai 和手机结合的真正未来所在。那么今天我们看到的 ui agent, 无论是豆包也好,还是任何一家,都只是一种过渡形式, 那为什么还依赖这种过渡形式?你真的要去搭建一套 os agent 加 mcp 的 机制,是受大大的外部条件制约的,它没那么快,对吧?而 u i agent 的 这种快速部署的能力,我可以先给到用户用时间去换空间,但是人人都知道那个路径才是未来, 那这个模式有没有问题呢?其实也有 os agent 的 效果呢?其实高度的依赖外部服务的接入情况,也就是说它不是手机厂商能说的算的事儿, 对吧?但是我认为豆包这一段时间的发布,可能很大程度上会改变这个局面,谁能够在这条道路之上接入更多的第三方服务,给用户提供一个更加完整的体验包, 谁的竞争优势和差异性就会越大。而豆包手机的出现会让集体冲刺的这个速度大幅的加快, 原因有两个,第一个就是当豆包手机出现了之后,原来采取传统保守线路的手机厂商会发现,哦,其实原来我们太保守了,用户其实是蛮接受这件事的,对吧?是不是我们应该加快速度往前多迈几步? 所以我相信最近很多手机厂商都在疯狂的开会,对吧?说原来保守的净是我自己,赶紧跟进赶紧走。 第二个非常重要的一个影响和变化,让所有的超级平台和头部 app 会觉得要逐步开放权限这件事应该说已经是势不可挡了,那么如果一旦超级 app 开始逐渐开放自己权限,拥抱这样一个变化, 那么就会有新的一波红利出现。而一旦这个红利出现,真正能够接到的人其实并不一定是豆包,谁在这布局最早走的最快,谁更有可能在第一波的时候充分的享受这个红利。 其实荣耀现在的身位却是最靠前的,我看来大概有八到十个月的领先的周期,所以如何利用好这八到十个月的领先优势,对于荣耀来说最为重要啊。我现在讲到这啊,肯定很多弹幕啊,开始蛐蛐了,阴阳怪气的是不是?我替你们说荣耀打钱 好吧,第二个非常值得提到的品牌就是华为,因为他自己的软硬整合的这条路径啊,也提供了一个 ai 和手机结合的一个很高的上限,但是我之所以把它发到第二位,就是因为这极大的考验着鸿蒙系统在整个移动互联网生态当中的号召力问题, 所以未来会怎么发展,我觉得要保持紧密的观察。那么如果把以上的因素全部都结合在一起,我们还能得出一个进一步的结论,那就是未来的手机行业在 ai 整合这件事上还有很高的不确定性, 但是 os agent 加 mcp 这件事,从绝对的技术难度上来说,对于大厂来讲都不是特别的难,所以从现在开始,只要大家意识到了开始去构建,难度并不大。 第二个问题就是超级 app 逐渐要开始拥抱这样的趋势,开放的对象就绝对不只是一家手机公司, 而是面向整个手机行业来去开放。现在有局部优势的公司想要保持这种优势难度很大,现在在身位上相对靠后的品牌想要快速追赶上来也是有极大可能性的。那 讲到这,大家可能就会想说啊,那既然超级 app 要开放,那是不是豆包手机作为新玩家之一也会有机会呢? 在这一点上其实我反倒不太乐观,因为豆包手机本身天然的身份属性,它和超级平台之间的利益是相互排斥的,但是超级平台跟手机厂商之间的利益却是不排斥的,因为传统手机品牌的应用的分发价值和天然庞大的这个用户基数, 超级 app 和手机厂商之间其实是一个互利互惠的关系,开放给手机公司可能我会赚钱,开放给一个想要取代我的竞争对手,那可能就会要命。 这就是为什么之前我在播客当中反复提到豆包手机的出现是一个里程碑式的意义,它是最终吃到最大红利的,却不一定会是豆包。我其实非常期待手机行业未来的发展,因为在 ai 和手机结合的这条道路上, 由于它是一次技术范式的革命,交互范式的革命,我们看到了很多很多的可能性,新玩家已经破圈了,小厂很可能借着这波机会再翻身,而大厂如果稍有不慎或者动作慢一点,反倒有可能会遭到淘汰。一句话来说就是 ai 让手机行业未来可期。 我也希望大家别再转摄像头了,天天在这逗蛐蛐,我都烦死了。好吧好吧,今天这个话题呢就到这了,如果大家喜欢的话呢,一键三连,我们下期再见。

荣耀幺优豆包手机助手与 auto gm 全面对比核心优势、功能特色及选择指南荣耀幺优豆包手机助手和 auto gm 作为当下主流的智能助手类产品, 三者定位不同,优势各异,没有绝对的更强,仅在不同使用场景和需求下各有突出表现。其中荣耀幺幺聚焦系统深度整合与硬件协同中,豆包手机助手主打跨平台操作与复杂任务处理, 凹凸 gm 则凭借开源属性与多端兼容性占据特色赛道。下面从产品形态、核心优势、功能特色、优劣分析及选择建议大维度进行全面进行解析,助力不同需求的用户精准选择。 从产品形态来看,三者的定位和适配范围差异明显。荣耀优优是荣耀手机专属的内置智能体, 深度绑定荣耀自研的 magic os 系统,仅针对荣耀全系列手机进行优化适配,属于系统原升级智能助手,无需用户额外下载安装,开机即可使用,能与手机硬件、系统功能形成天然联动。 豆包手机助手是独立开发的手机助手软件,并非单一品牌专属,需通过与中兴等手机厂商达成合作才能适配。对应品牌的安卓机型属于合作适配及智能助手,用户需在适配机型上下载安装后起用 限阶段。受限于合作进度,适配的手机品牌和机型仍相对有限。阿斗 g m 则是一款开源 a i a 智能模型,区别于前两者的成品助手形态, 他以开源代码的形式面向用户,覆盖安卓、 ios、 pc、 网页端等多个主流平台,不受手机品牌系统限制,属于灵活定制级智能工具,用户可根据自身需求自行下载部署,甚至进行功能二次开发。 在核心优势与主要功能上,三者的侧重点各有偏向。荣耀优优的核心竞争力在于系统及深度整合加硬件协同适配,以托与荣耀手机硬件 magic os 系统的深度绑定,能实现硬件及快速唤醒 指令,响应速度更快,操作更流畅。同时具备专属的记忆功能和记录用户的使用习惯、偏好设置等信息, 逐步优化个性化服务体验。其主要功能围绕日常使用场景展开,很积极针对盗包手机助手与凹凸 g m, 还针对视频通话场景优化了美颜、背景虚化等功能,某用户娱乐、办公、出行等多场景需求。 豆包手机助手的核心优势集中在跨平台操作加复杂任务处理,即便用户使用多品牌安卓手机,也能通过豆包实现统一的智能助手,无需适配不同品牌的原声助手。其复杂指令处理能力尤为突出, 支持跨应用联动操作,如从聊天软件提取地址后自动跳转地图规划路线,跨平台比价购物,同步多个电商平台商品价格筛选最优优惠。 还搭载了操作手机 pro 模式,可完成文件分类整理、批量处理办公文档、智能汇总信息等复杂任务。哼,大幅提升用户的使用效率,更贴合有高效办公、便捷购物需求的人群。 o d g l 的 核心亮点则是开源免费加多端兼容加灵活定制。作为开源模型,它完全免费向用户开放,无使用权限限制,同时覆盖安卓、 ios、 pc 网页端,打破了手机电脑的平台壁垒, 用户可在不同设备上同步使用。其主要功能以生活办公基础需求为主,包括日常问答、日程提醒、办公辅助、云端任务处理等。 更核心的优势在于可定制性,技术爱好者、开发者可基于开源代码,根据自身需求修改功能,添加新模块,甚至部署到个人设备或专属场景中,适配更个性化的使用需求。从功能特色的优劣来看,三者也各有短板。需要注意, 荣耀优优优的优点是系统融合度高,硬件协调流畅、个性化服务精准,娱乐功能丰富,能给荣耀手机用户带来无缝衔接的使用体验。 但缺点也十分明显,仅限荣耀设备使用,若用户更换非荣耀手机则无法继续使用。跨平台兼容性极差,通用性较弱。 豆包手机助手的优点是跨品牌适配,复杂任务处理高效、跨应用联动便捷,能解决多品牌手机用户助手切换麻烦、复杂、操作繁琐的痛点。 但缺点在于依赖厂商合作,木加成合作的手机品牌无法适配,且部分复杂功能需依靠手机系统权限,部分老旧机型可能无法完全发挥功能优势,浪费基础,修改范围有待进一步拓展。 凹凸 gm 的 优点是开源免费、无成本、多端兼容、无平台限制、可定制性强,能满足技术人群的二次开发需求,也适合追求多设备统一体验的普通用户。但缺点是需要用户自行下载、部署和调试, 对普通用户的操作门槛较高,且与手机电脑的原声系统整合度远不如前两者,部分功能可能存在响应延迟、操作卡顿的情况,缺乏成品助手的流畅性, 结合不同用户的需求给出针对性选择建议。若你是荣耀手机用户,用选择荣耀呦呦呦,能充分发挥系统与硬件的协调优势,享受原升级的流畅体验,且无需额外操作即可使用,全部功能适配性和便捷性拉满。 若你使用多品牌安卓手机,会有跨应用联动、复杂办公、比价购物等需求,推荐选择豆包手机助手,能实现跨平台统一服务,高效解决复杂任务,提升日常使用效率。 若你是技术爱好者、开发者,或追求免费使用、个性化定制的体验,高辅基础需求为主,开源属性支持自由修改部署,可适配自身专属的使用场景,灵活度远超产品助手。若你使用 ios 设备且无开发需求,应优先考虑 auto gm。 豆包手机助手暂未大规模适配 ios, 荣耀优优则完全不支持 ios 设备。 整体而言,三者均能满足智能助手的基础使用需求。核心差异在于专属适配、跨平台便捷开源定制三大赛道。用户只需结合自身使用的设备、品牌核心需求选择,即可获得更贴合自身的智能助手体验。

哈喽大家好,关注手机 ai agent 的 朋友应该都知道豆包那个呢,得买手机智谱,虽然开源了一个,也有第三方 g u i 版本,不过只能电脑端使用,还很麻烦。然后我们前段时间推荐的 opportarai 则是需要派生环境和各种依赖。 而今天无知终于发现了一个更加简洁方便的开源 ai 手机自动化助手,它就是肉包,无需电脑,填写个 api 密钥即可使用。跟随无知一起来操作下吧。 首次打开应用,他会引导你去下载一个始祖,苦作用呢,就是获取 adb 权限,以实现自动化操控大局的视觉感知,突破应用间隔离,实现跨应用流等。 知道有这么个事就行,然后去打开你手机的开发者模式中的无线调试按钮,你要是不知道怎么开自己手机的开发者模式,就自行百度。 接着点使租库中的配对,他会引导你打开开发者选项,再点击无线调试, 再点击使用配对码配对设备,就能看到他给你生成的配对码了。此时下滑到通知页面会有个配对码输入入口,填写上就行了。 配对成功后呢,在十足库第二个功能入口勾选这个肉包就行了。最后呢,到肉包的设置中配置下 api 即可。注意模型这里呢,要选择视觉模型,如阿里的同意签问 物资这边呢,用的是归机流动的,所以填写的是归机流动的自定义 api 地址和密钥。模型呢,就在这里随便复制个视觉模型的名称即可。 之后输入需求,软件就会截图传给 ai, ai 分 析后再规划好操作步骤,依次循环,不过不清楚是模型的选择问题,还是手机太老旧了,这个自动化操作呢?确实有点慢,大家可自行测试。 好了就给大家介绍到这里吧,可在私信中发送关键字工具,按发布日期获取本期分享,如果视频对你有帮助,记得转发支持,我们下期再见!

北京到上海的机票今天晚上最晚是什么时候? 二零二五年十二月二十日,北京到上海晚上最晚起飞的直达航班为二十二点十分起飞。

打开抖音搜索美女主播,给前三名点上关注, 如何安装,你也不需要去一步一步的操心怎么写指令,你直接把这个地址,直接把这个地址扔给啊切克 ppt, 或者扔给啊通讯签文,扔给豆包,他直接帮你生成一个安装的一个指令,但首先是安装那个对,安装 python 相关的一个环境, 那我们需要去安装一个 v o m 的 一个啊框架,然后再去下载一个模型,对,然后直接啊可以在本地啊启动服务,对,我们还要在手机中去安装一个 a d b 的 一个啊驱动,然后打开 usb 的 一个调试, 那就可以了。安装的过程中你直接的遇到任何的问题报错,然后直接丢给 a, 然后他会对直接帮你去啊找到一个相关的解决方案。

最近全网都在吹豆包 ai 手机,我决定不花一分钱用这台普通安卓机手搓一个满血版的豆包。系统底层调用 tmax 获取 root 级权限,顶层接入智普 auto g l m 视觉大模型。这一波我要用代码教厂商做人。测试开始, 我给的指令非常模糊,点一份评分最高的螺蛳粉,注意看!此时我的双手已经完全离开屏幕。 p l o s 正在通过 v o s k 离线模型把语音转成文字,并实时唤醒美团 app。 这不仅仅是模拟点击,它正在读取安卓底层的 app 文件。 普通脚本到这里就卡死了,因为评分最高是一个逻辑概念,不是简单的关键词。此时, auto 咕 n 风九 b 模型正在云端疯狂推理,它需要先找到筛选菜单,理解好评优先的语义,然后在几十个商家里,通过视觉识别对比分数。这个思考过程,也就是你们看到的这个转圈圈, 才是 ai 真正的灵魂决胜时刻。它精准锁定了好评优先按钮,并且自动排除了广告干扰,直接选中了自然排名的第一家店铺, 进店选购下单,行云流水。这波操作的逻辑复杂度,说实话,市面上百分之九十九的语音助手来了,都得歇菜。任务搞定,听觉在本地,大脑在云端,这才是二零二五年该有的 agenc 智能体 元码正在整理,想学的兄弟双击关注评论区,蹲个坑,下一期发不同平台对比价钱的更复杂任务。
