最近朋友圈被豆包手机助手刷屏了,等了几天后,我们也拿到了这款有助手技术预览版的手机。网上关于点外卖、订飞机票的评测已经很多了,我们想试试不一样的玩法。所以我们拿着豆包手机在润米办公室找找大家真实需要的问题,看看它到底好不好用。 我们刚搬了新办公室,有公众号的同事想要找新房子,我们来帮帮他,帮我找一下地铁二号线威宁路附近,然后两室一厅, 大概预算在六千到八千的房源,并且帮我放到收藏夹里。他打开了贝壳,迅速识别到了上方的租房入口,选定位,筛户型。接着要注意了, 这里我说的价格只是个范围,所以不能直接点击,但是好像也没被难倒,他还是模拟手指滑动屏幕,当然了,可能没有那么准确,划了几次也没有完全对齐。但是六分钟后,他把二十七条房源信息放进了我的收藏夹里。 再来看个更复杂的,隔壁的同事元旦要去越南胡志明玩,看看豆包能不能帮上他。注意哦,不是那种让 ai 直出的酒店攻略,那也太没挑战了。 我元旦要去越南胡志明玩三天,预算在四百到六百一晚,能不能帮我去小红书上搜索排名前三的酒店,然后帮我放到携程的收藏夹里?我出行的时间是一号到三号, 先打开小红书,直接搜索了笔记,然后记下了几家热门酒店的名字,然后再跳到携程复制酒店的名称,调整到我的出行时间,搜索价格。当然了,元旦这些酒店大幅度涨价,他收藏的酒店已经远远超出了我当时给的四百到六百的预算范围。 最后,我们去了 hr 的 工位。我们的 hr 菜菜经常说,筛选简历呀,其实是招聘里面最耗时间的活。正好我们视频部门要招一名脚本编辑,来看看他能不能帮上菜菜 啊,我要为刘润视频号招一个脚本的编辑一个。是呢,最好是最近一个月内活跃的人。他要有商业、财经,然后背景和这个职场经历,工作年限在五年以上。 他打开了 boss 直聘,先是输入了岗位的名称,然后一条一条点开获选人的信息。当然了,他没办法帮我判断这个人是不是真的适合。但是严格按照我的指令,五年的经验, 近一个月的活跃,有财经和商业从业的背景,大概两分半吧。符合这三个条件的获选人,就出现在了润米传媒这个账号的收藏夹里。 找房子,订酒店,搜简历,可能还有更多的场景能用,但整个过程,我们只做了一件事,动动嘴皮子,提出需求,剩下的就是看着手机助手把活干完。 一圈下来,你可能跟我一样,一方面觉得,哎,这挺新鲜的手机居然真能自己干活。但另外一方面,他也并不是随时响应完全准确。 为什么他能做到这些呢?这里面有个词叫做 g u i agent。 说大白话,就是他在模拟人的手指和眼睛,就像刚才找房子那个画面,他没有后台的权限, 他只能像人一样盯着屏幕,看着那个像素点去拉动那个滑块。这意味着什么?这意味着 ai 不 再只是陪你聊天的那个对话框了,他开始真正地介入我们的生活,去触碰那些具体的 app, 去解决那些琐碎的流程了。 这样的未来你期待吗?关注刘润,降低商业的认知门槛。
粉丝239.8万获赞1284.2万


卧槽,兄弟们看过来了,咱们这个豆包 ai 手机助手大家都见识到了吧?你只只需要给他一个口令, 他就直接替你做。呃,你所有的事情咱们只去,比如说打游戏,点外卖咱们都可以啊,实现呢,咱们这个豆包这个智能呃是怎么安装的?今天我手把手的告诉大家。呃,首先呢, 呃,在我现在这个你视频下边,咱们跟着我操作一下,咱们一定要复制成功了啊,复制成功以后咱们不要着急,咱们找一下这个在之前这个手机上没有的,下一个打开,然后打开以后这里呢他会出来一个呃小小黄包,咱们就可以进了, 进来以后呢,呃,找到咱们那个热门呃软件合集就可以找到咱们想要的,咱们这个豆包智能助手咱们点进来就可以用了哈,特别容易。

今天教你用上豆包手机同款的智能体,不需要买新手机,全程本地运行,没有隐私问题。腾讯阿里联手封杀豆包手机之后,昨晚熬夜把这台 redmi k 八零直接改造成为了全自动特工。看好了,我只需要动动嘴,你看,我只需要运行这样一行命令。 ok, 它会自动跳过广告和弹窗搜索对应的机票,然后还会增加限制条件, 会选择默认的乘机源完成提交。到最后一步支付的时候,他会把控制权交给你,所以不需要担心支付错误的情况。 用的就是智普刚刚掀桌子也要开源的 open a do g i m。 底层是风九 b 的 模型,通过 a d b 连接手机,而视觉模型去看屏幕,模拟人的手去滑动手机,全程本地部署数据,部署手机, 你的隐私全在自己的手里。说实话,这个效果巨头们当然会害怕了,只需要输入这个指令,马上就已经在执行了,会自动向下滑动,查看各种咖啡店的咖啡价格信息。 ok, 他 已经选好了一本标准美式最终的结算步骤了,我只需要结算就可以完成。以前的我是流量韭菜,得到 app 里面来回去切换,给各大互联网商付过路费。但现在, ai 让巨头们成为了纯粹的工具人,失去了入口,失去了用户的时长,这不就是在砸他们的饭碗吗? 但是大事是挡不住的,我们不想做重复的动作,不想看广告,不想被反复去折腾。真正的结局应该是 app 们去适应新的规则,跟 agent 共生质朴, 我们每个人一颗种子。而豆 open gm 让我们可以拥有一台只在本地设备运行,只为我服务的智能机。所以要不要把自己闲置的手机也变成跟我一样同款二十四小时在线的手机? a 整呢?保姆级的部署教程已经整理好了,想要的拿走。主页更多 ai 技巧,我是卡,我们下期见。

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓、苹果、鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包, 没有的去下载一个就会弹出资源包,没有弹出的去首页输入鱼饼大全,然后打开这个文件包,右下角去保存就可以了。

今天给大家分享一个豆包手机同款的开源项目,也就是最近特别火的智普,他们开源的 open oto g l m 是 专门用于控制这种托管手机的智能体。这个是一个框架,也是一个项目,但是这个总体来讲它的亮点大于实践, 主要有两个比较大的创新。第二个就是他们这个框架是可以进行这种手机的 连接,其实它跟按键精灵是差不多的,甚至它比按键精灵要小或者简单很多,实现了电脑和手机的远程操作,可以直接连 usb 或者直接在一个 wifi 里面就可以进行对接和联通。 我也详细梳理了一下这个项目,它开源的话其实并没有开源特别多的东西,像一些 memory 记忆体啊,这些记忆模块都没有开源,而且它只有一个智能体模块,它更像一个 simon, 而不是实际的一个项目。因为他在去年的时候其实是呃发了一个 app 的, 也是 otoglm, 但是在后面就没有特别多的推广了,而且效果也一般。 但是由于这一次豆包手机大火了之后,他借着这个风也做了开源,让大家也看到了这个项目。 我们详细来梳理一下这个项目。首先它的主要的架构就是你可以支持用它自己的本地模型,当然它都是使用的这种 best url 的 方式,你可以用本地的,也可以直接用现成的,但是那个模型必须要支持能元素定位, 现在币源的模型几乎都可以多模态的,最近的微软也开源了一个三 b 的 模型,应该性能也是蛮不错的,做元素定位,而且思考的模型 应该性能也是蛮不错的,但是他没有跟这个模型做一下对比,不知道他们九 b 的 这模型跟这个微软开源的三 b 的 模型比起来怎么样,应该大差不差,因为微软这个模型稍微小一点点,但是测试起来效果还是蛮不错的,而且小了之后才能在我们这种本地的这种显卡上面跑。九 b 还是挺大的,不算小了, 但是他有量化的,不过肯定是需要二十四 g 才能跑的,三 b 的 话做一些量化操作的话,也是可以让他实现在十二 g 内存上面跑的。 我重点比较疑惑的就是它到底有哪些工具和它这个智能体,它是什么样的一个智能体?它智能体只有一个智能体,然后我也没有 memory, 也没有记忆的规则,然后主要就是典型的 react 智能体, 整个流程就是典型的感知、思考、行动的这样的一个循环。然后每一次它做任务的时候或者下发任务的时候,它就会把整个 手机的系统去构建一个上下文,他的系统有什么应用这些,还有他的截图,就构建这样整体的一个上下文,加上你的一个任务规划, 然后他通过思考思考了之后去规划出来一个计划,然后去做执行,每一次执行了之后,他再进行一次思考,然后再进行执行,直到完成任务为止。当然他还有一些敏感操作,比如说验证码,比如说 要进行付款呀,这个是要人工介入的,它会主动的提示你们,我重点是想要知道它有哪些工具,或者可以执行哪些操作,是怎么样执行的?然后我就让它梳理了下,我是用的这个 deepweek 来做的,梳理它的工具也 跟按键精灵是差不多的,甚至比按键精灵要简单很多。首先就是启停指定的应用,然后手机上面关键的那几个按钮,还有就是滑动输入文本,返回上一页,还有点击,这些都都是可以的, 主要用的就是滑动文本和点击这几个,然后启启停应用,切换应用,这都是标准的按键精灵里面的东西。然后就是操作他的其实是一个相当于方寸扣领,点击某一个按钮去调用这某一个工具,然后有一些比较标准的规则, 应该执行前要检查应用,然后最多呢连续的等待三次,验证这个操作是否可以 进行操作。然后就是完成之后检查一下它的准确度,其实整体看起来它是一个 demo 的 形式,它并不是一个特别完整的项目,只是一个 非常简单的 demo, 稍微复杂一点的可能就是它搭起来了这样的一个框架,你自己可以去加一些 memory, 或者说加一些什么东西,然后我去可以放在你的手机里面,可以进行继续的二次开发。 总体来讲这个项目还是不能直接拿来做实际的运行的,可以做二开,这个是可以的。然后我都还专门让它梳理了一下它的记忆模块有没有,它是没有记忆模块的,它只有它模型上下文 token 的 这样一个上下文,然后这些提示词它都是用的中文呢?然后必须遵循的一些规则, 这些提示词其实还可以拿来做一些借鉴这些智能体的提示词借鉴还是蛮不错的。还有像这些执行动作某一个 app, 然后这就是它们方选透的一些东西了,当然做成 mcp 其实也是可以的。