豆包豆包,打开优优远程,用 qq 给坚果派发一条消息,说我正在用豆包手机了。
粉丝6338获赞5.1万

刚刚我发现了豆包手机有一个特别逆天的功能,到底有多恐怖?给大家看看啊!豆包豆包,打开向日葵,然后呢,再在图库上找到第一张图片,识别图片里面的验证码,输入进去,控制我的电脑,在电脑桌面上打开 i g 浏览器, 大家到底看看有多吓人啊?他先啊打开了向日葵,然后 查看了我的图库,找到了第一张图片,看它识别记录了这个验证码的信息啊,然后找到返回到向日葵,点击控制,看能不能控制, 看厉不厉害。用豆包控制电脑了,而且是用语音控制的,点击按键,你看它识别到了这个桌面的按键, 看能不能打开啊,等待按键打开,双击六不六,牛不牛?是不是很恐怖?

今天给大家分享一个豆包手机同款的开源项目,也就是最近特别火的智普,他们开源的 open oto g l m 是 专门用于控制这种托管手机的智能体。这个是一个框架,也是一个项目,但是这个总体来讲它的亮点大于实践, 主要有两个比较大的创新。第二个就是他们这个框架是可以进行这种手机的 连接,其实它跟按键精灵是差不多的,甚至它比按键精灵要小或者简单很多,实现了电脑和手机的远程操作,可以直接连 usb 或者直接在一个 wifi 里面就可以进行对接和联通。 我也详细梳理了一下这个项目,它开源的话其实并没有开源特别多的东西,像一些 memory 记忆体啊,这些记忆模块都没有开源,而且它只有一个智能体模块,它更像一个 simon, 而不是实际的一个项目。因为他在去年的时候其实是呃发了一个 app 的, 也是 otoglm, 但是在后面就没有特别多的推广了,而且效果也一般。 但是由于这一次豆包手机大火了之后,他借着这个风也做了开源,让大家也看到了这个项目。 我们详细来梳理一下这个项目。首先它的主要的架构就是你可以支持用它自己的本地模型,当然它都是使用的这种 best url 的 方式,你可以用本地的,也可以直接用现成的,但是那个模型必须要支持能元素定位, 现在币源的模型几乎都可以多模态的,最近的微软也开源了一个三 b 的 模型,应该性能也是蛮不错的,做元素定位,而且思考的模型 应该性能也是蛮不错的,但是他没有跟这个模型做一下对比,不知道他们九 b 的 这模型跟这个微软开源的三 b 的 模型比起来怎么样,应该大差不差,因为微软这个模型稍微小一点点,但是测试起来效果还是蛮不错的,而且小了之后才能在我们这种本地的这种显卡上面跑。九 b 还是挺大的,不算小了, 但是他有量化的,不过肯定是需要二十四 g 才能跑的,三 b 的 话做一些量化操作的话,也是可以让他实现在十二 g 内存上面跑的。 我重点比较疑惑的就是它到底有哪些工具和它这个智能体,它是什么样的一个智能体?它智能体只有一个智能体,然后我也没有 memory, 也没有记忆的规则,然后主要就是典型的 react 智能体, 整个流程就是典型的感知、思考、行动的这样的一个循环。然后每一次它做任务的时候或者下发任务的时候,它就会把整个 手机的系统去构建一个上下文,他的系统有什么应用这些,还有他的截图,就构建这样整体的一个上下文,加上你的一个任务规划, 然后他通过思考思考了之后去规划出来一个计划,然后去做执行,每一次执行了之后,他再进行一次思考,然后再进行执行,直到完成任务为止。当然他还有一些敏感操作,比如说验证码,比如说 要进行付款呀,这个是要人工介入的,它会主动的提示你们,我重点是想要知道它有哪些工具,或者可以执行哪些操作,是怎么样执行的?然后我就让它梳理了下,我是用的这个 deepweek 来做的,梳理它的工具也 跟按键精灵是差不多的,甚至比按键精灵要简单很多。首先就是启停指定的应用,然后手机上面关键的那几个按钮,还有就是滑动输入文本,返回上一页,还有点击,这些都都是可以的, 主要用的就是滑动文本和点击这几个,然后启启停应用,切换应用,这都是标准的按键精灵里面的东西。然后就是操作他的其实是一个相当于方寸扣领,点击某一个按钮去调用这某一个工具,然后有一些比较标准的规则, 应该执行前要检查应用,然后最多呢连续的等待三次,验证这个操作是否可以 进行操作。然后就是完成之后检查一下它的准确度,其实整体看起来它是一个 demo 的 形式,它并不是一个特别完整的项目,只是一个 非常简单的 demo, 稍微复杂一点的可能就是它搭起来了这样的一个框架,你自己可以去加一些 memory, 或者说加一些什么东西,然后我去可以放在你的手机里面,可以进行继续的二次开发。 总体来讲这个项目还是不能直接拿来做实际的运行的,可以做二开,这个是可以的。然后我都还专门让它梳理了一下它的记忆模块有没有,它是没有记忆模块的,它只有它模型上下文 token 的 这样一个上下文,然后这些提示词它都是用的中文呢?然后必须遵循的一些规则, 这些提示词其实还可以拿来做一些借鉴这些智能体的提示词借鉴还是蛮不错的。还有像这些执行动作某一个 app, 然后这就是它们方选透的一些东西了,当然做成 mcp 其实也是可以的。

豆包手机抢不到?别抢了,装上这个 app, 你 的安卓机一秒变身豆包手机,把我车的回响打开, 给我在美团上点一杯深夜拿铁,全自动下单,我最后只需要付个款就行, 是不是很强?其实它的内核是基于智普开源的 auto grm, 但我做了一个重要的改进,我用安卓系统的无障碍服务,完美替代了原来复杂的 adb 底层控制, 彻底告别电脑,告别数据线。现在安装难度呢?直接较为打击,就像你平时装个 app 一 样简单下载安装开启权限,然后填入智普的 a p i k, 搞定。想要尝鲜的朋友下载的二维码我已经放在我的个人主页了, 但必须严肃提醒大家,无障碍权限非常敏感,请务必谨慎授权。如果你有技术基础,强烈建议直接去我的 github 下载源码,自己编辑安装,这样最安全。 最后呢,感谢 open auto g l m 安卓提供的无障碍思路以及智谱 auto g l m 的 核心 a 键的逻辑。我也已经将我的代码在 github 上进行开源,没有开源社群的建立,也就没有这个豆包手机的平替版。 nice! 我是 喜得湖,用 ai 点的咖啡,你喝到了吗?我们下期见!

抖爸抖爸,给我打开抖音,然后找两个美女视频给我点个赞。 这个点赞这广告他应该会哦,他划掉了, 一直刷不到,怎么办呢?把这个刷到了,哈哈哈,牛逼。

打开抖音搜索美女主播,给前三名点上关注, 如何安装,你也不需要去一步一步的操心怎么写指令,你直接把这个地址,直接把这个地址扔给啊切克 ppt, 或者扔给啊通讯签文,扔给豆包,他直接帮你生成一个安装的一个指令,但首先是安装那个对,安装 python 相关的一个环境, 那我们需要去安装一个 v o m 的 一个啊框架,然后再去下载一个模型,对,然后直接啊可以在本地啊启动服务,对,我们还要在手机中去安装一个 a d b 的 一个啊驱动,然后打开 usb 的 一个调试, 那就可以了。安装的过程中你直接的遇到任何的问题报错,然后直接丢给 a, 然后他会对直接帮你去啊找到一个相关的解决方案。

大家好,我是天天手机侠,最近有很多小伙伴问我如何用手机啊?远程控制自己的电脑, 就自己上班的电脑,家里的电脑,因为电脑不可能像手机一样随时随地的在身边啊,一旦你出去,出去了,然后就无法去控制自己的电脑了, 然后比如说远程控制办公,远程控制挂游戏都不可以啊。接下来就教给大家一个, 反正是我自己用的一个非常好的办法。首先就在手机端下一个这个向日葵远程控制,然后在自己需要远程的一个 电脑也要下一个这个,呃,软件就叫向日葵远程控制,然后打开,然后找到他的官网,这个是官网,然后直接下载下来, 嗯,看是哪一个,就豌豆丝的, 然后直接下载, 嗯,下载好了安装,安装的话,安装好了这两个端都要填写一个账号, 然后直接安装, 然后家里的这个电脑上的这个软件要把那个开机启动打开,这样的话就像每一次他都是启动的,然后你控制的话,直接用手手机就可以控制, 然后直接注册啊,我在扫码登录一下 好了,这台电脑就是叫做 pc, 也可以在这里面把名字改掉啊,都可以,然后主机加入列表,然后加入列表, 立即加入,然后密码随便写一个, 然后完成加入,好吧,然后这台电脑就叫做电力,就是我店里的电脑,然后呢,现在我们就可以用手机来控制它了,一般你像 在手机上,然后直接打开这个软件,然后刷新一下, 看到这个店里没有,直接打开,点桌面控制,然后访问密码,然后点击 看到没有,这时候就可以远程控制自己的电脑,然后这下面也可以反转啊, 然后有很多指针模式,然后键盘录像锁定,然后可以旋转屏幕这样大一点,我想我平常挂游戏啊, 然后挂机就可以远程的控制它,非常好用。

哎,大家好呀,今天介绍一个像豆包手机一样智能的 ai 模型, oppo g a l m 企业级应用大模型。就像最近爆火的豆包手机,能自动帮你处理买车票、点外卖等,并且能够多平台对比公司采购、采 财务、 hr 这些业务全流程,它都能全自动跑下来,压根不用你盯着。咱先看采购以前几个买一百台电脑门的需求,得手动查预算,找供应商比价签合同,光纤系统就得半小时。包头 g l m 咋干?他先拆成六步,自动对接你公司的 erp, 查预算够不够,再去采购平台抓三家合格供应商,连用户评价、历史合作价都发的明明白白。自动生成比价表。一看这表,价格将过期 售后全标明,重点全程透明。更牛的是签合同,它能自动识别合同里的价格,交过期要是有某部条款,还会标黄,提醒你审批过了直接触发财务系统付款,最后同步仓储系统确认入库。 全程不用你点一下鼠标,就等收通知。再说说财务最头疼的报销和报表。以前员工贴发票,你得一张张看真伪。对考勤月底做报表,要从 e r p 银行销售系统导数据,一千张发票三个人算五天,还老出错, auto g l m 咋就长?员工上传报销票据, 他用 o c r 一 扫密码识别金额,查发票真伪。还能对接考勤系统。比如员工说出差三天,他自动核对考勤记录,超标准的直接标异常 符合规则的秒打款,月底更省心,它自动从所有系统抓数据,生成利润表、费用表,还能用大白话告诉你,这个月办公用品超值百分之二十,不用你再扒数据。筛选一千份简历 大概需要七天时间,不光外,还特容易把人才给遗漏掉。新员工一起入职的时候更忙,还得帮着开通账号安排培训,忙的脚都沾不着地。但用 oppo g l m 就 不一样了, 他分分钟就能把千份简历分析完,还能按技能、经验和性格维度来匹配岗位,直接把选人排名列的明明白白,就连出差、面试的问题都能替你问。例如,你对某技能熟悉吗?你可以接受加班吗?这问完还能自动记答案, 节省了大量的时间。你最想让 oppo g l m 帮你自动干哪个流程?是采购、财务?还是 hr 评论区?说出来我直接给你发对应场景的解决方案。