豆包 e i 手机没了吗?那三十秒带你体验载版豆包手机。
粉丝212获赞2655

今天给大家分享一个豆包手机同款的开源项目,也就是最近特别火的智普,他们开源的 open oto g l m 是 专门用于控制这种托管手机的智能体。这个是一个框架,也是一个项目,但是这个总体来讲它的亮点大于实践, 主要有两个比较大的创新。第二个就是他们这个框架是可以进行这种手机的 连接,其实它跟按键精灵是差不多的,甚至它比按键精灵要小或者简单很多,实现了电脑和手机的远程操作,可以直接连 usb 或者直接在一个 wifi 里面就可以进行对接和联通。 我也详细梳理了一下这个项目,它开源的话其实并没有开源特别多的东西,像一些 memory 记忆体啊,这些记忆模块都没有开源,而且它只有一个智能体模块,它更像一个 simon, 而不是实际的一个项目。因为他在去年的时候其实是呃发了一个 app 的, 也是 otoglm, 但是在后面就没有特别多的推广了,而且效果也一般。 但是由于这一次豆包手机大火了之后,他借着这个风也做了开源,让大家也看到了这个项目。 我们详细来梳理一下这个项目。首先它的主要的架构就是你可以支持用它自己的本地模型,当然它都是使用的这种 best url 的 方式,你可以用本地的,也可以直接用现成的,但是那个模型必须要支持能元素定位, 现在币源的模型几乎都可以多模态的,最近的微软也开源了一个三 b 的 模型,应该性能也是蛮不错的,做元素定位,而且思考的模型 应该性能也是蛮不错的,但是他没有跟这个模型做一下对比,不知道他们九 b 的 这模型跟这个微软开源的三 b 的 模型比起来怎么样,应该大差不差,因为微软这个模型稍微小一点点,但是测试起来效果还是蛮不错的,而且小了之后才能在我们这种本地的这种显卡上面跑。九 b 还是挺大的,不算小了, 但是他有量化的,不过肯定是需要二十四 g 才能跑的,三 b 的 话做一些量化操作的话,也是可以让他实现在十二 g 内存上面跑的。 我重点比较疑惑的就是它到底有哪些工具和它这个智能体,它是什么样的一个智能体?它智能体只有一个智能体,然后我也没有 memory, 也没有记忆的规则,然后主要就是典型的 react 智能体, 整个流程就是典型的感知、思考、行动的这样的一个循环。然后每一次它做任务的时候或者下发任务的时候,它就会把整个 手机的系统去构建一个上下文,他的系统有什么应用这些,还有他的截图,就构建这样整体的一个上下文,加上你的一个任务规划, 然后他通过思考思考了之后去规划出来一个计划,然后去做执行,每一次执行了之后,他再进行一次思考,然后再进行执行,直到完成任务为止。当然他还有一些敏感操作,比如说验证码,比如说 要进行付款呀,这个是要人工介入的,它会主动的提示你们,我重点是想要知道它有哪些工具,或者可以执行哪些操作,是怎么样执行的?然后我就让它梳理了下,我是用的这个 deepweek 来做的,梳理它的工具也 跟按键精灵是差不多的,甚至比按键精灵要简单很多。首先就是启停指定的应用,然后手机上面关键的那几个按钮,还有就是滑动输入文本,返回上一页,还有点击,这些都都是可以的, 主要用的就是滑动文本和点击这几个,然后启启停应用,切换应用,这都是标准的按键精灵里面的东西。然后就是操作他的其实是一个相当于方寸扣领,点击某一个按钮去调用这某一个工具,然后有一些比较标准的规则, 应该执行前要检查应用,然后最多呢连续的等待三次,验证这个操作是否可以 进行操作。然后就是完成之后检查一下它的准确度,其实整体看起来它是一个 demo 的 形式,它并不是一个特别完整的项目,只是一个 非常简单的 demo, 稍微复杂一点的可能就是它搭起来了这样的一个框架,你自己可以去加一些 memory, 或者说加一些什么东西,然后我去可以放在你的手机里面,可以进行继续的二次开发。 总体来讲这个项目还是不能直接拿来做实际的运行的,可以做二开,这个是可以的。然后我都还专门让它梳理了一下它的记忆模块有没有,它是没有记忆模块的,它只有它模型上下文 token 的 这样一个上下文,然后这些提示词它都是用的中文呢?然后必须遵循的一些规则, 这些提示词其实还可以拿来做一些借鉴这些智能体的提示词借鉴还是蛮不错的。还有像这些执行动作某一个 app, 然后这就是它们方选透的一些东西了,当然做成 mcp 其实也是可以的。

哎,大家好呀,今天介绍一个像豆包手机一样智能的 ai 模型, oppo g a l m 企业级应用大模型。就像最近爆火的豆包手机,能自动帮你处理买车票、点外卖等,并且能够多平台对比公司采购、采 财务、 hr 这些业务全流程,它都能全自动跑下来,压根不用你盯着。咱先看采购以前几个买一百台电脑门的需求,得手动查预算,找供应商比价签合同,光纤系统就得半小时。包头 g l m 咋干?他先拆成六步,自动对接你公司的 erp, 查预算够不够,再去采购平台抓三家合格供应商,连用户评价、历史合作价都发的明明白白。自动生成比价表。一看这表,价格将过期 售后全标明,重点全程透明。更牛的是签合同,它能自动识别合同里的价格,交过期要是有某部条款,还会标黄,提醒你审批过了直接触发财务系统付款,最后同步仓储系统确认入库。 全程不用你点一下鼠标,就等收通知。再说说财务最头疼的报销和报表。以前员工贴发票,你得一张张看真伪。对考勤月底做报表,要从 e r p 银行销售系统导数据,一千张发票三个人算五天,还老出错, auto g l m 咋就长?员工上传报销票据, 他用 o c r 一 扫密码识别金额,查发票真伪。还能对接考勤系统。比如员工说出差三天,他自动核对考勤记录,超标准的直接标异常 符合规则的秒打款,月底更省心,它自动从所有系统抓数据,生成利润表、费用表,还能用大白话告诉你,这个月办公用品超值百分之二十,不用你再扒数据。筛选一千份简历 大概需要七天时间,不光外,还特容易把人才给遗漏掉。新员工一起入职的时候更忙,还得帮着开通账号安排培训,忙的脚都沾不着地。但用 oppo g l m 就 不一样了, 他分分钟就能把千份简历分析完,还能按技能、经验和性格维度来匹配岗位,直接把选人排名列的明明白白,就连出差、面试的问题都能替你问。例如,你对某技能熟悉吗?你可以接受加班吗?这问完还能自动记答案, 节省了大量的时间。你最想让 oppo g l m 帮你自动干哪个流程?是采购、财务?还是 hr 评论区?说出来我直接给你发对应场景的解决方案。

打开抖音搜索美女主播,给前三名点上关注, 如何安装,你也不需要去一步一步的操心怎么写指令,你直接把这个地址,直接把这个地址扔给啊切克 ppt, 或者扔给啊通讯签文,扔给豆包,他直接帮你生成一个安装的一个指令,但首先是安装那个对,安装 python 相关的一个环境, 那我们需要去安装一个 v o m 的 一个啊框架,然后再去下载一个模型,对,然后直接啊可以在本地啊启动服务,对,我们还要在手机中去安装一个 a d b 的 一个啊驱动,然后打开 usb 的 一个调试, 那就可以了。安装的过程中你直接的遇到任何的问题报错,然后直接丢给 a, 然后他会对直接帮你去啊找到一个相关的解决方案。

看好了最近这个很火的豆包 ai 助手,并非独立 app, 其他手机根本用不了。主播给你们找了一个替代的软件,就这个智普开源奥特曼直接说指令,他就给你操作了,也是可以,比如说在淘宝上买东西,你直接说打开淘宝,买什么买什么, 非常简单,苹果、安卓、鸿蒙都是可以使用的,跟着主包操作,小白也能学会。首先打开抖音,点我视频右下角这个,然后点这个分享链接,来到 app store, 打开这个工具,点击允许粘贴, 打开这个自动弹出的资源包,没有弹出的,在这里搜索扬尔宝库,进入这个文件夹,找到软件资源,找到这个 z 对 应的文件夹,取消全选,勾选智普 ai, 最后点击保存安装就可以了。

帮我打开微信,找到李胖醒,给他发一条问候,再用抖音极速版帮我挣五块钱,然后再帮我打一把斗地主。

今天带大家白飘一个软件,最近全网都在热议的 ai 手机智谱 ai 开源大模型 auto glam 的 最新版分享给大家,如果有需要的可以往下看。首先点击我视频右下角分享箭头,选择分享链接。接着重点的来了,需要手机上有这个蓝色工具没有的应用商店下一个。 然后打开蓝色工具,会自动弹出链接文件,点击立即查看。要是没有弹出文件,就在搜索框搜索花妹数码,打开文件,找到软件库文件夹,这里有我最新上传的智普 auto gamma, 需要的自己保存下载,不会的里面也有详细教程。

每天教会大家白嫖一个实用软件,今天教会大家获取的是全网爆火的智普开源 auto glam, 一 款超级好用的 ai 软件, 简直就是今年王炸,内有生活助手、工作助手两个板块,而且完全开源,人人都可以拥有豆包手机。接下来我手把手教会大家如何下载,同时支持手机、平板、电脑三端,操作简单便捷,小白也可以轻松学会。第一步,点我视频分享复制链接, 找到这个软件,打开没有的,下载一个,允许黏贴,它会弹出个资源包,如果没有弹出的话,我们在这里搜索金子工具,找到软件合集,看到这个保存安装就可以使用了。

请用双语帮我讲一下这些绘本吧。豆包,帮我把特斯拉的前备箱打开,再帮我定一个晚上八点半在未来中心的西班牙餐厅正在帮你操作手机。豆包豆包,我下周一到周五要去上海出差,你在飞出上帮我跟陈高丁请个假。 另外你再帮我去飞叔的鞋穿过上提一个出差申请,另一个周一早上八点到上海的高铁票。

二零二五年十二月一日,字节跳动发布豆包手机助手技术预览版,以大模型加 os 加智能体的系统级融合模式,打破传统手机助手局限。首款合作工程机努比亚 m 幺五三。 这款手机搭载高通枭龙八至尊版十六 gb 加五百一十二 gb, 标配六千毫安电池, 售价三四九九元,首批三万台被获迅速售罄,二手市场溢价超百分之二百四十。第二代机型已逆向端侧 ai, 产业链相关企业显著受益。 那么,什么是 ai 手机? ai 手机又称 ai 原声机,它不是为了加 ai 功能的普通手机,而是以端侧大模型加硬件深度协同为核心的全新形态。 大模型直接在手机本地运行,搭配高算力芯片、多模态传感器,让 ai 从单独 app 升级为系统及服务, 真正具备跨应用调度权限和主动服务能力。拿这款豆包手机助手来说,它的设计研发是由字节跳动与中心通信 共同完成的。在分工方面,字节跳动负责 ai 大 模型,也就是豆包大模型的研发、系统交互设计、 ai 功能集成以及部分操作系统层面的定制工作。字节旗下的 o 型团队是豆包手机研发的主力团队, 该团队整合了锤子手机等硬件团队的技术力量,专注于 ai 硬件产品的开发。 而中心通讯负责努比亚 m 幺五三工程样机的硬件研发与生产,包括芯片选型、电路设计、外观造型、生产工艺等环节,同时具备五 g 手机与综合通信设备制造实力。努比亚凭借其在手机领域的技术积累与供应链资源, 确保了豆包 ai 手机的硬件性能和品质。豆包手机助手的核心突破在于打造了系统级 ai 代理架构,即彻底挑出传统语音助手只能单点响应的局限, 通过操作系统层面深度渗透,获得跨应用调度和自动执行权限,真正实现复杂任务一键搞定。 它和普通 ai 应用的关键区别是不只是一个独立 app, 而是与手机系统硬件深度绑定的底层服务。 通过和手机厂商合作,拿到核心权限,能像人一样看懂屏幕操作 app, 而非只能调用有线的应用接口。从软件上看,它采用的是端云协调架构,从而使得隐私与性能兼得, 即采用本地加云端分工模式,兼顾安全与强大功能。在端侧,也就是手机本地运行一百三十亿参数的轻量化大模型,负责语音识别、本地信息管理、简单问答等核心场景数据离不开手机,隐私有保障,离线也能使用 在云端承担纹身、图生、视频、复杂知识问答等重复杂任务, 仅在需要生成内功能时协同,既不占用过多本地资源,又能实现高 ai 能力。从硬件上看,它采用的是高通枭龙八至尊版,这使得它在算力上有兜底。 努比亚 m 幺五三搭载的枭龙八至尊版 ai 助手流畅运行的性能底座,通过三纳米制成工艺,加两颗超级内核,加六颗性能内核,设计单核多核,性能比上一代提升百分之四十五,同时开微信、 excel 视频会议切换无延迟, 多任务并行不卡顿。同时 hexagon npu, 也就是 ai 专用芯片,性能提升百分之四十五,处理大语言模型速度达七十 tops 每秒。 开会时语音转文字,精准区分发言人派菜单,能直接识别菜品名和价格,生成购物清单,复杂 ai 任务响应又快又准。 通过前面的架构设计,软硬结合,使得斗宝手擎界系统级权限实现跨应用自主操作,能看懂屏幕,理解需求,还能模拟人的点击、滑动动作,自动跳转多个 app, 完成复杂任务链。 主要能力体现在三大方面,一是多模态交互,可以说是怎么方便怎么来,即整合语音、视觉、物理、按键等多种交互方式,覆盖不同场景。 在语音交互上,不用喊固定唤醒词,拿起手机直接说需求方言也能精准识别。在机身左侧有独立按键,一键调出悬浮助手,不打断端前聊视频、刷微信的操作。通过搭配 olaf friend 的 智能耳机,骑车做饭时不用碰手机,语音指挥即可。 拍照时能识别商品文字,还能自动优化场景美食,提亮色泽风景,增强层次感。二是拥有智能体,也就是 agent 能力,可以像人一样用手机, 是最核心的干活能力,本质是 ai 能自主规划执行复杂任务。首先它可以进行屏幕感知,能识别 app 里的按钮,输入框文字,任意界面都能直接问这个按钮是干嘛的,帮我提取这里的电话,并且可以进一步跨应用操作,不用手动切换 app, ai 自动串联任务。比如说比价三大平台的肯德基、汉堡,选最便宜的下单并分享给朋友,他会自己打开外卖 app 比价领券下单,再跳转微信转发,全程不用你动手。 最后,他还可以模拟人类操作,理解需求后自动完成点击、滑动、输入等动作,和人手动操作的逻辑完全一致,不用依赖 app 特殊适配, 算是它拥有全局记忆功能,可以说是越用越懂你。它支持手动加自动双模式记忆,从而让服务更个性化。 通过手动记忆,即按特定实体键加音量,加键就能保存重要信息,比如临时记的地址、片号,后续 ai 处理任务时会自动参考。通过自动记忆,即在授权后可读取特定 app 的 收藏内容, 自动记录你的爱好、常用信息,比如常去的餐厅、偏好的口味,下次不用反复叮嘱, ai 就 能精准匹配需求。当然, ai 手机的发展也注定和其他新的重大技术发展一样,道路并不平坦。 比如我们短期内就可以看到的问题有,一是应用风控限制,微信、支付宝等主流 app 可能会禁止模拟点击,因为模拟点击可能被用于恶意刷单、数据爬取等违规行为。豆包助手的应对方案是分腿策略,一方面是与 app 厂商协商,开放合法的操作接口。 另一方面训练模型掌握更多手动操作指令,如滑动输入、语音输入等,即使不能模拟点击,也能通过其他方式完成任务,但执行效率可能会略有下降。 二是商业逻辑冲突。 ai 助手跳过广告,直接定位核心功能,会影响 app 广告收入,这一问题需要行业共识解决,未来可能形成 ai 助手分账模式, ai 助手为 app 带来流量和订单, app 向大模型厂商支付一定分成,从而平衡双方利益。 三是技术优化仍有较大空间。复杂 ui 识别,如小众 app 的 界面和长尾需求,如特殊场景的定制化人物人设短板。大模型厂商的解决思路是数据积累加算法迭代,通过更多合作进行收集不同 app 的 界面数据, 优化视觉识别模型。同时开放第三方开发者平台,让开发者针对小众场景开发 ai 技能,丰富功能覆盖。从整个产业的发展趋势来看,短期预计还是由手机厂商主导。 当前手机厂商掌握硬件入口和系统权限,合作开发周期长达六个月以上,且对核心权限如模拟点击、跨应用数据访问的开发非常谨慎。比如豆包与 vivo、 oppo 的 合作,手机厂商会限制部分敏感权限,避免 ai 助手影响自身生态,如自带的语音助手。 此外,手机厂商的品牌影响力和渠道优势也是短期内主导合作的关键,而中长期预计将会是大模型厂商的逆袭,核心原因是技术壁垒加用户需求倒下。大模型技术需要持续的算法迭代加数据积累, 手机厂商缺乏相关人才。大模型人才主要集中在互联网厂商和独角兽企业,仅靠开源模型无法实现持续优化。而随着用户对 ai 原生手机的需求提升,预计超百分之六十用户将 ai 能力视作购机核心指标, 手机厂商的硬件优势将被弱化,大模型厂商的技术能力将成为核心竞争力。届时大模型厂商的话语权可能达到华为与赛利斯合作的水平。华为提供核心技术,赛利斯负责生产,技术方主导产品定义和体验标准。 好了,以上就是本期视频的全部内容,感谢您的宝贵时间关注我,一起用通俗易懂的语言理解前沿产业趋势,做民百投资人!

相信关注科技圈的朋友啊,最近都注意到了,本周呢有一款最新发布的手机啊,是非常的火热,可以说是一机难求,大家来看一下,就是我现在手上拿到的这款,那从外观来看呢,它其实跟我们平时用的智能手机啊,没有太大的区别,那之所以会受到如此大的关注啊,就是因为它搭载了一款 人工智能大模型,也就是我们所熟悉的豆包。那话不多说,今天我们就带大家来一次沉浸式的开机测评。那刚才登录进来之后啊,我也是按照他的流程设置好了这个豆包语音助手,然后我也下载了一些我们日常常用的一些 app, 我们现在就来跟他做一个这个交互,看看豆包助手能帮我们做到哪些事情。我现在通过这个语音啊,可以直接唤醒豆包,豆包豆包 帮我查找一下携程旅行上关于上海的旅游信息,并帮我生成一份旅游攻略,正在帮你操作,手机结束后会马上告知你。可以看到输入这个指令之后呢,他其实在后台已经在开始帮我执行一些功能,我们可以在这里点进去看一下,我现在是没有触碰到手机的屏幕,但是他已经开始自动的来执行这个信息的检索 来看一下,包括像这样滑动页面,其实都是豆包助手他自己在执行的一些操作。携程旅行上收集到上海的旅游信息,并生成旅游攻略,内容如下,我们来看一下他生成的这份旅游攻略啊,相当丰富啊,刚才看了一下,那我们现在来试试,让他再执行一下任务,豆包豆包, 帮我订一张明早九点从北京到上海的机票,正在帮你操作手机结束后会马上告知你 这里,他会给我一个选项,他列举了一些这个航班,需要我来告诉他我需要哪趟航班。 体验了豆包助手的一些功能之后,我有一个非常明显的感受啊,就是他的这个人机交互的功能还是非常强大的。还有一个比较明显的感受啊,就是目前来说,他在执行任务过程当中呢,这个等待的时间啊,其实还是比较漫长的。比如说我刚才第一个任务,他执行的时间前后加起来大概会有十分钟左右的这样一个等待的时间。 包括这两天我在网上也看到大家的一些评论,比如说他的一些软件兼容的问题,包括一些涉及到安全隐私的问题,我想呢,这可能也是需要在后续的这个真正使用过程当中啊,去进一步的优化或者磨合。目前是其实各位很多的智能体都在里面,但是大部分的智能体都是双方各走各的,事实上智能体他是浮在这个手机的系统上面的, 他不是存在手机系统里面,通过来说,他就有可能在这款手机上面做了最初的尝试,以后能到什么程度,我们还需要观察。从现在他自己没有做系统,所以他对这个系统他要进行改造,他要理解,他也有很长的路啊,要走。

就在豆包手机爆火的当下,智浦开源了 auto g l m 手机智能助理项目,让每一台安卓手机都能成为 ai 手机。 auto g l m 通过 a d b 来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作。我用它帮我在小红书上搜索豆包手机话题, 并且收集点赞超过一百的笔记。可以看到,配合一并开源的九 b 小 模型,全程无需人工干预完成了任务。不过目前智能能力还不够,计划后续换成 gemini 三 pro 再试试,看效果能不能更好。

火爆全网的豆包手机,竟然开源连代码带框架全免费公开!智普潜心研发三十二个月的手机操控 ai 模型,现在能被装进任何手机里,动动嘴、发消息、订票、打车, ai 操控手机的时代真的来了,你期待吗? 而这股能力早已冲进汽车座舱!荣威 m 七 d m h 首发搭载豆包大模型,用最自然的对话就能联动超三百项车控功能,还能听懂言外之意,博人感十足,以后出行都能自在从容。 更惊艳的是,下车后,车辆能自主驶入狭窄车位,彻底告别停车的繁琐,解放双手!只差一辆荣威 m 七 d m h, 你 准备好迎接 ai 掌控的未来了吗?