为什么智普开源 auto g l m 如此重要?过去,向手机 ai 助手能自动发红包、点外卖,这样的能力被视为巨头的专利,但智普的选择截然不同,用 mit 加 apache 二点零双开源许可证协议,把整套能力白送给开发者。这意味着手机厂商无需从零研发,即可快速集成 ai 原声能力。初创团队能基于 auto g l m 打造垂直场景 agent 医疗温诊助手,引发足操作,引导研究者可复现改进发表新算法,普通用户也能在本地运行,真正掌握自己的数据与隐私。而这正是大语言模型 g u i。 智能体术反复强调的核心理念。智能体不应是黑箱服务了, 应是可理解、可控制、可引进的合作伙伴。这本书全面系统地把 auto g o m。 的 底层原理 g o i。 智能体讲透了。如果你想基于开源的 auto g o m 进行二次开发,像巨头一样开发属于自己的 ai 助手,一定要看看这本书,它会让你少走弯路,更快更好地开发出爆款 g o i。 智能体。点击下方链接下单,获得人机交互新时代的入场券吧!
粉丝1178获赞1929

手机圈子天又塌了,豆包手机的发布让我们的智能手机变成了逗逼手机,让所有人见识到什么叫真正的 ai 手机。但是我们同时也见识了资本的力量,一号发布,二号微信立马封杀,紧接着阿里这些巨头也全部跟上,共同抵制。 九号智普 ai 突然宣布将核心产品 auto g l m 彻底开源,这意味着任何手机厂商,任何开发者都 都能立刻拥有制作、训练 ai 手机的能力。但有件事很耐人寻味,智普 ai 和字节并没有商业关联,反倒是阿里也腾讯、美团这些巨头是它的核心投资方。这波大义灭亲还真是挺有意思。 智能手机取代按键手机用了小十年,现在有了开源技术, ai 手机取代智能手机也许只需要一年。真的是太神奇了,怎么下载,怎么配置?怎么让你的手机变成 ai 手机?问下豆包去吧!

本来以为字节的豆包手机被各大 app 联手封杀后, ai 帮你自动点外卖发微信,这事就算黄了。结果没想到,智普 ai 昨天半夜突然搞了个大动作,直接掀桌子了。他们把类似的核心技术 全部开源。这意味着,以前只有巨头能搞的 ai 操控手机,现在代码就在那,人人都能拿来用。这下好戏才刚刚开始。好戏开始安排,这事还得从前几天说起。大家都知道自己也搞了个豆包手机, 因为他拿着系统级权限,能在不同 app 里来回跑,点个外卖,发条微信,顺手比个价,啥都能干。 结果一下子就踩到一堆大厂的痛脚,淘宝、微信、各家银行 app 立马把它封了个干净。嘴上说是为了保护用户安全和隐私。 眼看着 ai 手机这股火刚冒头就要被掐灭,质朴在这个截骨眼上直接扔出了一枚重磅炸弹,正是开源那个研发了三十二个月的 auto g l m, 而且还保证绝不碰你的隐私。厉害!这招为什么叫掀桌子? 你看啊,各大 app 厂商能封杀豆包,是因为豆包是个具体的产品,我有把子我就能打。但质朴开源的是什么?是框架?是代码? 这就好比你没收了我手里的枪,但我转头就把造枪图纸发到了网上,不仅免费,还包教包会。现在任何一个手机厂商,甚至懂点代码的个人开发者, 都能拿着这套叫做 auto g l n 的 东西,在自己的设备上造出一个能看懂屏幕、能帮你干活的 ai 助手。巨头们能围搅一个豆包,但怎么围搅千千万万个基于开源代码生长出来的私房豆包? 而且这玩意的技术逻辑,简直是对传统 app 防御机制的降维打击。我刚特意看了一下技术文档,它跟以前那种容易被封的脚本外挂完全不一样。以前的脚本或者辅助功能是告诉程序去点那个 id 叫 button 的 按钮, app 厂商改个代码就能把路堵死。 但智普这个开源的 auto g l m, 它用的是视觉大模型,逻辑跟咱们真人一模一样。它是先看屏幕截图,大模型分析出哦,这是微信图标,然后再模拟手指去点击。 划重点啊,只要人眼能看懂界面,这 ai 就 能操作。除非 app 厂商把界面做的连真人都看不懂,否则根本防不住。他甚至调用的是安卓底层的 adb 指令,那是给开发者调试用的尚方宝剑,你敢封 adb, 等于把整个安卓开发生态都给封了。这次绝, 那大家最关心的隐私问题呢?这次开源最狠的一点就在这儿。之前大厂不是拿隐私泄露当理由封杀吗?智浦这套方案支持本地部署 什么意思?就是这个 ai 模型可以直接跑在你自己的电脑或者未来的高性能手机上,他看着你的屏幕,帮你操作所有数据、聊天记录、支付密码, 连哪怕一个比特都不用,传到云端,全部烂在你的本地设备里。这下大厂们连为了保护你隐私这个理由,都被这套开源代码给瓦解了。 这东西现在好用吗?说实话,体验非常奇妙。举个例子,你想去香港玩三天,以前你得在小红书刷一下午攻略,还得手动记笔记,现在用 auto g l m, 你 跟他说一句话,他自己打开浏览器,自己搜帖子,甚至还能看懂笔记里的图片,帮你避坑,最后直接生成一份攻略, 它实现了真正的边想边干。人类是想好了再动手,现在的 ai 也能一边思考复杂任务,一边这就去给你执行了。这场开源让我想起了一部电影 v 字仇杀队,里面的主角 v 倒下了,但千千万万个戴着面具的 v 站了起来。同样的一个豆包,手机或许会被暂时封锁,但当智普把 autolm 开源的那一刻起,手机 a 阵智能体的种子就已经撒遍了全世界。对于手机厂商来说,这天上掉馅饼,小米、 荣耀这些硬件厂有了现成的技术底座以后,手机不是智能手机,而是真的懂你的机器人。对于我们普通用户来说,这可能是一个时代的转折点。也许很快,我们就不需要在一堆 app 之间切来切去,不需要忍受开屏广告,因为有一个只听命于你的 ai 智能 会帮你搞定一切技术的大门,一旦打开,就再也关不上了。这不是简单的技术升级,智普这一手直接把选择权交还给了每一个开发者和用户。 所以说,这场戏现在才真正进入高潮。摆在那些互联网巨头面前的路其实已经很窄了,要么 继续修更高更厚的墙,哪怕牺牲用户体验,也要死守流量。要么乖乖坐回谈判桌,把 api 开放出来,大家一起搞生态。如果是你,你会选择一个什么都能帮你干的 ai 手机,还是坚守在现在这些超级 app 里呢?欢迎在评。

寄豆包 ai 手机后,二零二五年年底的顶级杨某,来自 ai 大 模型企业智普。在十二月九日,智普宣布开源其研发了三十二个月的能操作手机的智能体模型 autolim。 此次开源的是一套拿来就用的完整能力包,包括训练好的核心智能体模型、封幼师能力框架与工具链,覆盖淘宝、抖音、美团等超过五十个高频中 文 app, 连代码带框架全部免费公开了。这个 autolim 拥有和豆包手机几乎完全相同的能力,开源目的是要让每个手 手机都可以成为豆包手机,这意味着这项技术不再是哪个定制版手机的独家特权。现在起,开发者都可以把这个能力装进任何 设备里,对,是任何设备,也就是说,手机这个载体也不是唯一的载体了。明年开始, ai 手机和各种 ai 设备将遍地开花。智谱开源的这个动作,直接把 ai 替人操控终端设备的路给敞开, 直接让 ai 操控成了未来各种设备载体的标配,这就跟当年安卓开源一样,具有 ai 时代的标志性意义。智普把 auto g r m 开源,是为了让所有开发者一起动手,让我们熟悉的钢铁侠的 ai 助手 jarvis 不 会只诞生在某一家大公司里,而是诞生在我们每个人在用的终端里。你准备好了吗?关注阿宇,与你一同领悟成长之路!

二零二五年十二月九日,正当市场热议豆包手机与互联网大厂的攻防战时,智普 ai 深夜开源核心 ai agent 模型 auto g l m。 此举不仅是技术分享,更主动塑造了 ai 手机未来生态格局。 智普对 ai 使用手机的探索,始于二零二三年四月,经近一年框架构建与抽象团队,使 ai 能把自然语言指令拆解为稳定可回放的操作步骤。二零二四年十月, 可稳定完成真机操作链路的 auto g l m 问世,一个月后齐发出首个 ai 完成的手机红包,标志 ai 跨过从对话到执行的关键门槛。 这件事只在一家公司做是不够的。智普在官方声明中明确开源战略,意图防止会用手机的 ai 能力成为少数厂商私有入口,扼杀开发者创新空间。 即将训练好的核心模型能力、框架工具链及覆盖五十多个高频中文应用的 demo 全部开源,意在将 auto g l m 打造成行业共研的公共底座,让硬件厂商、手机品牌乃至个人开发者都能去此快速构建 ai 手机助手,大幅降低技术门槛。 质朴的开源时机颇具深意。此前字节跳动豆包手机工程样机因跨应用自动化能力触及互联网大厂基于用户停留和广告变现的核心商业模式,遭主流应用登录限制与封堵,暴露了封闭式依赖系统及权限方案的生态阻力。 auto g l m 则走差异化路径,基于视觉大模型分析屏幕截图,通过 adb 指令模拟操作,这种所见即所得的类人操作模式,让应用厂商难用。简单代码检测封禁 智普开源实质是为行业提供绕过生态壁垒的技术选项,将竞争从全线争夺引向体验创新。 ai 操控手机的最大顾虑是安全与隐私。智普的解决方案是将 ai 置于云端虚拟手机运行, 与用户真实物理环境隔离操作可审计回放干预,且主动放弃极高隐私敏感应用的操作支持。开源更是这一安全理念的终极延伸, phone use 能力壮大后,必将触及核心敏感数据, 通过开源和允许私有化部署,质朴将数据和隐私控制权完全交予使用者,实现技术向生态开放,数据留在自己手中。 auto g l m 开源拉开了 ai 终端开放,共创时代序幕,让人人皆可打造 ai 手机成为可能,也是智普构建产业生态、突破 c 端瓶颈的关键布局。 正如智普所言,我们迎来的可能不只是 agent 元年,更是 agent 的 十年。打开 ai 手机能力的技术黑箱,将创新钥匙交与社区,一个多元、充满竞争与活力的 ai 原生终端生态才有了真正诞生的土壤。

上周还在被围堵的 ai 手机核心技术,这周突然被开源了。智普这部棋,表面是技术共享,实则给所有人发了把钥匙,能绕开 app, 让手机直接替你干活的钥匙。 你没看错,以后抢票、订餐、比价,不用再反复打开 app 输密码,切界面,一个指令, ai 帮你一气呵成。 但对商家和创业者来说,这是冲击还是机遇?当流量不再锁死在入口,服务好不好、体验顺不顺,才真的能留住人。 这根本不是简单的技术战,是我们和手机的关系、商业的规则都要被重塑的寓言,时代在问,守住过去的围墙,还是拥抱新的桥梁?你的答案,评论区告诉我。

十二月九日,智普正式开园,全球首个支持智能手机全流程操作的 ai 智能体框架 auto g l m 只在推动 ai 手机普及。 该模型具备 phone use 能力,可识别屏幕元素并模拟真人操作,如点击输入支持微信、淘宝等五十加高频应用,完成外卖、点单、机票预定等复杂流程。核心突破 一、云端隔离, ai 操作在虚拟手机执行,与用户物理设备隔离,避免隐私泄露。 二、安全机制,不收集敏感信息,支付等高风险,操作需人工确认。三、开源生态,硬件厂商可基于 auto g l m 快 速开发 ai 助手,打破技术垄断行业意义, 降低 ai 手机研发门槛,推动生态从封闭走向开放,加速 ai 终端普及,未来或推动手机从工具向智能管家转型。

没有想到都跑手机的朋友们,恭喜你省了三千五,因为就在昨天的时候,支付把它的 autgrm 开圆了,它可以直接机关你的手机屏幕,替你思考点击输入场景,覆盖了五十多个高频的中文 app, 比如说微信、淘宝、抖音、美团这些核心的场景,它都是可以跑的。 我拿它做了两个小测试,有亮点,当然也有吐槽点。首先第一个点外卖,它是真的可以跑通,比如说你想在美团上去下单,然后到加购,下单路径是很顺畅,你会产生一种错觉, 好像手机里面住了一个非常懂你小助手一样。第二,他的一个跨平台笔架是很实用的,我可以让他对比淘宝和京东同款拖鞋,他能够自己搜,自己去对比,最终给出你的一个结论,这就不是什么聊天机器人了,这相当于一个端侧 a 阵的他真真正正的上桌了。更关键的是什么?他居然很克制, 比如说他碰到了支付或者验证码之类的敏感操作呢?它会自动停止让你接管,很聪明,不会约借。但有一点很值得吐槽,就是现在的形态对普通人是不够友好的,你要用电脑通过 a、 d、 b 去控制手机体验,实际上更像是你在电脑面前远程控制着你自己的手机,就很奇怪。大家如果想要试试,可以找我拿下开源地址 和它的一个部署教程。智普啊, autolm 开源,我想说的是,它的价值不是在完美的体验,而是说它释放了三个信号。第一, ai 手机的异件可能要被打下来了, 以后的 ai 体验不一定要靠很贵的硬件,说不定就是靠的一个开源框架加它的一个端侧的能。第二就是大厂的 for a 阵固城河开始变浅了,开发者和极客们可以直接拆改做出来自己的版 本。第三呢,无障碍和轻量自动化领域绝对是要爆了。对于一些操作是很方便的人群来说,语音加 ai 操作就等于手机自由。欢迎大家评论区留下你的想法。


豆包手机被围角,智普重磅开源 auto g l m 是 时候记出这本书了!大语言模型 g u i。 智能体人机交互新时代,一本书讲透豆包手机智普 auto g l m。 背后的黑科技 g u i。 智能体。本书由微软 windows 系统首个 g u i。 智能体项目 ufo 核心开发者张潮运 斯、李立群、何世林著写。这本书系统提出了语言、视觉、动作一体化的 g u i。 智能体系反思,正是 autolm、 豆包手机、 open ai、 operator 等产品背后共同的技术底座。书中不仅解释了 ai 如何看懂屏幕、如何将自然语言指令转化为精准点击、滑动输入等动作,如何在没有 a p i。 的 情况下实现快 ip、 快 平台的复杂任务自动化,更深入剖析了微软 ufo 这一工业级 g u i。 智能体的架构设计,其思路与 auto g l m。 高度呼应。你想知道的关键技术在书中均有详细拆解。如果你是开发者、产品经理,或者关心 ai 未来,这本书就是你理解下一代人机交互的必读指南。现在点击下方链接下单,抢先掌握 ai 原生时代的操作手册!

前几天我们了解了一下豆包手机被各大 app 软件禁止登录的事情,我原本以为 ai 直接操控手机系统需要禁止一段时间,但是其实在十二月九日,突然间有一匹黑马同时同步下场竞争,那就是北京的智普青岩。 单单从场景的被动定义到智能体操控整个的手机系统平台,从争议到新产品的介入,这足以证明在未来,我们 ai 手机智能体一定会是一个新的发展赛道和方向。我们先了解一下智普的基本情况。 二零一九年,智浦公司成立于北京,该公司的核心发展方向,它是专注大模型算法研究,中间研发了多个版本的 ai 产品。 早在二零二三年,智浦就加入了 ai agent 的 phone use 战局。在二零二四年,它的凹凸 g l m 项目正式启动,它主要的是研究 ai agent 的 phone use 能力。同时,我们通过一些相关数据能了解到,在二零二四年,它的总营收已经达到了四千二百万美元, 其中来自 ai 开发工具的年度经常性收入已经突破了一千四百万美元。商业盈利的数字已经足以说明萨斯模式已经跑通。在十二月九号当天,智普开元的新闻一度成为 ai 界的热搜,这也充分说明新的 ai 赛场已经开始。 我们先看一下到今天为止,智普 ai 已经做了哪些事情。首先第一个,它已经具备了 phone 与 uzi, 也就是手机操作能力的 a r a g t。 经过相关的业内人士的测验,它已经可以稳定地在城内点外卖、机票预定等,通过原来查询、筛选、笔架付款等十几个步骤的操作能够一键式触达。 这个功能的展示不仅代表着手机厂商的新一轮改革,同时也对原来对硬件、手机和开发者都有一个比较强的设备要求。经过数据以及开源的研究表明,它已经不需要那么重的依赖了。 目前已经支持微信、淘宝、抖音、美团等超过五十多个的中文 app 场景,它的自动化场景和之前豆包的演示几乎相同,也充分说明豆包打开了一个新的赛场,后来者居上以及后来者会越来越多。第二个, 智普 g l m 大 模型的开源造就了很多民间的商业化,大家感兴趣的话可以搜一下闲鱼,比如说豆包呀,智普呀相关的一些内容,它会给你直接推荐一到五百以内的就是远程部署以及需要你的手机。原来我们是需要依赖手机且一些硬件基础不差的, 但是现在他简直是 ai 界的华强北,任何厂商、任何设备、任何开发者都可以基于 glm 大 模型进行输入和输出,这哪是比模型啊,差不多是零门槛了,但是远程代部署还是有一定的风险的, 你的相关信息材料以及包括支付等个人信息安全的一些内容有可能会被盗取。田姐还是建议,如果你不是相关的从业者,也没有自己的一个搭建的能力,还是等子弹飞一会儿,它能够真正市场化的时候,能够被 c 端用户直接使用的时候,你再去体验哦。 三、技术和场景的变更,更是技术场景上的更上一层楼的大摸底。 我如果说这些整个能力,我们的核心词汇就是拼装,比如说一些高手玩家,已经让开源更加的发扬光大了。我们知道一般的手机有安卓和 ios 系统,原本呢,开源的发布只针对安卓生态,但是一些极客大神已经能够手搓 ios 版本了,且成功了, 等于说水果机也能使用,直接打破了厚重的系统限制。而且开源还脱离电脑跑程序,也直接匹配它配套的这些 ui 界面等等。 这些才一周啊,短短一周就有这么多的大神,他的灵感以及二层的创作层出不穷,那么在未来, ai 手机智能体还会远吗? 经过最近的一些分析以及一些相关报道的一些观察啊,这已经是一个新的行业大事,因为人们已经习惯了移动设备到生活的方方面面,它改变的不仅是用户的使用场景,更是各大软件能力的 垄断能力的一个打破。当然,作为各大 a p p 有 护城河的软件,还是要适当开放拥抱,尽量拓展可商业化的场景,至少避免真的被爬了数据而浑然不知,比如调用次数,最终的差价、费率等等。用户粘性 你比较好的,你始终保持你的更新迭代,如果有新的场景接入,还是尽快挖掘可以商业化的场景才是根本。 最后再给大家透露一个小小的新闻啊,非官方啊,是因为我看到新闻看到的就是经公开新闻所提到的智普,他计划在二六年在香港进行 ipo, 如果你比较感兴趣的也可以关注一下哟。

前几天,豆包发布了首款 a i 手机,一机难求,工程机都被炒到一万两千块。今天智普直接放了个大招, auto g l m 开源。他们的目标很简单,让每台手机都能像那台热门工程机一样强大。 开源意味着什么?任何人都可以在自己的手机上部署,不需要依赖云端隐私自己把控。开发者可以训练微调,在车间、商铺、医院甚至田野里造出各种你现在想不到的应用。
