Kiro自动化部署AutoGLM模型 hone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。系统通过 ADB(Android Debug Bridge)来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作流程。用户只需用自然语言描述需求,如“打开小红书搜索美食”,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。系统还内置敏感操作确认机制,并支持在登录或验证码场景下进行人工接管。同时,它提供远程 ADB 调试能力,可通过 WiFi 或网络连接设备,实现灵活的远程控制与开发。 支持的应用 Phone Agent 支持 50+ 款主流中文应用: | 分类 | 应用 | |------|-----------------| | 社交通讯 | 微信、QQ、微博 | | 电商购物 | 淘宝、京东、拼多多 | | 美食外卖 | 美团、饿了么、肯德基 | | 出行旅游 | 携程、12306、滴滴出行 | | 视频娱乐 | bilibili、抖音、爱奇艺 | | 音乐音频 | 网易云音乐、QQ音乐、喜马拉雅 | | 生活服务 | 大众点评、高德地图、百度地图 | | 内容社区 | 小红书、知乎、豆瓣 | Verbose 模式输出 当 `verbose=True` 时,Agent 会在每一步输出详细信息: ================================== 💭 思考过程: 当前在系统桌面,需要先启抖音应用 🎯 执行动作: { "_metadata": "do", "action": "Launch", "app": "抖音" } ... (执行动作后继续下一步) 💭 思考过程: 抖音已打开,现在需要点击搜索框 🎯 执行动作: { "_metadata": "do", "action": "Tap", "element": [500, 100] } ✅ 任务完成: 已成功搜索美食攻略 #人工智能 #编程 #Kiro #autoglm #AI手机
00:00 / 04:17
连播
清屏
智能
倍速
点赞32
00:00 / 01:05
连播
清屏
智能
倍速
点赞66
00:00 / 00:46
连播
清屏
智能
倍速
点赞7035