Claude ComputerUse 最佳实践 很多人用 Claude ComputerUse 做自动化,第一反应都是:是不是 Prompt 没写好?🤔但 Anthropic 的最佳实践里,最先强调的反而是一个很“工程”的问题:截图分辨率和坐标系。 Claude 明明看着点对了,程序执行时却点偏,很可能不是模型不会推理,而是模型看到的截图尺寸,和程序实际点击时使用的屏幕坐标,不在同一套尺寸里。🖱️📐 ✅ 1. 先处理截图分辨率 Claude 4.6 系列图片有限制:最长边 1568px,总像素 115 万。 超过后 API 可能会静默缩图,不提醒你。 所以别直接丢 1920×1080,建议先自己 resize。 大多数网页 / 桌面 UI,可以先用 1280×720。🖼️ ✅ 2. 注意 Opus 4.7 的分辨率预算 Claude 4.6 系列建议保守一点。 如果用 Opus 4.7,限制更宽:最长边 2576px,总像素 375 万。 复杂页面可以从 1080p 开始试。🚀 ✅ 3. MacOS 一定注意 2x DPI MacOS 截图经常带 2x DPI。 你以为是 1280×720,实际图片可能是 2560×1440。 记住一句话:发给模型的截图多大,API 里声明的 display_width_px / display_height_px 就写多大。 模型返回坐标后,再换算回真实屏幕。🍎 ✅ 4. 指令放在截图前面 不要先甩图,再补一句“点这个”。 正确顺序是:先写清楚任务,比如“点击右下角蓝色 Submit 按钮”,然后再给截图。 模型先知道要找什么,再看图,结果会更稳。📌 ✅ 5. 小目标别硬点 checkbox、系统托盘图标、小箭头、tree view 展开按钮、密集菜单,都是事故高发区。⚠️ 能开 enable_zoom: True 就开。 实在太小,就用快捷键、Tab 导航,或者 DOM 操作。 #claude #ai工作流 #ai教程 #ai自动化 #Anthropic

66
1
58
1
举报
发布时间:2026-05-24 16:48
全部评论
大家都在搜:
主要是Computer Vision这个功能实在太消耗Token了
作者赞过
5天前·日本

1

分享
回复
老李AI实战
老李AI实战

粉丝1125获赞1.7万

猜你喜欢

推荐视频

热榜推荐