00:00 / 01:56
连播
清屏
智能
倍速
点赞261
00:00 / 04:45
连播
清屏
智能
倍速
点赞30
00:00 / 01:17
连播
清屏
智能
倍速
点赞2
小码歌6天前
突破:AI Agent一口气验证通过7类21种场景的验证码 #openclaw #养龙虾 #ComputerUse 我给龙虾同类型的Agent加上了眼睛和手,补上了AI Agent最后一块能力缺陷,AI Agent可以完全像人类一样操控你电脑上的任何软件,可以无障碍访问任何网站,即使网站有复杂的验证码阻碍。 【背景】 我们致力于用可靠的自动化,全面替代重复的、体力型的电脑操作——即人们每天在键盘鼠标与界面间完成的例行点击、输入与导航。这既包括个人日常任务(您自己的桌面与浏览器工作流),也包括企业员工的日常工作(标准业务应用与 Web 管理后台中的重复操作步骤),凡需要视觉、判断与多步控制的场景均适用。 【验证码】 要实现AI像人一样操作电脑,遇到的第一关就是将人和机器区分开的验证码,基于这个原因,我们在视觉的AI Agent中加入了验证码自动验证通过的能力。视频清晰展示了AI破解7类21种场景的验证码验证通过过程,虽然少数时候不是很丝滑,出现了错误,比如点错了或者打开了错误的页面,但是AI都能通过观察屏幕察觉到异常,最后还是回归到正常的轨道上,继续完成后续任务。这正是AI Agent强大的地方,能够自我规划任务,通过观察自动纠正错误。 【超长任务】 视频原始时长达45分钟,期间Agent仍然正常运转,未出现常见的上下文过长二发生遗忘或者偏离目标的现象,核心在于Agent的计划跟踪能力和任务快照机制,中间Agent自动执行了两次快照,记录了当前执行计划和进度、已经提取的数据、学习到的经验,同时截断历史的上下文以防上下文爆炸带来的遗忘和偏离问题。
00:00 / 04:34
连播
清屏
智能
倍速
点赞38