00:00 / 04:21
连播
清屏
智能
倍速
点赞1358
ai来事1年前
【教程】用Computer Use控制电脑,只需这几步! 官方项目地址:https://github.com/anthropics/anthropic-quickstarts 今天要给大家带来一个超酷的电脑使用工具——Computer Use!🌟 有了它,我们可以直接通过大语言模型控制电脑,就像有了一个智能助手一样。从打开浏览器到截图、移动鼠标,统统不在话下! 🚀【步骤一】准备工作 首先,你需要一个Claude账号和API Key。别急,跟着我一步步来,保证你也能轻松上手。 🐳【步骤二】安装Docker 根据你的操作系统下载相应的Docker Desktop,安装并运行。看,我这已经安装好啦! 📂【步骤三】克隆项目仓库 打开命令行终端,克隆官方项目仓库。我之前安装过,所以这次我们用“二号”这个名字来克隆。 🔑【步骤四】获取API Key 进入Claude云后台,创建一个新的API Key。记得保密哦,别让其他人拿到你的Key。将Key保存好,但千万别上传到GitHub! 📝【步骤五】配置项目 打开项目说明,复制必要的代码,填入你的API Key。然后,在项目文件夹下运行代码,确保Docker运行正常。 🎉【步骤六】部署成功 当你在本地8080端口看到界面时,就表示部署成功啦!发个“你好”测试一下,如果它能正常回复,那就一切顺利。 📸【步骤七】截图测试 最后,发送一个命令获取截图,如果一切正常,它就会返回截图给你。 好啦,今天的分享就到这里。如果你对这个工具感兴趣,记得点赞、订阅、转发哦!我们下期视频再见!👋 #claude #computeruse #人工智能 #自动操作 #电脑控制
00:00 / 04:53
连播
清屏
智能
倍速
点赞42
Claude和OpenClaw的区别,你了解多少?评论区聊聊 #人工智能#一人公司#智能体 #Claude#OpenClaw Claude官宣macOS端Computer Use功能,能开应用、填表格、操控浏览器,甚至手机远程指挥电脑干活,微博瞬间刷屏“OpenClaw要完”。但这场看似商业巨头对开源项目的降维打击,实则是对AI代理两种核心逻辑的最大误解——Claude和OpenClaw从不是对手,而是AI自动化的两条不同赛道,一个按需待命,一个7×24在岗,各有生存法则。 Claude是典型的“被动响应式助手”,像按小时计费的临时工:打开网页发指令,它解题完成后便隐身,不会预判需求、自动跟进,全程需要人类指挥。而OpenClaw是“主动持续式基建”,如同全天候在岗的专属员工,设置一次“每日8点生成运营报告”,它便在周末、假期持续运行,甚至能学习用户工作模式,主动适配需求,这是二者架构上的根本分化。 成本与自主权的差异,更是让二者适配完全不同的用户群体。Claude按token计费,百万token输入/输出分别收费5/25美元,企业用其处理日常自动化任务年成本可达几十万;OpenClaw开源免费,仅需向大模型API供应商付费,可灵活对接Claude、Gemini、GPT或本地模型,同类型任务年成本仅几万,成本优势显著。更关键的是,Claude深度集成Google套件等平台,看似便捷却让用户陷入生态锁定,提价、限权皆由平台决定;而OpenClaw将代码交予用户,可自主修改、本地部署、切换模型。 当然,Claude的优势无可替代:Opus 4.6推理能力业界领先,benchmark成绩登顶;打开即用无需技术门槛,对普通知识工作者极度友好;与各大平台的集成深度,短期内OpenClaw难以企及,且Anthropic持续砸钱升级,技术军备竞赛从未停歇。 二者的真正对手,从来都不是彼此。Claude的战场是与GPT-5、Gemini的生态竞争,目标是成为“最被企业集成的AI助手”;OpenClaw则角逐AI代理基建赛道,核心是解决企业“是否需要持续自主系统”的需求。飞书的接入,印证了开源基建的市场需求,而Claude的成熟,更让AI自动化市场的容量被彻底验证。 …………评论区聊聊你的看法
00:00 / 03:29
连播
清屏
智能
倍速
点赞14
00:00 / 01:13
连播
清屏
智能
倍速
点赞779
00:00 / 00:49
连播
清屏
智能
倍速
点赞2032
小码歌3天前
突破:AI Agent一口气验证通过7类21种场景的验证码 #openclaw #养龙虾 #ComputerUse 我给龙虾同类型的Agent加上了眼睛和手,补上了AI Agent最后一块能力缺陷,AI Agent可以完全像人类一样操控你电脑上的任何软件,可以无障碍访问任何网站,即使网站有复杂的验证码阻碍。 【背景】 我们致力于用可靠的自动化,全面替代重复的、体力型的电脑操作——即人们每天在键盘鼠标与界面间完成的例行点击、输入与导航。这既包括个人日常任务(您自己的桌面与浏览器工作流),也包括企业员工的日常工作(标准业务应用与 Web 管理后台中的重复操作步骤),凡需要视觉、判断与多步控制的场景均适用。 【验证码】 要实现AI像人一样操作电脑,遇到的第一关就是将人和机器区分开的验证码,基于这个原因,我们在视觉的AI Agent中加入了验证码自动验证通过的能力。视频清晰展示了AI破解7类21种场景的验证码验证通过过程,虽然少数时候不是很丝滑,出现了错误,比如点错了或者打开了错误的页面,但是AI都能通过观察屏幕察觉到异常,最后还是回归到正常的轨道上,继续完成后续任务。这正是AI Agent强大的地方,能够自我规划任务,通过观察自动纠正错误。 【超长任务】 视频原始时长达45分钟,期间Agent仍然正常运转,未出现常见的上下文过长二发生遗忘或者偏离目标的现象,核心在于Agent的计划跟踪能力和任务快照机制,中间Agent自动执行了两次快照,记录了当前执行计划和进度、已经提取的数据、学习到的经验,同时截断历史的上下文以防上下文爆炸带来的遗忘和偏离问题。
00:00 / 04:34
连播
清屏
智能
倍速
点赞36
说说,Claude(4)“龙虾”Claude属于智能体吗? 三、典型智能体行为:Claude已经能“动手干活” 1.Computer Use:Claude能直接控制你的电脑桌面,像人一样“看”屏幕、移动鼠标、点击按钮、输入文字,与任何软件交互(不仅仅是浏览器)。 2.自主代码重构长达7小时:Claude4能自主进行连续代码重构,在持续理解代码意图的基础上进行逻辑优化。 3.Claude Code:能分析整个代码库、搜索API文档、发起拉取请求、回应代码审查评论,所有这些都能异步工作数小时。 四、Claude的智能体生态:从“单兵”到“组织” Claude不仅能自己干活,还能组织“子智能体”协同工作: 1.Subagents(子智能体):分工明确的“子角色”,拥有独立上下文和权限隔离,负责专门任务。 2.Skills:可复用的“操作手册+资源包”,让Claude稳定地按同一套方法做事。 3.Projects:面向工作主题的长期工作空间,持续积累知识与上下文。 4.MCP:连接层协议,让Claude接入外部工具与数据源。 五、实际案例(工作方式): 案例1: 当你让Claude“帮忙预订下周去北京的机票”时: •Claude会自主规划:打开浏览器→进入订票网站→搜索航班→比较选项→填写信息。 •每一步都自我检查:截图确认当前页面状态→决定下一步动作。 •遇到问题自动调整:如果弹窗遮挡,会先关闭弹窗再继续。 案例2:软件重构 当你让Claude“重构支付模块,提高性能”时: •Claude会自主使用grep、find等命令在代码库中探索。 •逐步构建对项目结构、模块依赖的完整认知。 •生成结构化的“行动计划”。 •如果指令模糊,会主动发起澄清性提问。 •持续工作数小时,完成重构。 六、结论:Claude是“有目标的行动者” Claude已经实现了从“对话机器人”到“数字同事”的跨越:你告诉Claude:“帮我安排下周去北京的出差行程”,它能自主完成订票、订酒店、安排会议、生成行程单等一系列任务。 未来智能体AI的形态很清晰:进化为可靠的数字员工,不仅“懂”,更能“干”。 部分内容由AI生成,仅供参考,请仔细甄别。#智能体#claude#AI#人工智能#科普 #教育
00:00 / 02:07
连播
清屏
智能
倍速
点赞10
00:00 / 00:34
连播
清屏
智能
倍速
点赞4
00:00 / 01:01
连播
清屏
智能
倍速
点赞21
00:00 / 01:25
连播
清屏
智能
倍速
点赞20
00:00 / 01:48
连播
清屏
智能
倍速
点赞19
00:00 / 03:55
连播
清屏
智能
倍速
点赞19