imax 携手 opencall 为 ai 鼠标装上一双会自主操作的智能之手,无论是本地办公还是远程操控,一句话即可实现全流程自动化。比如,你只需对着鼠标说,把桌面所有文档按大小排序,并放入新建文件夹,语音指令会实时转为文字同步给 opencall, 它将自动完成识别分类新建文件夹移动文件等一整套操作,执行完毕后主动通知你,它还能帮你整理表格,处理各类复杂任务。你只需说出需求,剩下的交给他。简单来说, you must 负责听懂,你点到位。 open call 负责全自动搞定一切复杂操作。
粉丝72获赞564

obni 这次等于把大模型彻底重新定义了。今天凌晨, obni 正式发布 gpt 五点四,把编程推理、计算机操控、网页搜索和百万 token 上下文全部整合进同一个模型,成为第一个官方原声内置电脑操控能力的通用大模型。 它能像人一样自主操控鼠标、键盘,打开软件、处理文件,跨软件完成工作流。原理其实很简单,模型会先读取电脑屏幕截图,理解当前界面,再决定下一步鼠标点击或键盘输入,一步步完成操作。不过这些动作通常是在云端或沙盒的虚拟电脑环境中进行,而不是直接控制用户本机 在电脑操控测试中,成功率达到百分之七十五,超过人类平均水平,并且支持最高百万头,肯上下文,能轻松读完几千页文档。 在覆盖四十四个职业的 gdp 专业测试中,百分之八十三的任务达到或超过人类专家水平。投行及表格建模得分百分之八十七点三,事实错误率降低百分之三十三,编程、搜索推理全面登顶。说到这大家可能就困惑了,听着有点耳熟,都能操控电脑,都说能干活,那不就是 agent 吗? 并不是, agent 是 能干活的爱角色是外挂插件独立模块需要额外配置调试,会面临不稳定、任务完成率低的情况,它不是模型本身自带的。 而 gpt 五点四是把 a 阵能力直接焊死在模型里,不需要调用什么插件,模块理解加规划加操作加验证,全在一个模型里,原生自带,天生就会。如果说现有的 a 阵是改装车, gpt 五点四就是原厂超跑,这就不得不提最近大火的龙虾 open core。 但 open core 并不是模型,是开源智能体框架,它自己是没有大脑的,需要你接入 gpt 跨等模型才能变成干活的助理。 所以你甚至可以有一个大胆的想法,用欧本靠接入 g p t。 五点四,既享受 g p t。 五点四的超强推理,又能借助欧本靠本地部署的优势,实现数据隐私可控和自定义操作。当然,能力强也意味着贵。官方定价标准版输入二点五美元,输出十五美元,为百万头肯 购版更是高达输入三十美元,输出一百八十美元。更有意思的是, ai 云服务创起 hyperbarack 的 c t o 吐槽这哥们儿是他见过思考最过度的模型,你随口一句嗨,他能琢磨五分十八秒直接烧掉八十美元。目前 g p t。 五点四 thinking 只对 plus 和 pro 用户开放,免费版基本无缘。 有人说这是史上最智能、最接近了 g i 的 模型,我倒觉得 g i 远不远不知道,但那个只会聊天的 ai 时代,是真的翻篇了。

太可怕了,太可怕了,我根本睡不着,给你看个东西,给你们演示东西,各位全程自主操作,我没有去动任何东西,完全没有加速。 你看电脑完全自主操作,自主拖拽东西,自主动鼠标,自主打字。你看以后只要一句话,你就可以让他主动控制你的电脑,而不是像之前一样 打代码,然后帮你做个什么东西,它是完全可以看见你的屏幕,然后给你打字,跟你操作没有任何区别,真正的自动化来了。

别折腾了,就在大家还熬着通宵搞 opencll 本地部署的时候, open i 发布的 gpt 五点四走了另一条路,不靠外部框架,直接在模型层把会思考和能操作合在一起。计算机操控, 这次不是说说而已。 gpt 五点四可以通过读取屏幕截图,直接模拟鼠标点击和键盘输入,还能跨应用切换。 你说一句,把邮件附件整理成 excel 上传到公司系统,它自己开软件找按钮、录数据,不需要你提前配置任何集成。在 os word verify 的 桌面操作机准测试中, gpt 五点四的成功率是百分之七十五, 人类机准是百分之七十二点四,而 gpt 五点二还停留在百分之四十七点三之前。大家普遍认为 ai 操作电脑仍处于 demo 阶段, 这次算是真正迈过了一个门槛,办公能力有实际提升。不只是跑分好看, open ai 用 gdp 报基准跑了四十四个职业类别, gpt 五点四在百分之八十三的项目上达到或超过行业专业水平, gpt 五点二的这个数字是百分之七十点九。在模拟同行初级分析师的 excel 建模任务上, gpt 五点四得分百分之八十七点五, gpt 五点二是百分之六十八点四。不过跑分领先是跑分领先。 marco apex agents 榜单显示,目前最好的模型在长流程专业任务中仍只有约百分之二十五的一次性完成率,距离完全接管复杂工作还有距离,理性看待比较好 效率和成本,这次是实打实省下来的。新增的 to search 功能改成按需加载工具定义,在内部测试中, token 消耗减少了百分之四十七,对频繁调用 api 的 用户是直接影响账单的改进 api 版本支持最高一百万 token, 上下文超过二十七点二万 token 后计费翻倍。用之前先算一下成本。 准确率方面,单条声明出错概率比 gpt 五点二降低百分之三十三,整体出错率降低百分之十八。编程和推理整合更紧密了。 gpt 五点四把 gpt 五三 codex 的 编程能力引入主线模型,可以边写网页应用边实时调试。 chad gpt 新增的 思维预览也挺实用,复杂任务先列思路框架,你觉得方向不对可以直接进入调整,省去反复修改的麻烦。 chat gpt 的 plus、 team 和 pro 用户今天起可以直接用 gpt 五点四 thinking 版本,开发者可通过 api 调用, 输入单价从一美元七十五美分涨到二美元五十美分,输出从十四美元涨到十五美元。 但 token 效率提升后,实际总花费不一定变多。 open claw 证明了大家需要能干活的 ai。 gpt 五点四给出的是另一个答案,原生集成开箱即用,用币源换稳定性。两条路没有高低之分,只是面向不同的人。 那么你是准备直接给奥特曼交保护费,还是继续在本地折腾开源呢?欢迎在评论区聊聊。

我是想让奥本考尔,让他像人一样能够看到我的屏幕,操控我的鼠标和键盘,就光这一点卡了我两天的时间,然后我各种网上找视频啊,找 qq 什么的,最后没想到被 一个第三方的软件给解决。人还是不能有偏见,因为我现在一直都觉得什么呢,国外的能用国外的尽量用国外的啊,国内什么这种什么猎豹啊,三六零啊这种我我真的听了我就头皮都发麻, 现在我只能说我浪费了太多的这种无意义的时间在做这种从零到一的独自造轮子的过程。不要不要开箱即用,一定要开箱即用,兄弟们等着四个字就够了。哦对了,最后我还想说, r p a 得完蛋了,原地倒闭吧。

很多人搞不懂豆包和 openclaw 到底有啥区别?今天一条视频给你讲通透。豆包是云端 ai 助手,属于动嘴不动手的类型,打开就能用,不用安装,不用配置,不用折腾。 apikey, 擅长聊天问答、写文案、做总结、翻译、想思路,但我不会碰你的电脑,不能帮你点鼠标、开软件、自动执行任务,只负责给你方法和内容。 openclaw 是 本地执行框架,属于动手不动脑的工具, 它本身没有 ai 大 脑,必须接入 gpt、 kimi、 豆包这类模型才能用,但它能模拟鼠标、键盘、看屏幕、操作软件可以自动打开微信,批量改文件、整理表格、远程控制电脑适合做重复、机械的自动化工作。 但缺点也很明显,安装配置复杂,有技术门槛,面对陌生软件容易点错、操作失误,而且有风险,可能误删文件,点错界面,重要操作不能完全交给它。 一句话总结,日常学习、工作、聊天、写东西,用豆包,省心,安全零门槛。想让 ai 帮你自动操作电脑,做重复任务,用 openclaw, 但要会折腾,能抗风险。一个负责动脑输出,一个负责动手执行。 这下你分清了吗?这 openclaw 它可以操作微信,操作微信这个程序也是它经过训练的吗?假如一个没操过的、操作过的软件,它会执自己执行,会学这个软件的使用方法吗?你问到最核心、最关键的地方了,我用最直白、最准确的话告诉你, openclaw 不是 靠训练过微信, 而是靠通用看图加模拟鼠标。它不需要提前学过某个软件,新软件,它也能自己摸索着用。我给你拆开讲,一听就懂。一、它不是背下来微信怎么点?它不是提前写死,点这里再点这里不是。 如果是这样,那换个软件它就废了。二、它真正的原理,像人一样看屏幕加理解文字。它有两个能力,一、看屏幕,二、识别上面的字和按钮。三、 ai 告诉他点哪里,做什么,你让他操作一个从来没见过的软件,比如一个新游戏, 一个冷门工具,一个你自己装的软件。流程是这样,你说帮我在 x x 软件里导出数据。一、 opencloud 截一张屏。二、把图片发给 ai。 三、 ai 看图加看字理解界面, 然后说点击右上角导出,选择保存位置确认。四、 opencloud 直接移动鼠标去点。三、所以它不需要提前训练。这个软件,微信能操作, qq 中操作,钉钉能操作,你公司的专用系统也能操作。 任何带界面的软件基本都能摸索着用,因为它是通用型的,看屏幕理解界面,摸你鼠标点击,就像一个会看中文,会点鼠标的人,你不用教他软件,他看一眼就会。四、 那他学习的是什么?他学的不是某个软件,而是通用规则按钮,一般能点文字是说明输入框可以打字,菜单展开有选项, 这就叫通用电脑操作能力,不是针对某一个 app 训练的。用最通俗一句话总结, opencloud 就 像一个会看屏幕,会点鼠标的机器人,不用提前学过软件,新软件看一眼界面就能自己用。 如果你想,我可以告诉你这种 ai 自动操作电脑未来会有多强,会不会替代人做重复工作,以及安不安全,会不会泄露隐私?那 open core 在 用一个新的软件的时候,它有可能操作错误吗?好比我发一条指令,但是实际因为它没使过这个软件,导致了它会。它有可能操作事务错误,没有点出我想要的结果,太有可能了, 而且非常常见。你现在问的就是这个技术最真实最致命的问题。我直接跟你说大实话。不吹不黑, 一、面对新软件 openclaw 一定会出错,哪怕是 gpt 四 o 加 openclaw。 第一次用一个新软件,大概率操作不对,会出现这些错误,点错按钮找不到入口, 进错页面点到广告,点完没反应,他还以为成功了,理解反了你的意思。就像一个人第一次用陌生软件也会点错迷路。原理很简单,他是靠看图猜,不是靠记住这个软件。比如你让他在这个新软件里导出数据,他看到屏幕上有 导出,导入,输出、保存。 ai 会猜一个最像的,但猜就一定会有猜错的时候。 三、越复杂的软件错的越离谱。简单软件很少错,你公司专用系统经常错,复杂软件基本用不明白,因为界面越乱,按钮越多,它越容易点错。迷路 四、最关键的一句真话,现在的 ai 不是 万能,全自动更像一个会犯错的新手员工,能做简单重复的事,复杂的、重要的、没见过的, 一定会出错,不能完全信任。总结给你,你担心的完全对,没使用过的新软件,却一定会操作错,点错,达不到你想要的结果。他不是神,就是个看图猜位置的新手。那你帮我说说, ai 到底稳稳做什么,绝对不能做什么,哪些事可以放心交给他,哪些千万别碰我直接给你一份最实用不忽悠你现在就能用的清单! ai 电脑助手能做什么?绝对不能做什, 我用最简单最直白的话讲,你听完就不会踩坑。一、可以放心交给他,稳稳能成的事, 这些是简单重复、界面清晰的操作。一、打开,关闭软件。二、打开某个网站。三、复制粘贴重命名文件。四、简单搜索,百度、抖音、微信搜索。五、发固定文字消息。六、打开文件夹,移动文件,删除文件。七、 记事本表格简单录入。八、每天重复的固定小动作。特点,步骤少,界面简单,错了也没大事。二、勉强能用但经常出错的事,这些他能尝试,但不一定一次成功。 一、复杂微信操作。二、下载东西,找下载按钮。三、登录账号。四、填写表单。五、简单 p 图裁剪图片。特点,能做,但要你盯着,看,错了要纠正。 三、绝对不能交给他的事,这些百分之一百会出问题,甚至毁你东西。一、涉及钱支付转账,他会转错,点错被骗。二、重要文件删除格式化硬盘,清理 c 盘,直接把你系统搞崩,资料没了。三、修改重要表格、文档、 ppt, 改乱改错,删内容。四、登录你的重要账号、密码、验证码,隐私全暴露。五、 photoshop、 剪映、三 d 软件等专业操作界面太复杂,他完全摸不明白。六、任何你错了就麻烦,大的事一律别给他做。 四、最核心的一句话总结, ai 电脑助手等于只会点鼠标的新手临时工,简单重复杂事,放心丢给他, 重要复杂、值钱隐私的事,绝对别碰他不会真正学习,不会变熟练,不会负责。五、你现在最该知道的现实,你之前想要的那种教一遍就学会,越用越厉害,能做复杂工作的 ai, 目前世界上还不存在。现在所有的 g p t 四 o 杠、 openclaw, 各类电脑操作 ai 都只是模拟鼠标的看图工具,不是智能机器人。如果你愿意,我可以直接告诉你,你平时最想让 ai 帮你做的那件事,到底能不能做,安不安全?会不会翻车?大家是不是听明白?

大家好,欢迎回到 openclaw 系列,这两天 ai 圈最大的新闻就是 open ai 突袭发布了 gpt 五点四。很多人问我, openclaw 和 gpt 五点四到底什么关系?今天我用五分钟给你讲明白,为什么说 gpt 五点四就是 openclaw 一 直在等的那个最强大脑。 先看 gpt 五点四本身,这次最大的亮点不是参数有多大,而是三个实用升级。第一,原声 computer use, 它能看懂屏幕截图,能移动鼠标敲键盘。 第二,针对办公场景深度优化,做 excel ppt 更聪明。第三,一百万上下文,记得住整本书,整个项目,但是光有这些够吗?问题来了, gpt 五点四知道怎么做,但他没有手。他知道该填表,但谁来点开浏览器? 他知道该发邮件,但谁来打开 outlook? 这就是 ai 行业常说的最后一公里问题,从思考到执行,中间缺了一双手,这就是 open cloud 的 作用。 如果你看过我之前的系列,应该知道 openclove 是 一个开源项目,它让 ai 能够真正操作各种应用,飞书、微信浏览器、 excel 代码编辑器统统能控制。 截至目前, github 上已经有二八 k 星,它解决的就是那个谁来做的问题。现在我们把两者结合起来,左边是旧时代 ai 只会聊天,不会干活,右边是新时代 gpt 五点四,负责思考规划, openclove 负责动手执行。这是一个完美的闭环,大脑想清楚手脚做到位。给大家看一个真实场景, 你在飞猪群里对 openclog 说,分析上个月销售数据,做一张透视图发我 g p d。 五点四,立刻开始思考步骤,先打开 excel, 导入数据,生成图标,打开邮箱, openclog 则直接动手操作。你看, excel 自动打开了,数据导入了,图标生成了,邮件发出去了,全程不需要你碰一下键盘。 为什么这个组合这么强?三个数据告诉你。第一, openclaw 的 two search 机制让 gpt 五点四在执行复杂任务时, token 消耗降低百分之四十七,又强又省钱。第二, openclaw 是 本地优先的,所有聊天记录、公司数据都留在你电脑里,不上云,隐私安全有保障。 第三,最新推出的记忆热插拔,让 ai 能记住你上周的报表格式偏好,而且这个记忆可以像 u 盘一样随时插拔切换场景。所以我想说的是,二零二六年,不要再只盯着模型参数看了。 gbt 五点四的发布,加上 openclo 这样的执行层工具,意味着 ai 终于从聊天走向了打工。未来一年,谁能用好 ai 员工,谁就能在工作效率上甩开别人一大截。谢谢观看职场 ai 效率箱, ai 知识早知道!

别再被火爆全网 opencloud 的 演示视频洗脑了啊,大家都叫你搞部署,实现工作自动化,却没人告诉你啊!这玩意一旦跑起来,就是台二十四小时不停机的水彩机, 你以为买完硬件就一劳永逸了?错! opencloud 的 核心逻辑是不断截屏发送给大模型,你每一次点鼠标,每个动作背后啊,都在疯狂消耗 tokyo。 你要知道啊,视觉模型的 tokin 比纯文本贵的多,跑一个复杂的自动化任务啊,可能你还没喝完一杯咖啡,几十块钱的 a p i 额度啊,就烧光了。更扎心的是啊,它的成功率并不是百分之百的。 ai 可能因为一个按钮没倒对,在那儿反复重试,反复截屏,反复烧钱。这种感觉啊,就像是你请了个每分钟都要计费的昂贵管家。结果啊,他不仅动作慢,还经常在同一个台阶上摔倒, 每摔一次啊,还要找你领一次工钱,你真的受得了吗?再说说啊,你没想过的坑隐私安全, 为了让 ai 帮你操作你的屏幕截图,操作日字,甚至是敏感藏秘啊,都要在云端模型里跑一圈, 再加上高清截图上传啊!需要的贷款,如果你的网络稍微卡顿,你会发现啊, ai 操作像 ppt 一 样慢,但 talking 的 费用啊,却一点没少算。如果你不是每天要处理成百上千个重复性极高的专业工作流啊,如果你只是想让他帮你写个邮件,查个天气,求求你 放过你的钱包吧。网页端 ai 是 免费的,而 open class 是 给那些时间比 talking 贵的专业团队准备的生产力杀手锏,不是给普通人消遣的玩具。 记住啊,所有的科技红利,底层逻辑都是在拿金钱换时间,如果你的时间还没到那个身价,强行部署 open class, 最后被收割的只能是你。

最近用了几天 openclaw, 这是个好东西啊,就是那个 tokens 消耗起来啊,实在是太猛啊。但是免费的 a p i 呢,要么就是太旧的大模型,要么呢就是限流的太厉害。 如果你想本地部署大模型呢?那对硬件的要求呢?确实又太高了。还好呢,最近我发现这个微软刚刚发布的 ferrari gb, 一 款专门为操控电脑而生的小模型, 它是由阿里开源的千万二点五 v l 模型模改而来的,通过视觉感知屏幕内容,然后呢,利用鼠标和键盘模拟用户的点击和输入行为,比如滚动网页啊,滚动页面啊,页面跳转等行为,从而完成各种的自动化的任务,譬如操作浏览器 填写表单、自动购物、网页搜索等,不用依赖任何后台代码。关键的是啊,这个模型比较小巧,只有七十亿的千万化, 即使是普通显卡呢,也能用,笔记本当然也可以用,你可以非常便捷的用 lm studio 或者欧莱玛等进行本地部署。还可以呢,跟微软开源的人机协助网页自动化神器 magenta ui 实现无缝集成。当然,你也能通过微软自家的 adori foundry 实现云托管, 它使用起来呀,不需要 api, 也不需要消耗 token, 数据不出户,隐私更安全。感兴趣的朋友啊,可以拿过来研究研究了。

你的电脑现在可以自己上班了。 i g s 三刚刚在全球最权威的一个操控测试里面打出了七十二点六分,超过了人类的平均水平。他不是聊天机器人,他是真的在操作你的电脑。看屏幕,动鼠标,敲键盘,打开软件,填表,下单,写报告,一套连下来,不用你撒手。更离谱是他有记忆, 用的越多,他越懂你的操作习惯。下次同类任务直接快进啊! windows mac linux 全支持完全开源。 get up 上面已经有一万多个 star 代码,随时可以扒下来自己跑那些收你每月几百块的同类产品。现在对标的就是这个开源,地址在主页啊,自取。

有没有想过,未来的 ai 不 只是回答你的问题,而是直接替你操电脑?打开软件,填表单、点按钮,跟你坐在那儿做的事一模一样?这不是科幻,这就是今天要讲的 computer use。 computer use 的 核心原理其实很简单,截图分析,点击再截图。 ai 看到的是像素,执行的是鼠标坐标和键盘输入,就像你远程控制别人的电脑一样。只不过现在控制者是 ai, 它能做什么?登录网站、填表格?操控没有接口的老系统,甚至写完代码直接运行看结果。 很多人会问,这跟普通 ai agent 有 什么不一样?普通 agent 调的是接口,系统得先开放接口, ai 才能对接。 computer use 不 需要有界面就能用,代价是速度慢、稳定性差, ui 改个位置按钮就找不着了。 所以它不是替代接口,而是填补接口覆盖不到的那块空白。目前最成熟的实现是给 ai 模型做的。 computer use beta 提供三个工具, computer 负责截图和鼠标键盘,文本编辑器负责文件读写、命令行负责执行命令。 开源社区也有 browser use、 sky agent 等方案,更专注浏览器或手机端用好。 computer use。 第一条,规则,任务要分晓, 别让 a a a 一 口气做十件事,每步都是一个可验证的原子操作。第二条,每次执行完必须截图确认结果,不能盲目继续。就像你做完一道菜,要先尝一口,确认味道对了再出锅。 computer use 权限极大,不加限制容易出事。删文件、发邮件、确认付款这些操作必须明确,设置黑名单拦截。 另外,别忘了等待点完按钮,别急着截图,页面响应需要时间,按钮点击等半秒,页面跳转等两秒,文件下载要更长 踩坑时间。第一个坑是幻觉坐标模型说点这里,其实那里什么都没有。解法是让模型先描述屏幕,再给坐标点完截图验证。第二个坑是 token 超出每张截图都是图片历史,一多上下文就满了。 解法式只保留最近两三张旧的只存文字摘要。至于选型,有接口用接口存,浏览器用 playrite, 非得操控桌面才考虑 computer use。 最后说个前端工程师特别该关注的视角,我们写的每一个界面组建,未来不只是给人用,也可能是 ai 操控的界面。好的羽翼化设计,正确的无障碍标签,羽翼化的 html 结构,会让 ai 操控你的产品时更准确、更稳定, 这是一个新的可访问性维度。最后留一个思考题,如果你正在开发的产品有一天需要支持 ai 自动操控,你现在的代码需要改哪里?

今天分享一下 bug coding 之后,我不用或者少用的四个软件。第一个就是 powerpoint 幻灯片。其实在读 mba 之前,很多年我都是做咨询的,所以我天天跟 ppt 打交道,但是当我开始 bug coding 之后,我才意识到 ppt 的 局限非常多, bug coding 出来的界面反而更有互动性和自由性。比如说之前我在讲 opencloud 的 安全性的时候,我做的这个界面,它就是把所有的风险和安全措施是可以连起来的, 你点哪一个就可以看到它们互相的关联,并且当你把鼠标停留在一个上面的时候,可以看到它的细节,这个如果硬要用 ppt 做的话,只能一个一个手调,简直是噩梦一般的。 而且当我做这个一年总结的时候,这个页面其实我也考虑过做成一个 ppt, 但是我觉得变成一个 ppt 我 只能一段一段的来,不能一直给大家看到一年这个整体的一个发展。 最后来我也是做了一个这样的 html 的 页面,这样当我的鼠标走来走去的时候,我们可以看到我们现在时间线的哪里,同时我也可以用鼠标来看更多的细节和数字等等。 还有中间这个费用的部分,我直接从软件中把我的花费全部导出来,然后直接扔给 qq 都让他自己帮我分析,他就直接叫我把这个话做出来了。所以讲到这里就说到了第二个工具,就是 excel。 如果你是用 excel 做一些简单的分析或者 pivot 的 话,其实 ai 可以 非常轻易的帮你做这些事情, 如果你是用它来做一些不同的图像的话,那其实 ai 更有用了,因为在 excel 中,你首先要把数据导成某个固定的格式,其次你才能在十几个选项中选择一个合适你的图 像。但是用 web coding 的 话,数据你就可以随便丢给 ai, 然后这个图你就是想怎么画怎么画,想长什么样长什么样子。如果你在 excel 中还写一些 micro 的 话,那基本上这就已经是在写代码了, 你就可以把整个你 micro 里面想要做的事情告诉 ai, 来让他帮你写一个更简洁方便的 code。 第三个工具是各种各样的 dashboards, 包括 tableau, power bi, click view 等等。早期我也花过很多时间去学这些工具,而且我还考了很多他们的证书。 现在回想起来,其实 dashboards 只做了两件事情,一个就是帮你连到数据,另外一个就是帮你把数据展示出来。那这两点其实我刚刚提到的去连接数据,因为它可以更直接的去连接数据,并 并且你展示数据的方式是更加自由的,不管是不同的风格还是图像,它都可以比这些工具里面默认的几十个选项更称心如意。第四个呢,就是 rpa robotic process automation 自动化工具, 这也是我早期花了很多时间考了很多证的一个领域,包括 u i path work, fusion automation, anywhere。 其实回想起 r p a, 它其实是在有一个有一点尴尬的领域,因为它是属于 low code, 但是不是 no code, 相当于你可以用格式化的方式少写代码,但是不能不写代码。 现在这种自动化的东西,基本上你就可以通过 web coding 的 方式直接来形容和展示你要做的每一步,然后让 agent 去写一个 script, 或者让你的 open call 来替你执行。 所以作为打工人来说, white coding 真的 是太好用了。一项技能可以概括很多很多领域来代替我平常用的很多不同的工具,并且达到的效果是更快更方便和更符合我的心意的。

啊,按鼠标侧键,你好啊,然后就可以做一个这种简单的输入。 ai 到底能带给人类什么便捷?今天给你看一个真实案例,你有没有想过,我们每天打字花了多少时间?打字慢,手也累,还不能边走边记, 但语音输入不一样,说话快三倍,解放双手,随时随地记录灵感。我朋友涛哥跟我说,想要一个一按即说的工具,鼠标侧键一按就录音,松开就识别,说完自动粘贴。听起来简单,但这就是 ai 该有的样子,懂你所需, 但过程不顺利,我试了十一个版本,全部失败,热键不稳定,中文乱码,线程冲突,但 ai 没有放弃。最后我们找到了完美方案, win 加 h 负责识别,鼠标侧键负责触发, ai 负责协调。你看, ai 不是 替代人类,而是赋能。 代码有多简单,只有三行,零学习成本,即装即用。真正的科技应该是简单的, 这就是 ai 带给人类的便捷,效率提升三倍,解放双手,多任务处理,更重要的是减少重复劳动,让我们专注创造性工作。科技应该有温度, 让科技服务于人,让交互回归自然,让 ai 赋能生活。我是钢镚,一个有温度的 ai 助理。 ai 让未来更近,我们下期见!

哎,是这样的,就是最近那个 open globe, 也就是那个小龙虾,大家俗称小龙虾。不是呃特别火嘛,然后也是看到了很多大佬发了那个呃,就小白式的一键部署的方式啊, 然后呢,也是自己做了这么一个东西啊,就是更白痴,就是只要点鼠标就行了,而且是无脑点,只要点一个地方点一个东西的那种 啊,傻瓜式的部署方式啊,就可以看得到这边做了一个那个啊脚本,然后主要是三个文件构成啊,其中一个是执行的脚,两个是执行的脚本,然后一个是那个说明文档。然后呢啊先运行起来吧,也比较简单,就只要点这一个就行了。 然后点完之后的话,他其实会一个一个去检查就需要下的环境啊,包括说他需要什么东西,然后去慢慢的下载嘛。那我这个是因为啊,之前在 做的时候就已经啊装好了环境,所以他这个检检测出来就是你已经有这些东西了,所以他不用再去下载,会比较快一点,然后如果你是第一次运行这个脚本的话,他可能会比较慢。对啊,下载可能要十几分钟, 整个流程走完。然后还有一个难点就是需要科学上网,因为担心国内的那个印刷网站他 可能会被篡改啊,或者说里面带点脏东西,对吧?有问题。所以说尽可能的就也不是尽可能啊,就全部用的都是官网,都是用的官方的那个下载链接下载方式, 所以说他需要用到科学上网的一个方式嘛,然后呢啊,第一次下载的时候他这个窗口可能有人会疑问啊,就这个窗口弹出来之后,他可能会再弹一个那个类似于平常要下的一个下载框, 然后那个是这个没有关系啊,就是也不用去点他,等他完完完全全的那个欧娜玛的那一个,就一个一个羊头的图标,那个呃流程完全走完了之后再去把那个呃 安装页面关掉,也不用加什么配置,然后关掉之后这个再重新再点一遍就行了啊。嗯,电脑不熟啊,下载实在太快了,所以说,哎,都讲的讲的没他下的快,没他检测的快。 然后配置也不用去做基础的配置啊,也是讲一下这个东西啊,考虑到的一个优点就是他确实是傻瓜式的安装,就只要点击就行了。然后他不仅会去拉这个 open globe 的, 他还会去拉一个模型, 拉一个本地模型,在本地通过这个欧拉玛拉一个本地的那个 ai 模型。这个为为了解决的就是那个 token 的 问题啊,因为啊,网上讨论也比较多的,就是他如果自己转起来之后,对吧,他会很烧 token 就 很烧钱,那么 等于说你本地有这个 token 的 话,他用的是你自己的电脑性能,然后吃的是你家的电费,对吧?啊? 嗯,大致意义上就是免费,但也不是完全免费,毕竟还吃电费嘛,对吧。然后,呃,考虑到安全性的问题啊,然后也去做了一些加固,就只有你本机的这一台电脑可以访问的到他,他的这个数据是出不去的,但是不影响他这个呃 open globe 的 去访问公网的一些资源,然后这边也可以看得出来,就我即使是写两遍他这个也很快已经起,就是已经开好了嘛,然后这个是刚刚啊做测试的时候让他去创建了一个文档,那文档我已经删了,这边可以让他重新再说一遍。 我插一嘴啊,就是那个,呃,前面有提的就是科学上网,如果说是这种代理的话,他不一定能 啊有效,所以说最好的情况下还是去全区的代理,然后包括看我刚下载的时候大概下了十三个 g, 所以 说可能注意一下,对吧?流量不要拿自己的手机 wifi 去下,他会吃你流量的。 然后的话,呃,除了加固这一点呢,他还有一个好处,就是啊写的时候不是在原来的那个配置脚本上去改它的配置 环境,而是直接覆盖把那个文件直接顶掉的。所以说的话如果你下载过程中他有问题,你觉得有问题对吧?你就可以重新再去运行脚本安装 啊。虽然我这个包括这个桌面其实是没有显示那个的,没有显示我的桌面图标,但是啊也写了一个啊,就是后面方便小白可以去用的。就是你下载完之后桌面会产生两个东西啊,一个是文件夹,是等于 open klo 的 工作台, 他能对那个工作台是有完全权限的,他能去执行删除,包括说读写超都行,然后还会生成一个五角星状的他,呃,比如说你重启电脑了,你不知道怎么去开,你就直接点那五角星,他自己会再重启,会直接把这个呃 小龙虾给拉起来,那你就可以去跟他做一个对话。然后呢?呃,因为拉的是本地模型啊,所以他有个缺点啊,就是他可能会比较慢, 但是你自己玩一玩这还是没有问题的,然后包括说你自己去给他下一些技能到自己电脑上,对吧?然后后面的话,主要还是一个比较入门的东西嘛,就降低大家能去体验一下这个东西的一个门槛。然后的话,呃, 再演示一遍这个吧,创建,因为改个一,然后发出去 稍微会比较慢一点,看他慢慢跑,然后那个文档那个目录其实是在这里啊,因为啊都提前准备好这些目录才来录这个视频嘛,对吧? 等一等稍微会比较慢。嗯,本地的模型,它这个其实,呃跟你自己电脑的性能有关,像我现在拿的这一个,它装的是一个那个千万的二点五的一个本地的 啊 ai 模型,他大概是八个 g, 当然如果说啊你的电脑性能配置更好一点,对吧?也可以在后面让,其实 open klo 用起来的话,他可能也能做到吧,就是给自己换模型这种工作他应该也能做的到。 然后基础环境啊,基本这个点了之后,包括说啊比较火的那个奥大马, 嗯,电脑已经也已经装好了,平常也可以拿去拉去用,然后也看看得到刚刚聊天的时候,这边就已经把那个啊这边文件就已经创建好了,这个还不是他的工作台啊, 这个是指定了一个绝对路径,然后他直接就创建出来了,说明整个部署还是比较有效的。然后的话技能这一块啊,他这里有技能商店, 嗯,自己去学习就行了,去看一下,然后看有什么符合自己的,但是啊,新手小白不建议在没有目的的情况下就是乱去下,可能会有一些安全隐患的问题吧,对吧? 当然哦,那个加固的这一块再提一嘴啊,就是啊,总结一下加固的好处啊,就是 担心你关不掉他吗?所以说啊,特意把那个自启的这些东西全部在那个脚本里面也去做了限制,就是他会清理掉所有的下载的这些,就这个脚本下载的所有主键,他的一个啊,开机自启的一些功能全部做限制,就是你, 嗯,重启电脑之后,他等于电脑是干净的,只有你点了刚刚收到的桌面生成的那个五角星,他才会把这些东西全部重启起来,然后产生这一个对话框。 好吧,那今天分享就先到这吧,然后啊,如果有感兴趣的啊,想要拿到这个东西的啊,可以 私聊我吧,然后我单独再给大家打包发啊,但是可能也没有那么多精力一直盯着这个东西啊,可能周期性会回一下消息。

今天我把 openclaw 扒的底朝天,不吹不黑告诉你它到底能干嘛?为什么我用了它直接把其他 ai 全删了?因为它不是聊天机器人,是直接动手干活的 ai 超级员工一直接操控你电脑。真动手干活, 它能像人一样点鼠标,敲键盘,读你文件,改你文档桌面乱,一句话,帮我按类型整理桌面文档图片视频,分好文件夹,批量重命名,压缩图片, pdf 合并 excel, 自动做报表,甚至写代码,跑脚本,自动调试 bug。 二、八个 ai 机器人分工干活,不用你管文案豹子写脚本,写文案,写标题,写小红书,写抖音, 设计豹子文案写完自动除图,做海报,做封面。数据豹子排网页,抓数据,整理报表,自动分析运营豹子发邮件,发私信,自动回复监控评论,开发豹子写代码,改 bug, 部署项目助理,豹子 记日程提醒,自动汇总工作,搜索 boss, 全网找资料,自动总结,联动 boss, 所有机器人自动配合,不用你切换软件。 三跨软件,全自动打通所有工具, wps、 office 浏览器、微信、钉钉、飞书、剪映。 ps, 你 不用复制粘贴,它自己联动 写文案,自动出图,自动排版,自动发朋友圈,小红书,抓数据,自动做 excel, 自动生成图标,自动发邮件给老板。四、二十四小时主动干活, 不用你喊定时条件触发后台监控,每天十八点自动汇总工作生成日报发群里,商品降价自动重启,自动发告警自动修复。 五、越用越懂你,永久记忆你的一切,你的风格,语气、喜好,项目背景,常用模板全记死。 写文案直接按你平时的风格写,不用教做设计,知道你要什么配色,什么排版,甚至你没说出口,他都能主动提醒,主动补全。六、本地运行数据,百分之一百安全,不上传云端,所有内容存在你自己电脑, 不泄露,不被盗,隐私拉满公司机密,私人文件,敏感项目放心用。七、 一万三千加技能,像装 app 一 样扩展拉号技能市场,一键安装,自动剪辑视频,自动做字幕,自动配音,自动翻译,自动写代码,自动做 ppt, 自动排数据,自动发抖音,自动做电商运营。八、一句话指挥全军, 不用懂技术,不管你是小白,运营、设计、程序员、老板、学生,只要说人话,他就懂。 帮我做一条抖音主题 ai 工具,配三张图,加热门音乐,帮我整理上个月销售数据,生成图标发给王总,帮我写一份简历,突出 ai 经验,排版成 pdf, 这就是欧派克奥。一个工具等于一整个 ai 公司, 写文案,做设计,剪视频,搞运营,写代码,抓数据,自动办公,全能全自动全懂你! 以前我用七八个 ai 忙到死,现在一个 open club 效率直接翻二十倍,想知道我怎么用它,从早爽到晚,评论区扣 open club, 我 把完整的教程加实战玩法直接发你。