最近啊,总有人问你们大师啊,最近在研究什么?今天啊,统一回复,我们在琢磨 oppo 可乐的落地。首先, oppo 可乐是什么? oppo 可乐啊是一套开源的自主智能体方案,简单来说,就是让 ai 不 仅能思考,还能自己动手干活,要用工具读写文件、操作软件,像人一样完成具体的。 他把大模型的能力啊延伸到执行层,让 ai 从建议者变成操作者。第二点,欧派可乐啊与自动化公司的结合点。自动化公司的业务量越长,专业跨度啊越大,从机械设计、电气选型到软件开发、数字孖生,处处有重复性、繁琐性的工作。 open klo 的 出现让我们看到了将这些工作自动化的目前,我们聚焦两个最能产生直接价值的场景进行挖掘。场景一,软件团队的超级实习生, 重点是编辑设备驱动、 hm 脚本报表生成等任务,往往需要工程师翻阅大量手册,重复编辑模板代码,耗时且枯燥。实践,我们让 open klo 扮演实习生角色, 给定任务指令,它能自动解锁技术手册、生成代码框架、编写单元测试甚至初步调试。工程师从写代码变成审代码和调优 成效,开发效率提升百分之三十。工程师在已从重复的劳动中啊出身,专注于架构设计和技术公关。 代价与挑战 open 的 成本啊,处理几百页的手册可能耗费数十元,需定制精细的使用策略,较高稳定性,复杂逻辑易出错。目前仅限非核心可人工复合的模块使用。 配置门槛,每个任务类型啊,需定制 pro 和工具链,并非极差。极用场景二,技术资料的智能管家, 它的痛点啊,自动化公司跨行业,比如机械、电器、软件和工艺资料散落各处,版本混乱,查找也困难。 实践基于 oppo cola 构建资料智能体,实现自动归档,每日扫描服务器,识别新文件,按项目和专业分类提取图号、版本、作者等原数据。 再说版本管理,如果发现同名文件更新时自动对比差异,提醒审核并保留历史版本,避免误用旧图 纸。智能解锁自然语言查询,比如找三号线最新启动原理图,直接定位文件或本项目编辑图纸是否齐全,自动比对清单并反馈损失。工作量统计, 根据提交记录生成个人工作日记、修改频次、文档贡献度、辅助项目管理等效。 查找时间从半天压缩至一分钟,且版本可控,规章规范,该场景因不涉及实时控制,安全风险低,落地顺利,价值立竿见影。 第三点啊,我们的体会和展望 o 喷可乐并非万能,它距离取代工程师啊感很遥远,但在自动化公司啊,它正演变为一件趁手的新工具,帮我们节省时间,管理知识,提升效率。 真正的价值不在于技术本身多炫酷,而在于啊,我们能将它驯化成适合行业的工作。 未来啊,需要持续空间,降低使用门槛,简化配置,让非 ai 专业人员也能快速上手控制成本。优化偷看的消化策略, 平衡性能与支出保障安全,完善杀伤机制,确保 ai 操作不出级。生产系统方向是明确的,让 ai 从聊天走向干活,让工程师从执行者蜕变为定义者,这场人机合作的进化我们才刚刚开始。
粉丝5764获赞18.5万

open class 到底能做什么?只有你想不到,没有他做不到。今天带你看一个比较复杂的工作流程,当你在终端启动了 open class 之后,在 mac 上面会有一个插件。今天的任务先是帮我搜集一下斯坦福大学第一年级的计算机课程,我们来仔细看他的工作流, 首先他根据我们的课程找到了准确的课程内容,比如说 cs 幺零六 a 和 cs 幺零幺,然后他通过 break 浏览器帮我们提供的搜索引擎的功能,然后进行了网络搜索,成功的找到了几轮搜索。最后他帮我们找到了几个课程, cs 幺零六 a 以及他的介绍,还有 cs 幺零幺,那这个相对来说比较容易,但是呢,我们想让他帮我们做成一个课程总结,然后截取出相关的讲义内容的图片,做成一个报告来,我们看看 这个任务的结果,那这个任务就会变得相对于更加复杂。在一些常规的网页搜索之后,我们看到了他开始帮我们写报告了,他告诉我们报告已经生成,我们在左侧他的工作夹里面就能看到这样一个 cs 幺零 a 点 report 这个东西,我要求他用 markdown 的 形式,确实完美的用 markdown 的 形式给我展示出来,这也不足为奇。我们再来看看他帮我们找到的关于内容的截图,看到了吧,有二十张截图,所以他帮我们完美的完成了信息搜集,总结汇总,甚至 视频内容截图的功能。而且在运行过程中,他直接通过了自己自带的画布功能,帮我打开了这样一堂课程的页面,我们能够看到这就是斯坦福大学 cs 课程的官方网页,更加厉害的是,这一套流程下来都不到一分钟的时间,所以这就是 open cloud 最大的一个优势,速度极快。那如果你也感兴趣,想要部署在你的电脑上面,成为你真正的 ai 助手, 我们正好有一个 ai 工具群,里面会提供这样的服务,以及对应的行业多地案例的课程。如果你感兴趣,可以看主页第一行,会有专人给你提供更多的信息和介绍。

比较复杂的,这个测试用力执行,这一步他能进行自动化的测试吗?完全可以,完全可以,已经配完了,经过我们的调教,他已经完全可以和浏览器交互,完成测试的执行以及结果的回转,我给大家演示一下。呃,请你看一下我桌面的测试用力下面的 t x e 文件, 然后呢打开浏览器,依据我的测试文件去测试它,并且每一个操作步骤操作前操作后都有相应的截图,把这个截图整理成一个文件里面,然后再把这个测试过程写成这个记录,记录到一个 txt 文件,然后把这些整体打成一个包发给我。 这么复杂?对,特别复杂,这个指令完全可以执行,经过我们的测试,他这他这个字时间不准吧?不准没关系,他可以,他可以理解,他可以理解。对,他可以理解的,所以说你可以看到 我们这边写完测试用力之后,他可以直接的时间目录,然后找到我的测试用力的文件夹,然后再控制我电脑的浏览器完成这个整个操作,然后最后测试完就给我们,所以他就完全可以替代一个检测人员。咱现在没动鼠标啊,他现在完全没有动,现在正在执行这个过程比较比较比较多啊,比较操作比较多,所以我们稍微等一等 来过来可以看一下。打开浏览器,打开浏览器输入可好了,你看我们的测试用力, 第一个输入 openclaw 的, 并且提交准确显示 openclaw 的 相关的技术产品啊,他现在是输入了,对,现在输入了,这是他自己操作的。对,这只是完全自己操作,哎,现在第二个用力输入一二三四五六,并提交,准确识别为熟度,并且展示结果,哦, ok, 他 也输入完数字了, 接下来输入第三个用处是输入人工智能并且提交,看到了吗?然后第最后一个结果是拼音输入百度并且提交。 现在就是这个简单的四个用力自动化测试。其实不光是这个百度啊,它我我们之前试了一些下载啊,一些按钮啊,点击它,完全没有任何 你就这个界面,一个陌生的界面,经过我们跟客户的一个接入浏览器的控制,就完成了用力的设置和自动化。基本在检测的时候大部分软件都是非常简单的界面,什么注册呀,登录啊,表单呀,按钮啊都大部分是这样,它完全是一个通用的界面,它既然能做到这么精准的,后面也可以做到。哎,现在我们用力应该都测完了,所以我们可以 稍微等待一下,看看他有没有截图,有没有把这些用力打包下来啊,你看一下我们,我们现在回到桌面了啊,我这边大部分都执行完了啊,他现在还在执行。现在说什么?他现在正在打包,然后正在记录,对,他表示正在打包, ok, 我 的天,这是所有的测试结果,哈哈, 好,这把字的内容记录了,然后回传。哎,他这个文件没有在桌面看来,这样,我们,哎,我们不用担心,他已经给我打包给我了,咱先看看哦,他现在,哦,他是给你看。哇,我的天,好快啊,这是记录的过程哎,我们找不着,不要紧啊, 咱可以告诉他,请把这份记录放在桌面, ok, 现在我不知道他,请把这份记录放在桌面, 咱们在电脑上看更清楚一些啊,他刚才是理解为,哎,出来了,出来了,看到吗?他已经出来了,哎,哎,测试记录的执行过程,然后我们再稍等一下,他应该还在执行。啊,还有那个,我现在那些图片你也给我放在桌面,就是那整套 我就随便说这口气话的东西,他能理解,就是我这大白话,就是那整套他也能理解整套是什么,都不用详细的告诉他一些细节。经典版,然后第一块输入百度,然后执行,执行结果通过,然后已经有截图证据了。然后第二个结果呢?输入这个, 然后通过第三个结果输入这个截图,然后我们可以打开这个截图,这个是刚才创建好的。对对对,然后你看第一个 输入数字,第三个, 第三个输入这个人工智能,第四个输入这个基本上都有截图,有执行,有记录,就这个东西。

大家最近都在忙着安装这个长得像大龙虾的开源神器 open clone, 我 们在用它的前提,得先知道它的工作原理是什么,它是怎么自动干活的。 今天就用大白话把它的八个核心模块一次讲透,准备好了吗?开始第一个模块是 getaway, 他 就像你家小区的保安大叔,不管谁来发号施令,他负责核对身份,确认是你本人才放心。 直连进去后,就到了第二个模块, agent 智能体,这是大龙虾的超级大脑,你说我要出差,它会自己拆解任务,查机票店、酒店、排日程,像个高级大管家,大脑再聪明也没长手。这就需要第三个模块 skills, 也就是大龙虾的工具箱, 给他配上发邮件、查网页的工具,他才能真正去干活。怎么给他发指令呢?全靠第四个模块, channels, 这就是沟通专线,不管你用飞书、工作软件还是网页找他,他都能把你的话翻译成机器指令。 第五个模块, nose, 相当于影分身,你在手机和电脑上分别装一个人在外面,用手机就能直接跨设备联动,让家里的电脑自动传文件。 第六个模块是 memory 记忆系统,他有个超级记事本,你提过一次不吃香菜,他永远记得下次点外卖自动备注,越用越懂你。 最后两个模块,让他永远在线。第七个 heartbeat, 心跳机制,是个全天候巡逻兵,就算不叫他,他也在后台主动帮你盯着邮箱,收到紧急邮件立马提醒你。 第八个 call, 定时任务是个非常精准的闹钟,设定好每周一早八点,他准时把行业热点发给你,雷打不动。当然,光知道原理也不够,下一期保姆级教程安装国产小龙虾,小白也能学会。记得点个关注,我们下期见!

最近网上 openclore 特别的火,然后我在二月二十号左右,我自己也去下载了一个 openclore, 从零到一,自己完全的去部署和摸索, 从最初不知道如何部署,然后再到提示词全面的去调试, 就是所谓的这个养龙虾嘛,然后再到呃整个的这个多团队 a 梗这个配置,然后再最终到了呃,就是用不同的任务去 让 openclaw 自己去调用不同的这个模型去处理复杂的这个任务。嗯,其实我在接触 openclaw 的 时候呢, 我一个最大的感触就是它真的是一个知识屏权的这个工具,你只要把权限完全的开放给他,他可以做很多很多,我们 很多人不想,就是没有办法去做,就是技术门槛很高的很多事情,你比如说,呃,我们不擅长去做这个呃, ppt 你也不会,或者你没有接触过,你只要告诉他帮我去搜寻相关的这个内容,内容的主要内容,内容里面的提纲大概是怎么样怎么样怎么样,然后让他去生成专业的用于做什么的 ppt, 他 会很迅速的 去生成你想要的,然后去提交结果给你去审核。那 opencore 给我最大的感受是什么呢?就是 它跟 ai 智能体完全不一样的点在于 ai 智能体是你给他什么指令,他返回什么样的结果。那 这边有个很重要的点,就是他不会去帮你去考虑其他的东西去给你参考。但是 open club 不 一样,他支持长线任务和短线任务,你给他一个具体的目标和方针,他自己会去学 相关的技能和插件,甚至会编辑自己的这个技能去完善,从而达成做到这件事情的这个目的。你比如说,呃,我们要去分析某个行业它的数据支撑支撑,但是呢 你以前你是从来不知道这一个东西数据从哪里来,然后要考虑哪一些问题, 分析的要从哪一方面去分析。但是 openai 出来了以后,你完全不用去考虑这个事情,然后它会遇到问题了,它会驱使你去提供 他要完成这个任务所需要的这个东西。你比如说我要让他去查我的抖音的粉丝列表和粉丝画像, 那他在遇到问题了,他第一个遇到的问题就是抖音账号和登录是否开放权限给他,还是说让你登录好了告诉他,然后他进行操作,然后中间你就不用管了,他会把最终的结果报告返回给你, 就是一句话的事情,你不用去考虑太多。所以 open crawl 呢,跟智能体最大的不一样就是它可以支持长线的任务,然后还有一个最大的感受就是什么呢? 使用 open crawl 最大的限制在于你自己的想象空间和规划整合的这个能力, 才能最大程度的去调动他为你去做事。有些时候你没有 创业过,那创业上会遇到哪一些问题和哪一些瓶颈?你需要的元素和资源有哪一些?你不能完全的去描述清楚,就导致 open crawl 它的完成度不好,或者是你根本就想象不到那一个领域的事情,从而去开发它的这个功能。 给大家看一下我这边我自己养的这个龙虾,然后它可以完成非常非常多的这个工作,然后每天我会要求它把工作和报告任务给我。

二六年的第四个应用,也是我和 openclaw 一 起完成的, 它是一个数字货币交易机器人,现在还有很多问题,我给它配上 opencode 之后,整个开发效率提升了很多,目前还是一个亏损的状况, 现在已经修复了大多的问题,继续努力。

openclaw 绝不仅仅是个用来聊天的对话框,通过安装这七个核心技能包,它能直接变成你的全能助手。 它不仅能像真人一样操作浏览器,抓取全网数据,还能帮你盯着网页价格,或者在每天固定时间自动处理文件。简单来说,只要配置好这些技能,你就能把那些枯燥的重复性劳动全部交给 ai 自动流转,实现真正的生产率翻倍。 我们来看第一个也是最受欢迎的技能, agent browser, 直接执行一条安装命令就能搞定,你可以把它理解成 openclaw 的 眼睛和手。有了它, ai 就 不再只是个聊天框, 它能像真人一样去打开网页,点击按钮,拖动滚动条,甚至能把看到的屏幕内容直接截图存下来, 或者把网页里的信息抓取出来。装完之后,有两个关键配置,建议你先设好。首先是 headless 模式,把它设为真,这样浏览器就会在后台静默运行,不会在你干活的时候突然弹出一个窗口吓你一跳。 第二个是 timeout 超时设置,建议设为三万,也就是三十秒,这样能保证那些加载比较慢的网页有足够的时间跑完,避免任务中途报错。 在实际用的时候,你直接给他下指令就行,比如你跟他说去帮我把某个网页截个图存到地盘,他就能自己去执行。 或者你想整理资料,让他去新闻网站把前十条标题抓下来,理成表格,他也能听懂。甚至更复杂的填表任务,你只要把信息给他,他就能自己去网页上找输入框填好并点击提交,全程不用你动一个手指头, 这个技能在工作里非常能打。比如你可以用它做价格监控,让他每天自动去瞅一眼商品有没有降价,或者做竞品分析,让他盯着对手的官网看有没有发新产品。基本上只要是你在浏览器里需要反复点的反复看的枯燥活,现在都可以丢给他去全自动运行。 这就是 agent browser 成为最受欢迎技能的原因。如果想让 open core 拥有实时感知世界的能力,你就必须安装 brave search, 这个插件是 ai 获取最新资讯的申明线。安装之后唯一的动作是去 brave 官网申请一个 api key, 别被 a p i 这个词吓到,其实就是注册个账号,拿川字符填进去。免费版,每个月提供两千次查询,这对个人用户来说完全够用了。配置好之后,你就可以直接问他当天的行业新闻或者最新的政策变动。他给出的答案再也不是几年前的陈旧数据, 而是鲜活的实时动态。如果说搜索是帮你找信息,那 web scraper 就是 在帮你洗数据。它的强项是把网页里那些乱七八糟的内容变成整整齐齐的表格。比如你把一个购物网站丢给他,让他提取所有产品的名称和价格, 它几秒钟就能凸出一个 excel 给你。或者你想收藏文章,它能自动剔除广告和侧边栏,只抓取干净的正文并存呈 markdown 格式。这种对非结构化信息的处理能力,正是将 ai 真正转化为生产力工具的关键一步。 装上 chrome 插件后, open core 就 有了精准的时间观念,它的价值在于把你的大脑从那些定点发生的琐事理解脱出来,安装非常简单,异形命令搞定。 配置好之后,你就可以像定闹钟一样给他下任务。比如设定每天早晨八点准时去查天气,然后直接把结果发到你的飞书上。这种一旦设定就永不停歇的自动化,才是真正的省心。 如果说 chrome 是 按时办事,那 web monitor 就是 盯着变动在干活。你只需要给他一个网址,再设个触发条件, 比如某个商品降价超过百分之十,或者某个政策页面有了更新,就会像个二十四小时不睡觉的哨兵,第一时间把变动发给你。有了它,你再也不用手动去刷新网页看有没有消息了,信息会自动跑来找你。 最后,这招 file system 技能专门对付你电脑里那些乱七八糟的文件。无论是想把几百个 pdf 批量转成 word, 还是想让它把下载文件加按类型自动归类,它都能秒记完成。配合前面讲的监控和抓取技能,你就能实现从网上自动搜资料、自动下文件,再到本地自动整理的全链路闭环, 这才是专业玩家的办公姿势。如果你觉得 ai 每次聊天都像个健忘症,那一定要装上 memory 这个技能。它能让 openclaw 拥有长期记忆。 比如你告诉他领导的联系方式,或者你的工作习惯,他就再也不会忘了。下次你直接说发邮件给老板,他会自动去脑子里搜索那个邮箱地址,不用你再重复一遍。这种越用越顺手,越用越懂你的感觉,才是真正私人助手的样子。 咱们来看个真功夫,怎么把这些技能包串起来用?比如做一个每日资讯简报,每天早晨七点, openclaw 会先用搜索技能找最新的 ai 新闻,接着调动浏览器进去抓正文,然后自动洗掉广告,总结干货,最后赶在你起床前发到你手机上。这套组合拳打下来,你每天早上刷网页的半个小时就全省下来了。 对于做运营或产品的朋友,这招竞品监控简直是神迹。你让 openclaw 每天中午去对手官网截个图,然后跟昨天的照片做对比, 只要对方偷偷改了个价格,或者上了一个新广告位, ai 就 会立刻抓到这些像素级的变化,并给你报警。这就像在对手公司门口雇了个不睡觉的哨兵,所有动作都在你的掌控之中。最后咱们说个保命的功能,自动备份。 你可以设好每天晚上十一点,让他自动把你电脑里最核心的工作文件夹打个压缩包,然后传到云端备份,整个过程完全不需要你操作, 他在后台自己就干了,最后再给你发个备份成功的消息。把这些技能玩转了, open claw 就 不再只是个聊天机器人,他就是你最靠谱的数字分身。

我终于把 open club 部署到我的亚马逊里面了,其实我真的没有想过他真的有一天会释放我的双手,我觉得这还是处于那种 科幻级的一个状态,但是实际上他真的做到了,现在基本上可以帮我做一些上品修改、详情页、投流设置、预算等等,所有都是他来操作。我待会会给大家放一下操作流程,所有他在操作的我都可以展现给到大家。

openclub 能做什么?有人据报道说一夜之间赚了上百万?昨天有好几位我们工具群的会员转发了这条信息给我,大概的意思是说,美国有一个人利用 openclub 进行自动化交易, 一夜之间赚了二十多万美元。当然这件事情的真实状况还有待验证,但我们可以理性的从技术的角度来分析一下。据报道说他是通过 openclub 自己获取互联网上各种各样的公司信息 以及鱼情相关的内容,来短时间高频的进行买卖。让我们来分析一下这后面的技术路径。首先,互联网信息搜索,这个完全可以借助 opencloud 自带的 mcp, 比如 brave api 网络信息爬取可以利用类似于 playwrite, browser use 这样的 mcp 去实现,把搜集来的信息发送给最强的 ai 大 佬,比如说 cloud 四点五,四点六去进行趋势的预判,以及何时买何时卖,最后将这些指令连通交易平台的 api, 就 可以进行短平快的交易了。 所以这一切操作流程下来都是通的,我们在搭建智能体的时候也会模拟这样的场景,但是你是赚是赔,能赚多少,这些都是无法保障的。但是如果你对 opencloud 的 技术和产品本身感兴趣,我们正好在工具小组里面提供一系列的课程,可以在视频底下留言,会有专人给你提供更多的信息和介绍。