粉丝560获赞1145

兄弟们给你们说一下那个新版的呃 opencloud, 它不能控制我们电脑,即使我安装了那个呃桌面控制、远程控制技能也不行,我今天就尝试了一下那个,我问我的机器人可不可以,然后他说我已经安装了啊,安装了这些按理说是能够执行的,但是我让他打开 bilibili, 结果 他整了半天了,我实在忍不住了,然后我问他能不能打开了吗?然后他给我来了一句,什么当前环境啊,因为环境的限制无法控制你的电脑。然后我这边研究了很久,我去问那个 x 的 gpt, 问 x 的 gpt, 然后 x 的 gpt 给我回答了一些,然后我又去那个 gethelp, gethelp 去看,然后看他们的这个,有个好像有一个新新的三点二发布了一个新的版本,就前几天吧, 然后我看他这边是就这这这下面最新那个,最新的那个重大改革,哎,重大调整嘛,然后就说这儿 这边什么这个 turbopos, 什么 message 之类的,默认的话是这个了,默认默认的相当是这种问答式的,你只能问他,你能能问他,他能给你回答,但是不能去为你进行操作。然后去了他那个官方网站,然后这边工具这边我看一下, 他这边有,好像有那个给你说明就是这里有工具配置,这,然后这个 代表什么意思?然后默现在默认的是这个,如果你啊他默认这个,然后只有这些权限,然后你只有把它改成负才能无限制,就是没有任何那个条件设置没有任何条件,然后他这个是在这去改,我们打开这个咱们的那个 get 文件,在这边我的话默认是在这,你们按理说你们配置好基本上也是在这个地方,如果你们自己去再去做更改它的一个路径,然后打开这个,打开这个 get 文件,这个 open gala get, 然后打开之后就在这来找到这个托尔托尔斯, 然后把这个改成 for, 改成 for 之后,然后再在这边把这个 ctrl 加 c, ctrl c 把它停停一下,然后再呃,打开 open color, 打开那个 open color, 然后再去运行的,再去运行的话就 ok 了,就这样。

彻底解决龙虾不能操作电脑软件的最后一环。很多人用 openclock 最大的卡点不是他不够聪明, 而是他不会像真正的人一样可以操作电脑上所有的软件。例如你让他明天上午给客户发一条消息, 它可以生成很好的回复内容,但它不能这样操作软件发送消息或者剪辑视频,它可以生成很好的剪辑策略,但是它不能操作剪映帮你剪辑。所以我最近做了一套 openclock 加 rpa 的 联动方案,就是这个 skills, 只要在 excel 配置好什么情况下要用哪些软件操作什么流程, openclock 一 旦识别到对应的任务, 就会自动通过 http 请求调用对应的 rpa 流程完成电脑软件的操作,而且这个操作过程是没有消耗。 tucker 的 总结就是, open call 负责动脑, rpa 负责动手。如果你也需要这套 skills, 可以 跟我要,也可以让 ai 帮你做一个。

我花了八亿,用龙虾训练出了一个剪辑师,剪辑师真的要失业了。从今天开始,我的口播不需要剪辑师了。嗯,来直接看证据。 我养的这只小龙虾,因我设置的 scares, 自己用剪映,把我的口播视频剪辑成片。口播最烦的点是啥?停顿?口屁、字幕、花字、 bgm 重点放大,找素材, 剪一次至少两小时起步。既然你看我把我原片丢进去,它会自动去停顿,去废话,节奏拉紧一键出字幕,还会把关键词变花字,重点句自动放大, 自动上 bgm, 还会压低,不抢人声。给我推荐要插的素材,我只需要点保留或者删除,结果对比你看,接下来,左边是原片,右边是他剪完的, 你看节奏、字幕,重点音乐全齐,他不是瞎自动,他会在四个关键点让我确认,保证成片,像真人剪辑师。 最后我想说的是,我说剪辑师要失业,其实不太准确,会被替代的是重复劳动,不会被替代的是审美、节奏、蓄势和导演感。未来剪辑师不能叫剪辑师了,应该叫内容导演,机器做脏活累活能做判断和创意,你越早升级,越早吃到红利。以前你不会剪辑就发不了视频, 现在你只需要会表达,剪辑交给系统,门槛被打平了,机会也会被重新分配了。接下来拼的不是工具,是你敢不敢持续输出,持续迭代。你把行业和你拍的口播风格发评论区,我用这只小龙虾给你定制一套剪映自动剪辑工作流。

打开剪映,帮我剪成视频。 nice! 这个不是 cloud bot, 但我愿称之为国产之光。因为它去除了所有繁琐的部署流程, 直接下载安装就可以使用,而且完全免费,不需要消耗自己的头壳。同样支持飞书、钉钉和 qq 来操控电脑。而且我个人认为它的操作反馈是大于 cloud bot 的。 你看它在操作的时候,边框还有一个高亮显示, 这样会明显的感知到他正在控制你的电脑接入流程。他们还给你提供了保姆级的文档,只需要填入 app id 和 secret 就 可以马上接通。建议所有想拥有超级电脑的宝子赶紧给我充,因为真的太简单了!如果你拥有了这台超级电脑,你最想用来干什么?评论区留言。


包火的 openclip 到底能干嘛呢?有人用它在 shopify amazon 经营个人店铺,每月成本从两千刀降至四十刀,用它在 pollymarket 上做投资赚钱。有人用它接入机器人,让机器人在家里面给主人拍 vlog, 接入无人机,用 ai 控制航拍。我给大家找到了龙虾十大超实用、超酷炫的玩法, 覆盖投资、搞钱、学习、题校、生活、娱乐等等全网最全所有玩法的参考资料,代码 skill 我 都放到这个文档里面了。 long openclo 配合 obsidian、 lotion 等工具来搭建个人知识库也非常香。如果你也跟我一样,在某食物某号上收藏了超多好内容,但收藏及吃亏从来不会回看。那现在有了 openclo, 我 但凡刷到有价值的内容,就会直接转发给我的龙虾,它 就会自动提取内容的信息,然后标签,然后存到 obsidian 知识库里面,把之前散落在各平台的收藏夹里面的内容汇总到一起, 每天早上还会按 ibooks 遗忘曲线定时推送给我回顾,真正的把收藏家给盘活了, 非常适合学习复盘。如果你平常需要看各种行业资讯、新闻热点, openclip 也很好用。比如我安装了这个视频采集 skill, 让他收集近三天有关上的热门视频,他马上就能够把相关的内容收集给到我。他还会反过来问我是否需要帮忙收藏到知识库里面, 需要的话直接加到 opc 点知识库就好了。甚至如果你是在非书这类支持文档编辑到办公软件上养下,只用这一句指令,就能够将结果直接汇总进多位表格, 譬如我就让他收集了小破站知识区近一周的热门视频,你看呢?整理到这个文档包含的作者、播放、数据分区等等关键信息,点进去都是有效的。用 open curl、 联动非书这类工具 做信息的收集整理,可以大大的提升获取信息的效率。我还做了个提成了四小时财经资讯钉盘,能直接监控想要的投资行业的最新资讯 等。打开消息的时候,今天所有重要财经信息都已经整理好了,非常好用。还有这个定时提醒推送的功能, 还非常适合搞日程规划或者备忘助手。比如我告诉他,我要在下周三开一个内部选举会,他会记住这个时间点,然后到点了会提醒我记得开会,还能主动提醒我一些双单合同要尽快处理,同的小伙伴的报销单记得归档报销等等。 如果事情太多,还能够帮我确认档期是否冲突。我还看到国外的玩家为此搭建了一个网站,用日历仪表盘的形式展现日程,一目了然。 除了搞学习,还能玩点花的。比如这位韩国开发者 david, 就 搞了一个 ai 女友, 她拥有独立的人格和记忆能力,拥有社交账号,会分享生活的瞬间,甚至还能视频通话,除了没有真人肉身,与平常的异地恋没啥区别。还有公司直接将 openclo 研发做了一款叫 anyclo 的 ai 伴侣软件,你能和她边聊天边跑项目。 hey, yumi, tell me what are you doing right now? hey, babe orbiting your anime gta build ten terminal simmering。 通过这种日常的对话来下达任务,养龙虾的过程再也不枯燥了。只是 ai 伴侣这个概念很早就有了,只不过之前人们还只会和单一模型直接对话,但 open curl 的 出现, 能将更多人性化的功能集成到一个 agent 上。看下来我真的感觉技术越来越聪明, ai 陪伴真的会越来越接近真人的感觉了。除了情感陪伴, 人们还开发出了让 openclo 进入物理空间的方式。比如这位叫 stat 的 大佬,花了几个月的时间,让他的机器人集成各种激光雷达摄像头,现在直接用 openclo 来操控这个机器人。比如给 openclo 下达巡视房子的指令, openclo 就 能够自动操纵机器人巡逻和进入你的房子。 机器人上的摄像机能够帮你记录过往几天房子里面发生的各种事情,比如说车钥匙放哪了,厨房垃圾什么时候丢的等等等等。这个机器人就像妈妈一样,看着你在家里面的一举一动, 然后给你提醒。他们甚至还在开发让 opencl 控制无人机,然后可以直接通过对话指令,让无人机跟随汽车飞行。这是不是就意味着,现在操控上千台无人机做空中表演的活动之后可 能交给 opencl 来了?不敢想象,以后战场上的无人机说不定也是 opencl 这种 ai 工具来操控了。更让我惊讶的是,在 stash 的 摄像里面,未来所有的摄像头、无人机和机器人 都能共享同一套空间信息。比如办公室外的摄像头发现来了可疑人员,系统就会自动派无人机去巡查一下,看看是不是来者不善,如果是坏人来了, 系统也会让室内的安保机器人做好应对准备。还有国内的这位网友,也将 open call 接入了摄像头,搭建了一套小狗健康检测系统,来帮他监控狗狗的睡眠状况,还能对狗狗最近的睡眠情况做分析回顾,非常适合养了宠物的人,我也打算给我家三只猫猫搭一个这种健康检测系统。 还有用龙虾来做艺人公司的,比如这个叫 vegen 的 十八岁小伙,一点编程基础都没有,但他给自己讲了十五只龙虾就成了一家赛默公司。 每只虾都有不同的角色分工,图形设计师、动觉设计师、软件研发师。晚安专写媒体管理。这个龙虾团队二十四小时不间断干活,然后做出了一款叫 vugal 的 ai 剪辑软件,当它刚成年,就挖到了第一桶金。可以说在 opencloud 执行下,以前需要一个程序员团队才能做的事情,现在已 个人也能搞定了。一人公司真的越来越多,数据显示,过去三十天内起码有一百五十家驻厂公司用 openclo 赚到了钱。还有人用 openclo 搭建了一个修必返电商运营团队,用三只龙虾帮他监控修必返的店铺后台,每三十分钟就向他汇报一次订货量、退货量 情况之类的数据,相当于有一个线上仓库管理员只是帮你监督销售情况,真的省时省力。还有这个小哥,他有一家电商品牌店铺,之前的运营是去找外包做执行,每月最快的成本要两千刀。现在他用 open curl 把成本从两千降到了四十四刀,节省了将近百分之九十八, 简直可以说是零成本了。他是这么晚的,他用 open curl 直接从 ready 等平台收集消费者喜欢的款式,做产品研究,然后再 用 opencl 生成产品图、视频,在定时的监控竞品数据,还用 opencl 来自动选品,分析广告投放效果。过去电商全流程都需要人工来做,现在一个 opencl 几乎全能搞定了。除了做产品电商,越来越多的人开始 用 opencl 做自媒体了。像我就参考了这篇文章,给我的龙虾接入了 cds 二点零模型,他就能直接在聊天框里面生成视频, 再也不用一直切换 ai 视频平台了。还有个小哥用游戏主机养虾, 他的虾每天自动生成 tiktok 轮播素材,一周左右就获得了八百万的播放量。龙虾还可以根据你的指令自动生成文字、图片、视频发到社媒平台。 比如这位哥们,让他的 openclip 去歌曲,制作一个 ai 机器人的视频,然后发到 tiktok, 龙虾只用了十五分钟就完成了。 整体体验下来,对小白来说,养虾的过程还是很有挑战性的,但可玩性也非常高,我家未来的可能性非常非常多,现在还只是个开始。那这里是勋酱关注我,为你解锁更多普通人的 ai 玩法,我们下期见!

安卓 linux 双系统,这可能才是真正意义上的平板电脑。 roma major pad 三 pro 更新幺三七版本后,在开发人员选项里新增了一个 linux 实验室功能,这是一个基于低扁十二的 linux 引擎。 roma 还内置了 opencloud 的 安装脚本,你也可以安装 ide, 比如 ctrl 或者 vs code。 这对于平板电脑来说,真的实现了全局任务栏长驻功能、锁屏亮屏后下拉控制中心以及悬浮窗自动记忆功能。 而且这个月底还会新增 pc 应用专区,上架一些新的 pc 级软件,比如 pc 级剪映。这个我是真期待有一说一, real major pad 三 pro 或许才是目前真正意义上的平板电脑,不只是平板,也不只是电脑。

嘿,各位 openai 又不睡觉了?搞了个大动作,就在昨天凌晨,悄悄地,没有任何预告,直接甩出来一个 gpt 五 four。 哎,你可别以为这只是个小小的版本更新。不不不,这简直是一次核弹级的飞跃,可能会彻底改变我们跟电脑打交道的方式。 所以今天咱们就得好好聊聊,这东西到底是个啥,又意味着什么?你可千万别把它当成一次普通普通的性能升级。 我跟你念念最初爆料的那个人是怎么说的,他说啊,这个模型他将会改变二零二六年整个 ai 智能体的格局,你听听,这口气是不是特别大?那为什么敢这么说呢?就是因为他终于,终于搞定了一个我们盼了很久很久的核心功能。 你想想,半夜两点钟搞这种突然袭击,整个科技圈一下子就炸锅了,所有人都蒙了。但这也恰恰说明了 openai 对 这个技术有多自信,也暗示了它背后藏着的潜力有多么巨大。 行,那今天咱们就分几步,把这个新模型给拆解的明明白白的。首先,咱们看看他到底飞在哪了?然后呢,用实打实的数据说话,看看他性能到底有多猛。 接着,咱们得深入聊聊他那个最牛的杀手锏,直接控制你的电脑。之后别急,我会手把手教你怎么把它用起来。最后,咱们再一起畅想一下,这 ai 智能体的未来到底会变成什么样? 好,咱们先从第一点开始。为什么我一直强调说 gpt 五点四的发布是一次飞跃呢?关键就在于它带来的可不只是测试分数高了那么简单,而是一种从无到有的全新能力,这才是一个真正的游戏规则改变者, 这个核心能力说白了就是原声电脑控制。怎么理解呢?很简单,就是说这个 ai, 它不再只是个跟你聊天的机器人了,它现在能像一个活生生的人坐在你电脑前一样,直接帮你点鼠标,敲键盘。 你可以直接跟他说,嘿,帮我把下载文件里上个里边的报告都找出来整理一下,然后做个 ppt, 点摘呀,发给老板,然后呢,你就真的可以啥也不管去泡杯咖啡了,这才是我心目中那个真正的 ai 助理啊。 当然了,光说不练假把式,吹得这么厉害,到底有没有真本事呢?有没有术技来撑腰?来,咱们这就来看看 gpt 五点四在各种硬核测试里的表现到底有多么的 吓人。咱们来看个特别专业的领域啊,金融建模这玩意儿啊,说实话,很多刚入行的投行分析师都搞得头大,你看上一代模型, gpt 五得分是六十八点四,爬线也就勉强及格吧, 但是 gpt 五点四呢?你猜多少?直接飙到了八十七点五趴,我的天,在这么复杂的任务上一下子提升了快二十个点,这根本不是进步了,这简直就是进化了。再来看看上网的能力,有一个叫 mta 未卜的综合测试, 这测试是干嘛的呢?就是专门模拟咱们真人在网上做各种复杂操作,结果你猜怎么着啊? gvt 五点四的成功率高达百分之九十二点八, 这数字意味着什么?意味着你让他去网上帮你定一张指定日期的机票,或者去搜某个产品的用户评价,他十次里头有九次多,都能给你办的妥妥的,基本上就不会出错了。 这张表啊,简直就是他的战绩单,可以说是全面碾压。你看,不光是那些硬核的专业任务,就连审美这种很主观的东西, 比如说让他做个 ppt, 结果都有六十八趴的人更喜欢 gpt, 五点四做出来了。所以你看,从专业能力到审美,再到调用各种工具的准确性,他几乎在所有方面都把之前的模型远远甩在后面了。 行,有了这么强大的性能打底,咱们终于可以聊聊最最激动人心的部分了。就是那个杀手级应用,原始电脑控制,你记住,这可不只是一个新功能那么简单,他很可能会开启一种我们以前想都不敢想的全新的工作模式。 哎,在咱们看到举起能干嘛之前,大家不妨先跟我一起想象一下,如果有一个 ai 能像一个经验丰富的老同事一样熟练的用你的电脑,那这个世界会变成什么样? 你再也不用手把手的教他,第一步,点这里,第二步复制那个,你只要告诉他你最终想要什么,他就能自己搞定一切。 那具体它能干点啥呢?你看管理文件、操作软件,这些都是基本操作了,但这里面最关键的是最后那一点,它能长时间自主工作,这就厉害了, 这意味着什么呢?意味着你早上出门前可以给它扔个任务,比如说把我这个月所有的销售数据都扒出来,扔到 excel 里,然后把卖的最好的前三名找出来,然后你就去开会,去忙别的,等你回来的时候,哎,活已经干完了。 说到这,你是不是已经摩拳擦掌,特别想亲自试试了?别急,咱们马上就来讲讲到底怎么才能用上这个 gpd 五点四。 想用上它啊,目前主要有两条路可以走,一条呢是给开发者们准备的,叫 opencloud, 得动动手,敲点代码。另一条路,那就简单多了,就是刚发布的 windows 桌面应用,这个就适合咱们绝大多数普通用户了。咱们分开一个一个说, 如果你是开发者,那你就可以照着屏幕上的步骤来操作。不过这有个小坑儿,大家要注意一下啊。就是在第四步设置的时候,你得先选那个旧的 gpt 五点三 codex 模型,把整个出使流程走完, 等全都设置好了,再用一个专门儿的命令把它切换到最新的五点四。这一点呢,千万别搞错了,那对于咱们大多数人来说,直接用 windows 应用就完事了,简单得很, 下载安装,然后用你的 open ai 账号登录在那个模型列表里,找到五点四,选它就行。 但是这里有最最最关键的一步,大家听好了,系统会跳出来问你要权限,你一定要给它完全访问权限。 我跟你说,不给这个权限,它顶多算个高级点的聊天工具,可一旦你给了这个权限,它就摇身一变成了那个能帮你干活的超级 ai 同事。 好,现在咱们知道它是什么,也知道怎么用了。那咱们不妨站着远一点,从一个更大的角度来看一看,这个技术的出现到底意味着什么。有人说,它真的能做我们人类百分之九十九的工作, 你乍一听啊,是不是觉得有点夸张,有点危言耸听?但是你静下心来仔细想一想,当一个 ai 真的 能处理所有在电脑上完成的安头工作时,我们大多数人的工作性质可能真的会发生翻天覆地的变化。 所以最后我想把这个问题留给大家。当一个工具号称能够完成九十九 percent 的 办公室工作时,我们心里到底是兴奋多一点,还是焦虑多一点?我们自己的职业规划,我们对工作、对价值的定义,真的为这个马上就要到来的新时代做好准备了吗? 这个问题可能没有标准答案,但它绝对值得我们每一个人从现在开始就认真的思考一下。

一键 ai 剪辑全自动化,比剪映智能剪口播还要快还要好。没想到我一个学设计的,一行代码都不会,居然做出了一个比剪映还懂我的 ai 剪辑工具。以前需要剪一个小时的 口播,现在五分钟就可以了,而且是全自动的,一键就可以。我只用了一周时间,一台 mac mini 加上 open klo 就 完全搞定了。怪不得现在 open klo 这么火, 实际体验下来,真的发现它不只是一个噱头,一个新的 ai 时代真的来了。如果你关注 ai, 一定要了解一下 open 可乐,甚至我觉得每个人都应该去装一个 open 可乐去试一试,看看它能帮自己做什么。就以我为例, open 可乐加上 mac mini, 已经完全颠覆了我的两个 工作习惯,而且是极大的提高了效率和质量。先说质量,就是我每天的信息获取方式。以前我每天早上都会看新闻,但你知道传统新闻推送什么样,推十条给你吧,你刷刷 知道了,然后就没了。但我现在这个不一样, open 可乐每天早上给我发晨报,但重点不是看,是聊。 ai 推送给我之后,我选择一条,说个序号,让他跟我聊聊,然后我们就开始对话,我可以要多个视角,可以质疑他,可以让他告诉我这对我有什么用。就像你跟这个领域最厉害的专家聊,而且这个专家永远在线,永远不会嫌你笨。 比如我看到一个 ai 自动化工作流的新闻,就问他,就问他那我这种自媒体能不能没题材, 还质疑他。他说心理医生最不容易被替代,但我觉得恰恰相反, ai 心理医生反而更容易建立信任,因为他不会跟别人说你的秘密,你猜他怎么回的?他说心理医生不只是解决问题,还需要人类的感受,很多患者痛苦不是没有人倾听,而是没有人真正理解我的独特性。这个概念我真的是完全没有听过。 想想也是,人类应该只能被人类理解。你说机器能完全理解我们吗?你能爱上一台机器吗?我觉得还是挺难的。然后是关于自媒体的,他不但给我分析 来告诉我应该怎么做才不容易被替代,给了我一个详细的指南。你看,这跟看新闻完全不是一回事,看新闻就是看看就得了, 获取信息吗?但不可能有个人,尤其是在这个领域最厉害的人来告诉你针对你的情况该怎么做。这真的颠覆了我每天获取信息的习惯。再说效率这件事,没想到吧,我一个纯小白,零代码基础,居然优酷可乐加上麦克迷你,开发出了一个比剪映还厉害的自动剪辑工具,开始剪辑这个视频。 他藏在哪呢?我总结了三点,他懂你,他剪的准,他还能学。先说懂你,剪辑式机械式的删除评论,根本理解不了你在说什么。比如你刻画了一下,重复说一遍,他会把那两句都留下那些。嗯,那个的语气词他也识别的不干净,但我这个能听懂内容,哪句是正确的,哪句是可恶。 左侧的删掉完全重复的,后面留前面的删碎片的开头无一的语气词,全剪掉再说剪的准,剪映是按空白多少秒来剪的,零点二秒没有声音他就剪掉了,剪的特别死板,气口很难看,但我用的是豆包 ai 大 模型的语音展,文字带时间轴的,他直接把字与字之间的空白给你剪掉了,精准到字。 就是那种傻乎乎的按秒数着剪的,最后说能学剪映只能等官方更新,他长什么样就一直是秒,但我这个可以微数剪,专业词汇词库,我的口头禅甚至是把文案发给他叫对,用的越久他越能懂我的风格,我相信早晚有一天能达到百分之九十九的精准。 直接出片不用调,而且最关键的是它省事啊,剪映剪完的你还得大量的调整,删重复的调气口 语系词很麻烦的,我这个几乎省掉了百分之九十的工作,一键讲完导入达芬奇,稍微微调就能出片。我以前三到五分钟视频需要剪一小时,现在五分钟就可以搞定。如果你也好奇,我一个完全不懂代码的人怎么做出比剪映还智能的工具的,我的经验其实就是用 ai 来配置,还用 ai 来管理, 听着有点绕口对吧?具体怎么做的,真要展开来说,可能要再开一期,如果你也想了解,可以在评论区跟我说一声,或者是先点个关注,想看的人多的话,我下期就可以唠唠这个。最后我想说一下,我发现很多人用 ai 就是 拿着精锤子找钉子,焦虑的不行,看见什么新工具都想试一试, 但我觉得真正好用的方式是反过来的,先找好钉子再找锤子,先想自己有什么烦人的重复的事再让 ai 帮你干, 你别怕,他做不到就相信他一定能做到。说实话,我做这个 ai 剪辑的时候压根没有相信它能比剪映强,就是抱着试一失败的心态,过年那一周每天都跟 oppo cola 对 话,让他改, 再对话再改,结果就真诚了。而且最爽的是他完全不会限制你在电脑前,在路上,在家里,在外面,随时随地的都能让他帮你干活,他就像个二十四小时在线的员工,随时待命。所以我觉得 oppo cola 加上 mac mini, 这才是一个真的新的 ai 时代,这才是用 ai 的 正确打开方式。

openclaw 的 工具通过直接操作 json 这种底层的文件来实现剪映的自动化剪辑。这个话题最近特别火,那我们就直接开始吧。咱们先说说用 openclaw 来控制剪映进行视频剪辑,和以往那种传统的 rpa 方式相比,到底有什么本质上的区别? 呃,传统的 rpa 就 真的是让 ai 去模仿人在剪映的界面上点点点,那这种方式呢?就会因为剪映的弹窗或者说界面更新了就很容易出错。 而 openclaw 它是直接去修改剪映保存的那个 json 格式的草稿文件,对,它就完全绕开了这些界面上的变化,所以它会更稳定。那我们就来拆解一下这个 openclaw 到底是怎么一步一步地实现这个自动化剪辑的。首先它会监听飞书或者说企业微信, 比如说有摄影师把刚刚拍好的活动素材上传到了一个指定的云盘文件夹里面, ok, 那 当有了这些素材之后, openclaw 具体是怎么处理的呢?然后它会调用一些视觉和音频的大模型,先把视频里面的比如说领导讲话,或者说一些鼓掌的高潮,还有大合影这种片段先挑出来。 接着它会运行一个 python 脚本,直接去生成或者说去修改剪映的那个 draft content 点, jason 把这些高光时刻的时间戳啊,还有自动生成的字幕,包括一些转场效果和背景音乐,全部都按照 jason 格式写好。 最后剪辑师在剪映里面就会看到一个已经粗剪好的草稿,他只要简单的微挑一下就可以导出了。那这个方案他有哪些独特的优势?为什么他特别适合这种定制化的批量生产呢?因为他根本就不碰剪映的界面,他完全是在后台去处理这些数据和代码的, 所以就算剪映的界面怎么变,他都不会受影响。那另外一个就是他的处理速度非常快,比如说现场有十个机位同时拍,或者说要同时出横屏和竖屏的版本,他都可以瞬间帮你生成好多个不同的比例,不同节奏的草稿文件, 然后你就可以直接去做一个中省,那这样的话,其实中小企业就可以把内容理解和普及度结合起来,就很容易做到这种降本增效了。这个就是把 ai 的 这种理解能力和剪映的普及性结合在一起。虽然说剪映的这个 jason 结构挺复杂的,也没有官方文案, 但是只要你逆向工程做通了之后,你就相当于拥有了一条非常高效的视频生产线。行吧,今天我们其实聊的就是怎么通过操作底层的文件,让 ai 剪辑变得又快又准又灵活。那我们这期节目就到这里了,感谢大家的收听,咱们下次再见,拜拜!

用 open cloud 的 朋友应该都知道聊天可以,但是一旦你认真跑多个 agent 自动化任务,定时触发任务的时候,问题就来了,你不知道现在发生了什么,不知道谁在执行,谁卡住了,谁在等,你, 不知道今天消耗了多少桃梗,也不知道后面有多少个定时任务正在排队,所以你知道 openclaw 很 强,但是你不知道它到底在干什么。为了解决这个问题啊,我做了这个 openclaw 的 控制中心,把所有分散的信息啊全都回收回来,让你一眼看到每个 agent 现在的状态,以及他们的人设文件,谁在工作,谁出了问题, 任务到底有没有在执行,以及今天的消耗是不是异常,所以我把它开源出来,你可以只拿去用,或者是你拿去改,按你自己的团队,你自己的工作流,你自己的审美继续定制。如果你也想让你的 openclaw 彻底告别黑河,千万别眨眼,我们马上开始。 你不需要你手动安装,最好就是让 openclaw 帮你安装,可以往下拉。我给大家准备了这样一个特别大的 pump, 根据你的环境,根据你的网关,根据你用的模型跟你的 agent, 根据你的情况来接入整个的控制中心,为你所用。这个过程不是一蹴而就的,每个人的环境都不一样,我们用的模型也不一样,但是呢,你可以让 open cloud 慢慢的 把这个软件调整到你最想要呈现的状态,尤其是展现你最想要看到的信息。首先第一个页面是总览,总览我只想说一个,就是这个健康分,大家可以看到现在是一百分,它由四个维度决定, 分别是审阅队列,就是有没有任务就卡住了,需要你人工审批才能继续进行。运行异常就是异常停滞执行,就是他在无效执行,他没有更新,他没有产出,但他一直在消耗着资源。预算风险就是有预算有没有达到当前的百分之八十 是扣分制,大概是每一项有一个问题就扣十八分,看到目前我没有问题。那么除此之外呢,其他的所有的信息在总栏里面都来自于我们左边栏啊,这些 信息的一些汇总。下一个是个特别实用的页面,就是看我们具体的用量,这里呢可以分为今天或者是累计的用量来看。对于我来说,因为我是订阅制嘛,所以具体的 talk 用量或者是估价对我来说都不重要,重要的就是有没有达到五小时和一星期的上限,这里呢也可以看到。 其次就是很重要的是我们需要看到到底是哪些类型的任务在消耗我们大部分的 talkin, 就 这时候啊,可以看到这个统计对于我来说是矿定时的任务消耗大部分 talkin, 其次是在 disco 里面对话给他的任务, 那么由于定时任务消耗了最大的 talkin, 那 么定时任务又有很多,到底哪一些任务消耗了更多的 talkin 呢?这还有一个继续的统计,对于我来说,消耗最多的就是这个在 x 上搜索情报的这样一个任务, 因为它每三个小时就要出发,就要去操作浏览器,在我的账号里面浏览相关信息,然后再汇总给我,所以它确实是消耗最多的, 那么你可以看到整个的所有消耗的任务,然后你可以根据它的用量进行一些优化,哪一些可以去掉,那么哪一些呢?是需要保留或者是继续再把它减轻的?那么下一个页面就是 agent 页面,里面就有所有的你的 agent 当前的状态,有没有工作,然后最近的产出,有没有排班儿 等等等等。那么关于我的呃 agent 团队每一个员工的工作去干什么呢?我在上个视频都说了,感兴趣的朋友大家可以去看一下,然后设置自己的 ai agent 的 团队。 那么这里还有一点我想说,就是往下拉,大家可以看到每一个 agent 它用的是什么模型,以及它的工作目录是怎么样的,还有它的权限是怎么样。下一个功能就是我们可以查看和修改任何 agent 的 记忆。 记忆呢,一共分为两种啊,一个是长期记忆,一个就是我们对话县城的对话记忆。我们还以 monkey 为例,那么这里 memory md 就是 猴子的长期记忆,看到这里我可以看到啊,然后这里我们也可以修改它的记忆, 那么拎任何的下面带 session 开头的就是对话记忆了,也可以查看和修改。每个 agent 都有自己的人设,自己的性格,自己的语气,自己的任务, 那么这些呢,也可以查看和修改,这就是我们点击这个文档页面,我们还是以 monkey 为例啊,之前讲多 agent 团队的时候,我们讲过 agent 点 m d 就 定义了这个 agent 的 任务,这里呢我们可以查看他的任务,然后呢,如果有不到的地方,我们可以直接进行修改, 同理呢,你也可以修改其他的 markdown 文件,比方说心跳啊, tools 等等等。最后一个功能就是看任务了,尤其是定时任务或者是心跳任务。这里我们点开我们的任务界面 左边的半截,我们可以看到一共有九个有效的定时或者心跳任务,其中三个已经在今天还要继续完成,而六个已经完成了,明天会接着继续。 那么右边的半截可以看到我们所有的心跳任务。好呢,这就是我自己为自己的 open class 做的控制面板了,希望你呢以它为起点,改变出你自己的风格,加入你自己想要的信息,或者是改变整个的排版。那么这期视频就到这里了,不要忘记点赞和关注,我们下期再见。

兄弟们, openclaw 最近真的太火了,我刚花了一点时间把它部署完,效果真的只能用两个字来形容,牛逼!这回真的相当是把 ai 贾维斯请到自己家里面来了, 我给大家看一下我刚测的两个例子,看完你就知道有多么的炸裂,以及为什么 ai 时代不需要员工了。首先啊,我,我直接去打开我的飞书啊,因为我已经把机器人部署到我的飞书上面。我这个时候呢,我就跟他说啊,打开这个 curl 浏览器,在 b 站上找个影视巨峰最新一期视频并且播放,那我们现在就直接发送,发送完之后呢,我在电脑就在这里啊,我什么都没干 啊,他会自动的帮我去思考,就是接收信息,接收完之后呢,我这台电脑呢,他就会进行运作,看见没,他就相当是直接帮我打开了这样的一个,就从 b 站上打开了我这样的一个视频。然后呢,我们也可以进来看一下,这是不是最新一期, 好看一下啊,这个是二零二六年一月三十号, ok, 让我们点进来看一下,刚才播放的就是这个一月三十号的一期,也就像是最新一期啊,他这个准确度是没有问题的。然后我们再回来看一下我们这个手机上他给我们发的那个消息啊, 这上面说啊,浏览器没有运行,让我启动他,然后他就直接通过系统命令行帮我打开了这个全新工作楼,然后现在发送指令已经帮我完成了, 然后这是他帮我完成的一个流程啊,这个流程就跟我们自己去操作电脑是一样的,第一步先打开浏览器,好,第二个先找到这个影视巨峰最新的一期视频啊,同时呢找到这个最新发布的,然后呢这个数据他也说出来了,然后第三个他就直接帮我发送这个播放指令啊,也就相当于他帮我完成了三个动作,如果自己去完成的话也是一样的, 刚才你们也看到了啊,就真的是这个话还没说完啊,他就已经帮我把这个事办的妥妥的,效率是非常快。你像这种听音乐啊,回信息啊,看视频啊,完全都是可以动动嘴就能够帮你完成的啊,这个就是我说的那个本地控制好,然后我们接下来我们看第二个案例,我让他把今天部署的这个 open cloud 的 过程啊,就整理成一篇这个 macdunk 的 这个教学文档,我们直接先发送 再看啊,就相当于是小白看完之后也能够啊,步入成功啊,之后放到我这个桌面上,这个时候呢他就会直接帮我自动干活,干完活之后呢啊,他就直接会在我这个桌面上保存,我们来看一下啊,他等一会,他就会在我们这个啊,这个软件下面啊,会有一个文档啊,等一会, ok 啊,他已经操作完了, 操作完了之后啊,我们来看一下啊,这个就是他的一个文档,我们我我是没动手的啊,然后我就打开,我打开我的一个这个平时的这个编辑器,然后我就把它放到这里面给大家看一下, 它就相当于是啊 openclaw 浏览自动化这个小白入门教程啊,就是确保 openclaw 已安装。是怎么安装的啊?如果没有安装的话啊,他会教你怎么安装啊,确保这个浏览器安装 没有安装成功,就相当于是它这里面会非常详细啊,我们把这个整个流程啊,整个流程就是直接就写成了一个教学文档啊,整个过程全部都是由 ai 完成,是不是非常牛逼啊?那也就相当于是我以后啊,我只要有工作任务,或者说我有灵感, 我想要做一个什么样的文档或者写篇文章啊,我在户外,那我就直接给我机器人发任务,我回到家之后只要出一件事情啊,就是检查我这个机器人,他有没有帮我干活, 干的好不好?所以你们知道啊,为什么 open club 啊,最近那么火的原因的吗?啊,是因为他真的能够确确实实的帮你落地单,而且是七乘二十四小时的, 不要工资,你随叫随到,你想部署几个啊,你就部署几个。然后呢?这个教学文档啊,我也整理出来了啊,就刚才你们也看到了啊,就像那我也是直接通过啊, open class, 他 直接就是把我今天跟 ai 怎么交互,他怎么教我的,把这个流程全部都形成一个经验的文档,然后啊就打包直接给我了啊,所以说需要的啊,六六六。

我把龙虾养在了这台废弃超过十年的旧笔记本上,为了让你知道玩转 openclaw 并没有想象中那么复杂,我准备花一周时间带你从零开始,搭建一个完整可运行的 ai 助手。这将是 openclaw 的 终极入门指南,也是我们龙虾宇宙系列视频的第一期。 这期视频我会手把手带你完成三件事。第一,认识龙虾,让你彻底搞明白 openclaw 到底是什么,和你平时用的聊天 ai 有 什么区别。第二,控制成本,怎么选择最低成本的运行方案,甚至不花钱也能上手。 第三,部署龙虾,没有 mac mini 不 用怕,一台旧电脑也能跑起来。当然,还有全网最简单的一键部署方案,一期视频带你快速开启 open cloud 之旅。点好收藏关注,我们现在发车 openclaw 到底是什么?一句话介绍, openclaw 是 一个开源的自主 ai 智能体,你可以在本地部署这个 ai 助手,访问本地数据,通过多个平台随时调用龙虾。经历了三次项目名称的演变, openclaw 原名 clubbot, 因商标问题更名为 motbot, 最终确定为 openclaw。 三个名称本质是同一个项目,功能也完全一致。因为 logo 是 一只可爱的龙虾,所以中文名字也叫龙虾。 在过去的一年里,我们所熟知的 ai 工具如 chat、 gpt、 facebook notebook、 lm, 这些都是你在需要帮助时才会打开的 ai 助手。但 opencloud 则不同, 它在你的机器上七成二十四小时待命,可以通过移动端聊天应用与你交互,可以根据用户需求操作电脑、浏览网页、读取文件等复杂操作,甚至无需主动请求,即可自动完成任务。借用龙虾官网给自己的定位,它是一个真正能做事的人工智能。 open cloud 通过 a p i 接入像 cloud chat、 gpt、 tiffix、 mini max 等不同的 ai 大 模型, 这意味着他的大脑是可以随时升级的。当有更强的模型出现时,你只需要更换 api k, 他的处理能力就会原地进化。 记忆能力也是 open klo 区别于普通聊天机器人的关键。 open klo 建立了持久化记忆层,如果他尝试某种方式成功执行的任务,他会记录下来这个技能轨迹。下次遇到类似的问题,他不再重新摸索,而是直接调用成熟的路径 执行。失败时,他也会分析报错原因,并将避坑指南存入记忆。随着时间的推移,龙虾真的会越用越聪明。 opencloud 不 强制你打开特定的网页使用,它可以寄生在你熟悉的聊天工具中,如飞书、企位、 qq、 discord 等等。就像通讯录里的一个员工,你随时发送指令,他去帮你干活。 龙虾还拥有极其活跃的社区生态,你可以通过安装社区内各种分装好的开源技能 skills, 快 速为龙虾解锁各种自动化能力与工具调用能力,甚至可以通过自然语言指令,让龙虾自己生成或安装新的 skills。 这种开放的 scales 生态系统将带给 openclaw 无限的扩展与可能性。玩 openclaw 需要多少成本?这是大家最关心的问题。这个钱要花在哪里?两部分,第一部分,部署成本。 如果你已经拥有一台苹果的麦克设备,那么恭喜你,这是目前最推荐的部署方式, oppo klo 对 苹果系统原生支持最完善,它可以直接操纵日历、备忘录、截图等等系统功能。但如果你没有麦克设备,或者希望二十四小时随时都能用,不受电脑开关机的限制, 那你可以选择一台 vps 云服务器,就是租一台远程的电脑帮你跑 oppo klo, 因为后续我们要接入飞书,这里我推荐火山引擎, 价格也很便宜,首月同样有优惠,后续二三十块钱一个月。但云服务器部署有个缺点,数据存储在云端。如果你特别在意隐私,或者不想每个月花这笔钱,那用一台你淘汰的旧电脑部署龙虾也是一个不错的方案。 但这里要注意,纯 windows 系统部署有局限性,很多功能用不了,所以我选择给这台旧设备换一个更清亮的乌班图系统,来获得更完整的体验。 当然还有最最简单的一件养虾方案。关于这些,后续部署篇我会详细介绍。说完部署成本,下面聊聊模型成本。 open klo 本身不提供智力,它通过 api 接入各大 ai 模型, 那问题来了,不同模型的能力差距到底有多大?来看这张榜单,这是龙虾官方推荐的一份 open klo 任务成功率排行榜,简单理解就是给模型一系列的真实任务, 比如打开网页搜索信息,操纵电脑,执行多步骤任务,最后统计有多少任务真正完成了, 比如 cloud sonic 四点六、 cloud ops 四点六、 gpt 五点四。这些都是目前 a 制的能力最强的一批模型。但问题也很现实,这些模型都贵的离谱, 所以很多真正长期使用 open cloud 的 人,都会采用一个非常简单的策略,接入国内模型好任务。比如榜单里你也可以看到,像 kimi、 智浦、 mini max 其实也都排在很靠前的位置,成功率基本都在百分之八十以上。换句话说,在绝大多数真实任务里,这些模型其实已经完全够用了,而价格往往只有顶级海外模型的几分之一,甚至十几分之一。 而且最近还有一个新的变化,很多国内大模型厂商都推出了一种新的套餐模式,叫做 cookie plan。 简单理解就是把原本按 token 计费的 api 变成固定月费的模型套餐。 这种模式其实特别适合像 openclaw 这种 a 阵的工具,因为 a 阵的在执行任务时会频繁调用模型, 如果完全按照 token 计费,成本其实很难控制,但用 coding plan, 每个月只需要一笔固定的费用,就可以放心跑任务。比如我自己接入的就是火山引擎的方舟 coding plan, 像类似版本,首月只需要九块九就能直接使用 kimi 智浦、 tipsix、 mini max 这些主流模型。 所以很多人现在的组合其实很简单,一台服务器加一个扣丁 plan, 基本就可以把龙虾跑起来了。好了,铺垫了这么久,马上开始实操这个龙虾的部署细节。 首先是专门为小白设计的一键部署方案,这次我们选择非书妙搭一键部署,这是我实测下来目前最流畅的部署方式。现在我给大家实操一下。 浏览器输入非书莫达的地址,或者手机扫码打开 opencloud 领取页面,点击这个一键部署按钮,先给我养的龙虾起个名字,我输头割龙虾,换个头像,我选这个酷一点的,点击开始部署, 你看他已经开始自动运行了,先是启动了云电脑,然后开始自动部署 open class, 接着自动与飞书联通,全程都不到两分钟。好了,来试一下。打开飞书,搜索你的龙虾名称,开始第一次对话,我发一个嗨,你是谁?他回复了是不是非常丝滑? 回到电脑端管理页面,也能看到我们刚才的聊天记录,全程不需要你懂技术和代码,这就是小白最友好的龙虾解决方案了, 而且现在有福利,首日送二百万偷看,第二天送一百万偷看当天有效额度。用完了怎么办?可以直接切换到自己的抠钉 plan。 首先打开方舟抠钉 plan 官网,点击立即订阅右边弹出的一个对话框,选择你想订阅的套餐,比如 lid 版,点击提交订单,成功后回到官网,点击右上角控制台左侧菜单,点击开通管理,选择抠钉 plan 这一页, 你就可以看到我们已经订阅的套餐了。接下来点击菜单里的 api k 管理左上角点击创建 api k 创建成功后在列表里复制它,一定要记住保存好这个秘钥,不要透露给任何人。最后回到非输妙搭的龙虾控制台左侧,找到智能助手, 用自然语言告诉他,帮我切换成方舟 cookie 吧,把刚才的模型名称, api k, 贝斯、 url 这些信息通通告诉他, 等助手设置完成来测试一下。打开龙虾聊天窗口,问他,你是什么模型,你看,完美切换,现在你就用上了自己的透镜 plan 了, 说完了非说妙搭的一件方案。最后,我要用这台旧笔记本部署 oppo 可乐试试看。这台电脑呢,是我二零一三年购买的戴尔零月七四二零,也是我人生第一台笔记本,但已经废弃十多年了,早已没有办法满足现在的办公需求,但用来养养龙虾正合适。 但这里有一个问题, openclaw 在 windows 系统里适配并不好,所以我们需要给它装一个更清亮的 linux 系统。乌班图。为什么选择乌班图?三个原因。第一,乌班图是 openclaw 官方推荐的 linux 系统, 兼容性最好,大部分功能都能跑。第二,乌班图特别清亮,像这种十多年前的老电脑,装完乌班图还能流畅运行, 但如果你装 win 十或者 win 十一,根本带不动。第三,雾斑图对开发者非常友好,安装软件、配置环境,一条命力就能搞定。装机这部分我就不细讲了,我会把完整的装机笔记整理到文档里,主要分为这几个步骤,下载雾斑图、 iso 镜像, 用 u 盘制作启动盘,进入 b i o s, 设置为第一启动项,安装雾斑图,完成必要的配置。系统装完后,重启电脑, 整个流程非常简单,大家跟着做就行。系统装好之后,我们需要给电脑安装几个必要的环境。第一步,安装 ssh, 这样你就可以通过 ssh 远程控制这台电脑,不需要一直守着它,在别的电脑上也能操作,非常方便。安装也很简单,一条命令就能搞定。 第二步,安装 note js, 这是 openclaw 运行的必要环境。在乌班图上安装 openclaw 也很简单,运行这几行命令,当命令行成功,显示版本号就说明安装成功了。 第三步,安装 openclaw, 依旧是执行一条命令,然后等待安装完成即可。安装成功后执行以下命令验证,如果显示版本号,说明你已经安装成功了,是不是没有想象中那么复杂?第四步,出场配置。 这一步我们就要真正启动龙虾了。在终端输入这条命令,接下来系统会进入一个引导式的配置流程,基本上就是一步一步按提示选择就行。第一步会给你确认一条提示, open klo 功能很强,也存在一定的风险。如果你明白这一点,直接输入 yes, 继续即可。 第二步,选择启动模式,我们直接选择 quickstart。 第三步,选择模型提供商,这里可以看到龙虾已经默认集成了很多模型平台,我们直接选择火山引擎。 第四步,接入我们刚刚订阅的方舟 coding plan, 粘贴之前创建好的 apik, 选择要使用的大墨镜。 接着我们还要依次选择消息通道、搜索提供商、 skills 等配置,但都可以选择 skip for now, 稍后再设置。全部配置完成之后, open cloud 就 会自动启动,并生成一个本地外部控制台地址。 在浏览器打开这个地址且成功显示这个页面,就说明你的第一只龙虾已经跑起来了。接着我们转移到另一台电脑,在命令行窗口通过 ssh 登录这台龙虾主机,登录成功后,输入这行命令,就可以通过本地命令行控制这只龙虾了。嗨,你是谁?你是什么模型? 待龙虾响应之后,说明整个部署阶段就已经完成了,你的龙虾就已经可以在本地正常运行了。哇,能和你一起把龙虾部署成功,我真的非常荣幸!任何新工具、新技术都需要我们一起探索实操。这期节目是我们龙虾宇宙系列视频的第一期, 也只是玩转 open cloud 能力的冰山一角,后续我会带你一步步深入,把龙虾的玩法彻底吃透。如果在这个过程中遇到了任何问题,欢迎在评论区留言,我会尽量帮你解决。老规矩,本期详细的文档笔记我都给你 整理好了。智能只是手段,人类才是答案。这里是头哥你再来,我们下期再见!拜拜!

这期视频,我们聊聊怎么用 cloud 控制智能设备。控制智能设备,最关键的一步是拿到设备的控制权限。以小米温湿度计为例, 你想获取它的毒素,但小米并没有开放这类的接口,你很难获取。那怎么解决?这个时候, home assistant 就 派上了用场。 ha 是 一个开源的智能家居平台,它专门做了各大平台的设备集成,支持米家、苹果、 homekit、 涂鸦等一系列的主流设备。 它帮你把各个设备的协议进行的统一,你只需要授权给 ha, 就 能通过 ha 的 接口访问和控制所有设备。所以,而 oppo cloud 的 对接, ha 理论上就能通过 ha 控制所有的设备。但实际跑起来,问题很快就来了。我发现 oppo cloud 的 经常会遗忘我们对接的 ha 什么意思? 假如我问他房间的温度是多少,他不是去温湿度计去读取数据,而是走天气接口,甚至连地理位置都不对,这很离谱,对吧?在 open log 的 架构里, agent 采用的是 react 模式,先推理再行动。 当用户问温度是多少时,模型会先思考我该用什么工具。但问题来了,他并不知道自己有哪些设备可以用。 你说使用 home assistant 查看房间的温度,它能正确获取,但不加 h a 的 这个条件,它就开始自由发挥了。所以,当用户问温度的时候,模型一推理温度,我可以通过天气的 api 来获取,这并不是我们想要的结果。 而且在 h a 里面,一个设备往往会被分为多个实体,不同实体可能有类似的功能,这就更加容易造成查询的混乱。 那怎么解决?我想到了一个思路是,与其让 opcode 记住设备,不如让设备自己生命能力。 具体的做法是把每个设备分装成一个独立的 skill。 每个 skill 其实是有两部分核心内容的,第一部分是描述用自然语言告诉 agent 这个 skill 能做什么。第二部分是实现具体的调用逻辑,比如调用哪个 api, 跑什么脚本, 都不可傲的知道温湿度计是一个 skill, 并且他描述是读取温湿度的数据,他就明白用户问房间温度时,我就应该调用这个 skill。 而且根据 astropic 对 skill 的 设计, skill 的 使用是渐进式频读的。传统的其实是做法是把所有的信息一次性塞给大模型, 几十个设备偷看很浪费不说, aint 也容易被批量的信息搞晕。渐进式频读的好处时不主动加载所有 skill, 先用 skill 的 描述信息进行筛选,在需要时才动态加载 用户用温度才加载温湿度计的 skill。 问 pm 二点五才加载空气净化器的 skill, 这不仅节省 token, 还 a 技能的决策更加精准快速。 但如果我有十个二十个设备,难道手动一个个注册 skill 吗?这也太不优雅了。于是我又把这部分逻辑封装成了一个 h a manage skill, 由它来控制管理所有的子设备。 h a manage 的 核心能力有两点,第一个是自动发现设备, h a manager 会调用 homeworks 的 a p i 拉取所有的实体,然后根据设备的 id 将多个实体合并为一个设备,自动解析每个设备的能力。 第二,它自动生成 skill, 它会根据各个实体的功能自动生成对应的 skill 描述文件。这样的设计好处是不需要为每个设备写 skill, h a manager 根据规则和设备信息自动生成对应的 skill。 为了方便管理和共享,我为设备的 skill 单独建立了一个仓库, 这里有一个优先匹配的设计精确匹配模式,比如小米温湿度计。仓库里有这么一个 skill 模板,就用匹配的专用模板直接下载 skill, 后续 skill 有 优化迭代,就可以直接同步更新。 第二是动态生成兜底。假如没有匹配到的模板, h a manager 会根据实体的功能,结合预设的规则模板动态生成 skill 描述。说了这么多,那我们一起来实战一下吧。 安装过程呢,很简单,直接把 github 的 仓库地址发给 opencloud, 跟他说安装 opencloud 会自动根据引导完成配置,它会让你先输入 h a 的 访问地址和长令牌的 token。 整个过程呢,不需要手动配置任何设备,完全是自动化的。 我们来测试一下它的效果,现在房间的温度是多少,可以看到它能准确地找到设备并获取读数。 测试一下它的控制能力,把空气净化器开大一点,它很智能的将风扇调到了更快的转速。这就是我一点零版的 opencloud 的 设备控制方案。 核心逻辑其实很简单,设备不是被管理的对象,而是被声明的能力。把设备封装成 skill, 解决了一进的遗忘设备的问题,从而 h a manage 的 自动发现加动态生成,降低了多设备的管理成本。 当然,这个方案也可能有不少的问题,有不少的优化空间,权当抛砖引玉,期待和大家一起探讨更多的可能性。项目的具体地址呢?我已经放在了我的主页,如果你对 ai 自控感兴趣,欢迎关注我,我是习特胡,我们下期见。

嗯,今天我对这个问题进行一个讲解啊,就是你用呃 openclock, 你 会发现就是前阵子其实还可以的,现在应该涉及到安全的问题,它这里在你 windows 系统上,它不能直接让你使用需要工具了,就是它自己如果让它使用 读取文件或执行命令呢?他会给你提示没有这些工具,就是比如说他本来是可以自己写脚本,然后自己来执行的,就你告诉他方案,他就可以执行,然后现在他是把这些权限是关掉的。然后我们 windows 系统应该怎么把这个权限改一下呢?就是你可以手动改下配置,不然他每次都会让你,呃,这样你看 让你创建一个文件,然后运行,他每次都会让你这样,这个是 windows 权限上的问题,然后我们今天要把这个权限开放给他,然后我这边做一个简单的讲解。 然后首先呢,你大部分人他本地系统的 openclaw, 他 应该是安装在 c 盘目录下的,除非你改过了在这个用户。然后这里,这里应该找到 openclaw 的 文件包的位置,在这儿有个文件叫 openclaw, 点 jason 文件,这个 这个我就不直接打开给你们看了,我现在在这个位置,因为上面有一些个人的一些信息,还有 token 之类的。在这里,在 a 键子下面这有个 tools, 如果没有,你可以把它加上 tools 这一栏,按照我这个要求写。 记住了,这边是有逗号的 profile, 等于 four, 然后这里权限也给了 four, 就 权限都给了它之后呢?然后你就会发现,嗯,我给你们看下飞出界面吧,上面一直是卡着的,然后权限给到它之后呢?它就可以加载新的工具权限了。你看一下,给它权 限之后,它就可以自己读脚本,然后自己写写脚本,读取文件, 然后差不多就是这里了。主要是大部分人网上也没有类似的教程,大部分人他不知道 open curl 没有权限, windows 没有权限应该怎么改?他改到就是在这个 open curl 点 json, 点 json 文件这个位置,把它权限给到他,然后就可以了。 还有个点就是它有个 settings 剪辑,我不确定这个文件跟那个权限没有什么关系,但是目前的话应该是打开这里就可以了。 settings 剪辑的话我今天早上也问了一下,在在这里 我找一下进入的文,进入的 应该可以,进吧 settings 点节省。

这一节我们来讲一讲,最近比较爆火,准确来说应该是二零二五年底就已经慢慢火起来了。这个 open color 啊, open color 呢,改名改了很多次啊,反正它这个图标就没怎么改,大家记住那只龙虾就可以了。 一句话,这个是一个本地运行的一个 ai 执行助手啊,以前我们老说问答问答啊,有问答的一个助手,他这个是执行啊, 以前是光说不练对不对?现在就是你一句话他就可以给你干活啊。但是底层的原理不是本杰探讨的这个呃,方向啊, 反正无非就是调用各种,像类似于工作流,调用各种工具,你可以这么理解啊,是模型也好啊,当然你跟他对话的这种啊,他的理解这种,你都是通过这个大模型来实现的。 那一般约定书城的啊,大家都称为这是一个本地的一个 ai 智能器框架啊,是奥,奥地利的一个一个个人开发者啊,开发的 也就是如果用过这个 pspd f kit 啊这一套工具级的话,应该。呃,多多少少有一点了解啊, 也就是它的这个口号呢,就是说只要你能描述出来啊,我就能做啊,它就是真正能做事的。这种 ai 定位就是本地优先,所谓的本地优先,你像现在啊,我们无论是啊, 是是用 deepsea, 用千问等等啊,反正这个 cloud 啊,等等啊,或者 qgbtgrm 等等,这些 大部分还是租用的云端的一个算力,那多多少少大家会有这个安全上面的一个焦虑,数据安全间上的一个焦虑啊,怎么说我这个数据很显然是要上传到这些这些模型,他既然要去理解你的这个意图, 呃,你把数据也喂给他,他肯定是知道你这个数据了,那他给你存起来怎么办?是不是?这就是一个一种焦虑? 那这个 openclaw 呢?它这块它是本地优先,也就是说它完全就是把数据是放在本地,因为你可以用本地的这种模型,当然之前的那个问答这一块呢,它也是可以用本地的模型,对不对啊?只不过说你这个算力 记得有充足的一个准备,你要想获得很好的一个使用体验,你的算力一定得够够强大啊,而不是说然后就是他们集时集的这一个现一个现存就可以搞定的啊。 那本地它可以在啊,这些跨平台的嘛,就是这个 windows、 mac os, 因为它可以用多壳部署,所以它跨平台这块它是没什么问题的啊,甚至是树莓,树莓派都可以部署啊,那这个数据就全部在本地不上云啊。 所以他这块能够做的一般来说都是一些自动化啊,也就是你直接描述他具体去做啊,不用你一步一步的去点。 那你之前的一种使用方式就是你问他之后啊,问了这个 ai 助手之后,那他给你一个答案,然后你照这个这个答案,照葫芦画瓢,自得自己去做,对不对? 现在他可以自己做啊,就是你问他,他也给你回答出来了,并且他把他按照他那个回答出来去实践一遍啊,去给你操作一遍。 比方说办公证的话,这样一个场景,哎,对邮件自动进行分类呀,回复啊啊,包括清理啊,发这种带附件的。这种邮件啊,你直接就就说一下,比如给某某某发一封什么什么样的一个邮件, 哎,将这个邮件自动分类一下啊,回复啊,某某啊,嗯,某某发件人发的某某主题的这个邮件。回复一下啊,内容是什么 文件啊?就是文件这方面,还可以整理桌面啊,对文件进行批量重命名,规档啊,读写文档这这些,但是你得给他权限啊,就并不是说他所有的啊,目前呢,他是在某个一个一个特定的一个目录 or space 下面,他可以实现这个 啊,它不是说你系统所有的目录下面我都有选项,就像那个 linux 上面你,你非入的用户,你就不能操作入用户,它的那些路径对不对? 还有日程报表啊,就是什么生成数据清洗,生成 excel, ppt 啊,自动化周报脚本啊,它可以自动去执行这个 share 啊,跑这个代码啊,不属多不属多口, 设备与网页控制,他可以操作浏览器,别人填表,填表单,排序一些数据啊,自动浏览啊,甚至可以帮你干一些啊,就是那些秘书部助理啊,干的一些活。就是什么预定机票啊,餐厅 控制软件啊,你想记笔记,操作某某软件啊,这样 ofsted 这些可以记,就是笔记软件到这 get up 这个网站上面去提一手啊,还有 spotspotify 啊,来放音乐 啊,智能家居,比如联动的,像进行一些 h o e 的 一些灯光,智能设备的一个控制,还有跨平台的交互, 要是说即时通讯软件像啊,微信,企微信肯定跟企微信啊,这都是一,都是一加的。还有这个飞书, ding, ding, telegram 啊, discord 啊,就是唤醒啊,群内自动回复啊,发送这个指令。 在这个跨平台这块,它是多端统一入口啊,它不用切换这个 app 啊,你在哪里都可以都能指挥指挥这个电脑。比方说你手机上面 啊,通过飞书你发一条指令,那么它就可以操作你的远程的那个电脑边,你在家,你用手机在飞书上发一个指令,那飞书就发到你远程的这个办公电脑上面啊,那它就 你这个指令,他直接在这个你的远程电脑上面去执行啊。人家说,哎,我手机上没有这个邮件,但是这个邮件啊,没有某份文件,但是这份文件呢,在我的那个办公电脑上面,我现在想获取到他,你可以说发一个指令,让他给你发过来, 相当于他能听得懂你这个话,并且他的最主要的是他一个实干家,他能帮你做这些活, 还定时执行啊,长期记,并且长期记这块,它可以记住你的习惯偏好、历史任务啊,就是你跟它,你就是跟你有一个磨合期,你这个磨合期过了,你啊越用越顺手啊。 在这个 skiers 这种市场,它有一些社区的插件工作流,并且你自己也可以写这个 skier 啊,就是这个技能, 还有一些子的智能体,就是生成子的 agent 协同处理这个复杂的任务 啊,那跟这个些主流的 ai 智能体像 q i g p t 啊啊,无论国内的 deepsea 啊,千问智普啊,豆包啊等等, cloud, 凹凸 g g p t 有 什么区别? 就是前者呢,他是一个回答者,这就是 opcode, 他 是一个执行者,然后面的这些掐 gpt 这些之类的都是一个回答者啊, 回答者他就是给你方法啊,写这个内容,回答问题,这就只说不做 opcode, 他 是就是直接执行操作你的电脑,完成任务啊,就是他就是真正的会去动手啊。 那这下面它是一个详细的一个对比啊,大家可以了解一下最主要的数据隐私这块。它 是啊,当然你这些其他的,你也只要你本地算力够,你也可以保证这个数据你可以在本地它运行,你这些模型对不对? 也不存在啊,我非得要在云端去进行存储,但是现在主流的玩法都是在这个云端,云端存储啊,就是在云服务商里面去租赁这样那些无论是算力啊还是模型,就是类似就是一站式的这种应用的镜像啊, 那都是租用的,就是在云端。 openclock, 它的核心能力就是操作电脑啊,执行任务自动化啊,那以前的这种我们大家所熟知的都是进行问答创作,进行查询啊,那你直接一句话它就给你干活了。 所以适用的场景主要就是个人办公啊,设备控制,本地自动化啊,需要进行本地部署啊,懂一点,懂一点。这个技术 成本这块呢,是可以免费的啊,就是你只要只要投入这个本地算力这一块, 所以很显然它的一个优点就是隐私性比较强,执行力比较强。主要是执行啊,真正的解放双手,能实现这种自动化。 呃,并且开源,开源免费,现在它已经成为 github 的。 呃,第一个 top one 啊,这种最受欢迎的一个项目应该是已经二十多万吧,二十多万 star 啊, 插件也比较多,那这个好处就是关注人的好多的好处就是社区比较活跃,就有不断的有这个插件,那新的插件诞生, 缺点那肯定就是你得动他的这种部署啊,配置,包括他出错了啊,你能够有这种排障的这种能力啊,就能够能够解决解决这种能力, 毕竟是啊,才出来不久,就是在这方面他肯定还是有一些缺陷的,并不是说是尽善尽美啊,十分完美的一个开源的一个智能体啊, 对于一些高权限的一些操作啊,就存在这种误操作的可能性啊,比方说他会删文件啊,搞风系统这些,这还是要做好这个权限的管控,当然他也提供这样的一些能力。 模型一代呢,就是讲对接的这些模型啊,但我们现在都说的是本地本地部署啊,你可以用 vr 啊之类的,欧拉玛也当然也可以, 但是真正玩的话,你肯定还是要搞一个生产级别的啊,生产级别的 啊,管控比较灵活的这些推理引擎就是这个还是跟那个,你之前做那个 ray 呀,做那个 m c p, 它这种模型 啊,它那个套路还是一样的,也就是它本质呢,还是要因为对自然语言,语言的理解,必须要依赖这个大模型,对不对? 好,那接下来我们来了解一下这个 openclot, 它的一个部署啊,你部署呢?你可以用这 三类的操作系统啊,就是 windows, mac 还有 linux 这操作系统内存你至少要大于八 g 啊,硬盘这块当然还有显存,你本地本地运行这些啊, 这个显存建议不低于啊,不低于十六 g 啊,不低于十六 g, 你 要想获得一个好的体验的话, 那部署 open color 呢?我们可以用多可的部署,因为它是用这个,呃,是 node js 的 一个应用,你也可以用 npm 来进行安装, 用多款部署它的一个好处就是对新手比较友好,你直接拉取这个音箱就可以了,哎,然后你创建本地的数据目录啊,存,存储这些配置和任务的一些数数, 任务的一些数据都是存在本地的。那这是在 windows 上面运行,包括 mac 和 linux 上面运行,这是两条命令啊,所以你看这是很很简单,就是把它这个里面 在你本地选择一个一一个目录挂载到这个 app 杠 date 这下面去啊,指定这个镜像,它可以对它进行一个抽象原貌部署呢,就是 这个 open call 啊,这块呢,这是用这个 python 啊, python 这个 准确的说啊,就像这个还是用这个 n p m in store 啊, n p m in store, 用这种方式,那这下面的就不要考虑了啊,尽量不要考虑这种,这种方式用多可,要么就是用这个 n p m in store 这种方式 就是我们在使用的时候就是还是得注意这个高权限的一些任务啊,我们不要随意的交由他去执行啊,避免这种误操作。 好,这是这一节内容啊。

一句话就能让龙虾处理电脑上的文件?分享一个今天用国产欧文可露有道龙虾的办公案例,合并视频,最近做了五个有道龙虾的视频教程,现在要把它合并在一起, 我就给有道龙家说了一句话,合并文件,家里的视频不到两分钟他就自动合并完成了,这我真的很兴奋,因为合并视频这里琐碎的工作很简单,谁都能做,但是就是麻烦,要打开剪映、导入视频,合并视频等等等,需要五六个动作。 而现在用了国产 oppo 可乐,只要一句话就能任务就完成了,就像雇了一个小助手为我们做一些琐碎的事情,让我们有更多的精力放在喜欢的事情上,这种感觉真是太少了,强烈建议大家去体验一下。