今天呢我们继续为大家去讲解 open cloud 的 进阶版有什么样的能力,它能做什么,它不能做什么,以及怎么样基于它去二次开发打造属于我们自己的这样的一个 ai 产品, 七乘二十四小时的这一个 ai 助手。首先呢我们首先我们还是来重温一遍一个 opencloud, 它是什么? opencloud 它是一个可以运行在你自己的这一个设备上面的这一个 ai 个人助手。 然后其实可以通过你已经使用的这个聊天渠道,比如说 telegram, 比如说 whatsapp、 whatsapp, discord, 或者是谷歌 chat, 或者是 imessage, 以及 win microsoft team 些 im 聊天软件来回答你的问题。 那么它是怎么样开发出来的呢?其实它也有自己的这准确的这一个演进的历程, 包括比如说它先是由这一个 whats app relay 这种原型,然后逐步的演演变过来,它开始是叫 cloud bot, 然后之后改名为这一个 mod bot 以及这个 open cloud。 同时的其实它的核心另外其实用户群体是给这个个人用户来进行使用的那部署部署的模式是采用这个本地优先的这个方式运行环境的话是 目前限制在这个 macos、 linux 和这个 windows 等操作系统里面,然后 windows 部署的话,其实一般要用这个 wsl 这个来进行运行, 然后它的这个价值是进一步的把这个大模型只是对话的这个能力,然后演变成个人真正能够干事情的这样一个个人的助手。我们可以来总结一下它的基本的这个定义的,它其实是给个人用户使用的,然后企业来用的话还是比较的 困难的,因为它的一些安全性问题,它的一些权限的问题,它的一些可信的问题,以及相关的费用的问题,其实是不太可控的,它准确来说还是不能太可控。 那么 opencloud 到底能做什么呢?它第一它能够做的事情是有这一个多渠道的这个信息信息管理。那比如说你可以通过 app, 通过 telegram, 通过 discord, 通过 slike, 通过这个 sig 呢,通过这个 ms 或者是 microsoft teams, 或者飞书或者谷歌来去跟它来进行这一个对接。 这里的话 whatsapp 它一般选用的是这一个 bellace 这样的一个实现方式,然后 gram 它选用的是这一个 grammy bot api, 这种方式是最便捷的,容易最容易去实现的。还有这一个 discard 是使用对应的这样的一个模式,而我们可以看到其实他是在国外的一款项目产品,他不是国内的,国内的如果你要去做国内的软件对接的,基本上要开发对应的插件, 比如说飞书这里他要开发对应的这个插件来进行插件的支持。而其次的话的这个列表的这个工具,他目前他自己原生自带的这个工具有这一个 example, 执行这个 shell 命令的这一种工具。相对来说之所以不在企业里面赋予这种权限,就是因为它的这一个权限太高了, 然后会给企业的这个说电脑或者云服务器带来很高的这个风险,因为它是直接是系统层的这个命令, 说你一旦你的这一个嗯服务器跑的业务,然后通过 shell 然后把你搞挂了,你比如腾讯里面用你微信,突然有一天不能用了,那会面临大量的人卸载或者吐槽微信,这是极大的一个影响。 然后这个 browser 就是 这个浏览器自动化的操作,还有这 canvas 就是 节点化步的这个控制 node 多设备节点的管理, 还有这 crown 是 定时任务调度, memory search、 记忆语义搜索,当然还有其他一些小的这些工具执行的能力。 web search 或者是 webfaffet 就是 网页内容抓取或者网页的搜索, 还有 message 级的这个能力,是跨渠道的消息发送等等这些能力。当然这些工具的执行它是会有一个更加 嗯,更加广阔的天地,是你可以去开始开发这些的工具的,然后会让他的能力越越来越强。工具层面,记忆系统层面,记忆系统层面的他是以什么形式呢?他上节课也讲到了 记忆不同于这个上下文,他是以这个 markdown 文件来进行存储的,每天去给用户的这个对话存储一个 markdown, 然后方便大模型要进行后续的这一个 开发和对接的时候的,那么它或者是能够帮助你去调用原来某一天的这一个 markdown 的 这一个文件, 同时它也支持这一个向量的语义搜索,支持比如说 open ai 和 gemina 以及本地的一些模型的这个嵌入,但是它这里 原来的模型有一个限制,你看到它这里其实是不支持这一个国原生支持国内的这个模型的接入的。如果你要接入国内的模型的话,是你要做一些相应的配置,然后才能够实现国内的模型的这个接入 支持的这一个搜索其实是支持这一个 b m 二五和这个向量搜索,那 b m 二五比如说它是关键词搜索,然后这个向量的话其实就是相似度这种类似于这种搜索两者来结合。 另外的话支持这个自动记忆的这个刷新,包括压缩前来触发这一个保存的这个机制,保证这个记忆系统的稳定性和可能性。 而技能系统的它是采取了这个三层的这无限级的管理的机制,比如说工作区托管和这个内置三层的这一个架构,同时它们也支持这个环境变量的注入,那么我们可以灵活的去配置这一个不同技能系统的这种行的参数。 其次的话依赖这一个呃,可以进行自动的这个检测这个新环境的稳定性,比如说 bose 或者 e n v 的 这种依赖,它可以自动检测。还有它有自己的这个生态,它有这个 cloud hub 的 这个生态,在这个公共的技能和插件的物可以去进行 去开发,然后它是有公共的这个技能去做这个注册。而节点的这一个系统它其实还有这个相应的,比如说这呃 mac os 的 这个 app 语音的这个唤醒菜单栏的控制。 另外 ios 和安卓的这个 node campus 或者是相机录屏远程节点这些可以执行这个命令, 那是他有很多能做或者不能做的地方。能做的地方就是第一个他无法直接的控制这个手机的 u i, 他 需要借助外部的这个工具,所以他现在目前只能控制这个电脑和这个云服务器。第二点他是不支持这个实时视频流的处理的,目前他们 目前是不支持和高并发的,支持音频的这个解码,那你没有办法说给他发视频或者发语音,他就能够自动的帮你去读懂。当然有部分的功能是因为在这一个聊天软件的机器人,他已经实现了这个语音转文字的这样一个能力。 这个的话强依赖这一个环境的,他基本上就依赖这个电脑或者是这个云环境,一定要依赖这个强网络,一定要在有网络的情况下才能够去稳定的运行。另外的话就是他的任务成功率其实目前来看不是那么的高,不能够像这一个 curser winserve 这样的一个编程类的这个 a 这一个 ai 软件一样任务的成功率那么的精确,那么的高, 他是受这个环境的稳定性和模型的理解能力所限制,存在极大的这个失败的效率。其次的话成本也是比较高的。另外的话有多方面的限制,比如说他针对复杂的多步骤任务的失败或者偏离这个目标。 其次就是这个长长时间的这个运行的时候会面临一个问题,就是上下文会耗尽,然后一个循环,然后会用户的这个 token, 这就是这个企业级部署的话,是缺乏企业级的这多租户的支持。 然后设计也存在诸多的问题,还有它的这个安全风险的问题,都会有很多的安全风险问题,比如说这个间接提示注入的这个风险,如果输入不经过验证的话,可能会被注入恶意指令,然后执行未授权的这个操作,所以是一个非常高风险的一个地方。 那么你想想一个贾维斯,他也有可能是对部署者联盟二里面的这一个反派奥创,那么如果贾维斯一天,某一天变成奥创,他在你的系统里面去注入这个毁灭的程序, 就像奥创要毁灭人类一样,那么带给你的这个风险和损失是不可估量的。其实的话权限是太高了, 他又能操控你一切的电脑上面的,比如说你的银行,银行卡密码,你存储的所有的这个东西,敏感的东西他都知道,那么这其实是一个非常高的一个权限, 你应该要做好这个权限的收敛。另外的话还缺乏缺乏这个沙箱的这个隔离环境,比如说这个 zap 的 工具是默认在这个宿主机环境里面运行的,存在这个逃逸的风险。那么我们在讲完这一个相关的这个风险之后,我们再来详细的分析 opencloud 到底 为什么那么爆火,然后为什么那么多人在鼓吹它,同时的话又它有哪些擅长的?它有哪些不擅长的? 那么擅长的话其实我们可以看到第一个它有一些价格优势,首先它用单一的这个 getaway 控制的平面去统一所有的这个渠道聊天软件,那么实现了其他的这个定性化的部署。 这一个项目可以对接微信,可以对接钉钉,可以对接 telegram, 可以 对接这个 whatsapp, 可以 对接所有的这个 app, 可以 对接所有的这个消息。转给 这个大模型,让大模型调扮演好这个对应的 a 镜的角色去完成对应的任务,所以它是有这个统一的 get 位的这个平面,这是它的一个技术价格优势。第二点呢是使量实现了这模块化的这个插件系统, 那比如说你的渠道、你的工具,你的技能,都能够根据你的需求向外去对接,做做好灵活的可扩展。三点的话,它实现了很好的本地的这一个优先设计。因为我们在使用 ai 的 过程中,绝大多数的情况下面你的数据一定不属于你自己, 你你所有的记忆都是属于这一个云厂商或者模型厂商。那么这时候的话带来一个点就是一旦哪一天模型厂商不对你再提供服务了,或者是你不决定不再付费了,那你你所有的这个个人的生产资料和上下文 都会面临一个丢失的风险。在现在来看可能不算很大的这一个经济损失,但如果长期来看,他一定是你个人很大很大的一个经济损失。因为未来的公司竞争力和未来的这个人竞争力,他不在于你有多少钱,他可能是在于你有多少根 ai 对 话的这个上下文,并且由你自己掌控,你自己了解,这是非常非常关键的,因为未来的 ai 就 代表了生产力,而你输入了多少的这个 token, 就 代表了你会有多少这个产出,你有多少的资源。所以这个数据存储在本地是对个人是非常 关键的,同时他也能够保证你个人的这个隐私安全,可以实现安全可控。另外的话还实现了一个持久的这这也是一个比较大的创新点,就比如说用户可以 呃之前的话的上下文,其实是不能跨对话的,上下文是有限制的,达到一百万上下文可能是已经是国内第一个 顶尖的这一个软件的,这就是大模型的这种水平了。然后他而他选用了一种持久记忆能力,他把你每一天的对话,然后形成一个 markdown, 然后存储在他的这个 mark memory 的 这个文件夹里面。每一天他需要去多轮对话的时候,他可以去调取某一天的这一个 记忆的这个 mark markdown 的 这个文件,然后保证这个交互是连贯的,所以他就能够实现七成二十四小时的为你淡定,为你服务,就像为你定制化的一样。 同时他也支持这个定制人人格的这个设定,你在初期的时候,你跟他进行对话的时候,他可以定制你个人助手,你个人的蒋维斯,他的性格满足你个性化的这个需求。 另外的话,多渠道的这个整合,一个助手可以有多个入口,并且心跳这个机制是保持连接情不稳定的。那你可可能你到时候去用微信跟他聊会天,让工作的时候你用飞书,你跟他聊会天,他都是可以保持这个稳定的这个跳机制保证他稳定可靠, 这是他的一些优点。比如说实现了这种解偶,实现了这种统一管理,实现了这种长久上下文,实现了这一个个人数据的有效的存储,这是他的这一个很好的一个创新点。另外的话还有他的一些优优点,比如说他,嗯 开发的这一个友好度,你它是用这个 type script 来实现这个类型的安全,而且比较容易这初学者去理解。同时它它的文档,它的这个活跃社区,它的开源都是支持的是比较好的, 但是它同时存在了诸多的问题。这里的问题呢,我们可以看到第一点的话系统稳定性的这一个挑战。 首先呢为什么会存在这样的呢?第一点就是说它会面临一个快速崩溃的一个现象,比如四条消息之后,它就会存在停止响应,这你可以去分析它的这个 open cloud, 它的这个开源的代码,它会存在这样的一个现象, 这个心跳机制间隔设置会比较激进。第二点的话是长上下文耗尽的长对话的话会丢失这个记忆,因为他没有设置这个上下文的这个限制,导致用户没有办法继续的去延续上次这个话题。 第三点呢,就是这个逻辑循环存在一个死锁,那比如在处理特定的这个指令的时候,智能体可能会陷入无限的循环,导致这个资源占用 飙升,它会容易循环,然后你的这一个 token, 你 购买的 token 迅速被消耗完。另外的话它存在一个复杂任务处理的能力,那我们在做了大量的测试, 呃,在解决了这所有的硬件资源问题,解决了所有的大模型的问题,解决了所有的这一个 m c p 的 这个开发对接的问题,解决了所有工具和 skills 的 这些功能开发对接的问题。但是它还会 已经给他提供最优的环境。之后他还会存在很多问题,就是多步骤规划失败,那么在需要多步骤拆分拆解的这样的一个复杂的任务过程中,会容易出现这个逻辑断裂,偏离这一个最终的目标,这也是他自己的最终的这个问题的体现。 其次的话就是他存在一个现象,就是呃人格的这个漂移,在对话多轮的这个任务之后,那么一个人的助手他容易逐渐丢失,最开始你给他设定好的这个性格回复的这一个风格趋向趋向于相同的这个答案。另外就是这个技能加载是非常不稳定的, 在你动态的加载这个功能技能的时候,会存在一个延迟和失败,进而影响这一个任务执行的这个连贯性。其次的话之所以不能够被大众接受,还存在于一个关键点就是在于的配置过于的复杂,那么配置项是比较多的,新手的入门的门槛还是比较高。 其次就是他的这个开源项目里面的官方文档是比较方便另外的缺乏统一的这个一键部署的这便携式的方案。 安全配置这一块的话,默认配置权限过高,刚刚也提到了不够安全。其次就是杀枪功能需要手动起用,也增加了用户的这个配置难度。另外的话权限模型相对来说比较复杂,配置容易出错, 也就是为什么现在 openclaw 已经出来有一段时间了,但它的思路的确也还可以,但是它没有基于这个 openclaw 去做出一款很爆的这个产品。另外所有开源的项目它之所以开源肯定是有它的局限性和不能够解决的问题, 如果他已经能够做出一款能够商业化的产品的话,其实他大概率不会选择开源乔布斯,他当时也数的很正确,就是尽可能的让用户减少选择的成本,思考成本,你把这个技术给用户隐藏掉,交给用户的就是更加人性化的、自然化的、直觉化的这个交互的 方式,那么你的这个产品才是一款好产品。所以我们的我们如果要去做这个改进的,我们首先 我们在他的原型的基础上面,我们要去开发这个新的技能,包括他不是万能的,他核心的能力其实就是要去依赖这个技能和插件以及这一个 ai 的 工具。那么你要开发对应的这个技能,扩展 新的技能,就可以去进行这一个技能的开发,包括你去找到这一个 open class skills my skill, 创建这个文档,然后去定义好这个技能的 skill 的 点, m, d, e, 然后定义好 ev 的 这个环境变量,同时再去写好这个 script 执行的这个 脚本。那这一个 skills 的 这个格式的话,基本上就是第一个名字 my skill 描述 description, 我的自定义技能上面的是这一个 meta data, 就是 这一个不同的这个技能的以及它的使用方法。然后它的优点是不需要去修改 opencloud 核心的代码,可以独立地部署发布到这个 cloudhub 这个网站上面去给别人来进行使用。 而且升级这个 openclou 的 话,不会影响所有的这个技能,相当于是跟 openclou 是 完全结偶,但是它也有一定的这一个缺点,那么它的这个缺点就是只能作为只能通过这一个一个 zank。 我 们之前说了这个 openclou 它的这个执行命令就是用 shell 命令来行调用的, 它无法去修改这一个 opencll 核心的这一个行为。而第二个方式的话就是你去开发一个这个插件,那么你添加这个新的渠道,或者是添加新的工具 m c p 的 这种工具,这里头是 你可以在这一个 extensions 找到 my plugin 去新建一个项目,然后你去新建这个 package, 点击 action 这样的一个文件,或者 opencll in 的 这个 json 文件,然后再去新建对应的这个 s r c index 或者 skills my skills 点 md, 这样的话你可以去注册新的这个工具,并且可以添加新的渠道, 但是它的它必须要与这一个原来的这个核心系统深度的集成。缺点就是你要第一你要有编程基础,你要了解这个 type script。 第二点的话你要遵循 opencloud 它的这个插件的开发规范。四就是你有可能会 opencloud 升级的时候,你会受它升级的版本存在这一个影响,这是它的缺点。第三点的话是直接修改这一个 opencloud 它的核心代码, 那么它这一点的话就是你需要去基于这个 opencloud 完全去研发出自己的这个产品,自己的这个 ai 助手。这时候的需要首先你先把这个项目给克隆下来,然后去安装这个 npm, 它的这个好处是在于你可以完全 可控控制,然后你可以修改任何这个项目的行为。但它缺点的话是你需要持续的去合并 它上游的这个更新的这个版本和功能,它的维护成本相对来说会比较高,这里的话通过对接外部系统的这样的一个视力,包括这一个通过这个 zap 的 工具, 通过这个上命令去执行和,以及通过这个遵循这个 mcp 协议的这个服务器,然后进行远程的这个标准化的远程调用, 或者通过这个 webhook, http webhook, 然后去触发 web 的 这个服务。它整个的这个流程其实就是去对接用户发送信息,然后 get away 去接收,然后去理解意图,然后执行。 总共的是我们给了个建议的话,是适用的点是目前它适用的更多的价值是在于个人的这个 ai 助手和日常管理开发者的这个原型验证和快速迭代,以及技术爱好者的这个学习项目和探索。 慎用的这个场景建议不要使用,场景是这一个企业级的大规模高开发的部署,还有这个需要百分之百可信的关键业务和场景,以及完全非技术的这用户的这个开箱即用的这个环境,这是 不太好的,因为它毕竟是一个开源的项目,如果你真的想用的,可以等我们的,我们也会开发出一款 open cloud 商业化的这样一款产品,就像苹果 和这一个 linux 操作系统这样的一个差距,然后会去开发出来打造面向非技术用户也能够做到开箱即用,然后并且实现这一个直觉交互极致体验。那么如果你想去做二次开发的话,感兴趣的话也可以联系我们,然后可以跟我们进行沟通 或者是交流。如果你想做这个准确的二次开发的话,可以去优先使用这个 skills 或者 planking 方式去做这个功能的扩展式的开发,先不开发这个核心代码, 其次的话可以去做这个沙浆来进行这一个安全配置,然后控制它的这个工具调用调用权限,然后做好这个安全审计。 另外就是你在这个性能方面,你可以合理的去设置这个文的限制,然后调整这个芯片检心跳检测的这个机制间隔,并且定期的去清理历史的绘画数据来释放对应的内存,保证这一个 open cloud 它的这个运行的稳定性和可能性。 那么我们再去想就是说这个项目它到底会怎么能够开发出来的?它是怎么样实现这样的项目的?首先 就是 ai 的 终极目的还是去替代人,替代人就是以前人能干的活, ai 全部都能干,这就是 ai 的 第一定义。 我们近阶段的话, ai 主要是生活和生活在这个互联网和虚拟世界世界里面来,它还没有完全的从虚拟世界往这个现实世界里面来渗透,那么在人类的这个脑脑力劳动的话,基本上能够被 ai 替代百分之九十,所以这时候都是 传统的这个 chatbot, 它只能做说单人对话,没有准确的执行能力。然后它只能走这个大模型的这个厂商的单一的入口,然后过度的依赖这个大模型自己的这个云端部署。 而真正意义上的个人 ai 的 助手,它第一它要满足几个特征,第一必须要实现多轮对话和记忆,它要属于这个人的这一种的 agent。 第二点的话能够帮这个人去执行一系列的操作,那里的话可以看到 minus 这一个 cursor 或者 winsole 这样的产品,它基本上就能够做到这一点,而且呃, cursor 和 winsole 它是比较好的。 第二点的话就是这个多渠道的接入,它能够实现这个本地的优先存储这个相应个人的数据, 按这个长久化的记忆,然后实现多渠道的接入。而我们从这里来思考的时候,我们就可以看到 open cloud 它的这个心路历程,就是它是以这个 open cloud 的 这个解决方案,然后实现持久化的这个记忆, 并且通通过这个 map 到文档和这个向量搜索来实现这个持久化的记忆。同时的话它通过这个 zip 的 工具和这个技能系统, 还有这个工具系统让你实现这个有效的操作。另外通过 getaway 这种方式实现了统一的接入,并且它通过后台服务和这个心跳机制实现了这个长期的这样的在线,同时它也有对应的这个权限系统和沙箱环境机制来去做好了这个安全性。 那么我们在这样的一个模式下面去思考,我们怎么样能够保证开发的这一发出来一个项目能够超越 opencloud 它这个项目呢?首先 我们知道就是这里的这个项目,它其实本质上它还是只是一个 agent, 它并它并不比 minus 优秀多少,它也不比 cursor 和 body 这些优秀多少, 其实它本质上的它还是参考了这 cursor, windows server cloud, code agent, teams 或者 codex, 这或者是这个 call work 以及 minus 这种产品的, 我们可以参考,它肯定不是重新去发明的,它是一种有效的组合。第一次从低信原理去思考了个人 通常为什么需要这个 ai 对, 你可能打开微信的频率是打开豆包的频率的每天的十倍以上,那么这里呢?而打开豆包基本上也是一个聊天对话框,你打开微信也是一个聊天对话框, 从你这里想的话,那我继续这样思考的话,需要一个这样的 getaway, 这样的产品,这样的一个架构,然后助我不管是打开微信,打开这一个嗯音,打开飞书,我都会想到去找我的机器人聊聊天,那么这就实现了一个高频的应用场景。 第二点的话就是他要实现多轮对话和记忆,那么以前是依赖这个上下文,而现在的话就是其实本准确。我们来从根音来思考,大模型都能够读取这一个文档读取,并且大模型也有一定的这个向量搜索向量解锁的能力, 那么这个的话,假如我把用户每一次的对话,每一天的对话去存储成一个一个的文档,然后放在这个数据库里面做好存储,后面的话可以通过向量搜索的形式来去解锁对应相似的这个内容,然后再去回答用户的问题,那么我就可以实现这个大国型的长久的这个记忆。 第三点的话就是可执行操作,那个的话其实不太稀奇,包括这一个 cursor, windows server, minus 和所有的 agent 产品基本上都能够做到这一个 执行操作。当然它这里的创新点是在于它集成了这个 zack 工具,然后系统可以理论上可以去执行所有电脑和服务器上面所有的这个命令,因为它是 shell 级的级别的权限,它的权限非常非常的高,那最后一个创新它就实现了本地的这个优先。 我们大多数人都理解到,就是你跟豆包去对话,你跟下载 gpt 去对话,跟界面去对话,最终如果有一天这个大模型不给你免费使用了,或者是不给你使用了,那么你所有的数据,你所有的账号可能会面临一个消失, 而且你的这些数据其实本质上你存放在的这个数据是存放在豆包,存放在 pmi, 存放在这个元宝的这个云端的,你不是存在你自己的本地,你是不可控的。 所以而未来个人最宝贵的就是自己的数据,大模型他要为每个人服务,他就是需要数据,数据越优,他的这个效果就越好。 这时候我们想一点,我们要想一个办法帮他把自己的这个与大模型对话的这些内容存放在本地,这里就衍生出来了这呃这一个 项目的本地本地运行和这一个呃对话,以及这个记忆的这个库的本地的运行和存储,那么它在开发的制作过程中是用的这一个 ai 编程去开发出来的,它用的 ai 编程去开发,它通常非常喜欢用 对应的 type script 和这个 node js 以及这一个通信和存储,它用的是这个 webckey 的 和这一个 secure light 加 macdum 的 形式。当然 这也有个弊端,就是对于企业级的话,它其实不太适用,因为这这个存储的这一个数据库和是相来说不太商业化的,不太稳定的。 如果我们后面的需要去进行这一个改造的,那么我们其实是推荐你们用这一个语言去学习了解这个 type script 的 类型安全和这个 node 点 g s 二十二加,以及这一个通讯 webc 的 这个实时性,还有这个存储 secure 和 macdaw 这种文件,以及这一个啊会员模型和这个渠道去多去了解他们这个 sdk 的 这个开发, 然后架构原则。但如果我们想在这个基础上面继续去做好创新,我们可以仔细的思考和使用这个 open cloud 它有哪些弊端。第一的话它的安全性问题一定要得到解决,比如说权限的管控,比如说这一个沙箱的这个模拟运行, 比如说第一场哪些任务可以交给他来做,哪些任务不能交给他来做?二点的话是他的这一个完了,你还是能不能给用户做出效果。 那么 open cloud 这个项目其实目前时间来看,它不一定能给用户做的出大量的这个效果,你可能让它给你定时定定什么这个收发邮件啊,或者是定时的发发邮件任务呀,但是这里面 只占个人生活和生产,要做任务让个人产生疲惫和劳累的,这呃,互联网工作里面的很小很小的一部分,而且它还不一定稳定。这说的如果你想让它,因为它不稳定,所以你不敢把它很多事情让它去做,因为它不够的可靠, 所以这时候的我们核心的关键点除了让它安全之外,还要让它可靠。那么可靠的话,我们完全可以借鉴 cursor, 借鉴这个 windows, 它这种稳定型的这种 a 型的工具 来去参考它的意义,比如说第一去选用好最稳定的大模型,比如说 cloud, 第二点的话一定要做好这一个任务的这开景和任务的这格式化的这个参照,就不能够说只是通过这一个 微信和这个飞速的聊天代码框返还这个文字跟你交流,你不知道他在你的电脑上面,在你的云服务器上面执行是什么样子, 而他应该参考的一种方式是像维密斯特,像这个 curser 那 样的一个一个编程的,一个通用的一个编程办公的这样一个通用的工具来去让你实时的看到自己做做的效果是什么样子。那么未来的这个形式,其实比如说可能会是一个形式,就它会是一个 ai 眼镜,然后在人的眼睛上面有可能带一个智能戒指,然后每天要做的事情就是用语音的方式跟这个 ai 眼镜上面的云端大模型 a 镜去进行交流,然后自己可以通过眼镜上的屏幕实时看到这一个 a 镜帮自己做成了什么样子, 在自己的云服务器上面或电脑上面,或者是远程的手机、 ipad, 以及这嗯笔记本或者是智能,或者是这一个电子手表上面去做成什么样子,然后通过格式化的极简交互、直觉交互跟我们眼睛进行反馈,然后并且采用这一个确认或者是否认的这种机制, 那么且每一次做好一步之后,他一步一步的去完成,从而提升这一个可能性,同时每一步都展现出来一个结果返还给这一个用户,让他通过自己的戒指进行点击确认或者否认,击确认或者否认,快速的去进行这个办公或者是生活, 让用户真正的享受到未来生活的这一种定义。而我们也在研发这样的一款软件,这种软硬件包括他的智能戒指和这一个眼镜, 通过眼镜和智能戒指的这个方式去实现这个极简交互,那么它把这个 agent 的 交互界面跑在这个眼镜的本地,然后通过这一个其他的这个交互方式,通过无线网去连接这个云端的这一个电脑和这个云服务器, 然后通过这种方式实现这个极简的交互。用户最终的话只需要通过语音发送命令,然后控制这个 a 帧的去运行还是不运行,一切都有这个语音来输入, 或者去做好这个任务,每完成好一步的任务,他就会返还对应的这样的一个效果,可直观的效果让用户看,如果效果不确定的话,他可以去回退,如果效果确定的话就继续执行下一步, 这样的话用户七十二小时可以随时随地的让 ai 为自己干活而为自己办公。这款软件我们后面开发出来之后,我们会推出相应的硬件,让在我们的关注我们的这一个伙伴里面挑选,让大家免费的去试用, 如果大家有意向的话,可以随时找我们去沟通,去讨论,然后把这个产品给打磨好。 其次的话我们如果再要去开发到我们要去实现企业级的这大规模的这个部署,那之前有讲到我们在研发这个 a 型的 teams, 其实 a 型的 teams 它的这个思路要比那一个 open cloud 要超前很多, open cloud 里面有所有的功能基本上它都有,它是适用于企业的这个大规模的部署和运行的,它的理念是用来替代一个一个的这一个公司的这个部门,并且它也能够实现比较高的这个号召性。 后面的话我们会面向这一个非技术的用户去做出更多的好的开源项目和这个产品出来,让大家能够免费去使用,同时我们也会提高这个高安全性 ai 的 这个高安全性。 如果如果你对我们的这一个课程,或者对我们产品或者开源项目感兴趣的,可以随时私信我们,然后欢迎加入我们,我们一起让 为普通人的资本掌控这 a g i 的 时代,为普通人去真正的谋取一些福利,找到一些出路,然后让他们也能够享受 a g i 时代带来的真正的这个价值和利益。经理今天呢就到这里, 如果你有任何的意见,也可以随时跟我们沟通或者评论。以上的话,今天的这个 open cloud 这个项目的交流,谢谢大家。
粉丝158获赞1350

最近爆火的 opencloud 大 龙虾大家都用上了吗?我已经在我的 windows 电脑和 mac 电脑上都用上了,而且连通了飞书,现在我在我手机上的飞书 app 上发送消息,我的智能体就能接收到信息,并且按照我的要求为我执行任务了。 今天我就来为大家介绍一下 opencloud 的 安装和使用方法,以及如何连接通讯软件。比如飞书,让你在手机上就可以发送指令,操控智能体。 所有的安装步骤和注意事项我都整理成了文档视频的最后我会分享给大家。今天的视频主要有以下几个部分,首先,我们来快速的安装并使用 openclaw, 包含 windows 和 mac 两个系统,这一步是为了让大家快速的用上并熟悉 openclaw。 然后我们来看一下如何为 openclaw 安装插件和 skill, 以及去哪里寻找相关的 skill 资源。 第三,我们来连接即时通讯软件,让你能够在手机端实时发送消息,操控智能体。这里我们以飞书为例。 第四,我快速的为大家展示一下如何在 dalker 这个隔离环境中安装 openclaw, 以及安全性问题和 token 相关问题。那这一步是当你真的想把 openclaw 当成你的 ai 数字员工,让它在生产环境中为你打工, 那我们就正式开始。首先,在本机快速安装 opencloud, 我 们需要保证我们的电脑上已经安装了 node js, 版本号大于二十二,以及安装了 git。 其实 node js 已经是我们的老朋友了,我们之前安装 cloud code, open code, java 都是通过 node js 安装的,那在 ai 时代, node js 是 你电脑上必不可少的工具,直接到 node js 官网下载,然后双击安装即可。 git 也是一样, 当我们想要在 github 上下载开源项目和资源的时候, git 是 最好的工具,安装方式也是一样,到 git 官网下载,然后双击安装即可。那注意,这一步对于 windows 和 mac 来说是完全一样的,没有任何差别。 然后我们打开命令行工具, windows 就是 cmd, mac 就是 terminal。 在 命令行里输入 node 空格横线 v 查看 node js 版本,输入 npm 空格横线 v 查看 npm 版本, 输入 get 空格横线 v 查看 get 版本,能够输出版本号,那就说明一切准备就绪,然后我们来安装 openclaw, 其实一共就两个命令,首先我们在命令行里输入 npm 空格 install 空格横线 g 空格 openclaw at latest, 然后回车。那这一步会在你的电脑上安装 openclaw。 这里我们要注意一点,你要确保你的电脑的网络环境是 ok 的, 如果出现网络问题,尤其是网络连接超时,你可以使用 n p m 的 国内镜像来安装。那具体的方法就是先运行一行命令,把 n p m 转向国内的镜像,然后再进行 n p m 意识到具体的命令我也展示在屏幕上了。 在 n p m 意识到成功后,我们运行第二个命令, open clock 空格横线横线意识到横线低蒙。这一步是进行驶出话点击回车之后,稍等一会儿就会进入驶画界面。 在初次化界面,第一个问题,我们用键盘的上下左右箭头按键切换到 yes, 然后回车。那第一个问题呢,是让你知道这个工具的风险。然后第二个问题,我们选择 quick start, 也就是快速开始,然后点击回车。 那第三个问题就是选择一个 ai 大 模型,你可以使用你常用的 ai 大 模型,要注意一点啊,这里使用的是 a p i p。 那 建议大家用一个有免费额度的 ai 先进行体验,等你熟悉了这个工具之后呢,再去购买 ai 的 订阅套餐。 这里我选择的是智普 g l m, 然后我们到智普的官网进入后台创建一个 a p i t, 然后复制出来,到命令行里进行粘贴,然后回车,然后模型,我们这里选择 g l m 四点七, 然后继续。那后面的问题我们都选择跳过或者 no, 包括是否安装 skill 以及是否配置聊天软件,那因为这些呢,我们都可以过后在图形界面中进行设置。那最后一个问题 就是 how do you want to hatch your boot? 意思就是说你想通过什么方式访问你的机器人,那这里我们选择 open the web ui, 也就是说通过网页版图形界面进行访问,那图形界面适合我们绝大多数人,如果你有编程背景,你也可以选择通过命令行访问,那之后它就会自动弹出网页, 进入到 opencll 的 智能体界面,然后我们在 ai 对 话框中输入,你好, ai 能够进行回复,就说明配置成功了,那么到此你的 opencll 就 正式运行起来了。 我们再来做一个测试,在 ai 对 话框中输入指令,在我的 mac 用户瞩目下,创建一个名为 jason 横线 opencll 的 文件夹,然后 ai 就 进行了文件夹创建,那么到此你就可以开始尝试让 opencll 为你做各种事情了, 那在这里我要强调一点,以上安装方式是直接在本机安装, windows 和 mac 是 一样的方法,运行的命令也是一样的。我们唯一需要注意的就是安全性问题,你不要把太多的个人隐私数据放到本地,以防 ai 一 不小心给你删了。 那接下来我们来看看如何安装插件和 skills, 以及在哪里可以找到 openclaw 的 优质资源。我们首先要知道 openclaw 本身自带了很多 skills, 我 们在 openclaw 的 网页上左侧菜单点击 skills, 然后点击这个 build in skills, 就 能展开它自带 skills 的 列表, 里面有一些 skills, 暂时被 block 的 话,你可以在右边看到对应的安装按钮,点击就可以安装依赖,然后这个 skills 就 可以使用了。 另外,当你在 github 上看到一些 skills 想要安装,你并不需要手动安装,你直接把 github 的 链接发给 openclaw, 让它自己安装就可以了。我们知道 openclaw 是 一个 ai 智能体,它已经足够智能,已经是一个成熟的智能体了,能能自己赚钱养家了啊,那它自己就可以给自己安装 skills。 那么我们从哪里寻找 skills 以及有哪些必装的 skills 呢?两个核心的社区,一个是 github 上的 awesome openclaw skills 这个仓库,那这里收集了几千个优质的 skills, 并且有详细的分类。那其次我们在 openclaw 的 官网 可以找到一个名为 clawhab 的 链接,点进去这里就是官方的 skill 市场。那我我总结了一些必装的 skills, 我 认为最核心的就是 fun skills, 这个 skill 也是目前社区中下载量最高的 skill, 当你提出一个具体的使用场景的时候,这个 skill 可以 帮助智能体找到并安装对应的 skills, 这样一来你就不再需要自己亲自去翻找 skills 了,它自己就能找了。 另外最好安装这几个联网和网络搜索的相关 skills 来增强网络搜索能力。那最后当你想要实现某一个具体功能的时候,你就可以直接向 ai 描述你的功能场景,并让它自己先分析需要安装哪些工具,然后自行安装就可以了。那么以上就是工具的安装, 到此,大家就可以无障碍的快速上手使用 open cloud 了。再次提醒一下,注意安全和隐私问题, 那接下来我们实现一个进阶功能,连接即时通讯软件,让你在手机上发送消息,就能操控智能体帮你干活。 我们在 opencloud 的 网页上左侧的 chinese 选项点进去就能看到它目前支持的通讯工具。那使用这些工具比较简单,以 whatsapp 为例 啊,我们在用户目录下的点 opencloud 文件夹里的 opencloud, 点 json 中配置自己的 whatsapp 号码,然后在命令行中运行 opencloud 空格 chines, 空格 log in, 然后用手机 whatsapp 扫描弹出的二维码就可以了。但是目前 openclaw 并不支持微信或者 qq 这一类中文通讯工具,那在中文环境中,截止到目前为止,最好用的就是飞书, 只需要创建一个聊天机器人就可以连接 openclaw 发消息了,而且这个方式不会造成安全隐患,因为飞书里没有你的私人通讯录,那接下来我就来讲一下如何把 openclaw 连接飞书。 首先我们要安装一个飞书插件,命令就是 opencloud 空格 plug ins 空格 install 卖家插件的名字。安装之后,我们来到飞书开放平台 注册登录,之后点击右上角开发者后台,然后点击创建企业自建应用,起一个名字,然后选择图标,点击创建,然后在左侧的菜单栏里点击添加应用能力,然后选择机器人,然后添加, 然后来到权限管理页面,我们可以点击开通权限,然后搜索关键词 message, 把有关收发消息的权限都勾选上。 那如果大家嫌麻烦,可以直接点击批量导入,然后把我笔记中的这段 jason 复制进去,然后点击开通就可以了。那这一步的目的是给与机器人相应的权限。然后我们点击左侧菜单的版本管理与发布,填入一个版本号,一点零点零,然后发布这个机器人, 然后点击左侧凭证与基础信息,把 app id 和 app secret 保存下来,然后我们回到 opencloud 页面, 点击左侧菜单中的 channel。 因为刚才安装了飞书插件,所以现在显示的就是飞书的配置界面。首先把 app id 和 app secret 配置进去,然后 connection mode, 选择 web socket, 我 们填飞书, dm policy 和 group policy 都选 open, 然后保存就可以了。 然后我们回到飞书界面,点击左侧的事件与回调事件配置,这里选择长链接,然后点击添加事件,搜索关键词 receive, 勾选这个接受消息,然后点击确认,然后再次重新发布一下机器人,到此所有配置就完成了。 然后我们来到飞书 app, 你 可以在手机上下载 app, 也可以在电脑上下载飞书 app, 在 聊天界面的搜索你创建的机器人名称,那我的机器人叫 jason bot。 然后就可以向机器人发送消息了。我们先发送一个,你好,你是谁?第一次发送消息的响应速度会比较慢,稍等一会我们能,我们就能接收到回复了。 然后我们再发送一个指令,在我的用户瞩目下,创建一个名字叫 jason 横线飞出的文件夹,点击发送,然后智能体就开始开始执行任务了, 马上文件夹就创建好了,那么到此我们就成功连通了飞书。只要我们的电脑是开机状态, open cloud 是 运行状态,我们出去玩的时候,用手机飞书 app 发送消息,就可以给智能体下命令,让它干活了。 到此你已经掌握了 open cloud 的 主要的基础功能,你现在就可以上手试用这个智能体工具了。那最后我来快速介绍一下如何在 docker 这个隔离环境中部署 open cloud 以及 token 相关问题。当你深入使用了 open cloud 这个工具, 觉得你确实需要一个这样的数字,员工来二十四小时为你干活,那么最好的方式就是在一个隔离环境中部署它。这也是为什么 open cloud 带动了 mac mini 的 销量,因为 mac mini 性价比高,运行功率低,适合二十四小时不间断运行,那还是一个全新的环境。 所以你也可以在本地使用 docker 这个隔离环境来部署 openclaw。 方法很简单,首先要安装 docker desktop 这个 app, 那 它也是我们的老朋友了,那之前安装 n 八 n 和 deepface 都是用它安装的。安装好之后,我们来到 openclaw 的 官方 get up 仓库,把这个仓库下载下来。 我们使用 git clone 命令把它下载到本地之后,在文件夹内就能看到一个名字叫 docker setup 点 s h 的 文件,我们在当前文件夹内打开 bash 工具。那这里要注意啊, mac 可以 直接用 terminal, 而 windows 则需要使用 git bash 这一类的 bash 工具。 我们输入点斜线 docker 横线, setup 点 s h, 然后它就自动安装了。那另外呢,你也要注意网络问题,开启代理 安装成功之后,就自动进入到了出场界面,那和之前是一样的,选择 ai 模型,然后配置 a p i p, 这里我就不多做展示了。那我个人更建议大家使用独立的电脑或者云服务器来部署这个 ai 数字员工, 因为本地刀客的使用还是需要一定的技术门槛,尤其是网络问题和权限问题。那如果你没有编程背景,确实是有一定难度的,那目前阿里云和腾讯云都集成了 open cloud, 非常方便。 那另一个就是 token 问题,智能体的运行非常消耗 token, 那 说不定一晚上过去你的卡就刷爆了。那这里建议大家订阅类似 coding plan 的 套餐,在五小时内允许几十次的访问, 那类似这种包月的方式就不会让你的 token 无限制消耗了。那目前最经济实惠的 ai 模型就是智普、 glm, mini max 以及 kimi, 大家选择自己喜欢的就可以了。那最后还是要强调,一定要注意安全和隐私问题,不要让 ai 访问自己的核心隐私数据, 那么到此本期视频内容就结束了,那具体的安装步骤我都整理成了文档,大家可以在我的主页频道信息中找到我的个人网站,在那里可以下载文档和资料。大家在使用过程中有任何问题都可以给我留言,记得点赞关注,谢谢大家!

大家好,我是根古,今天是 open call 的 第十二堂课啊, c dance 是 字节跳动发布的一个超级强大的,号称地表最强的多模态的大模型,它在图声视频、纹身视频这个领域啊,应该是第一题对的,第一题对的。那这堂课给大家分享一下如何通过 open call skills 来打通 c dance。 首先给大家看下效果,这是我已经调试好了的,我这个就是生成一张图片,图片呢,描述就是根古老师在外太空中说 cds 啊,这个就是他,最后图片会在这里, 他就马上 get 了。好,我理解你想生成一张图片,描述是这个,这个这个,他会根据我的 proma 的 运行调度这个 cds 的 一个这样一个也就即梦的 api 啊,已经好了, 反正,反正这个图片也一般了,效果一般了。然后他怎么做到的?怎么做到的? 首先你应该去打开吉梦,吉梦这样一个官网啊,这个大家都应该用过了,然后用抖音扫码登录,点这个 api。 好, 然后立刻开通啊,因为你是用 api 去调用,而不是用这个文字去调用这个。你进入这里以后,如果你是第一次进入,这是所有的都是暂未开通,暂未开通,我建议大家把这个吉梦四点零这个全开通, 如果是没有开通的服务的,他这边就是灰色的,你选择开通就好了。点开通就好了,我这个不不去开通了,开通了以后这个就会变绿。概数点这个概数啊,他大概有四个步骤,第一个步骤,实名认证,这个也没啥介绍的,也就是,呃,在抖音扫个脸就好了。第二步,开通服务,刚刚已经演示了, 就在这个节目 ai 这个这个里面,然后第三步是最最重要的,他现在喉咙不是很好,然后去开通这个新建秘药,这个秘药他有两个秘药,一个是 s s k, 一个是 secret 的 k 啊,这两个秘药拿到以后,然后编一段代码, 这个就是编好的代码,其实也不是很长的,这也不是很长,就这么一点,编好代码以后,然后让这个这个 让小龙虾去学习这个,呃,你刚刚编好的这样一个代码,也就样式学好了以后,他就能够运行调度这个极梦的 api, 大 概整体思路就是 第一步,第一步申请极梦的 api key, 那 第二步是开通服务,开通极梦的服务,第三的话就是编辑 skills 技能卡,也就这一块的代码,大家感兴趣的话可以在评论区扣,我可以分享给大家。最后一步就是让大龙虾去学习这个 skills, 所以 说关键点还是 你这个 style 是 自己开发的啊,你也可以用网上其他能开发好的,但是我用了下他们的不是很好用。最后就是,呃,直接可以展示效果,可以大家再给大家展示一下,比如说生成,生成一只猫在太阳下, 太阳下休息,然后可以看一下, 这个 好,他说我理解你想生成一张图片,描述是一只猫在太阳下休息,看一下应该很快就出来了,哎,这个 是不是还可以啊?效果还是不错的啊。所以说龙虾它也非常多的样式啊,如果你不会开发代码的话,你可以去找很多样式,把它放在那个它的项目上面的一个叫 work space, work space 里面它就自动能学习啊,这堂课就分享到这里,你学会了吗?

大年初七的早晨七点钟,我爬起来录了一个四十分钟教你们安装 openclog 的 一个教程,面向小白的他就能够独立安装,后续遇到一些故障都能够解决。今天早晨在安装的过程中有一些心得我都写进去了,我觉得这个可以实现两个目标,第一个目标就是我知道你们 不只是想要安装成功,还需要的一个目标就是我知道你们不只是想要安装成功,还需要的一个目标就是我知道你们不只是想要的自主的去解决 这个,我才是,我觉得才是真正靠谱的学习方法,而不是求着别人去给你操纵。你的电脑是怎么样,我觉得还有一些安全性的风险,所以我自己研究出来了一套怎么用另外一个 agent 去辅助你去安装,这是我自己的一个思路,希望你们能够学到。

兄弟们, openclaw 最近真的太火了,我刚花了一点时间把它部署完,效果真的只能用两个字来形容,牛逼!这回真的相当是把 ai 贾维斯请到自己家里面来了, 我给大家看一下我刚测的两个例子,看完你就知道有多么的炸裂,以及为什么 ai 时代不需要员工了。首先啊,我,我直接去打开我的飞书啊,因为我已经把机器人部署到我的飞书上面。我这个时候呢,我就跟他说啊,打开这个 curl 浏览器,在 b 站上找个影视巨峰最新一期视频并且播放,那我们现在就直接发送,发送完之后呢,我在电脑就在这里啊,我什么都没干 啊,他会自动的帮我去思考,就是接收信息,接收完之后呢,我这台电脑呢,他就会进行运作,看见没,他就相当是直接帮我打开了这样的一个,就从 b 站上打开了我这样的一个视频。然后呢,我们也可以进来看一下,这是不是最新一期, 好看一下啊,这个是二零二六年一月三十号, ok, 让我们点进来看一下,刚才播放的就是这个一月三十号的一期,也就像是最新一期啊,他这个准确度是没有问题的。然后我们再回来看一下我们这个手机上他给我们发的那个消息啊, 这上面说啊,浏览器没有运行,让我启动他,然后他就直接通过系统命令行帮我打开了这个全新工作楼,然后现在发送指令已经帮我完成了, 然后这是他帮我完成的一个流程啊,这个流程就跟我们自己去操作电脑是一样的,第一步先打开浏览器,好,第二个先找到这个影视巨峰最新的一期视频啊,同时呢找到这个最新发布的,然后呢这个数据他也说出来了,然后第三个他就直接帮我发送这个播放指令啊,也就相当于他帮我完成了三个动作,如果自己去完成的话也是一样的, 刚才你们也看到了啊,就真的是这个话还没说完啊,他就已经帮我把这个事办的妥妥的,效率是非常快。你像这种听音乐啊,回信息啊,看视频啊,完全都是可以动动嘴就能够帮你完成的啊,这个就是我说的那个本地控制好,然后我们接下来我们看第二个案例,我让他把今天部署的这个 open cloud 的 过程啊,就整理成一篇这个 macdunk 的 这个教学文档,我们直接先发送 再看啊,就相当于是小白看完之后也能够啊,步入成功啊,之后放到我这个桌面上,这个时候呢他就会直接帮我自动干活,干完活之后呢啊,他就直接会在我这个桌面上保存,我们来看一下啊,他等一会,他就会在我们这个啊,这个软件下面啊,会有一个文档啊,等一会, ok 啊,他已经操作完了, 操作完了之后啊,我们来看一下啊,这个就是他的一个文档,我们我我是没动手的啊,然后我就打开,我打开我的一个这个平时的这个编辑器,然后我就把它放到这里面给大家看一下, 它就相当于是啊 openclaw 浏览自动化这个小白入门教程啊,就是确保 openclaw 已安装。是怎么安装的啊?如果没有安装的话啊,他会教你怎么安装啊,确保这个浏览器安装 没有安装成功,就相当于是它这里面会非常详细啊,我们把这个整个流程啊,整个流程就是直接就写成了一个教学文档啊,整个过程全部都是由 ai 完成,是不是非常牛逼啊?那也就相当于是我以后啊,我只要有工作任务,或者说我有灵感, 我想要做一个什么样的文档或者写篇文章啊,我在户外,那我就直接给我机器人发任务,我回到家之后只要出一件事情啊,就是检查我这个机器人,他有没有帮我干活, 干的好不好?所以你们知道啊,为什么 open club 啊,最近那么火的原因的吗?啊,是因为他真的能够确确实实的帮你落地单,而且是七乘二十四小时的, 不要工资,你随叫随到,你想部署几个啊,你就部署几个。然后呢?这个教学文档啊,我也整理出来了啊,就刚才你们也看到了啊,就像那我也是直接通过啊, open class, 他 直接就是把我今天跟 ai 怎么交互,他怎么教我的,把这个流程全部都形成一个经验的文档,然后啊就打包直接给我了啊,所以说需要的啊,六六六。

家人们,这只开年爆火的小龙虾你们刷到了吗? oppo, 人称小龙虾,滴滴哈普狂揽十四点五万新,网上吹的神乎其神,给他五十美元,他可以自己嘲讽自己去发推,自己赚钱。有人说他四十八小时五千九百八十美元,有人说是七天赚了七百万。但我尝试安装运行以及阅读各种资料后,今天我来说点真话,这玩意到底是不是普通人? 先说优点, oppo 可乐确实是一个划时代的一个想法,它不是只会聊天的 ai, 它是真的能操控你电脑的 ai, 帮你部署网站,整理文件,自动翻译,自己装技能,自己学东西, 社区已经有一千七百多个技能,想要什么功能给他装上,他自己就会用。我给他写了一个自动化交易的技能,实际上我完全不懂金融,不会炒股,不会看 k 线,但是我就把这个技能发给他,然后跟他说,你帮我盯着市场,自己决定买还是卖,他就可以每天给我发日报,今天市场情况怎么样,建议怎么怎么样。我还给他布置了一个详细任务,让他自己研究怎么利益最大化,自己思考怎么才能做得更好。 每天晚上他会给我发热报,向实习生汇报一样。我还给了他一个灵感库,让他自己没事的时候去挑任务做。我跟他说你要主动,不能等我安排,结果呢?他真的自己每天自己研究,自己分析,虽然到现在还没出手啊,一直怂着没买。最实用的是,我在服务器上布了一个问号,让他给我打一个电话,让他自己解押,自己配域名,自己申请证书那一刻,我感觉自己确实是请了一个免费的 it 运费。但是目前来讲啊,他是有坑的。 可口可乐不是一个商业化的产品,他不考虑用户体验,他只考虑功能性强不强,扩展性好不好,所以他非常非常的不稳定。我每天有百分之五十的时间是在跟他调整各种功能的问题,聊着聊着模式就挂了,服务不知道为什么连不上了,定时任务莫名其妙就没了,更多的是很多运行模式是 c 和模式。 比如说我让他每天定时发日报,有一天晚上没收到文案日报呢,他这才补发出来。我问他,你不是定时任务吗?怎么还要我提醒?他说定时任务好像没了,我问他怎么没有的,他说不知道,还有一个坑,他执行任务的时候是沉默的,你让他跑一个复杂的任务,在过程中他是消失的,是不见了,是不会给你任何反馈的。你也不知道他跑到哪里了,还是卡住了,还是死了,根本就不知道,我就一直在那问,你还在吗?怎么样了,好了没有?还是那出问题了,就像一个保姆。 再说费用, oppo 可乐本身是免费的,但它调用了大模型,要钱,一次复杂的任务动辄几十万的投币,我试着跑一个代码跑了一天,花了几千万的投币,还没有跑好,你以为省钱吗?一个月下来可能比订阅十几个 ai 服务还要贵。最重要的是安全问题, oppo 可乐要的是你电脑的最高权限,它能堵你的文件,删你的东西,操控你的浏览器以及屏蔽你的密码, 你就有安全机构发现黑客可以在网页、邮件里植入隐藏指令,诱导 oppo cole 执行恶意操作,删文件,发密,要访问钓鱼网站,而且你完全不知情。最后说部署,网上那些保姆级教程,你跟着抄,能够装下来,到电脑上,你就已经超过百分之九十的普通人了。真正的普通人,连命令行 cmd 都不知道在哪里开,更不要说环境变量、端口映射。我 也是个普通人,我折腾了整整两天才跑起来,中间无数次想放弃。那 oppo cole 到底适合谁?一是有技术背景的杰克,能把彩充当乐趣,能接受不稳定。第二是有预算的团队愿意为效率付出,能接受不稳定。 第三是想参与到 ai 过程中。一些普通人像我一样,我享受过程,我不指望他真的干什么,但是我想要参与进去,我能了解他怎么去运行,怎么用的。那普通人想要靠它自动赚钱,想靠它自动运营账号,我的建议是,限阶段啊,别碰,但未来可期。他不是神器,是半成品。网上那些爆款文章,让你看到的只有幻想性的未来,没有让你看到现实的情况。 幻想中 ai 可能会帮你赚几十万美元,现实中,其实呢,不足一天,你净亏损可能都是几十刀,甚至几十刀,可能就是你按了一下回车的事。奥本可乐确实是一个划算的想法, 它让我们看到 ai、 ai 智能的未来方向,但现在呢,只是一个中间的形态,过度的产品,而不是最终的产品。那我们可以等那些大厂把这些想法包装成成熟产品,等它变得稳定,安全,开箱即用,那个时候才是普通人上车的时候。如果你想看到真正的普通人是怎么学 ai、 玩 ai 以及如何变现的,关注我们一起学习。

喷口大龙虾机器人获取终端最高权限的问题啊,我给大家解答一下。最简单的方式你就是直接告诉龙虾,你要获取本台终端的最高权限,你需要哪些权限?他会告诉你他需要哪一些,我呢?在他需要的权限里边,我还额外给他更多的权限, 比如麦克摄像头,鼠标键盘的控制,甚至是远程桌面,还有自动化控制啊,都给他,主要是给谁啊?终端知道吧?你的龙虾理论意义上的最高权限。

哈喽,我今天一分钟学会不说喷嚏,并接五分钟让他二十四小时帮我们干活。首先第一步,来到扣子编程,在下面这里找到喷嚏,选择创建副本,这里的应用名称和应用介绍可以自定义填写,然后确认就可以一键安装。在安装完后,我们来测试一下,在对话框输入任意 的指令,如果可以正常运行就说明安装成功。接着点右上角的部署,稍等一会,这里就会显示部署成功就可以了。接着第二步,如果要打通飞书,首先我们来到飞书开发者后台,在这里选择创建企业自建应用,应用的名称 和用描述可以自定义填写,然后选择创建,在创建完后,我们需要添加机器人的能力。展开左侧的目录,找到开发配置下的权限管理,选择批量导入,导出权限,在导入这里把原来的权限代码替换成我这一段,然后确认新增权限,有需要的可以跟着 我的步骤来,将应用的权限就开通了。接着在左侧目录,从凭证与基础信息入口进来,先把应用的 app id 和 app mail 保存下来,待会要用到,然后选择顶部的创建版本,版本号和更新 说明可以自定义填写,接着划下来选择保存,然后确认发布,刷新一下页面显示已发布就 ok 了。第三步,我们回到扣子的 open call 相壁页面,直接在多号框输入,让它帮我配置飞书的渠道。这里需要把我们刚刚保存好的 app id 和 app 密钥粘贴进来,它就会帮我们自动完成对接, 稍等一会再执行完后,这里会显示已经配置成功。接下来到了第四步,再回到飞书开放平台,在开放设置这里找到事件与回调,简单来说就是当我们在飞书里给 open call 发指令,飞 书需要把这些任务通知给到 open call, 这个通知权限需要在这里开通。接着从右侧添加事件的入口进来,我们可以根据自己的需求选择应用身份订阅,比如接收消息等等。 只有订阅了这个事件, opencore 才能收到我们在飞书里发的指令,其他的敏感权限大家也可以根据实际的需求在这里开通就行。接着是回调配置,也是一样的思路,在权限开通后,当有消息发生时,飞书会把内容发给 opencore 让它执行, 在设置完后,一定要再发布一个新的版本,这样才能把飞书和 opencal 完全打通。最后我们回到飞书,在开发者小助手这里打开应用,就可以直接让 opencal 开始工作了,基本的思路就这样好了,本期视频内容,觉得有用的话给我点赞关注,咱们下期见,拜拜!

老师们,我问问啊,就是那个 oppo 可乐,如果说在本地部署的话,你别管是什么 mac mini 啊,还是 windows, 它能控制咱们电脑去点击浏览器,去登录账号,去操作整个电脑界面吗? 就是如果的话,我可能真的呃动心思说整一台单独的设备就直接部署了本地部署了,为什么?其实我是想把那个项目做下去的, 就是用 ai 助理我的云叔,让他每天去研究着发什么视频,我自己就不参与了啊,让他自己通过自己的形象啊,再通过咱们吉梦的那个 cds 二点零啊,自己去做视频,做完视频之后顺手再发出去。 我是挺懒的,但是我就想试试这个项目成立不成立啊,懂的,老师,咱们聊聊探讨一下,就是我们本地部署的能做到这种程度吗? 我在云服务器上我是整不明白了,登个浏览器啥的他就给我卡死啊,半天都不说话,再一说话他又不记得之前干嘛了, 还是说其实在哪怕是云上用浏览器他也能操作我,我用的云他,他没有个界面,没有个正儿八经的界面都我看不见,他那边到底是什么样子的吗? 嗯,我也不知道他到底有没有去浏览器里边去干活呀,是不是?但是我可以用 rpa 是 吧?机器人自动化,但是他自动化他没有智能,他不会思考呀, 对吧?我可以去做脚本啊,一步一步一步怎么做?但是我想要的那种效果,我还需要跟我的云叔天天聊天呢,对吧?

朋友们,新年伊始啊, ai 从建议走向了行动啊,个人 ai 助手 opencloud 啊,正是引发了技术圈热议的数字管家,用户只需要发送一条消息啊,即可远程操控电脑,执行 关窗帘、写代码、订餐厅,甚至于是用 ai 语音打电话等复杂任务啊,它就帮你完成了,你只需要下指令啊,这不仅仅是效率工具啊,也象征着 ai 的 技术即刻啊,用 ai 重述工作与生活方式的新边界啊!它呢,可以用于 用户的设备,直接操作系统文件、浏览器及终端命令,支持 chat、 gpt 等大模型作为大脑啊,同时啊,长期记忆上下文啊,可 后台监控任务,并主动提醒,如追踪机票价格不动或者自动处理保险理赔。这个是非常厉害的一个个人助手啊,他可以不眠不休啊,二十四小时一直工作啊, 而且你不需要啊,额外为此付费啊,就是他可以部署在你个人的电脑上啊,就跟你的一个私人助理是一样的啊,二十四小时啊, 随时待命啊,你只需要有什么任务啊,布置给他就行了啊,把这个工作给他啊,然后几个小时之后啊,你看结果就行了,相当于全球八十亿人集体获得了一位可以七乘二十四小时完成任何任务的超级智能 ai 员工啊! 这的确啊,非常非常的厉害啊,什么时候啊,我们也可以下载一个,用一用体验一下啊!这个就是 每个人都有一个在线助理,你想要他完成什么工作啊,用 app 啊,给他下任务就可以了。看着我投资不迷路。

今天教大家怎么用 windows 系统配置这个最近比较火的 open code, 然后也是不用敲代码就可以配置了。首先呢咱们肯定是借助很多这个 ai 工具了,第一个必不可少的就是你要下载一个 ai 编程工具 啊,我推荐 tree 或者是啊 cursor 都可以啊。下载完这 a 编程工具呢,让他帮你做一件事,就是在你的 windows 系统里需要下载一个叫 wsl 二的一个虚拟机架构的一个东西,你不用管它是什么,你就跟他说帮我下载一个 wsl 二就可以了。下载完之后呢,它应该有一个 橘黄色 u 开头的一个软件,然后你点开那个软件之后就可以在这个软件里有命令行的去配置这个 open code 了,就是说,呃,需要粘贴一些安装命令什么的,这个时候呢,不要慌,你去找一个,呃,你去找这个 官方的安装文档,这个安装文档这个视频里就是没法贴出来,然后可以戳我发你们呃,把这个安装文档给到这个你的随便一个网页的一个 ai 助手上,然后让它一步步的根据这个文档指导你怎么去粘贴这个命令去安装这个 open code 的 这个 ai 助手呢。其实我推荐啊,大家在最好在国内找一个 cloud 的 镜像,里边有那个 o p u s 模型,用那个 o p u s 四点五模型 会让你少走很多弯路那,呃,这个安装完这 oppo 扣子之后呢,接下来就是配置这个 oppo 扣子配置的时候就是大家最好选这个 mini max 作为它这个圆模型,然后会让你去 mini max 官网上找一个 api, 然后填到里面,这里面就是有什么问题的话,其实 mini max 的 官网,呃也有教你,呃也有指导你怎么配置 open code 的 一个具体流程,你同样也可以把这个官方 文档链接粘贴给这个 ai 助手,让他教你怎么去配置这个,呃,怎么去这个配置 open code 的。 然后呢, 如果在电脑端配置成功之后,你应该会在一个弹出的网页里,应该他是他的控制中心,就可以直接跟这个啊 open code 对 话了。那么因为咱们最终的目的是用手机控制这个 你的这个 open code 嘛,所以说还需要配置一下你这个移动端的一个呃应用,这个咱们就用飞书啊,这个比较简单。 呃,其实就是整个流程,我简单跟大家说一下,就是去飞书开放平台,然后创建个应用加机器人开权限,然后配置事件回调 整个流程呢,一个叫技术啪啪虾的博主,他是呃展示的比较详细的根,根据他的步骤你去操作一下就可以配置成功了。最后呢,你的手机就可以呃控制这个电脑进行一些简单的动作了, 这个就是整个的一个流程,然后过几天我还会出一下怎么用这个 open code 做一些呃更有意思的内容,大家可以关注我一下。

今天是 opencode 的 第十二堂课,本地的模型配置嫌太复杂, api 调用的模型嫌太贵,今天我给大家分享免费调用的多款顶级的模型,这个就是英伟达这个官网提供的这样一个 免费的服务啊,大家可以去薅羊毛。首先要进入这个恩伟达的官网,就 build 点恩伟达点 com 点这个首页的模型, 你可以看到这里面有很多个顶级的模型,比如说精华指望的 g l m 五,还有这个 mini max, 大家第一步先要去进行这个登录啊,这个登录其实也就是正常的注册啊,没啥可掩饰的,注册完了以后,大家右上角有个 api key, 点了以后,你要生成一个 apikey 啊,比如说这个根股啊,就是随随便选一个,他就生成了一个这个 apikey, 然后你把它复制出来,复制出来我,我这里已经有了一个啊,这有,有了这个,呃,然后呢?再把它回回到前面的这个模型, 选一个你想要的模型啊,这里推荐是用迷你麦克斯,你也可以用千问的,然后点击它,点击这个模型, 点击这个模型以后,呃,你要去配置文件进行修改啊,这个就是,呃,这个我也是扣的啊,你需要打开这样一个,在你的加目录里面有一个这个这样一个文件啊,就是叫这个 open 点 open 扣的一个一个目录给大家看一下, 比如说我 cd 加目录点 open core, 哎,它这里面有一个叫 open core 点 jason 的 一个,你把它打开,把这一段把它粘过去那个 base url 和这个 api key, api key 就 刚刚你你你那个 这里的刚刚右上角这个啊,现在很卡,现在很卡,然后它好处是第一个它不需要魔法上网,第二个的话这里暂时是无限免费的,这个就是它的贝斯 u l, 可以 看一下,把它敲出来。贝斯 u l 第二个就是 api key a p i k 就是 这个 mini max, 这个然后弄好了以后,其实你可以重启路由了,重启路由了以后你可以试试看啊,可以试试看,我刚刚已经重启路由了,重启路由了以后,呃,我刚刚让它切换了这样一个 mini max 啊,这没问题的,大家,那大家配置这个, 呃, config 的 这个文件的时候,大家一定要在这个地方,也就是在 a 键词里面要把它加进去,就是这个地方 mod 是 一定要加入这个白名单,如果不加的话,这行它默认的是没有的,默认的是没有的,你如果不加的话,它就一定切换不过来,那不要以为在这个地方配置好了就是, 呃,就高枕无忧了。嗯,所以说这个地方是一个坑啊,这个地方是一个坑。嗯,然后切换了以后,你就可以用那个英伟达的这样一个 mini max 进行无限制用了它,它,我感觉它还是很卡, 可能是因为免费的东西也就这样了吧。对,然后大家切换到 mini max 以后就可以去尝试使用啊,这块是不需要钱的,因为因为打战时这个所有的模型都是免费的,那大家可以把它切切过去玩一玩啊,这么多模型啊,这个,这个也是不错的,还有这个叶子暗面二点五也非常好啊,所以说大家还是尽可能去薅他的羊毛。

今天我们来讲一下如何利用 codex 或者是 cloud code 来进行 opencloud 的 升级,因为很多小伙伴发现升级从 cloud 会直接挂掉,我们最好的方式就是用 codex 辅助我们进行 opencloud 的 升级。 在我们右边的是 codex 的 界面,首先我们第一件事情是要把我们的 openclaw 进行保存 commit, 今天我们要升级 open 了,请你帮忙查看一下最新版本的更新,保证我们我们先让 codex 帮我们检查一下最新的版本 以及这个更新可能带来的影响,这样我们才能够保证我们的更新不会把我们之前培养的小龙虾的配置给改坏掉,它会去分析整个的代码, 我们等一下一路 yes 就 行了。这也是 codex 跟我们的 open cloud 的 一些不同的地方, codex 它在执行很多任务的时候还是需要人为的去进行干预的,但是像 open 呃 cloud 就 可默认获得了整个电脑最大权限,所以在实际使用 的时候,长城的任务里面表现的会更好。它其实已经看到了我们的小龙虾最新版本是二点二二,之前我们版本是二点一九点二, 这是我们的小龙虾的界面,可以看到它其实也说了我们的版本是过时,所以它会帮我们自动进行升级,它可以看到我们中间隔了好几个版本。我现在用的是 cloud code 啊, codex 的 操作其实基本上是一样的,也是先让它去帮忙去看整个的 代码的情况,分析一下差异,看看会不会出现什么问题啊。我们其实可以同时启动一个 codex, 这个是 codex 的 界面,基本上跟这个 cloud code 是 一样的,今天 open 更新了,嗯, 这个是 codex 的 界面,那我们可以看到它这边已经出来了,就是 opencloud 的 一个最新的一个更新,这里可以进行新增模型的选择,内置 out 后台哦, 多语言的改进,我们可以看一下, codex 也在分析,那我们可以让这个 cloud code 这两边操作是一样的,请你帮忙先保证所有 都可密,让他帮我们把变更都可密了之后,我们再来决定是否需要更新啊,那这边 codex 还在跑啊, 通常可能会起两个代理来做交叉的验证啊,这样子呢,保证我们的升级的一些细节不会被忽略啊。 change 这边的 commit 完成了, oodex 已经帮我整理出来整个升级的一些相关影响, 可以看到它整理的其实比这个 cloud 整理的会更加的细致。那我们也看到了,它其实做好了一些升级的准备,停网关,指定到版本,恢复本地的补丁并叫验。因为之前其实我给这个 cloud cloud, open cloud 打了一些补丁,人工打了一些补丁, 那现在其实我怕升级之后把我的补丁给覆盖了。这个 codex 它其实也扫描到了,那我升级之后,它会自动帮我去执行之前我打的补丁, 并且帮我把补丁给打回来,这样保证我的小龙虾还是在我的预设范围内进行更新,到现在开始执行。当然两边的选择我觉得都是可以的,只不过在升级和改代码方面,我更信任 codex, loco 的 会作为我的备选,看看两边的方案会不会有什么差异,会不会有什么遗失。如果没有的话,我们用 codex 为主来进行整个的升级,这边它其实已经停掉了小龙虾的服务了,小龙虾在这边可以看到它已经 disconnected 了啊,升级命令已经启动了, 等它自动帮我, codex 自动帮我升级好之后呢,我就可以正常的跟小龙虾进行沟通了。首先要验证的就是我的三个小龙虾是不是都能够在手机上进行正常的使用, 我的小龙虾呢?其实在整个飞书上面是有三只的,升级完之后呢,我会去做一个验证,那三只小龙虾是不是都能够正常的使用?你看到这是一二三三只小龙虾啊, 那么它其实 get 位已经恢复了,这时候你可以看到它已经连接上了。这边你看王冠已经正常启动,都已经加载成功,我们就发送一条消息来进行验证,随便发送一条 可以就是已经通了,没有任何问题。这样子我们因为已经升过级了,我希望把它做成一个 skill 以后就可以自动帮我完成升级的整个过程, 让他去跑了。这就是我们今天完整升级小龙虾的过程,完全不需要你会任何的代码就可以帮你的小龙虾进行一次安全的升级,并且能够正常的使用。 所以你看是不是很简单,只要我们会用 agent 就 可以帮你能够解决很多的问题,整个升级的过程大概花了我十来分钟,我们下次见,拜拜。