那个跟大家来说点真话啊,我现在实在受不了很多的自媒体在吹这个 open crow 这样一个框架无所不能,万能什么标题党拉满 ai 自动赚钱,二十四小时,现在贾维斯降临等等这些言论什么又便宜,有一个二十四小时的全方位打工的员工帮你去做这个做那个等等, 其实这些呢,都是有很多条件在的。我今天呢就讲一些真话啊,跟大家来分析 open crow 到底是什么?它究竟什么能做,什么擅长做,什么不能做,什么不擅长做,跟大家讨论清楚。 好,我们分为三个部分呢,跟大家来说一说 open crow 它的基本情况。第一个呢是 open crow 究竟是什么?第二部分呢是 open crow 它做什么靠谱?第三部分呢,我们主要来看一看 open crow 呢,它做什么不靠谱啊?我们先来从第一个部分开始讨论,第一个呢就是 open crow 它究竟是一个什么东西? 好了, open core 呢?其实我们从简易的或者说大家好理解的方向来说呢,它呢其实是一个智能体调度框架,不是决策大脑啊,因为它不是大模型。我打一个比方来讲呢, open core 究竟是什么呢?它更像是一个高级的智能化的一个数控机床。 这个大家呢,其实就比较好理解了,数控机床呢,它更多的是去执行某项任务,但是指令是谁下的呢?是它的大脑,也就是人 数控机床去车不同的零件儿,那么它需要使用不同的工具,这些工具呢,也就是它能调度的 m、 c, p 或者智能体啊,所以它整体来讲呢,分为四个步骤啊,首先呢是确定对话,因为大家都知道 open curl 呢,它可以用对话的方式,比如说 what's up 啊,这种对话的方式能够去下达它的指令, 还有呢,它可以你下达指令之后,它就可以组装上下文儿,这个叫 contest assembly 啊,这个部分呢,也是它的第二部分, 第三部分呢,就是调用模型并执行工具 ok, 模型是什么呢?就是它的大脑,这个大脑呢,本质上来讲它不属于 open core, 它呢更多的是我们这些做基础模型的公司,比如说 jvm, 比如说 gbt 等等。啊, 这个呢,所以 open curl 它是没有大脑的,它是一个执行调度框架啊,这个呢是也比较好理解。第四步呢,应该说是它会保存现有状态,就是你之前说过的话,之前下达过的指令呢,它都能比较好的,比较完整的帮你保存下来啊,它通通存回磁盘。 所以呢, open curl 呢,打一个比方,就是刚才说到的,它更像是一个高级的数控机床,这样的一个形象在出现, 所以我们再说专业一些,它呢具体适合做什么呢?就是它的针对于命令行, m, c, p, 协议, shell 等等啊,这些工具的读写代码,执行,终端操作啊等等,这些工作呢,它是比较擅长的,所以呢,它适合把这个模型和工具串起来使用。 然后整体总结一句话呢,就是它擅长的是一些后端命令行接口儿化的问题,而不是一个面向普通用户的桌面儿全能助手。 所以大家就能够理解了,我们想要操作我们的浏览器,比如说我们的谷歌浏览器,这个呢,其实现在目前啊,它是没有办法完成的, 所以这些就是它真正的一些痛点,包括操作 windows, 包括操作这个 windows 里边的各个指令,你打开某个这个应用软件等等,这些呢都是不行不通的啊,现在目前呢是没有办法去操作的 好,那么就此而言呢,我们来看一看 open core 呢,那到底做什么靠谱呢?其实它肯定是有靠谱的地方啊,就是刚才讲到的命令行脚本执行和简单的自动化啊,这个就是让它去做执行,这个呢是非常好的一个工具,并且呢就是调用 m c p a p i 以及其他工具接口。 大家可以想到啊,如果啊我想做的一个事情,他没有 m c p, 也没有 api, 那 么他能成功吗?他一定成功不了。比如说我之前去部署的这个就是 kimi crow 啊,我让他去帮我去抓啊,某一个这个专家就是医生他的号, 他的号源我就跟他指定了,我说你帮我去找到北京大学肿瘤医院赵君主任的号啊,如果有号,你就提醒我, 这个东西,就这个指令或者这件事情,它根本是无法完成的,因为它没有办法去调用相应的 m c p, 找不到这个 m c p 这个号源在哪呢?可能在幺幺幺四挂号平台,在北京大学肿瘤医院的这个官网上还有一些小程序等等,它找不到,所以这个任务呢,根本是无法完成的啊, 也就是没有 m c p, 没有 api 接口调用的时候,那么这个事情没有办法完成。还有就是代码儿编 e 运行,简单调试这些呢,应该说都是没有什么问题,文档读写啊,这些目录操作这种简单运维也是 ok 的 啊,就是作为巨能体框架,它更多的是把模型和工具串起来使用。 然后呢给大家找了一些现在全网中比较常见的一些用力,我用这个呃错位的方式呢,帮大家来呃突出了一下。第一个呢就是新闻摘药啊,天天整理新闻啊,我也在做很多整理新闻的一些工作,但是呢他的评价就是很多公众号啊,肯定有很多人整理啊,没必要自己花钱,因为他 token 消耗还是蛮大的。 第二个呢是邮件的这个管理啊,自动分类规章啊,这件事呢,给大模型做可能风险比较高啊,但不是不能做,然后日常管理和提醒呢,这个呢,其实可以用我们大模型或者说用一个助手,像 siri 这样的其实就够了啊, 等等,还有像备忘录,现在目前呢,笔记的一些备忘录还有日历我们是可以同步的啊,也会有比较好的替代方案。 还有这种 im 消息整理, im 消息整理呢,就是我的对话啊,这个说实话我根本不,我根本不敢交给大模型去进行整理啊,这个我的私人绘画呢,凭什么我要发到网上去,对吧?让大模型都知道我在讨论什么? 这个没有什么意义,网页的监控,服务器的监控,这个呢,其实啊,总体来讲啊,可能是为了蹭热度啊,这个根本不需要啊,因为成本太高太贵了。传统监控呢,完全可以达到自媒体运营找热点啊。这个听起来呢,是刚需的一个功能, 但是啊,这个功能我们其实之前编写一个工作流,一个 agent 啊,也是便宜可控并且能够实现的,我们不一定非要用这个 open curl 的 方式去实现, 还有像写代码处理这个,呃,处理问题, pr 等等,这个基本上就跟我们很多的智能体是一致的 啊,以及 pdf 处理呢这些其实整整体来讲啊,我们之前我推荐的呢,还是用脚本或者用工作流,我们的工作流去做处理,也是非常好的一些选择,所以呢,肯定也都是有取代方案的啊,这些呢是 open crow 呢比较擅长做的东西。然后呢,我们再来看一看这个 open crow 做什么不靠谱啊, 不靠谱呢?第一不靠谱就是浏览器的 u i 自动化啊,体验极差,这个是什么意思呢?就是你让它作为像人一样坐在电脑前面,打开一个浏览器,通过视觉的方式啊,帮你接管你的框啊,就是我们的谷歌浏览器 靠视觉的方式去进行识别,拖拽等等。这个呢错误率啊,几乎到百分之百啊,几乎没有办法去执行下去,特别容易卡啊,这些我都是试过的, 而且呢特别容易错啊,什么拖拽呀,弹这个弹框啊,验证码,动态页面等等等等,非常的差啊,非常的不好啊,几乎没办法用,而且消耗 token 消耗的极高,也就非常的贵。 然后呢,就桌面的这种软件啊,就是这种可适化的 g u i 的 软件的控制,这个呢就是最大的问题就是不支持原声啊, windows 跟 mac os 都是没有办法支持的,你没见过谁在 windows 里用 open curl 去控制 windows, 比如说我说帮我打开找一个文件,然后吧啦吧啦吧啦等等,这个呢,几乎是没有的啊, 所以这就是这部分呢,其实啊,呃,还有像国内的一些什么 qq, 微信啊,其实根本是现在目前开放不了,因为非常不安全啊, 还有像这种办公自动化自动赚钱啊,这个就是我觉得根本就不靠谱啊,其实根本不靠谱,这个除非是你有非常资深的程序员,并且能处理一些比较简单的问题而已啊。 所以呢,这部分他的整个脚本呢,其实不稳定,你要真是一个普通人,大家注意啊,我说的是普通人啊,如果是一个非常高级程序员或者说专家,那么呢,你可能会有一些挣钱或者说能自动化脚本的一些工作 啊,但是呢,他挣的也不是 open crow 的 钱啊。 open crow 对 于普通人来讲,直接二十四小时全能办公全自动挣钱啊,这个呢,不太靠谱啊,这个确实是不靠谱的。 然后呢,我们再说说我们最近啊,这个最受不了的一点就是自媒体吹啊,一直在吹啊,你这个哦,不会 open crow 呢,就要落,就要落伍了,就要过时了啊,要赶快学习学习是没错的,或者赶快去买它的服务。 所以媒体吹的呢,基本上就是 ai 全自动的控制电脑,什么都能点啊,都能做啊,其实实际情况啊,他呢,只能搞搞简单命令, g u a 啊, g u i 就是 我们页面的这个部分操作基本都基本是完成不了的啊,基本都废掉了。 然后呢,就自动办公自动做表格啊,复杂表格排版这种复杂逻辑一个都干不了,这个大家自己试过就都知道了, 然后自动刷视频,自动赚钱,二十四小时,这个赚钱啊,基本上来讲啊,演示为主,大家可以真实去跑一跑,看看你能不能跑够二十四小时的顺畅啊。 这个呢,什么不用写代码,小白也能一键启动啊,这个本质上来讲,这个是不是小白啊?不是,小白是专家啊,只有资深的软件工程师可能能够把它调的非常灵 非常通啊,针对于环境复杂,多条式报错,这个小白根本搞不定啊,而且 open core 的 部署可以看一看,很多程序员啊,不学习也搞不定啊。所以小白啊,不要考虑或者说是自媒体吹的,听一听就可以了,我们这个主要在说些真话嘛, 然后这下一代的智能体超越一切,下一代的智能体我们是承认的,没问题,这个框架也是非常超前的,一个超越一切啊,不太可能啊,这个是不靠谱的 啊,也就是带一个工具协调的智能体框架啊,他不是一个新模型啊,应该只能说是一个新框架啊,确实是下一代的框架,但并不是一个这个万能或者说什么都能做的一个东西,他还有很长的这个发展的路要走。 好。我们最后总结一下啊,很多自媒体对于 open core 啊,就是出现的这三个问题。第一个问题呢,是混淆概念,把这个能力框架等价于模型能力,这肯定是不对的,而且呢,把演示的效果等价实际应用的效果,这个呢,其实就是混淆基本概念。 第二点呢,是他的隐瞒成本,就是 open core 这个东西呢,其实 token 是 非常烧的啊,他有大量的需要消耗的 token, 这些呢,其实他并没有讲清楚, 所以这部分呢,应该说是隐瞒了相关的使用 open curl 的 成本。第三部分呢,应该说叫收割焦虑,很多自媒体都提到, 我们现在呢,必须跟上 open curl 的 节奏啊,如果你跟不上呢,那就是掉队了。最后呢,去卖部署,卖一体机,卖云服务等等,这些呢,应该说就是收割焦虑的非常典型的一个表现,所以呢,大家应该认清啊,具体 open curl 是 什么,怎么来迎接新的技术进展?
粉丝1328获赞7444

opencloud 不 适合百分之九十的普通人,唯有三大理由和一个阴谋论去帮你去魅。 opencloud 简单来说就是一个可以操控你电脑的 gpt 或者 deepseek, 可以 运行你电脑上的程序。 第一个理由呢,就是经济成本,首先你需要有一台闲置的并且能二十四小时运行的电脑去部署这个 opencloud, 同时这个电脑的性能还不能够太差。最好呢还得是苹果电脑,因为有很多功能,比如说录屏啊,在 windows 系统上经常会出现问题,而且软件生态呢,也是苹果系统更好。其次呢, 就是 token 的 开销了,这个就是重中之重了,很多博主鼓吹的什么免费啊,便宜的代模型,但是呢用起来太笨了,而且使用体验非常的差。而一些好一些的模型呢,比如说 cloud 啊, open i 或者 jimmy, 你 使用一次 执行一次任务,动辄呢就是几十万的 token, 折合下来呢,几块钱就没了,而你真的需要去付费执行这些任务吗? 第二个理由呢,很多使用场景呢,它都是委曲求,比如说你让它处理你本地电脑上的文件啊, pdf, 那 我请问了,你难道没有 wps 云文档了吗? 是什么样的场景需要让你拿起自己的手机,打开 whatsapp 或者飞机,然后发送指令让它处理你本地电脑上的文件,这个文件还不是你公司电脑上的,是你本地电脑上的文件。其次呢,还有说让它帮你进行交易,这个世界面上有那么多成熟的而且久经安全考虑的量化 交易软件,你不用,你非要自己弄策略,自己去下单,你也不考虑安全上的问题,哎,就是要 diy 主播,自己呢也是有玩 solo 的, 我是绝对不可能让自己部署的 open call 去帮我执行策略去交易的,一不小心全给我爆仓了。 至于什么帮你自动运营自媒体,那就更扯淡了, ai 味道那么重的内容,你确定你发出去有人看吗?你发送一条内容所消耗的 token, 你 确定你可以变现赚回来吗? 第三个理由呢,就是技术门槛。首先,安装它就有一定的技术门槛,很多人说网上有很多保姆级教程啊,你跟着敲就行了。我想说的是,如果你能跟着教程把它完整的安装下来,你就已经不是百分之九十的普通人了。真正的普通人,他们连命令行工具 c, m、 d 他 们都不知道要怎么打开,更别提什么 下载 note js 啊, get, 只有图形化的安装界面才是真正适合普通人的软件。其次呢,配置大模型,配置配置 whatsapp 维书,推特,那就更麻烦了,更别提你还要考虑安全权限的问题。你最好呢还是要有一个隔离的环境,不然他把你的一些重要资料或者文件给删除了,而且他还可以直接去操控你的浏览器,而大部分人呢,浏览器都绑定了十分重要的账号。 最后呢,我想谈一下我的阴谋论,直说了,我觉得就是有一些国内的大模型厂商在炒作这个热度,大家仔细看一下教程里配置大模型,也就是你需要花钱的这一步。上面呢,有几个国内的厂商恰好呢上个月刚在港股上市, 而且呢,有很多点击量十分高的安装教程,都无一例外的推荐你使用这几个收费的大模型厂商,而且呢要使用他们的邀请码 视频呢?最后呢,我想强调一下我的观点,我问我认为 open call 这种本地 agent 的 形式十分的有前景,而且它很有想象力的空间,但是限阶段它还不适合百分之九十的普通人,大家不要这么焦虑,好像觉得自己已经落伍了。

ai 助理可以帮我做视频吗?那我现在这个电脑里装了最近非常火的 open curl, 那 今天我们就来挑战一下,让他来帮我做一些视频工作,甚至于 代替我去做一些工作。我们来看一看二零二六年这个人工智能 ai, 呃,到底发展到什么程度了?能不能代替我们这些人类?那这就是这个软件的官网页面啊,你其实你只需要运行这么一个指令就能去安装了,还需要做一些配置,网上其实有非常多的教程, 同时他还提供了一个苹果客户端的这样的一个软件,我这个都已经装好了。装好之后呢,在右上角这里可以看到像龙虾一样的这样一个图标,他现在用户体验不是很好啊,他是一个纯英文的,呃,有很多很多的功能核心的点,其实在这边这一块 这个区域是提供了一些他的执行的能力吧,你比如说他可以访问你的摄像头,帮你运行一些程序。呃,打开一个画板绘这些东西,或者说是语音唤醒,控制浏览器,然后下面这有三个选项,一个是打开他的后台,呃,一个网页界面,然后最主要的是这个 啊,聊天啊,你就可以用这样一个聊天窗口去跟他说话,你好,反应比较慢啊。你好,然后他下边这里我们可以看一下啊,他还有一个叫做对话模式,我们可以试一下,这个就更加接近于跟人对话的一个体验。呃,你好, reply to current, 你 好,瑞斯,我在线,要不? 瑞斯我在线,要不他现在有问题就是他,你看他会把这个 这边这这个前缀都会读出来,而且它会说两遍,不知道为什么,所以这个对话功能我觉得非常直觉明白 核心问题还是会重复说两遍,对吧?第一,你不要说这个,前面这个 reply to current, 然后呢?你不要说两遍,你看能改一改吗? replied to current 收到,我改,从现在开始。 reply to current 收到,我改,从现在开始。这这个问题解决不了,我们先关上吧,我们还是用最朴素的这种聊天窗口的方式吧。 今天我们的目标呢是做一个视频,帮我想一个视频选择题啊,要流量高一些的。呃,最好 是相机啊,或者科技相关的,我们来看看怎么说啊,哎,出结果了,二零二六年普通人最该买的一台相机,我花了七天带这一台,结果真香,真坑。 这个还行啊,但是我们这个如果做一个长视频,这个今天时间肯定不够啊,我想做一个一个短一点的,把时间控制在一分钟。标题,二零二六年普通人买相机,别乱买,就看这三点 六十秒口播,想买相机,别着急下单,对焦,防抖镜头生态。我觉得还行啊,那我们就让他给我们产出一个文案吧。啊,这是他产出的文案, 还是建议他说,如果你要,我可以再给你一把更炸的开场三秒钩子也提升完播率。好的,给你五个,哈哈哈。第一,你买相机先听我一句啊,不要大概,不然大概率后悔。 百分之九十的人买相机,第一步就买错了,别再看像素了。普通人买相机只看这三点,你以为你缺的是参数,其实你缺的是这三个判断,今天这六十秒,帮你省下至少两千块冤枉钱。我的妈呀,都都拍了吧我看哈哈哈。如果你更像朋友聊天感的第三句是最自然的, 要更加呃,冲突抓人的第二句。那接下来我们可以让这个 ai 来做件事,就是你帮我把 啊这些文案和拍摄建议添加到我的苹果备忘录, 这个就我们要来看看 ar 的 能力了。他有这样一个能力啊,你看他弹出了一个请求他,他要要访问,要要有这个权限,那我们就给他一次啊,要控制我的备忘录啊,允许哎,他说直接帮你写到备忘录,哎,搞定了,我们来看一看啊,我们验证一下。还真真弄过来了。 看看啊,给大家看看。但是字特别小,妈呀,他可以调整的,有了这个助理之后你就说话就可以了。那我就点这个,一直给他这个权限。没事,我在这监视着他呢,他如果敢做一些小动作的话,我立即拔电源。他又创建一个大字版,他还是很小,但是他用了大字版这个标题, 这本字变少了,不知道为啥。大哥,我是手机的备忘录上看你字体大一些,这 ai 挺油的。收到,哥,我按你说的做了,不仅仅全量文案给到。你又来了啊,又来了,我这备忘录里面已经有三条了啊 啊,这个,这个很大了,这很大了。好的,我就接人家至少完成第一个工作了啊,对吧,虽然中间有一些小波折。 那我们现在呢,就来正式开拍一下,我们还是要问一下我用什么拍啊?我们就用手机拍,不用相机了,就我这里有小米十五 ultra 和 iphone 十五 pro max 啊,你建议用哪一款啊?他建议我用十五 pro max 啊,更稳更省心,出片成功率更高,然后再用 十五 ultra 当 b 机补拍特写。这这都照顾到了啊,都挺好,情商挺高的。怎么设置拍摄参数呢?来个手机支架,一会我们就在这开始拍啊。啊,这来了啊,四 k 三十帧最稳啊。用这个一倍的主摄,别用超广角拍口播。那我用主摄 还是前置镜头?用后置的主摄,那我不就看不到自拍的画面了吗?最稳的解法,先前置对好位,然后再切后置拍前置,打开站位和头顶留白 切主摄。行吧,那我我还是我们就用自拍吧。啊,对,这个意思意思就行了。这拍摄这个部分其实 ai 能帮我们的东西是比较少的,除非你让让他直接帮你生成啊,也拍张照片生成,那就是另外一条技术线路了。六十秒口播文案,我们来现在开始正式开始录了啊,想买相机的先停一下, 很多人第一步就错了。先看像素,拍好了话,我们把这个视频给他 ar 罩到我们的电脑上,看 ar 能不能帮我们处理一下啊。这个就是刚才拍的这个视频, 其实这种视频拍完之后第一个工作其实就是要对他进行一个剪辑,因为他会有很多我说错了的话,或者是要对他进行一个剪辑一下。那我们就来试试 ar 能不能帮我们这件事情 先让他干一点这种整理活哈,看他干的怎么样。文件就在在这个地方,看他能不能先先完成一个这个素材的这个整理啊。 哎,他要又要权限了,我们给他,他要访问我这个下载目录给他这啥还没干呢,就要权限,哎,瞬间啊,这个就是他用指令操作的,非常快,你看他创建,他把这个移动进去了,那接下来我们要进入这个最重要的环节啊,就是看他能不能帮我们剪视频,我们来问一下他可以先帮我 把这个口播视频剪辑一下吗?去掉说错话的部分,让他 看起来更流畅。正在进行,我在装剪辑依赖的软件,还没跑完,装好呢,我马上开始自动剪辑口误段,给你导出一版流畅的可以再给我几分钟。 不知道他做了什么,他说我已经帮你做了一个更流畅的输出了,去掉了停顿,从八十秒压到了六十五秒,下一步可以按时间点精简。我们看看啊,他这输出了一个流畅版的,看文件大小的话 你看看啊,八十八八百八十八兆,这八百八十六兆,你看下他的这个时长呵,时长我这个是一分二十一秒啊,这个流畅版没有变化呀,还是一分二十一,一个小一分二十一秒,呵呵呵, 你看时长没有变化,不知道他怎么干的,他只只复制了一遍,呵呵呵,骗子,你这个骗子, 我们先不要戳穿他,你帮我把说错话的部分也剪掉,压缩到一分钟以内, 哈哈哈,我可是在盯着你的哟。好的,有进展了,他说正在渲染中啊,是一个四 k 的 冲编码,速度会比较慢,等他跑完之后呢,第一时间给我这个最终的时长 弄好了,我们看一看啊。哎,这个你还别说,他真的时间变成了五十九秒了,我们来看一下啊,想买相机的先停一下, 很多人第一步就错了,先看像素,先看像素,看八 k。 其实普通人买相机只看三件事,第一,对焦啊,拍人,拍宠物,连走路了,自己啊,对焦不稳 啊,能看到他的一些剪辑,他是确实是剪了的,但是还是有大量重复的这个内容没有剪掉啊,真人剪的话肯定不会弄这样的啊,这其实还这是一个非常非常简单的活了,就是只是去掉这个气口,还没有到这个 贴逼肉这个环节了。好的,又有进展了啊,他说正在给我做这个第二版,他需要一个语音转写的这样的一个服务,但是没有这个 a p r k, 所以 暂时不能用语义识别来去驱虫。他已经在跑一版,更接近的去停顿加去短碎片加压长的一个 重剪,还在渲染中,我们先看下效果吧,可以让他去找其他的这种语音转写方案吗?这版是压到五十秒了吗?看一下,想买相机的先停一下,对焦不稳,素材直接废。第二,防抖啊,你是手持拍,你是手持拍视频,不行,他还是无法做到去重。 那你能找一些免费的语音转写服务吗? 好的,又有进展了,他说已经帮我在本地搭好了这个 whisper 这个软件了,而且已经跑通了啊,输出了这个文件啊,他其实你看,他是相当于是把这个视频文件给做了字幕,这是音频, 还有文本,还有这个字幕,这样他就能基于这个生成这个文本来进行一个处理了,去重复中板,很自信啊,直接说中板了是吧,他这个识别到了啥? 再高音再高音再高音再高音再高,这已经过去多久了?我感觉已经半小时了吧。好了,他这个好像是剪好了,我感觉我们再来看一下。这有问题啊,这怎么变成时间又变长了呢?五十七秒。刚夸完他这个就活就干的不好了。想买相机的先停一下, 很多人第一步就错了。不行啊,他这个还不如之前那版呢。你现在给的这个版本气口 都没有剪,我已经快对他失去耐心了。好的,哎呀,又出了一版啊。他这个这个叫做去重复超紧凑版, 这个别的不行,这命名还一套一套的。这个只有四十二秒。想买相机的先停一下啊。我感觉他只是把后边剪掉了。 后面剪掉了,这前面没动弹。他没有剪啊,我感觉这条路似乎走不通了。又开始了又开始了,又来了。一版内容清前版。哈哈哈。 ok, 他 又回复了,他说前一版更偏简短,不是要你要的按内容去去重。 我重做了一版,把中间重复的口播去掉了。我已经逐渐对他失去耐心了,我已经崩溃了。可能 ai 领域也有一些人做专门的 ai 剪辑的软件,可能会效果更好, 但是我们县级段,我们我们的原则就是用这个软件让他来做啊,我们尽量不去参与到这件事里边,所以所以目前来看的话 不太行。那就用最终这个版本,基于这个版本帮我做一个封面图,这个应该比比剪视频容易多了,对吧?他只需要截取一个画面,然后生成一个封面图,但我们先不给他提这个 具体的要求啊,就是让他帮我做,看他能做成什么样。来了,哎,来了就很快。封面图相机三点吸金版,哈哈哈,吸金版,这,哎,字,字体有问题哎,封面图上的文字 有问题,他是先截取了一张这个,然后给你生成了这个。哎,来了,买相机别乱买,先看这三点,对焦防抖镜头生态爆款干货哈。 他下面还有个啥?下面下面怎么还叠了个什么什么二二零什么什么口播,隐隐约约的。嗯,我们继续这版让他改一下吧,中文可以正常显示了,但是字体不好看哎,这个要好一些了啊,他加了边框还有阴影,加一些美化的图形质感加强版。 呃,呵呵,反正他加了一些,质感还行吧。二零二六实实测口播,把右上角的实测口播去掉,好像给我的画面调了色,也就这样了,对吧。 我们要求不能太高,我们让他给我们生成一下字幕,我天呐,生成好了,想买相机的先停一下, 很多人第一步就这个字幕也是不对的,就需要校准,那他他现在也没法很好的校准,而且他这字幕直接 直接这样了。我天呐,把字幕调小。好嘞,他又生成了一版啊,这个凑合吧,这还想买相机的,单纯看字幕的话还还可以,咱就不调了,咱就这样了吧。 啊,我们来进行这个收尾工作吧,把硬字木板封面图、视频发布文档放到一个发布文件夹啊,已经整理好了,我们看一看啊啊,这里封面图啊,是一个发布的文档啊,标题给了三个呢,非常的慷慨啊。简介标签, 帮我把视频发布到哔哩哔哩,我会帮你。呃,扫码登录我们来看看。这个也是很考验 ai 的 一个部分,这个工作它能完成。我觉得也还可以啊。你要先在 chrome 里打开一个窗口, 然后点一下 opencloud 的 浏览器扩展图标,帮我安装这个插件啊。它是没法帮我装的,我还是自己去装。我装好了,检测不到。你用你自己的浏览器上传可以吗? 可以,我用这边的独立浏览器帮你上传。他现在是用了他自己自带的一个浏览器,他可以操作啊。不是,我自己装的,他内置的一个浏览器。 来真的打开了这个哔哩哔哩页面啊,我们扫码一下,我看他能找到这个上传按钮吧,就在左上角这个投稿,看他能不能找到。 哎哎,找到了,有点慢啊,有点慢。找到了,接下来我们尽量不要去帮他,就让他自己来看能不能找到这个上传视频。这个按钮太慢了,如果是人类,正常人类的话就就就直接点了。就啊, 他卡在这个页面了,他找不到上传按钮了,他好像说什么因为路径权限的问题,没法把本地文件喂上去,最不耽误我的方法就是手动的把视频拖到 b 站上传,我发现你都没有点上传 视频那个按钮,你再试一下。 哎,他点了,我们看看能能不能找到那个路径啊,他只需要点到下载这个目录就能找到那个了,我看他能找到吗?不行啊,他好像做不到, 看这边怎么回事。那我们就受累给他点一下吧,我们选择 这里啊。刚才这个视频文件点这个上传,我现在已经把视频上传了,你把封面图标题这些东西给我填一下,忘了可以用语音输入的啊,视频已经上传好了,但是 ai 这边还没有 看他能不能完成这个上传资料填写的这个工作,哎,找到这这一了,看他能不能填。对啊,他至少识别到了这个标题这个输入框了,然后他需要在发布文档那里找到标题,给他粘贴过去,能不能完成这一步呢? 这是 b 站给生成的封面,那 b 站生成我觉得比他做的要好啊,又陷入了漫长的等待, 赶紧啊,上传完视频我可以下班了,我就呵呵,我就可以去吃饭了耶,标题填对了啊,不错不错,你终于干成了一件事。哎呀,你真的可以啊, 但现在一个新问题就是它还需要翻动这个页面,哎呀,会啊,它会翻啊。哇,标签填好了, 给你鼓掌啊。填好标签了,还有还有简介,可以可以,这终终于干干了点事,哈哈哈, 但是我这个跟影视剪辑有什么关系呢?我觉得又是漫长的等待呀。妈呀,这太慢了,太慢了。然后他又他又加了一个标签,他只是工作慢啊,人家还是在工作的,哎,给我们把简介粘贴好了, 你太棒了, ai, ok, 我 觉得这就是即使他能完成啊,就这个执行效率我是没法接受的,我真的是没法接受,这个效率真是 太太低了, ai 助理还在干活,还在上传这个视频呢。我们就最后跟大家做一下总结吧。首先大家今天看到了这些东西,它不能说明这个产品它是没有用的啊,它只能说明在某个领域,比如说我这个做视频这个领域,暂时它还不能代替人类,但这个东西有他非常擅长的部分,也 就是代码或者是指令这个部分啊,因为它背后其实还是在使用我们这些熟悉的大语言模型,比如说 change、 gpt 了,或者说千万了这些啊,把我们在这些诉求给转化成一条条的指令去执行。如果你在操作这个对象,它是支持用指令或者说是代码操作的话, 嗯,这个产品就会非常擅长。就比如说你家里这个路由器,它是可能有的,是有带系统的,它是能够用代码用指令去操作的, 你就可以让这个 ai 进到你的系统的那个路由器里面去帮你去改一些设置,它要比你去改啊,更快呃,更加的有效率。 相反,如果一个东西它是需要大量的依赖这个图形界面操作的话,就比如说剪辑,或者说是这个上传视频这些东西它也能做啊,但它的逻辑其实是把画面识别之后, 识别这个文字再去判断该怎么去点,只能说能做,但是非常的慢,非常的效率低下,而且经常会出错,不准确啊,这个方面是远远要低于人类的操作的县级段。这个产品它更加适合这种开发人员或者程序员人员这个群体,因为 天生的就这些人,他们用的这个工具啊,都是支持这个代码或者说是指令操作的。那这个产品它第二个问题就是如果你想要让他给你全盘的去完成你的许多工作的话, 你就需要充分的放权给他访问你各种私密文件的的能力,因为你不给的话,他就没法操作,但是你给了他这些能力的话就存在一定的风险,所以现阶段我是不敢让他去做更加偏向个人隐私的这些操作的,因为是 会很危险的。那第三个问题就是这个产品目前用起来是有很多的门槛的,一方面它的体验没有那么好,你比如说它是一个英文界面,你设置它的话需要有一定的技术的知识才能去设置,哪怕你去看别人做的那个教程,你跟着做,你也会遇到一些奇怪的问题,你要去修复。 第二就是这个产品你想要用的好的话,你需要给他接入很聪明的模型才行的,你不能用免费的模型,免费的模型就会很慢,那用付费的模型带来一个新的问题,就是很贵啊,你让他随便干件事,就比如说上传一个视频的话,他就要动不动就花掉你几美元的或者是几十块钱的,这个 所谓的 token 性价比是很低的。目前我让他在做了一件事情就是,呃,可以去帮我看看网址,帮我汇报一些问题, 这个还挺好的,因为天生的这些服务器都是代可以通过这个代码或者是指定操作的,那就仅此而已了,我还没有找到一些真正可以替代我的工作的一些场景那。说了这么多这个产品的问题,但我觉得他也是有他的可取之处的,最主要的就是他的一个人机交互方式,就是他你是可以通过这种 聊天窗口的方式直接给他安排活之后的工作,他会想尽办法去帮你完成 你要做的事情,就真的就是像安排一个助理那样去通过一个聊天窗口去说话就可以了,只不过有的工作他现在还做的不是很好。但是我觉得现在的最大问题在于我们现在电脑上用的很多软件,包括这些图形界面的软件都是给人类设计的,他不是为了给这个 ai 设计的, 这些图形界面是为了我们眼睛看到鼠标点到来而设计的。如果未来这些软件都为 ai 提供一套接口,让 ai 可以 更方便的操作,那么那个时候这个 ai 去 帮我们工作的这个效率将会非常的高,甚至可以接管我们大多数的工作。但现阶段还是不可以的,所以从这个角度讲的话,我还是挺看好这样的产品的。嗯,你可以想象一下,未来你可能真的是 你随随时就是用用手机就可以安排你的这个 ar 员工帮你工作了,帮你做一张图片,或者说是帮你剪辑一个视频。但现阶段的话,我觉得我们只能把它作为一个很好的一个未来出行的这样一个参考, 他还能要要走的路还是比较远的。 ok, 那 以上就是本期视频的所有内容了,如果大家关于 ar 还有一些想要让我去体验的东西,也可以给我留言分享,我最近其实对这方面还挺上头的, 而且我最近也在用这个就是 ar 编程,在做一些小的项目,这个感觉我觉得比用这个 open clone 啊更好,因为那个真的是 呃,可以替代你写代码了。那今天视频就到这里了,感谢大家观看,我是基地,我们现在再见,拜拜。

装了 openclaw, 但发现它什么也干不了,甚至有点笨。那是因为你还没有去 clawhub 给它装 skill。 clawhub 上有一万七千多个 skill, 我 从下载量前三十和我自己高频使用的做了交叉筛选, 只推荐这十个,装完至少强三倍。第一个 skill writing, 安全审查员,他会在你安装任何 skill 之前扫描安全风险检查红旗标识、权健范围和可疑模式,能检测 prom 的 注入工具、逃毒、隐藏恶意代码。建议在装任何其他 skill 之前先把它装上。第二个自我进化 skill, 它是 cloud 交互下载量第一的 scale, 解决大模型失忆症。它会自动把每次的错误日期、成功经验和你的编号存到本地数据库,下次遇到类似问题,直接调用历史经验实现,越用越聪明。这个 scale 的 价值不在于第一天,而在于第三十天, 用的越久, agent 越像你的数字分身。第三个, tablie search ai 专属搜索引擎,让 agent 学会上网搜索,而且搜出来结果是 ai 友好的。 不同于传统搜索引擎返回一堆链接, tabl 直接返回干净的结构化内容, agent 拿到就能用。第四个 summarize, 全格式内容,摘药专家,网页、 pdf, 图片、音频、视频,什么格式都能一口吞下去给你摘药。 我的日常用法是 tabla 搜索加 summary 总结,先搜到相关页面,再把整篇内容压缩成五百字未给上架文,效率翻倍。第五个, find scales, 寻找 scale 的 scale, 用自然语言告诉 agent 你 需要什么技能,它帮你找到并安装对应的 scale, 不知道装什么的时候直接问他就行。六个 using superpowers 来源于 superpowers, 这个强大的插件,核心理念是让 agent 严格按照先查 scale 再行动的规则做事,杜绝偷懒和无距离探索。如果你发现 agent 不 用你装好的 scale, 就 自己瞎搞, 这个 scale 能帮你管教他。第七个, react 最佳实践技能的性能优化圣经 worst one 方共同团队出品, react 和 next 最佳实践前端开发者必装。 第八个前端设计技能,帮你写出更有设计感的前端页面。按 zorbike 官方出品强制 agent 先做设计思考,再写代码,把从能跑就行提升到设计合格。第九个, github github 全流程操控,让 agent 直接操作你的 github 仓库, asos prci 一 条命令搞定。最后一个浏览器操作技能,让你的 opencloud 像人一样打开网页,点击按钮,填写表单,截图画面。最后帮大家总结一下。

你能在浏览器里做的工作, openclaw 都能帮你做,而且二十四小时不停地做,调研、情报、学习、写作、投资信息等等等等。今天我们循序渐进的介绍四种方案,从内置的工具开始,到依赖 api, 不 依赖浏览器的 skills, 再到隔离用户档案的浏览器自动化,最后到完全接管你当前浏览器状态的方法,每一个我们都说明白它的原理,优点、缺点,如何设置,以及最重要的适用场景。好的,废话不多说,我们开始如果你还没有设置 open club, 不知道选什么机器好。哎,看完这个视频之后啊,去看我的上映视频,真的非常的简单。 首先我们看 opencloud 以及内置的 web fetch 节点,它的原理啊,就是一个网页抓取和正文提取的工具链,它用 http 请求去抓网页的内容,这是服务端的抓取啊,不依赖于你本地正在用的浏览器, 也不会附用你任何浏览器的档案啊,资料啊, cookie 啊,拓展等等等等。它就是把 html 作为正文提取, 玻璃调导航栏,页角,广告、侧边栏等等的噪音。那么输出的是干净的 markdown, 它适合什么呢?它适合所有公开可访问内容,主要在 html 里面的网页,比方说文章,博克,公告这些, 它做不了什么呢?哎,它不是浏览器,它没法执行 java script, 也就是说所有需要登录、交互、翻页、滚动点击这些它都做不了。 它的优点啊,非常的明显啊,它速度快,成本低,因为它不需要启动浏览器,不需要渲染。它呢,适合二十四小时长期的扫描输出,更干净也更安全,因为它完全不碰你的个人浏览器,它不接管你的账户的登录态。 那么缺点也非常的明显,他看不到需要登录,需要 cookie 的 内容。那么比方说所有的社交网络,他呢,不能执行 java script, 所以 需要互动的内容他都做不了。然后呢,他呢,非常容易受反派机制和地域的限制,那么他的价值和使用场景来自于两个方面,不论是你做生意有竞争者,还是有对标者, 还是你想要学习或者某一个网站,那么你都可以第一时间,哎,关注到这个网站,爬取这个网站最新的定价的消息,它是不是有发布新的 i c u 的 文章,那么它啊,有没有调整它的政策,这些你都可以第一时间知道。第二就是,哎,有些公开的信息啊,比方说你关注 ai 领域,那么 open ai, spatial, jin 奈他们的官方的 啊,文档,他们官方的网站的最新信息呢,都可以被你抓取到,你可以第一时间知道这些信息。除此之外呢,比方说一些公开的网站啊, archibald, 如果你读文章的话,还就是维基百科, hack news, 这些网站都可以公开地爬取。 它的缺点也是非常非常明显啊,任何的社交媒体上的高价值信息,尤其是需要你登录进去的有关于你的信息,它都抓取不了,不能够定制化。那么如何设置呢?哎,完全不需要设置,你安装了 opencloud 之后,那 web fetch 工具就已经安装在内了,那么任何需要网络抓取的任务,没有其他方法的话,它都会默认走 web fetch 可以看到这里啊,我让他啊,用 wifi 去抓任何关于 opencloud 的 啊具有趋势的信息。那么由于呢,我这里已经安装了其他的方法,所以如果我只布置明道性的用 wifi 的 话,他就会去用我浏览器的方法了,那这个我们后面马上会讲到,你可以看到这里,他就会去 hack news 上抓取 相关的 open cloud 相关的信息给我了。那么用内置工具最大的缺点就是任何社交网络它都做不了,那么由此我们衍生出第二种方法,也是不依赖浏览器的 skills。 那 么第二种方法,我们用的这个 skill 叫做 last thirty days, 本身上我们就可以规定一段时间内啊,最低抓昨天的,要么就是三十天以内,最多我们去抓取社交媒体上 x reddit, youtube 上最新的爆点,痛点,舆论趣事等等等等,它只是用来做抓取的这样一个工具,那么它的原理也非常的简单,就是广撒网,然后再聚焦 reddit 上的信息来自于 open i 的 网络搜索功能, x 社的信息来自于 x a i 的 网络搜索功能与 top 的 信息,来自于 y t d r p 这个开源库。 首先啊,先搜索信息,然后对于这些高频的关键词呢,它就会再聚焦 subraded 或者是一个账号,再进行二次的补搜。最后啊,根据出现的频率和动信号来做加权的总结。 那优点,首先第一个就是它三个主要的社交媒体平台都顾及到了,都抓取了,所以它后面呢,还可以对它们这些信息的来源进行交叉验证。 第二个优点就是它毕竟不需要浏览器嘛,所以它是个轻量级的方案,它第一个缺点就是它需要 api, 就 它不是免费的方案。第二个缺点呢,就是它只能做 情报的获取,舆论的监控,爆点痛点的挖掘,对吧?它做不了任何浏览器,需要我们浏览器的操作,比方说鼠标点击啊啊,比方说帮我们发表文章等等,它都做不了,那么这个是我们后来两种方法,依靠浏览器的两种方法,我们马上会讲到 这里,我提一句啊,就是这种依赖 a p i 的 方法,你完全没有必要用这个开源库,它做的不错,但是呢,你可以完全定义自己的算法,比方说 啊,三不同的来源,你认为 x 最重要,那你就对 x 进行更多的加权。这些算法的制定,你就完全可以通过自然语言跟你自己的 open cloud 机器人兑换的方式来进行设定你自己的算法。 那么关于安装呢,有两种方法,第一种方法就是通过 cloudhub, cloudhub 可以 看成是 opencloud 的 市场,里面有各种各样不同的 skills, 你 可以一行命令直接安装这个 skill, 它的优点就是快速简单,对吧?受到官方的支持。缺点就是,哎,它呢,里面的版本不一定是这个 skill 最新的版本,比方说在这里啊啊,我们在我安装的时候呢,它 cloudhub 里面的版本是 v 一 点零这个 skill, 但是呢,实际上 github 上我看到它这个最新的版本是 v 二点一啊,所以就隐身出来。我们的 第二种方法就是如果你想看安装这个 skill 最新的版本,但是 clubhouse 不是 最新的,你可以通过 get 来安装,这个就要稍微复杂,稍微麻烦一些了,那么具体怎么安装,一步一步的,我遇到的问题我都放在免费的社区里了,大家可以去社区里面免费去拿。还有一点就是安装的时候一定要多跟你的 open club 问他问题, 因为每个人的环境有所不同,娱乐的问题也会有些不一样,最好是问你的 open club, 而不是网页版的 gpt 或者是 gmail, 因为问他,他很可能在回答的过程中直接跟你把你问题解决了,而不是你还需要去问网页端的, 然后玩一段 g p d 给你回答,你再粘贴到这里,告诉你怎么操作。那由于取决于 api k 啊,所以我们还是要在安装完之后,去到点 config last thirty days, 点 e m v 文件下面填入我们的 open i s a 的 api k, 那 么因为它是个付费的这样一个功能,如果我不说多少钱,就显得过说不过去了,对吧?那么每一次深度搜索呢, 大概是零点二美元,也就是 x a i o p i 的 费用加起来大概包括 reddit 二十多个县城 x 啊,三十到六十个帖子, youtube 大 概四十个视频左右,每次搜索都会有点不一样,但是大概的费用是零点二美元左右。 这里有一个小 tips, 就是 一定不要用它来搜广泛的词,比方说 ai 这种词,用它搜尽量细致的关键词,比方说 openclaw 或者 openclaw setup 这种关键词才会有比较好的效果。比方这里啊,我让它用这个 skills 哎去给我找出。这两天之内,大家都在讨论关于 openclaw 的 比较火的帖子以及痛点,比方说比较火的帖子,大家都在讨论安全问题啊,可能性啊,还有就是它记忆的管理,以及多个智能体的使用案例。 那么关于痛点呢,大家都在说,就是更新之后啊,会有一些风险,还有就是可信的问题,安全性的问题等等等等啊,同时啊,他也可以看到他可以分析不同平台,他发现 x 上 啊是非常强的,大家在上面抱怨痛点, reddit 上呢,就会有更多的技术讨论,而与 twitter 呢啊,就是各种混在一起。 那么到现在为止,我们见识到两种方法都是无浏览器的方法,他们呢,可以抓取我们想要的信息,不管是社交媒体还不是社交媒体, 但是它还不能完全替代我们人类能在浏览器里做的所有工作,那么接下来我们就要正式建设两种新的方法,这种方法都依赖于浏览器 完全模拟人的操作,你能做什么,他们就能帮你做什么。好的我们来看第三种方式是由 open club 管理的浏览器,真正实现二十四小时期的浏览器自动化操作,它的原理啊,其实就是 open club 在 我们网关上启动一个谷歌浏览器的实力。 然后呢,你这是独立的用户档案,而不是附用你现有的浏览器的用户档案,所以呢,它有独立的拓展,独立的 cookie, 独立的缓存,都在这里面,你呢,可以手动的登录一次你的社交网站之后就可以一直长期服用了。 它的优点就是,哎,它实现二十四小时长期非常的稳定,只要你的网关是开着的,那么它就可以直接跑,不依赖于你的日常使用浏览器是不是开着? 第二个优点就是它安全,边界更清晰,因为它隔离了你的用户档案,它不会污染你平常你用来工作,你自己手动使用的日常浏览器的生态。 第三个就是它可控性强,你可以选择有头模式,如果你想要看到图形操作的界面的话,你可以选择有头模式,或者你可以选择无头模式,它自己在后面跑,对吧?它的缺点,首先就是,哎附用生态弱,因为它是新的一个用户档案,那么它不带你日常用户档案里那些插件啊,你的证书,那些密码管理器等。 第二个就是设备的一些风控问题啊,一些站点呢?对你这个新设备,你的新的这样一个用户档案可能会更加敏感,可能会容易触发额外的验证, 那么它的使用场景是什么呢?哎,你用浏览器做的东西都可以让它自动化来帮你做,只要你设置完之后,哎用自然语言的方式告诉他,你想要什么时候触发任务,去做什么样的任务就可以了。那么如何设置呢?其实也非常简单,分为三步,第一步就把下面的 open cloud 点 json 文件里面,然后填入 这个关于浏览器的内容参数,直接照抄这里的就可以,然后控制有头和无头的是这个这个 handleless 参数一开始推荐大家是填 form, 所以 说有头的,因为我们还是需要手动地登录,之后你可以登录之后可以把它调成无头的。 那么第二步就是,哎,我们去重启我们的网杆网关,然后呢,我们需要手动地弹出来,用这个命令手动地弹出来我们的谷歌浏览器。然后呢第三步,我们在弹出来的网页里面手动地进行登录,把我们的社交网站,所有的 x, youtube ready, 其他的网站都登录一下。 登录之后,哎,我们就可以回来用自然语言的方式给我们的 open call 命令,让它去帮我们做任何浏览器的操作了。 比如说这里啊,我首先给他一个任务,就是每天的九点,他要去帮我生成一个报告,关于 open cloud 所有的报点和所有的新闻。 那么可以看到他返回给我们说他任务完成了,每天就早上的九点,哎,都会有这样一个定时的任务进行执行。 然后后面我要让他现在就给我输出一个报告,我们现在先测试一下效果。我们首先看他给我们的热门话题啊,跟啊前面的那个 skills 也差不多。首先就是安全性的问题,大家都在讨论,另外就是可靠性的问题,还有就是哎记忆的问题,包括是各个多个智能体之间的协助的问题。 那么关于痛点他发觉就不一样了,他发现了就是在社交媒体上自动化,比方说 x 平台 l 存在一些限制,大家都在讨论这个问问题。然后就是一些啊维修的问题啊,比较复杂,包括安全性。 然后他每一个社交媒体啊都会有一个总结,告诉他在这个社交媒体上发现的关于 opencloak 相关的话题,大家在这里都在讨论什么?值得注意的一点就是这种方法能做的事情远不止于去社交媒体搜集信息, 这里我们用这个手机信息作为例子,是为了更好的对比四种不同的方法,但是呢,任何你在浏览器上做的工作,你都可以尝试让 opencloud 浏览器自动化来帮你做,只要你设定好边界和规则。 那么第四种方法就是我们也干脆不用一个单独的浏览器里面的用户档案了,我们直接复印我们现有的浏览器,现有我们的登录,用我们现有工作环境的一切。 这里啊,我们就需要安装一个谷歌浏览器插件,那么这个插件的名字叫做 open cloud relay, relay 就是 中继嘛,本质上就是我们安装的这个拓展和我们本地网关之间的交流,不是直接的啊,是通过 本地的中继作为桥梁来完成数据的传输的原理,不需要懂太多,哎,重要的是它的优点和缺点,对吧?那么它的优点最大的优点就是百分之百附用我们当前的啊,谷歌浏览器的档案,我们的 cookie, 我们安装过的任何的拓展,我们有的证书等等等等,哎,都可以百分之百的服用,相当于带你去操作你日常的工作了啊,而且呢,哎,你有什么问题你能直接看出来对吧?就在你的眼前,在你眼底的地下刨做你平常有那些网页, 他的最大的缺点啊,首先就是不得不提的就是危险性,为什么用它完全使用你当前的网页,网站等等等等的。 第二个点就是他需要一些手动的操作,后面我们会马上设置,你就会看到实际上每次我们还就要手动安装了这个拓展之后,还需要打开网页,然后手动的激活这个拓展才能够生效。 第三点就是他只能在你已经打开的网页上面操作,你没打开网页,他操作不了,他能做什么呢?他直接可以当你的分身,他不仅是自动化,可以自动化工作,而且呢,你附用你当前的一切,直接帮你完成工作。 同时呢,哎,你你的登录,你之前的使用习惯,你已经在网站积累了一些信任,那么他呢,可以直接在你这个基础上直接帮你工作,他不能做什么呢?或者他不适合做什么呢?本质上他不是很适合二十四小时长期帮你工作,因为你看 他首先只能在你打开的网页上工作,不能去别的网页,对吧?其次你还要手动点亮啊这个浏览器,激活这个浏览器这个拓展,否则他就不能工作,所以这是比较麻烦的一些点。那么我们如何安装他呢? 首先我们来到 openclock 官方文档,大家谷歌搜索 openclock from extension, 就 会来到这个网页,往下拉有一个安装的一步一步的步骤,我们,哎,首先复制第一个命令,来到终端粘贴这个命令,然后执行, 它会安装,然后给我们一个地址,我们复制这个地址,哎,只要记住这个地址,然后我们浏览器右上角点击拓展,然后管理拓展,打开开发者模式,然后上传未打包的文件, 然后呢,那个地址吗?还记得吗?哎,大家选择那个地址,打开文件夹之后,他会问你一个 token 对 吧?怎么获得呢?我们需要用到这个指令, 这个指令比较长,大家可以暂停截图一下啊,然后让 ai 识别出其中的文字,这个指令执行之后,我们会得到一个 token, 我 们复制这个 token, 然后粘贴到这里, 然后可以看到,哎,我们成功了。那么这时候我们打开任意一个网页,比方这里我们以 read it 为例子吧,因为它需要登录,也有比较高的价值。 我们这时候点开我们拓展按钮,把它给拼上,然后点击这个拓展,就会看到它有个 on, 说明生效了。这时候我们打开的任何网页,只要我们点亮了 on, 那 么我们就可以让我们的 open cloud 在 这些网页中执行任何 需要我们想要他做的操作了。好,那这里之后我们马上来试一下,我去另外一台机器的 diagram 里面,我让他去 read it 里面仔细寻找关于 opencloud 的 热点和痛点。 你们可以看到我在另外一台机器上,他自己对这个浏览器操作,他去了这个 opencloud 的 字板块找热点,然后他寻找 opencloud 一 术来找痛点, 最后他总结出答案来回答了我。那么这次搜索啊,明显更加细节针对 reddit 这一个平台,当然这只是一个平台啦,大家也可以用在其他的平台,比方说 i x, youtube 等等一切社交媒体或者其他的网站上,只要你打开网页点亮都可以操作。 好的,我们总结一下,尽管我们今天用了信息收集、爆点挖掘、通点挖掘这样一个例子来啊验证这四种不同的方法,但是本质上第三种,第四种用浏览器的方法,你都可以让他做。你任何在浏览器需要上网做的工作不仅限于通点挖掘, 那么大家可以想想自己在日常生活中什么工作,在浏览器的工作是可以让 ai 帮你做的,来提高效率,来增大你的产出。有什么问题大家可以在评论区里告诉我,不要忘记点赞和关注,我们下期再见。

这周我们烧了十亿多的 token, 在 openclaw 上大概就是一千五百美金吧。呃,但是我觉得非常值啊,因为我们终于 figure out, 怎么去管理一个 ai agents 团队, 所以如果你是一个艺人公司,或者你想用 ai 来管理协调你的整个团队的话呢?那请看完这条视频,因为我们已经帮你省下了一千五百刀的学费。 整个 a i a 阵子团队的协调枢纽和核心呢,就是最近这个特别火的 openclaw, 他 只要被调教好了,就是一个非常完美的项目经理。但也像所有刚招进团队的同事一样, openclaw 本身并不是一个开箱即用的 数字员工,我们需要去培训,他就是什么事情能做,什么事情需要让其他的人类同事或者其他的 agence 搞定进度该怎么汇报?有哪些规则要遵守?那么这些规则呢?在 open core 里其实就是一个叫做 agence 点 md 的 文档, 这个文档就定义了 ai 的 所有行为准则,它是一个配置文件,基础的配置就非常简单,就像一个没有被培训过的新员工一样。但是在过去一周的时间里,我们不断的去优化这个配置文件,让他成长到了可以帮我们去协调其他 六七个 a 公司的一个项目经理。那我们其实主要增强了他在以下三个方面的核心能力吧。第一个就是主动性, 因为很多人说 agents, 大家觉得他只是一个工具,只是一个机器人,那是因为他们是被动的,就是你给他一个指令,他就去执行一次, 然后你推一推他,他就往前走一步,他并不会主动的去想办法解决他遇到的问题,也不会主动的复盘和思考说怎么样把一件事情做得更好。 那如果 aids 只做到这样的程度呢?它确实只能当一个螺丝钉,但是 open course 不 一样的,它本身有一个心跳机制,就是 heartbeat 会定时去检查哪些项目卡住了,然后哪里遇到了它自己解决不了的问题,并且主动跟我们去汇报。 当然只做到这个程度的话,肯定还是不够的,所以我们在 a 证点 m d 里呢,就配置了更多的规则,让它能够做到不需要我去问任何一个项目的进度,它就可以完全汇报给我。 第二是可重入性,可重入性其实就是说这个 a 证它能不能稳定的靠谱的把一个很长期的东西干完, 它并不是说这个 agents 可以 百分之一百的在线,永远保持 up time, 因为项目的推进总是会出现问题的,然后网络即便再好的网络环境也会有意外的中断,所以我们要的其实是 它能够在项目中断,网络断掉了之后,当它重入的时候,能够从断掉的地方稳定地继续向前推进,它甚至可以去 fix 去解决为什么会断掉了这个问题。 openclaw 的 工作记忆管理,呃,其实是被动进行的,也就是说如果他认为和你对话当中没有涉及到什么重要的任务,没有涉及到什么重要的内容,他是不会主动记录到他。当他的工作日记当中 就导致比如说你重启了 gate 位之后,它就忘记了它在干嘛,所以我们在调试的过程当中呢,就优化了它去主动压缩上下文,主动刷新 session 的 这个配置,让它能够在横跨多天的非常长的任务或者是对话当中,依然清楚地知道啊不同的项目应该怎么样去推荐。 然后第三点,我们对它的改进,我觉得可以称之为 a gentle thinking, 就是 像 agent 像 ai 一 样去思考。因为很多人觉得调教 ai 来进行人机写作,应该是像 agent 像人类一样思考,但是我觉得恰恰相反,因为归机生物就应该用他们自己最熟悉,他们自己干的最好的方式来解决问题。我举个例子,大家肯定都让自己的 agent 去做过一些很简单的自动化,比如说去帮你发一条推特,去帮你在 tapp 上面呃 发一个 issue。 那 这个时候 a 正题有很多技能是可以用来干这个事情的,比如他可以像人类一样去操作浏览器,模拟人类的点击和思考,模拟人类在浏览器的输入框中,用键盘输入 来完成这条帖子的发送。当然呢,他也可以直接写一段呃 js playwrite 的 脚本,调用这个脚本来实现刚才的这个任务。但是最高效或者说最省钱最快速的方法, 肯定显然就是他直接去调用呃相关平台的这个 api。 那 么在刚才的这个任务里,比如说发帖子,在所有他可用的方式里,最慢最浪费投坑的方式其实就是模仿人类的这个方式。所以我们在给 openclaw 定的这个行为准则当中呢,就明确规定了 他在不同工具托 use 的 一个优先级,优先级高低吧,就不仅是当他自己要去解决问题的时候,应该以一个什么样的方式思考,什么样的方式去用工具,包括当他要和其他的 agents 交互的时候该怎么办?比如我们团队当中的 ai 工程师就是 cloud code, 那 open code 跟 cloud code 去共享一个项目 context 的 时候呢?它根本就不需要像人类一样,两个 agents 那 边开会聊天,它只要把自己在这个项目上的工作记忆日记直接把那个路径开放给 cloud code 就 可以了, 它们就直接可以完成整个工作 context 的 共享。除了上面的几个主要配置优化呢,我们还做了很多在细节层面的调整。呃,我也把这个版本的配置文件 留在评论区了,大家可以直接把它发给你自己的 agent, 他 就会自己根据这个文件里的指示完成所有的升级。 all right 我是 v a 七,现在在做一家 ai 加跨境的公司,如果你也想探索 ai agents 或者是相关的业务领域的话,欢迎来一起交流。 have a good one。

哎,好的好的,大家好,我们今天手动来带大家从零到一部署在自己电脑上面部署一下最近火爆全网的这个 cloud bot 啊,现在已经改名叫 opencloud, 我 们从零开始,首先我们去 opencloud ai 这个官网,然后往下滑,它有一个 one liner 的 这个 quick start, 非常简单,你只要在复制这个代码,然后开一个命令行,然后把它黏贴进去, 它就会自动去安装这个 opencall, 它会去检测联盟装着 homebrew, nojs 和 git 啊,如果没有的话呢,它会帮你去安装,我这边已经有了,所以它自动开始在安装这个 opencall。 好 的,安装完毕,安装完毕的话,它会自动会进入这个 onboarding 的 这么一个流程啊,它也是非常人性化。首先让你先来先签个协议啊,说这个很 powerful, 但也很 risky 啊。我知道了, onboarding mode, 我 们选 quick start。 然后第一步呢,是我们要接一个模型啊,在后端的模型,它虽然就 open call, 它只是一个中间层吧,你后端的模型还是需要用自己的 a p i 的。 之前呢是我我尝试使用这个 cloud code 的 订阅,可以接入这个 open call, 但是前段时间 cloud code 把它给封了,所以现在就必须只能调用 a p i, 所以美国的模型 api 太贵了,所以我们这里选择支持一下国产。我们使用 kimi 的 模型啊, moonshot ai, 然后 kimi 最近也是浪潮了,自己的这个 kimi k two 呃,二点五的这么一个模型啊,能力上据说是跟 opps 四点五非常相像啊,也是很厉害,然后价格可能只有十分之一,所以我们来体验一下,所以我们这里选 moonshot ai, 月色暗面, 然后把我们之前复制好的一个 api key 给复制进去, create a api key, 然后我们选择一个模型,我们就选 kimi k 二点五。然后呢,我们在这里选的是 在第二步呢,是选这个 channel, 就是 call bot, 呃, open call, 它是可以让你用过用你的这个即时聊天软件,然后来调用它的啊,这里就会去配置一下这个即时聊天软件。我在这里选的是,呃, whatsapp, 然后我们来看一下 whatsapp 怎么 link 啊,它会给你二维码,然后我们要拿 whatsapp 扫一下二维码。 好,我们拿这个 whatsapp 刚刚扫了一下这上面的二维码,然后,呃,现在是可以去继续去设置一下详细的配置。 whatsapp, 它里面有一些 phone, 呃,这个是 phone setup 啊, separate phone just for open call。 我 选择用一个单独的电话号码在 whatsapp 里面,然后这里使用,选择 recommended power mode allow form。 说实话不是很知道是干嘛了。嗯,选择 default 好 了,然后下一步呢,是 configure 这个一些技能啊,这里我先不 configure, 但是我们看一下, 呃,这个 open call 它有哪些技能啊?这些技能本质上来说就是它到底能做哪些事情,你可以看它这里有非常多的集成的这个 integration, 就 你的密钥,密钥管理系统 word 是 可以用来发这个 twitter 的, 然后 bear nose 是 可以用来这个记笔记的一些东西,然后有非常非常多的这个,还有什么 g u g 这种 就是 gmail 啊什么的,非常非常多 open ai 啊什么的很多啊,我们这里今天先不配置了,然后回过头也可以再配置,到时候会问你一些问题,要不要这些 a p i key 有 多选? no no, 如果到时候需要的话呢,可以再单独回过头来配置 好。然后最后一步呢,是这个 hook 啊,自动的这个操作,然后它可以在某些特定的环境下面被触发,然后帮你操作。比如说它这里有一个 session memory 的 这个 hook, 就是说它可以在每个赛季结束的时候呢,自动把赛季的这个你们聊天对话记录呢,保存到他们的这个长期的这个 memory 当中。这里我觉得还是开一下比较好,因为 open call 它是自带这种长期 memory 的 功能的,然后如果每每每一次跟他对话,它会更新长期 memory 的 话,你会发现这个 open call 越用越聪明。 好,然后这些都是系统自带的,我就都开了,然后都开了,然后去设置 gateway, gateway 就是 说是呃呃,如如何去开这个?开个关口,然后让可以让这个你在 whatsapp 里面发送的消息被传递到这个电脑上的 open call 里面。这里我之前已经装过了,所以我们在这里的话就是 reinstall 一下。 好,我们这里的 git 已经装好了,我们现在有有有方法去 hack。 我 的 bug 就是 初设啊,初设的话我们可以推荐是走这个 t u i, 也就是它自己会开一个网页,然后这有一个链接好,然后可以尝试发个消息 啊,很可惜啊,消息没有发成功,我要来 debug 一下。哎,好的,刚刚发现是因为自己的那个 kimi 账号没有充钱啊,现在充了钱就变强了啊,我们现在已经可以 跟他对话了,然后我们在终端呢,可以输入这个 open opencloud dashboard, 然后呢我们来重新进进入这个网页的 ui 啊,然后这里呢我跟他说了个嗨,然后他现在会介绍一下自己可以干哪些事情啊?怎么怎么样,怎么怎么样都是英文啊,太,太烦了,我看他看中文那里边啊, 好,他现在等于说一开始的对话呢,他会让你去呃设置一下他的名字是什么,然后怎么称呼我,然后他是干嘛的?嗯,然后同时呢我们我来就展示一下这个我们这个 whatsapp 的 这个能力啊,就你看我们这边, 嗯,其实 whatsapp 上面是可以给大家直接发消息的,然后在这里的所有的信息呢,我们也都可以在 whatsapp 里面跟他呃聊天,然后他就只要你的这个网关是上线的,他就是可以呃去跑的。 那么今天视频就到这里呢,我们就简单的装一下 cloud bot, 未来的话我们也会在这里继续更新一下 cloud bot 到底能在呃能对我的工作流程带来多大的影响啊?期待可以创造更好的内容给大家,谢谢。

给大家分享一个我踩的一个坑,就是在 openclaw 里面,它虽然可以帮你开发代码,但是有这种大量的参考图的需求开发,我建议大家还是回到 ide, 自己把这些贴图在 ide 当中粘贴给 ai 编程工具,让它去开发, 因为它能够识别那些图片,但是在 openclaw 里面是很难做到的,为什么呢? openclaw 现在就我觉得两种编程的方式,一种是直接把需求告诉他,让他给你编码,但这种长时间的任务会被 openclaw 杀掉,所以我不建议大家去这么去做。 还有一种方法就是我昨天推荐的用 tmux 让 openclaw 当一个传话筒,真正的编程工具是在 tmux 里面去执行的,那这种就面临一个很大的弊端,它没有办法把图片传过去, 所以那边的编程工具他根本就不知道你要参考什么样的图片,因为他拿不到图片,所以我觉得在 openclaw 里面让他帮你去写代码的话,更合适的是那种不需要大量 ui 界面的 需求,如果需要更改大量的 ui 界面,并且需要基于参考图来开发的情况,我建议大家还是回到 i d e。 当然这是我个人目前踩的坑,如果大家有更好的办法能够解决这个问题的话,也欢迎大家在评论区告诉我。

大家好,今天我来教大家如何在 windows 系统上快速安装部署 open clone。 open clone 是 一个强大的 ai 工具,可以帮你更加高效地处理各种任务。 安装过程其实也挺简单的,只需要几分钟就能搞定了。 首先我们先登录它的官网,也就是 open clone 点 ai, 然后在下面这里找到这个运行到你的机器上, 打开之后我们可以把它切换到这个中文模式,也就是这个,然后点击安装这里一个步骤,这是系统要求 windows 所要求运行在 wsl 二上面。 首先的话,我们需要在 windows 系统上安装这个 wsl 二, wsl 二是适用于 linux 的 windows 子系统,允许开发人员在 windows 上运行 linux 的 环境。然后这是个安装文档, 首先我们要运行这个 wsl 杠杠一 doo 命令,我们可以打开这个终端, 这终端必须使用管理员的身份打开, 我们搜索, 我们以管理员的身份打开终端右键,以管理员的身份运行,然后输入这个 wsl。 杠杠一 stop, 我 这边已经安装了,所以说就不用执行这个步骤了。 在安装 wsl 的 时候,我们可能会碰到一些问题,比如说没有开启这个虚拟平台就会导致这安装失败,所以说我们要确定一下, 我们可以在这开始的时候输入这个 windows 功能, 点击,然后从列表中选择打开或者关闭 windows 功能, 然后找到这个虚拟平台。 我这边已经勾选了,所以说不需要再次勾选。 然后当这个命令执行完毕之后, 我们可以检查一下当前运行的版版本是什么,点击复制, 然后当前运行版本是 g o 乌班图的,我们可以换成其他的版本也可以, 如果想更改版本的话,我们可以通过这个命令进行更改,或者打开这个应用商店 输入, 然后咨询选择版本进行安装。我已经安装着过了这个二十二点四的, 然后安装完成之后我们搜索这个终端,然后点击,点击之后这里有个侠列表,我们选择这个安装的无弯图, 然后这里开启我们真正的安装步骤,然后在这里我们就可以暂时安装了, 我们首先使用这个快速安装命令,点击复制粘贴回车,然后这里会让我们输入这个密码,就是当时我们安装这个 double s l 的 时候会有个密码输入, 输入完成之后回车,然后接下来它就开始安装了, 这里已经下载完了,然后这是正式的安装步骤,然后这里让我们是否继续,我们选择是到这里我们选择第一个, 然后这个揭露的模型是让我们选择哪个模型啊?这里就选择这个千问的模型就行了,然后这里会让我们等待,让我们登录这个阿里千问的模型, 我们需要把这个网址复制,复制到浏览器粘贴, 然后我们需要登录到这个千万模型,然后这边我已经登录自己邮箱,并且认证成功了,然后我们回到这个命令,行, 这个 let, 我 们选择对应的模型,我们选择这个保持默认就行了。当前模型, 然后这个的话是配置那个飞书或者其他工具,安装的时候可以选择这个跳过, 然后这个的话是让我们现在是否配置几呢?选择否,然后这里的话是通过这个空格键选择,这是因为是多选的嘛。然后我们这个也跳过就行了,让安回车。 然后这个是让我们通过哪些方式进行预览?我们一般选择这个,通过这个 web, 也就是网页, 然后到这里我们就已经安装完成了,并且这个也已经启动了。然后在上面他会有个地址,我们复制这个地址, 然后粘贴到浏览器,然后这个就代表已经安装成功了,我可以跟他聊天, 你是谁? 好,然后这个就代表已经安装成功了。 好了,这个 open clone 龙虾已经安装完成了。是不是挺简单的? 然后今天视频就到这里了啊,感谢观看,然后下期再见。

最近网上流行的养龙虾,也就是 open club, 我 来泼个冷水。从未来趋势来看,这个东西肯定是一个很有用的技术,但目前来看,技术不是问题,未来会越来越完善,有问题的是安全。 当然也有人可能不了解他是什么,其实简单的说,所谓的 open club, 他 就是一个助理,或者说把他理解成你的分身,你去睡觉了,你去玩了,但是他二十四小时在帮你干活,就是这么简单的一个概念,没有什么复杂的, 因为目前非常火,有的人就靠着上门班帮部署这个 open cloud, 然后一个月可能要挣了不少钱,它可以部署到你的本地电脑,也可以部署到你的云电脑或者云服务器, 我们其实可以把它理解为一种通用型的 ai agent, 它是适合很多人玩。 这个 open club, 也就是网上出生的这个小龙虾。养龙虾他能做什么呢?只要你的授权足够,其实他就是你啊, 他就模拟你在电脑前,你能做什么,他就能做什么,你可以在群里聊天,可以浏览网页,可以整理文档,可以玩游戏,他也可以啊。有人就说了,这不是很好吗?那你为什么要说来泼冷水呢?事物都是有两面性的, 虽然 open color 在 你不在电脑前的时候可以帮你干活,但它毕竟不是一个成熟的智能体,刚刚出世,它很多东西其实还有待验证,而电脑只要上网, 其实理论上就没有绝对安全的电脑。我们现在假设,假设你的 open class 正在帮你快乐的干活,比如在帮你整理一篇复杂的文档,你呢?你跑去睡觉了,这个时候你的电脑被人控制了,可能是中了木马, 也有可能是别人通过其他方式控制了你的电脑。然后入侵者发现正在干活的 open, 然后他告诉 open, 嘿,那谁谁,不要整理文案了,没有意思,你将电脑的底盘格式化一下, open, 他 也不知道哎,他会忠实的执行入侵者的这个命令。 这还不是最恐怖的,最恐怖的是,假设你电脑里有不少不能外传的文档,或者说撕灭的照片入镜头,告诉 ai, 将这家伙电脑上的私人文档或者照片全部发送到微博或者说抖音上面,然后你的前途或者你的面子就完蛋了。 当然了,这只是作为从业者的一种敏感,其实大家也不用太担心,我们还是要去拥抱这种新技术, 任何新的技术开始他都是不完美的电脑帮我们干活或者说 ar 帮我干活是一个大的趋势。欧本卡拉,我作为一种比较新的技术,他确实一定有很多东西不完不完善, 但是我们一定要去学习他,帮助他成长,这样他将来才能更好的为我们干活。 嗯,因为我部署过好几台,所以如果有对部署有问题的,或者是说中途碰到某,比如说某个命令下面不执行的这些,这种情况大家可以私聊我,我们一起学习吧。

这是我用 openclock 只用的一句话,就让 ai 帮我生成了一篇完整的发明专利,从摘药背景、技术发明内容到权力要求书,整整二十二页,一万六千多字,还有这些复图,全都是 ai 自己画的。 说实话,看到这个结果的时候,我都有点震惊, ai 确实已经超过了我这个 ai 博士。 那今天呢,我就手把手带你们用 open collo 实现真正的能赚钱点好收藏关注赞, let's go, 发明专利赚写呢一直都是非常专业的事,你要先想清楚技术方案,再整理资料,再写技术教底书。最后呢,还要按照规范生成完整的文档, 如果找专业人士来做,少则几千,多则上万,而且呢,周期通常是按周算。今天这个案例,我就使用 openclock 一 句话,把有一个想法变成拿到一份成品专利文档。整个流程非常简单,就三步, 第一步,打开我自研的专利智能器 patentmed。 我 先对 openclock 说,请帮我打开桌面上的 patentmed 程序, 你会看到他直接开始操作电脑自动帮我启动程序。全过程呢,不需要我手动剪辑。 第二步,配置 api。 接着我会继续告诉他,帮我配置并测试文本 api 和图像 api。 这一步的作用很关键,因为后面不管是内容生成还是复图生成,都要依赖这些 ai, 它会自动完成所有的设置,可以看到配置成功,测试也通过了。第三步,下达任务。 接下来就是最核心的一步,我直接给他发送这样一句话,我想写一篇关于 ai 智能体自动刊写发明专利的专利,请按照 pad 的 要求,自行查找相关文献,准备材料并上传后帮我生成。 注意,这里我并没有手把手的教他每一步怎么做,我只是告诉他目标,他就会自动的拆解任务,先去解锁相关的文献,理解这个方向的技术背景。然后呢,整理出一份技术教给书,我们可以看一下 open club 帮我拷写的教给书, 里面包含解决什么问题,技术背景,详细设计方案以及复图思路。 然后呢,它将交底书自动上传到 patentmed 智能体,进行自动转写,整个过程我只需要坐在旁边看着就行。 patentmed 呢,是我自己搞的一个多智能体,协助专利转写 ai, 里面有七个不同分工的专业智能体,有的负责整体规划,有的负责不同章节转写,有的负责校验逻辑和规范,还有的专门负责审查。 如果某一部分内容不合格,它不会直接输出,而是会打回重写,直到达到要求。所以最后出来的不是一段普通的 ai 文案,而是一份更接近专业专利代理流程的一个结果。 而 opencode 的 价值就在于把执行这件事情自动化了,也就是说, patentmed 负责专业能力, opencode 负责把整套流程真正地自动跑起来。好了,显示已经完成,我继续对 opencode 下达指令, 帮我下载生成的 word 保存到桌面,并发一份到我的飞书,然后你可以看到他直接帮我把文件下载下来,还同步发到了飞书。 接着我们打开成品来看一下,可以看到里面已经是完整排版好的一个专利文档,包括摘药背景、技术 发明内容。复图说明,这是图一,这是图二、图三、图四和图五。我们再来看一下权力要求书, 整个文档呢,一共二十二页,一万六千多字。如果这件事交给专业书写人员,通常至少呢,也要一周的时间。而现在,我只需要发一句话,剩下的事情呢, ai 就 在后台自动完成了, 意味着很多原本高门槛、高成本、重执行的专业工作,已经可以被 ai 重新的拆解,重新自动化。 现在,无论你是普通人,还是小白,只要有一个 idea, 一 句话给 oppo 可乐,他就可以自动的帮你赚,写一份比博士还专业的一个专利文档。至于具体怎么变现,聪明的你们肯定有自己的想法,我就不用多说了吧。 最后我想聊几句掏心窝的话, ai 时代最可怕的变化呢,不是某个工具又更新了,而是很多原本被专业壁垒保护起来的能力,正在被快速的屏权。 以前你觉得写专利这件事情离普通人特别远,但现在,只要你会用对工具,会设计流程,很多高门槛工作都可以被重新定义。所以接下来真正拉开人与人差距的, 不再是谁更会熬夜加班儿,而是谁更会借助 ai 来放大自己的能力。如果呢,你也想把 open cola 真正用到自己的项目里、业务里,甚至是变现里,这个方向呢,是值得你认真研究。 如果这期视频对你有帮助,记得点赞、收藏、关注,我们下期再见!拜拜!