大家好,欢迎来到今天的分享,今天我们要聊一个让可乐扣的从好用变成超好用的关键能力,并行绘画。大家有没有过这样的场景呢?就是一个终端在跑测试,你就只能干等着,或者是一个模块在重构,然后另一个模块的 bug 修复呢,只能排队。 如果这个时候你点头了呢?那证明今天的内容对你是有用的。我们这一期内容还是分为上下两期,然后我们今天主要聚焦最基础也是最常用的两层并行能力。然后下一期呢,我们会讲一个进阶的 agent teams, 还有 headless 的 一个非交互模式的一个并行的使用。 然后我们先看一下,当我们提到并行里的第一个反应是什么呢?是不是多开两个终端,然后多开两个 clout, 其实这个是没有错的,就是其实大多数包括百分之九十的人刚用的时候可能都是这样,但是这个可能不完全对,就是说,嗯,只是做到这种并行其实是完全不够的。 首先我们看一下可乐扣的四层并行的能力,像基础的呢,就是去开多个 clout, 那 是一个进程级的隔离。 那第二个呢,就是 agent 子代理的这样的一个形式,这个可以理解为一个县城级的隔离,那更高级别的做法呢,就是一个 agent teams 的 一个代理团队,这个就是绘画级的隔离。再往下呢就是 headless 这样一个非交互模式的啊,批量脚本级别的一个隔离。 那我们今天的上期呢,先讲 l 一 和 l 二,然后我们下一期来讲 l 三和 l 四的两层。那今天呢,我们讲一个核心的观点就是并行不是开多个窗口,而是工作流的重新设计。其实开多个窗口呢,只是最原始的并行,真正的效率来自选择正确的并行层级,然后并且正确的隔离。 那为什么并行这么重要呢?因为 cloud code 和传统的 id 最大区别就是它不是等你输入的工具,而是替你执行任务的代理。当你只有一个 cloud 的 绘画时,你的工作流就是这样的,给他一条指令,然后 cloud 去执行,然后你去等待它, 然后你去等待他的反馈,然后你再来去做下一条。所以说你的时间线是串行的,这样你就呃有些任务是不能并行处理的。那如果说并行的这个模式呢,就是你会可以有多个任务或者多条命令,然后让多个客户一起工作, 然后一起去并发的处理任务。那你这个时候就是一个并行的过程,所以你的等待时间呢,就是 n 乘以这个 time 变成你的一个 n 个任务的最大的 time。 ok, 在 我们实操之前呢,有一个非常关键的概念就是隔离, 这个概念我们需要理解就是绘画它最大并行,绘画最大的敌人不是速度,而是冲突,两个 collude 同时 get commit 的 话,就会互相的有冲突, 所以解决核心冲突的手段就是隔离。那我们怎么样去隔离呢?就是用 gitworktree 去隔离,让每个绘画有自己的工作目录和分支,然后文件层面呢就完全被隔离开了。 还有一种就是权限隔离,就是不同的绘画给不同的工具权限,这个呢也是一种方式。还有一种就是任务隔离,就是不同的绘画负责不同的文文件和模块, 就是模块级别的隔离,边界清晰。那这个呢,我们是要先记住的,就是你在做并行绘画之前,肯定是先要考虑你到底要使用哪种隔离手段,然后再去并行。 那我们常用的肯定就是 getworktree 这样的一个隔离方式。像任务隔离这种呢,可能就是你去让他做不同的任务,比如说一方面一个绘画在做测试,然后另一个画画在做啊,主线的一个叠带编编码,所以说这种就天然它是不会有冲突的, 但是你在呃这个时候使用的时候,是要注意自己的一个模块的边界隔离的,然后权限隔离呢?这个其实大多数就是工具级别的隔离。 ok, 接下来我们看一下最基础的一个 l e, 就是 我们开多个终端去并行去做处理任务。 但是我们这个时候会遇到一种问题,就是可能会有文件冲突,或者是造成 git 的 分支混乱。那我们这个时候刚刚也提到了我们的一个比较重要的手段,就是去做隔离,那我们的运行核心呢,就是用 worktree 去做这里面呢?这个 gitworktree 呢,就是可以用 clock 杠 w 这样的一个操作,就是后面的是一个分支的名, 那这样做有一个好处,就是它会自动调用 get 和 tree 去创建一个分支,然后每个 tree 呢,它都是独立的工作目录加上独立的分支,两个 code 可以 同时改同频文件,然后也互不影响。只是你在 get 末置合并分支的时候去解决一下有冲突的问题。 好,接下来我们演示一下。首先呢我们有这样的一个远程的一个分支,然后啊 master, 然后我们这个里面其实很简单,就是一个打印的一个代码,然后我们现在去给它创建 两两个并行的 root, 那 这个呢就是我们的一个分支名称,然后是我们基于哪个分支创建, 然后再创建一个 f 二。 好,然后我们现在让它做一个简单的打印。 ok, 我 们这样,嗯,有两两个任务,然后我们让它同时处理,然后如果说我们不去这样用 word tree 去进行处理的话,那它可能会发现发生一种状态,就是说它会覆盖,也就是说有可能只打印出一条 log, 所以 说我们用这种方式来看一下最终的一个并行的一个安全的一个效果。 ok, 看到这边它已经分别完成了它的任务,然后我们在这里看一下,它会生成两个 rocree 的 这样的一个分支,然后我们可以手动墨制一下,因为我这边是为了给大家演示的清楚一些,所以说我这边是手动给它墨制。 ok, 这个时候可能会有一点冲突,我们需要去解决一下。 好,我们选择接受组合,然后完成,这个时候可以看到我们两个任务都已经呃合入进来了, 那我们再看一下刚刚的这两个绘画,我们在退出的时候它会有两个选项,一个是保持这个 void 保留,还有一个就是删掉,那我们把 m 一 的 f 一 的删掉,然后在 f 二的时候保留它,这个时候我们再看一下, 那这个 workshop 还是存在的,所以说我们这个时候再去进入这个 workshop, 可以 看到我们还是会可以再一次进来的。 ok, 那 我们继续去讲下面的内容。 ok, 我 们下一个 i 级别的这个 b 型呢,就是一个 sub agent 的 这样的一个应用方式,这里面呢其实我们就会就不需要打开新的终端了,然后子弹里呢会在完成任务后主动回到主会话, 然后适配适合做一些小块而且专注的一个任务。我们这边可以看一下大概的一个对比,就是多终端就是多个窗口,但是 sub agent 呢,它是一个绘画窗口,然后我们在多终端平行的时候呢,是你的结果是需要自己去大概去参与处理的,但是但是 sub agent 这个是 不需要你去关注的,它会自动去汇总到你当前绘画,所以说第一个的成本是相对高一点,然后我们这种应该是几乎没有一个切换成本。 其实 code code 也自带了几个内置的字代理,像这个 explore 这种文件探索代码探索的,还有就是制定实施计划的 plan 模式,还有一个就是复杂多步骤任务的这个 general purpose 这样的一个模式, 然后 code code 会根据你的请求自动去选择这几种合适的字代理,然后你也可以显示的指定,比如说像用 explore 去搜索你项目中的 a p i 端点。 ok, 接下来我们看一下他的两种方式,一种是前台运行,然后一种是后台运行,那前台运行一般是默认的,就是他会阻滞你的主绘画,然后权限都是呃要通过你来同意的。还有一种就是后台的一种并行运行的方式,他运行完了会通知你结果, 那这个后台权限呢,他是在启动的时候会做一些啊预审批,然后之后就是自动拒绝的,所以一般后台任务都只给只读权限是比较安全的。这里呢就是一个禁用后台运行的一个配置 啊。接下来呢是讲一下,大概是去创建一个自定义的一个代理文件。那创建方式呢?很简单,就是一个 markdown 的 文件,然后存到这个 加目录的 dr cloud agents 下面,或者是 dr cloud agents 这两个目录下面都可以。然后这里面呢大概有几个常用的字段 啊?首先这个内幕呢,就是说你这个 sub agent 的 一个名字,然后 description 呢,就是你的这个 sub agent 它描述的一个职责和专场,就是它用来是干啥的。然后 tos 呢,就是它这个能调一度的一些工具列表,然后 model 呢,可能就是你会使用哪种类型的模型去做 这个呢?接下来呢这个是隔离策略与工作范围啊, background 呢,就是附加背景说明和指定。 ok, 我 们有几种调用的方式,首先呢就是说你在绘画里面直接给他讲说调用子弹里去来完成任务,或者是直接去艾特他的名字,就是我们刚刚内幕上面配置的名字,然后或者呢是直接是 gloud 加刚刚 agent, 然后再加上他的名字去启动。 还有一种方式就是我们可以在啊绘画里面快速去定义一个 sub agent, 就是 不需要我们刚才说的那个文件那样去定义。 ok, 我 们继续看一下这个 sub agent 的 一个创建,然后我们是在这个选择这种方式就是在加目录下面的 agent 目录下面 去编辑一个 code reviewer 这样的一个 md markdown 的 文件,然后呢里面就是去写一个代码审查的一个 sub agent, 然后这里呢我们让他去审查一下我们当前那个代码, 那我们选用这种艾特的名字的方式去调用它,然后看这个时候它是在前台运行的一个模式,这也是它默认的一个模式 啊,它这边是生成了一个审查的一个报告,那我们再去让它用中文生成一遍,那我们接下来让它在后台运行 看,这个时候我们是跟刚才不一样的,我们是可以继续来跟他对话的,然后他在后台做一些运行,然后这也才提醒你看,这是他说你可以继续做其他事情,然后无需等待 啊,这个时候他就已经完成了。 ok, 我 们看一下,我们刚刚问了他一下,在他处理的过程中,我们问了一下进展,然后他跟我们说他还在处理,然后处理完了之后,他就会把这个结果发给我, 这他就是一个并行的一个操作。这里面可以看一下我们这个 subagent 它常见的三种并行方式吧,一种呢就是去并行的一些探究,然后让一些呃把探究结果进行一个汇总。 还有一种就是劣势的,这样的三维形的,就是反复的去找问题,然后修复,然后自动闭环。然后还有一种呢就是让子弹里去跑一些刺套件,然后隔离高输出量,然后只报失败和结果,然后不过度占用上下文的对话。 ok, 这一期我们总结一下,大概呢就是我们首先有一个认知,就是啊 cloud code 的 运行并不是开多个终端,其实我们是需要去 啊重新对我们的工作流做一个设计的。第二个呢就是我们要先做好隔离再去并行,不然的话你可能会有一些呃覆盖啊,或者是引入一些新的问题,这个就比串行还还比较还难了。然后还有一种就是呃升级一点的这个 servicent, 这个还是会有更好的一个用法,也值得我们更多的去探求。 那我们下一期呢就是讲一下 agent 的 team 和团队的代理,还有一个 f 四的 headless 的 一个啊非交互的模式,然后是用脚本大量批量去做一些事情, 还有一些我们会做的一些遇到的一些坑啊,还有一些比如说大概的什么时候,我们用哪些啊?兵行手段啊?我们下期见。
粉丝5747获赞1.6万

好不容易注册了各大 ai 服务的账号,想要付费,结果卡在了最后一步,国内的信用卡绑不上,海外的虚拟卡又太折腾怎么办? 大家好,我是二中城,今天给大家分享一个好用的神器 y o 的 ai, 它专门针对 chat、 gpt、 cloud 以及 x 的 订阅做了专门的优化,解决了四个让大家最头疼的问题。 第一,解决了支付门槛,使用支付宝就可以搞定。第二,他提供了独立订阅以及合租的方案,如果你只是想单纯的体验一下 ai 的 功能,可以在网站上去选择性价比更高的合租方案。第三,操作简单。 如果想要使用个人账号独立订阅,不需要担心自己的支付环境,在页面上选择你要订阅的服务, 跟着网站的提示操作, vr 的 ai 会帮你搞定剩下的事情。第四,资金安全。很多人最怕的就是平台跑路, vr 的 ai 不 需要预存资金,钱永远都在你自己的手里才叫安全。 通过视频下方我的邀请链接去注册,或者在订阅的时候输入我的邀请码,还可以享受优惠。效率第一,赶紧去试一下。

你是不是也让 cloud code 一 次只干一件事?不是不想让它并行,是你怕两个绘画同时改一个项目代码,直接打架,改完一合并全是冲突,比不改还惨。 其实不是并行不行,是你少用了一个参数 work tree。 work tree 说白了就是给每个 cloud code 的 绘画单独开一个工作目录, 你在 a 目录写功能,它在 b 目录修 bug, 各干各的文件,完全隔离,根本不会冲突。怎么用?就三步,第一步,启动的时候加一个参数 cloud worktree feature of, 它就自动帮你创建一个独立的工作区,所有改动都在这个隔离的目录里进行, 想再开一个,换个名字再来一遍就行。第二步,把环境文件带过去。 worktree 是 个全新的目录,你的 f 配置文件默认不会跟过去。在项目根目录建一个 worktree 文件,把需要复制的文件名列进去以后,每次创建 worktree, 它都自动帮你考好。 第三步,让子代理也用起来。你可以直接跟 cloud 说,给你的代理用 work tree, 这样每个子代理有有自己的独立空间,并行编辑完全不冲突。它内部就是每个绘画拿到一份完整的代码副本,各自在各自的分支上改,最后合并的时候清清爽爽。 这就是从一次只敢让 ai 干一件事,到同时开五六个任务全速推进的转变。你不再是排队等 ai 干活的人,你变成了同时指挥一支 ai 队伍的人。适合什么场景多任务并行开发,一边写功能一边修 bug, 多人同时用 cloud code 不 适合什么,就一个小改动,没必要隔离,直接干就完了。关注我,下期继续讲 cloud code 里真正能提升效率的隐藏技巧。

cloudmed 写得再细, cloud 还是会忘事。这事你肯定遇到过, astropica 官方文档也说了,规则明明白白写在那儿,模型也读了,但执行到某一步,它就是绕过去了。 这一期我想跟你聊清楚为什么以及怎么解决。先说一句,这是一个系列,前两期讲了 cloudmed 怎么写 cloud 目录,下五层配置都干嘛用。 从这一期开始,我们其实在做一件更大的事,把 cloud code 这套东西搭成一条你可以每天照着走的工作流。今天讲的是这条工作流里最容易被低估的一层, hooks ansorepic 自己其实在官方文档里把这层关系写得很清楚,它们把 cloud code 的 能力分成了四层,如果 cloud 每次都该知道的是放 cloud mate, 如果有时需要放 skill 或者 rules, 如果必须每次都发生,放 hulk 也是本期视频重点讲的。 如果某类能力根本不该碰,直接用 permissions 收回来。这四层最容易被混着用的就是第三层, hook。 这一层很多人压根不知道它存在或者知道,但没意识到它解决的是个完全不一样的问题。 那 hook 到底是啥?先问你一句话,你是不是遇到 clod 不 听话的情况?那可不是你的提示词有问题,提示词是软约束,而 hook 是 百分之一百执行。告诉我,你的 clod 是 经常不听话吗?我前阵子让 clod 帮我清个临时目录, 他自己拼了个 r m r f 出来,因为之前在项目目录下已经手动确认跳过这个执行权限,所以自动执行了。还好那是个测试目录。 一句话讲明白 hook 是 什么,它是 code, code 在 自己生命周期的关键节点上让你挂一段强制脚本的入口,用户提交 prompt 之前工具调用之前,工具调用之后,对话结束等等。官方文档列了三十多个事件,但实际上你只要先记住两个就够用。最常用的是 pre to use 和 post to use, 一个在工具跑之前拦,一个在工具跑完之后接先把前面两个用熟,剩下的什么时候要用什么时候再加。这个视频我也是通过 cloud 制作出来的,后面把知识点讲完,会以这个工作流为例讲解。好了,我先分享下我常使用的三个场景, 你看完之后可以直接抄如何使用。第一个 post two news 配自动格式化 cloud, 每次 edit 或者 write 把格式化掉, 配置就六行 json 中 match 写 edit, write 配置命令中写 pretty write 加文件路径,从此你 cloud md 里就不用再写记得格式化这种话了,它一定会发生。这就是 hock 跟提示词的本质区别, 提示词是约定, hook 是 强制。第二个就是我之前提到的,没有让我确认,就执行了 r m r f 操作。在那之后,我加了一个 hook, 在 配置中加上了这个命令的 hook 匹配上就掉一个脚本,脚本里再判断一次完整命令,遇到 r m r f 直接 exit 二,退出码二,这个细节非常关键,我在之前的视频讲过这个,不知道的小伙伴可以翻翻。第三个最舒服, stop 事件配桌面通知我经常让 cloud 跑一个比较慢的任务,自己切去干别的,回来发现他早就停在那等我了。配上 stop hook 之后,他一收尾,桌面直接弹出来消息,我直接确认就好,不用我主动去查看。但我得说一个反话, hooks 不是 越多越好。这事挺微妙,如果某件事不是每次都该发生,硬塞进 hook 反而会变成新的污染源。 它适合勾住那些确定性的,每次都得做的不需要思考的动作。判断要不要思考的标准很简单,你能不能用一个 shell 脚本写完这段逻辑且永远不变,能就上 hook, 不 能就别用。回到开头那个反差点, cloud md 写得再认真也只是契约 期约靠双方履约,你方履约了, cloud 这边偶尔走神一个判断标准,你可以直接拿走。如果你 cloud md 里某条规则,你发现自己会反复去强调这件事,就该下承到 hook 提醒是可跳过的,而 hook 是 应约束。这一期就到这下一期。讲一个更反直觉的东西, sub agent 下期讲怎么判断什么任务该开, sabotage 怎么开,开几个合适。如果对这一期感兴趣,可以点个赞或者收藏,方便回头来抄那几个 hulk 配置回头见,制作不易,觉得文章对你有用,请一键三连。

哎呦,又见面了,朋友们,今天我们来聊一下用 ai 来控制你整个电脑这件事情的最新进展。因为啊,这个 cloud code 和 codex 呢,在最近这一两个月时间,相距推出了他们各自的解决方案,我实际使用下来呢,效果很不错, 之前爆火的龙虾 oppo pro 能够操作我们整个电脑对吧?但说实话,用过的人都知道这个东西吧,稳定性不是很好, 而现在呢,情况完全不一样了,这两家提出的方案的稳定性比龙虾强太多了。但是呢,这两家本身他们的解决方案呢,也有很多的不同,他们的优势劣势非常明显, 所以本期视频我们来做一个全方位的对比,同时我会简单的跟你说一下,哎,这两个方案如何安装,还有一些技术的原理,到最后你就会知道,哎,你该选哪个呢?作为你日常使用的工具,更重要的是,我会教你如何来同时的使用这两个完全不同的方案。 来吧,这里是乾坤下一站,一个用通俗易懂的方式来讲解如何用 ai 来提效的频道。点好关注,赞,我们开始。 好,我们先直接演示一下用 cloud code 和 codex 来操作你电脑的效果。 意思的是啊,这两家做的方案的名字呢,都叫做 computer use, 而且呢,你都可以在你自己电脑终端和他们各自的桌面客户端来用。接下来的操作呢,我们呢,主要在终端里面来操作。 好,我们先在这个终端打开 cloud code, 你 看我让 cloud code 打开我自己电脑上的日历,然后呢,在周六创建一个全天世界,标题就是周六出去玩, 我们输入指令,此时你看我的电脑在这个上面,对吧?然后呢,指令发出去之后,好,你看他打开了我的日历,然后呢,你看啊,我的鼠标自动的被移到了,这个下周六看到了吗?他自动的就被移过去了,他抢了我的鼠标, 然后呢,他自己呢?点击设置周六出去玩,你看他现在在输入周六出去玩。 好,你看这边,周六出去玩已经建好了,没有问题吧?好,我们现在来到 codex 这边啊, 同样的任务呢,我们现在在下周日,哎,我们创建一个全天的事件,叫做周日出去玩。你看这个指令发出去之后呢?你看,哎,他也打开了我的日历,然后你注意看,我自己这边有一个自己的鼠标,对吧? 但是呢,他那边有一个白色的小鼠标,你看到没有?我自己的鼠标和他的白色小鼠标呢,这两个是不冲突的,你看我自己鼠标呢,想干嘛干嘛,他那边呢自己在操作,这两个完全不冲突, 然后你看他各种点来点去,最后你看啊,这个周日出去玩,他也弄好了,好演示呢,我们就先看到这里,看起来都很丝滑,但是他们的差别很大,具体怎么安装呢?你看我这个视频的图吧,接下来我要做一个深度的对比, 不过在我聊这个具体的对比之前啊,我想先花一点时间来通俗的讲一下这两个工具它们各自实现的核心原理是什么,这样你后面听我说对比的时候,你才能够真正的理解。哎,它们为什么呢?会有这些差别? cloud code 的 方式呢?你可以想象成就是一个人,他坐在你电脑的前面,他看不到底层代码,他就只能看屏幕,怎么看呢?截屏 具体的流程是这样子的啊,你看这边他是怎么一步步操作的,他就是先打开了一个应用,对吧?然后呢,哎,先截个图,截完图之后呢,哎,他会发给模型去分析这个屏幕上有什么,我要点哪个按钮,在哪个坐标,各种分析。分析完之后呢,他就会操作鼠标或去点击, 点击完之后呢,他再截个图,确定结果对不对。截完图之后,哎,再分析,分析完之后再点击,就这样截图分析,采取行动,一直这样循环下去 好。而 codex 这边呢,就完全不一样了,它是利用了苹果电脑自带的一套系统,叫做无障碍数 a s tree。 这个东西呢,本来是苹果公司给盲人那些视障用户做的,就是让屏幕阅读器呢,哎,知道现在界面上有哪些元素, 然后呢,这个屏幕阅读器呢,就会把这些信息啊,给读给那些试驾用户。而 codex 的 工程团队发现这套系统 ai 也能用, 所以你看啊,这个 codex 的 操作过程是怎么样子的?他一开始呢,先获取了桌面应用的结构化数据,就是每个按钮呢,叫什么,在什么位置,什么状态都一清二楚。他分析完之后呢,他就会直接告诉系统,哎,我要点这个按钮,然后呢,系统呢,就会帮他去做手机。 当然了,他也有这个截屏降级的功能,就是 a x 区读不到的时候呢,他就会退回这个截屏的模式,但是那个只是备选方案,主力还是使用这个无障碍数好。原理就这么简单,一个呢靠看,一个呢靠读。 那么紧接着我就来说一下这两种不同的解决方案,在实际使用中会有哪些差距? 第一个最直观的区别啊, cloud code 会抢你的鼠标,而 codex 不 会, 为什么呢?就是因为这个 cloud code, 它就是很真实的来操作你的鼠标,来做这个点击啊等一些的行为。而 codex 呢,是直接向系统发指令,它甚至不需要把这个目标窗口放在前台。所以呢,你在前台正常的操作电脑,它呢在后台呢帮你干活,两个之间呢互不影响。 哎,这就让我想到了当时的 madison 团队呢,最早呢,哎,他们想做一个 ai 浏览器,然后他们也遇到了同样的问题,他们觉得 ai 在 用你的浏览器的时候呢,你自己呢,就用不了了,所以他们最后选择把一切操作都放在一个独立的虚拟机里面。 而现在呢,这个 cloud code 的 computer use 目前呢,就有这个问题,它抢你电脑的使用权,除非你专门留一个时间,比如说晚上睡觉的时候呢,哎,你让它慢慢的跑, ok, 我 们再来说说它们其他的区别啊。简单来说,因为 cloud code, 它每走一步呢,都要走完这个一整套的视觉分析的流程。 而 codex 呢,直接读取了这个系统结构化的文本数据,它跳过了整个视觉处理的环节。这就直接导致了下面这个后果,就是 clockcode 相比于 codex, 第一它速度更慢,第二它价格更贵。你想啊,它每一步都要截屏去分析图片,对吧?而图片呢,会占据大量的 token, 所以 同样的任务, codex 的 token 的 消耗量呢,大约只有 clock code 的 四分之一, 第三,它精准度会更差,因为 cloud code 靠截屏算坐标来点击,对吧?而在一些高分辨率的屏幕上,它的按钮呢,是很小的,就是你差几个像素又有可能会点歪了。 而 codex 通过这个无障碍数,它就是指哪打哪,基本不会出错。更重要的是, cloud code 它不能同时的去处理多个任务,因为你想啊, cloud code 要截屏吗?而且你只有一个真实的鼠标,对吧? 而 codex 呢,是可以同时开好几个任务的,它们每个呢都有自己的虚拟的光标,各干各的,互不影响。 听到这里,你是不是觉得,哎,这个 cloud code 拉完了,直接用 codex 得了。但是我跟你说不是的,它有自己的独特优势,有些地方比 codex 好, 而且长期来说,我反而更看好 cloud code 的 方案。 cloud code 碾压 codex 的 地方就是通用性,因为它是靠截屏来理解你电脑界面的,对吧?所以不管你是什么系统,你是 mac, 你 是 windows, 你 甚至是远程的桌面,只要有屏幕能截图欸,它就能操作。 而 codex 的 computer use 呢,目前呢,只支持 macos, 因为它非常的依赖这个 macos 那 个无障碍数系统,所以现在 windows 用户呢,还用不了。而且呢,你如果在欧洲,因为这个隐私合规的问题, codex 的 整个 computer use 的 功能呢,都被直接封掉了。 更重要的是,这个局限性还不只是平台,因为即使是你在 macos 里面呢,也不是所有的应用都有完整的无障碍数的信息, 比如说一些游戏的界面,一些飞格玛画布里面的元素,还有一些奇奇怪怪的应用,它们在这个无障碍数里面就是一片空白。 这个时候, codex 呢,确实有降级的机制,他会退回到这个屏幕截图加点击这个方案,但是问题是,这个降级的模式的精确度和效率就差很多了。 而截屏识别这件事情呢,恰恰是 cloud code 的 主场,它整个框架都是围绕着这个视觉理解来设计的,所以说在这些非标准的界面应用里面, cloud code 反而更加的靠谱。说到这里呢,让我想到了这个自动驾驶领域的两套方案, 就是说特斯拉呢,坚持用纯视觉,就是摄像头,看到什么呢,它就根据什么来开,这就很像我们真人开车对吧? 而另一派呢,是用激光雷达,就是他们靠发射光束去扫描周围环境的三维结构。你有没有发现, cloud code 的 截屏识别本质上就是纯视觉的方案,它就是在模拟真人用电脑的方式。 我们人类操作桌面的时候,不就是眼睛看到什么地方就点什么地方吗?而 codex 呢,更像是激光雷达,它不看画面,而是读取底层的结构化数据。 你想想,从这个第一性原理的角度, cloud code 的 方式呢,更加的接近于通用智能的本质。理论上,只要它的模型越来越强,推理越来越快,它的上限是没有天花板的。而 codex 呢,就只能在一些标准化的情境中使用,但凡有一些额外的场景, codex 就 不行了。 所以说,从长期的潜力上来看,我更看好 cloud code 的 这条路。但是目前来说,这套操作电脑的解决方案呢,我更愿意用 codex, 可是呢,我一直是 cloud code 的 忠实粉丝,它整体的 agent 的 能力呢,我用起来更舒服。 那问题来了,有没有一种方案可以让 cloud code 作为总指挥来自动地使用 codex 的 computer use 的 能力呢?有, 答案,就是让 cloud code 去调用 codex 的 命令行。简单来说, codex 有 一个无交互模式,就是你不需要打开和 codex 的 交互页面,你直接的终端输入命令就行了。然后呢, codex 呢,就可以在后台来自己默默地执行任务, 而输入命令这件事情呢,我们可以让 cloud code 来做,对吧?比如说,你看这里啊,我现在在 cloud code 这边,我跟 cloud code 说,让它运行这个命令,其实就是让 codeys 用 computer use 来打开我的计算器,然后呢输入一加一,然后呢把结果告诉我, 我直接输入,你看它会发生什么啊?哎,你看它这边有一个白色的小光标,自己在操作我的计算器, 过一段时间,你看我左边终端里面啊,克拉克说,哎,这个 codex 完成了任务,它通过这个 computer use 打开了计算器,然后呢点击一加一,然后呢,结果是二,怎么样?是不是很丝滑? 而这个命令里面有很多的参数对吧?具体每一个是什么意思,有什么坑要注意。还有它的官方文档的链接呢,我都整理在我的视频的图文版里面了,你去看就行了。 我再多说一句,如果说呢,你要想在 codex 里面要用 cloud code 的 computer use 的 能力,可不可以呢?也可以,因为 cloud code 呢,它也有一个无交互模式,这个呢,你自己去探索一下。 看完上面的对比呢,到底用哪种方案,我相信你心里已经有数了,我在这个视频图文版里面呢,做了一个详细的快速查找表,你可以按照你的设备和需求直接对号入座。好了,今天就说到这里,我们下期见。

上条视频和大家分享了,装完 coco 之后,那怎么用它来帮我们解决实际的问题呢?那接下来我将会出一系列的教学视频,包含怎么用 ai 做 ppt, 怎么做视频,怎么做自己的个人作品集合网站,以及如何收集资料等等。 当然如果你有其他的需求,也欢迎评论区留言,我会陆续出相关的教程给大家,所以记得持续关注哦。好,接下来我们直接进入到正题,今天第一期教程,先和大家分享怎么用 ai 做好 ppt。 之前我们一直强调 skill 是 菜谱,要做出不同的菜,就得找到不同的菜谱,告诉 clarko, 他 才知道流程是什么,用什么配料。所以大家平时可以持续关注下那些在给哈仓库里面新标比较多的,就证明用的人很多。其中做 ppt 的 skill 在 中文圈里面非规章老师的这个规章 ppt skill 莫属了。 那最后我做出来的效果先给大家看一下,这个就是我把一个简单的个人信息的握文档丢给了 coco 要用的这个 ppt skill 做出来的这样的一个效果,大家可以看看觉得怎么样?我觉得整体的效果做的还是蛮不错的,他把我的这个信息做了一个提取,然后整理在网页上面, 接下来我就会演示在 vsco 里面怎么调用 clouco, 用这个 ppt skills 来去做出这样的一个成品。首先我们先打开 vsco, 就是 这样的一个界面,在 vsco 里面可以搜索这个 clouco, 就是 在这个扩展里面就是这个 clouco for vsco, 直接点击安装,我们安装好这个 clouco 的 扩展之后,后续每次打开 vsco, 我 们在这个右上角就会看到这个 clouco 的 按钮。我们每次去做一个项目的时候,我们都可以新建一个文件夹, 比如说这个是我之前新建的一个空的文件夹,然后假设没有使用的文件夹,我们就在这里面直接新建一个文件夹,然后选择打开,打开之后直接点击这个 clark co 的 按钮,我们就可以直接进行对话了。打开这个对话窗口之后,像刚刚说到的,我们要让这些 skill 帮我们去做事,但很多时候我会给大家一个建议,就是这个 skill 具体是能做什么的,我们可以先丢给 clark co 问问他, 所以你问他的时候,他会先去读取这个网页里面的内容,他就告诉我们这个 ppt skill 是 可以帮我们去做一个横向翻页的网页, ppt 是 一个 html 的 文件,具体下面有这些功能,如果我们想让它基于我们给的内容,让它去输出一些 ppt, 那我们就可以直接把我们的信息丢到这个文件夹里面,我们把这个简历放到这个文件夹里面,然后就会在这个文件夹里面去识别到我的这个内容,我就让他基于这些信息帮我做一个 ppt, 可以 看到他自己在一步一步的去规划要做的事情,他就先规划这个 ppt 的 结构还有内容大纲,然后生成这个瑞士风的 ppt 之后再去验证这个效果。当他做完之后,他就会提示你是否要在浏览器当中打开这个 ppt 的 预览效果, 我点击券之后,他就打开到浏览器让我去做一个预览,这个就是一整个瑞士风的一个 ppt 的 效果,我觉得整体还是非常的清晰和简洁明了。对比我那样一个 word 文档的一个信息, 我觉得通过这样的一个 ppt, 或者说这样的一个求职简历给到 hr 来看,其实还是挺加分的,不知道大家觉得怎么样?所以总结一下。今天跟大家分享的就是在 vsco 的 这个软件里面去安装完这个 clolo 的 扩展之后,每次我们打开 clolo, 然后去新建一个文件夹, 把你要给 clolo 识别的一些信息跟内容都放到这个文件夹里面,然后每次点开右上角的这个 clolo 的 图标,我们就可以跟 clolo 去进行对话了。 第二个比较重要的就是我们每次让 cloudco 帮我们干活的时候,最好就是调用别人已经封装好的 skill, 当你解决不同的问题的时候,就用这些 skill 帮我们去解决。 然后当你不知道这个 skill 能干什么的时候,就直接在这个对话框里面,让 cloudco 帮你去读取这个网页里面的内容,问问他这个 skill 是 干嘛的。所以对于那些想要做课间 或者去做一些演讲分享,对外的展示这些内容,我觉得用这个 ppt skill 是 一个不错的选择。所以今天的分享不知道对大家有没有帮助,或者大家在实操的过程当中遇到什么问题都可以留言,我会针对大家的问题给予解答, 以及大家还想知道用 call 能做什么,也欢迎评论区留言,我会出相对应的教程分享给大家。好,那我们今天的分享就到这里,我们下期再见。

上期视频我分享了 cloud code 的 安装和常用技巧,但真正用过的小伙伴肯定会遇到一些问题,比如没法联网搜索、没法识别图片、没法阅读网页、没法监控上下文进度和 coding plan 的 使用情况。哈喽大家好,我是专注用动画科普 ai 的 阿 k, 接下来我就为大家一一解决上述困扰。本期依然全程无广走你。 其实想解决联网搜索、图片识别和网页读取这三个问题,只需要用到一个叫 m c p 的 技术。简单来说,以前 ai 的 能力往往局限于自身的知识库,但有了 m c p 以后, ai 就 具备了使用外部软件的能力, 所以从某种意义上来说, m c p 就是 ai 和外部软件之间的一座桥梁。那到底装哪几个 m c p 能够解决上述三个问题呢?这里我给大家推荐目前 github 上最主流而且确实能打的三个免费开源方案。第一种是用来搞定联网搜索的,叫 brief search, 它的强项在于拥有独立的搜索锁影,而且对 ai 的 读取特别友好。第二种是用来解决网页读取的,叫 fetch, 它能过滤掉网页里的杂乱元素,只把最核心的代码和文字扒下来给 ai 看。第三种是搞定图片识别的,强烈推荐 screenshot mcp, 它能自己截取你当前的画面或者指定窗口去分析报错的原因,这种直接让 ai 看图排错的体验妥妥的极品。接下来我就以 brave search 为例,为大家演示一下如何在 cc 里安装 mcp 工具。 首先你需要有一个 brief search 的 api key, 具体获取方法大家可以问问 jimmy, 为了避免被限流,这里实在无法展开了,只有拥有这个 api, 才能安装它的 mcp, 并获得每月两千次的免费搜索次数。放心哈,个人绝对够用了。 然后我们需要打开终端,粘贴这串代码。注意哈,这里要换成你获取的 api key 哈,那敲完回车,等它自动跑完,你的 c c 就 正式通网了。那另外两个工具就没这么复杂,不需要 api, 直接分别执行这两串命令就行。 那这三个外挂都装好了,具体该怎么用呢?简单,比如你直接敲一句,帮我搜一下某某某某,他自己就会去调用 brave search。 又比如直接甩个链接过去,按这个链接里的开源项目说明,帮我搭个环境, 他马上就能又快又准的执行任务。那遇到程序跑不通的情况,也连截图软件都不用打开,直接给他发一句,看一下我现在的屏幕,帮我找找 bug 出在哪,他就会自己咔嚓一下,截取当前的画面去排错。总而言之, m c p 工具的好处就在于清亮和即杀即用,而且 github 里面好用的 m c p 一 抓一大把,大家感兴趣的话可以自行探索哈。 ok, 那 接下来就是解决上下文监控和 callin plan 用量的问题了,大家看这里,这是我安装的一款名叫 cloud hud 的 开源插件,它的优势就是能够挂在在 c c 输入框下方,并且以进度条形式直观显示上下文用量和 callin plan 用量。 那有了刚才安装的 m c p, 我 们只需要把这个项目的仓库地址丢给 c c, 然后让他帮忙安装就行了。但是大家注意,这个插件原本只能监控 cloud 的 订阅套餐的用量,而我用的是国产 callin plan。 所以 接下来我想告诉大家,我是怎么通过使用 c c 来改造这个插件的。 首先我上期视频说过, c c 终端版最大的优势就是自由度高,而且这个插件又是开运项目,这就意味着我们可以用 c c 来修改插件代码。然后我分析 cloud 套餐机制和我使用的国产套餐机制是一样的,都是无小时限制加上周限制, 所以我只要能够获得我的套餐的用量数据,然后把它们替换到插件里就行了。所以我第一步是先让 c c 用 brave search 搜索如何获得我使用的控制 plan 的 数据。第二步就是让 c c 写个脚本,把我的国产套餐的数据替换到插件里面,读取 cloud 套餐数据的代码中,然后设置每五分钟刷新一次,这样我啥也不用干,刷刷手机就完成了。但是这个时候出现了一个问题, 就剩下文监控还是进入一条形式,但套餐监控变成了文本形式了, 按道理来说也能用,但是我有强迫症,我想既然可用的套餐可以用进度条显示,我不过只是换了数据来源样式,应该是不用动的。所以我用自然语言告诉 c c, 我 要插件原本的进度条显示,颜色搭配也必须遵循原来的插件。然后没多久 c c 就 帮我改好了。 当然我说的很简单,它中间其实还有不少细节,受限于篇幅没法展开。但我真正想告诉大家的是,知道原理就自然知道怎么做。比如我不知道什么是前端,什么是后端,就无法修正进度条显示。 所以大家想要玩好 ai, 真的 一定一定一定要多动手多尝试,从而提升自己的知识储备哈。 ok, 那 以上就是本期视频的全部内容了,我是专注动画科普 ai 的 阿 k, 无惊无险又到六点,下了个班。

想象你正在和 cloud code 做一个复杂的重构,他刚读完第七个文件,正准备动手改,突然对话被压缩了。压缩之后,他又去重新读那个文件。你心想,不是刚看过吗? 压缩把长对话浓缩成一条赃药。这一刀下去,模型失去了所有原始上下文读过的文件,加载的技能,正在执行的计划全没了。 直觉上的解决方案是全部恢复。但这会陷入荒谬的循环,压缩刚省出的 to cap 空间立刻被恢复的内容填满,等于没压缩。所以核心问题不是恢复什么,而是在有限的 to cap 预算里,恢复什么,放弃什么。 cloud code 的 答案是,一套五零年五月五日法则,最多恢复最近读取的五个文件,每个文件不超过五 k token。 总预算五零 k token, 但不是简单取。最近五个,它走了一个四层过滤管线,像一个漏斗。 第一层分流计划文件和 cloud md 被排除,它们有独立恢复通道。第二层,去重压缩加载里已有的文件,不再重复恢复。 第三层,排队,按最后读取时间戳排序,取前五个。第四层阶段,五个文件加起来超过五零 k 的 话,后面的直接丢弃。还有一个细节,恢复识读的是词盘上的最新内容,不是缓存快照。 压缩期间你手动改了文件,恢复的就是你改过的版本。恢复本身是一次刷新 技能的恢复策略和文件不同,一个技能文件可能高达二十 k token, 但关键指令通常在文件开头,行为约束触发条件。核心流程都在头部尾部,大多是参考信息和补充说明, 所以 cloud code 选择了截断,而非丢弃每个技能保留前五 k token, 砍掉尾部参考内容总预算二十五 k, 大 约覆盖五个技能。这就像搬家时指带最重要的东西,你不需要把整个书柜搬走,带上前五本最常翻的书就够了。 前面提到,计划文件不走文件恢复管线,而是有独立通道。为什么?因为计划是当前正在做的事,压缩发生时,你可能再执行一个多部计划的中途, 如果计划丢失模型,就不知道下一步该做什么。这是最严重的上下文断裂。所以计划恢复没有挤在五零 k 的 文件预算里,而是单独处理,确保不管压缩多频繁,我在做什么,这条线索始终不断。 最反直觉的设计是,有些状态故意不恢复,比如 thank you names。 一个四 k token 的 技能名称列表 压缩清除了它,恢复时不重建。为什么?模型通过工具 schema 已经知道技能工具的存在,实际用过的技能也已经被截断恢复花四 k token 重新注入一个名称列表,收益微乎其微。 四 k token 看起来不多,但在五零 k 的 文件预算里,那是百分之八的空间。用来恢复一个技能名称列表,不如留给一个实际文件。这是一个典型的 token 经济学决策,在完整性和成本之间选了后者。 压缩还清除了工具声明、 agent 列表、 m c p 指令等增量信息。恢复方式很巧妙,传入空的消息历史触发 delta 函数的完整重拨。 正常情况下, delta 机制只发送当前状态和上一轮之间的增量,但空历史意味着基线为零,所以 delta 自然输出,完整集合。这就像重新启动一台电脑,不需要逐个检查哪些驱动需要更新,直接全量加载一遍就好。 赋用现有的 delta 机制,不需要额外的全量恢复逻辑,这是一个优雅的工程选择。新功能赋用老机制,少写代码,少出 bug。 压缩后的状态恢复,本质是一个预算分配问题。 cloud code 的 策略概括为三句话,第一,分层预算文件,五零 k 技能,二十五 k 计划,独立通道,重要的东西多给,次要的少给。 第二,选择性恢复。四层过滤管线,只恢复最有价值的内容,每一步都在淘汰低价值信息。第三,刻意不恢复四 k, 偷看的技能列表不重注,看似不完整,实则是正确的经济学。理解这个逻辑, 你就能预测压缩后模型会记住什么,忘记什么。三个实用建议,最后读最重要的文件关键约束,写进 cloud md 跨压缩的长任务,用 plan 模式驾驭 ai agent, 从理解它的遗忘开始。

哈喽,大家好,我是 jason。 不知道大家在用 cloud code 的 时候有没有遇到过这样一个问题,明明你的需求还没有写完,那是 cloud code 他 自己就停下来了,说你的需求已经写完了啊,这个问题呢,我经常会碰到,然后我就会继续跟他聊,然后发现越聊他好像越笨了啊,很多很 细节的东西他就没有办法去写下去了啊。最近呢,这个问题被一个叫做 rough loop 的 玩法解决了啊,这个 rough loop 现在被讨论的非常火,它是什么东西呢?它其实就是在 code code 的 这个命令行外面套了一层负循环啊,这个可能程序员朋友可能听得懂, 有人呢,睡前把这个 rough log 跑起来,然后早上起来检查成果,就发现它的七十多个功能点和三千多个测试都已经写好了。今天我们来看一下这个 rough log 和传统的 cloud code 它的一个区别。我们先来说一下传统的 cloud code 在 运行的时候会碰到哪些问题。 第一个就是我们刚刚说的可能跑了一半,他说他已经写好了,但其实你的任务并没有真正的写完。第二个你会觉得越聊他越笨,因为我们的上下文已经积累了很多,他有一些无关的信息 冲刺了你的整个上下文,去影响他的一个思考和推理。然后还有一个问题就是我自己也是感同身受,就是你在使用 code code 的 写的时候,你得一直反复的复制,粘贴, delete, 然后看哪里有问题,非常耗精力,特别是长时间的这样一个对话,它的效率又很高,你得一直去跟他聊, 这是在 web coding 这个阶段,嗯,程序员会碰到的普遍的问题,所以总结下来呢,呃,在传统的 ai 的 coding 用法里面,它其实就是一个呃助手,你可以把它想象成一个 呃,刚毕业的逻辑很清晰的研究生。但是你必须要不断地去检查它的一个成果啊,你得带着它去完成任务。然后这个 rap 就 很有意思了,我们看一下它是怎么解决的。它在外面套了一层负循环,不断地去轮询你的提示词 啊,不让他去决定自己什么时候能够停下来,就让他一直不断地跑好。但这个有一个前提,就是你的这个 prompt 提示词已经写好了你所有的需求,你到底要一个什么样的一个结果和条件? 呃,把所有的规范都给它写清楚。所以 rough look 它的流程是这样子的,首先,你在外部先定义好你整个需求的文档是什么样子。呃,包括你的细节,说白了就是 p r d。 你 要说清楚你要实现的一个详细的效果是什么样子, 然后丢给 rough loop, 让它负循环不断地去跑啊。当嗯, cloud code 他 觉得自己需求已经写完的时候,哦,你不让他决定什么时候停,而是重新刷新整个上下文。 rough loop, 重新读一遍你的 prompt, 让他自己去检测有没有哦,完成你这样一个需求, prompt 这样的一些文档, 所以外部的这样一个脚本会去拦住他的想停的这样一个呃动作,你真的写完了吗?我们再检查一遍,不断的重复并重复,然后最后去优化他这样的一个结果啊,通过这样的一个循环,一晚上让他自动跑啊,我们就能够让我们的需求真正的能够被验证通过, 并且实现你最后真的要的效果。他其实解决的我觉得最大的问题就是他把上下文给你不断的刷刷新,然后去验证, 嗯,这样这样的一个过程,所以跟传统的 cloud code 用法最大的区别就是,呃,不是 ai 他 说完成就完成了,而是外部的验证通过了你才算完成。第二个点的话,就是他会每 次都开新的上下文,开新的对话去沟通,避免长很长的上下文去污染,导致他越聊越笨啊。最后一个很关键的点就是我们不用一直盯着我们,丢给他们最后的需求,然后你就可以去睡觉或者你去玩就行了。 第三个问题呢,其实就是我们在实际使用这个 rough loop 的 过程中会有一些前提。第一个是,呃,如果不断循环去跑,并且用 opus 四点五这样一个最顶级的模型的话,它的成本可能还是会比较高的 啊,所以有人建议就用 glm 国行的这样一个大模型,它的成本可能只有 opus 的 十分之一,就很适合用这套 rough loop 的 玩法去试一试。 第二个呢,就是我们的试用场景,呃,像这样一套 rough loop 的 用法,其实还也是比较适合我们的干店验证的这样一个阶段的,它有一个明确的验证标准,不需要过多的去主观的去做决策 啊,不然你在过程中可能很多细节没想清楚,你丢给他他最后生成的东西你也不知道到底好不好,所以归根到底呢,我们的核心需求就是因为这套流程,嗯,他是一晚上一直去跑的,会跑非常久, 你中间是没有办法去干预和修正的,所以前期准备就特别重要,我们必须要把需求给他说清楚,整理好你的项目背景,给他交代清楚,然后并且定义好什么样的东西你才算做完了。所以这些东西呢,变成了关键的能力。 那这篇文章的作者叫做丹,他最后也提出了我们开发者的角色其实已经反发生了一个明确的变化。 以前呢,是可能产品经理派活给我们,让我们去写,现在是我们派活给 ai, 让 ai 去写,他用了一个词叫 cpu, 叫做 code product owner 啊,你的是代码产品的一个主人。然后他也在重申,之前我说过很多次的一个观点,就是你以前有很多想法,没有时间去做, 现在 ai 出来了,你现在完全可以去 build 了,不要怕你做的东西不完美,完美是你去实现你想法的一个阻碍而已。好的,总结一下呢,我们传统的 cloud code 其实就是一个助手, 你得带着他去用。那 rough loop 出来之后呢,他就是一个员工,你把需求给他,他自己就能跑,不断地跑。 那想试的话,官方已经出了一个 cloud code 的 rough loop 的 这样一个插件,叫做 rough loop, 大家有兴趣可以去尝试一下。那其实呢,我觉得底层能力其实是通用的,你的需求描述能力, 然后你的沟通能力、逻辑能力,最后包括你的验证能力。你这个不,不管是呃用 rough loop 还是用 cloud code, 还是真的跟人打交道,都是你必须要去掌握的一个通用的能力。

现在着急挣钱的人都得了一种病,叫 ai 焦虑症。那到底这个病是谁让我们得的?我举两个例子应该就明白了。我记得在今年三月份的时候,朋友圈、抖音全网到处都在聊养小龙虾, 当时最夸张的画面应该是腾讯在深圳搞了个免费安装的活动,有几千个人在排队装这个 oppo cola, 上到七岁的老头,下到几岁的小学生,都千里迢迢跑过去排队安装。这个新闻大家应该都看到过吧, 那个场面根本不像一个技术沙龙。很多人其实不是突然之间就懂了 ai, 而是担心 ai 赚大钱,自己没有赶上车发不了财, 害怕自己落后了。很多人的 openclock 之路大概是这样的,看到了满屏的新闻,所有的短视频都在推 ai 创业, ai 挣钱, ai 副业, 所以买了台 mac mini, 自己周末折腾了一天去安装,装好之后自己坐在电脑边上盯着个屏幕想了半天,然后也不知道它可以干嘛。说到这里, 我就要说一下,当时谁在靠小龙虾在挣钱,那就是安装小龙虾的人。网上那个时候出现的袋装服务还记得吗?有没有踩过这个坑?自己花了多少钱装的?打在评论区好吗?我当时知道的是五百块钱起步, 有人一个月靠袋装小龙虾能赚不少钱。还有就是二手的 mac mini, 价格从当时的两百多块钱直接疯涨到几千。其实这本身就说明了一个问题,当一个工具火到需要请别人去安装的时候,那说明他真的不太适合普通人去用。 更现实的是,大多数人的工作还没有复杂到需要去安装它。当时用了小龙虾做社交媒体自动化运营的,是不是遇到过数据泄露啊,封号的问题? 因为我们当时从内容的生成、发布、互动全部都交给这个 ai 去处理了。 那当然平台是不允许你这种事情发生的,你制造一些垃圾视频出来。所以当我们自己在开发这个自动生成工具的时候,我都是选择公开透明的出来验证,测试 你的东西好不好用是一回事,能不能用符不符合平台的规则又是另外一回事了。所以 openclo 现在降温了, 小龙虾也没人提了并不奇怪。当 cloud code 出来以后,全网又在说 ngram 才是发展的方向。 这个月开始你几乎刷十个视频,有九个视频告诉你必须用 code, 这些洗脑的视频呢?嗯,先不说 code 你 能不能用,现在是不是风口,但他们的视频里面都在说 ai 的 新风口就是用 codas, 就 像零八年做淘宝,一八年做抖音一样,你刷到过多少?这种用 codas 暴富的洗脑视频我们在评论区打出来。而且我敢断定发这种视频言论的就是两类人, 一种是脱口贩子,还有一种就是纯粹去蹭流量的人。而且我敢打赌,估计这第二类人他自己连 plus 都没有充值过,光在这个视频里直接就去给别人洗脑叫唤,那他的目的是什么呢?可想而知。其实就算我们解决了 呃配置环境、注册、手机验证以及我们花个二十美刀的费用这些问题,那我们拿到它到底可以干什么? 是去写文案吗?还是做个网站是真的可以解决我们的工作效率问题,如果不是, 我劝大家不要太着急,我有几个视频都说了,我们不要拿着这个倚天剑屠龙刀去切西瓜好不好?我们话说回来, 不管是爆火的小龙虾还是 cloud code code, 普通人最大的问题现在不是安装和使用的问题,我觉得最应该考虑的 是自己的工作哪一段最适合交给 ai, 自己要清楚。所以与其追下一个爆款的工具,不如先问自己三个问题, 第一,我每天最重复的工作是什么?第二,哪一段工作机械到不要我们亲自去做?第三,如果这段交给 ai, 出错的代价我们能不能承受?这三个自查问题我建议大家都收藏起来。 如果我们盲目跟风的时候对照去选择去用,知道我们自己需要什么,比盲目追追风口要好很多。但是如果你真是把一个 ai 可以 切入到我们自己的工作当中去,哪怕只为我们省一个小时的时间,那他也比追十个风口 划算。你自己工作当中哪个部分可以交给 ai, 你 打在评论区,是文案短视频还是什么东西, 我来帮你筛选适配的工具给你道你建议。现在小龙虾的病毒已经降温了, ko 大 师的病毒呢还在传播, ai 的 浪潮也才真正的开始,我们自己一定要轻轻的知道自己要什么。

为什么很多人现在装到 clothes code, 然后在使用的过程中觉得没有别人口中那么智能或者是不好用?今天我们就来解决这个问题。目前像 clothes code 这类智能体可以说是第一梯队,它不仅是依靠整个魔性的能力,它还比较依靠整个智能体的能力。 那么其实我们在安装之后是需要有几个地方,我们需要进行一些配置和给它制定一些规范,这个其实就是它的配置文件。比如第一个配置文件就是在安装了 cloud code 里面,它有一个 cloud 点 md, 这个 md 文件主要就是 比如说后期你执行项目或者是任务的过程中,你要给他制定哪些相关的条件或者是约束,避免的后期他可能有太多的一些幻觉,或者是在执行问题的过程中出现太多的错误,这个其实就需要我们给他制定这个规则和规范。那么我这里举例第一个就是我们在这个文件目录下的 cloud 点 md, 这个其实它是一个隐藏目录,我们平时在电脑上看不见的,那我就教大家怎么打开这个文件。我这里以那个苹果电脑为例,其实可以直接通过在终端命令行,比如说命令的方式,直接打开这个相应的文件目录, 可以看到这个其实就是我们整个 code code 安装的一个隐藏文件目录,包括我们的 skills 全部在这个文件目录下面。这个 code 点 md, 就是 刚才所说的我们要去后期改配置,把我们的一些条件和约束放里面。那我们具体的看一下我们该怎样去设置相应的条件和约束, 其实这里也相对比较简单,我这里使用了一个通用的模板,这个通用模板大家可以直接复制之后拿过去使用。它其实是有几个维度的。 第一个就是在使用的过程,我给他设定了我的语言条件,比如说全程是通过中文沟通,包括他的推理过程,或者是呃,我整个的结果是以中文,包括在执行任务的时候,我给他的条件是先讲阶段,然后再讲关键原因,以及给出一些简短的执行计划,再进行执行。 那么工作方式,因为我们有时候会用 qq 的 这些执行一些复杂任务,或者是读取我们电脑中本地的一些多个文件,然后再执行任务,给出一个结果。在这里对他的整个工作方式也要进行相应的约束,比如说修改范围要尽可能小,不做与任何无关的重构。如果发现一些需求模糊的 情况,我们要提出关键的问题,说白了他就像一个检查员或者是一个专业人员来帮你去制定这个规范,来帮你去严格的要求。在执行的过程中可能会出现的一系列问题, 包括一些安全编辑。我们也看到了很多人可能在网上说使用 coco 的 过程中,他误删了自己的数据,或者是执行了一些误操作。这个其实我们在这个 coco 的 点 md 里面文件也可以给它约束,好比如说不能让他随随便删我们的用户数据,或者是在执行一些 get push 的 时候不能自动执行,要通过我们人为确定。 还有最终的一些交付标准和长期记忆维护,这个其实就是我们最终对这个生成任务的结果,怎样的一个判断标准呢?比如我生成一个代码文件或者执行的任务,我先让他给我检验一下,或者说改了东西,让他给我判断一下改了什么样的内容。 最终的话就是我们要沉淀一个长期记忆维护的机制,这个机制的话就是他每次对你执行的任务,或者是你执行项目的过程中一些关键的信息,他会沉淀 下来形成一个记忆,这个记忆在下次你执行同样的任务过程中,他可能还会带到这一次的绘画中,这就避免了后期可能他就会越来越懂你,越来越了解你。刚才我们讲的更多的是在全军目睹,说白了 他是站在整个 coco 的, 你去执行任何任务,他会按照这个约束去执行。那么还有一个就是我们要去规定他整个项目的刻点 md 的 这个方式,这个项目规划其实就是我们每次会建一个任务的项目, 这个项目其实更多是执行一些代码或者程序,比如这里我们也可以给他设定整个项目的目标、工作方式以及目的的约定。这里很多更多的是偏我们在生成代码的方面,比如说呃,我们在整个源代码或者测试过程中,以及在呃文档的过程中,因为很多人使用 code, code 让他写代码,因为我们并不是专业的程序员, 那我想让它给我执行的结果更标准或者质量更高,那么这个约束肯定是必要的,因为有了这条约束之后,那后期可能你来改整个项目或者执行整个的这个结果的质量就相对比较高。还包括 可能我们要开发一个复杂的项目,涉及到一些阅读文档,比如 api 数据库,这里面其实也是需要在整个项目的整个 md 文件去给它进行最终的约束的。我们可以直接把这两个模板复制到大家的 qq 中,然后来好好体验一下它的能力有没有变强。

全球 ai, 一个 atlus cloud, 三百家前沿大模型,一个账号,一个 api、 一个控制台,一站直达。 atlus cloud 总部位于美国纽约时代广场,在硅谷、伦敦、卡尔加里、 吉隆坡、台北等全球核心城市设有分支机构,以本地化专业团队服务全球客户。 atlus cloud 的 用户永不排队告别,等待调用即响应,生成即完成,高并发算力,随需扩容,从想法到画面,让创造即可发生。其模型发布日就是 atlus cloud 可拥日。一个 api 接入三百家前沿模型, l l m 图像视频全品类 atlass cloud ai 专家工程团队成员来自 google cloud、 aws、 腾讯云、斯坦福、伯克利、戴尔等全球顶尖科技公司与学术机构,造就独有的优化技术。 全球二十万家企业与开发者的选择,月均透肯消耗超三千万美元。 s o c 一 s o c 二 h i p a a 三重合规,以企业及安全协议守护合规与数据主权 自主的高算利润托底,弹性扩容,秒击部署,满足 ai 基础设施需求,保障平台的稳定高效生产。 alice cloud, 一个 api 直连全球顶级 ai 模型。

看来不展示点干货,视频流量起不来啊。今天这套流程我估摸着至少值个二十万,但有可能砸了人家饭碗。大家低调,别滥用一句话看日本市场有什么机会品类 ai 自选,他居然挑了防灾市场,六月台风季有点东西的。 然后 ai 自己拆成十一路侦察兵同时出发,五路扫宏观,哪些品类在涨?中国供应链哪里有价差?法规门槛卡在哪?三路深挖供货方案,货源多少钱?走海运还是空运?利润能有几成?最后三路直接去挖日本当地的买家。十一路小弟同时跑,不是一个一个排队,你们看屏幕上这一片全在动,这就是十一个 ai 在 同时替我干活。先看宏观, ai 把市场规模, 申诉法规全扒出来了,日本地震多,政府逼着每家企业给员工备物资,法律写着的。然后他自己算了一遍利润,国内采购价多少,到日本卖多少,中间毛利多少钱给你列出来了,这数都是他实时查的,暂停自己去核。重点来了, ai 不 观察市场,还顺手把日本当地二十八家买家全给我挖出来了。分三波,第一波,防灾用品批发商哪家做 oem 哪家才四个人的小公司都标清楚了。第二波,地方专门店从关东到九州都翻出来了。第三波,最狠,他去找了一堆根本不叫防灾店的隐藏买家,做企业赠品的,管公寓的,搞酒店用品的,全都有防灾采购需求,一般人根本想不到。二 十八家公司名,地址,官网,邮箱,全对屏幕上。从看日本市场有什么机会,一句话开始,到品类分析,利润侧算,货源报价,二十八家买家连联系方式都凑齐,十一路 ai 同时跑十二分钟。哥,以前这会你得飞一趟东京, 跑三天,展会回来再整理一周。现在我坐这儿喝了杯茶。哪一步是编的?数据全在屏幕上随便合。今天给你们看的是市场侦察,下回看心情可能让他直接把开发信写了发出去。这套东西换个国家换个品类,照样跑。工具我撂群里了,自取。最后一句老话,低调用,别乱用。

我不懂代码,但只花半天做出了这样一个自动剪口播的 ai 工具。上传视频后,它会自动识别字母,帮我去掉所有的口屁和食物,然后直接导入 final cut pro, 就是 剪好的视频给我省了大量时间, 我一行代码都没写,甚至没看 type of coding 做出来的这期视频会分享在这个过程中都有最有用的四个经验和技巧。如果你也和我一样不懂代码,但又想自己做点东西,那这些经验应该能帮到你。 剪映其实有智能剪口播这个功能,但又想自己做点东西,而且它要花钱。再一个,我剪辑用的是 final cut pro, 剪辑替代 不了,但最关键还是因为我的目标不止是 ai 剪口播。长期来看,我想 ai 逐步接管我的整个视频工作流,这种剪映是不可能实现的,他不会为我个性化定制,所以这个东西我必须自己来做。这也是 web coding 的 魅力。像过去这种想法,我们只能想一下,但现在可以自己来实现。 有了想法之后, web coding 第一步绝对不是从零开始写,这是很多小白,包括我以前常犯的错误。互联网发展这么多年,其实已经有大量成熟的开源项目,你想做的事情肯定有可以附用的地方, 所以我会让 ai 先帮我全网搜集,看看有没有现成的项目可以用。结果找到了一个叫 video cut skills 的 开源项目,他做的事情就是用语音识别,把视频转成带时间戳的音频字幕,然后让 ai 做语义处理。但有个问题,他是直接给你剪出一个视频来,而我需要的是生成 final cut pro 的 时间线导入,再做二次精简,所以我需要在这个项目的基础上去做二次开发 的。语音识别和处理的逻辑我都是可以服用的开发工具我用的是 cloud code, 刚开始模型用的 cloud 的 订阅,但 web coding 消耗 token 是 真猛,基本上半小时就限额了,只要满足需求,得升到 max 套餐一个月小一千。 说实话,我觉得对大多数人来说都太贵了。于是我打算换其他模型。本着用新不用旧的原则,刚好 mini max 发布了 m 二点七。因为我的小龙虾之前一直跑的是 m 二点五这个模型, 他家的风格就是性能够用,而且很快很便宜。这次新发的 m 二点七在软件工程和项目交付这两个主流编程性能上也还不错,和 cloud 的 g p t 一个水平线,应该够用了。于是我打算试试。开了个 plus 极速版,有一百 t p s 的 退率速度,加上每五小时一千五百次请求,实际用下来还真可以, 速度比 cloud 的 快了不止一倍,主要是不担心跑的一半突然被限额。我基本是用 m 二点七完成了后续全部的开发,所以如果你要 webcoding, 可以 考虑刚出的 m 二点七 模型,定了准备开发。虽然我们可以不懂代码,但是你得了解项目的整体框架和逻辑,这样你才能跟 ai 说清楚你要改什么,改哪里。有个方法很简单,我直接让 m 二点七把整个项目读一遍,然后生成了一个格式化的页面,把框架和逻辑直接展示出来。我不用看懂代码,全程只用对着这个页面和 ai 说需求,一步步开发,这个方法尤其适合非程序员朋友。 web coding 还有一个很常见的痛点,就是 ai 帮你写出来的界面功能没有大问题,但就是丑,一眼就能看出来这是 ai 做的。你想让它好看一点,但我们又不是设计师,不懂专业词汇,没法用语言精准表达。 我找到了一个叫 impeccable 的 神级 skill, github 上一万多星,它的作者是 jacqueline ui 的 创始人,全球几百万网站都在用它做的东西。它在 google 还做过创作者生态的负责人。这个 skill 呢,是它把自己多年的设计经验打包成了二十条指令, 每条都携带完整的设计专业知识,作为上下文安装即用。比如像我用了这个 audit 指令,让 m 二点七模型直接帮我审查全部代码,并输出一份完整的前端报告。它按照影响程度划分了问题优先级,并且还整理好了后续怎么修复的命令,真的是有手就行。 然后还有像 polish, 能帮你把界面打磨的更精致, boder 能增强这个页面的视觉冲击力。这是我这个工具优化前后的对比图,你看变化还是很明显的。最后说到这个剪口拨的工具,我目前还在打磨迭代,等完善了后面会考虑开源出来。如果你也想开始或者已经在 web coding 自己的产品上面,这些方法我推荐你可以去试试。 目前国产模型用来 web coding 的 性价比真的很高,大家不用去掉 a p i, 而是订阅它们的套餐会更划算。这次立刻聊 i 姐,分享 ai 干货,我们下期见!

哈喽,朋友,晚上好。我最近发现这个 codex 越来越好用了,好用到我已经快有点忘掉了可乐的 code, 这不得不说这个 c 端的 ai 的 粘性啊,真的是非常的低。那今天给大家分享几个我用 codex 的 比较常用的我认为非常好用的功能点。我觉得第一个很好用的功能点就是 codex 支持排队的功能。比如现在有个项目,我跟他说请深度探索一下这个项目,那他就去做这个事情了。那这个时候如果我还想知道更多的项目细节,那我跟他说,请 告诉我这个项目是什么语言开发的,那我可以看到下面就有一行小小的条,这条呢就是表示他这个任务正在排队了,他之后把上面一段任务完成之后,他就会自动去执行这段任务,那我可以接着再跟他说, 比如我跟他接着说还有没有其他类似的项目,那我这个事情就接着排队了,那我所有排队任务我还可以进行拖拽。假如说我认为我先告诉我类似的项目,再告诉我什么语言开发更重要,那我只需要一个位置,那他就下一次下一个任务就会把这个还有什么其他的项目先去给这个 codex 发过去。 那假如说我觉得这个像,我觉得这个问题问的不好啊,那我可以看到这边他有一个三个点,我可以再去编辑这个消息,那我点击编辑消息,你看他就回来了,那我可以针对这个消息再去编辑之后重新去发送,发送完之后呢,那我可能就去调整一下位置,我把这个事情先来去 让他去做,那还没有完。假如说我觉得我上个问题问的不是很好,那我希望有改变这个问题,或者加一些我的补充,让你可以看到这六个引导按钮,它的意思是提交单缓冲段运行,那我去点击引导, 但这边可以看到以引导对话,那回过头来看 codex, 它就变成以正在思考,正在思考它是基于这个新的任务,新的任务去重新根据在做,根据它上下文去做一个新的事, 我觉得这功能很好用。那可能我之前问你个问题,我认为,哦,我可能问全了,但是我想了想,我回来我测试了一些功能,发现我并没有问全,那我就可以给他发一个新任务去引导他,那他可以基于我这个新的上下文去做, 把这上面这个事情更完善的去做好。那第二个功能点呢?就是你看我这个有一个小小的一个分一个分叉的 icon, 它叫分,它叫分叉。 那我点击之后,他会告诉我我的消息是分叉到同一个工作数,还是派成到新的工作数。这功能就很好用啊。那我会变成 我可能又跟他聊了很多很多的消息,很多很多的内容,那我针对其中某一段内容,我可以再做一个派生,派生成一个新的一个绘画,那我就可以针对这一段内容去进行一个更细节的调整,而不受他的下文的影响,那我觉得工作很好使。 那我如果我对于其中某一个任务或者某一个对答,我认为他做的不是很好,那我可以直接派生一个新的工作数, 根据这工新的工作数去进一步完善的调整。那再有一个其实是我之前偶然间发现的,就是我跟他说我之前有一个有一任务跟他说的是你明天再帮我接来干,那我发现我第二天到了单位,他九点就已经开始帮我干活了,那我这会还没有到单位, 那他就帮我干活,我觉得很神奇,其实这个事我仔细看一下,其实是他本身的一个自动化能力,那这个东西很很好用,也很好创建,可以看一下啊,我只要跟他说明天早上九点继续帮我执行任务就可以了。哎,你就可以看到他的明天早上九点会 我,他会根据这个县城继续帮你执行任务,以创建一个明天继续执行的任务的一个 task。 咱们可以点开来看一下啊,他其实就是一个自动化任务,那我觉得这个就非常好用, 我可以把一些明天做的,或者说我今天下班了,我可以给他一些任务,让他明天早上起来,我还没有到单位就开始去执行了。那我觉得这个任务这个事情就非常非常符合一个我对 ai 智能体的一个认知部落,不说 codex 牛批,嗯,对,大概就是这么几点吧。 呃,我再用用看,我再用用看把。呃,如果有我更多的这些经验的分享,我再做一期视频再分享给大家,这里是刘同学,如果喜欢我视频记得点赞双关注,下期再见。

我现在算是终于理解了,为什么有的人说 cloud code 比游戏还上瘾,比游戏还好玩 啊,就是因为我平时吃饭,有的时候我不知道吃什么,有点选择困难症。然后呢,我就跟 gpt 说,我非常希望 cloud code 帮我做一个小程序,就是一点啊,它就能随机给我生成一个菜单,告诉我今天我应该吃什么,解决我的这个选择困难症。 然后我直接跟 gpt 说,你给我写一个指令,这个指令就是发给可乐的扣的, 这个指令不要我亲自写,一定要交给 gpt 去写,然后 gpt 给我写出来对可乐的扣的要求,你看就是这些全是 gpt 写的啊,不是我写的,我就读了一遍,感觉差不多, 嗯,就是菜名,什么图片热量,然后计算出他的这个营养有多少,然后大概的成本有多少,时间有多少,就这些内容告诉他。而且呢,还要有随机菜单的这个 选项,就是我不知道吃什么的时候,我一点这个随机哎,他就随机给我出一道菜,然后今天不论是我点外卖还是我自己做,我就去做这道菜, 嗯,都是非常普通的那种家常菜啊,非常简单的。然后他告诉我这个指令之后,我直接发给可乐的扣的这个界面,就是可乐的扣的,告诉他之后呢,他就开始写代码了, 从一开始我发给他到现在,总共花了大概有七八分钟那个时间,然后给大家看一下他的成果啊,这是微信开发者工具,这就是开发微信小程序的这个工具啊, 你看相当于手机页面就是这样的。然后呢,这个小程序七八分钟已经做成这样了,我今天比方说,呃,我想 我随机点一个,我不知道吃什么,我就来这个小程序点一个啊,今天就吃香煎鸡胸肉,再点一下香煎鸡胸肉,还有鸡蛋蔬菜炒饭,查看一下他的详情,他的详情这道菜 有什么热量构成啊?蛋白质还有多少克?碳水多少克?脂肪多少克?他的营养信息写的非常全,制作步骤也给你写出来, 然后功他的这个功效,包括制作时间、成本都给你写的比较清楚。当然呢,这具体的没有那么精确啊,这只是一个七八分钟的一个呃,作品,我觉得这确实非常的让我震惊啊 大家,你以前没玩过 cloud code 的 也可以去玩一玩,真的非常有意思啊,我现在已经不打游戏了,我打开电脑我就开始让他给我写程序。

老公怎么了?靠,更牛的东西出现了。什么呀?太牛了,现在在 get 上面龙虾已经不火了,爱马仕火了,就这个爱马仕和这个龙虾啊,他俩配合起来才最牛逼的,就完完全全是互补的关系。 龙虾很多不太好解决的问题,因为爱马仕的出现全部解决了。嗯,就是之前我不是有很多自动化的动作需要让龙虾给我做吗?我之前可能需要去写保本。 你,你知道脚本这个东西,我基本上是让 call code 和 codex 帮我写吗?然后他们俩写其实每天有额度的,因为国内 a p i 也不是很好接吗?然后就用那个会员额度,就你就会变得很被动。然后现在爱马仕出现完全解决了这个难点。爱马仕是一个非常好的净化以及呃,写 skill 的 一个工具。然后我现在我的龙虾和爱马仕他俩能互相写信,你知道吗? 嗯,就是我让我的爱马仕每次把他的 skill 写完之后,就会给龙虾那边再去读这封信,然后进行一个部署和配置,这个方法真的 都给我去用,太好用了。然后龙虾配出来之后他就是手,爱马仕就是脑子,然后龙虾就能够去执行。还有非常多好玩的事情啊,比如说爱马仕,他还能实现自动游。什么叫自动游呢?就是 淘看不是很贵吗?你能够给他给爱马仕设置呃,一个路由的方式,你也可以理解成也是一个技能吧, 让你自己来决定,或者让他来判断一个问题,到底是用贵的模型还是便宜的模型。但就这个事情我跟你讲,我在这个世界上走了很多很多的弯路,嗯,就是我,我昨天我给他设置好的那个规则,我今天用下来我就发现真的是栽了。真的代码东西如果你交给便宜的模型去弄,其实是做不好的,代码这个东西你还真就得用比较贵的。嗯, 像国内的 g l m 和 cloud code 其实都比较好的。我跟你讲,现在 cloud code 都被我淘汰掉了,为什么会把它淘汰掉?就你就可以理解成,呃,龙虾和爱马仕,它是两个系统的手机,这个手机上面可以安装不同的软件,但你每个手机上面其实你是不是要杀毒?有时候手机会卡,你是不是要去清一下进程,或者看这个手机的安全状况? cloud code 和这个 codex 这两个工具呢?其实更像 给你手机解决问题的杀毒软件。嗯,或者说是一个,呃内部的程序软件,他可以看你整个这个手机的一个健康状况,修复你手机的一些问题,所以这这四个东西是个很好结合。但是现在我使用他们的能力变得越来越强之后就发现 口袋解决不了那些问题了,只要可可扣的他能够帮我修复,我再扯回来啊,就说刚说自动路由这个事情,天的模型,真的你给他交代一个任务,他会做一种叫做顺手帮你改他,他造成的损失都是 比较难以挽回的。虽然虽然掏坑少,但花的时间多呀,对话的轮次多呀,我还不如简单一点,我贵一点啊,一不到位,包括还有这这今天这两个软件升级,升级完了之后都是出各种问题,问题都是靠扣子帮我解决的,然后,然后我今天我就觉得 就是既既有成就感,又感觉很疲惫,就感觉今天啥也没干,光解决问题了。我今天所有的这些东西做完了之后,我,我真的有一个非常非常深的感触,你知道是什么吗?嗯,真的,老板们太重要了,我觉得当下的老板来说,就这个是我的一个非常 非常深的感触,就是原本啊,我认为开源很麻烦,就是也下载了一些像 autoclave 啊,包括呃,悟空啊这样的一些工具嘛。嗯,然后那我觉得不是这样子的,就是其实真正贵的 真的是那些看起来很省事的闭源软件,就像像就是大厂封装过的这些这壳,为什么?这些东西他的问题也不少,但是每一次出问题,我只能在他的架构下去改,我改的非常的有限的,我唯一力所能及的是是通过我的提示词去优化。 但是我举个例子,像像今天这个龙虾,我更新完之后,它出现了 bug, 我 可以从它底层去修复它自己出现的问题,嗯,能明白吗?你现在微信,比如说出个什么 bug, 一个什么功能用不了,你能通过你的底层去解决这些问题,你做不到的,包括阿里也是一直能去找客服,你没有办法说我,今天我,我自己给他代码改一下,你没办法的,就现在真的就是我一边折腾一边修 bug, 但是我真的认识的, 这不是在自己给自己找麻烦,明白吗?嗯,就以前我觉得,哎,我有现成的,我用现成的不就好了?我现在觉得不是这样子,就那些都确实省事,但是那个省事是你把你的主动权交出去了,更长远的来看是 你在替别人养孩子。所以我我就在想啊,就是为什么过去我,我们做生意也好,就是我们为什么没有想过我们要去搞一个自己的系统呢?就不管是从呃电商来讲,还是从自动化来讲,就好像从来没有想过就是我自己搞一套系统啊,而想一般是我入驻平台,或者说我去买一套萨斯,对吧?就从来没有想过这种问题,但为什么现在 可以去做这个事情,并且可以给众多老板去为他们做咨询,就给他们解决方案?我觉得其实最根本的原因还是因为过去这件事情他是真的太贵了。就你想想,你以前比如说我们搞一套自己的系统,怎么可能搞的出来?肯定得招程序员啊,程序员的工资以前多高,大家众所周知,对吧?高收入群体。 然后所以你那个时候你等于说你要养程序员,你还要组织团队,你还要懂产品逻辑,你还要去反复的试错这些东西。当然我不如用现成的平台了呀,现成的平台才最好的选择,但是现在不一样了, 现在现在这个时代呢,就是今天你如果自己去做你的系统真的是可能降了百分之九十,就说如果以前是十万,那现在就是一万,嗯,就是我觉得就能下降到百分之九十差不多。所以你你想啊,就是以前你想实现一个自动化的系统,你首先你得懂很多的技术, 然后你还得花很多的钱找人做,但是现在呢,其实就可以先让 ai 当你理逻辑,写框架,但是现在呢,其实基本上可以百分之百的还原解决, 无非就是时间的问题,成本也是在可控范围之内了,所以对于我们现在来讲,已经不像过去脸蒙的状态。那么既然不是这个样子,那为什么我不去用自己的系统,还要去用一些封装好的系统呢? 对,而且如果你给我交付的是成熟的软件,是我拿来就能用的,我因为不是没有用过,能够直接判定你不可能完完全全适应我的系统啊,嗯,对吧。那么 所以既然这个当下的条件这么成熟,所以其实现在真正的问题的重点真的不是在平台上了,而是在你自己的经营逻辑,你的每一个环节的业务流程,知识库框架 是不是清晰,如果你这套是强依赖于呃能力强的员工啊,怎么样他去完成的,而不是说任何人过来都能够跑的通的,那么这样的事情就 ai 就 没有办法管理实践。那你现在的经营框架,业务逻辑,如果是我不强依赖于人才,而是有一套成熟的体系,那完完全全自己搭系统就好了呀, 对吧?这个事情,这个事情性价比是最高的,所以啊,很多老板怕麻烦,但是这个麻烦的本身呢,你如果现在不去提前迈出这一步,变成更大的麻烦,其实真的就跟做生意本身一样,就是,呃,有的人他选择了上班,因为上班没有那么多麻烦事,有人他选择做生意,但是做生意你积累的所有东西都你自己的, 虽然说不停的遇到问题,解决问题,但是积累下来东西是自己的,但上班不一样,上班我给平台打工,所以 最后的结果就是规则、流量、系统、客户都不属于你,一旦改规则,一旦出现变化,你就会变得非常的被动。所以你知道最有意思的是什么吗?就是现在真的很多人在讲,讲的特别花里胡哨,然后什么自动化,什么智能题啊,什么一键搞定啊,我一听我觉得这话听太爽了,但是你真的往下做,你会发现真的 之前的不是那所谓的自动化的那个流程,以及你能不能支撑起你企业的自动化的那个流程,以及你能不能控制拥有了自动化之后的主权, 这两个才是关键,对吧?如果你这两个问题你都不解决,首先第一个问题你不解决,你达成不了丝滑的自动化。第二个问题不解决,你即便搭成了你的自动化,你是在给别人养儿子,嗯,你还是在给,对吧? 这个其他公司去。所以我真的我觉得现在很多人不是不会用 ai, 也不是学不会技术,而是真正的问题是,嗯,从来就大部分人,他从来没有想过 站在我要拥有自己的系统的这个角度去看问题,他永远在想,现在有没有个什么东西能让我少动脑子,让我不要去承担麻烦,有没有一个什么一个工具让我立刻躺着中赚钱?怎么可能,我觉得就痴人说梦一样。真的,就你今天不去花时间建立自己的主动权,明天你就只能花钱花时间花情绪去 调别人的规则,这几天真的干的头疼脑热的啊。但是我的结论非常简单,就是开会麻烦吗?麻烦大家系统累吗?累, 反复试错,打补丁,调各种各样的这个技能。但是你熬过去之后,这个东西他属于你,他是你的,你 bug 你 能自己修,你能调逻辑,你能改,成本你能控,嗯,对吧?你。而且你这个东西在入门一旦了解了之后,他会变得越来越简单, 他是一个从简单到很难再到难到一定程度在变得很简单的过程,但是这个过程已经现在是一个普通人能够掌握的那个难度了,不像以前你说你去学个代码,那就 你想都不敢想对不对?那现在我上一期视频也讲了,就是你通过用这个,呃,龙虾对吧?爱马仕和这个像 codex, code code 这样的软件你去结合起来用,你用自然语言你就能解决所有的问题,只要你愿意去调优, 没有你解决不了的问题。所以真的,我现在就真的很想劝各位老板一句,你不要怕现在的麻烦,你要想想现在的这个麻烦值不值得克服它未来能够成为一个长期让你更轻松的事。是说今天我省了这个麻烦,我以后会变得越来越麻烦,我的成本 将会变得越来越高,公权变得越来越低。那你我觉得各位老板,大家都是有长远眼光的人,你要想明白的是这个问题,所以你一旦把这个问题想明白了,其实你现在更知道你在 ai 的 时代到底该怎么走,往哪走,用什么样的工具招什么样的人,去做什么样的部署, 如果你这些没有办法想明白,想的通的话,你还在想所谓的,哎,就你能不能,你的工具能不能让我用啊?就我的工具你用不了。我今天我,我只能这么跟你说,你做的行业对吧?你做的平台跟我不一样,我的东西你用不了。很多老板真的来问我这个问题,一定要想想明白问题的这个本质,那你就会知道接下来真正值得你做的事情是什么。