哎呦,又见面了,朋友们,今天我们来聊一下用 ai 来控制你整个电脑这件事情的最新进展。因为啊,这个 cloud code 和 codex 呢,在最近这一两个月时间,相距推出了他们各自的解决方案,我实际使用下来呢,效果很不错, 之前爆火的龙虾 oppo pro 能够操作我们整个电脑对吧?但说实话,用过的人都知道这个东西吧,稳定性不是很好, 而现在呢,情况完全不一样了,这两家提出的方案的稳定性比龙虾强太多了。但是呢,这两家本身他们的解决方案呢,也有很多的不同,他们的优势劣势非常明显, 所以本期视频我们来做一个全方位的对比,同时我会简单的跟你说一下,哎,这两个方案如何安装,还有一些技术的原理,到最后你就会知道,哎,你该选哪个呢?作为你日常使用的工具,更重要的是,我会教你如何来同时的使用这两个完全不同的方案。 来吧,这里是乾坤下一站,一个用通俗易懂的方式来讲解如何用 ai 来提效的频道。点好关注,赞,我们开始。 好,我们先直接演示一下用 cloud code 和 codex 来操作你电脑的效果。 意思的是啊,这两家做的方案的名字呢,都叫做 computer use, 而且呢,你都可以在你自己电脑终端和他们各自的桌面客户端来用。接下来的操作呢,我们呢,主要在终端里面来操作。 好,我们先在这个终端打开 cloud code, 你 看我让 cloud code 打开我自己电脑上的日历,然后呢,在周六创建一个全天世界,标题就是周六出去玩, 我们输入指令,此时你看我的电脑在这个上面,对吧?然后呢,指令发出去之后,好,你看他打开了我的日历,然后呢,你看啊,我的鼠标自动的被移到了,这个下周六看到了吗?他自动的就被移过去了,他抢了我的鼠标, 然后呢,他自己呢?点击设置周六出去玩,你看他现在在输入周六出去玩。 好,你看这边,周六出去玩已经建好了,没有问题吧?好,我们现在来到 codex 这边啊, 同样的任务呢,我们现在在下周日,哎,我们创建一个全天的事件,叫做周日出去玩。你看这个指令发出去之后呢?你看,哎,他也打开了我的日历,然后你注意看,我自己这边有一个自己的鼠标,对吧? 但是呢,他那边有一个白色的小鼠标,你看到没有?我自己的鼠标和他的白色小鼠标呢,这两个是不冲突的,你看我自己鼠标呢,想干嘛干嘛,他那边呢自己在操作,这两个完全不冲突, 然后你看他各种点来点去,最后你看啊,这个周日出去玩,他也弄好了,好演示呢,我们就先看到这里,看起来都很丝滑,但是他们的差别很大,具体怎么安装呢?你看我这个视频的图吧,接下来我要做一个深度的对比, 不过在我聊这个具体的对比之前啊,我想先花一点时间来通俗的讲一下这两个工具它们各自实现的核心原理是什么,这样你后面听我说对比的时候,你才能够真正的理解。哎,它们为什么呢?会有这些差别? cloud code 的 方式呢?你可以想象成就是一个人,他坐在你电脑的前面,他看不到底层代码,他就只能看屏幕,怎么看呢?截屏 具体的流程是这样子的啊,你看这边他是怎么一步步操作的,他就是先打开了一个应用,对吧?然后呢,哎,先截个图,截完图之后呢,哎,他会发给模型去分析这个屏幕上有什么,我要点哪个按钮,在哪个坐标,各种分析。分析完之后呢,他就会操作鼠标或去点击, 点击完之后呢,他再截个图,确定结果对不对。截完图之后,哎,再分析,分析完之后再点击,就这样截图分析,采取行动,一直这样循环下去 好。而 codex 这边呢,就完全不一样了,它是利用了苹果电脑自带的一套系统,叫做无障碍数 a s tree。 这个东西呢,本来是苹果公司给盲人那些视障用户做的,就是让屏幕阅读器呢,哎,知道现在界面上有哪些元素, 然后呢,这个屏幕阅读器呢,就会把这些信息啊,给读给那些试驾用户。而 codex 的 工程团队发现这套系统 ai 也能用, 所以你看啊,这个 codex 的 操作过程是怎么样子的?他一开始呢,先获取了桌面应用的结构化数据,就是每个按钮呢,叫什么,在什么位置,什么状态都一清二楚。他分析完之后呢,他就会直接告诉系统,哎,我要点这个按钮,然后呢,系统呢,就会帮他去做手机。 当然了,他也有这个截屏降级的功能,就是 a x 区读不到的时候呢,他就会退回这个截屏的模式,但是那个只是备选方案,主力还是使用这个无障碍数好。原理就这么简单,一个呢靠看,一个呢靠读。 那么紧接着我就来说一下这两种不同的解决方案,在实际使用中会有哪些差距? 第一个最直观的区别啊, cloud code 会抢你的鼠标,而 codex 不 会, 为什么呢?就是因为这个 cloud code, 它就是很真实的来操作你的鼠标,来做这个点击啊等一些的行为。而 codex 呢,是直接向系统发指令,它甚至不需要把这个目标窗口放在前台。所以呢,你在前台正常的操作电脑,它呢在后台呢帮你干活,两个之间呢互不影响。 哎,这就让我想到了当时的 madison 团队呢,最早呢,哎,他们想做一个 ai 浏览器,然后他们也遇到了同样的问题,他们觉得 ai 在 用你的浏览器的时候呢,你自己呢,就用不了了,所以他们最后选择把一切操作都放在一个独立的虚拟机里面。 而现在呢,这个 cloud code 的 computer use 目前呢,就有这个问题,它抢你电脑的使用权,除非你专门留一个时间,比如说晚上睡觉的时候呢,哎,你让它慢慢的跑, ok, 我 们再来说说它们其他的区别啊。简单来说,因为 cloud code, 它每走一步呢,都要走完这个一整套的视觉分析的流程。 而 codex 呢,直接读取了这个系统结构化的文本数据,它跳过了整个视觉处理的环节。这就直接导致了下面这个后果,就是 clockcode 相比于 codex, 第一它速度更慢,第二它价格更贵。你想啊,它每一步都要截屏去分析图片,对吧?而图片呢,会占据大量的 token, 所以 同样的任务, codex 的 token 的 消耗量呢,大约只有 clock code 的 四分之一, 第三,它精准度会更差,因为 cloud code 靠截屏算坐标来点击,对吧?而在一些高分辨率的屏幕上,它的按钮呢,是很小的,就是你差几个像素又有可能会点歪了。 而 codex 通过这个无障碍数,它就是指哪打哪,基本不会出错。更重要的是, cloud code 它不能同时的去处理多个任务,因为你想啊, cloud code 要截屏吗?而且你只有一个真实的鼠标,对吧? 而 codex 呢,是可以同时开好几个任务的,它们每个呢都有自己的虚拟的光标,各干各的,互不影响。 听到这里,你是不是觉得,哎,这个 cloud code 拉完了,直接用 codex 得了。但是我跟你说不是的,它有自己的独特优势,有些地方比 codex 好, 而且长期来说,我反而更看好 cloud code 的 方案。 cloud code 碾压 codex 的 地方就是通用性,因为它是靠截屏来理解你电脑界面的,对吧?所以不管你是什么系统,你是 mac, 你 是 windows, 你 甚至是远程的桌面,只要有屏幕能截图欸,它就能操作。 而 codex 的 computer use 呢,目前呢,只支持 macos, 因为它非常的依赖这个 macos 那 个无障碍数系统,所以现在 windows 用户呢,还用不了。而且呢,你如果在欧洲,因为这个隐私合规的问题, codex 的 整个 computer use 的 功能呢,都被直接封掉了。 更重要的是,这个局限性还不只是平台,因为即使是你在 macos 里面呢,也不是所有的应用都有完整的无障碍数的信息, 比如说一些游戏的界面,一些飞格玛画布里面的元素,还有一些奇奇怪怪的应用,它们在这个无障碍数里面就是一片空白。 这个时候, codex 呢,确实有降级的机制,他会退回到这个屏幕截图加点击这个方案,但是问题是,这个降级的模式的精确度和效率就差很多了。 而截屏识别这件事情呢,恰恰是 cloud code 的 主场,它整个框架都是围绕着这个视觉理解来设计的,所以说在这些非标准的界面应用里面, cloud code 反而更加的靠谱。说到这里呢,让我想到了这个自动驾驶领域的两套方案, 就是说特斯拉呢,坚持用纯视觉,就是摄像头,看到什么呢,它就根据什么来开,这就很像我们真人开车对吧? 而另一派呢,是用激光雷达,就是他们靠发射光束去扫描周围环境的三维结构。你有没有发现, cloud code 的 截屏识别本质上就是纯视觉的方案,它就是在模拟真人用电脑的方式。 我们人类操作桌面的时候,不就是眼睛看到什么地方就点什么地方吗?而 codex 呢,更像是激光雷达,它不看画面,而是读取底层的结构化数据。 你想想,从这个第一性原理的角度, cloud code 的 方式呢,更加的接近于通用智能的本质。理论上,只要它的模型越来越强,推理越来越快,它的上限是没有天花板的。而 codex 呢,就只能在一些标准化的情境中使用,但凡有一些额外的场景, codex 就 不行了。 所以说,从长期的潜力上来看,我更看好 cloud code 的 这条路。但是目前来说,这套操作电脑的解决方案呢,我更愿意用 codex, 可是呢,我一直是 cloud code 的 忠实粉丝,它整体的 agent 的 能力呢,我用起来更舒服。 那问题来了,有没有一种方案可以让 cloud code 作为总指挥来自动地使用 codex 的 computer use 的 能力呢?有, 答案,就是让 cloud code 去调用 codex 的 命令行。简单来说, codex 有 一个无交互模式,就是你不需要打开和 codex 的 交互页面,你直接的终端输入命令就行了。然后呢, codex 呢,就可以在后台来自己默默地执行任务, 而输入命令这件事情呢,我们可以让 cloud code 来做,对吧?比如说,你看这里啊,我现在在 cloud code 这边,我跟 cloud code 说,让它运行这个命令,其实就是让 codeys 用 computer use 来打开我的计算器,然后呢输入一加一,然后呢把结果告诉我, 我直接输入,你看它会发生什么啊?哎,你看它这边有一个白色的小光标,自己在操作我的计算器, 过一段时间,你看我左边终端里面啊,克拉克说,哎,这个 codex 完成了任务,它通过这个 computer use 打开了计算器,然后呢点击一加一,然后呢,结果是二,怎么样?是不是很丝滑? 而这个命令里面有很多的参数对吧?具体每一个是什么意思,有什么坑要注意。还有它的官方文档的链接呢,我都整理在我的视频的图文版里面了,你去看就行了。 我再多说一句,如果说呢,你要想在 codex 里面要用 cloud code 的 computer use 的 能力,可不可以呢?也可以,因为 cloud code 呢,它也有一个无交互模式,这个呢,你自己去探索一下。 看完上面的对比呢,到底用哪种方案,我相信你心里已经有数了,我在这个视频图文版里面呢,做了一个详细的快速查找表,你可以按照你的设备和需求直接对号入座。好了,今天就说到这里,我们下期见。
粉丝282获赞1381

就在刚刚, codex 终于官方发布了手机版,很多朋友说现在只支持连 mac, 其实 windows 也能连上了。这期视频我就手把手教大家怎么把 windows 电脑上的 codex 和我们手机连上,让我们在外休闲时也能远程指挥家里的电脑干活儿。首先确保 codex 已经更新到了最新版,通常 codex 会自动更新,然后我们打开 c 盘,进入用户文件夹,找到点 codex 文件夹,打开后找到这个文件,双击打开,找到 features 这一栏,如果没有就自己按照我这里的格式加一行, 然后把这两行复制粘贴到 features 下面,保存配置就改好了。打开 codex, 等待手机连接。接下来我们就拿出手机,打开 check gpt app, 在 侧边栏点击 codex, 它会弹出一个窗口,如果电脑这边配置正常,下面就会出现这样一个黑色按钮,点击后要走一次认证流程,通过后呢就到了确认界面, 我们点击右侧的黑色按钮,稍等一会,就能看到屏幕上显示出来了我的电脑名称,并且同步了电脑上我与 codex 对 话的历史记录。我们点进一个绘画,可以看到之前的绘画记录,那么我们来测试一下,我让他在桌面创建一个 txt 文档,然后打开 点击发送,可以看到电脑上已经同步了我发送的信息,速度很快,文档也很快创建好,打开了, 体验非常丝滑。不过我发现一个 bug 就是 如果这是一个全新的绘画,发消息出去手机和电脑都没有反应,可能需要等待后续的更新了。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪。

真的,你的电脑只需要一个考勤就行了,可以让他二十四小时帮你干活,你想体验 code code 的, 你直接告诉他,他直接帮你安装中文版本的,并且配置好 deepsea 微四的一个模型, 如果终端用不习惯也没事,我直接让他帮我安装桌面端的版本,并且啊,会员也是帮我成功开通,像我这种一个代码都看不懂的,现在也能做网站呢。 你别说,这个画布做出来还挺就挺好用的,什么帮我把硬盘合区,做每日资讯,做 ppt 我 真的都全用它,真的太强太好用了,因为这个电脑它控制的话,它这个鼠标是和你和你的鼠标它不会冲突的,它在后面默默的干, 你来可以开两个,三个一起来跑。所以呢,我就直接上了一个 pro, 让三台电脑二十四小时直接帮我干。

强烈推荐大家去使用 open ai 的 ai agent 编程助手的终端 codex, 甚至你可以用 codex 来修复龙虾中的 bug, context 加 openclaw, 简直是天作之合,完美的搭配。而且啊, open ai 在 这个点上还真的是比较大方的, 如果原来你是 openai 的 plus 或者是 pro 会员订阅用户的话,在 codex 上面会给你配备一定额度的 token 的 使用配额。 大家好,欢迎来到玲姐说一 i 这期视频啊,我们聊聊同步在 windows 上线的 codex 的 使用,非常推荐,之前其实他在苹果的终端也上线了,所以我在这里给大家做一波强烈的推荐。 原来你在使用 cloud code, 同样的二十美金或者两百美金的这个订阅计划。大家知道那个配额啊,是很不够用的,稍微干点活就不能用了,就要另外买 token 了。但是 codex 使用的配额还是相对比较充沛的。 open ai 你 花二十美金每个月的订阅啊,给你整个的配额还是挺多的,又可以聊天,又可以申图,还可以用 sora 每天大概十到三十条的 这个使用条数,同时你还可以使用 codex, 现在苹果用户和 windows 用户都可以使用了,赶紧在电脑端把它下载下来。这个编码助手啊,也可以说是 cloud code 的 平替, 当然叫平替啊,也不太合适,我只是说 cloud code 在 这个领域上面我之前讲过,它做过很多刻意的练习,解决过很多开放性的生产任务,所以它整体的位置是行业老大的位置。我说这个领域啊,不是说呃,所有领域 是在这个生产工具的 call 顶的领域啊,它是属于引领的位置,而且它也一直在定义行业的标准,包括大家熟知的 m c p, skill, co work 等等的工作方式。但是呢, codex 这一波的上新呢,确实是有它的创新点在里面的,它用户的交互界面体验比较好, 对于那种比较厌恶命令行的这种交互方式的用法会特别的丝滑。它会有自己的特色,比如说像工作数这样的任务的并行的方式啊,我觉得对于多任务并行啊也特别的友好。另外使用它你基本不用付出 额外的成本和费用,更重要的是加持上了它最新的五点四的模型。 五点四最重要的一个优化是什么?就是它加强了在 computer use 上面的能力,也就是这个 agent 的 编码助手,它有更强的执行操作和理解的能力,相当于它的闭环能力更强了。 所以听到这里,是不是已经迫不及待去微软商店下载 codex 了?这期视频我会给大家介绍 codex 的 特性,以及如何从零到一。使用 codex 我 会给它几个实战任务,看看它这个过程中会遇到什么 bug, 怎么执行解决,会不会有翻车的情况。 如果你是苹果用户呢,直接在 app store 里面去下载就可以了。如果说你是 windows 用户啊,你是 win 十及以上的用户, 你就直接在微软的这个 microsoft store 里面直接下载就可以了,它的整个的下载安装非常丝滑,你就按着它的引导一步步完成就可以了,这里我就不做深入的演示了,这个就是 codex 安装后打开的界面, 是不是一股熟悉的味道扑面而来,特别像 try gpt 的 聊天窗口,对于那种使用命令式的交互窗口,仍然有一些抗拒的。这份使用者 codex 我 认为是一个非常好的选择。 在这里啊,你可以很好地过渡。我就结合 codex 的 使用,从零到一实操,给大家也讲讲 codex 的 使用特性。 首先啊,在设置这个地方,点开,大家在这里登录自己的 try gpt 的 账号,同时在这里可以很快地切换你经常使用的语言,英语或者中文都可以。在这个地方会显示你这个账号的额度, 它是通过两个维度限制你,一个是五小时的使用量,还有一周的使用量。如果说你真的做很多深度密集的 这个使用任务的话,我觉得这个额度可能还是不够。但是对于大部分的使用者而言,我认为这个额度啊,已经比 cloud code 要大方很多了,基本你们都是够用的。 在出事安装的时候,在这个地方,现在我已经弹点掉了啊,就是它会弹一个窗口让你安装这个沙箱。 这个专用的沙箱也是 codex 针对 windows 的 一个设计,有这样的沙箱,让它的整个的命令的执行在一定受控的环境里面,也可以有效地保护你系统本身运行的文件, 就按照它默认的配置去选就可以了。在下面这个位置啊,可以更改权限的范围,除非你非常笃定啊,给它完全的访问权限, 大份情况下建议使用默认权限。另外,在模型这个位置,可以选择不同类型的模型。 现在比较推荐初学者使用的是 g p t 五点四,因为五点四是一个综合型的模型,它既有理解能力,又有推理能力,还有 computer use 的 能力,还有 coding 的 能力,它是一个综合型的模型。另外呢,如果是针对专门的 扣顶的工作,可以选择五点三 context, 它是针对 context 这个环境和 context 的 任务,专门进行过优化的这么一个模型。 在这个地方,推理强度一般默认是高,也可以选择超高,当然这个背后所消耗的 token 数就会不一样。另外在加号这里啊,你可以去上传文件和照片, 这里就会有很多的玩法了,又可以对一些多模态的内容啊进行加工,比如说对视频进行剪辑。同时在这里可以调它的 speed standard 和 fast。 这里啊,我觉得它有一个做得很好的地方,相当于它在用户体验侧的一个优化,它这里有一个计划模式, plan 模式。其实这个技巧呢,我在之前给大家教学 chain 这个软件的时候,也会讲过类似的技巧, 只是说他现在把它单独拎出来了,对于这个功能进行了优化。你在做一些项目的时候,你可以先计划,先和这个 gpt 去沟通, 这个项目怎么规划,它的框架是什么,怎么设计,计划完了之后再开始执行 coding。 所以 从这个层面来说, context 它的定位啊,其实分为三层,第一层它是一个代码助手,它可以帮你写代码,解释代码,审裁代码。第二层,它是一个工程型的 agent, 它可以帮你去识别 bug, 修 bug、 提 pr 等等。而且它还可以做很多并行的任务, 比如说我在这里有个任务啊,你点击这个右击鼠标,在这里啊,它就有一个特色,叫做派生到新的工作树,叫做 walk g, 就是 你在做一个项目的时候,当它出现问题的时候, 你会发现可能有好几个东西要修。如果做过生产实践,你会发现啊,你修 a 的 时候, b 也在修,那么它们有可能把 a 修好了, b 又出了问题,就是它会出现相互的交叉污染这个情况。有了这样的 work tree, 你 就能够并行地进行很多工作任务,那么你发现没有,你的效率就提上来了。 codex 的 第三层,它还是一个电脑操作型的 agent, 比如说我刚刚讲的剪辑视频这样的任务,或者说其他的这个文件名批量命名的任务,整理会议资料的这样的任务,它其实都是电脑操作型的, 它也是一个电脑操作型的 agent, 这是我对 codex 这个 agent 工具的三层的理解。当你需要新建一个项目的时候,可以点击这个位置,这里点击 add project, 新建一个项目文档,然后在里面呢点击这个新县城。 同时呢,它这里有一个功能啊,叫做自动化,你可以让它定期的帮你制作一些任务,那么你就可以设置一些定时任务,比如说让它每天定期的帮你去搜集某个领域的专业信息,或者定期的跑一些这个整理文件文档的这么一个信息 等等等等。这里需要关注的一个点就是它的权限问题啊,你给它开多大的权限?当然它这里也少不了最近最流行的 skill 技能 这个板块我在 cloud code 的 这个视频里面讲过,它也是类似的,你看它这里,它的官方 skill 里面放在最前面的也就是 skill create 创建一个新技能的技能, 你在这里可以去调用它的技能啊,它不是那种命令的交付窗口。比如说你想要用这个 figure 码,你就可以点击这个加号,它就直接帮你安装了这个 skill。 如果说你想用这里面的视频生成工具,你就可以用这个 sora 生成视频的技能,并且啊,你想生成新的技能,点击右上角的新技能, 这里呢,它就自动调用了 skill creator, 你 就可以跟它去交互聊天,告诉你你要创建怎么样的技能,然后它帮你进行封装。并且啊,如果说历史你用的是 vs code 这样的终端,你也可以同步很好地去打开对应的项目, 很好的平移切换到这里。而且我自己用下来的体验,它会比 vs code 更好用一点。所以对于 vs code, 我 觉得大家可以放一放,然后平移切换到 context 这个终端来使用。下面我就讲一些具体的实操的案例来启发一下大家,可以用 context 做什么任务?它有哪些魔力?效果怎么样?好,我们进入任务实操,我先给他一个任务,我让他给我批量修改文件的名称。在这个文件夹里面我放了五条视频,这个视频是我 youtube 上面已经剪辑好的成品视频。 现在他的命名啊,只是有日期的标签,是没有主题的,我希望他能够基于这个视频的前六十秒所表达出来的内容抽取主题,把这个主题加上日期,对这些文件进行批量命名。 在 context 里面,我就把我的要求和希望达到的结果告诉给他,这里是我写的提示词。在任务的进行过程中啊,因为我们对它进行的是一个有限的授权,在一些关键步骤上面,它会来询问你的授权和意见。 比如说这里啊,它问你是不是直接就对这些文件名进行重命名了,你可以回答是,或者一直允许,或者是告诉他如何调整。这里啊,我就允许是 在这个思考过程中啊,他也会说,从命名的这个动作是越过沙箱的一步,可以看到,在这个过程中,你的文件,你的系统内的东西是比较安全的,这也是我比较推荐大家使用 context 的 一个原因。同时在这个任务跑的过程中啊,我再同步地开一个新的项目,新的县城, 点击这里的 add project, 创建一个新的文件夹, orange cad game, 然后选择这个文件夹,这样我就进入了一个新的项目文档。我现在想做的这个任务是类似这个经典的 flappy bird 的 这个网页小游戏这样的开发,把这个游戏的主角形象换一下,把那只经典的黄鸟 换成一只橘猫,飞行员稍微做一个调整。但是整个游戏的框架和逻辑啊,还是去参考 flappy bird 的 这个设计。在这里啊,我就把这个游戏的要求放到这个 context 里面。 注意啊,这个游戏的要求的需求文档和整体的项目框架,我也是让 g p t 给我写的,为什么我会这样操作呢?其实这也是一个技巧,因为虽然 open ai 在 codex 上面的配额还是相对比较大方的, 但是如果你要做比较极致的生产任务,这个配额可能还是不够,所以我就尽量可以省一点,把前面的需求设计和构建的这个阶段蓝图规划的内容交给 gptchat 去聊,用五点四 thinking, 这样子相当于前后的模型,是前后连贯的这么一个状态。先把需求沟通好, 然后呢,再回到 context 里面,在这里面我们还可以再极致一下,再细划一下,打开这里的计划模式,让它再给我规划一下这个游戏开发的任务。这里的推理功能,我选择一个超高,然后点击发送, 在右侧,这里就可以看到不同的项目文档,不同的县城,它们就在并行。如果说你比较关心的县城呢,你还可以使用这里的这个钉钉一下,它就会置顶在前面,这样子你关心的核心在修的一些 bug, 重点在做的项目就在最前面。使用了这么多款 编程助手的终端 app, 我 自己的感觉 projects 是 我整体用下来觉得最丝滑的。这里帮我把整个的开发计划规划出来了,包括需求理解,文件结构,关键接口,七步 mvp 开发计划,以及最后的验收,还有第二阶段的功能等等,都包含了。 他问我是否实施此计划,我点击确认实施。哎,这个文件夹从命名的任务已经完成了,他告诉我每个文件分别从命名了什么,而且他这里还讲了这个转写的逻辑是什么。前六十秒他识别出了 这个视频主要是讲什么内容的,然后提炼出的主题是什么,然后把这个主题加上日期格式的转写,变成了这个新的命名。我们打开 d 盘看一下, 欸,都命名好了,完成的很棒哦,以后这种批量重复的工作啊,都可以尝试交给 codex 来使用。当然对于这个 codex 这个工具啊, gpt 对 它的定位,还是说把它作为一个 agent coding 的 工具, 你要尽量让他做他擅长的工作。再回过头来看,他的执行路径是比较清晰的,因为他扫描发现我这台计算机没有装离线的音频转文字的转写的工具,这个不可用, 所以他就通过工具把这个视频的前六十秒进行抽帧,核心去保留底部的字幕区域。因为我的这个视频啊,有时候也会有这个背后贴了这个 ppt 的 信息,所以他会同时用 windows 的 ocr 去读这个字幕,以及 ppt 的 标题和页面的文字 综合来形成对这段视频主题的判断。最后呢,再把它整合成新的文件名,并且啊,它强调这次的授权仅在这个指定的文件夹里面进行操作,不能够碰其他目录的文件。 整个过程流程清晰,权限的边界也很清晰。这个任务其实对于 codex 都是非常简单的任务啊,我给他上一个高的推理权限,实际上也是有点大炮打蚊子的感觉。我想表达的是可以用 这个工具去执行以往我介绍的在其他终端的其他任务都是可以的,它的能力上限啊,和智能程度还是比较高的,甚至你可以用 codex 来修复龙虾中的 bug。 context 加 openclaw 简直是天作之合,完美的搭配。这个游戏的任务它完成了,总共花了十七多分钟,给了我这个试跑的链接。这个试跑的链接啊,就存在我的 d 盘里面的项目文档里面一个 html, 我 们在浏览器里面打开这个界面啊, 空格,点击上升穿门就得分,我们开始飞行试试。哎呦哎呀,碰到柱子了,再试一下。哎呀,还挺难的,再试一下。哎呀,这个有点难通过呀。 一分,哎呀,一分,结束了, 得两分。哎呀,得两分,这是我的最好成绩了。以上就是 context 的 介绍和实操,它可以帮你写项目,写代码,也可以帮你修 bug, 提 pr, 还能够做电脑的 computer use。 你 打算用它来做什么呢?欢迎在评论区分享你的想法,我们下期再见!记得订阅玲姐说 ai 的 频道哦,拜拜!

现在的 codex 已经不只是写代码,而是开始直接接管电脑了。它能做的事很杂,但也很完整,数据分析、应用开发、游戏构建、网页开发,甚至浏览器操作和电脑控制都能串起来做。 重点不是会不会写,而是它已经能把开发、测试、交互、自动化这些环节连成一条线。更关键的是, browser use 和 computer use 这类能力已经不是掩饰级别,而是能真正落地的工作流工具。这 真正让人注意到它的是 o s world firewall 这个机准。这个测试看的不是答题能力,而是模型能不能在真实电脑环境里自己完成操作。 g p t 五点五,在这里拿到百分之七十八点七,而且 toc 效率也更高, 也就是说,它不只是能做,还能更省的做。更绝的是, codex 现在加了 browser use 插件,能直接进入 build and firewall 的 闭环,先生成前端,再打开浏览器,像真实用户一样点击浏览验证,发现问题就继续修。这一步的意义很大, 因为他不是只看页面表面,还能同时读取视觉信息, console 报错和 network logs 页面哪里卡住了接口哪里失败了,模型都能自己判断。 于是他做的就不只是自动点网页,而是像一个持续工作的测试员,边操作边截图边看结果边迭代,直到任务真的跑通。这个能力一旦稳定下来,很多原本需要人工盯着的前端测试流程验证、基础自动化都会被他接过去。 而且这次更新还把 computer use 的 速度直接提了百分之四十二。这很关键,因为真正用起来,瓶颈往往不是能不能做,而是做得够不够快。 现在它在框架上的操作已经接近人类节奏,甚至可以打开本地页面,测试 checkout flow, 发送邮件,访问 youtube 页面。使用方式也很直接,插件预装在 codex 里,调用 act 命令就能起用。 更实用的是,复杂任务不一定要开高强度推理 de intelligence, 反而更省额度。结论很清楚, ai 正在从帮你写一段代码走向,替你把整个电脑工作流跑完。关注全球 ai 速递,获取更多 ai 前沿资讯!

无处不在,半年左右,森林构建,对广大开发者而言,这个平台就是 windows。 因此,今天我们正式将 collect 应用引入 windows。 collect 应用可轻松管理多个项目,这一切都在同一界面中完成。此次推出的 windows 帮 collect 应用 实现完全原生运行,将在专用 windows 沙盒环境中通过 power show 实现。 kolex 广受好评的各项功能也一应俱全,包括能轻松探索并扩展 kolex 能力的技能模块,以及能默默在后台为您出力任务的自动化功能。 工作树功能可在同一项目中并行处理多项独立任务。机能库中可发现新的 windows 专享技能,比如专为 windows 应用开发者打造的 win ui 技能。 如果你更喜欢用 w u s l 来开发应用, w u s l 环境下工作, 请从 microsoft store 下载应用或访问 open e com collections 使用现有在 g p d 账户或 ipm 要登录即可。

国内用户如何使用 codex? 这个视频我将教大家不需要解决网络问题的情况下完美使用 codex 软件, 避免使用 codex 时提示输入手机验证。我们需要准备两个软件和一个网站,那两个软件呢?分别是 codex 和 cc switch, 一个网站就是我们要选择接入哪个模型,或者是我们使用的 api 中转站。首先我们可以到 codex 官网来下载,我们可以直接打开这个网址,国内用户是不需要上网环境就可以打开的, 打开后我们可以直接下载,如果你是 windows 电脑,这里会出现 windows 的 版本, 我们直接点击下载就可以。第二步,我们打开这个 cc switch 的 github 仓库,我们可以直接输入这个网址来打开,在这里我们选择下载它的对应版本,点击后我们向下滑动, 在这里我们可以找到不同的客户端,我的电脑是 mac, 所以 我选择 mac 版本,点击后直接会下载 这里你如果没有配置好上网环境的话,下载这个客户端会比较慢,那我在这里已经帮大家下载好了,并且已经上传到了云盘,如果需要的话,你可以在评论区留言,下载好后我们正常安装就可以。 现在我们打开 codex, 现在我们可以看到它,让我们选择登录,这时如果你没有上网环境的话是无法使用的, 那现在我们就用到了第二个软件 cc switch, 我 们正常安装 cc switch 后,我们选择打开它。 打开这个 cc switch 后,我们看最上方的这一栏,我们选择 codex, 在 首次配置时默认是只有最上方的这一个官方 api 的, 下面这三个都是我自己配置的,那如何配置自己的模型或者 api 呢?我们点击这个加号, 在这里我们可以选择不同的供应商,也可以自己填写供应商的名称。那我这里以这个 ai go code 的 这个 api 网站为例,点击后我们看到这里的参数,它已经帮我们设置好了, 我们现在只需要填写一个 api k, 那 我们可以打开它的官网,在这里我们点击登录或者注册,如果首次使用的话, 它是需要充值额度的,充值好后我们可以点这个 api k, 然后在这里我们可以看到这个 codex 有 不同的两个分组,我们可以选择这个速度更快一些的,或者性价比更高一些的。 我们点击这个创建,可以给这个密钥起一个名称,然后点击创建,这时它会生成一个密钥,我们选择复制,然后把这个密钥粘贴到 cc switch 中, 我们选择添加,添加好后我们在这里点击起用,这时我们再将 codex 重启一下, 这时我们就可以看到他现在可以正常使用了。这里我全程都是使用正常的上网环境,我们来测试一下,帮我生成一张,欢迎大家点赞收藏。评论的图片要求十六比九的比例, 它现在已经按我的要求可以正常对话,并且可以生成图片了,而且调用的还是最新的 emoji 二模型, 并且全程不需要登录,不需要其他的上网环境。我们接入第三方 api 的 话,也是用多少花多少。这个方法主要是针对那些没有上网环境的同学, 如果你在安装过程中出现了任何问题,都可以在评论区留言,我会给大家逐一回复, 下个视频我将教大家如何具体使用这个 codex, 它和 cloud code 有 什么区别?我们下个视频见,欢迎大家点赞收藏评论。

大家好,今天我要听大家介绍 codex 最新的 chrome 扩展。这是一项非常实用的功能,专为让 codex 能够无缝融入实际工作环境而设计。首先,我们都知道很多工具和任务都依赖于浏览器, 特别是对于文件处理、数据剪索等。这款 chrome 扩展支持在 windows 和 macos 平台上与 codex 应用写作,提升了工作效率。 它使 codex 能够直接在你当前的 chrome 浏览器中工作,不需要额外的切换。扩展会使用与你相同的浏览器配置,包括账户登录信息、 cookies、 标签页等,让集成操作变得自然顺畅。 比如,我们可以利用 codex 扩展对用户反馈进行研究,识别产品的使用案例并分析痛点,最后将这些信息汇总成数据表格, 而这一切都可以在后台完成,不会影响我们正在进行的其他工作。这款扩展也支持结合插件使用,例如,我可以通过插件让 codex 检查与出差相关的邮件,从中提取关键信息,并自动完成报销表单,甚至还能上传缺失的收据,一气呵成。 更重要的是, codex 无需依赖截图或鼠标操作,而是直接通过扩展控制浏览器,这使得它在处理一些复杂的工作流时更加高效,比如多标签页操作、内容筛选或是自动脚本执行。举个例子,我正在开发一款多人绘画游戏,借助 codex 和它的扩展, 我可以让多个虚拟代理分别在不同浏览器标签页中写作、玩游戏,从而模拟多用户互动。总之, codex 的 chrome 扩展大大扩展了它的能力,让它可以无缝连接你已经在使用的工具和应用,快来试试吧,说不定它能为你的工作带来意想不到的便利。

今天教大家用手机控制电脑上的 codex, 这个功能很好理解,电脑继续负责跑项目,手机让你随时看到进度,也能在关键时候做决定。在 mac 上打开 codex, 登录账号,选中你正在做的项目, 直接交代任务,比如修复一个问题,调整一个页面,或者让它帮你运行测试。离开电脑之后,打开手机上的嵌 gpt, 进入 codex, 你会看到正在运行的设备,比如 macbook 或者 mac mini。 点进去手机就能看到 codex 在 电脑上的工作状态,它现在处理到哪一步,改了哪些文件, 测试有没有通过,电脑画面里发生了什么,都会同步到手机上。 codex 需要你确认的时候, 会把请求发到手机上,你可以批准,也可以拒绝,还可以直接告诉他换个方向继续处理。代码、文件权限和本地环境都还留在电脑里,手机只负责查看进度,发指令, 做审批,这就很适合那些需要等一段时间的开发任务,你可以在路上看一眼修改结果,排队时批准测试。回到电脑前, codex 已经把进度整理好了, codex 手机版的价值就在这里,电脑继续工作,你随时接收。

比起 opencloudex 可能才更适合普通人使用,能操作电脑做文档、表格、 ppt, 还能生成图片,执行自动化任务,逐渐从编程 agent 走向桌面 ai 助手。那今天这个视频我就给大家带来 codex 保姆级教程。先到 codex 的 下载页点击下载 macos, 下载好后打开安装包, 直接把文件拖进去就可以了。打开 codex, 它的界面很像网页版的 ai 聊天界面,主要可以分为三块,右边这里就是和 ai 对 话的地方。左上角的四个功能,第一个就是开启一个新的 ai 对 话搜索,可以通过标题来找到之前的对话内容, 剩下的插件和自动化功能我会在后面详细讲解。左下角这里是两种和 ai 写作的方式,一种是项目方式,一种是对话方式。 项目方式更适合去做一些长期积累的任务,比如沉淀知识库、做工作流、写代码。有两种方式使用项目,一个是创建新项目,默认会在文稿目录下创建一个项目文件夹,也可以使用你现有的文件夹作为项目, 所有后续的 a 阵子操作都会默认在项目文件夹下进行。第二种对话方式,就像我们平常使用网页版 ai, 可以 临时去做一些任务,比如偶尔查一查信息什么的, 那我们这里就可以新建一个项目,我们也可以在三个点这里给项目改名,在聊天框左下角就可以看到他已经进入了刚才新建的项目文件夹。下聊天框这里的加号, 我们就可以上传图片或者文件给 ai 这里我们还可以开启计划模式,这个模式是不让 ai 直接改动文件,而是先生成一份计划,我们看完没有问题以后才会执行。 权限,这里 codex 有 三种权限,第一种默认权限,就是只能访问项目文件夹下的文件,如果涉及到其他文件或者网络访问,就会弹出审核框让我们去批准。第二种是自动审查,就是 codex 会自动放行低风险操作,高风险操作才会需要人工审核。 最后一种就是给 codex 所有的电脑权限,很方便使用。右边这里我们可以选择模型的推理强度,复杂人物可以选择更高的推理强度。 模型这里我们可以切换多个叉 t b t 模型最后的速度就是可以加快模型的输出速度,不过会消耗更多的 token。 这里直接让 ai 写一个单 html 的 个人播客网站,但我们可能有新的想法,想要加进去就可以直接进行引导, 比如我这里补充整体色彩风格要用孟菲斯风格,还可以继续补充,要用一个板块式,个人作品展示用滑动式般的呈现。我们直接点击这里的引导, codex 就 会在下次执行工具调用后 插入我们新的要求,很适合补充提示词或者纠正方向,不用中断对话,让他帮我们再写一个手工艺的电商网站。使用 react, 那可以看到两个任务就并行执行了,属于转圈的状态, codex 当前步骤完成后就会显示为一个小蓝点。 看完基本使用,我们来看一看一些好用的特性。先来看一下插件功能,插件就是用来帮助 codex 操作各种工具的, 比如 computer use 和 browser use 就是 让 codex 操作你的电脑和它的内置浏览器,下面这两个就可以操作表格和 ppt, 那 往下翻我们还可以看到操作邮箱 canvas 设计软件的,我们点开一个就可以看到。这个插件其实由外部服务调用和技能组成, 那有的插件本身也是一个技能,后面也会给大家演示怎么使用插件。技能这里大家应该就不陌生了,技能就是工作流程的一个分装,如果有不懂的朋友可以看一下我之前讲 agent skill 的 视频, 如果你是以现有文件夹的方式创建项目的,也会把里面的技能同步过来。接下来我们就来看一下 computer use 这个插件, 它是利用 macos 的 屏幕录制和无障碍辅助数,让 codex 既能看到画面,又能精准点击。 这里我让他打开扫雷通关简单模式,这个半透明小光标就是 codex 操作所使用的,不会占用你的鼠标。一开始他尝试标记地雷的时候,发现标记失败了,很有意思的是,他换了一种玩法, 直接打开安全格,然后就是一路门店,推理出所有可能的安全位,直接通关。我就在想,如果以后模型的推理速度和输出速度再快一点,那我们干游戏就只需要用 ai 就 可以了。 下面我们看一下办公三件套和作图插件,这里我让他调研一下英伟达显卡的发布和价格信息,并让他制作成 word 文档, 然后配图。这里他很快先把配图制作出来了,整个过程一共用了十六分钟,第一次用的时候他会自动安装相关运行环境,制作完成后,他还会截图进行复查,发现可以打磨的地方还会进行二次修改。我们打开文档来看一下 发布信息和价格表都出来了,而且还贴心的配了图,最后还有产品线解读和购买建议。然后我让他在这个基础上把价格表整理成 excel, 同样的他在处理过程也会不断修正错误,花了五分钟时间做好。 来看一下表格,所有信息都正确写进来了,唯一有个瑕疵是溢价,这一栏应该是百分比,它这里用的是小数,不过这些都可以通过细化提示词去解决。下面继续让它根据文档做 ppt 分 格,参考苹果信息层级不超过三层。 他做完第一版以后,又对我的信息层级这个要求进行复查。我们来看一下 ppt 整体布局还是很舒服的,满足了我对信息层级的要求,没有堆满字,而且风格也是沿用了英伟达的配色。最后我们来说一下自动化功能, 它就相当于一个定时任务。右上角这里我们可以新建任务模板里有一些关于代码的任务模板。下面这里你可以选择在哪个项目文件夹下进行, 并且设定定时时间,有每小时、每天、每个工作日或者每周。也可以自定义规则,我们可以直接粘贴这个规则,让 ai 帮我们改成任意时间,比如这里就让它改成每周二和每周四的十三点执行。那 那我们在这里也可以让它执行已有的工作流程,比如这里,我之前是用 cloud code 做的,在 cloud 点 md 里已经写好了完整的自动拉取推文的流程,那直接让 codex 执行就可以了,很顺利地帮我完成了定时任务。那以上就是全部教程了,如果对你有帮助的话,记得一键三连。

程序员注意,现在手机也支持 codex 了,但重点不是让你在手机上写代码,真正重要的是,你可以随时随地控制电脑上的 codex。 以前 codex 跑到一半问你要不要继续,要不要执行命令,你人不在任务就停住。 现在你在手机上就能看进度,批操作、改方向。过去的 ai 编程工作流有一个很大的问题,人必须跟着 agent 的 节奏走。 他问你要不要继续,你不在,他停,他问方案选 a 还是 b, 你 不回,他停,他要执行测试或者高风险命令,你没批准,他还是停, 这不是能力问题,是协助半径太短。 agent 很 强,但他被锁在电脑前。 openai, 把 codex 放进 chat gpt 手机 app, 但重点不是在手机上跑代码, 真正干活的还是你的 mac、 mac mini、 devbox 或者远程开发机。手机只负责看批改方向,文件、凭证、权限都还留在原来的机器上。这件事真正改变的是 agent 工作方式。 以前你在陪 agent 跑,现在是 agent 跟着你的节奏跑。你在地铁上可以看他跑到哪一步,你在开会时可以审一眼 diff, 你 在吃饭时可以批准他继续测试。你在路上发现方向错了,可以直接打一行字让他改。 你看官方信息里真正关键的表述,在 chat gpt 移动应用中开始新工作,查看输出结果,控制执行进度并批准后续步骤。 这句话的重点不是移动端,而是控制执行进度和批准后续步骤。也就是说,手机端承担的是 agent 工作流理的控制面,而不是代码运行面。具体怎么用?第一步,电脑上先跑 codex, 目前主要支持 macos、 windows, 还要等。 第二步,手机更新 chat gpt app, ios 和安卓都已经有 preview。 第三步,在 chat gpt 里打开 codex, 你 就能看到正在跑的任务线程。 第四步,在手机上看 beef, 看测试结果,回复新指令,批准高风险操作,甚至新建任务,继续跑。 这次更新不是让程序员在手机上写完整项目,他更像是给你的 ai 程序员加了一个随身遥控器,你不用把文件凭证、开发环境搬到手机上,你只需要在他需要判断、批准和纠篇的时候能立刻出现。 所以这次更新不是 codex 多了个手机版,而是你的 ai 程序员终于有了一个随身遥控器。对程序员来说,这比手机写代码重要得多。因为真正的效率提升不是你在哪里敲字,而是 agent 卡住的时候,你能不能立刻让他继续往前跑。

让库德斯呢控制我的电脑,全程呢?让他自己给我做设计,我们看看效果会怎么样?这里话呢,我是先让库德斯干嘛呢?就是参考我这个产品, 这里话丢了一个,那个就是手机, vivo 手机产品,然后呢给了他两组参考,对吧?每个文件夹里面呢生成五张图,对应五张图啊,一共十张图,我给他什么参考呢?哎。一个什么呢?一个是呃,这种什么雪地啊?嗯,之类的。这种雪地啊,一个参考。 那另外一个怎么参考呢?另外一个是花卉的参考,就是完全让他按照着参考来。按参考来干嘛呢?就是让他是根据这个参考呢去提供那个就相当于给大家群群版,然后呢给大家个产品卖点,试一下创意呢?他自己想,然后呢?吭哧吭哧吭哧,然后自己想了,对吧? 然后自己控制我电脑,再然后呢?哎,他就能去开始打开我的这个串起屁。那第一个的话呢?什么呢?他是丢了两张这个参考图,那跟这个产品呢?哎,申请一个是雪地的吧,对吧?不要放其他 logo 什么的,但是,哎,这第一张雪地的效果还可以啊。 第二个呢就是这个,呃,延时的。第三个呢是在冰块里面的。第四个的话呢就是应该是他模仿的脚印,你看变成手机印了,印在里面,我们这样看, 还有是这衣服呢,这个是我没想到的衣服,这个都不知道他怎么跟这个长相结合在一起啊?饱满可以,对吧? 那好,再后面的话呢,就是那个啊,就是花卉的,就是因为我给两组嘛,另外组花卉的,他就是跟花期结合的,一个两个,对吧?这两个很重复嘛?这个人家说不要太重复了,因为这个是像是万里生长一样的, 这个应该跟那个时间去好像有点关系啊,然后这些花卉的 啊,还有这个,这个对吧?那我又让他干什么事呢?又让他那个挂这里,自己去打开我的编辑室,然后自己的话呢?就参考那个,呃,创意图啊,吭哧吭哧,再生成个海报 题词是他自己写的,然后自己那个我让他不要重复哈,创意不要重复,对吧?啊?这一张的话每张都是他自己写的题词,然后自己那个生成海报,生成完了再接着下一张,对,就就这样挂了,挂了一个晚上哈, 没有好创业的时候呢,你就可以让它扩展自己呢去做,对吧?那这前提干嘛呢?就是你在要在设置里面哈,打开什么?打开你的电脑控制电脑控制这个打开来,然后呢把这个安装一下就可以了,点个授权他可以控制电脑了。

这个扣代个可以直接用谷歌的浏览器了。我发现在这个 ai 时代压根就不需要学习啊,我前两天在想着要做电商啊,还要呃卡在那个上货,然后反正那个界面还要自己研究,看的挺头大的。然后今天这个现在他自己支持浏览器了啊,可以自己去 看茶田。那不就代表着我直接让他网页去呃登录浏览器,然后帮我操作那个抖店的后台就行了吗?不直接让他扣贷自己跑了吗?但是现在有个问题啊,这个 windows 的 扣贷 x 好 像 有问题。装不了啊,一直都装不了,都好多次了,装不了。本来在这个插件商店里他都没有这个 虎哥的浏览器,这是他已经修过一遍之后才有的啊,大家可以去看一下,应该很多人都没有,但是你可以直接让扣袋子给你修,他现在在给我修,估计一会就修好了啊。学估计是真的不需要学啥了,全都是 ai 自己去干了。 这马上把这个装好了,什么公众号,什么呃图文啊,只要能做的,包括那个,特别是我现在需要的这个抖店的运营啊,直接让他自己去上传。 刚才还用不了啊,现在已经他给我修好了,可以用了,我让他给我打开了这个抖店的后台啊,说明是可以的啊,可行了, 这个插件商店里他已经安装好了,现在是可以用的啊。呃,大家不懂的可以把这个开成完全访问权限啊,像我这种不懂任何呃什么代码工程的各种傻子啊,就该开这个完全访问权限,虽说有这什么什么各种各样的什么风险, 但是不开的话他解决不了问题啊,对不对?我也不懂,即使坏了我也看不懂啊。不开解决不了问题,开了反而能解决问题,即使有一定的风险,风险也可控嘛,对吧?小破电脑坏了就坏了。

codex 现在能直接操控你的 app 了,是不是有点神奇?我们一起看一下。打开这个能力之后,它会先申请屏幕和输入权限。也就是说, codex 不 只是看代码了,它可以真的看到桌面,然后自己去点去输入。 这个 spotify 的 例子就很好理解,用户只是说想听一个适合专注的歌单。 codex 没有等你指定软件,而是自己打开 spotify 搜索,然后播放。 而且它不一定非要站着你的前台再看 the vinci resolve, 它能打开专业视频软件,找到最近项目,切到编辑页。虽然还很早期,但你会感觉到它已经开始碰到真实工作流了。 放到浏览器里也是类似的思路。以前很多页面检查要写自动化脚本,现在你可以直接让 codex 去看页面, 比如这里他打开本地页面截图,看布局、配色和对称性,然后给出修改建议。这个感觉更像身边多了一个会看页面的助手。 再看这个评论模式,你不用把需求讲得特别复杂,直接点页面上的位置,写一句这里换图按钮换个颜色,间距调一下。 提交之后, codex 会把这些评论整理成任务,自己去改,再刷新给你看。这样沟通会轻很多,因为你们看的其实是同一个画面, 它也能做一些很小的桌面操作,比如打开计算器,输入十加十加十再告诉你结果。这个例子很简单,但说明操作链路已经通了。 所以评论模式真正省下来的是来回解释的时间,你看到哪里不对就点哪里。 codex 再把这个修改落到代码里, 最后看 xcode, 它可以打开项目,构建应用,再启动模拟器,也就是说,它正在从写代码慢慢走到运行和验证这一步。 所以我觉得这次更新真正重要的地方不是它会点几下鼠标,而是 codex 开始从代码编辑器里走出来,进入你的真实工作流。它可以看页面、改前端、打开专业软件,甚至帮你完成一些桌面操作。 现在它还不完美,但方向很清楚,未来的 ai 助手不只是回答问题,而是能跟你一起把事情做完。

今天给大家说一下怎么在 windows 上安装 code, 以及怎么在 windows 上使用。首先我们打开一个浏览器, 然后输入一下 code, 点积木 x y z 点 com, 然后我们把它放大,找到一个 c l a 安装与配置选项,这里有个 context, 找到 windows 这个选项,点击使用说明。 我们这里系统的要求就是需要 windows 十十以上,然后这里可以安装相关的依赖,需要需要安装 note g s 和 git, git 是 可选的,我们首先要安装 note g s, 打开这个网站, 然后点击这里进行下载,下载完毕以后点击下一步就行了,因为我这里已经下载好了,就嗯就不做影视了。然后我们打开一下这个, 这里首先需要环境检测,这里可做可不做,就是大家如果没安装 get 的 话,没安装 get 的 话,这里环境检测就会失败,我们点击复制一下命令,这里点击一下 cmd, 然后把这个命令复制下去,要安装完 get get 以后,这里环境检测就会出现这个绿绿色的部分,这环境检测已经通过, 这里我推荐大家使嗯,不要使用 windows 原生态的 cmd 使用使用,嗯。 vs code, 我 们下载一个 vs code, 在 这里直接搜索一下 vs code, 然后点击这里, 其中类 vs code 也可以,比如 css 等等的。有一些相关的软件可以直接打开终端,然后点击这里进行下载, 这里已经开始下载了,然后大家直接点击下一步,默认进行安装就行了,我们这里已经下载完毕了,就是这个, 然后我们这里是我的相关的项目,然后我们可以新建一个文件夹, 以后写项目就在这个文件夹上面,比如我的项目,然后把这个文件夹拖入 vs core 的 中, 然后点击信任这个作者,然后我们可以在一开始 vs core 的 这里是嗯,英文,然后我们在这在扩展,这里可以搜索一下,搜索一个中文, 然后把这个安装下,安装下来,然后再切换一下语言,这就是中文的显示,然后我们继续看一下它是如何说的。 在环境检测这里相关的终端,就直接在这里点击一个切换面板,就是相关的终端, 然后在这里终端可以任意添加,添加很多个, 我们以第一个终端为例,这就相当于打开一个 c m d, 然后点击粘贴,粘贴粘贴进去了,点击回车键,这里显示文件检测通过, 然后把这个缩小一下,看一下, 这里需要卸载,嗯, codex 如果你没有安装,可以跳过,我们卸载一下,点击复制命令,这里卸载, 已经卸载完毕, 然后需要安装 context, 这里是复制,然后在这边直接粘贴, 等待安装,这里已经安装完毕,然后验证一下安装, 直接复制一下命令,这里相关的提示,如果有错误,直接直接按照这这个错误直接复制这个相关的命令就行,跟不同的电脑有不同的。嗯,要求我们直接复,把这个复复制下来,然后进行粘贴, 可以看到 codex 已经安装完毕,已经出现这绿绿色的小圆点, 这里是可选的,然后我们就不执行,然后需要登录去创建 cortex 的 key, 然后下面就是写一键,用脚本去写,写入这个 key, 我 们先创建一个 key, 嗯,这里就是需要创建 cortex 的 key, 然后就在这里选择一个产品线,点击 cortex, 然后输入一个名称,随便输入一二三,创建这个 key, 这个 key 已经复制过来了,就这就刚我们创建的能复制下来,我们在我的项目这里输一个,创建一个文件夹,把这个 key 复制下来一点。 md, 把这个复制上去,刚刚的 key 复制粘贴, 这就是刚刚我们嗯创建了 key, 然后再回到嗯原来的安装的脚本以及说明,点击这里使用说明, 嗯,创建 key 以后,第六步已经完成,然后就这里有个命令,一键写入脚本,这里这个命令就比较长,还要替换嗯你的 key, 然后就复制下来,然后放到嗯这这里, 这就是刚刚复制的命令,这里注意需要把你的或者是 a p r key 替换成,替换一下,把这删除,然后把这个复制下来,粘贴到这这里,这就是刚刚我们的 key, 然后把这一部分 复制到终端中,点击粘贴, 然后点击回车,这里已经写入完毕。这一行大家不要管 这里,嗯,就是写嗯,写入相关的已经完毕了,然后它显示要重新开一个终端, 下一步就这里,下一步就是手动配置,大家可以嗯自自动进行配置,手手动配置我们就不看了。 然后下一步就是你的进进入你的相关的项目,然后在终端输入一个 context 就 行了,然后把这个 context 和终端叉,嗯,删除和输入一个 context, 然后就进入 context 终端的界面,大家就可以在这里写嗯嗯写项目,比如这里可以输入一个斜杠 model, 这也可以选择相关的模型,目前我们选择的是 g p c 是 五点四,然后输一个二,然后再输一个四,这是 g p c 五点四的模型, 然后再输一个斜杠 app, 这是允许,呃,国泰 s 执行什么范围?我们选择四就是允,允许它全自动, 不需要经过我们的允许,他就可以自行的修改代码,修改文件等等。我们选择个四,那再输一个一, 然后我们把这,嗯,比如我们问一下,或者是你好,你是谁?你可以帮我做什么? 来看一下他怎么回答的, 它已经回答完毕,这这里就是它相关的回答,然后我们点击这里用量日式,可以看到这是刚刚我们创建的 key 的 名称,然后相关的模型以及消耗的积分, 然后以及时间,然后我们再把这个 context 给擦了,然后如果你想回到原始的,嗯, context 就 输一个 context。 瑞苏米 那点击这是刚刚我们创建的,然后点击一个回车就回到刚刚的相关的,嗯,项目项目的范围中了。同时我们可以也使用 vs code 的 插件,点击扩展这里 下载一个 context, 输入一个 context, 下载第一个,这里有个官方的标识这里, 然后把它下载下来,下载下来的时候大家就就可以看到 vs code 这边有一个 context 的 相关的,嗯,图标在这边,在我图标点击了这里,点击一下 它就会出来相关的 port 的 事,比如刚刚我们两分钟前的它这里显示一个两分,然后我们点击这里,然后就没必要进入,进入到终端中,直接在这里可以进行和它进行对话,比如,嗯,问一下, 你可以帮我写 matelab 代码吗? 就直接在这里进行工作,终端这里如果大家不方便使用,直接在这里插件部分使用, 他这里他已经进行了回答。

今天有个重大的更新啊,可以在手机上使用 code x 了,我自己还没有更新,给大家来一个一镜到底啊,怎么去在手机上完成一个配置?好,所以你的 code x 要更新到最新的版本,然后左侧这个图标里面就会有设置 code x 移动版,我们推进看一看,点开 就是这个页面了,同步到你的手机啊,也要更新到最新的版本,我们点开有一个 code x。 好, 我们先在电脑上操作,点击开始设置允许你的手机控制条,电脑好,点击允许,这个时候你的移动设备就要去扫个码,你要拿着你的手机又说是苹果手机,用你的原相机去扫,看到没有,这里就会有一个打开的按钮,点击 点击连接,你看这里就有个授权的界面啦。这一步大家要注意,很多人在他的 app 里面找扫码的入口,没有一定要原相机去扫,这是第一个问题,第二个问题,有人扫了之后回到这个界面,还是等待桌面连接,我就这个问题卡了好久,六处提供解决方案,大家一定要注意看打开你的终端去安装 code c l i 的 能力这个命令, 然后装好之后输入这个指令,它就会帮你去配置,你不管它,它配置完之后,你这边就会弹出一个授权手机了,这个就可以弹出来了。好,这个时候我们点授权,继续再点授权, 等待它完成安全设置。这边已经可以看到我电脑的 code s 工作区了,再看看电脑端显示已连接这里可以点开, 这个是控制你的应用的,这个是控制你的浏览器的,可以点开安装一下,我之前没有装好,然后点击完成设置,我们对看一下操作啊,我们点一个昨天没有做完的,我们试一下,继续完成这个任务啊,帮我重新写一个最新的脚本。好,这是我刚刚发的一个指令, 这里面的功能跟桌面端的都是一对应的啊,这个是上下文的窗口的占用,这是对应的模型的选择都是可以的。好了,搞定啊,生成了一个五月十五号无一一的一个 m d 的 文档,我们继续回到文档上, 这是六叔放文档的地方,你看对应的文档已经生成了,终于可以在手机上去干活了,这个配置流程大家赶紧去试一试。好了,我是六叔,拜了个拜。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

这是一条 codex 技术求助的一个视频,五月十四号官方有一个最新版本的更新,然后新版本上有一个手机可以控制电脑的那个图形化 app 的 功能,然后呢,我这边用的是 mac 的 图形化的 codex 界面,但是我用的第三方的 api 接口,这我实话说我就为了省钱啊,确实也帮我省了不少钱, 所以可能是因为我没有买他的会员,所以他没有给我开放这方面功能啊,就你们有没有这个彦祖或者是逸飞啊,你们买了那个会员的啊,你们有没有 扣代斯手机控制的这个功能,然后有没有用过?对,可以跟我分享一下,因为我在犹豫啊,是不是我需要我再专门花一笔钱去测试这个东西,因为我现在的解决办法是之前有个小姐姐 啊,给我的建议用那个向日葵同手机操控电脑啊,也能也好使啊,也好使,只不过呢,手机上面操作还是有一点点别扭点,各种画面的操作啊,拖拉出来都是不是特别方便的。 对,他如果有一个手机版的话,就有一些我手机上的素材就可以直接传了啊,就不用再倒腾好几次啊,这块的,有没有这个有经验的兄弟对吧?已经开始玩的啊,跟我们分享一下。