每一个刚装上 hammer 的 人,有可能你是用的 cloud code, 有 可能是 code is, 这些不重要。第一件事不是让他给你写代码,也不是说什么 ppt 和做文案。你直接先把这段话发给你的 hammer 或者其他的智能体。 请在我授权的文件夹里扫描我的电脑工作区,包括桌面文档、项目文件、常用资料, 然后帮我做三件事情。一旦这个人物跑完了之后,你就会发现 hammers 和 open color 的 这样的一些智能题,它不是一个聊天框,它更像一个我们自己专属的私人助理。只要我们先让他看了我们的工作现场,他就知道怎么能帮助我们。 很多人用 air 用的很浅,因为他们问的问题一直是零散的问题。今天问一句,明天问一句,所有的事情都是从零重新开始。但真正好的智能题,应该先了解我们是谁? 我们在做什么?我们的资料放在哪里?我们的项目又在哪些地方有卡点?我们的工作习惯是什么?每天重复消耗时间的地点又在哪里?他越理解我们,就越能成为我们长期的协作者。所以,安装好 hammer 之后,第一件事先跑这个任务,让他先做一次你的电脑提 写、工作复盘和写作规划。如果你还没有 hammers, 可以 点一个关注,找我们要 u 盘版的 hammers, 即插即用的专属智能屏,插上就能用。你不用再去做那些费力的配置,直接开始你的第一件事,让它了解你。
粉丝1075获赞9119

让库德斯呢控制我的电脑,全程呢?让他自己给我做设计,我们看看效果会怎么样?这里话呢,我是先让库德斯干嘛呢?就是参考我这个产品, 这里话丢了一个,那个就是手机, vivo 手机产品,然后呢给了他两组参考,对吧?每个文件夹里面呢生成五张图,对应五张图啊,一共十张图,我给他什么参考呢?哎。一个什么呢?一个是呃,这种什么雪地啊?嗯,之类的。这种雪地啊,一个参考。 那另外一个怎么参考呢?另外一个是花卉的参考,就是完全让他按照着参考来。按参考来干嘛呢?就是让他是根据这个参考呢去提供那个就相当于给大家群群版,然后呢给大家个产品卖点,试一下创意呢?他自己想,然后呢?吭哧吭哧吭哧,然后自己想了,对吧? 然后自己控制我电脑,再然后呢?哎,他就能去开始打开我的这个串起屁。那第一个的话呢?什么呢?他是丢了两张这个参考图,那跟这个产品呢?哎,申请一个是雪地的吧,对吧?不要放其他 logo 什么的,但是,哎,这第一张雪地的效果还可以啊。 第二个呢就是这个,呃,延时的。第三个呢是在冰块里面的。第四个的话呢就是应该是他模仿的脚印,你看变成手机印了,印在里面,我们这样看, 还有是这衣服呢,这个是我没想到的衣服,这个都不知道他怎么跟这个长相结合在一起啊?饱满可以,对吧? 那好,再后面的话呢,就是那个啊,就是花卉的,就是因为我给两组嘛,另外组花卉的,他就是跟花期结合的,一个两个,对吧?这两个很重复嘛?这个人家说不要太重复了,因为这个是像是万里生长一样的, 这个应该跟那个时间去好像有点关系啊,然后这些花卉的 啊,还有这个,这个对吧?那我又让他干什么事呢?又让他那个挂这里,自己去打开我的编辑室,然后自己的话呢?就参考那个,呃,创意图啊,吭哧吭哧,再生成个海报 题词是他自己写的,然后自己那个我让他不要重复哈,创意不要重复,对吧?啊?这一张的话每张都是他自己写的题词,然后自己那个生成海报,生成完了再接着下一张,对,就就这样挂了,挂了一个晚上哈, 没有好创业的时候呢,你就可以让它扩展自己呢去做,对吧?那这前提干嘛呢?就是你在要在设置里面哈,打开什么?打开你的电脑控制电脑控制这个打开来,然后呢把这个安装一下就可以了,点个授权他可以控制电脑了。

真的,你的电脑只需要一个考勤就行了,可以让他二十四小时帮你干活,你想体验 code code 的, 你直接告诉他,他直接帮你安装中文版本的,并且配置好 deepsea 微四的一个模型, 如果终端用不习惯也没事,我直接让他帮我安装桌面端的版本,并且啊,会员也是帮我成功开通,像我这种一个代码都看不懂的,现在也能做网站呢。 你别说,这个画布做出来还挺就挺好用的,什么帮我把硬盘合区,做每日资讯,做 ppt 我 真的都全用它,真的太强太好用了,因为这个电脑它控制的话,它这个鼠标是和你和你的鼠标它不会冲突的,它在后面默默的干, 你来可以开两个,三个一起来跑。所以呢,我就直接上了一个 pro, 让三台电脑二十四小时直接帮我干。

我跟大家说酷狗真的能接管我的电脑,刚才我用了一下,真的非常好用。大家来看一下我刚才弄了什么东 西。首先我假装我找不到三年级下册的英语的 pdf, 我 就让他帮我找,找完之后呢,再用 gpt 里面只 two 生成第一单元的思维导图,还有 ppt 可以 供上课使用。结果他真的就帮我开始干活了,我这边一动没动。最后他帮我生成了 ppt, 还有三年级下册英语第一单元的思维导图, 他还怕我找不到,有文件直接把这一个也发送了给我。如果我把其实词再写好一点,这个 ppt 会更好看一点。总之, codex 真的 太牛了。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

哎呦,又见面了,朋友们,今天我们来聊一下用 ai 来控制你整个电脑这件事情的最新进展。因为啊,这个 cloud code 和 codex 呢,在最近这一两个月时间,相距推出了他们各自的解决方案,我实际使用下来呢,效果很不错, 之前爆火的龙虾 oppo pro 能够操作我们整个电脑对吧?但说实话,用过的人都知道这个东西吧,稳定性不是很好, 而现在呢,情况完全不一样了,这两家提出的方案的稳定性比龙虾强太多了。但是呢,这两家本身他们的解决方案呢,也有很多的不同,他们的优势劣势非常明显, 所以本期视频我们来做一个全方位的对比,同时我会简单的跟你说一下,哎,这两个方案如何安装,还有一些技术的原理,到最后你就会知道,哎,你该选哪个呢?作为你日常使用的工具,更重要的是,我会教你如何来同时的使用这两个完全不同的方案。 来吧,这里是乾坤下一站,一个用通俗易懂的方式来讲解如何用 ai 来提效的频道。点好关注,赞,我们开始。 好,我们先直接演示一下用 cloud code 和 codex 来操作你电脑的效果。 意思的是啊,这两家做的方案的名字呢,都叫做 computer use, 而且呢,你都可以在你自己电脑终端和他们各自的桌面客户端来用。接下来的操作呢,我们呢,主要在终端里面来操作。 好,我们先在这个终端打开 cloud code, 你 看我让 cloud code 打开我自己电脑上的日历,然后呢,在周六创建一个全天世界,标题就是周六出去玩, 我们输入指令,此时你看我的电脑在这个上面,对吧?然后呢,指令发出去之后,好,你看他打开了我的日历,然后呢,你看啊,我的鼠标自动的被移到了,这个下周六看到了吗?他自动的就被移过去了,他抢了我的鼠标, 然后呢,他自己呢?点击设置周六出去玩,你看他现在在输入周六出去玩。 好,你看这边,周六出去玩已经建好了,没有问题吧?好,我们现在来到 codex 这边啊, 同样的任务呢,我们现在在下周日,哎,我们创建一个全天的事件,叫做周日出去玩。你看这个指令发出去之后呢?你看,哎,他也打开了我的日历,然后你注意看,我自己这边有一个自己的鼠标,对吧? 但是呢,他那边有一个白色的小鼠标,你看到没有?我自己的鼠标和他的白色小鼠标呢,这两个是不冲突的,你看我自己鼠标呢,想干嘛干嘛,他那边呢自己在操作,这两个完全不冲突, 然后你看他各种点来点去,最后你看啊,这个周日出去玩,他也弄好了,好演示呢,我们就先看到这里,看起来都很丝滑,但是他们的差别很大,具体怎么安装呢?你看我这个视频的图吧,接下来我要做一个深度的对比, 不过在我聊这个具体的对比之前啊,我想先花一点时间来通俗的讲一下这两个工具它们各自实现的核心原理是什么,这样你后面听我说对比的时候,你才能够真正的理解。哎,它们为什么呢?会有这些差别? cloud code 的 方式呢?你可以想象成就是一个人,他坐在你电脑的前面,他看不到底层代码,他就只能看屏幕,怎么看呢?截屏 具体的流程是这样子的啊,你看这边他是怎么一步步操作的,他就是先打开了一个应用,对吧?然后呢,哎,先截个图,截完图之后呢,哎,他会发给模型去分析这个屏幕上有什么,我要点哪个按钮,在哪个坐标,各种分析。分析完之后呢,他就会操作鼠标或去点击, 点击完之后呢,他再截个图,确定结果对不对。截完图之后,哎,再分析,分析完之后再点击,就这样截图分析,采取行动,一直这样循环下去 好。而 codex 这边呢,就完全不一样了,它是利用了苹果电脑自带的一套系统,叫做无障碍数 a s tree。 这个东西呢,本来是苹果公司给盲人那些视障用户做的,就是让屏幕阅读器呢,哎,知道现在界面上有哪些元素, 然后呢,这个屏幕阅读器呢,就会把这些信息啊,给读给那些试驾用户。而 codex 的 工程团队发现这套系统 ai 也能用, 所以你看啊,这个 codex 的 操作过程是怎么样子的?他一开始呢,先获取了桌面应用的结构化数据,就是每个按钮呢,叫什么,在什么位置,什么状态都一清二楚。他分析完之后呢,他就会直接告诉系统,哎,我要点这个按钮,然后呢,系统呢,就会帮他去做手机。 当然了,他也有这个截屏降级的功能,就是 a x 区读不到的时候呢,他就会退回这个截屏的模式,但是那个只是备选方案,主力还是使用这个无障碍数好。原理就这么简单,一个呢靠看,一个呢靠读。 那么紧接着我就来说一下这两种不同的解决方案,在实际使用中会有哪些差距? 第一个最直观的区别啊, cloud code 会抢你的鼠标,而 codex 不 会, 为什么呢?就是因为这个 cloud code, 它就是很真实的来操作你的鼠标,来做这个点击啊等一些的行为。而 codex 呢,是直接向系统发指令,它甚至不需要把这个目标窗口放在前台。所以呢,你在前台正常的操作电脑,它呢在后台呢帮你干活,两个之间呢互不影响。 哎,这就让我想到了当时的 madison 团队呢,最早呢,哎,他们想做一个 ai 浏览器,然后他们也遇到了同样的问题,他们觉得 ai 在 用你的浏览器的时候呢,你自己呢,就用不了了,所以他们最后选择把一切操作都放在一个独立的虚拟机里面。 而现在呢,这个 cloud code 的 computer use 目前呢,就有这个问题,它抢你电脑的使用权,除非你专门留一个时间,比如说晚上睡觉的时候呢,哎,你让它慢慢的跑, ok, 我 们再来说说它们其他的区别啊。简单来说,因为 cloud code, 它每走一步呢,都要走完这个一整套的视觉分析的流程。 而 codex 呢,直接读取了这个系统结构化的文本数据,它跳过了整个视觉处理的环节。这就直接导致了下面这个后果,就是 clockcode 相比于 codex, 第一它速度更慢,第二它价格更贵。你想啊,它每一步都要截屏去分析图片,对吧?而图片呢,会占据大量的 token, 所以 同样的任务, codex 的 token 的 消耗量呢,大约只有 clock code 的 四分之一, 第三,它精准度会更差,因为 cloud code 靠截屏算坐标来点击,对吧?而在一些高分辨率的屏幕上,它的按钮呢,是很小的,就是你差几个像素又有可能会点歪了。 而 codex 通过这个无障碍数,它就是指哪打哪,基本不会出错。更重要的是, cloud code 它不能同时的去处理多个任务,因为你想啊, cloud code 要截屏吗?而且你只有一个真实的鼠标,对吧? 而 codex 呢,是可以同时开好几个任务的,它们每个呢都有自己的虚拟的光标,各干各的,互不影响。 听到这里,你是不是觉得,哎,这个 cloud code 拉完了,直接用 codex 得了。但是我跟你说不是的,它有自己的独特优势,有些地方比 codex 好, 而且长期来说,我反而更看好 cloud code 的 方案。 cloud code 碾压 codex 的 地方就是通用性,因为它是靠截屏来理解你电脑界面的,对吧?所以不管你是什么系统,你是 mac, 你 是 windows, 你 甚至是远程的桌面,只要有屏幕能截图欸,它就能操作。 而 codex 的 computer use 呢,目前呢,只支持 macos, 因为它非常的依赖这个 macos 那 个无障碍数系统,所以现在 windows 用户呢,还用不了。而且呢,你如果在欧洲,因为这个隐私合规的问题, codex 的 整个 computer use 的 功能呢,都被直接封掉了。 更重要的是,这个局限性还不只是平台,因为即使是你在 macos 里面呢,也不是所有的应用都有完整的无障碍数的信息, 比如说一些游戏的界面,一些飞格玛画布里面的元素,还有一些奇奇怪怪的应用,它们在这个无障碍数里面就是一片空白。 这个时候, codex 呢,确实有降级的机制,他会退回到这个屏幕截图加点击这个方案,但是问题是,这个降级的模式的精确度和效率就差很多了。 而截屏识别这件事情呢,恰恰是 cloud code 的 主场,它整个框架都是围绕着这个视觉理解来设计的,所以说在这些非标准的界面应用里面, cloud code 反而更加的靠谱。说到这里呢,让我想到了这个自动驾驶领域的两套方案, 就是说特斯拉呢,坚持用纯视觉,就是摄像头,看到什么呢,它就根据什么来开,这就很像我们真人开车对吧? 而另一派呢,是用激光雷达,就是他们靠发射光束去扫描周围环境的三维结构。你有没有发现, cloud code 的 截屏识别本质上就是纯视觉的方案,它就是在模拟真人用电脑的方式。 我们人类操作桌面的时候,不就是眼睛看到什么地方就点什么地方吗?而 codex 呢,更像是激光雷达,它不看画面,而是读取底层的结构化数据。 你想想,从这个第一性原理的角度, cloud code 的 方式呢,更加的接近于通用智能的本质。理论上,只要它的模型越来越强,推理越来越快,它的上限是没有天花板的。而 codex 呢,就只能在一些标准化的情境中使用,但凡有一些额外的场景, codex 就 不行了。 所以说,从长期的潜力上来看,我更看好 cloud code 的 这条路。但是目前来说,这套操作电脑的解决方案呢,我更愿意用 codex, 可是呢,我一直是 cloud code 的 忠实粉丝,它整体的 agent 的 能力呢,我用起来更舒服。 那问题来了,有没有一种方案可以让 cloud code 作为总指挥来自动地使用 codex 的 computer use 的 能力呢?有, 答案,就是让 cloud code 去调用 codex 的 命令行。简单来说, codex 有 一个无交互模式,就是你不需要打开和 codex 的 交互页面,你直接的终端输入命令就行了。然后呢, codex 呢,就可以在后台来自己默默地执行任务, 而输入命令这件事情呢,我们可以让 cloud code 来做,对吧?比如说,你看这里啊,我现在在 cloud code 这边,我跟 cloud code 说,让它运行这个命令,其实就是让 codeys 用 computer use 来打开我的计算器,然后呢输入一加一,然后呢把结果告诉我, 我直接输入,你看它会发生什么啊?哎,你看它这边有一个白色的小光标,自己在操作我的计算器, 过一段时间,你看我左边终端里面啊,克拉克说,哎,这个 codex 完成了任务,它通过这个 computer use 打开了计算器,然后呢点击一加一,然后呢,结果是二,怎么样?是不是很丝滑? 而这个命令里面有很多的参数对吧?具体每一个是什么意思,有什么坑要注意。还有它的官方文档的链接呢,我都整理在我的视频的图文版里面了,你去看就行了。 我再多说一句,如果说呢,你要想在 codex 里面要用 cloud code 的 computer use 的 能力,可不可以呢?也可以,因为 cloud code 呢,它也有一个无交互模式,这个呢,你自己去探索一下。 看完上面的对比呢,到底用哪种方案,我相信你心里已经有数了,我在这个视频图文版里面呢,做了一个详细的快速查找表,你可以按照你的设备和需求直接对号入座。好了,今天就说到这里,我们下期见。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

如果你还没用上最新的 openid codex, 一定要去用啊,真的太牛逼了啊!大家如果看过之前这个豆包手机啊,你跟他指令,然后他操作你手机那些视频的话,那你今天就想象一下这个流程直接被翻译到电脑上了 啊,这抠代码。现在你跟他说一个东西,他可以直接打开你电脑的应用程序,你就能看他的这个光标在移动,然后直接就在你的应用程序里面进行操作了,非常非常牛逼啊。这个从日常的一些打开邮件,处理邮件,然后他可以扮演一个角色,然后他跟你的同事对话, 呃,再到打开什么这个剪视频的软件,他能直接操作你的电脑来完成。我不再是像之前别的 ai 一 阵他都是打开一个啊这个 服务器,然后在里面去操作很多东西他不知道,现在就直接在你的本地端操作了。而且他比这个 cloud 做的更牛逼的地方在于, cloud 可能更多还是停留在一个工程的感觉上啊,他不能打开你的应用程序去做啊,但是这个 codex 你 是能看着他直接光标在移动的,这个感觉是非常爽的啊,要记着这个体验是要比这个小龙虾好很多的,而且他在关键的需要确认隐私地方,他会停止住, 如果他觉得这个任务可能侵犯到你的本地隐私,他直接就告诉你,对不起,这个事我做不了,可能有些啊影响到你的隐私数据了,所以这块呢,还是可以安全放心的去使用的啊。自从他们这个 code red 啊就是红色警报之后啊,这个升级迭代速度是非常的快啊,不再像曾经一样被人嘲笑说 cloud 和我 jimmy 都做的比他好了。这场事情已经啊, 我相信未来几个月还有大动作啊,之前图像模型升级之后啊,三个月以后这面呢就有大动作了。 gbt 我 觉得也是一样的,非常期待下 gbt 六 啊。我觉得他们最近的这个更新已经越来越让我看到 agi 时刻的接近了。我是志远,如果这期视频对你有所帮助的话,记得点关点赞分享给你,觉得会有收获的朋友们,下期视频见。

openai 这次更新 codex, 我 觉得最关键的一点是,它终于进 chrome 浏览器了。以前我们让 ai 帮忙,大多是让它写代码给建议,告诉你怎么操作。但现在不一样了,它可以直接在浏览器里帮你干活。比如你已经登录好的后台表格、 crm 网页工具,它都可以在里面处理任务。 而且他不是抢你的鼠标,你还能继续正常用电脑,他自己在后台开环境,自己执行。简单说, codex 不 只是会写代码了,他开始进入真实工作场景了。 codex 不是 只能打开一个网页,慢慢点,他可以自己开一组标签页,同时处理多个任务。比如你让他整理用户反馈,他可以打开多个页面看内容,走流程,找问题。这种感觉就很像你旁边多了一个实习生, 你把任务交代清楚,他自己去跑,最后把结果拿回来给你看。 codex 不是 简单模拟人类点鼠标, 他背后是会写代码跑代码的。这意味着他处理网页任务时,不一定要像人一样,一个按钮一个按钮慢慢点, 像批量填表、提取页面信息、检查多个页面测试流程这些重复活,他可以用更快更稳定的方式完成。 这次升级的核心不是 ai 又变聪明了,而是 codex 真的 开始从写代码助手变成能在浏览器里干活的 ai 代理了。浏览器里的重复工作可能要正式交给 ai 了。

给你们看一下我电脑里这个能够七乘二十四小时工作的牛马。哎我去,一会没看着他竟然在摸鱼了,可恶啊。这个呢,是最近上线的腾讯的 agent 马维斯, 之前啊,我一直在用 codex, 但是呢,受到 toky 的 限制啊,不敢随心所欲的使用。但是这次马维斯呢,每天的免费额度啊,可以让我们为所欲为了。主要吧,他这个还能够操控电脑完成很多日常任务。 你看啊,比如我这里,让他用浏览器来搜索一下实时新闻,并整理出跟财经相关的内容发给我,他很快就能够完成。 在这里啊,我们还能够设置定时任务,让他每天定时的去做同一件事情。这里有一个办公室的一栏,就能够显示到这几个牛马的工作状态了啊。后面呢,我就开始准备尝试一下,离开工位的时候甩给他一些科研任务,让他帮我处理一下。 不过这个 agent 我 也是刚开始使用啊,待开发的功能呢,还有很多,不过看他的介绍的话,感觉,呃处理日常的小任务啊,还是很方便的,并且非常的提效。大家如果在使用过程中啊,发现了对我们研究生非常有用的功能,也可以分享一下。

现在这个就是我的飞书,然后我已经把酷 max 就 到飞书当中,我们看一下他能够做些什么,比如说这是一排的一些文件,然后我现在需要这些文件,但是我手边没有电脑,然后我就可以通过手机给酷 max 发送指令,让他把这些文件发送给我。 然后我们现在来测试一下,现在我告诉他把一盘的 o 烧问的图片发给我,他会响两次提示音,第一次代表接受任务,第二次代表完成任务,然后我们现在来看一下, 现在他已经阅读了任务, 然后他说我现在把已复制到的目前目录的图片路径发给你,哎,这个就是他发给我们的 office word 图片,然后我们看一下和电脑上的文件一不一样, 然后打开电脑上的这个 office word 一模一样的。他把 e 盘中的文件发给了我们,然后我们继续测试它是不是支持所有的文件类型呢?然后我们告诉他把 e 盘的轴承支架文件发给我,这是一个 software 文件,然后我们看他能不能发给我们, 最后他也是成功的把 software 文件发给了我,然后他还能做什么呢?我们继续测试,我们让他打开 bilibili 客户端,并随机打开一个视频播放, 然后他真的打开了 bilibili, 并随机播放了一个视频,这个是炮龙的视频。经过上一个测试呢,我们可以发现通过手机发送指令可以完成电脑上的所有操作,也就是说我们可以实现真正的躺着办公了。

今天凌晨, openai 正式发布了它的 computer use, 你 可以通过 codex 去操作你电脑当中的任何的 app。 这期视频带你从三个案例去看看这个产品到底体验怎么样,以及如果你想使用的话可以怎么去安装。 我们先讲一个我觉得对我自己帮助最大的一个使用场景,我最近做了一个项目,是关于 ai 人物知识图谱的,我把各国家各公司的一些重要的 ai 人物放到了一张图当中 啊,通过这个图来表示它们之间的关系,让我可以快速的学习。那我这个时候就可以让 computer use 帮我去看看我这个产品设计有哪些可以在体验上优化的地方。它就可以直接的去阅读我的这个网页,重点去看它的信息架构、流畅度 和体验上面有哪些可以改进的地方。你可以看到它已经开始操作了,它会根据它的理解 去做一些体验测试,比如说他这里刚刚发现了搜索和筛选的联动是有效的,他还会再根据他的理解做一些更多的探索。这里需要强调的一点就是 右边的这个卡片的所有的操作其实都是 codex 进行操作的,我完全没有介入。大概思考了有五分钟左右,他最终给到了我五条建议。他给我的五条建议是按优先级高低去排的,那第一条是告诉我建议把首页先聚焦再展开, 不要一下摊开数据比较杂乱。第二条建议是告诉我要给图谱去加选中泰,让点击有明确的反馈,以及告诉我需要有些兜底的文案等等。我觉得这些建议都是有道理的,言之有物的, 虽然之前其实通过 agent browser 其他的插件也可以去完成这个工作,但我觉得现在 computer use 的 优势是它会比较的格式化,你是能够直接看到它有操作哪些部分,还有没有操作哪些部分是很直观的。 我们再看一个案例,我平常有使用推特去跟踪一些 ai 的 公司最新新闻的一个习惯,我这次让他去帮我去看一下最近二十四小时内这些公司有发哪些最新的推文,整理好发给我。 它一开始是操作错了的,它是用这个 agent browser, 就 我之前装的这个 scale 去完成,不是用的这个 computer use 去完成的,所以我在这里打断它了,也是同样请求我的授权。也可以看到右边这里又出现了它的这个标志性的一个光标,帮我打开了推特, 然后成功找到了我的 ai 机构的列表,是顺着这个时间线往下翻,按照我的要求 把二十四小时的帖子全都抓出来,他也是可以用这个光标去滑动的,每翻一页他会判断是不是还在二十四小时以内。大概翻了五分钟左右,就把所有的这些帖子根据不同的机构给我整理出来了。 看一个帮忙发微信那个场景,我是收到了一个微信,是我在撸猫的一个照片,我让他帮我回复一下,他是先请求我授权他使用这个微信,然后根据这个照片帮我理定了一个很不错的一个回复,我批准同意之后, 他就开始去操作发布,可以看到右边这里出现了一个 codex 的 小的光标,顺利代替我发布。 肯定有人好奇 computer use 费不费 talk, 那 我们这里是把三个案例的呃消耗都统计在这里了。 我们是 cortex plus 的 会员,使用的是 gpt 五点四 high 的 模式,可以看到这三个案例消耗的 talk 量分别是五小时用量的百分之三、百分之十三和百分之十六,也就是说五小时用量大概也只够你跑 五六个省略 ai 图谱这样子的一个项目的量。同时他花费的时间也统计在这里了,大家可以去看一下。特别是像发送微信这样的任务,他花一分钟二十秒,这样的时间肯定是不可用的,因为还不如我自己去发呢。 computer use 的 安装方式也很简单,打开 context, 这在这里选择插件,然后筛选到 open ai button, 然后找到这个 computer use, 添加到 context, 点击安装就已经安装好了。 最后简单讲一下这 computer use 的 一个实现的原理,那 computer use 其实本质上是一个桌面的自动化层, 它不是跟其他的产品一样是直接通过 api 去操作,而是分三步先感知当前的窗口,它可以通过截图来看到当前窗口有哪些东西,通过这个元素去判断哪些东西能操作,最后去执行原子化的动作。 所以他的操作跟你去操作其实是一模一样的,所以他会有一些风险,比如说所有你看到的这些信息,他有可能都会被截图交给模型,以及你如果已经登录了一个账号之后这个账号,那可能会被 误操作,以及有些敏感信息还是需要注意的。虽然其实 computer use 目前肯定还是有各种各样的问题,比如说它的耗时是比较长的, 它有的时候的操作也不是很稳定,就像它在操作我微信的时候,是没办法直接在微信框内输入,是要通过调用剪贴板去复制粘贴的, 那有时候他可能也不能稳定的去被正确的调用等等,这些都是他目前存在的问题。但是我觉得这个方向是对的,因为他其实打开了一种新的人和电脑的交互方式, 也许未来真的有一天,呃,我们再也不用鼠标和键盘去操作电脑了,所有的机器跟我们都是自然语言的交互了。那这天的到来一定是会非常的有意思的。我是离谱关注我,获取更多一手的 ai 的 实践和思考,我们下期见。

今天教大家用手机控制电脑上的 codex, 这个功能很好理解,电脑继续负责跑项目,手机让你随时看到进度,也能在关键时候做决定。在 mac 上打开 codex, 登录账号,选中你正在做的项目, 直接交代任务,比如修复一个问题,调整一个页面,或者让它帮你运行测试。离开电脑之后,打开手机上的嵌 gpt, 进入 codex, 你会看到正在运行的设备,比如 macbook 或者 mac mini。 点进去手机就能看到 codex 在 电脑上的工作状态,它现在处理到哪一步,改了哪些文件, 测试有没有通过,电脑画面里发生了什么,都会同步到手机上。 codex 需要你确认的时候, 会把请求发到手机上,你可以批准,也可以拒绝,还可以直接告诉他换个方向继续处理。代码、文件权限和本地环境都还留在电脑里,手机只负责查看进度,发指令, 做审批,这就很适合那些需要等一段时间的开发任务,你可以在路上看一眼修改结果,排队时批准测试。回到电脑前, codex 已经把进度整理好了, codex 手机版的价值就在这里,电脑继续工作,你随时接收。

今天来和大家分享一下我们如何利用 codex 来帮助我们收集整理以及分析我们的网页端的数据。我们打开 codex 之后先进入设置页面,这时候就需要注意了,你要 清楚自己想要获取的这个网站数据是否需要你登录才能获得相应的数据。如果你想要的网站数据不需要登录就可以获取,那你就可以点击这个浏览器, 把这个 browser use 这个开关打开。如果你想要获取的网站的数据需要登录,那你就点击这个电脑操控, 把这个允许 codex 控制电脑上的应用开关打开,再把这个 google chrome 的 浏览器扩展程序的开关也打开, 当然你也要下载一个 chrome 浏览器。我们返回主窗口后点击新对话。我们先设置一下允许 codex 访问的权限,我不希望 codex 老是让我审批它的一些操作,所以我会给它完全访问权限。 如果大家不放心的话,可以选择默认权限或自动审查。选择这两个访问权限有好处就是它会自动在沙河隔离环境中执行任务, 坏处就是它会老是让你审批它即将做的一些操作。是要安全性还是要完全的自动化,大家自行考 量,我们可以在这里选择。这次任务的推理程度,我一般选择的是超高,但是相应的它的执行速度也是最慢的。如果你是 chat gpt 的 plus 和 pro 用户,你可以选择快速模式,但是快速模式会消耗你更多的 token, 这点大家也需要注意一下。 你们可以看到我这个提示词非常的简洁,没有要求 codex 该返回什么样格式的文件给我们,也没有要求 codex 应该把文件存放在什么位置,这是因为现在 gpt 五点五已经足够聪明了,它可以自己决定最后的文件是什么样的格式,以及把文件放在哪里,我们编辑好提示词之后直接发送就可以了。接下来就是坐等 codex 帮我们整理好数据, 我们还可以在这里展开 agent 的 思考过程,这样我们就知道它在完成任务的过程中都做了哪些工作。 codex 花了十五分钟帮我们把想要的数据整理好了,并以 excel 的 文件的形式存放下来。我们可以直接在 codex 中打开 这个 excel 表格,可以看到在超高的推理程度下,它生成的这个表格是非常的详细的, 有摘药,有全部视频的,有某一个视频平台的详细数据的。我在拿到了这些视频的数据之后,可操作性就比较强了,我可以知道观众大概喜欢看什么样的内容, 并且让 codex 给我一些接下来的视频的选题的建议,我会持续分享更多如何利用 ai 来提高我们的生产案例。非常感谢你的观看,我是 jack, 我 们下次再见,拜拜。

我太激动了,我的扣代词已经连续工作了十三个小时了,然后他还在自己干活。扣代词他最近上线了一个新功能,叫 go, 那 这个 go 是 什么呢?简单来说就是你给他一个目标之后,扣代词会把后续的工作围绕这个目标持续的去推进,他还能跟踪状态,耗时跟投跟的使用。 以前我们做项目的时候,哪怕计划方案写的很清楚很详细, ai 也很难一次性的去做完,他会分很多个阶段去做,每次之前完一个阶段,你要去验收,有问题还要跟他多次的去沟通修改,然后再一次去推进。别的阶段,你就需要一直守在电脑前。 说实话,自从使用 ai 编程之后,我基本上很少有周末休息的时间了,不知道有没有相同感受的朋友。但是我今天第一次尝试购给扣代斯设定了一个目标之后他连续工作了十三个小时,我今天白天就出去玩了, 我真的可以不用一直在电脑前去守着了。虽然扣代斯之前也有 remote control, 可以 让我不用一直在电脑前守着,但是在验收某些需求的时候,用手机去调试查看,其实还是不是很方便。 那以前最痛苦的不是 ai 不 够聪明, ai 它会读代码,会写代码,查报错、跑测试,但问题就是它不够让人放心, 它很像一个能力很强,但需要你一直盯着的人。所以很多时候你以为自己在用 ai 干活,但实际上你是在给 ai 当主管,你不敢真的把一个复杂任务交给他,他随时都可能会停在半路。但扣代斯这次更新的这个 go 这功能让我第一次觉得这个状态改变了, 他不是回答完这一轮就结束了,他会一直记得自己要完成什么,会读代码,改文件,看失败日记,失败了再改,改完再测,测,试完再去判断这个目标到底完成没有,他知道自己这个目标没有闭环,就会继续接着往下做。 那怎么使用这功能呢?其实也很简单,你只需要打开勾带子,然后输入斜杠目标,然后选中之后就把你要让他做的事输入上去,他就会不达目的誓不罢休的给你干了。我觉得勾的价值就在于他开始让勾带子围绕一个结果持续推进,他改变的是你使用 ai 的 方式。

你有没有过这种感觉,脑子里想法一大堆,但一打开电脑就卡住了。以前你要自己写代码、查文档、调 bug, 现在你可以把想法直接交给 codex, 你 只需要说清楚你想实现什么。 codex 会自己写项目、改代码、跑任务,你负责想象,他负责把想象往实现推进一步。这是一期教学视频, 我将带你从零开始,用 codex desktop 把一个想法变成现实。打开 codex 客户端,首先我们来创建一个项目,点击新建空白项目,在对话框输入需求。我想要创建一个个人简历网站,该怎么办?这是一个关于想法和计划的需求, 你可以点击加号,选择计划模式,选择成功之后,这边会出现计划图标,你也可以通过 shift 加 table 键 进行切换。在计划图标的右边有一个权限控制下达菜单,它有三种选项,一种是默认权限,就是在 codex 的 沙盒中自动运行命令。沙盒你可以理解成是一个与外界隔离的封闭空 间,不受外部的干扰,也不会影响外部环境。第二种是自动审查,它的权限比默认权限更高一些,通过 ai 智能的判断,哪些权限不需要人工审核而进行自动审核。第 三种是完全访问权限,当你选中这个选项, codex 对 你的计算机拥有完全访问权限,它不单单可以操作沙盒里面的内容,也可以操作沙盒以外的内容。 这个选项风险比较高,一般要慎用,不要为了方便而牺牲安全。我一般建议选择自动审查,既考虑到方便,又兼顾到安全。点击这个下拉菜单,可以对模型进行具体设置,选择模型的智能能力时, 一般建议选择中或者高,对于复杂的问题,建议选择超高模型的版本可以选择五点五、五点四或者其他的版本。 code x 客户端目前只能接入自家的模型。 这边的速度有标准和快速两种模式,注意快速模式的速度是标准的一点五倍,但是同时它的头壳用量也是增加的。所以一般情况下,我们选择标准模式。你的需求也可以通过语音的方式进行输入,单机这个按钮 可以进行语音输入,点击确认它就将你的语音转成文字。这些都设置好之后,你就可以点击发送按钮了。在发送之前,你会发现在对话框的下方有这样一些选项,点击它,你知道当前的对话是针对这个项目进 行提问的。你也可以在这边快捷地创建一个新项目,你也可以不使用任何项目进行提问。我们这边选中 new project, 即当前项目。这边还有本地处理 工作树关联。 code xwave 最下面是一个余额查询,它可以显示当前的 token 使用量。我们这边就选择默认本地处理,也就是在你的电脑上运行该项目。 这边还有一个切换分支,当你创建项目成功后,默认使用 git 进行管理, git 帮你创建一个面分支。如果你对 git 不是 很了解也没有关系,直接选择面分支就可以好了。这些选项都配置成功之后,你就可以爽快地点击发送按钮了。 在运行的过程中,它会弹出这样的选择卡片,让你进行选择。通过不断的交互, ai 可以 更加清楚地了解你的需求。比如你希望网站风格是什么, 简历内容如何提供给他,他这边提供四种方式。我们这边可以选择从现有文件提取,直接上传一个文件到对话框,点 击它,然后点击加号添加文件,将你本地个人简历发送给他。接着 ai 问你作品,即主要面向哪些机会?我们这边随便选择一个,你计划把网站发送到什么平台。这边我们选择 git hub pages。 都选择好之后, 我们可以把个人简历发送给他,点击发送这边他接着问你的网站主要使用什么语言展示,我选择中英双语,页面结构偏向于单页。滚动 来阅读一下这个计划书。如果你觉得这个计划书没有问题的话,你可以点击试开始执行。如果还是不满意,你可以在第二个选项里面告诉他进行如何修改。我这边选择试,当选择实施计划时, 你会发现这边的计划模式图标自动取消掉了。接着 ai 就 会根据计划书进行代码的生成。在生成的过程中,你会发现左侧导航栏有个项目,这是我刚刚创建的项目。下面有个对话分类标签,我们可以点击这个按钮, 新建一个对话,然后在对话框中输入今天的天气如何点击发送。这时候你会发现这次对话信息归属于对话分类中,而我们上面的项目是归属于项目分类。你可以在对话分类中新建对话,进行闲聊。而在项目分类中, 你必须要先新建项目,然后在每个项目下方新建一个个对话,这是我刚刚创建的项目,项目中的该对话右侧有一个滚动特效,表示该对话正在运行中。你也可以创建多个项目, 鼠标悬浮在项目分类上面,点击这个文件夹,我们可以创建第二个项目单机,你可以新建一个空项目,也可以打开你电脑上现有的项目,我选择使用现有的项目,点击,找到你电脑上的某个项目, 选择文件夹,点击打开,这个时候在项目分类中就有两个项目,你可以同时对着两个项目进行提问,实现多项目并行开发,提高开发效率。我们现在在每个项目下方 可以创建多个对话,这是一个对话窗口,当你点击它的时候,可以创建第二个对话窗口,你可以在这里进行提问,这时候这两个对话窗口都归属于这个项目下方。在第二个对话执行完成时, 这边就会出现一个圆点,表示执行完成,告诉你这个对话已经执行结束,你可以点击它打开对话窗口进行查看,这边已经完成代码的生成, 同时给你一个网站的预览链接,点击它就可以进行预览。单机后就可以在内置浏览器中预览网站,你也可以点击右上方的这个图标,对右侧边栏进行折叠,再次点击就是打开, 你也可以将内置浏览器进行全屏展开,点击这边的展开面板,这样预览式口变得更加的宽阔。我的简历网站支持中英文切换,点击这个图标可以对整个浏览器进行截图, 这时候截图保存到粘贴板上,你可以将截图粘贴到对话输入框中,然后根据截图进行提问,还可以点击删除按钮,进行截图引用的删除。 回到右边的面板,除了截图功能,还有批注功能,点击批注,你可以选择页面上具体某个区域,例如对这个区域进行批注操作,去掉监 ceo, 写好批注后,点击这边的勾号按钮, 这时批注就会自动添加到对话输入框内,你可以点击发送,让 ai 参考你的批注内容进行修改,这边显示它已经修改成功,你可以点击打开,再次预览一下, 我们发现这边已经修改成功。当然如果你想要撤销修改,你可以点击这边的撤销,那么就恢复到批注之前的状态。你也可以点击这边的审查,看一下代码文件中,它将这行代码进行删除, 然后新增一行代码,除了这个文件内容有改动,其他文件也进行了相关的修改。当前的页面是审查 tab 页,我们可以回到内置浏览器 tab 页。当你发现整个页面 不需要进行任何修改时,你可以将批注开关按钮关闭掉,这样就可以进行很好的预览。点击右上角的图标,可以恢复面板宽 度,这时我们在 codex 界面的中央区域就可以看到完整的历史对话记录,这就是你刚刚添加的批注对话,你可以添加多个批注,点击批注,选择这个区域删除。个人创业,按下回车键,表示添加批注。到对话输入框,按下 command 加回车,表示发送对话内容。 当你发现你的批注描写的非常具体,不需要额外补充任何信息时,你可以直接按住 command 加回车,此时就开始按照批注内容进行修改代码执行成功之后再来刷新页面,个人创业就被成功删除掉了。你再往下方看,将这个爬虫标签进行删除, 点击它加个批注,删除爬虫,按下 command 加回车键,在界面中央区域 e i 开始进行删除操作。删除成功之后,你可以点击刷新,预览一下,发现删除成功,大功告成,删除均被删除, 这时候你可以取消批注。如果这时候你后悔了,你觉得不应该删除爬虫这个标签,那么怎么办呢?你可以点击这边撤销按钮,对代码进行撤销操作。点击撤销后再来刷新页面,这时候爬虫标签就又出现了。 这种操作是对历史对话中最后一轮进行撤销。那么如何撤销到历史对话的具体某个位置呢?例如,你希望从这轮对话开始,往下所有操作均被撤销,那么如何操作呢? 这个时候你可以找到这轮对话,点击这边的分叉按钮,派身到本地,在左侧边栏给你新建一个对话窗口,在这个对话窗口里,我们只能看到这轮对话及之前的对话内容,而无法查看之前的对话内容。 你再次打开预览,这个时候点击撤销,再次刷新一下浏览器,发现被删除的间 ceo 又出现了,这样就可以实现历史绘画记录 撤销到该轮对话位置。回到右侧的内置浏览器。你现在想要对项目模块和经历模块进行同时修改,那么如何操作呢?你发现这两个模块是相互之间独立的,你可以使用工作树找到左侧的对话标题 后,进行右击,点击派生到新的工作数,这时候你发现派生失败,这是为什么呢?在派生之前,你需要进行一次 get 提交,返回到开对话输入框, 输入 commit, 这样就把我们之前所有代码提交到本地 make 之上,这边显示提交成功。如果你不放心的话,可以二次确认是否提交成功。你需要找到项目的源码,点击这边你会发现很多代码, i d e logo 图标,你希望项目源码在哪个编辑器上展示,你就点击哪个图标 标。我一般习惯使用 v s q 的 点击 v s q 的 图标,在左侧边栏中找到版本管理,当你发现这个区域没有任何文件时,说明已经提交成功。回到 q d x, 再次新建工作数,右击派升到新的工作数,这个时候一个新的工作数就新建成功了。为了方便区分, 可以对对话标题进行重命名,点击重命名,修改为项目模块,然后点击保存,这时你就可以对项目模块进行优化。这时候你发现对话框的下方显示工作数三个字。在这个对话窗口状态下,你可以打开内置浏览器,将我们的网站链接复制过去。点 点击复制,然后进行粘贴回车。我们在这个对话框中对项目模块进行优化,选择批注,找到该项目区域,添加三个项目介绍,点击添加,点击发送。接下来再次创建一个新工作数,对精力模块进行优化。同样的操作,选择这个标题,右击派生到新的工作数, 同样对它进行重命名,然后保存,同样打开内置浏览器,把网站链接复制过去,在这边粘贴,然后找到经历区域进行批注。添加多段经历, 然后点击发送。这时你会发现这两个对话框在运行工作,但是它们分别运行在不同的工作树上。对于这个创建失败的对话,你可以选择进行归导,点击确认,它就从对话列表中消失掉。对于我们暂时用不到的对话,你 可以选择进行规党操作。对于对话列表,除了规党,你还可以进行这样的设置,选择右击可以让这个对话置顶。从命名对话规党,对话标记为未读。 在访达中打开复制工作目录,复制绘画 id 等等。更有趣的一点,你还可以在迷你窗口中进行打开。点击该窗口时,它以迷你小窗口形式打开。关键一点,你可以将其置顶。它可以置顶在任何的窗口的最上层,无论你窗口如何切换,它都显示在桌面的最上一层, 点击这里可以将其关闭。你发现两个蓝色实心圆点,表示它们已经运行结束。现在可以预览一下这边它增加了三段项目内容。再来检查一下经历模块,打开预览, 点击经历导航菜单,这边也新增三段经历。你现在回到最初的那个对话窗口,点击它。刷新一下。点击项目,你会发现只有一段项目内容,这边只有一段经历内容,这是为什么呢?这时候你需要将这两个对话框中分别进行的代码修改内容 合并到本地 main 分 支里。在合并之前,我们需要对它进行一个提交,点击经历模块输入 commit。 点击项目模块,输入 commit, 然后让它合并到 main 分 支,此时两边都显示成功合并到 main 分 支。这时候你再点击这个对话窗口,刷新一下,页面上出现项目模块和经历模块的新增内容, 此时这两个对话框的使命就结束了,你可以将它们进行归档处理。回到主分支对话,你可以接着对网站进行深入优化。现在你想要让网站界面变成 ppt 风格,这时候你可以输入美元符号, 然后选择一个专门设计 ppt 风格的 skill, 我 选择这个 skill, 它是我自定义的专属 skill。 接着输入提示词,将网站转换成 ppt 网站,点击发送, 执行成功之后,点击刷新,你会看到这个网站变成 ppt 风格样式。在对话框里面直接调用某个技能, 你需要使用美元符号,这个时候就可以预览 qq 的 x 中安装的所有技能。除了这种方式预览技能,你还可以对技能进行详细的设置。找到左上角的插件导航菜单,在这边选择技能贴报页。技能一般分为两大类,一类是系统内置的技能,一类是用户自己安装的技能。 你可以管理这些技能。点击右上角的管理按钮,在这个界面你可以知道 code x 上安装了多少技能,每个技能分别是什么。 对每个技能可以选择关闭预打开,点击左边的三个点更多按钮,你可以点击打开按钮,这时候看到的是该技能的 scale md 详情,点击这边详情按钮,也可以通过这样的方式阅读 scale, 点 md 文件。当然你也可以点击左下角的卸载按钮, 将这个技能卸载掉。卸载完成后,你可以点击这边的刷新按钮,但是我发现被卸载的 skill 依然存在于技能列表中,这可能是 codex 团队需要优化的地方。右上角有个新建下拉菜单,你可以新建自己专属的插件,也可以新建个人专属技能。 点击新建技能。新建技能的本质是使用 skill create 元技能来帮助你去创建你的专属技能。比如说帮我创建一个技能,该技能的功能是该技能可以审查代码是否规范,技能的名称是悟空 code review。 点击发送自定义技能,创建成功之后,你就可以使用它回到这个对话窗口,在输入框中使用美元符号找到刚刚自定义的技能,但 关机,然后输入进行代码审查。发送该技能就会对当前项目进行代码审查。除了技能可以帮助你实现想法,你还可以使用插件。点击左边的插件导航,你会发现这里面有很多插件,比如常见的 computer use 和 浏览器两个插件,一个是负责操控你的电脑,一个是负责操控内置浏览器。学到这里,你可能好奇,插件和技能是什么关系呢?你可以理解成一个插件包含 n 个技能,它是技能的结合体。比如我们打开 superpowers 插件,你会发现这个插件里面包含了这么多技能。 特殊情况下,一个插件里也可以只包含一个技能。安装插件也很简单,我们回到插件界面,以安装 superpowers 为例,点击这里的加号,点击安装 superpowers 按钮。安装成功之后,点击 superpowers 查看一下插件详情。 默认情况下,这些技能都是起用状态。你会发现第一个技能是 brainstorming 头脑风暴。点击右上角,在对话中试用该插件,这个时候在对话输入框中自动引用这个插件。如果你只想使用该插件里面的某个具体技能,你可以使用美元符号加上插件的具体名称。比 如 brainstorming 头脑风暴技能。如果你只想直接使用插件,而不指定某个具体技能,你可以点击左下角的加号,然后选择插件,找到 superpowers 插件单机。

你以为 macbook 的 价值是芯片、屏幕续航?现在可能要加一个新理由, codex openai。 最近几轮 codex 更新,其实释放了一个很强的信号, ai 不 再只是网页里的聊天框,它开始进入你的电脑,进入你的 app, 进入你的本地工作流。二零二六年二月, openai 发布 codex app, 最早就是面向 macos 推出的。这个 app 不是 简单的聊天窗口,而是一个 codex 指挥中心。它能同时管理多个 codex, 一个修 bug, 一个写文档,一个跑测试,一个看 pr。 而且它支持 worktrees, 每个 codex 都在隔离环境里干活,不会互相把代码改乱。但真正让 macbook 含金量上升的,是后面的更新。 codex 现在可以用 computer use 在 mac 上操作桌面应用。 什么意思?它不只是读代码,它可以看屏幕、点按钮、输入文字、操作浏览器,复现图形界面里的 bug, 甚至帮你测试一个 micros app 或 ios 模拟器。流程更狠的是, openai 官方写的很清楚, 多个 codex 可以 在你的 mac 上并行工作,同时不干扰你继续使用其他 app。 这就很关键了。以前 macbook 是 一个人用来干活的电脑,现在它正在变成一个人和 codex 一 起干活的工作站。还有一个很适合 mac 用户的功能,叫 appshots。 你 在 mac 上看到一个报错窗口, 一个设计稿,一个网页,一个设置面板,不用长篇大论描述,直接用快捷键把当前窗口发给 codex, 他 会拿到截图和可读取文本,然后基于这个上下文帮你处理任务。这对程序员、设计师、产品经理、内容创作者都很实用。比如,你打开一个网页设计稿,让 codex 看一眼,然后让它改前 端,你打开一个表格文档后台页面,让 codex 根据当前内容继续干活。再加上手机远程控制, 现在拆的 gpt 手机端可以连接到正在 mac 上运行的 codex, 你 人不在电脑前也能看 codex 的 进度,终端输出测试结果,代码 def, 还能远程批准下一步操作。也就是说,你的 macbook 放在桌上跑任务,你在路上用手机盯进度。这就是为什么我说 macbook 的 含金量在上升, 不是因为 macbook 突然变便宜了,也不是因为参数碾压所有电脑,而是因为 ai 时代的电脑价值正在从性能设备变成 ai 工作流底座。 codex 这种工具越成熟,越需要一个稳定的本地环境,代码仓库、终端、浏览器、 ide 设计工具、文档权限系统、桌面 app。 而 macbook 本来就是大量开发者和创作者的主力工作机,现在 codex 正在深度适配 macos 工作流, macbook 就 不只是生产力工具,而是 codex 可以 长期驻扎持续工作的 ai 工作台。 所以这波不是单纯吹 mac, 真正的变化是,以前你买 macbook 是 为了自己更高效,现在你买 macbook 可能是为了让 codex 也能更高效的替你干活。未来值钱的电脑不只是跑分高, 而是谁能让 ai 更顺畅的看见你的工作,理解你的上下文,操作你的工具,持续完成任务。从这个角度看, macbook 的 含金量确实还在被 codex 往上抬。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。
