第一次打开 codex, 很多人卡住的不是不会问,真正容易出问题的地方是项目选太大,权限给太满,第一句话又说的太急。这期我们按新手能跟做的方式来,中面段为主,命令行,只讲你真正会碰到的部分, 你不用先记一堆名词,也不用一上来就写代码。我们先把 codex 放到一个正确的位置,它不是普通聊天框,而是一个能进入项目里工作的助手。能进入项目,就意味着它能看文件,也可能会改文件,还可能会请求运行命令。 所以这期的重点不是炫功能,重点是让你知道什么时候可以放心交给他,什么时候必须停下来检查。视频会比较长,建议先收藏,然后跟着做,不要只听概念,最好在电脑上开一个干净文件夹,一步一步试。 接下来我们分四个阶段,先认识他,再安全上手,再让他处理项目。最后再讲扩展能力。先讲一句最简单的定义, codex 是 openai 做的编程助手,但如果你是新手,不要把它只理解成一个会回答问题的聊天框。更好理解的说法是,它是一个项目工作台,你给他一个文件夹,他就可以围绕这个文件夹帮你看资料、整理文件、写代码、查错误、跑,检查 普通聊天 ai, 通常等你把内容复制给他,你不给文件,他就看不到文件。 codex 的 思路不一样,你把一个项目交给他,他会在这个项目范围里工作,这个范围越清楚,他越不容易乱跑。 所以你以后用 codex, 第一件事不是想提示词有多漂亮,第一件事是想清楚这次我要让他在哪个项目里工作,很多人会问, codex 和 cloud code 到底选哪个? 这个不用争,也不需要站队,它们都是能进项目里处理任务的 agent, 区别主要在入口界面和手感。 cloud code 也有桌面和网页入口,但它最典型的使用习惯还是围绕终端、 ide 和开发者工作留展开。终端就是那个输入命令的窗口。程序员很熟,新手第一眼会紧张。 codex 桌面端更像一个工作台,你能看到项目对话任务结果,也更容易知道他现在在做什么。所以,如果你刚开始用这类工具,或者你不是每天写代码的人,我建议先从 codex 桌面端开始,先把项目权限、改动、命令这些基础动作,看明白 命令行入口,后面真正用到再讲,这样你不会被工具吓住,也不会因为给错权限把自己搞乱。 codex 不是 只有一种入口,你可以在桌面端用,也可以在 id 里用,也可以用命令行,还可能在网页或远程任务里继续。 但新手不要一开始就把这些入口全学一遍,这会让你只记住很多名字,却不知道什么时候该用哪个。我们这期的路线很简单,第一,住面端先用熟。第二, ide 和命令行,知道他们是干什么的。 第三,等你真的需要自动化远程任务持续运行,再去碰更高级的入口。 c i lie 是 command lie interface, 中文就是命令行界面, 它不是神秘东西,就是通过命令操作工具。这期会讲到 c i i, 但不会把它当主线。你先学会在可见的工作台里判断风险比被命令重要。接下来我们真的开始用。第一步,先建一个干净文件夹,比如叫 learning pack, 里面只放这次要处理的资料,可以有一份 notes, md 放你的笔记,可以有一份 links, md 放你收集的链接,标题,可以有一份 type, md 写你希望他帮你完成什么,也可以放几张截图,但不要一上来放几十个不相关文件, 更不要直接选桌面下载文件夹。整个文档目录范围太大, codex 会看见太多噪音, 噪音越多,他越容易猜错你的目的。新手第一条原则,小范围跑通比大范围混乱强。 你后面可能会看到几个工作范围。 logo、 word tree、 cloud 这些词先不用被定义, 你可以把它们理解成三种,房间。 local 就是 在你当前这个本地项目里工作,它最直接也最容易理解。 worktree 像是给项目开一个隔离副本,它可以让 codex 在 另一条工作线上试东西,不那么容易影响你当前主线。 cloud 是 把任务放到远程环境里跑,更适合长任务、后台任务,或者你不想一直盯着本机的时候。新手刚开始优先用 logo 或者界面推荐的保守选项,等你知道改动怎么检查再去用 worktree 和 cloud。 不要因为一个词看起来高级就直接选它。第二步,看权限。权限不是越大越好,对新手来说,权限越大,你越要知道自己在同意什么。 读取文件,意思是他可以看当前项目里的内容。修改文件,意思是他可以写入新文件或者改已有文件。运行命令,意思是他会让电脑执行某个操作 命令,可能只是查看版本,也可能会安装依赖,删除文件,启动服务。所以看到命令请求,不要直接闭眼点同意, 先看他要做什么。如果看不懂,就直接问这条命令会影响哪些文件,会不会联网,会不会删除东西。 codex 能解释清楚,你再考虑。同意,解释不清楚就让他换一个更安全的方案。正式开始时,第一句话,不要让他直接写东西。 我建议你先说,请先查看这个文件家有哪些文件,告诉我每个文件大概是什么,不要修改任何文件。最后这句很重要,他不是个性化,是边界。 你先让 codex 观察,等他把文件名和内容说对,再让他继续。这一步可以帮你判断他有没有真的读到项目。如果他一上来就说的很空,只说这里有一些资料,你就追问,请按文件名列出依据,能按文件名说清楚,才说明他进入了正确的项目, 这比写一个很长的提示词更重要。这里顺手讲一个小白,很容易踩的坑。很多人以为给 ai 的 资料越多,效果越好,其实不是,资料越多,上下文越乱,它越难判断重点。 codex 能读文件,但它不是你电脑里的管理员。 你要先把任务边界整理出来,这次要学一个工具,就放工具,说明你的问题,几张关键截图。这次要改一个小项目,就放这个小项目,不要把所有历史项目都塞进去。如果资料特别长,先让它只做摘要。比如让它把三份文档整理成一个 brief md, 然后后面的任务优先围绕 brief md 展开,这样它更稳,你也更容易检查。确认它读对以后,再让它做第一份输出, 不要一上来就让他完成一个复杂项目。先让他生成一份 study plan。 md, 这份文件可以很简单, 第一部分,当前资料讲了什么?第二部分,接下来按什么顺序去?第三部分,哪些内容还缺,需要你补充?为什么先做学习计划?因为计划能暴露他有没有理解错。 如果计划都跑偏了,后面让他写代码,整理资料,生成表格,只会偏得更远。先让他把理解摊开给你看,你确认方向没问题,再让他动手。只要 codex 开始改文件,你就会碰到一个词, diff, diff 就是 改动对比。你先不用懂 get 的 所有命令,你只要先会看三件事,第一看文件名, 他到底动了哪个文件?第二看红色,红色通常表示删掉或被替换的内容。第三看绿色,绿色通常表示新增或改后的内容。如果他改的是你预期中的文件,并且改动理由说得通再接受。 如果他突然动了不相关文件,就先停下来问原因。接下来讲命令行。命令行就是用文字命令操作电脑的窗口,新手不用害怕他也不用一开始就记很多命令。 你先认识几个。最常见的 pwd 是 看当前在哪个路径, ls 是 看当前目录有哪些文件。 get status 是 看这个项目有没有未保存的改动。 codex 请求运行命令时,你要看命令大概属于哪类, 只是查看信息风险通常低。安装依赖删除文件,移动目录上传推送风险就高一些。如果你看不懂就让他解释,不要为了显得自己懂就直接点。同意。看到命令请求,我建议你养成一个固定动作, 先问三件事,第一,为什么要跑这条命令?第二,他会改哪些文件,或者只是在读取信息。 第三,如果失败了怎么恢复?比如 a p m install 可能会改 package log 文件,比如 r m。 命令可能会删除东西,比如 git push 会把你的代码推到远程,这些不是不能做,但你要知道它们在做什么。 codex 不是 替你承担责任的人,他是帮你执行任务的人,最后确认的人仍然是你。现在讲 git, 如果你不是程序员,先不要被这个词吓倒。你可以把 git 理解成项目存档, 就像你玩游戏打到一个安全点,先存一下,后面试错失败还能退回去。 ai 做项目一定会有不确定性,他可能改的很好,也可能理解偏。所以每做完一个阶段,最好让 codex 帮你检查状态,然后存一个点, 提交前先看 def 确认这次改动只包含你想要的内容。这一步会让你改用 ai, 因为你知道坏了还有路回来。用久了以后你会发现 codex 好 像变慢,或者回答开始发散, 这不一定是它突然变笨,很多时候是上下文变满了,上下文可以理解成它这次任务里能同时记住的信息空间。 你说过的话,他读过的文件,命令输出错误,日制都会占空间,空间越满,他越难抓住当前重点。 所以长任务不要一直无限聊下去,每完成一个阶段,就让他做一次阶段总结,总结要写进文件,比如 progress, md, 这样后面就不用靠长对话应承,用文件接住上下文,比一直聊天稳的多。 codex 里还会看到模型、速度、努力程度这类设置。这几个词不用讲复杂,你先按任务轻重来选, 解释一个文件,整理一份笔记,改几句话。不需要让他用最重的方式思考。多文件修改架构,调整排查复杂错误,就要给他更多思考空间。配额也一样, 不要把宝贵额度都花在闲聊上,真正值钱的地方是让他读项目,做计划,改文件,跑检查,解释差异。 如果你发现额度紧张,就把任务拆小,一次只做一个明确目标。任务小,反馈快,也更容易发现错误。 新手最怕一口气让他做太多。接下来是 plan mode, 也就是计划模式,你可以不用记英文名,它的核心就一句话,复杂任务,先出计划,再动手。比如,你要让 codex 改一个项目, 不要直接说帮我优化一下这个太空。更好的说法是,先不要改文件,请先给我一个执行计划, 列出你会读哪些文件,准备改哪些文件,最后怎么验证。这样你在他动手之前就能看到他是不是理解对了,计划不对就先改计划,计划对了再让他执行,这一步能省掉很多返工。 codex 开始工作以后,不代表你只能等结果,中途你也可以继续给方向。比如,你发现他准备改一个不该动的文件, 你可以直接说这个文件不要动。比如,你发现他开始把界面改的太花,你可以说保持现有风格,只改按钮状态。比如,你不确定他下一步要做什么, 你可以让他先暂停汇报已经完成什么,接下来准备做什么,这不是打断他,这是管理他要从提问者慢慢变成任务负责人,这也是用 codex 最重要的心态变化。 codex 能同时处理多个任务时,新手也要注意,病情不是越多越好。 你要分清主线和支线,主线负责当前真正要完成的目标。支线可以查资料跑,检查比较方案,但支线不要随便改主线文件,最后把支线结论汇总回来就行。比如主线再改一个页面, 支线可以去查官方文档,或者跑一遍测试。支线完成以后只告诉主线哪些地方要注意, 这样上下文不会乱,也不容易出现多个任务互相改同一块的情况。接下来讲 agents md 这个文件,你可以理解成写给 codex 的 项目说明书,它不一定是给观众看的,它是告诉 codex 这个项目怎么运行,有什么规则,哪些地方不要乱碰。 比如项目启动命令是什么。比如改前端要遵守什么样式。比如生成视频时不要会用别的 episode 素材,比如字幕不要带框这些规则。如果你每次都在聊天里重复,很容易漏。写进 agents md, codex 之后进项目就能先看到, 这就是把经验沉淀成规则,做长期项目规则比临时提醒可靠。 codex 还会有 memory, 也就是记忆,记忆适合放偏好,比如你喜欢中文解释,比如你不喜欢界面太花。 比如你希望每次改完都说明验证方式,但项目硬规则我更建议写进文件,比如 agents md, read me md docs 里的规范,因为文件可以被你看见,可以进版本管理,也可以团队共享 记忆如果记错了,要及时删掉或更正,不要让它把一个临时偏好当成所有项目的永久规则。简单说,偏好可以交给 memory, 项目规则尽量写进项目文件再讲。 skill, skill 不要理解成神奇插件, 更准确地说,它是可附用流程。你有一件事经常做,比如写视频脚本,检查平台风险,生成素材清单,做字幕同步。你先和 codex 一 起把流程刨顺,确认每一步该输入什么,输出什么,怎么检查, 然后再把这套流程保存成 skill, 下次遇到类似任务就不用从零说一遍。所以 skill 的 核心不是多装,核心是把你已经验证过的流程固定下来,这也是我们做视频 agent 最需要的能力。 sap agent 可以 理解成分身或者小组成员,但它不是越多越好。适合拆给 sap agent 的 任务一般有几个特点,第一,可以并行, 第二,不需要立刻改同一批文件。第三,最后只需要结论。比如一个 sabotage 去查官方文档,一个 sabotage 去检查文案风险,一个 sabotage 去整理素材缺口、主线,最后拿到结论再决定怎么改。不要让很多 sabotage 同时改同一个文件, 那样你会很难判断到底是谁改坏的插件和 m c p 放在后面讲,因为新手一开始最容易被这些词带跑。插件可以理解成异包能力,里面可能包含 skill 工具配置或者某个服务的连接方式。 m c p 可以 理解成连接外部工具和数据的桥,比如让 codex 能读某个设计工具、某个文档系统、某个内部服务。 但新手不要一上来装一堆,装的越多,权限越复杂,上下文也更容易乱。正确顺序是先有任务再找能力,不是先装能力再想能干什么。每装一个外部工具,都要知道他能读什么,能写什么,怎么关掉,这才是安全的用法。 computer use 是 更高级的一类能力,简单说就是让 codex 能像人一样点击输入,切换窗口。这听起来很强,但也意味着风险更高。所以用它时一定要缩小范围,不要同时开私人资料支付页面。账号后台 只打开和任务有关的窗口,任务也要说清楚,比如只让他打开一个测试页面,点击三个按钮,记录哪里报错。不要说你随便看看电脑哪里有问题,范围越模糊,风险越大。我们做视频素材也是一样, 只录窗口,不录整个桌面,账号、路径、通知都要处理干净。自动化也放在后面,它适合重复任务,比如每天检查一批资料,比如每周整理一次问题列表, 比如每天根据固定规则生成一份代办。但不要把一个没想清楚的任务直接自动化,先手动跑通一次,确认输入是什么,输出是什么错误怎么处理,再让 codex 按固定时间或者固定条件去做自动化。最怕没有验收标准, 它每天都在跑,但你不知道跑的对不对,所以每个自动任务都要有可检查的结果。后面你还可能看到远程控制和手机入口, 这类功能很适合临时补充任务。比如你人在外面,突然想到一个需求,你可以从手机上把任务发给 codex, 但你要记住,入口换了,不代表检查可以省掉。电脑仍然是执行环境、项目、权限、文件命令,这些原则都还在 手机,更适合发起任务,查看进度,补充说明。真正关键的改动最好还是回到电脑上检查。新手不要追求哪里都能遥控, 先追求每一步都知道发生了什么,这才是长期稳定使用的基础。现在回到桌面端界面本身,新手第一次看,不要盯着每个按钮研究。你先看三块区域,第一块是项目和绘画, 他告诉你现在在哪个项目里,最近开过哪些任务。第二块是当前对话,你输入目标 codex 回复计划,问题和结果都在这里看。第三块是任务和文件变化, 他会告诉你 codex 正在做什么,做完了什么,哪些地方需要你确认。你只要先看懂这三块就不会慌,按钮以后慢慢熟,先知道信息应该在哪里出现。很多人用 codex 效果不好,不是工具不会干,是任务本身说的太散。 一个好任务至少要有三样东西,第一,目标你最终希望他交付什么。第二,材料,他可以看哪些文件,哪些文件是重点。第三,验收你准备怎么判断他做对了? 比如,不要只说帮我整理资料,你可以说,请根据 notes md 和 links md 生成一份 study plan md 要求分成三部分,主题摘要,学习顺序,逮捕问题。最后,请列出尼引用了哪些文件名,提示词,不是越长越好。新手更应该追求具体, 少写形容词,多写交付物。比如,不要只说帮我写的高级一点,高级是什么意思? codex 只能猜。你可以说,请把这段话改成小白能听懂的口播,每句话不要太长,术语第一次出现要解释,不要使用夸张承诺。 最后给我一版可以直接配音的文本。这样的指令不一定很长,但它有明确交付,也有明确限制。 codex 很 适合解释文件,但你要让它带着依据解释。 比如你可以说仅解释 notes md 的 主要内容,按标题分段说明,每一段都告诉我依据来自哪个文件。 如果有不确定的地方,不要猜,直接标出来。这句话非常重要。 ai 最麻烦的不是不会说,而是有时候不知道也会说的很像真的。所以你要养成一个习惯,让他把依据放出来,没有依据的结论就不要急着采用。 真正让 codex 改文件前,我建议多加一个步骤,让它先列改动清单,清单里至少写三列,第一,准备改哪些文件?第二,每个文件大概改什么?第三,为什么要这样改?这个动作会让 codex 自己先整理思路,也让你提前发现风险。 如果他准备动十几个文件,而你的需求只是改一段文案,那就明显不对。你应该让他缩小范围,范围清楚以后再让他执行。 codex 生成的东西,不要只看文字回复,能预览的一定要预览。做网页就打开页面看实际效果,做视频就看画面字幕声音有没有对上,做报告就看画面字幕声音有没有对上。做报告就看画面字幕声音有没有对。很多问题不会出现在对话里, 它会出现在结果里,比如按钮看着歪,比如标题太大,比如字幕挡住了画面。 所以验收不是问 codex 一 句完成了吗?验收是你真的打开结果看一遍,你给 codex 反馈时也要具体,不要只说不好看, 不好看对他来说太模糊。你要说位置,比如第三页右侧标题太大,你要说问题,比如压住了图片。你要说方向,比如把标题降一档红色,重点不变,这样 codex 才知道怎么改。 反馈越具体,返工越少,这也是人和 ai 写作最基本的方式。 codex 也可以处理图片和截图相关的任务,但你给截图前先处理干净,不要把整个桌面丢进去, 不要把账号路径、通知账户敏感信息一起放进去,只裁任务相关区域。如果截图里字很小,先放大或重新截,你让 codex 看不清,他就只能猜。 我们做视频素材也是同样规则,真实素材要清楚,如果素材太长,就切成几页讲。如果一个截图里有太多信息,就分成局部放大。不要让观众盯着一张小图猜里面写了什么。 ide 是 integrated development environment, 中文可以理解成开发环境。比如很多人写代码会用 cursor vs code jet brains 这类工具。 ide 的 好处是文件数、编辑器、终端都在一起, 你一边看项目结构,一边改文件,一边跑检查。如果你本来就在写代码, id 里的 codex 会很顺手。但如果你是新手,不建议第一分钟就钻进 ide。 你 先用桌面端理解项目和权限,等你知道 codex 在 做什么,再把它带到 ide 里,这样你不会被界面和代码同时淹没。 学习工具也要有顺序,先看得懂再追求效率。 cloud 和后台任务的价值是让 codex 可以 长时间做事,比如查资料、跑测试、整理报告、分析代码库。你不需要一直盯着屏幕,但后台不代表无人监管。 任务开始前边界要写清楚。任务结束后,先看他的汇报,看他做了哪些步骤,遇到什么问题,产出了哪些文件。如果有文件改动,再看 diff。 如果有命令执行,再看命令记录。后台任务最适合做低风险、可检查目标明确的事情。 不适合用来做你自己都没想清楚的事情。不适合用来做你自己都没想清楚的项目。新手第一个常见错误是一口气让 codex 改完整个项目, 比如你说帮我把这个项目优化一下,这句话听着省事。其实范围太大,它可能会改结构、改样式、改依赖、改文案。最后你根本不知道哪里变了。更好的方式是先改一小块,比如先检查登录页为什么报错。 比如先把首页的标题和按钮排版调好,比如先把 readme 整理清楚。小任务有两个好处,第一, codex 更容易作对。第二,你更容易检查, 等这一小块确认没问题,再继续下一块。第二个常见错误是指看 codex 的 回复,他说完成了,你就以为完成了,这不够。回复只是说明真正的结果在文件里,在页面里,在命令输出里。如果他说已经修好 bug, 你 要看测试有没有过。 如果他说已经生成页面,你要打开页面看。如果他说已经整理文档,你要点开文档读两段。 ai 的 自我汇报只能作为线索,不能代替验收。 你越早养成这个习惯,越不容易被漂亮回复骗过去。真正能交付的是能被你打开运行检查的结果。第三个错误和我们做视频也有关,不要把私人信息放进演示项目。 你录 codex 终端浏览器 ide 的 时候,画面里可能出现很多细节,比如真实用户名,比如本机路径,比如账号信息,比如接口密钥、账户状态、账单信息。 这些东西不应该出现在公开视频里。最好的办法是演示前就准备一个干净项目,只打开需要的窗口, 录完再检查一遍素材,该裁的裁,该遮的遮,不要指望后期临时补救。如果你暂时不知道怎么问,可以先套一个模板。第一句,请先查看,不要修改任何文件。第二句,请列出你理解的目标和执行计划。第三句,我确认后再按计划执行。 第四句,执行完请说明你改了什么,以及我怎么验证。这四句话很普通,但非常有用,它们分别解决四个问题,先查看,避免他一上来乱动。先计划,避免他理解篇, 确认后执行,让你保留控制权。说明验证方式,让结果可以检查。新手先把这套模板用熟,就已经超过很多人了。拿我们做视频这个项目举例, codex 也不能乱来。第一步一定是文案,文案没定,素材就没法准确分配。第二步是逐句素材表每一句话到底用真实录屏、截图、卡片还是动画元素,要先写清楚。第三步才是配音, 配音出来以后,时间轴必须跟真实音频对齐。第四步是渲染和 qa, 看有没有混错,素材,有没有字幕党,画面有没有旧元素残留。 这套流程写进项目规则以后, codex 下次就不会每次都换一种做法,这就是把工具变成流程的意义。用 codex 时也要知道什么时候停。第一种情况,他连续两三次理解错目标, 这时不要继续补一句改一句,你应该让他先复述目标。第二种情况,他开始动无关文件,这时不要急着接受改动,先让他解释为什么要动这些文件。第三种情况,你看不懂他要运行的命令,这时不要硬点同意 让他解释命令,或者换一个止读检查方案。会停是安全使用 ai 的 一部分,不是所有任务都要一路跑到底。如果一个对话越来越长,越来越乱,不要硬撑。 你可以让 codex 写一份 progress md, 里面写三件事,第一,已经完成什么。第二,当前做过哪些决定。 第三,下一步应该从哪里继续。然后你可以开一个新对话,新对话里先让它读 progress md, 这样比在一个很长的对话里不断翻旧消息,稳定。 很多长期项目都应该这样做,让文件承担记忆,让对话保持清爽。任务完成后,不要只说一句不错,你可以固定按一张验收清单过一遍。第一,看文件 他改动的文件是否在预期范围里。第二,看运行,能打开的打开,能测试的测试,能预览的预览。第三,看风险有没有暴露账号路径密钥,无关私人信息, 有没有运行你不理解的危险命令。第四,看下一步他有没有写清楚还剩什么问题。 最后再提醒一个学习顺序,不要一次学完所有高级功能。 第一层,先学项目权限文件,你要知道 codex 在 哪里工作,能看什么,能改什么。第二层在学 diff 命令 get, 你 要知道怎么检查改动,怎么理解命令,怎么给项目存档。 第三层,最后再学 style 插件、 m c p 自动化、远程控制。这些能力很有用,但前提是基础流程已经稳了,如果基础不稳,高级功能只会把混乱放大。所以这期你看完以后,先别急着把所有东西都装上, 先拿一个小项目完整跑一遍,跑通一次,比收藏十个功能您更有用。等你能自己判断它该看什么,该改什么,该怎么验收,再去扩展工具。那个时候 skill m c p 自动化才会真正提高效率, 否则你只是把一个不稳定的流程放大了。学习 codex, 顺序比速度更重要,先稳再快,先会检查再弹放手,先能复盘,再把流程固定下来,这样你之后遇到新的工具、新的界面、新的模型,也不会。每次从零开始, 你会知道自己要先看项目、看权限、看改动、看验证,而不是被新功能牵着走,这才是这期真正要教会你的东西。到这里,我们把 codex 的 核心用法串起来,新手先记住这条路线, 第一,选一个小而干净的项目。第二,权限先保守。第三,第一句话只让他观察,不让他改。第四,看他有没有按文件明说清楚。第五,再让他产出一个小文件。第六,所有改动都看 diff。 第七,重要节点用 get 存档。 第八,复杂任务先出计划。第九,规则沉淀到 agents md。 第十,重复流程再做成 skill 或自动化。最后总结一下,这期不是让你记住每一个按钮,工具界面以后还会变, 真正不容易过时的是这套工作方式,你给 codex 一个明确目标,给他一个干净项目,给他清楚边界, 让他先计划再执行。执行中看 deal, 看命令,看结果,完成后把经验写进规则和流程。你学的不是某个按钮在哪里,你学的是怎么管理一个会动手的 ai。
粉丝888获赞8681

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

大家好,今天我们开始讲 codex 的 入门系列,这期我会从零演示一遍 codex 如何安装,怎么打开项目,怎么让它整理资料,分析表格,最后再基于结果生成一张图片。 看完之后你基本就知道第一词应该怎么用了。很多人第一次听到 codex 会以为它只是给程序员写代码的工具,但是我觉得它真正有价值的地方远远不止写代码它。你可以把 codex 理解成一个可以围绕你电脑资料工作的一个 ai 助手。 相比于传统的这种聊天式的 ai 工具,他不是你问一句,他答一句,他可以基于你指定的文件夹去理解里面的文档、表格、截图和各种资料,然后帮你整理分析跟生成结果。 比如说你要做调研,他可以帮你整理资料,你要做计划,他可以帮你把零散的信息变成了行动目标,你可以分析表格,你可以去提炼脚本大纲,甚至生成配图等等。 所以我觉得 codex 对 于普通人也很有价值,只要你的工作经常发生在电脑上,需要处理文件资料啊,调研等等,我就觉得你应该试一下。 好,今天我们首先从安装开始。安装很简单,我们第一步需要打开 codex 的 官方网站,根据你的系统选择对应版本啊, mac 就 选 mac, windows 也可以, windows 安装过程跟普通的软件差不多,就按照提示一步一步完成就可以了。安装完成以后,打开 codex 登录你的 chat gpt 的 账号 啊,然后第一次登录的时候,他可能会让你选择主要的用途,那这我们可以看到这他是有一个工作模式,你是主要用于编程还是日常工作,这个之后都可以修改,但是如果你选择编程的话,他的回答会更技术性一点,更细节一点点。 登录之后你就来到了这个 codex 的 主界面,这个界面可以简单理解成三个区域,左边这块是这个项目跟任务列表,中间是你跟 codex 对 话的地方,右边通常会显示他正在处理的内容啊,或者可以生成的结果等等。接下来讲第一个概念叫做项目, codex 里面的项目本质上就是你对应你电脑里的一个文件夹,你选择哪个文件夹, codex 就 围绕这个文件夹里面的资料来进行工作。我这里用一个普通的例子,比如说啊,我这里可以选择添加新项目,使用现有文件夹就可以找到你自己对应的一个文件夹去作为你想工作的一个区域。 这里准备了一个很普通的例子,周末去杭州玩两天,这个文件夹里面有一些零散资料,比如说旅行笔记,想去的地方,想吃的店等等,也有一些截图、天气或者是酒店的一些路线信息。 在这个下拉菜单,这可以指定你想要的这个项目的文件夹,在这使用现有文件夹就可以指定你的工作目录,比如说我们可以简单看一下他们前 直接在这对话的形式告诉他啊,你可以查看我这个项目下面的一些文件等等。 比如说如果这我想要他帮忙整理这个文件里面的一些资料,比如说整理一个对应的杭州旅行计划, 我们可以通过语音的形式,在这有一个语音的形式,帮我整理一份杭州周末的旅行计划,内容包括目标行程安排,预算,需要提前准备的事项,以及如果下雨的备用方案等等。啊,需要 dog 的 文档,然后有图文, 对,然后就有语音的形式,在这我们可以选择它的智能的一个高低,一般来说高就足够了,然后除了这个智能,就是它的思考的一个深度, 如果是特别复杂的问题,你就可以选择超高,但它对应消耗的 token 会更多一点点,然后在这儿你可以选择对应的模型,现在最新的就是叉 gdp 五点五的这个模型,速度一般就是有标准跟快速,然后快速会一点五倍的快,但是同样的 token 数会增加。在这我们为了演示选择快速,我就开始 看,经过了这个两分二十秒,他就生成了这个文档,我们打开看一下,那就生成了一份两天两晚的旅行计划,有一个目标概,里面有图片也有表格,有对应酒店的一些住宿的建议, 以及两晚的一些价格,餐厅的一些备选,总的来说是非常全面,也非常友好。对于这种复杂文件整理的情况来说,帮我们完成了多的一个信息整理, 这也是 codex 跟普通的聊天工具最大的区别。普通的聊天工具需要在兑换框里面,你反复的复制粘贴文件,然后告诉他怎么做,他再告诉你怎么做,你可能需要去,然后你自己再去操作。但 codex 真正就是 在你指定的这个文件夹里面去读写,去生成你想要的文件,真正帮你去完成了这工作,我们可以看一下在对应的项目下面,他已经生成了这一份文档,相当于你就不需要去手动的去啊复制粘贴很多重复工作。 你可以想象一下,如果你是学生,你可以把论文资料啊,阅读笔记放到一个啊文文件夹,然后让他去生成论文。提高啊,你是做运营的,你同样也可以把这个沟通资料表格,会议记录,让他生成一个执行方案等等。销售啊,可以让他去根据你的客户资料和沟通记录进行一个跟进的计划, 所以这个就是 context 真正有用的地方,他不是给你建议,也不是告诉你怎么做,而是直接帮你去处理资料生成结果啊,这到就会极大的提高你的工作效率。 接下来我讲第二个概念,就是啊县城,就是对于同一个项目来说,你可以啊开多个县城,比如说这是这个项目本身,然后我们可以开,同时在这下面开一个新的,就叫县城,比如说分析一下,在这我想让他帮忙分析一下预算, 这样它会读写里面的一些表格啊,然后生成表格啊等等啊。同时我还想要调用这个啊, x g b t 的 那个深图模型,那么目前这个模型也是市面上深图能力最强的。 对,这样你看我们在左边就能看到转圈的,是正在运行的,然后黄蓝色的小点表示已经完成,这是帮我们那个预算的,它能够生成一个像 csv 的 一些信息,然后它也能够读取原本里面的一些信息啊,对, 让我们再看一下这个 啊,经过这个几分钟他就生成了啊,然后他就生成了一个图片,我们可以看一下效果啊,还是很不错的。就是根据我们刚才的一些旅行安排,然后生成了一个啊,非常清晰,然后也很信息量比较全面的一个旅行安排。对, 然后这个地方有一个点我也想介绍它的功能,比如说在这个工一开始的过程当中,他是尝试生成一个 svg 的 图片,然后没有调用他的,我想他调的那个工具叫 emoji 键啊,在这儿,所以我就用这个,在这个地方可以打断他,比如说用户他还在生成当中,我可以直接啊, 直接去发送,然后他就可以可以调整他的方向啊。另外大家也可以在这个设置地方可以看到自己的一个使用量,在这个地方设置 下面有个剩余用量,他这边有一个每五小时跟一周的一个限制啊。一般来说如果你是叉 g t 的 plus 账户的话,就是啊,你进行一些高强度的整理文章啊,调研啊来说,一般来说是没什么问题的啊。然后 open i 也经常时不时会重置他们的这个限制啊,所以说相比克拉扣的来说,这一点是非常好的,有点量大管饱的意思, 哎,我们回顾一下这一期,就是第一个就是首先 codex 它不只是写代码,它更像是一个可以围绕你电脑资料这么工作的一个 ai 助手。第二个是 codex 里面的一个概念就是项目,项目本质上就是你对应你你选择的一个文件夹。第三个就是同一个项目里面可以开多个县城啊,不同县城处理不同任务 啊。第四个就是啊,他可以帮你整理资料啊,分析表格,生成图片等等一些工具啊。第五个就是你怎么样去看选择模型,速度以及以及查看你的使用量等等。 这一期只是一些基本的一些概念,但是以及能够看到 codex 的 一些核心价值啊,他不只是在告诉你怎么做,而是真的去帮你去完成一项工作啊。 下一期我们会继续讲一些更进阶也更实用的功能,比如说插件呢啊,技能啊,智能浏览器辅助自动化任务,以及啊怎么把一个复杂的任务拆解成几步让他啊连续几天或者上周的去持续的运行啊。这期先到这,请大家继续关注这个系列。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

比起 opencloudex 可能才更适合普通人使用,能操作电脑做文档、表格、 ppt, 还能生成图片,执行自动化任务,逐渐从编程 agent 走向桌面 ai 助手。那今天这个视频我就给大家带来 codex 保姆级教程。先到 codex 的 下载页点击下载 macos, 下载好后打开安装包, 直接把文件拖进去就可以了。打开 codex, 它的界面很像网页版的 ai 聊天界面,主要可以分为三块,右边这里就是和 ai 对 话的地方。左上角的四个功能,第一个就是开启一个新的 ai 对 话搜索,可以通过标题来找到之前的对话内容, 剩下的插件和自动化功能我会在后面详细讲解。左下角这里是两种和 ai 写作的方式,一种是项目方式,一种是对话方式。 项目方式更适合去做一些长期积累的任务,比如沉淀知识库、做工作流、写代码。有两种方式使用项目,一个是创建新项目,默认会在文稿目录下创建一个项目文件夹,也可以使用你现有的文件夹作为项目, 所有后续的 a 阵子操作都会默认在项目文件夹下进行。第二种对话方式,就像我们平常使用网页版 ai, 可以 临时去做一些任务,比如偶尔查一查信息什么的, 那我们这里就可以新建一个项目,我们也可以在三个点这里给项目改名,在聊天框左下角就可以看到他已经进入了刚才新建的项目文件夹。下聊天框这里的加号, 我们就可以上传图片或者文件给 ai 这里我们还可以开启计划模式,这个模式是不让 ai 直接改动文件,而是先生成一份计划,我们看完没有问题以后才会执行。 权限,这里 codex 有 三种权限,第一种默认权限,就是只能访问项目文件夹下的文件,如果涉及到其他文件或者网络访问,就会弹出审核框让我们去批准。第二种是自动审查,就是 codex 会自动放行低风险操作,高风险操作才会需要人工审核。 最后一种就是给 codex 所有的电脑权限,很方便使用。右边这里我们可以选择模型的推理强度,复杂人物可以选择更高的推理强度。 模型这里我们可以切换多个叉 t b t 模型最后的速度就是可以加快模型的输出速度,不过会消耗更多的 token。 这里直接让 ai 写一个单 html 的 个人播客网站,但我们可能有新的想法,想要加进去就可以直接进行引导, 比如我这里补充整体色彩风格要用孟菲斯风格,还可以继续补充,要用一个板块式,个人作品展示用滑动式般的呈现。我们直接点击这里的引导, codex 就 会在下次执行工具调用后 插入我们新的要求,很适合补充提示词或者纠正方向,不用中断对话,让他帮我们再写一个手工艺的电商网站。使用 react, 那可以看到两个任务就并行执行了,属于转圈的状态, codex 当前步骤完成后就会显示为一个小蓝点。 看完基本使用,我们来看一看一些好用的特性。先来看一下插件功能,插件就是用来帮助 codex 操作各种工具的, 比如 computer use 和 browser use 就是 让 codex 操作你的电脑和它的内置浏览器,下面这两个就可以操作表格和 ppt, 那 往下翻我们还可以看到操作邮箱 canvas 设计软件的,我们点开一个就可以看到。这个插件其实由外部服务调用和技能组成, 那有的插件本身也是一个技能,后面也会给大家演示怎么使用插件。技能这里大家应该就不陌生了,技能就是工作流程的一个分装,如果有不懂的朋友可以看一下我之前讲 agent skill 的 视频, 如果你是以现有文件夹的方式创建项目的,也会把里面的技能同步过来。接下来我们就来看一下 computer use 这个插件, 它是利用 macos 的 屏幕录制和无障碍辅助数,让 codex 既能看到画面,又能精准点击。 这里我让他打开扫雷通关简单模式,这个半透明小光标就是 codex 操作所使用的,不会占用你的鼠标。一开始他尝试标记地雷的时候,发现标记失败了,很有意思的是,他换了一种玩法, 直接打开安全格,然后就是一路门店,推理出所有可能的安全位,直接通关。我就在想,如果以后模型的推理速度和输出速度再快一点,那我们干游戏就只需要用 ai 就 可以了。 下面我们看一下办公三件套和作图插件,这里我让他调研一下英伟达显卡的发布和价格信息,并让他制作成 word 文档, 然后配图。这里他很快先把配图制作出来了,整个过程一共用了十六分钟,第一次用的时候他会自动安装相关运行环境,制作完成后,他还会截图进行复查,发现可以打磨的地方还会进行二次修改。我们打开文档来看一下 发布信息和价格表都出来了,而且还贴心的配了图,最后还有产品线解读和购买建议。然后我让他在这个基础上把价格表整理成 excel, 同样的他在处理过程也会不断修正错误,花了五分钟时间做好。 来看一下表格,所有信息都正确写进来了,唯一有个瑕疵是溢价,这一栏应该是百分比,它这里用的是小数,不过这些都可以通过细化提示词去解决。下面继续让它根据文档做 ppt 分 格,参考苹果信息层级不超过三层。 他做完第一版以后,又对我的信息层级这个要求进行复查。我们来看一下 ppt 整体布局还是很舒服的,满足了我对信息层级的要求,没有堆满字,而且风格也是沿用了英伟达的配色。最后我们来说一下自动化功能, 它就相当于一个定时任务。右上角这里我们可以新建任务模板里有一些关于代码的任务模板。下面这里你可以选择在哪个项目文件夹下进行, 并且设定定时时间,有每小时、每天、每个工作日或者每周。也可以自定义规则,我们可以直接粘贴这个规则,让 ai 帮我们改成任意时间,比如这里就让它改成每周二和每周四的十三点执行。那 那我们在这里也可以让它执行已有的工作流程,比如这里,我之前是用 cloud code 做的,在 cloud 点 md 里已经写好了完整的自动拉取推文的流程,那直接让 codex 执行就可以了,很顺利地帮我完成了定时任务。那以上就是全部教程了,如果对你有帮助的话,记得一键三连。

同样让 codex 加一个按钮, loading 有 人十分钟做完,有人折腾,整个下午还得回滚,差的就是五步顺序。第一次让 codex 改东西,不要选重构整个系统这种大活儿,也不要选支付权限、删数据这类一旦出错影响很大的任务。更合适的任务是风险低、 范围小,能验证,而且真的会出现在项目里。比如给设置页的保存按钮加 loading 状态,避免用户重复提交。 如果你的项目没有设置页,也可以换成任意一个保存提交搜索按钮。思路是一样的,这个任务不复杂,但很适合作为练习。它会碰到组建状态按钮,禁用请求开始和结束,也会提醒你检查成功和失败两种情况, 同时一般不会改到太多地方。你练的不是让 codex 写几行代码,而是完整走一遍。定位计划、修改、验证、审查。第一步,先定位,不要直接改, 可以这样问。这一步的目的是让 codex 先把现场说清楚,它应该告诉你相关文件在哪里,按钮在哪个组建里,请求函数在哪里,现在有没有 load 状态。如果它只做概念解释,没有给出文件路径和函数名,就继续追问。 第二步,让它给最小方案。这里最关键的是最小修改。你不是让它重新设计设置页,也不是让它把接口调用那一套重新改一遍,只是围绕重复提交这个问题做一个小修。合理方案通常会包括增加或附用 loading 状态提交开始时设为 true, 请求结束后恢复为 false 按钮。 disabled 绑定 loading 按钮,文案在保存和保存中之间切换。如果项目里已经有状态管理或请求状态,就优先附用现有逻辑。 第三步,确认方案后再让它改,这时才让 codex 动手。你要观察它有没有跑偏,是不是只改了相关组建,有没有顺手格式化整份文件,有没有把接口调用那一套也改了?有没有引入不必要的新依赖?一个按钮 loading 最后变成局请求流程重构,那就不是小任务了。 第四步,让它验证真实。项目里不是每次都有完整测试,验证可以分三层,能跑自动测试就跑自动测试,没有测试就跑 lingt 或 type check, 这些都没有, 就写清楚手动验证步骤。这个任务的手动验证可以这样写。第五步,改完后做一次 review。 这一步很重要,因为成功的时候没问题,不代表失败的时候也没问题。保存成功以后 loading 会恢复,那保存失败呢?接口报错呢?页面被关闭或组建被卸载呢?如果只在成功后把 loading 设回 false, 失败时没恢复,用户就会看到按钮一直卡在保存中。所以这个任务真正要验收的不只是按钮。文案变了,至少要检查六件事,点击后是否立即进入 loading, loading 时是否禁止重复提交。 成功后状态是否恢复,失败后状态是否恢复?原有错误提示是否保留,原有叫验买点跳转有没有被影响, 可以让 codex 按清单自查。最后一句要保留,如果没有证据就说没有证据,它能避免 codex 用很肯定的话瞎回复。这一期真正要记住的不是怎么给按钮加 loadin, 而是用 codex 做任务的顺序,先定位,再给方案确认后修改,改完验证,最后检查风险。 以后不管你让他改文案、修 bug 还是补一个小功能,都可以按这个顺序来,这样任务不会一上来就变成大改,改完也知道该怎么验收。这期先到这儿,你还想让我继续展开哪个点丢到评论区,我下一期接着讲。

大家好,我是郑一环,今天我们看一下扣代词自动化任务,扣代词可以把重复工作封装成自动化任务,并且定时自动执行。 比如我每天早上都需要看 ai 热门资讯,用来做自媒体选择题,这件事每天都要做,并且流程完全一样,很适合做成自动化。具体步骤就是我先跟扣代词说, 帮我搜索今天全网关于 ai 方面最热门的资讯,挑选十条发给他。内容生成以后,我们先确认一下内容有没有问题, 没有问题的话我们再给 codex 下新的指令,就是把搜索当日最热门的十条 ai 资讯做成自动化任务,每天早上九点执行,然后发给他。 我们可以看到 codex 已经创建好了任务,后续的话我们可以在左上角的自动化这里查看和管理我们的自动化任务,可以修改自动化任务的内容,也能修改执行时间等等。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

兄弟们,我终于找到了 co ds 购的正确使用方式。自从 co ds 上线了购模式之后,我一直在做各种尝试购模式,对头肯的消耗确实很大,我花干了三个一百刀的 pro 五倍的订阅账号跟一个二百刀的 pro 二十倍订阅账号, 然后终于摸索出了 co ds 的 购到底应该怎么用了。刷到这个视频的朋友一定不要错过,我会把我的心得摸索出来的使用方案免费分享给大家。 首先给大家讲一下 go 模式跟普通模式的区别。在普通模式,你提出需求, koether 执行一轮任务结束,等你下次提出新的需求,再开启新轮的执行任务。一般来说,你会根据任务的执行情况,在下次对话去做不同的操作。如果你发现任务执行的有问题,你会在新库页里面去提出问题,让 koether 去修改。 如果你觉得任务没问题,就可以让 codex 去提交,然后思考下一步要去做什么。在 go 模式里面是完全不同的一个状态,你发送的快手会被设成一个目标,后续每一轮 codex 任务都不需要你去关注了 codex, 它会自动一轮轮的去执行任务。在每一轮里, codex 都会去看目标是什么,现状是什么,下一步做什么,然后真的去做这一步。 我把我们平时的任务划分为短任务跟长任务。所谓短任务,顾名思义就是比较简单,耗时比较少的任务。长任务则是比较复杂,可以拆解成多个短任务的任务。 其实没有 g 模式,我们在普通模式下也能做短任务和长任务。先看短任务,在普通模式下,提出任务之后,如果发出的 query 就 只说了任务描述,那 qsort 做完之后,我们还需要自己去验证,或者发验证任务让 qsort 去做。当然,我们也可以在最开始发短任务描述的时候,一次性说清楚怎么验证,发现问题要怎么做,但是否遵循其实还是取决于模型本身。 那在 go 模式下,其实就相当于把依靠模型本身的机制,用工程的手段固定下来,把不确定变成确定。 codeys 帮你做好了状态变更和管理机制,你只需要去提出你的任务,把任务设置成目标,因为它有严格的状态变更机制,不能随便的把目标修改为完成状态。你写进了标准,在没有符合标准之前他就会一直做。 所以目标模式对于短任务来说,会让任务完成的更加稳定。再看长任务,普通模式下,你不管是通过 play 模式规划好,还是通过 openstack 或者 superpower 这种插件去澄清需求细节,然后交给 koops 去做,他往往都会很难一次性完成。 计划会被划分成多个阶段,多一篇集,需要你跟 koops 去配合,逐个去验收推进。那在 go 模式下,你可以配合各种插件或者 play 模式,澄清一些你在意的核心关键细节, 你就可以设置你的目标了。这里 codeys 不 会把你的任务拆成一个个执行清单,而是每次都会基于总目标跟验收标准以及当前已经执行的一个状态去判断下次做什么。 这个机制看着不复杂,但其实有一些问题,特别是在常任务场景下,因为 codeys 的 构模式本身的机制并不是一个突突立色的机制,它不会在底层生成第一步做 a, 第二步做 b, 第三步做 c, 更不会有一个任务队列去管理每一步完成之后自动挑下一步。那长任务越走越久,背化跟工具结果会越来越多。模型不可能把所有的细节原封不动的背在身上,中间就会进行很多次的压缩,压缩天然的就会丢失一些信息细节。 call dice 的 go, 它会提醒模型以当前的状态为准,但是它没有一个内置机制,自动地把关键事实整理进文档里,也就是说, 把关键事实落在外部证据里,主要是靠用户在目标里明确要求,或者在过程中提醒模型去做,那这里就没有那么稳定了。一旦模型没这么做,每次完成一个小步骤,推动新步骤展开的时候, ko 代斯就要重新去分析代码,梳理状态,判断做了什么,做到什么程度了,就会出现长任务后期吞失都肯失控的问题。 这样看, codex 的 构里虽然有了严格的状态变更机制、神经机制、多轮驱跑机制,但在长任务里,由于本身没有工程的机制去做进度管理,就会确实出现一些任务偏离的风险,以及会消耗更多的 token。 所以我把这套使用方式整理成了一套 codex go workflow 的 方案,也推到了 github 上,它不是替代 go 模式,而是跟 go 模式去配合使用。 go 负责让 codex 持续往前推进,这套方案负责把目标验收、标准、阶段记录跟听的条件提前固定好,让长任务跑得更稳,不容易越跑越偏。 最后跟大家实际演示一下这套模式具体怎么用。我自己做了一个 codex 管理者的项目,因为我自己开了多个账号, codex 本身账号登录换号我感觉还挺麻烦的,这项目可以去管理我的这些账号,并且在某个账号的额度用完之后,让我手动切换到另外一个账号上,也支持智能的去切换到最佳账号, 还能把 codex 的 接口去接出来。这个项目整体功能我自己测试已经没什么问题了,但目前 ui 太丑了,我目前有了 ui 设计稿去重做,所以这次打算用 codex 的 go 模式去完成这个任务。 首先打开 codex, 选择这个项目,新开一个对话,然后输入斜杠目标,切换到目标模式,这时候输入框下方会出现目标模式的状态。 接着引入这个 codex go flow 这个 skill 直接用自然语言去描述我们的需求。参照页 ui 设计图,重新开发当前项目的 ui 页面,要求修改后的页面样式组建,配色、字体颜色和出细都对齐。设计图做到像素级还原,点击发送 会生成 go 点 m d 和 go progress 点 m d, 再按照这两个文档持续执行,后续每一轮它都会先看目标和进度,再继续推进,我们等它执行一段时间,最后看一下执行的一个结果,可以看到执行之后的 ui 页面跟原始 ui 页面差别还是蛮大的,整体效果还是比较满意的。

今天给大家说一下怎么在 windows 上安装 code, 以及怎么在 windows 上使用。首先我们打开一个浏览器, 然后输入一下 code, 点积木 x y z 点 com, 然后我们把它放大,找到一个 c l a 安装与配置选项,这里有个 context, 找到 windows 这个选项,点击使用说明。 我们这里系统的要求就是需要 windows 十十以上,然后这里可以安装相关的依赖,需要需要安装 note g s 和 git, git 是 可选的,我们首先要安装 note g s, 打开这个网站, 然后点击这里进行下载,下载完毕以后点击下一步就行了,因为我这里已经下载好了,就嗯就不做影视了。然后我们打开一下这个, 这里首先需要环境检测,这里可做可不做,就是大家如果没安装 get 的 话,没安装 get 的 话,这里环境检测就会失败,我们点击复制一下命令,这里点击一下 cmd, 然后把这个命令复制下去,要安装完 get get 以后,这里环境检测就会出现这个绿绿色的部分,这环境检测已经通过, 这里我推荐大家使嗯,不要使用 windows 原生态的 cmd 使用使用,嗯。 vs code, 我 们下载一个 vs code, 在 这里直接搜索一下 vs code, 然后点击这里, 其中类 vs code 也可以,比如 css 等等的。有一些相关的软件可以直接打开终端,然后点击这里进行下载, 这里已经开始下载了,然后大家直接点击下一步,默认进行安装就行了,我们这里已经下载完毕了,就是这个, 然后我们这里是我的相关的项目,然后我们可以新建一个文件夹, 以后写项目就在这个文件夹上面,比如我的项目,然后把这个文件夹拖入 vs core 的 中, 然后点击信任这个作者,然后我们可以在一开始 vs core 的 这里是嗯,英文,然后我们在这在扩展,这里可以搜索一下,搜索一个中文, 然后把这个安装下,安装下来,然后再切换一下语言,这就是中文的显示,然后我们继续看一下它是如何说的。 在环境检测这里相关的终端,就直接在这里点击一个切换面板,就是相关的终端, 然后在这里终端可以任意添加,添加很多个, 我们以第一个终端为例,这就相当于打开一个 c m d, 然后点击粘贴,粘贴粘贴进去了,点击回车键,这里显示文件检测通过, 然后把这个缩小一下,看一下, 这里需要卸载,嗯, codex 如果你没有安装,可以跳过,我们卸载一下,点击复制命令,这里卸载, 已经卸载完毕, 然后需要安装 context, 这里是复制,然后在这边直接粘贴, 等待安装,这里已经安装完毕,然后验证一下安装, 直接复制一下命令,这里相关的提示,如果有错误,直接直接按照这这个错误直接复制这个相关的命令就行,跟不同的电脑有不同的。嗯,要求我们直接复,把这个复复制下来,然后进行粘贴, 可以看到 codex 已经安装完毕,已经出现这绿绿色的小圆点, 这里是可选的,然后我们就不执行,然后需要登录去创建 cortex 的 key, 然后下面就是写一键,用脚本去写,写入这个 key, 我 们先创建一个 key, 嗯,这里就是需要创建 cortex 的 key, 然后就在这里选择一个产品线,点击 cortex, 然后输入一个名称,随便输入一二三,创建这个 key, 这个 key 已经复制过来了,就这就刚我们创建的能复制下来,我们在我的项目这里输一个,创建一个文件夹,把这个 key 复制下来一点。 md, 把这个复制上去,刚刚的 key 复制粘贴, 这就是刚刚我们嗯创建了 key, 然后再回到嗯原来的安装的脚本以及说明,点击这里使用说明, 嗯,创建 key 以后,第六步已经完成,然后就这里有个命令,一键写入脚本,这里这个命令就比较长,还要替换嗯你的 key, 然后就复制下来,然后放到嗯这这里, 这就是刚刚复制的命令,这里注意需要把你的或者是 a p r key 替换成,替换一下,把这删除,然后把这个复制下来,粘贴到这这里,这就是刚刚我们的 key, 然后把这一部分 复制到终端中,点击粘贴, 然后点击回车,这里已经写入完毕。这一行大家不要管 这里,嗯,就是写嗯,写入相关的已经完毕了,然后它显示要重新开一个终端, 下一步就这里,下一步就是手动配置,大家可以嗯自自动进行配置,手手动配置我们就不看了。 然后下一步就是你的进进入你的相关的项目,然后在终端输入一个 context 就 行了,然后把这个 context 和终端叉,嗯,删除和输入一个 context, 然后就进入 context 终端的界面,大家就可以在这里写嗯嗯写项目,比如这里可以输入一个斜杠 model, 这也可以选择相关的模型,目前我们选择的是 g p c 是 五点四,然后输一个二,然后再输一个四,这是 g p c 五点四的模型, 然后再输一个斜杠 app, 这是允许,呃,国泰 s 执行什么范围?我们选择四就是允,允许它全自动, 不需要经过我们的允许,他就可以自行的修改代码,修改文件等等。我们选择个四,那再输一个一, 然后我们把这,嗯,比如我们问一下,或者是你好,你是谁?你可以帮我做什么? 来看一下他怎么回答的, 它已经回答完毕,这这里就是它相关的回答,然后我们点击这里用量日式,可以看到这是刚刚我们创建的 key 的 名称,然后相关的模型以及消耗的积分, 然后以及时间,然后我们再把这个 context 给擦了,然后如果你想回到原始的,嗯, context 就 输一个 context。 瑞苏米 那点击这是刚刚我们创建的,然后点击一个回车就回到刚刚的相关的,嗯,项目项目的范围中了。同时我们可以也使用 vs code 的 插件,点击扩展这里 下载一个 context, 输入一个 context, 下载第一个,这里有个官方的标识这里, 然后把它下载下来,下载下来的时候大家就就可以看到 vs code 这边有一个 context 的 相关的,嗯,图标在这边,在我图标点击了这里,点击一下 它就会出来相关的 port 的 事,比如刚刚我们两分钟前的它这里显示一个两分,然后我们点击这里,然后就没必要进入,进入到终端中,直接在这里可以进行和它进行对话,比如,嗯,问一下, 你可以帮我写 matelab 代码吗? 就直接在这里进行工作,终端这里如果大家不方便使用,直接在这里插件部分使用, 他这里他已经进行了回答。

你敢相信吗?这条视频是 codex 帮我剪的。以前我做一条动画视频,要先写文案、找素材、拍时间轴、调字 幕、做转场,光是对齐画面和节奏就能耗掉半天。但现在,我换了一套流程,我先把想讲的主题告诉 codex, 让他帮我拆成脚本、分镜、画面节奏和封面标题。接下来重点来了,我不再一帧一帧拖动画,而是让 codex 直接写 remote 键标题怎么入场,数字怎么跳动,卡片怎么滑, 背景怎么突袭,转场什么时候出现,全都变成代码。这样做最大的好处是,视频不是一次性的,今天讲 ai, 明天讲科技,后天讲金融。只要换掉文案和数据同一套模板,就能重新生成一条 新视频。我的流程一般是四步,第一步,写一个五百字以内的主播稿。第二步,把稿子拆成五到七个画面。第三步,用 remotion 生成一零八零成一千九百二十的竖版视频。 第四步,把视频导进剪映,加上自己的配音和配乐,你看到的文字弹出数据、放大代码窗口、时间轴和发光网格都不是手工剪出来的,而是自动渲染出来的。 所以这套方法真正厉害的地方,不是省一次时间,而是把做视频变成一条可以重复使用的生产线。

如果现在你想学习一个 agent 作为你的主流 ai 工具,那么我觉得 codex 将会是现在你的最好的选择。虽然 codex 最早是作为编程 agent 的 诞生的,但是我觉得它经过这段时间的疯狂迭代更新,它已经是目前性价比最高的,普通人也能用到最强的 agent 产品。 所以今天这件视频呢,它是一条零基础小白也能学会的,教你从安装到基础设置,最后再到实力开发的保姆级 code 教程,保证能让每个人都能体会到 web coding 的 乐趣。那话不多说,我们先从安装开始。 首先安装这一步,它其实比较简单,在官网中直接就可以下载, mac、 windows 都有。在这里呢,你需要注意一下,如果你想体验 codex 的 完整的功能,那我十分建议 在 mac 上使用。那其实像电脑控制、远程手机链接这种便捷的功能,目前基本上都还是 mac 专属。我这里还列了一下 mac 和 windows 的 功能对比,感兴趣的朋友可以截图一下。 不得不说,苹果真的是在 a j 的 时代已经麻了, only apple can do? 那 安装好之后呢?你直接登录你的 type g p d 账号就可以了。这里我觉得有一个点呢,非常的有意思, 如果你之前经常抱怨 cloud 额度消耗太快,或者担心自己经常被封号,那么在 codex 中,它非常贴心地帮你设置了 agent 一 键搬家的功能,就是能从 cloud code 中直接导入所有内容,并且继承你在上面的全部的配置。 回想起之前 kyle 的 支持导入记忆来挖的拆的 g p d 用户,那这波只能说是你挖我墙角,我直接就偷你家。 那进入到界面之后呢?我们可以把整个界面 它只分成四个区域,其中正中间最大,这个区域叫工作区,它就是用来和 a 正的对话的地方。那左上角它的功能区主要是 codex 内置的一些便捷工具,你可以选择你喜欢的 skills 或者是插件。那下面就是项目还有对话的一些管理区。项目你可以简单的理解为 codex 的 一个工作间,一个项目里可以开好几个对话, 每条对话的就是一条独立的任务线,他们共享同一个文件夹里面的所有文件,但是记录相互隔离。而右边就是项目的预览区,比如在生成网页的项目的时候,我们就可以在这个区域里面看到你最终生成的效果。但到这里我知道你已经迫不及待的开始手搓一个项目了啊。但是你先别急, 我们先要做一些系统设置,这样才会让你的 codex 比较的好用。那打开左下角的这个设置,常规设置里面这三个开关 打开,并且将跟进行为改成引导,这样你会发现在 agent 的 做法偏离你预想的时候,你就可以及时的跟正他,而不需要去排队,这个样他也 不会特别多浪费你的 talking。 那 接下来你需要设置一个 agent 的 m d, 那 如果说 cox 是 一台可以自动驾驶的汽车,那么这个东西就是你设置的防 好配号,就设置这一步,才会按照你的习惯,用你最舒服的方式把你送到这个目的地里面。那这里我推荐直接使用大神卡萨斯的模板,设置好之后,下面的这个记忆功能会建议你一起打开, 这样它会在你对话结束之后,自动把聊天记录总结成记忆,然后保存下来,以后遇到相关的场景,它就该知道怎么去用了。 ok, 设置这块就搞定了。现在你终于可以开始你真正的第一次 web coding。 这里我用我一个自己的真实需求来做个演示,给大家做一个小 case, 而当你呢,先建好一个项目。建好项目之后,在对话框的左下角里面选择这个计划模式,它可以帮你先制定一个具体可行的方案,等你确认好以后再开始做。 我非常建议大家在开始每个复杂项目之前,都可以用这个模式先过一遍。然后权限这里呢?如果你是一个程序员或者开发的朋 朋友,在这里你完全可以选择默认权限,一步一步你自己来审批,来控制最终的成品质量。但如果像我一样,你什么开发经验都没有的话,同时你又不想频繁的盯着屏幕点击这个确认,那我推荐你跟我一样,选择这个完全访问权限就 ok 了。毕竟我又不是开发出身这东西这些代码我又看不懂, 那不如直接全部放开,让他自己搞你就完事了。当然这个模式风险还是有一点的,你知道的, 那模型直接选择现在最棒的 g p t 五点五就好了。推理等级日常的话你选择高就 ok, 但是遇到真正的硬活大活,你可以选择这个超高。这里我用我真实的需求来演示。 那比如说我最近确实刚刚体检完的,结果不是特别好,所以医生呢,给我开了三种药,那因为服用的顺序不太一样,也包括有的是饭前,有的是饭后,导致我经常搞混有没有吃,所以我就想开发一个 app, 通过糖酸的方式来提醒我按时吃药。那在这个工作区里面,他输入 的需求,再根据这个需求,他会给你一些问题,你把这个问题回答好,最后确认这个计划完的方案,他就可以自动去进行执行了。这非常简单,大概二十分钟以后,他会自己 把这些东西都做完了,这时候你会看到一堆乱七八糟的文件,你看不懂也没有关系,因为这个其实是 app 的 一些基础的文件,那你只需要再把我们的需求用你的大白话说出来就行。比如说我直接跟他说,我想把这个东西我们开发完的这个 app 转到我的手机上,那他会告诉你, 你首先需要装一个叫插扣子的工具,你先不用管插扣子什么,而且大部分人电脑上我不觉得它也有安装过这个东西,所以这个时候你只需要调用 codex 内置的一个插件,叫做 com 的 use 这个插件,它 可以帮你做好后面所有的步骤,所以基本上只有在遇到登录账号这种敏感操作的时候,它才会停下来交给你自己,让你自己去操作一下。那最后你其实按照 codex 的 一步一步的指示,在手机端做好一些设置,那你其实你会发现你这个 app 就 可以真的安装到你的 手机上,非常的简单,几乎都不需要你做什么,主打一个有手就行,只要你会说话。那做完 app 之后,如果你还想继续改东西,但是你又不想一直坐在电脑面前的话,你甚至可以在手机上去远程操控 windows, 苹果和安卓手机都行。那走在路上,你突然比如说想要改一个什么东西,那掏出手机啊,真的就能继续, 真的是随时随地都可以享受 webcoing 的 乐趣。那说实话,我一直觉得 webcoing 这个东西对于非程序员来说,它可能比程序员它更有一些价值。 你以为像开发者,他本来其实就会写些代码, ai 对 他们来说更多的是提效。那对于我们这些原本不会写代码来说, ai 直接把一套原本过不去的坎给铲平了。就像连胡彦斌现在都可以用 webcoding 来给他们的粉丝开发一个社区的 app 了。我最近哇写了一个多月代码, 就写了我自己的 app, 然后打开以后就会有我所有的日常。那说实话,在未来会用 ai 写代码,就会变成像会用 excel 一 样的基本技能一样,这是一个必然。那我也希望人人都能发挥自己的创意,祝大家 call 定愉快!

今天是一条适合小白的保姆级 codex 教程,如果你之前只用过聊天式的 ai, 可以 先把 codex 理解成能帮你执行任务的 ai 助手,它不只是回答问题,还可以在你授权的范围内帮你处理文件、生成内容、运行工具、预览结果。 那这期呢,我会从基础使用、真实案例、高级功能等三个方面给大家拆解。 codex 里面会包含三个案例,也会讲到一些插件和特色功能的使用。 那第一次打开 codex 的 时候,你按照界面的提示登录账号就可以了。登录完成之后呢,你会进入 codex 的 主界面,新手先不用纠结各种设置,因为这些后续都可以再改,我们可以先把界面看明白。 那我们现在已经进到 codex 这个页面呢,你只需要理解三块区域就够了。左边是项目和任务列表,你可以在这里切换项目,查看历史对话,也能看到有哪些任务正在跑。 中间呢是聊天和任务输入区,你要做什么就直接用自然语言告诉他,和之前咱们用的 ai 对 话型产品其实是一样的。 那右边呢,是执行过程和结果区, codex 改了哪些文件,跑了什么命令,生成了什么样的结果,网页预览长什么样子,通常都会在这里展示。然后呢,我们来讲几个新手比较容易混的名词。第一个是项目, 那项目就是你给 codex 选中的本地文件夹,你选了哪个文件夹,它就能够围绕这个文件夹读文件、改文件,生成内容。项目呢,也有两种使用方式,一种呢是根据任务类型创建一个项目文件夹, 以后同类的任务可以都放在这个项目里,比如说我自己每天都要做的 ai 新闻板块,我给他建了一个独立的文件夹,叫 daily ai news。 另外一种呢是打开现有的文件夹,那 codex 就 可以处理这个文件夹内的文件了。 第二个需要理解的名词是上下文,上下文可以理解成 codex 当前知道的信息,比如你跟他说过的一些需求,他已经看过的文件,当前任务进行到哪一步,都会影响他接下来该怎么去做。 第三个是模型智能程度和速度,普通任务直接用默认的中度就可以了,比如整理文件,写文案,改一点简单的内容,不用上来就拉满 那复杂任务,比如要跨很多文件,规划项目,排查问题,你可以再把智能程度调高,然后模型这里可以切换不同的 gpt 模型,速度这里直接用默认就可以了。 最后呢是权限,这个非常非常重要,默认权限就是 codex 主要围绕当前的项目文件加工作,遇到联网安装工具,访问项目外的文件的时候,一般都会先来问你。那自动审查呢?是我比较推荐新手日常使用的, 它会根据操作风险来做判断,低风险的时候自动操作,敏感操作的时候就需要你人工审核了。 那最后这个呢,顾名思义就是给 codex 所有的权限,这个只建议你非常明确的任务,也信任当前操作的时候再用好。以上呢,就是一些 codex 的 基础使用内容。

codex 最让人上瘾的玩法就是一句话,扔过去,等他把整个功能跑完。看着爽是真爽,翻车的时候也是真痛。我吃过几次亏之后,现在改成小步走,三件事你拿走就能用。第一件,先拆任务, 一个完整功能,先在脑子里切成三到五块,每块只让 codex 干一件事,先建数据模型,跑通再说,再写接口跑通再说。最后接前端,中间任何一步不对马上停,别让他继续往下糊。第二件,留检查点, 每跑完一小块,就让 codex 把代码测试改动说明写出来,你扫一眼,觉得不对劲就打断,觉得对就让他继续检查点,本身花不了多少时间,但能在翻车前拦下很多坑。第三件,小步提交到 get, 每一小块跑通就提一次,加一句简短说明,这样哪一步出错直接回退到上一步,代价就一小段时间,而不是一整天。 我用这套方法做完一个中等项目,中间打断过十几次,但没有一次需要从头来做工程的同行也有不少这么干。评论区聊聊你最长让 codex 一 口气跑过多久,跑完之后是真的能用还是越改越乱。

大象关进冰箱需要三步,而我呢,只给了 code 三句话,就把一段废片从这样变成了这样。大家看到的所有这些动画效果,屏幕上的大字字幕,甚至还有这些 ui 卡片,全部都是 ai 帮我完成的, 而我做的呢,只是给了 code 三句提示词。所以接下来呢,我就跟你一起实操,看一下这个流程到底是怎么跑起来的。先说工具啊, 那新的 skill 就 三个, video use 是 用来读懂视频,然后做出剪。 imagine two 呢,是用来生成分镜图,然后 hyperframe 是 用来把出剪视频包装成最终的成片。我们开始第一步,先用 video use 出剪视频, 我输入的是这段提示词,这样它就会先帮我把视频的口误停顿气口给剪掉,同时还会把这条视频的口波溢出来。然后这一步很关键, 因为有了这个字幕呢,后代才能更精准的帮我记录每一个词在第几秒,然后去更好的去匹配动画效果。接下来第二步就是初剪,完成之后, 我让 ai 先设计整条视频的动效风格,我会把两样东西丢进去,第一个是视频截图,第二是口播文案,然后输入这段提示词,他就会帮我做整个视频的分镜图。 这边要记住哈,就是生图的这一部分,要用带 imagine two 能力的模型,因为他要直接生成的是分镜的效果图。 然后接下来你看他生成的分镜图,已经是把整条视频的视觉方向都定好了,然后大字幕啊,流程,卡片,画面层次基本都出来了。第三步就是把这张分镜图加上初剪的视频,再丢还给 codex, 然后输入第三句提示词,然后这一步呢, codex 就 会根据分镜图去生成对应的效果, 我们直接看一下,结果我发现一个很荒谬的事,一个不会剪辑,不会转场,不会做各种特效的普通人, 突然有一天把这段口播素材丢给 ai, 然后用中文跟他说帮我剪辑一下,加点字幕, 然后再搞的高级一点,然后他就做完了。就是如果说你觉得哪里不好,你就只需要用自然语言跟他讲哪里需要修改,一般两三遍之后就可以得到最后的成篇。最惊的不是说他帮我剪了一条视频, 是我第一次感觉到是想做自媒体,但是拖延了好几年。那个计划是终于可以往前走了。以前我卡在不会剪, 然后不会包装,不会做特效,我发现可以一边用 ai 做一边学 ai, 还可以认识一群同样在动手的人,一起交流。这套流程真正解决的而不是剪辑技术, 而是普通人最痛苦的那一步,不知道从哪里开始。所以我觉得不要再收藏一堆 ai 的 教程了,一起先跨出第一步, 先做出来,再慢慢变好。我已经把整套流程做成了 scale, 想照着跑的,想一起交流学习的,可以进粉丝群领取。关注我,下一期我整理一些我自己觉得很好用的。

哈喽,大家好,我是车车,我最近在做 ai 视频的时候,有一件事情特别烦,我不是要花分镜图吗?分镜图要一张一张的发给 ai 出图,出图完再一张一张的命名存好,反复横跳,不敢想象这个重复的工作量。后面呢,我一想可不可以把这件事情丢给 codx, 让他帮我批量跑完,没想到一试还真给我试出来了。 我丢给他完整的分镜和参考风格,他一次性给我生成了非常高质量的分镜图,是我想要的,而且呢,还全部打包好 完整的发送给了我。那今天呢,和大家分享一下我现在是怎么用 codex 的, 包括几个我自己摸索出来的用法。我们先说 codex 的 面板长啥样,不然你不知道打开之后看哪。 codex 的 界面真的很极简,整体很干净,没有什么多余的东西, 左边的侧边栏就这几个入口。新对话搜索插件自动化,下面呢是列表和对话框底部这边有一个小的手机图标,是连接手机遥控用的,后面我会单独说 右边就是主操控区了,那左边的这个插件入口,它是可以给 codex 接各种扩展能力,比如像我自己就连接了我常用的 keyup notion。 第二部分呢,我们来看一下 codex 的 自动画面板能干什么? 我觉得扣贷的自动化是最值得说的。简单说呢,就是你写好个规则,设定个时间,他就按时自己跑,跑完把结果放进收件箱等你看,你不用每次都手动触发,他后台会自己来操作。那这里和大家分享一下我的使用场景, 我设置了一个每天使用扣贷的时候,他会自动提醒我检查一次当前的额度使用情况的功能。我一开始设置的是每两个小时提醒我一次,可以看到八点多、十点多、十二点多、 十四点多,他都会定时来提醒你看一下额度。那后面呢?库德斯他自己将每两个小时提醒一次的功能改成了每天上午九点提醒我一次,他觉得这样子更合理,因为在每天开始工作前看一次我的额度, 可以判断当天任务的优先级的情况。因为 colex 的 额度有点特别,它同时有两层,第一层是五个小时的短窗口,用完了等五个小时再会去刷新一次。另一个呢,是你包含在套餐里的总额度,这个才是真正的上限,用完了就真的没了,不会跟着五个小时的额度来重新刷新。 特别是我在批量出图的时候,担心额度消费很大,不盯着,很容易跑到一半就断掉,加个提醒就会安心很多。我们再来聊一聊节省额度的办法。第一个呢,我们可以在设置里面换一个小一点的模型来跑,简单的任务完全够用,消耗比默认的模型要少很多。第二个呢,可以使用它的计款模式, 就是在发起任务之前,先让扣代词把计划列出来,告诉你他打算怎么做,分几步,不做什么,你确认没问题了,再让他开始执行。为什么这样能省额度呢?因为他想清楚再行动,不用跑一半发现方向不对,重来减少反复纠错的消耗,尤其是跑比较复杂的任务,先过一遍,计划真的省很多。 再说一个功能,目标模型,我们同样可以在这边添加,追求目标,普通的用法是你说一句,他做一句,做完就停,等你下指令。 目标模型完全不一样,你给他一个终极目标,他自己会进入一个循环,从计划到执行,到检查,到出错的纠正,再到继续跑,一直到目标达成为止。你不需要守着,他不会中途停下来问你怎么用,怎么触发。 那我在批量升图的时候加入了这个模型,他在升完图的时候帮我整理好,并且呢他也会自己去检查一遍。这里补充一点,你点击这个加号,可以添加这个模型。之外呢,你也可以点一下斜杠,他这边会有很多的选项, 可以看到我这边也设置了一个 codex 的 宠物,那 codex 还有个刚出的功能,很适合 我们这种到处跑的人。手机现在也可以来操控 codex 了,逻辑很简单,电脑继续在跑任务,手机是遥控器,你在外面打开 x 的 gpt, 能看到 codex 跑到哪里了,可以批准下一步发起新任务,或者是随时叫停。电脑干活,手机在指挥。 具体怎么连呢?我们点击侧边栏的这个手机小图标,手机打开 x 的 gpt, 扫一下就连上了,这边是已经连接过了的界面,你打开出来的页面应该是长这样的, 我具体还用 codex 干些什么事情呢?视频开头说了, codex 帮我批量跑分镜图,它是在后台自己调用了叉的 gpt mate two 来生成的,我不需要手动一张一张的发指令,它自己会把整个流程跑完。除此之外呢,我会用它来读 github 上面的项目, dhab 上面的一些我很感兴趣的 skill 直接丢给他,他能按照里面的说明帮我操作,全程不碰一行代码。那这边呢?我是丢给他了一个最近很火的规章老师的 ppt skill, 然后让他帮我生成了一个如何学好 codex 的 简单的一个 ppt, 我 觉得还是很不错的。我还会让 codex 去连接我的 notion。 当我和他讨论完自媒体的脚本之后呢,直接 把最终输出的脚本自动保存在 note 里面,不需要我再手动复制过去,也不用调格式。最后呢,说几个我摸索出来的和 codex 的 沟通技巧。首先第一个说结果,不说步骤, 不要告诉他先做 a, 再做 b, 再做 c, 你 直接跟他说你要的最终结果是怎么是什么,他会自己想怎么走,你说步骤呢?反而会把它框死或者绕进去。二点呢,限制条件,说清楚你的文件名,格式是什么,存到哪个文件夹, 如果你要用到楼层,那楼层的数据库叫什么名字,这些边界条件越具体,他的出错率就越小。第三点,复杂的任务,我们可以先跑计划模式,他先把计划列出来,你看一眼有没有方向问题,确认了再执行,比跑一半发现跑偏要省时间的多。第一次可以先跑小样本, 确认结果,对了再跑全料。那我可以看到我前面在用 notion 生成帧近图的时候,帮我生成的计划是可以先小批量的测试三张,来确认这个风格是不是我想要的。 那它确实是按照要求来生成了三张图,那它确定了方向之后呢,对后续的项目进度来说会顺利很多。 好了,那我用 codex 最大的感受是它改变的不是你的技术水平,改变的是你愿意把多少重复的事情交出去。不会写代码,但你知道自己要什么,说清楚它就能跑。从一件最烦你的小事开始丢给他,看他能干掉多少。我是春春,下期我们接着 chat。

让你志能游天的 ai 动起手来吧!把这个文件夹里的文件按照类别整理好,按顺序改成项目一。项目二,咦,每天早上九点,搜集前一天的 ai 行业资讯,发到群里看,总结这个文档里的内容,生成 ppt。 这期避开专业难懂的术语,让小白也能够流畅运用上扣带,让你的工作效率和创新全面提升。我们先认识它,再到如何使用安装,用六个按键一步步的掌握它。其实词和小技巧呢,我也总结到了,视频里出发 扣带斯和可劳扣的它们呢,是类似的,都是 ai 的 编程工具,只不过一个呢,是 oppo ai 家的,默认的是 gpt 模型的,但你也可以在里面去更换你自己的模型,但你也可以在里面去更换你自己的模型。 这两个阶段性地成为目前好的必然模式。但它们适合使用的场景呢,会有点不同。 ko 代斯,它呢,就适合我用来快速整理文档,处理一些。这种本地的任务界面,对于小白来说会比较友好一点,就很适合初学者或者是我们日常的办公场景。因为是 open ai 的 嘛,所以呢,我们也可以直接在里面调用 j p e m 叉二来生成图片,而 可牢扣的会比较适合追求高质量的创作用户,并且 c c 的 知名度会高一点,所以不论哪种语言,你都能找到关于它的类似教程。 之前还在说 c c 可以 用手机来控制 c c, 在 前几天也出了手机端,二者的功能差距又缩小了。 c c 的 小白使用教程呢,我们之前也聊过,有兴趣的可以去复习一下。那我们要使用 c c, 我 们只需要一个 g p 的 账号, 免费的呢,也是可以用的,只不过它的额度会少一点,会有三种不同的使用路径,就是使用哪种方法来开启你的扣袋子。 c r i 呢,会在你本地去开发操作,你的本地项目就比较适合开发者深度来使用,因为需要一些命令行的使用,所以会有一丢丢的小难度。那这个呢,就是把扣袋子装进你的代码编辑器里, 像 vivo studio code, 反重力这种的,而我们普通用户呢,直接选择这个就可以了,不用懂。命令行,适合大多数人来使用, ok, 我 们来进行安装,我们按照它的指引步骤来操作就好了。进来之后呢,我们可以看到它的整个页面跟我们常用的 ai 工具还是很像的。而左边的这个导航栏就是你的文件柜, 所有的功能入口都会在这里去显示,而中间的呢就是我们对话交流的地方,而右边这里就是你小助理给你交作业的地方,成果的展示区域。而左边的这个导航栏,每一个入口都是一个工作流。在这里重点的呢就是这两个 来快速对话,就是主打一个随问随答,碎片式的对话,就像你给他一个英文的演讲稿件,然后让他给我翻译出来,哎,还挺到位的。像这种只是问问问题,写写代码和 check gdp 呢,其实相差不大。而这个项目呢,它就更适合一些长线的 摸不准,需要高度上下分连贯的这种复杂任务。点击这里我们可以看到这里呢会有两个选项,这个呢是在你默认的路径下新建一个空白的文件夹, 而另一个就是说打开你电脑上的现有文件夹,在这个基础上再去操作。比如给他一个本地的文档,里面呢是一堆的发票图片,那我们在这个对话框的下面也可以看到,我现在是在这个文件夹里进行操作的,这就触碰了沙箱机制,只能操作本地选中的文件夹,不能操作系统其他的文件。那我们现在给他要求根据这几张发票, 然后给我按照金额重新命名一下文件。当然只有这些呢,还是不够的,我们还需要给他开放对应的权限,那我们可以点击这里可以看到这里有三个模式,分别是你只能在当前的文件夹下来修改或者执行, 如果需要联网或者说触碰这个文件夹以外的东西,需要来向我们申请,我们同意,他呢才能继续执行。而这个呢,恰恰相反,他可以自由的读取、写入,修改或者删除目标范围内的程序。 自主性呢会比较高一些,但也会有一定的风险。在我在这种简单的任务下呢,会选择这个模式,简而言之呢,就是 ai 会自主的帮你筛查这个有没有危险,像安装常规的工具这种明显安全的操作,它呢就会直接上手了, 不会再来询问你了。 ok, 他 也操作好了,我们来看一下,那整体呢,也是根据我的这个内容来命名的,还是不错的。那除了帮我们整理本地的文档,还可以在我们授权的情况下,在你的电脑上来执行安装的操作。比如最近爆火,但有点上手门槛了。 cloud code, 我 们在 d 盘新建一个文件夹, 然后回到这个 codex 里面,再把这个文件夹给它呼唤出来。那这步的意思呢,就是让 c c 在 这里面进行操作,那我直接给他说帮我安装一个 colocode, 那 我们稍等一下。好,他现在呢说已经安装好了,我们来启动一下。哦,是可以的了,当然也包括 node js, git 这种我们日常生活中经常用到的依赖。 好,现在你用 codex 整理了你本地的文件夹,大大缩短了你的时间,也把有点安装困难的软件安装到了你的电脑上。对于听到 ai 编程就望而却步的,棒的就不止一点点了。当然 ai 编程嘛,也不能把它的能力举现在这里来, 我们一起做一个芝士机械超玩盲盒,咱们就都是原始谷的动画了。那我们呢,现在在这里选择好它原始的位置,先点击这个加号,那最上面的这个呢,就是我们上传文件, ppt, excel 图片,我们也想让它们进入到这个转化里, 就在这里上传,和我们直接拖拽是一个效果。那中间这个计划模式,在这个模式下呢,他不会立刻来改动我们的文件,而是先帮我列出一个详细的计划,就比较适合复杂项目,或者是你还没有思路的情况。 那右边这里呢,是用来更换模型的,我觉得五点五还是比较好用的,这里呢我就不更换,还有对应的推理强度,也可以在这里去更改。那我现在告诉他我的一些具体要求, 如果你有了一定的构思之后,也可以一起告诉他,当然如果没有的话,直接给他说我们最后想要一个什么效果,他呢也会一步步的引导我们来做出最后的成品,好开始帮我们来构思整个架构了。 哎,他现在问我盲盒系列规模要按照什么来设计?规模怎么搭配?那我们把鼠标放到这个小符号的上面,也会有个更详尽的一个介绍。好,那我在这里选择第一个, 他现在呢还是用这种选择方式来一步步引导我们表达出我们想要的东西,那我们顺着他的想法来就好了。那都选好之后呢,他也给了我一个整体的框架,我大概看了一下还是不错的,那觉得 ok 了,我们就可以让他开始执行,当然我们有需要更改地方,我们直接在这里提出要求就好了,那我们现在同意执行。 ok, 他 现在也在运行中了,在这个思考的过程中呢,我突然想起来,我想让他滑动的时候有一个光效,那我直接在这里提出我的要求。 哎,他现在啊根本就没有办法发出去,而是在这个地方排着这个情况呢,他会在这个任务完成之后再来执行我们现在的这个任务,但是不行啊,我现在就让他考虑到这个要求,并且加进去,那我就点击这里的这个按钮,他呢就插队到了当前的这个任务中, 而路由思呢也会考虑到我们这个要求继续执行,这就是一个插队的小技巧了。好,他现在说呢是可以了,我们先不着急,我们把鼠标放到这个小圆圈上,我们就能观察到我们这个窗口一共用了百分之几。路由思在快满的时候呢,它也会自动的来进行压缩上下文,但因为上下文太多的话,路由思就会表现的不那么聪明了, 那我们就可以手动的来进行压缩,在这里我们打斜杠压缩就好了,他呢就会把上面的聊天记录进行精简,但更细节的东西呢,他也就会不再记录了。 ok, 我 们来看一下我们刚才生成的这小网站,这个例子动销交互界面 还是不错的,那如何实现多任务并行进行呢?那我在本地选择一个项目文件里面呢,有往期的图片还有视频,在这里输入我的要求,把里面按照类别给我分类。好, 那我们再开一个,我要这个把文件里的图片和视频根据内容说明,你再来一个吧,把视频分离出来,音频, ok, 你 看他们在这里努力的转圈圈,我们来看一下结果,这个类别是分为好的,这里是视频的,还有图片的。不得不说啊,他这个名字和内容还起的挺相符的,所以说这里呢,他的每次对话都是独立的,不会再与其他的工作内容产生深度的关联,但都会有权限查看当前的文件夹内容。 到这里我们日常使用是 ok 的 了。更进阶一点的呢,就是扣带斯的插件技能 m c p 这三个词就是小白最大的路虎了,其实一句话就能解释清楚, 插件呢,就是给扣带斯装了一个能力包,比如装了表格插件,它呢就会处理 excel。 而技能 skill 大家都很熟悉了,就是一套固定的工作流程,可以根据我自己的风格来写一篇技术教程。 m c p 就是 连接外部的通用通道,比如我要用扣带斯做一个这样的效果,通过自然语言创建动画视频的技能。包好,我先给他一个文件夹, 然后把要求现在都给他,如果你有想要的效果,那我们就点击这里上传,然后把参考一并发给他。 ok, 他 现在呢是开始工作了, 里面需要的什么依赖啊,组建都不需要,我们再去手动的去添加,他呢都会帮助我们去一步步的完成。好,他现在运行完毕了,我们打开这个呢,是 windows 默认的浏览器浏览一下, 你在这里可以随意的来调节这个动画了,因为在一开始的时候,我提示词中已经提到了提供可以配置的参数项,那我们调节一下。 ok, 我 们关掉背景,那想要这种透明的效果呢?参数的配置是这些,那我们最后给他宣传好就 ok 了。 个人建议,一开始呢,什么插件我们都不要慌,先用它内置能力,等你明确知道了我需要库代词,去安装某个工具能力的时候, 再去插件页寻找也是来得及的,大家有兴趣的我们可以单独出一期,详细聊一聊。说了这么多,其实你也发现了, ai 现在就不只是答疑解惑的工 具了,它呢挑出了一个被动执行的命令曲线,是可以理解你的意图,帮助你完成复杂任务的智能伙伴。而每次操作呢,也成为了我们学习、创新和突破的机会。好了,喜欢这种内容的朋友呢,我们下次见。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

codex 到底是什么?它到底能干嘛?到底什么样的人才会用到它?不是程序员到底能不能用?不会写代码到底能不能用?本来呢,昨天我想出一个基础教程,结果没发出去,现在呢,我就简单口述一下。 首先我要说一下,不一定非得要用 codex, 我 说 codex 就是 指 codex 这一类工具,其实还有很多种工具,比如说像最近开源界比较火的 open code, 像字节出品的 tree, 还有像 carson 等等等等都可以。我只是拿 codex 举个例子,那 codex 到底是什么呢? codex 一 句话总结就是它是 gpt 的 亲兄弟, gpt 呢,就是用来聊天的,而 codex 呢,就是用来干活的。它能干什么活呢?现在能干的活非常多,如果你现在还花大量的时间去做 ppt, 你 现在就可以把这些任务丢给它。现在 ai 做 ppt 能力已经非常强了,我之前做过一次测评, ai 现在直出的 ppt, 简单修改一下,基本上就能够汇报,它还可以帮你做视频,其实我的很多视频都是 koex 或者是 cloud code 帮我做的。 koex 现在能帮我省掉很多剪辑工作,比如说你的电脑驱动坏了,你不知道怎么修,你现在就可以让 koex 帮你修一下,你还可以让 koex 做一个个性化的简报, 如果你真的有想法,你还可以做一个网站,做一个 app。 我 上面说的都是 koex 能力的冰山一角。那 koex 适合什么样的人群? 会写代码?到底能不能用 codex? 很多人以为啊, codex 这类软件就是一个非常专业的软件,这可能是最大的误解之一,你可以问一下你周边程序员的朋友,看看他们现在还写不写代码。今天刚刚刷到谷歌帝麦的研究员姚顺宇的播客, 他说现在大部分项目都不用写代码了,全部都在用 ai coding。 更主要的是像 codex 这类工具,它的使用难度绝对不会比豆包高,当年我学 cad 画图还学了好几个月,才能勉勉强强上手。 而现在的 ai coding 软件,基本上几天的时间就能够学会,最重要的是它不是一个很枯燥的软件。很多人开始 ai coding 之后,它现在连游戏都不玩了, 每天都在等着额度恢复,因为它很容易让你有一个 builder 的 感觉。 codex 其实它的能力跟它的竞争对手 cloud code 还是有一定距离的。 cloud 它更像是一个谋士,在你不知道干什么的时候,它会帮你出主意,而当你确定了想要干什么的时候,并且做好这些规划的时候, codex 就 会派上用场了。它更像是一个总经理,它会帮你认真的完成这些工作,所以两者要结合起来用。