一定要,一定要想尽一切办法用上 codex, 至少我不允许我的粉丝还没有用上 codex 或者 cloud code。 如果你跟你做互联网的朋友从来没有谈论过 codex、 cloud code 或者 gmail, 那 恭喜你,你刷到这条视频,可能就是你改变命运的机会。那有人问 codex 到底是什么东西呢?官方给他的定义就是 gpt 下面的一个编程助手。 但是如果你真的这么理解,那你太小看他了。黄仁勋现在让殷伟大所有的员工都要使用 codex, 这可是全球市值最高公司的老板都要让他的员工使用他,那为什么呢?因为他就是未来的财富密码。 你最近看了那么多新闻,什么纳斯达克又创新高了,航空股市又涨疯了,存储芯片又缺货了,这么多乱七八糟的芯片,其实都在讲述同样一个故事, 而这个故事的源头呢,就是因为这几个东西。 cloud code 对 于大部分人来说门槛还是有点高的,机密的体验呢,我觉得还不是特别友好。而如果你三个月前问我扣 dax, 我 可能还会犹豫,但是这三个月以来,它几乎每天都在更新,甚至有段时间天天都在更新。 到现在扣 dax 的 能力啊,真的很爆了,它就是目前最适合普通人上手的 ai 工具了。如果你现在是大学生或者二十多岁,那你太幸运了, 你刚刚进入社会,就迎来了一个弯道超车的机会,它就像是你在食堂打饭排队的时候,突然在旁边开了一个新的窗口,这个时候你最应该做的就是赶快跑到新窗口去打饭。
粉丝64获赞258

这条视频讲 codex a subagent, 小 白也能听懂的版本。它不是一个新软件,也不是神秘功能,而是 codex 处理复杂任务的一种用法, 你会看到它什么时候该用,什么时候别用,以及怎么用它。 review 一个真实项目,先给 subagent 下一个最朴素的定义。一个复杂任务,你可以让 codex 拆成几块,分别交给几个子代理并行处理。 每个子代理跑在自己的 agent thread 里,最后只把结论交回主线成汇总。官方术语听起来会正式一点。 sub agent workflow 指同时跑多个并行代理在汇总。 sub agent 是 被派出去做某件事的代理, agent, thread 则是每个代理自己的线程,你可以在 cli 里查看和切换。 sub agent 主要解决两件事,第一, context 被污染,读文件跑命令看报错,猜原因,全塞进主线城,后面判断就容易乱。 第二,该病型的事被串行,做安全测试风格可维护性本来可以同时看,却被一个代理从头查到尾。判断要不要开 sub agent。 可以 先问一个问题,任务能不能拆成几块?互不依赖的小事, 能拆就适合试,拆不开就别硬上。任务很小,子任务紧咬在一起,写入范围重叠,或者你自己都还没想清楚怎么拆,这些情况开了反而添乱。不适合的情况也要记住,任务本身很小,没必要开多个代理。 几个子任务互相咬的很紧,并行也不省时间。最危险的是多个代理同时改同一篇文件,这时候省下来的时间很可能被冲突和反攻吃掉。 真正适合练手的场景大多是 rate heavy, 比如大型代码库探索 pr, 多维 review 几个 bug 方向, b 型排查,长文档和长日制分块分析。官方也建议新手起步时先选探索测试、 treeash 和总结这类任务。 codex 默认不会主动开 sub agent, 你 要在 prompt 里讲清楚。常见说法包括 spawn two agents, delegate this work in parallel use one agent per point。 中文直接说启动三个 sub agent, 分 别检查安全测试和可维护性也可以。如果拿来 review pr, 可以 直接用这个模板,一个 sub agent 检查潜在 bug, 一个检查测试覆盖,一个检查代码质量和可维护性, 最后要求主线程等三个都完成后再输出高风险、中风险可选优化,以及建议优先修什么。 这个模板真正值钱的不是文字本身,而是里面的控制点。每个子代理的职责不重叠,避免大家都泛泛 review 一 遍,明确等全部完成再汇总,可以避免主代理拿着半成品就下结论。最后加一句,优先修什么,可以把排序工作也交给主县城。 接下来用 ship ready 这个小项目做例子,它是一个 s s landing page audit 的 mvp, 后端 api 在 s r c app 点 js, 审计规则和 rewrite 在 s r c audit 点 js, 存储是 s r c store 点 js, 前端是 publ i c 斜杠 app 点 js。 代码量不大,正好适合演示怎么稳妥的开 sub agent。 在这个项目里,最稳的开法不是让三个 agent 一 起改代码,而是启动三个 read only sub agent runtime risk agent 看运行风险 q a coverage agent 看测试缺口, architecture agent 看模块边界, 所有子弹里都不要改文件,等全部完成后,主线程再决定要不要修。三个结论里, round time risk agent 最有价值。他发现 handle request 里 in sync 路由没有 await, 外层 try catch 接不住 a sync handler 抛出的错。 这种 bug 在 happy pass 测试里不容易暴露,但线上可能表现成请求挂住或者 unhandle rejection qa coverage agent 的 结论也很实用。 他没有泛泛说测试不够,而是列出 invalid json 未付费 share 过早 follow up。 若 brief 绕过 rewrite 这些副路径, 这些用力不一定都要立刻补,但摆在面前,主县城就能快速挑出最该锁住的状态流。 architecture agent 的 结论最容易让人冲动, 他说 src app 点 js 可以 拆成 page extract checks brief 和 rewrite 几块 判断没错,但这次目标是写测试加修 bug, 不是 重构 auditing, 所以 这部分建议最后先记下来,不立刻动。三个 sub agent 的 优先级其实不一样, round time risks 想让你先修服务端 qa coverage 想让你先补测试, architecture 想让你先理边界。主县城不能给三票打平均分,而是要挑确定性高、改动小、能被测试所注的事情先做,最后真正落地的改动其实很克制, 异步路由统一加 await, 让外层错误处理生效。 rewrite 必须 brief ready 才能解锁, follow up 增加还没提交 brief 和非法字段校验。 read json 加 body size 限制 invalid json 返回四百,最后补 note test 回归测试。 这个案例最有意思的一课是两个代理的结论拼在了一起, round time risk agent 告诉你哪里坏了。 q a coverage agent 告诉你怎么用副路径测试把它锁住, 这就是 sub agent 真正的价值,不是替主线城做决定,而是把几个方向的结论同时端上桌。跑起来之后也要会管理 agent thread codex c l i 里可以用 slash agent 查看和切换线程,如果某个子任务偏离方向,可以让 codex 停掉那个负责性能分析的 sub agent 跑完的线程,也可以让它关闭已经完成的 agent threads。 给新手的练手顺序,不建议一上来就五个 agent 一 起改权。项目先并行阅读,让多个 sub agent 各自理解不同模块,再并行 review, 把 bug 安全测试,可维护性分头看。 第三步是单写,多审一个代理或主线成改代码,其他子代理做 review, 最后才是小范围并行修改。 下一次让 codex review pr, 你 可以直接从这个短 prompt 开始。请使用三个 sub agent 并行检查,当前 pr, 一个看 bug, 一个,看测试一个看可维护性, 等全部完成后,按风险等级汇总给我。就这几句话,已经够你完成第一次 sub agent 练习。 最后记住, sub agent 不是 替主线城做决定,他真正干的活是把几个方向的判断同时端到桌面上,让主线城更快做取舍。新手先从 rate heavy 的 探索和 review 开始,等你能清楚拆分任务,再尝试让多个代理并行改代码。

欢迎来到这期的讲解,今天咱们要聊点颠覆认知的,彻底改变一下你对人工智能的传统看法,忘掉那个只会一问一答干巴巴的聊天框吧。今天我们要看看怎么把 ai 变成你手底下最靠谱最拼命的虚拟实习生。 咱们先实话实说啊,回想一下你每天的上班时间,到底有多少是被那些无脑的搬砖活给撤掉的?比如积极枯燥的数据录入在好几个表格,或者对着同一个按钮点上几百次, 是不是想想就觉得特别心累?那么咱们直接进入第一部分 ai 的 进化,咱们看看它是怎么从一个副驾驶变成咱们的全能员工的。 咱们来看这个非常有意思的对比。以前大家用的 ai, 比如 copilot, 其实就像是个坐在副驾驶的教练,你累的半死地握着方向盘,它在旁边不停地给你提建议,说风凉话。 但是现在的 kolex 呢?它完成了一次巨大的范式转变,它是一位真正的虚拟员工,直接帮你接管方向盘,帮你把活干完。而你这个指挥官只需要舒舒服服地坐在后排,审查一下最终结果就行了。 所以千万别误会,你绝对不需要懂任何敲代码的技术就能用它,它不仅是个搜索引擎,也绝对不是程序员的专属玩具。你只需要用平时说话的大白话告诉他你的目的地在哪,他自己就会动脑筋规划出一条路走过去。 接下来是第二部分,也是今天的重头戏,这小助手到底能干吗?咱们来揭秘一下他的自动化能力。 重点来了,他到底是怎么替你干活的?这就得说到他一个神仙级的功能电脑操作。 用大白话来讲啊,这就像是你电脑里住进了一个隐形的田螺姑娘,她可以真真切切地看懂你的电脑屏幕,然后像个真人一样去挪动你的鼠标,精准地点击窗口按钮,甚至模拟人类在键盘上噼里啪啦的敲字。不管是切换窗口,还是用剪贴板复制人贴,它全都能代替你的双手去完成。 而且最绝的是什么呢?无论你是用 mac 系统还是 chrome 浏览器,他干这些活全都是在后台静悄悄进行的。也就是说,你可以继续一边看网页,一边写文档。他在后台帮你干他的,绝不会突然弹出来打断你的思路,完全不抢你当前的屏幕焦点。 进入第三部分,咱们来看看有了这个能力,怎么帮你彻底告别复制粘贴,变成全自动日常办公神器。 试想一下,如果老板让你从网页上手动抠五百行数据到 excel 里,是不是想想就头大?现在呢,你只要像屎丸小弟一样,用大白话下一道命令,嘿,帮我提取一下数据, 刚才提到的隐形小助手马上就会接管。他自己去移动鼠标框选数据,按下复制,然后自己打开 excel 表格,把数据格式调得漂漂亮亮的粘贴进去,全自动一气呵成。 当然了,他的本事可不止填表格,日常那些特别繁琐的琐事他都能包圆。比如代替你一行行去填那些枯燥无味的网页表单,或者把工作群里乱糟糟的聊天记录,自动给你整理成一条条清晰的任务。 甚至他还能看懂设计图,直接帮你写出网页代码,或者干脆根据你给的大纲,直接啪的一下给你自动做好一套精美的 ppt。 看到屏幕上这个数字,二十四了吗?对,没错,二十四! 它的自动化功能,意味着你雇佣的这位虚拟员工,是真正意义上每天二十四小时连轴转的。晚上你大可以安心去睡觉。而你的这位好帮手呢,会在漫漫长夜里帮你盯着系统的数据大盘,把昨天积压的各种小毛病 bug 分 门别类整理好,默默优化你的工作流, 等你第二天早上睡到自然醒。泡好咖啡,来到电脑前,一份清晰完整的总结报告已经乖乖躺在你的桌面上了, 简直了对吧?那么第四部分,咱们对号入座一下,到底谁最需要这个帮手?他能怎么解决不同岗位的痛点? 你可能会想,这玩意儿对我这行有用吗?其实不管你是干什么岗位的,他都能精准地帮到你。如果你是个销售,每天对着 crm 系统挨个录入客户状态,点得头晕眼花,现在交给他,他替你自动点击登录、打字录入。如果你是个苦逼的运营,天天被一堆杂乱的数据折磨,他能帮你自动提取、清洗、排版。 如果你是个初级程序员,天天跑测试、修 bug, 那 他就是你专属的除虫小弟。发现没有,他对任何胡柳技术背景的小白都极度友好。 哎,那如果你本来就是个懂点技术的程序员呢?他还有个叫 worktree, 也就是工作树的傻手脚儿 们。传统干活只能一件一件按顺序来,干完 a 再干 b。 但现在你可以同时召唤出好几个 ai 小 助手,他们能在同一个项目的不同分支上,同时在那啪啦啪啦敲代码,互相完全不打架,最后还能奇迹般的把工作成果自动合并在一起,这工作效率绝对是开挂级别的。 接下来进入第五部分,咱们也得客观一点,网上现在传的很神的一句话就能做个游戏,到底是真是假?咱们来个现实大揭秘。 其实啊,现实情况稍微有点骨感,并没有网上传的那么神,他确实能瞬间给你画出好看的图片素材,搭出个游戏的基础代码,但这顶多也就占了整个工程六十百分之的基础工作, 剩下四十百分之的关于游戏的打击感好不好玩,界面细节的微调,这些依然需要你这个人类亲自上手去打磨,才能搞出一个百分之百完美的作品。 但是咱们算笔账啊,以前你想做这么个游戏原型,得花大价钱请个开发工程师,吭哧吭哧搞上整整一个月吧。现在有了它打底,你只需要花短短一个小时就能把基础流程跑通,从一个月压缩到一个小时,这可是整整十倍以上的效率提升,绝对是一个不可思议的跨越了。 最后第六部分,也就是今天我想给大家传递的最核心的理念,你来指挥他来执行。这个虚拟员工给你带来的最核心的价值,其实是一场职场身份的巨大转变,把你从一个埋头苦干的执行者,把高成了一个统筹全局的决策者。 当你把那些枯燥的像机器一样重复的电脑操作全都甩给 ai 去执行之后,你在公司的价值就不再取决于你手速有多快,能不能一天复制粘贴完一千个表格了,而是取决于你做出的战略判断到底有多精准。 所以聊到这儿,我想问问屏幕前的你,既然懂了这些,你准备好坐上指挥官的位子,去雇佣你人生中第一位全能的虚拟 ai 实习生了吗?你的第一道命令又打算让他替你干点什么呢?好好想想吧,咱们下期讲解,再见!

今天我们聊一下 codex 这一个月更新的八个新玩法。我以前一直觉得 codex 是 个备胎,去年四月, codex c l i 刚出来那会儿, 我用了两天就回去用 cloud code 了。理由很简单, codex 当时就是个会写代码的终端 agent, 跟 cloud code 的 比没什么区别,模型还稍微弱一点。直到四月十六日那天, openai 发了一条公告,标题叫 codex for almost everything, 意思是 codex 不 再只是写代码的 agent。 先说最离谱的那一项, computer use codex 现在能看你屏幕,点你 ui, 用它自己的光标在你电脑上打字,授权之后,它可以操作你电脑上的桌面 app。 我 第一次让它做的活是把这个 figma 设计稿里的色值抓出来,写到 tailwind config 里,它打开 figma 截屏识图写入全程,我没动鼠标 这类跨 app 的 活, cloud code 作为 c l i agent, 很 难直接做 codex 这一步直接跨出了终端,代价是你给他的权限是整台电脑,不是某个项目目录, 心智压力比 cloud code 大 一个量级。跟 computer use 配套的还有一个内置浏览器。最有意思的设计是,你可以在网页上直接评论,把这个 comment 当成指令丢给 agent, 就像在 google docs 上选中一段文字加评论一样,但被评论的是网页 dom。 举个例子,你打开本地预览页,选中一个按钮,评论一句,这个按钮状态太弱,改成更明显的 primary action。 完了, 这种指着浏览器跟 agent 的 说话的交互,比 cloud code 走 mcp 接 api 那 套直觉多了。普通人不用懂什么是 api, 但真正让我有点恍惚的是, automations 是 一个持续任务系统,你给 agent 的 一个长期目标,它可以附用原来的对话上下文, 按计划自动唤醒继续做。 openai 的 原话是 potentially across days or weeks。 比如你可以把任务写成每天监控这个开源项目的 issue, 每出现一个跟性能相关的,就帮我整理背景,附线路径和可能的修复方向。它每天自己醒一次,自己扫,结果放到队列里等你看。这开始有点接近让 agent 接长期任务了。然后是 pets, 五月一日左右上线的,是这个月 codex 最初圈的更新。你输入 slash pet 就 能召唤一只虚拟宠物,浮在屏幕上做状态指示器, 它告诉你 codex 现在在跑什么任务,是不是在等你输入,是不是做完了八只内置宠物可以选。还有一个 slash hatch, 可以 让 ai 生成自定义宠物。这设计妙在,它解决了一个我们都默默忍受的问题。 agent 在 后台跑唱任务的时候,你不知道它现在到哪了。以前要么切终端,要么挂个第二屏幕,现在屏幕上一直有只小猫,它的姿势就是状态,但是区域限制要分清。 open 官方明确说 computer use 初期不再 ee a u k 瑞士开放 pass 这块我没核到同等强度的官方说明。所以如果你人在欧洲,并不是所有 codex 新功能都能立马可用。第二,自定义宠物的画风偶尔会翻车。社区里已经有人把 clippy 动漫角色,各种像素小人都做出来了。好看的是真好看,怪的也是真怪。 但一个虚拟宠物功能能被开发者认真讨论,你就知道它戳到了什么。剩下几样我快点过。五月十四日, codex 进了 chat gpt 手机 app, 准确说是手机端可以远程接入正在运行 codex 的 mac host。 你 在地铁上,在咖啡馆, 可以用手机继续控制回答问题,批准操作,看 df 和测试结果。但电脑那边要保持在线, codex 也要再跑,这事跟 automations 配在一起威力很大。早上出门前交代一个长期任务,路上用手机补两句判断, 回家再看结果。这里要修正一下。 cloud code 也有 remote control, 可以 从 cloud app 或 cloud 网页端继续本机绘画。区别不在有没有手机入口, 而在 codex 把入口放进 chat gpt app 这条产品线里。四月十六日那波还顺手加了九十多个插件, atlanta rover, circle shape code, rabbit, github issues、 microsoft suite 都在里面。 cloud code 走 mcp 也能接,但要自己配。 serverch。 codex 这边是点一下装好的体验,底层也换了。四月二十三日, openai 发布 gpt 五点五,并明确说它正在进入 chatttt 和 codex。 官方说法是 gpt 五点五在同类 codex 任务上更强,也更省 token。 它还跑在 nvidia gb 两百和 gb 三百 n v l 七十二系统上。具体到比 cloud code 省多少,社区里说法很多,我没看到一个能直接当结论引用的统一数字,但我自己的体感是,同样跑长任务, codex 的 成本焦虑确实小不少, cloud code 也没掉队。 antropica 四月十六日发布 opus 四点七 s w e bench verified 报道,百分之八十七点六。 open i 这边 gpt 五点五的 terminal 奔驰二点零是百分之八十二点七, cloud opus 四点七是百分之六十九点四。 这些 benchmark 口径不完全一样,不能简单等同于 codex 工具,打败 codecode 的 工具。我现在更愿意把它理解成 codex, 在 长任务跨 app 成本和可用性上进攻很猛。 cloudcode 在 严肃代码质量和复杂重构上仍然很有竞争力。 dv 上有篇社区余情整理,看了五百多条 reddit 评论和一些盲测,结果给了一个挺贴脸的说法, cloudcode 是 高质量但不好用, codex 是 稍低质量但真的可用。这不是严格抽样调研,但它很像最近很多开发者的体感社区。现在很常见的一种用法是 codex for keystroke, coded code for commits。 日常输入用 codex 跑得快又省心。关键提交 code review, 复杂重构,切回 code code 求质量。 甚至有人把同一套 skill 同时喂给两边。聊完功能再退一步看,会发现一件挺有意思的事儿。 cloud code 这一个月在生化, harness 做插件 hack worktree 和 deny rules 把自己往 o s like 做, codex 则跨出代码边界做 computer use, 内置浏览器 automations, 手机入口和虚拟宠物,把自己做成 digital co worker。 一个想做你的操作系统,一个想做你的同事。两条路都对,但两条路真的不一样了。

今天给大家分享一下 cloud 和 codex 最近都在推出的这种构模式,我会用一个实际的例子给大家展示一下,在一个真实的业务场景下面,我们不用构模式和我们用 cloud 的 构模式以及跟 codex 的 构模式产出的一个结果的质量的差异, 以及我也会说一下这个购模式比较适合什么样的场景去使用,它的效果是比较好的,希望对大家有帮助。我这里举的一个实际的业务 case 是 我有一个电商的朋友,他最近找我想让我帮他做一个电商里面的选品工具,然后他给了我一个获盘表,就是这个腾讯的一个 文档表格啊,给大家看一下它长什么样子。其实就是一个啊,供应商常用的一种货盘模板吧,就是图片、款号、颜色、码数、价格、性能等等啊,有几百个产品把它放在了一个货盘表里面,但是这个表格它是一个只读文档,所以其实我没有办法导出这个 文档,然后直接交给 agent 帮我去做一些事情。那么我其实要做的第一件事情就是把这个货盘变成我本地的一个一份格式化的文件。最开始我还是习惯性的用这个 cloud 帮我去做, 但是做的过程中我就发现他绕了很大的圈子,首先一开始他用这个 open c l i 去做,我就觉得不是很合适,所以中途我就打断了,跟他说这个东西应该不需要 open c l i, 是 不是可以直接采集过来, 然后他就去调研了一堆 api 的 东西,后面绕着绕着他又绕回去用 open c o r。 那 我觉得我这个场景其实是比较适合构这个模式的,因为我觉得它的输出是比较确定的,它的解决方案我觉得也是 ai 自己就能够完成的,应该不太需要我我的介入。 因为理论上你只要拿到腾讯文档的这个表格结构,然后按照格式化的把图片啊,款号啊、价格那些信息采集下来,录一份这个 c s v 的 文件,然后把图片下载下来,放到我本地,其实这个事情就完成了。它的实现过程我觉得应该也是比较简单的啊,直接通过脚本其实就能完成了, 所以我就尝试了一下。一开始我是用的这个 cloud 的 购物模式,然后这里的话,其实我就会发现它的质量其实会高比较多啊。它没有用这个 openclr, 也没有再去用什么 api, 而是去逆向逆向了这个腾讯文档,然后拿到了这个结果,但是他只拿到了一百一十六个产品,但实际上这个表格里面是有两百三十款左右的产品的。最终他用了二十分钟跟我说这个任务完成了,但其实他拿到的结果是不太对的。 同一时间我也用这个 codex 啊设定了一个目标,帮我去完成这个目标,经过二十二分钟的一个时间,它就顺利完成了,并且产出的质量非常的高,不管是款式的数量,还是图片的数量,以及整个交付的这个结果,完全就是一个我想要的结果。 那其实二二十二分钟可能看起来很长,但是其实在这个过程中完全不需要我的干预啊,在这个过程中我还一直在一个 再跟这边的 cloud 去聊到底是应该怎么去做,然后啊回过头看,发现 codex 已经把这个事情直接完成了 啊。所以说像这个 go 这个模式,我觉得啊,总体体验上,我觉得 codex 的 能力, 它交付的质量是要比 cloud 的 质量要好很多的。其次的话就是构模式比较适合的是这种编码型任务,代码型任务它就输出一些脚本,输出一些代码文件,然后帮你去完成一个事情,那么就要求你给出的这个任务,它一定要是比较有确定性结果的, 就相当于在这个过程中就不太需要人工的去做干预,那么这种任务就会比较适合用构模式去实现。在这个过程中无论他花多少时间,但是他其实不需要我们人去做干预,那其实他不用占用我们的时间精力,我们只需要隔一段时间来检查一下他是否完成了就可以了。 这里其实还有一个非常实用和方便的小技巧,就是当这个 go 完成目标之后啊,我们检查这个产出的结果是符合我们的预期的,那我们其实就可以直接在这里调用 skill creator 啊,把它刚刚完成的这一套流程封装成一个 skill, 那么后续我们需要再用这个流程的时候,就可以直接调用这个 skill 来完成,那下一次它就不用再用二十二分钟,可可能两三分钟它就可以把这个结果产出给我们了。如果大家还没有用过这个构模式的话,我真的非常推荐大家去 啊,用 codex 的 这个 go 模式去处理一些你在日常工作中比较确定性的编码型的脚本型的任务,那么怎么去使用?其实也非常简单,就是在今天 codex 的 版本里面,如果大家更新了的话,就会看到这个加号里面会有一个追求目标的 这个按钮,如果我们在对话里面开启的话,在这里直接输入你的目标,然后发送消息的话,那么这个对话就进入了一个 go 模式,它就不需要你去参与,最终会直接把你需要的这个结果产出给你,非常推荐大家去试一下。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

你有没有遇到过这种情况,写代码时卡在一个函数上,翻来覆去查文档,或者想实现一个功能,知道逻辑,但懒得写细节。如果有一个 ai, 你 告诉他帮我写一个读取 csv 文件的函数,它就自动生成代码,是不是很爽?这就是 codex。 codex 是 open ai 开发的一个 ai 模型,它专门针对代码进行了训练,能理解自然语言描述。自动生成代码,你可以把它想象成一个懂代码的助理。你说需求它写代码,你不需要记住所有语法细节,只需要描述清楚你要什么。这一系列,我们从零开始。 codex 是 什么,怎么装,怎么用, 怎么把它变成你的编程搭档。无论你是专业开发者,还是刚学编程的新手, ai 编程助手都能帮你提速。这一级,我们先搞懂概念,它不是要替代你, 而是让你更强。 ai 编程助手不是新鲜概念了, github, co pilot, co dex, cursor 这些工具已经在改变开发者的工作方式。它们不是自动编程,你不需要写一行代码, ai 帮你写整个项目还不行?它们是辅助编程,你负责高层的设计、逻辑审核, ai 负责低层的代码生成、股权重复性工作,你可以把它想象成截。对编程,你有一个搭档,你说我们来写一个排序函数,搭档立刻写出来,你觉得不对,让他改,他马上改。 ai 不 会累,不会烦,不会请假,他二十四小时在线,但你永远是驾驶员。 ai 是 副驾驶,方向盘在你手里。 ai 的 建议你可以用,也可以不用,最终决策权在你。这就是 ai 编程助手的定位,增强你, 而不是替代你。理解这一点,你就不会对 ai 产生恐惧,而是把它当成工具。 codex 有 两个主要形态,一个是 github co pilot 背后的引擎集成在 id 里。另一个是 codex c l i 命令行版本。这一系列我们主要讲 codex c l i。 codex c l i 是 什么?一个命令行工具,你打开终端, 输入 codex, 你 想让代码做什么,它就会生成对应的代码,直接显示在终端里。不需要打开 i d e。 不 需要配置复杂的编辑器插件。在任何地方,服务器、云主机甚至平板电脑,只要装了 codex cy 就 能用。它的定位是精量级终端优先,即用即走,适合三种人, 第一,喜欢用终端的开发者,不用切到浏览器查文档,终端里直接问 codex。 第二,需要快速生成代码片段的人,比如写脚本,处理数据自动化任务。第三, 想把它集成到自己的编辑器或脚本里的人。 codex c l i 可以 和其他工具配合,形成自动化工作流。 codex c l i 不是 要替代完整 ide, 而是给你一个更灵活的选择。传统代码补全和 codex 有 什么区别?传统补全,比如 ide 里的智能提示,你输入 deathget 下划线,它会提示 get 下划线 name, get 下划线 value。 它基于当前文件里已有的符号, 猜你接下来要打什么字。像一个智能输入法,你敲拼音,他猜汉字。 codex 不 一样,你输入写一个函数,从 api 获取数据,并解析 j s o n。 它生成完整的函数,包括请求异常处理, j s o n。 解析它不需要你已经有类似的函数。 传统补全像猜单词,基于已有的词汇,猜下一个字母。 codex 像写作文,给你一个题目,它写出一篇文章。传统补全帮你省打字的功夫, codex 帮你省想怎么实现的功夫。举个例子,你想写一个读取 csv 并计算平均值的函数,传统补全只能在你打出 pandas read 下划线时补全。 pandas read 下划线 csv codex, 你 输入描述它生成整个函数,包括 import pandas read 下划线 csv mean return。 两者不是替代关系,是互补。传统补全打辅助, codex 打主攻。 codex c i i 适用于哪些场景?我总结了四个。第一,快速原型。你有一个想法想快速验证,比如写一个脚本, 抓取某个网页的所有链接,你用 codex 生成代码考一下,看到结果不用花时间回应语法,查文档。第二,学习新语言。你想学 python, 但不确定怎么读文件,问 codex 用 python 读取文件,主行打印它生成代码,你看一遍就懂了,比看文档更快,更直观。第三,一次性脚本。你平时主要写 java, 今天需要处理一批 csv 文件,不想打开 i d e 建项目,就用 codex 生成一个临时 python 脚本,用完就扔。第四,代码解释,别人写了一段复杂的代码,你看不懂,贴给 codex 解释这段代码做了什么,他会用自然语言解释逻辑,适用人群很广。新手程序员学语法,写练习,老手程序员省时间写样板代码运,为工程师写自动化脚本处理数据,数据,工程师生成数据处理 cutline, 产品经理快速验证想法,不依赖开发资源。场景很多,核心只有一个,你想写代码,但不想从头写细节,用 codex c i i 工作流程非常简单。六步,第一步,你描述需求,用自然语言,越详细越好。比如写一个 python 函数, 输入是文件路径,输出是文件的行数,而不是只说统计行数。第二步, codex 理解语义, ai, 分 析你的描述,判断要生成什么类型的代码。第三步,生成代码,通常几秒钟,终端里就会出现代码。第四步, 你查看结果,检查代码是否正确,逻辑是否符合预期,如果不对,没关系。第五步,可叠代修改,你可以说不对,要跳过空行, codex 会基于对话历史重新生成。第六步,采用或修改代码,满意了,复制到你的编辑器里,或者手动微调一下整个流程的核心,你不是在写代码,而是在指挥 ai 写代码。 你的角色从打字员变成了产品经理。你描述需求, ai 实现,这不意味着你不会写代码了。相反,你需要更清晰地表达逻辑,更准确地判断代码质量。这是一项新技能提示词工程,来一个真实案例。你需要在项目里验证邮箱格式,传统做法, 回忆正则表达式语法,查文档,写代码测试用 codex, 你 在终端输入 codex, 写一个函数,输入邮箱地址,验证格式是否正确,返回 true, false。 几秒钟后, codex 输出 python import read def validate 下划线 email email pattern 等于二,反斜杠 w 反斜杠加 f 反斜杠 w 反斜杠加反斜杠,反斜杠 w 加美元 return rematch pattern email is not none。 它自动导入了瑞模块,它写了正则表达式,大部分人不愿意自己写,它返回不耳直,你不需要知道正则表达式怎么写,你只需要说验证邮箱格式,你可以进一步迭代,如果邮箱为空,返回 false, codex 会在刚才的基础上修改。这就是 ai 编程助手的威力, 描述意图,它处理细节不是说你不用学正则表达式了,而是你不用每次都用。把重复性、样板式的代码交给 codex, 你 把精力留给更重要的逻辑。怎么从零开始上手 codex c l i 五步学习路径 第一步,了解概念,你已经快完成了,理解 codex 是 什么,能做什么,不能做什么,这是最重要的一步,不会用错工具。第二步,安装配置 java js 环境,用 npm 安装 codex c l i 配置 api 密钥,这个我们下一集会手把手教。第三步,基础使用,学会最简单的命令 codex 你 的问题, 尝试生成简单代码,感受一下。第四步,提示词优化,你会发现描述越详细,代码质量越高。比如写一个排序函数和写一个快速排序函数,输入列表,返回新列表,后者结果更准确,提示词是一门新学问。第五步,集成工作流,把 codex 集成到你日常使用的工具里,比如 vein 插件 vs code 扩展,或者自己写脚本调用。整个学习路径从零到会用不到一小时,比学一门新语言快多了,因为 codex 的 接口是自然语言,你已经在用了。这套视频会带你走完前四步。第五步,靠自己探索 也不难。 codex c l i 的 环境要求高吗?不高,硬件方面极低,你能看这个视频的电脑就够了。 codex c l i 本身不运行 ai 模型,模型在 open ai 的 服务器上,你的电脑只负责发送请求,接收结果,不需要 gpu, 不 需要大量内存,不需要高端 cpu。 软件方面, 第一, node js 十六或更高版本,去 node js 点 org 下载安装,装完后终端输入 node v, 看到版本号就行。第二, npm, 装 node js 时自动带上的 apmv 检查。第三, openai api 密钥,你需要注册 openai 账号,绑定支付方式,生成 api 密钥,这个下一集会详细讲。第四,终端, mac 用 terminal, windows 用 power shell 或 cmd 用 bash, 你 已经有了总结,你能上网,能装 node js, 就能用 codex c l i, 不 需要折腾派送环境,不需要配置 g p u 驱动,不需要买新电脑,门槛极低,事实不亏。快速回顾这一集,第一, ai 编程助手概念,人机写作,你负责设计, ai 负责实现。第二, codex c l i 定位,终端里的编程副驾驶,轻量灵活,即用即走。第三,与传统补全对比,传统补全猜下一个字, codex 听需求写作文。第四,试用场景,快速原型,学新语言,一次性脚本代码解释,新手老手都能用。第五,工作流程描述需求, ai 生成,你审核迭代,采纳,你是产品经理, ai 是 程序员。第六,案例展示,一句话,生成邮箱验证函数,待正则表达式和导入。第七,学习路径,五步,从零到上手不到一小时。第八, 环境要求,能联网的电脑加 node js, 加 a p r 密钥,你现在知道了 codex 是 什么,能做什么,为什么需要它,它不是要替代你,你的判断力、架构能力、业务理解,这些 ai 暂时替代不了,但 ai 可以 帮你省去繁琐的细节,让你专注于更高价值的事情,我们下期见。

上个视频评论区有粉丝教我做一个详细的教程, ok, 安排用国产模型,而且要使用完整的 codex 功能,就要解决 api 代理和 codex 的 插件功能,这两个小工具就是解决这个问题的,他们都是的开源项目。 好了,安装 codex 加加,安装好以后会弹出一个命令行,不要紧张,按一回车就安装好了。接下来安装 echobird, 安装好了,打开它,在模型中心配置模型。以 deepsafe 为例,打开 deepsafe 官网,点右边的 api 开放平台,进去以后,先申请一个 api key 复制下来,再到接口文档里把 uio 和模型名记下来,转到 excel 这里配置好,这就全部搞定了。 启动的时候要注意一个问题,就是先打开 codex 加加,再用 excel 版的启动 codex, 不要用 codex 原声软件启动。这么详细的教程,快去点这里关注起来,下期不迷路!

接触我 codex 两周多,花了差不多六亿 token 啊,我一开始我也不会用 codex, 我 就是把它当成了一个更强的搜索框啊,什么都问,报错了问概念不懂问啊,脑子里有一个特别模糊的想法啊,就直接扔给他啊,就是 token 哗哗的烧, 呃,但我烧着烧着慢慢发现一个事儿,就 codex, 它就像我一个外界大脑一样,还是超级升级版的, 他能把我模糊的想法清晰化、结构化,并且他给的正反馈非常及时,你就跟刷抖音一样,根本停不下来。 我这六个亿的 token 主要花在三类事情上,第一类就是学习和探索, codex 本身就怎么安装怎么用,报错怎么办啊,边界在哪,怎么协助才有效,这一部分说实话就是纯学费,而且我相信大部分人都会经历这个阶段。 第二个就是我在搭自己的 ai 内容生产系统啊,比如选择题口播稿、素材整理、动效思路、发布复盘,还有一些可以附用的 skill 啊,我做这个视频用的 skill 就是 靠拆解蒸馏。一个我非常喜欢的博主啊,柱子哥, 我想把做内容这个事情从每次靠灵感慢慢变成一个可以重复运行的一个流程,后面我会把这个 skill 继续完善,然后开源分享给大家。 然后第三个,因为我媳妇是律师嘛,我在尝试用 web coding 的 方式给他做一个法律数字员工啊,负责合同审查,案件材料整理啊,法律文档的结构化处理,然后后面再给他接上一个本地的知识库。 但这个现在还很早期,很多地方还是比较粗糙,但至少我看到一种可能,就 ai, 它真的可以帮一个具体的职业处理一部分重复性的工作,优化工作效率,而且因为它及时积极的正反馈,也可以弥补我行动力上的一个缺陷。 所以现在回头看,这六个亿的 token 就 一个字,值啊,你就不能只盯着说啊,花了多少 token 你 就更应该关心说啊,这些 token 有 没有帮我解决一个真实的问题 啊?有没有这个沉淀成流程啊?有没有这个变成下一次你还能继续使用的一个系统? 就如果你只是跟豆包一样啊,一问就结束,那就确实是纯消耗。但如果每一次使用都能留下来一点东西啊,属于你的东西啊,一个脚本,一个模板, 一个流程,一个知识库,或者是一个自动化步骤,那他就不是说只花偷看啊,那你是在搭自己的生产系统,我会继续在这个账号记录并分享一个零基础普通人 ai agent 的 过程啊,抓紧用,兄弟们。

很多人下载安装了 codex 之后,不知道怎么把国产大模型 deepseek v 四 pro 配置进去,今天亮哥教你一个方法,前提是你的电脑上得下载安装了 cloud code。 很多人在下载安装了 codex 之后,都遇到了两个痛点,第一个痛点是申请不到 gpt 大 模型的 api k, 导致自己用不了 codex。 第二个痛点是通过 openai 的 官网,或者说是第三方中转 申请到了 gbt 大 魔性的 ipikey, 当时一个月跑下来的话费用太高了,普通人是承受不了这个费用的。今天亮哥教你们一个方法,就是 用这个工具叫 ds 为四本地重转工具,这是我通过 cloud code 的 生成的一个工具, 你只需要在你的 cloud code 的 对话框说这样一段话,帮我生成一个工具,让我的 codex 可以 用上 deepsafe v 四大模型 啊,它就会开始工作,然后生成这么一款工具。这个工具的作用就是让你的 codex 运行在 deepsea v 四 pro 这个大模型上面,这样费用的问题也解决了,然后模型的问题也解决了,而且 deepsea v 四 pro 这个大模型的能力也不差,性价比还特别高,大家学会了吗? 这里你们要注意一个点,当这款工具生成之后,你可以让你的 cloud code, 让这款工具随机自动启动,这样每一次你的 codex 啊,都是运行在 dsp 微四大模型上面。关注亮哥!

大家好,今天我们开始讲 codex 的 入门系列,这期我会从零演示一遍 codex 如何安装,怎么打开项目,怎么让它整理资料,分析表格,最后再基于结果生成一张图片。 看完之后你基本就知道第一词应该怎么用了。很多人第一次听到 codex 会以为它只是给程序员写代码的工具,但是我觉得它真正有价值的地方远远不止写代码它。你可以把 codex 理解成一个可以围绕你电脑资料工作的一个 ai 助手。 相比于传统的这种聊天式的 ai 工具,他不是你问一句,他答一句,他可以基于你指定的文件夹去理解里面的文档、表格、截图和各种资料,然后帮你整理分析跟生成结果。 比如说你要做调研,他可以帮你整理资料,你要做计划,他可以帮你把零散的信息变成了行动目标,你可以分析表格,你可以去提炼脚本大纲,甚至生成配图等等。 所以我觉得 codex 对 于普通人也很有价值,只要你的工作经常发生在电脑上,需要处理文件资料啊,调研等等,我就觉得你应该试一下。 好,今天我们首先从安装开始。安装很简单,我们第一步需要打开 codex 的 官方网站,根据你的系统选择对应版本啊, mac 就 选 mac, windows 也可以, windows 安装过程跟普通的软件差不多,就按照提示一步一步完成就可以了。安装完成以后,打开 codex 登录你的 chat gpt 的 账号 啊,然后第一次登录的时候,他可能会让你选择主要的用途,那这我们可以看到这他是有一个工作模式,你是主要用于编程还是日常工作,这个之后都可以修改,但是如果你选择编程的话,他的回答会更技术性一点,更细节一点点。 登录之后你就来到了这个 codex 的 主界面,这个界面可以简单理解成三个区域,左边这块是这个项目跟任务列表,中间是你跟 codex 对 话的地方,右边通常会显示他正在处理的内容啊,或者可以生成的结果等等。接下来讲第一个概念叫做项目, codex 里面的项目本质上就是你对应你电脑里的一个文件夹,你选择哪个文件夹, codex 就 围绕这个文件夹里面的资料来进行工作。我这里用一个普通的例子,比如说啊,我这里可以选择添加新项目,使用现有文件夹就可以找到你自己对应的一个文件夹去作为你想工作的一个区域。 这里准备了一个很普通的例子,周末去杭州玩两天,这个文件夹里面有一些零散资料,比如说旅行笔记,想去的地方,想吃的店等等,也有一些截图、天气或者是酒店的一些路线信息。 在这个下拉菜单,这可以指定你想要的这个项目的文件夹,在这使用现有文件夹就可以指定你的工作目录,比如说我们可以简单看一下他们前 直接在这对话的形式告诉他啊,你可以查看我这个项目下面的一些文件等等。 比如说如果这我想要他帮忙整理这个文件里面的一些资料,比如说整理一个对应的杭州旅行计划, 我们可以通过语音的形式,在这有一个语音的形式,帮我整理一份杭州周末的旅行计划,内容包括目标行程安排,预算,需要提前准备的事项,以及如果下雨的备用方案等等。啊,需要 dog 的 文档,然后有图文, 对,然后就有语音的形式,在这我们可以选择它的智能的一个高低,一般来说高就足够了,然后除了这个智能,就是它的思考的一个深度, 如果是特别复杂的问题,你就可以选择超高,但它对应消耗的 token 会更多一点点,然后在这儿你可以选择对应的模型,现在最新的就是叉 gdp 五点五的这个模型,速度一般就是有标准跟快速,然后快速会一点五倍的快,但是同样的 token 数会增加。在这我们为了演示选择快速,我就开始 看,经过了这个两分二十秒,他就生成了这个文档,我们打开看一下,那就生成了一份两天两晚的旅行计划,有一个目标概,里面有图片也有表格,有对应酒店的一些住宿的建议, 以及两晚的一些价格,餐厅的一些备选,总的来说是非常全面,也非常友好。对于这种复杂文件整理的情况来说,帮我们完成了多的一个信息整理, 这也是 codex 跟普通的聊天工具最大的区别。普通的聊天工具需要在兑换框里面,你反复的复制粘贴文件,然后告诉他怎么做,他再告诉你怎么做,你可能需要去,然后你自己再去操作。但 codex 真正就是 在你指定的这个文件夹里面去读写,去生成你想要的文件,真正帮你去完成了这工作,我们可以看一下在对应的项目下面,他已经生成了这一份文档,相当于你就不需要去手动的去啊复制粘贴很多重复工作。 你可以想象一下,如果你是学生,你可以把论文资料啊,阅读笔记放到一个啊文文件夹,然后让他去生成论文。提高啊,你是做运营的,你同样也可以把这个沟通资料表格,会议记录,让他生成一个执行方案等等。销售啊,可以让他去根据你的客户资料和沟通记录进行一个跟进的计划, 所以这个就是 context 真正有用的地方,他不是给你建议,也不是告诉你怎么做,而是直接帮你去处理资料生成结果啊,这到就会极大的提高你的工作效率。 接下来我讲第二个概念,就是啊县城,就是对于同一个项目来说,你可以啊开多个县城,比如说这是这个项目本身,然后我们可以开,同时在这下面开一个新的,就叫县城,比如说分析一下,在这我想让他帮忙分析一下预算, 这样它会读写里面的一些表格啊,然后生成表格啊等等啊。同时我还想要调用这个啊, x g b t 的 那个深图模型,那么目前这个模型也是市面上深图能力最强的。 对,这样你看我们在左边就能看到转圈的,是正在运行的,然后黄蓝色的小点表示已经完成,这是帮我们那个预算的,它能够生成一个像 csv 的 一些信息,然后它也能够读取原本里面的一些信息啊,对, 让我们再看一下这个 啊,经过这个几分钟他就生成了啊,然后他就生成了一个图片,我们可以看一下效果啊,还是很不错的。就是根据我们刚才的一些旅行安排,然后生成了一个啊,非常清晰,然后也很信息量比较全面的一个旅行安排。对, 然后这个地方有一个点我也想介绍它的功能,比如说在这个工一开始的过程当中,他是尝试生成一个 svg 的 图片,然后没有调用他的,我想他调的那个工具叫 emoji 键啊,在这儿,所以我就用这个,在这个地方可以打断他,比如说用户他还在生成当中,我可以直接啊, 直接去发送,然后他就可以可以调整他的方向啊。另外大家也可以在这个设置地方可以看到自己的一个使用量,在这个地方设置 下面有个剩余用量,他这边有一个每五小时跟一周的一个限制啊。一般来说如果你是叉 g t 的 plus 账户的话,就是啊,你进行一些高强度的整理文章啊,调研啊来说,一般来说是没什么问题的啊。然后 open i 也经常时不时会重置他们的这个限制啊,所以说相比克拉扣的来说,这一点是非常好的,有点量大管饱的意思, 哎,我们回顾一下这一期,就是第一个就是首先 codex 它不只是写代码,它更像是一个可以围绕你电脑资料这么工作的一个 ai 助手。第二个是 codex 里面的一个概念就是项目,项目本质上就是你对应你你选择的一个文件夹。第三个就是同一个项目里面可以开多个县城啊,不同县城处理不同任务 啊。第四个就是啊,他可以帮你整理资料啊,分析表格,生成图片等等一些工具啊。第五个就是你怎么样去看选择模型,速度以及以及查看你的使用量等等。 这一期只是一些基本的一些概念,但是以及能够看到 codex 的 一些核心价值啊,他不只是在告诉你怎么做,而是真的去帮你去完成一项工作啊。 下一期我们会继续讲一些更进阶也更实用的功能,比如说插件呢啊,技能啊,智能浏览器辅助自动化任务,以及啊怎么把一个复杂的任务拆解成几步让他啊连续几天或者上周的去持续的运行啊。这期先到这,请大家继续关注这个系列。

coso code 扣贷的优缺点测评?跟大家分享一下我的实战使用经验。先说一下我最开始接触的 coso, 这个是新手最可控的网站工具了,优点是它可以用拖拽的方式去进行可直观的操作。 我去想拖拽哪个文件,去修改哪个文件,我在这里面去拖拽去对话就可以了,它可以进行多个文件的梳理架构。前期很方便,因为我知道哪个文件在哪,我拖拽进去 就直接修改了。但是弊端也很明显,如果你没有进行架构或者没有经验,它很容易改了这个 html 文件,没有改 css 文件, 然后你的网站控制台全都是报错,甚至整个崩溃。而且每次新的对话,我都是在和一个完全陌生的智能体对话,我需要重复记录大量的常用指令,比如要他看哪个记忆文件,比如看哪个文件架构。 所以我给 cost 的 定位是新手学习搭建 app 或者几个定点功能,还有可识化的维护。如果是中大型任务,还是要去扣的或者扣贷的, 那再说一下市面上最强大的 code, 这是让我又爱又恨的 ai 协助助手,我天天担心封号。他最强的是你的上限和能力,越强他就越强,在你开了全部的权限,让他执行中大型任务的时候,他能一次性完成并进行测试。 我给他的定位是我的电脑施工队伍,他是本地执行加云端大脑,他不依赖像口袋的那样的流逝传送或者那种压缩内容。 他的逻辑就是你的本地的文件让我怎么操作,我按照你的规定去操作,有问题,然后他再去找云端的大脑去发出问题,然后给出更好的解决方案。 当然他的缺点就是前几天我也转发了,然后那个就是 srb 说了,扣的就是根据你的指令去干活,你如果越着急给他的指令越错误,他就越乱。 那我们再说一下扣贷的吧。前几天我的扣贷因为网络被封了,然后我就紧急充了个 gpd pro, 深度测试了一天,我发现了扣贷的和扣的是完全两种不同的运转方式, 我如果开扣的是会开七八个终端窗口都没问题,我去干不同的指令不同的工作,但是我开扣带的就是我会发现我开两三个任务就开始卡了。 然后我就和扣带带去聊,发现他在启动的时候是会被很多规则规定,包括记忆了,权限边界了,然后工作插件,各种各样的东西。扣带带会大批量的先检查内部文件,不是说只想着怎么快点去做,而是要先想哪个能不能动,哪个会不会误删等所有的问题, 这就导致了他既会慢又依赖你本地电脑的性能。这个操作对于新手很友好,也很少的去试错。对于中大型的任务,他的出错率更低一点,但是相应的他的时间成本就会很高。 所以对于我来说,我总结来看,通俗更像是可式化的小任务或者说维护的最好选择。 扣德呢是上线和下线,很明显它依赖于你的文件和你对编程和架构能力的极致体现,终端的轻量化会把效率极致拉满。 扣代的缺点就是它的优点,它有最稳定的输出和极低的出错率,但是它的效率产出和扣德的差距很大,对我来说它更适合中大型任务的架构和完善。还有定点问题的修 bug, 我 试了很多次 扣带的,在修一个定点问题的时候,它比扣的是要更强一点,所以大家可以根据不同的需求去使用 ai, 然后我也创建了一个 ai 的 交流群,欢迎大家一起探讨学习。

全部给我去用扣袋子,太香了。我昨天研究到凌晨四点搞我那个电商的全自动化商品工具,就自动选品,自动采集自动商家,包括自动合价。我给你们看一下我的进度, 目前是已经完成差不多五分之一了吧。选品自动商家,话不多说,我给你们演示一下吧,好吧。 然后上架时间跳一个月内,一个月内商家的新品,然后点一下来,自动跳到对应的,对吧选品工具,然后筛一个月啊,自动筛,然后自动 获取,比如第一页这二十个所有的产品主图,加上商品 id, 看,现在正在跑了,已经看到没在跑,在跑了,自己在跑。来,我们点一下, 你看一下扣带子界面就很简单,对话就行了,你会提词就可以了,全程不需要自己懂代码,不需要自己写,他帮你写好,帮你做个网页出来。 等一下,因为这一页的话有二十个屏,我们等下把这二十个屏跑完。好吧,我现在是全程没动,我没动鼠标的,你看没自己来跑的。 ok, 搞定,看一下来,现在没有数据吗?对吧?好了,刷新一下,看到没?出来了,呃,产品的品名缩写了对吧?标题以及主图一张,对吧?为什么只需要主图?因为后面会拿这个品去 幺六八八去识别,找同款链接,然后来比价,来筛侵权,来改图, ai 改图,然后再来去用妙手来去,对吧?上架去发布, 所以现在只完成了五分之一,所以只需要主图,然后对应的啊,比如上面 id, 我 点一下,点击之后自动跳转到这个平台,自动输入这个商品 id, 自动搜索,自动到对应这个产品链接,就如果你们想看的话点一下对吧?你看信息有了吗?对不对?比如说 想不想听啊?这是它工具自带的,只说你正常的话你得手动输在 id, 还还那啥自动啊,自动化了回来有人说你这个工具对吧?它本来就自带可以上架的呀,为什么说还要做这个东西呢? 因为听好了。举个例子,我们 y r 选品的话,不光是从,比如不光是从云集看,我们还会看 t k 的 数据,看亚马逊的数据,看店铺前端的数据,看什么各种数据,所以 如果云起这个工具他只是一个来源而已,懂 𠲎? 应该干过,应该懂我意思吧,所以全资的话,对 𠲎。

大家最近使用 codex 时,额度是不是又不够用了?或者你是一个小白,还不会配置上网环境,连切记 gpt 账号都注册不了, 那么这期视频我会手把手教你,将性价比之王 deepstack v 四接入 codex 中,国内用户直连兼具经济和性能于一体,可以说是国内入门编程者上手的最优解,我们直接从零到一进行教学。首先打开网页,输入 node js, 点击进入,进入官网后我们点击获取 note g s, 之后选择对应的操作系统,点击安装程序,国内直联的话下载速度很慢,大家耐心等待。下载完成后,我们打开安装包,最后一路点击同意完成最终的安装。 下一步呢,我们搜索 codex 桌面端下载,点击第一个我这里以 windows 系统下载为例,我们找到微软应用商店,点击下载之后打开下载的程序, 下载完成后就会出现 codex 桌面端登录的一个页面,然后我们先不用管它,我们还需要 c c x 和 c c switch 这两个工具,有需要我飞书的小伙伴点赞评论加关注,我也会把我的飞书链接分享给大家。 我们将这两个安装包解压,解压之后点击这个 c c x, 然后这里有一个环境配置文件,这里可以看到我们的这个 s k 是 一二三四五六,这个大家记一下之后点击下面这个程序,然后我们找到这个管理界面,把这个链接复制粘贴到网页端, 打开之后我们在这里输入刚才的那个 s k 就是 一二三四五六, 然后我们点击这里切换到简体中文,然后我们点击这个 codex, 点击添加渠道,之后我们进入 deepsafe 的 官网, 点击 api 开放平台,然后我们自行登录之后找到这个接口文档,我们将这个 baseurl 进行复制,然后返回在这里粘贴。之后我们在 deepsafe 的 apikey 里点击创建 apikey, 这里随便命名, 然后点击创建,之后进行复制,同样在这里进行一个粘贴,然后呢我们点击右上角的详细配置,在这里把服务类型选择成 open i chat, 然后我们下滑,找到这个规范化非常键,我们将这个进行开启,之后点击创建渠道即可。接下来我们找到刚才解压的 cc switch 这个软件,我们同样的进行登录, 安装成功后,我们打开 cc switch, 然后在这里选择呃切的 gpt open i, 我 们点击右上角的添加, 选择自定义配置供应商名称,随便起一个名字,这个 api k 还是我们的环境配置的 k, 就是 一二三四五六。 之后 api 请求地址呢,我们就返回 c c x 中的这个 api 地址,我们将这个地址进行复制,然后在这里进行粘贴,之后点击获取模型列表, 这里我们就可以看到我们已经获取了 deepsea 的 v, 已经获取了 deepsea v 四的两个模型,然后我们往下滑,把这个一百万上下窗口进行打开,然后点击添加, 之后我们关闭 codex 进行重启,这里大家稍等片刻,因为是国内网络的指令,所以说它会有一些延迟。重新打开之后呢,我们选择这个 enter api, 然后输入一二三四五六。 进入之后呢,我们点击上面的 file, 然后点击 settings, 我 们在 general 下面往下滑,然后找到呃这个 language, 进行一个汉化,然后我们在这儿选择中文。进入之后,我们输入对话, 可以看到我们的 deepsafe 已经接入到 codex 中了,我们也可以直接让 codex 帮我们安装 skills, 比如我视频开头制作的 ppt, 就是 用这个 ppt skills 制作的。我们只需要在网页上输入我们想要的一个 skills, 找到 github 的 原始仓库,我们打开, 然后将这个链接地址复制到 codex 里,让它帮我安装这个网页里的 skills, 然后它就会一步一步自动化地去执行我们的操作,最终帮我们安装上了这个 skills。 然后我们之后制作 ppt 的 时候,它就会自动调用这个技能,帮我们生成这样风格的一个 ppt。 这个是 skills 的 一个安装技巧。本期视频就到这里,如果觉得对你有帮助,别忘了点赞关注,谢谢大家!

为了更好的体验 ai, 为了更好的学习 ai, 我 原来有一台高配的电脑,你们可以看一下 win 十一,然后它的 cpu 是 幺四六零零 k f, 那 个显卡是四零七零 s。 但是你们很多人建议我去录一台 mac, 然后我就买了一台 mac, 这台 mac 是 m 四 pro 二十四 g 内存的。但是很多人又跟我说丐版的 m 五就够用了啊?没关系,反正买都买回来了。接下来的话,我会记录自己学习 ai 的 一个过程,比如说, 呃,扣扣的 x, 然后可的扣的啊,包括一些国内的一些可以平替的啊, t r a e 字节跳动的啊,然后包括一些图声视频、纹身视频也好,我基本上因为我自己本身就是做 电商,做自媒体这一块的,我看一下他这一块能不能帮我提效啊?能不能帮我做标准化的东西啊?就是流程化的东西。好吧,那这条视频到这里。

一定要,一定要一定要想尽一切办法用上 codex! 如果你跟你朋友从来没有谈论过 codex, 那 恭喜你,你刷到这条视频,可能就是你改变命运的机会。 全球市值最高公司的老总黄仁勋已经要求英伟大所有的员工必须用上 codex。 一万多名员工啊,你竟用它创造了让人震惊的成果!如果你身边有一些正在谈论和使用 codex、 cloud code 这样的人,珍惜它,去和他们交流,你进步的概率是更高的。 codex 是 什么?为什么每个人都能使用 codex 智能?从五月份开始,它不再是编程工具,而是一个全能型的通用 agent, 你 在电脑上能做的事情,它都能接管,它就是未来财富的密码。 你看看最近这么多的新闻, encyclopedia 二季度赚了一百多亿美元啊!欧盟 ai 融资了一千两百多亿美元,我们国家的三大运营商争相布局,打开 ai 普惠的入口,能源、算力、芯片、股票涨了多少倍的背后,都是因为这些革命性的 ai。 如果说几个月前的 cloud code 让你感受到了门槛,那 codex 就是 普通人能接触到的门槛最低、最顶级的 ai 大 模型了。 如果你现在是一个大学生或者二十多岁,那你太幸运了,你刚刚进入社会,就迎来了一个弯道超车的机会。如果你三十多岁,哪怕四十多岁,学会用上 codex, 你 的认知和工作方式会迎来质变。 就像你在机场安检口排长队的时候,突然旁边打开了一条快速通道,聪明的人第一时间就会切过去,就像开汽车的,对于拉马车的,那就是降维打击。如果你已经听说过 codex, 但不知道怎么才能用上,那么别担心,我给你最保姆级的方法, 你就会看到这个看似寻常,但集合了顶级模型能力和人类工程智慧的东西,这就是新世界的大门。

想用 codex 帮你改代码,第一步不是写提示词,第一步是先把环境装对。这期我用 windows 新手视角讲一遍 codex 怎么安装, a p i 怎么配置。先说第一步,安装 no case, 你 可以去 no case 官网下载 lts 版本,装完以后打开 power shell, 输入 node v, 再输入 n p m v。 如果两个命令都能显示版本号,说明基础环境没问题。第二步安装 codex, 在 power show 里输入 n p m i g o p n codex, 等它安装完成,然后输入 codex, 第一次运行,它会提示你登录或者使用 app。 这里注意, codex 不是 普通聊天网页,它是跑在你电脑终端里的 ai 编程助手,它能看你的项目文件,能解释代码,也能帮你修改代码。所以第一次用不要直接让它乱改项目,先让它做一个安全任务,以 如输入,先帮我解释这个项目结构,不要修改文件。接下来讲 api 配置。如果你用官方账号,可以按 codex 提示登录。如果你用 api key, 重点看三个东西, api key、 base url、 模型名。这三个必须对应同一个平台。很多新手第一步就错在 base url, base url 不是 网站首页,也不是控制台页面,它是接口地址,常见格式会带 v e。 如果你把官网首页填进去,后面 t 再对也可能连不上。第二个容易错的是 api t t 不要少复制字母,不要前后多空格,更不要把 a 平台的 t 填到 b 平台的接口地址里。遇到四零幺优先查 t。 第三个容易错的是模型名,模型名不要凭感觉写,后台支持什么模型你就复制什么模型名,遇到四零四或者提示模型不存在,先查模型名。还有一个重点, codex 更适合使用支持 responses api 的 接口, 如果你的中转只支持普通聊天接口,可能会出现连不上游戏失败。工具要用异常,所以配置前最好确认这个接口能不能跑。 codex 能不能看日智,能,不能查余额,能不能看到错误原因。 最后给你一张新手排错表, npm 找不到,先查 nodex 有 没有装好 codex 命令找不到,先查 codex 有 没有全区安装成功。四零幺先查 api 机 四零四,先查 base ur 焊模型名四百二十九先查额度焊限速超时,先查网络焊接口稳定性。如果你第一次用 codex, 我 建议先做三件事,第一让他解释项目,第二让他找一个小 bug。 第三让他给修改方案,不要一上来就开全自动, 先看懂他要改什么再让他动手。如果你要 codex 安装检查表评论打 codex, 如果你卡在 api keybase url 模型名也可以评论你卡在哪一步。我下一条专门讲 codex 借 api 中转怎么排错。