介绍个 codex 好 用的功能,右上角这个注四全屏,打开浏览器底部区域,不想要左侧菜单固定,我们点击右上角注四出现选择区域,选择要注四的区域,填写注四的操作内容并发送继续注四。要操作的地方, codex 会持续接收任务, 我们看一下调整后效果,底部模块精准去掉,点击内容,点击编辑滚动左侧内容固定住了,非常 nice, 大家去试一下。
粉丝255获赞4840

给大家看一下我们这个浏览器的效果,看到没?他直接去在网站里面去操作了就然后刚刚他是直接去在里面搜,你看他现在贼快,上面 ui 一 直在变,看到没?我去 codex 刚刚出了一个可以控制浏览器的插件,我现在刚安装,我给大家看一下是如何安装的。首先你一定要呃搜 codex, 然后一定要搜这个呃, open i 提供的,然后呢把它添加到 chrome 上面, 对,添加完之后呢,这里面就它就在这里面,我们把它这个勾选一下,然后这个 codex 它提示它没有这个连接,我们点击这个小齿轮让它连接一下,然后这个桌面端的 codex 一定要去升级到最新版本,然后点击这个安装,然后点击安装, 然后我让 codex 去帮我搜索论文。啊,一开始呢,他是,呃先去尝试用浏览器搜,但是他没有成功,然后他就开始用这个搜索指令了。呃,我说你不要用搜索技能,你直接用我浏览器搜好了,他第二次就直接开始用浏览器了,我给大家看一下我们这个浏览器的效果, 看到没?他直接去在网站里面去操作了就然后刚刚他是直接去在里面搜索,你看他现在贼快,上面 u i o 一 直在变了,看到没? 所以说呢,就是说他的好处,就是说他把所有东西呢他都会整理好,然后我们就不需要我们去手动去搜了。还有一点,就假如说你是在学校里面,你有一些对一些论文库的一些访问权限,那你可以把这个权限授权给他,对吧?然后他这个搜索范围就更广了。 ok, 谢谢大家。 最终结果大家看一眼他把优先读啊,哪些方向都列出来了,然后我们也可以让他把具体内容去总结,也都没问题的。

之前 ai 做 ppt 最让人头疼的就是排版乱,审美差,内容不成体系。但这套论文答辩 ppt 是 用 codex 加 gbt image two 自动生成的, codex 负责读论文拆结构, gbt image two 负责生成高质量的页面视觉, 我现在直接演示完整流程,看完相信你也能够复现。首先我这里准备了一个答辩 ppt 的 文件夹,里边有一个大论文 的文,还有一个校徽,作为一个视觉的参考。那接下来我们在 codex 添加新的项目,使用现有文件夹, 然后选中刚刚的答辩 ppt, 打开,这样的话,这个新绘画的所有的上下文就跟这个答辩 ppt 这个项目做了关联。那么接下来给它输第一段提示词,就是提炼 ppt 的 结构,让它生成十八到二十页的大纲,适合八到十分钟的答辩。最后输出一份 md 文档, 那我们这里选的是 gpt, 五点五智能选超高,然后速度就按标准就可以了。 ok, 我 们给它发送,然后我们稍作等待, 这里出现了读取 pdf 的 技能,那如果没有这些插件的话,去把它安装一下,当然默认它好像就是安装的,我也不太确定。比如说 documents, 如果没有安装的话,你把它安装一下插件,那插件里边还有一些,呃,做 ppt 的 这个 presentations 这个插件,还有做表格处理表格的这个插件,这些可以去安装一下,点一下就可以安装了,很简单。那我们再等待它一下, 经过三分三秒钟的等待,这个结果是生成了,我们可以点这个悬浮的这个框,点开一下这个 md 文件,里边就是大纲了,大概是二十页。 ok, 大 体看上去没有什么问题。那我们接下来给他第二段提示词,然后让他确定一个 ppt 的 风格。 这里需要注意的就是,我们必须调用他的一个技能,叫我们使用 at, 然后 image 这个技能,这个技能是他可以直接使用 gpd image 来生成非常逼真的那些图片。呃,里边的一个字都不会错的那种,大家都刷到过那种图片估计。然后我们让他生成 这里给他说,根据学校上传的 logo, 啊,不对,根据上传的学校 logo, 也就是当前这个文件夹下不是有个 logo 吗?他会参考这个视觉元素去生成一套方案。 ok, 又经过三分二十四秒钟的等待,他生成了视觉方案,大体上看还是符合屈服蓝大学调子的,看上去没有什么问题。不过呢,这个东西有点像开盲盒,我刚刚又在另外一个绘画里边让他生成了一下,这个看上去就更有那个学术味。 呃,所以说呢,跟提示词也有点关系,然后跟这个东西生成它本身都是随机性的嘛,所以有点想开盲盒。那既然这样,我们就继续这个再继续做吧。然后我们下一步就是参考,让他参考上面的这个视觉方案和 md 文档,就是这个答辩的 ppt 结构,然后使用 image 键技能。这里必须要艾特一下 image image 键 图片生成技能,生成全部的 ppt 页面,最后拼装成一个大的 ppt 演示文稿,然后让他起用演讲者注视,然后注视里面添加备注。嗯,不要添加任何的元素,然后避免破坏 ppt 的 图片,我会这样让它生成。 那在生成的过程中呢,他还有所顾虑,有点谨慎,他说容易出现错字,也就是生成的那个图片容易生成错字。他提了一个更稳妥的做法,就是生成到视觉图片作为视觉追踪,然后用程序渲染成 png。 但是我直接给他说,哎,不会出现错字,大胆的生成就完了。 这样的话,它生成的二十页资产最后全部都会完整的保留,不会再那个出现可以编辑的文字了,这样的话视觉完全统一,它最后只会在答辩的那个演讲的注示里边添加文字, 这样它现在正在一页一页的生成。 codex 现在的用户体验已经和 cloud 的 桌面版差不多了,你看这里也有这个进度显示,这边点开之后也会有资产的显示,这里是这个实时进度,这里是生成的一些结果 本身。虽然他是面向程序员提供的产品,不过他现在越来越像一个超级的终端啊,不是超级的那个智能体,面向普通人也可以用了。你看在他的设置里面打开设置,我们可以选中这个适用于日常工作的,如果你是不是技术人员的话,你可以选这个模式,那他会回复的过程中会少一些技术性的话语,这样的话看起来更纯净。 ok。 经过了四十三分钟之后,终于生成了 ppt。 它生成慢的原因主要是那些图片一张张的特别慢,我们打开这个缩略图先看看,哎,看上去没有什么问题,视觉上比较统一。那我们继续使用 wps 来打开这个 ppt 看一下啊,看一下,第一眼看上去这个字什么的都没有什么错。然后我们先看一下缩略图,看看整体是什么样,一个感觉 整体上差别也不大,整体的视觉元素,视觉语言保持的还是比较一致的。然后我们看一下细节,第一个问题就是我看这个 logo 好 像有点问题,不过这也好处理,直接把那个 logo 图片导进来给他盖住就可以了。下面这些基本上是没有什么要改的,直接来自论文里面,然后他还生成了备注,这底下有批注啊,这底下有备注,到时候可以照着读的。 然后我们翻一翻,翻一翻大概就是 logo 是 最大的问题,其他的都问题不大,没有什么错别字,哎,这里代码什么都是能做表,然后这个图,这个图表也非常的 nice, 然后这个也可以,都是比较可以比较,可以可以用 哦。我发现还有个问题,就是屈服师范大学底下这个白描的图也有点不对,这不是屈氏大典的元素,不过这个也好解决,让他单独再生成一下这一页就可以了,可以让他给他一些参考,给他一些图片作为参考,让他知道真正的屈氏大的那个图片,然后参考可以生成更逼真的白描, 那整体上就是这个过程。我们最后再来总结一下,我们看一下这个绘画,整体上就是这一个绘画。首先是在这个项目里面有个答辩 ppt, 里边给他提供了我们的完整的论文,还有一个 logo, 学校 logo。 然后第一步要求他生成 ppt 的 大纲,这个大纲就是在这里, ppt 大 纲生成完了之后,我们再让它形成一套视觉方案,参考 logo, 或者说你给他提供更多的一些视觉参考,然后它生成一个视觉方案,生成之后我们再让它参考视觉方案和刚刚的 md 文件,就是大纲,再用这个生成图片,一页一页的生成 ppt。 呃,生成完之后,最后拼成了一个大的 ppt, 那这样的话就完成了整个 ppt 的 生成功。不过这样有问题,就是生成出来的 ppt 你 是没法进行编辑,毕竟它都是一张张的图片。那好在它生成图片比较准确,没有什么错字的问题。如果有简单的一些元素需要覆盖,你像这个 logo 可以 直接用 logo 给他盖上去,真实的 logo 给他盖上去。还有最后这张白描,如果有问题,可以让他单独生成这一张。其他的你像这些图标什么的图标什么字都是没有什么问题的,都是没有问题的,直接就是参考那那个论文里面那些直接读读过来的。 ok, 那 今天的内容就到这里了,如果大家有什么问题的话,可以在评论区聊一聊哦。

有多少设计学的学弟学妹们在做答辩 ppt 的 时候还得熬夜或者去找模板,今天韩哥抓紧录这期视频江湖救急!直接用 codex 可以 把你的一百多页的毕业论文变成一个可编辑可修改而且梳理非常清晰的一个答辩 ppt 的 原文件, 直接拿去就可以汇报别人,在熬夜的时候,你就直接可以去爽玩了。 ok, 我 们直接开始上干货。 ok, 这就是韩哥把这个论文一百多页的 pdf 丢给 codex 之后,直接做出来的 ppt。 大家可以看到这个 ppt 甚至是连自己的蒙版都可以去调整,而且它最大的特点就是它可以调取你论文中 画出的某些图,比方说你这张里的 cd 平面图,它可以根据对应的去生成你对应的章节,而且呢,它是每一个章,大家在这里看到它是根据我们论文中 每一个环节进行裁切和整理的,也就是说他没有去自己瞎生什么,让你的 ppt 看起来好像是那么回事,但实际上内容上没有一个真正可以用的。那如何去做到这样的 ppt? 实际上非常简单,韩哥教大家两步走啊,直接就可以完成。首先第一步呢,我们还是准备好自己的毕业论文, 那把韩哥这里呢,去这网上随便找了一篇清华美院的设计学毕业论文,然后呢,把它直接导出 p i pdf 格式, 然后丢给我们的 codex, 但是丢给 codex 的 时候,这是我们第一步,大家一定要记住用韩哥给大家提供的这个结构化提示词。什么叫结构化提示词?就是我们一定要有强撸棒性, 你让他说帮我生成一个答案 ppt 啊,他生出来的只会乱发挥,给你很多废话啊,像一个商业路演一样,看起来很好看,这是我们很多 ai j c 呃,生出来的这个东西就是这样的。那么我们的强鲁邦性题词呢,就是一定要明确几件事情,首先呢就是我们答辩场景什么?你是本科必须着还是研究生论文还是什么情况?第二个是我们 ppt 页数有多长时间啊?多少页,多长时间?第三个是我们的每一个页的结构都包括什么啊?大概在 封面目录、研究背景、研究意义这些之中啊去筛选。那么最后呢,在每个详细的页里,我们还要包括哪些内容?比如说主标题、副标题要点,图像展示等等。然 然后我们最后约束一下他的视觉风格,我们就大概用什么样的颜色,用什么样的分蓝方式,重点色是什么颜色,对吧?只有有了这样的结构化题词之后, ai 生出来的才是可以直接去拿来用,减少我们非常多去后期调整的时间。 那么这是第一步。第二步是我们给到他这个题词之后,也不要让他立刻去升 ppt, 而是让他升什么呢?让他升成一个 markdown 文档,大家可以这里看到,这就是韩哥。首先第一步让他升成的这个 markdown 文档,也就是他的方案,在这里呢,他把韩哥刚刚提到的所有详细的内容 都变成了一个文字的形式,对吧?它的大纲有什么?然后它每一张大概是要做什么?然后它每一页每几页的创新点,然后包括它的它的设计建议,视觉风格,这里的好处就是 markdown 文档可以让我们不断的去调整自己的需求, 针对性的需求,你看这里,比方说我们的颜色对吧?我们可以直接针对性调整我们喜欢的颜色,甚至说跟我们壁设呃展板比较搭配的颜色。这个韩哥也比较建议,有了马克纳文档之后,我们可以详细的定制自己的内容,减少这种抽卡的这种概率, ok, 然后我们有了马克纳文档之后,我们就可以直接 啊让 ai 直接生成 ppt 了,这个时候呢, ppt 生出来的就是刚刚韩哥已经给大家看到了,对吧?这就是这样的一个呃,完整的这个 ppt 的 框架,那么这个 ppt 呢,它不仅是 视觉风格上啊,然后内容上跟你的 ppt 很 相关,而且它呢是帮我们梳理了整个你的讲述逻辑,很多同学做 ppt 还要去重新再梳理一遍,我怎么表达?就因为答辩 ppt 的 讲述和你的 辩论文呈现它其实是有一定差异的,你需要在八到十二分钟这个浓缩的时间里,讲出你的亮点,讲出你的呃设计的思路策略,然后最后呢提出你的展望结论大概有哪些,对吧?这里都是根据论文去实时去优化的, 那么有了韩哥给你的这两个方法之后,包括提示词,韩哥待会会放在评论区,你可以直接快速的去啊,完成你的答辩 ppt, 不 需要再去找模板,不需要再去熬夜了,对吧?这样的话,我们毕业之后无限少玩了。

比起 opencloudex 可能才更适合普通人使用,能操作电脑做文档、表格、 ppt, 还能生成图片,执行自动化任务,逐渐从编程 agent 走向桌面 ai 助手。那今天这个视频我就给大家带来 codex 保姆级教程。先到 codex 的 下载页点击下载 macos, 下载好后打开安装包, 直接把文件拖进去就可以了。打开 codex, 它的界面很像网页版的 ai 聊天界面,主要可以分为三块,右边这里就是和 ai 对 话的地方。左上角的四个功能,第一个就是开启一个新的 ai 对 话搜索,可以通过标题来找到之前的对话内容, 剩下的插件和自动化功能我会在后面详细讲解。左下角这里是两种和 ai 写作的方式,一种是项目方式,一种是对话方式。 项目方式更适合去做一些长期积累的任务,比如沉淀知识库、做工作流、写代码。有两种方式使用项目,一个是创建新项目,默认会在文稿目录下创建一个项目文件夹,也可以使用你现有的文件夹作为项目, 所有后续的 a 阵子操作都会默认在项目文件夹下进行。第二种对话方式,就像我们平常使用网页版 ai, 可以 临时去做一些任务,比如偶尔查一查信息什么的, 那我们这里就可以新建一个项目,我们也可以在三个点这里给项目改名,在聊天框左下角就可以看到他已经进入了刚才新建的项目文件夹。下聊天框这里的加号, 我们就可以上传图片或者文件给 ai 这里我们还可以开启计划模式,这个模式是不让 ai 直接改动文件,而是先生成一份计划,我们看完没有问题以后才会执行。 权限,这里 codex 有 三种权限,第一种默认权限,就是只能访问项目文件夹下的文件,如果涉及到其他文件或者网络访问,就会弹出审核框让我们去批准。第二种是自动审查,就是 codex 会自动放行低风险操作,高风险操作才会需要人工审核。 最后一种就是给 codex 所有的电脑权限,很方便使用。右边这里我们可以选择模型的推理强度,复杂人物可以选择更高的推理强度。 模型这里我们可以切换多个叉 t b t 模型最后的速度就是可以加快模型的输出速度,不过会消耗更多的 token。 这里直接让 ai 写一个单 html 的 个人播客网站,但我们可能有新的想法,想要加进去就可以直接进行引导, 比如我这里补充整体色彩风格要用孟菲斯风格,还可以继续补充,要用一个板块式,个人作品展示用滑动式般的呈现。我们直接点击这里的引导, codex 就 会在下次执行工具调用后 插入我们新的要求,很适合补充提示词或者纠正方向,不用中断对话,让他帮我们再写一个手工艺的电商网站。使用 react, 那可以看到两个任务就并行执行了,属于转圈的状态, codex 当前步骤完成后就会显示为一个小蓝点。 看完基本使用,我们来看一看一些好用的特性。先来看一下插件功能,插件就是用来帮助 codex 操作各种工具的, 比如 computer use 和 browser use 就是 让 codex 操作你的电脑和它的内置浏览器,下面这两个就可以操作表格和 ppt, 那 往下翻我们还可以看到操作邮箱 canvas 设计软件的,我们点开一个就可以看到。这个插件其实由外部服务调用和技能组成, 那有的插件本身也是一个技能,后面也会给大家演示怎么使用插件。技能这里大家应该就不陌生了,技能就是工作流程的一个分装,如果有不懂的朋友可以看一下我之前讲 agent skill 的 视频, 如果你是以现有文件夹的方式创建项目的,也会把里面的技能同步过来。接下来我们就来看一下 computer use 这个插件, 它是利用 macos 的 屏幕录制和无障碍辅助数,让 codex 既能看到画面,又能精准点击。 这里我让他打开扫雷通关简单模式,这个半透明小光标就是 codex 操作所使用的,不会占用你的鼠标。一开始他尝试标记地雷的时候,发现标记失败了,很有意思的是,他换了一种玩法, 直接打开安全格,然后就是一路门店,推理出所有可能的安全位,直接通关。我就在想,如果以后模型的推理速度和输出速度再快一点,那我们干游戏就只需要用 ai 就 可以了。 下面我们看一下办公三件套和作图插件,这里我让他调研一下英伟达显卡的发布和价格信息,并让他制作成 word 文档, 然后配图。这里他很快先把配图制作出来了,整个过程一共用了十六分钟,第一次用的时候他会自动安装相关运行环境,制作完成后,他还会截图进行复查,发现可以打磨的地方还会进行二次修改。我们打开文档来看一下 发布信息和价格表都出来了,而且还贴心的配了图,最后还有产品线解读和购买建议。然后我让他在这个基础上把价格表整理成 excel, 同样的他在处理过程也会不断修正错误,花了五分钟时间做好。 来看一下表格,所有信息都正确写进来了,唯一有个瑕疵是溢价,这一栏应该是百分比,它这里用的是小数,不过这些都可以通过细化提示词去解决。下面继续让它根据文档做 ppt 分 格,参考苹果信息层级不超过三层。 他做完第一版以后,又对我的信息层级这个要求进行复查。我们来看一下 ppt 整体布局还是很舒服的,满足了我对信息层级的要求,没有堆满字,而且风格也是沿用了英伟达的配色。最后我们来说一下自动化功能, 它就相当于一个定时任务。右上角这里我们可以新建任务模板里有一些关于代码的任务模板。下面这里你可以选择在哪个项目文件夹下进行, 并且设定定时时间,有每小时、每天、每个工作日或者每周。也可以自定义规则,我们可以直接粘贴这个规则,让 ai 帮我们改成任意时间,比如这里就让它改成每周二和每周四的十三点执行。那 那我们在这里也可以让它执行已有的工作流程,比如这里,我之前是用 cloud code 做的,在 cloud 点 md 里已经写好了完整的自动拉取推文的流程,那直接让 codex 执行就可以了,很顺利地帮我完成了定时任务。那以上就是全部教程了,如果对你有帮助的话,记得一键三连。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

hello, 朋友,晚上好。这 codex 更新了一个非常非常有意思的功能,叫做 appos, 那 听起来它就是一个截图的功能,那实际上它解决了一个日常使用 ai agent 的 时候一个非常烦人的场景,就是我怎么把我的问题也能够最直接的告诉 ai agent, 告诉 codex, 那像之前我用到的方式就是使用呃,微某信,对吧?完了使它的截屏功能,截了屏之后再发给 codex, 再跟他描述一些问题,描述一些关于这个问题的一些信息。那现在我直接可以用它的就 codex 这个 appstores 的 快捷键,直接把我 这个碰到了一个场景的截图就发给他了。那我觉得我靠,简直太方便了,咱们来看一下这功能怎么用啊?首先需要把你的 codex 更新到最新的版本,你就可以在设置里面看到这个英文快照了。 codex 对 于这功能的描述是你可以把你当前最前面的窗口的英文快照发送给 codex。 之后有一个很有意思的点啊,就是你看他那个热键,他是通过 command 加 command 来触发,我觉得设计这个的人绝对是个小天才,我永远不会想到有一天我有两个大拇指能在键盘上触发一件事情, 咱们来看一下怎么用啊?比如说现在我正在看这个论文,或者说你正在看一些其他的新闻,或者你像你认为你需要关心的事情的时候,那 你就可以直接在这个 codex 里面直接摁住摁这两个 command 键,你看他就会把你刚才的窗口的一个截屏发送过来。之后你可以跟他问问题了,比如说我想知道 这个 paper 写的什么,你看这个截图就发给他了,他就会基于这个截图来做分析一些具体的事情,具体你想了解的事情, 那我觉得这个就很方便,这个就我就可以,不,不需要看那些截图软件了,我还截图发给他,那直接 command 加 command 快 捷键就直接发给他了, 就 ok 了,就把这个事情就完成了。 ok 啊,那功能就是这样,其实 apple store 这功能很简单,就是一个截图,但是你可以看出来 open i 对 于使用者在使用 ai agent 的 一些场景时候,它的把握很精准。你包括,呃,前不久 codex 刚出的 remote control, 就是 这个手机远程控制, 以及跟随着这次的更新,还有一个叫做手动操作以及 ppt 的 插件。那我也会在接下来的视频里把这些功能再去详细的讲一下,我觉得,嗯,真的很好用。那就这样吧,这是同学,如果喜欢我视频记得点赞,双击关注,下期再见。

本期分享 codex 零基础上手使用教程,覆盖了办公、编程、自动化等使用分享,让我们每个人可以轻松上手使用。开始之前我们先来了解一下 codex 与 cloud code 相比,它的优点有哪些,第一个就是有更多的额度, 第二个就是不会轻易地限制账号,封账号。第三个就是 ai 升图能力,目前是排名靠前的。第四个就是客户端安装更容易,容易上手。第五个就是不订阅也可以去使用体验,因为它有免费的额度,这是关于 codex 的 一些优势。 第一件事情就是要修改语言,在这里部分伙伴会因为网络原因下载的版本默认的会是英文界面,所以需要修改,如果是打开直接就是中文,可以跳过这个步骤,然后设置语言,是在左下角设置这里,然后选择 设置,然后在默认的常规选项里面,这里有一个语言,在语言这里我们选择中文,这时候就可以切换为中文界面。 下面我们来介绍一下它的功能,我们先从左侧说起,第一个就是新建对话,这里就是创建一个新的对话窗口,在这里我们就可以把它想象成 相当于我们换了一个朋友聊天,然后打开了新的绘画。然后第二个就是搜索功能,在这里就是可以搜索历史对话,这里我们就可以比喻为搜索和朋友的聊天记录。然后第三个插件,这里就是让 codex 更强大,赋予 codex 拓展功能,拥有操作其他软件的能力, 在这个插件这里,它还有技能。这就是我们前面分享了好多次的 skills, 如果大家还不了解,可以看一下之前分享的内容,然后第四个就是自动化, 在这里就是定时任务执行,可以直接去新建自动化功能。下一个就是项目,这里就是我们所有的创建的项目和打开的项目都会显示在左侧,然后下一个就是对话, 当我们在对话窗口没有选择任何项目的时候,我们选择不使用项目,这时候的对话内容就会在 对话栏目下面去显示,这就和我们网页对话使用是一样的,适合做的事情就是一些日常任务,比如搜索资料,写内容等等。分享到这里肯定会有好多小伙伴有疑问,就是上面的项目什么时候用,以及使用的场景是什么?在这里我来分享一下。 这里就是我们需要 ai 生成文件的时候,比如我们写代码,生成 markdown 文档,生成 ppt, 生成 word 文档等等,就是涉及到文件生成的,我们就可以选择创建项目,这样的优势就是生成的内容都会保存到当前项目文件夹,容易编辑和管理。 在这里我就是使用大白话来分享的,就是更容易理解一些,可能还是有些模糊,下面我直接实操,大家来看一下。 在这里我直接新建一个项目,然后在项目这里我们指过来就会有一个添加项目的图标,然后我们选择这里,他有两个选项,一个是新建空白项目,第二个是使用现有文件, 第一个就是我们直接新建,第二个就是如果我们打开某个项目的时候,就选择使用现有文件夹, 在这里我们是新建空白项目,然后我们选择新建之后,可以看一下它,这里就新建了一个项目文件夹。创建之后我们可以去修改项目的名称,我们只到项目名称这里,然后选择三个点,在这里有一个重命名项目,我们在这里 我们命名一下,比如命名为 demo, 然后保存,然后我们看一下对话窗口这里它自动选择的就是这个 demo 项目,在这里我们给它提示词,就是一句话,介绍 ai 生成 txt 文文本档, 然后我们直接发送。现在我们的模式是选中项目文件的,到时候它生成文件的时候,就是生成在当前项目文件夹下面。 好,这时候任务完成了,就显示已生成文本文档。 ai 介绍点 txt, 在 这里我们打开项目文件夹,我们来看一下,然后我们通过项目文件这里三个点,然后在资源管理区中打开, 现在就有了 ai 介绍点 txt 文本文档,这就是 ai 生成的文件内容。如果我们不选择任何项目, 我们选择不使用项目,然后我们再和他对话一句话,介绍一下你自己,然后我们直接发送,可以看一下左侧,他就在对话列表下面,没有在项目文件夹里面,这就是项目和对话的一个区别,经过实操演示,我相信大家已经了解了。 然后如何选择,就是涉及到文件生成,比如文文本档写代码,我们就要创建一个项目,如果只是单纯的和 ai 对 话查资料,我们就不用去创建项目文件夹,直接对话就可以。 下面我再分享一个个人感觉比较好用的功能,就是多任务处理,在这里我还是使用生成个人主页的任务来举例,因为这个应用场景每个人都可以用到,我们先选择我们刚刚创建的这个 demo 项目,然后我们把提示词 粘贴过来,在这里我们就是让它生成一个个人主页,使用 html 加 css, 然后还有就是一些风格指定,还有一些按钮的效果,还有页面布局等等,在这里我们就直接发送 在当前的任务进行中,比如我们突然有一个想法,我们可以使用这个技巧,我们想规定腋角的颜色,比如腋角使用灰色,然后我们直接发送,可以看一下它现在这个提示词就是在排队的状态,如果我们想让它立即执行,在这里我们直接选择这个引导, 可以看一下他这里提示就是提交但不中断模型运行,然后我们直接选择,这时候像我们给他的这个任务,他就直接插队插进来了,就不用等上面的任务执行完毕之后,再执行第二个排队任务, 这是关于这个使用小技巧,可以看一下第一个它会直接在当前工作区生成一个可独立打开的静态文件,然后它这里就有一个已引导对话,它就提示收到页脚,我会做成浅灰色背景,如果我们不点引导的情况下, 它就会等第一个任务执行完成之后,然后再执行页脚使用灰色,好,现在就生成完成了,然后我们打开看一下生成的效果,这就是我们生成的个人主页,这里我们直接自己去修改就可以。 下面我再来演示一下多任务,比如我们在当前项目文件夹下面,我们再有一次对话,就是什么是 ai 一 百字介绍,生成一个 txt 文文本档,然后我们 直接发送,这时候我们就可以在另外一个项目文件夹下面,我们直接选择开始新对话,然后我们再给他一个任务, 如何学习 ai 一 百字介绍生成文档,这时候就是同时进行任务,这就是多任务同时运行,当运行完成之后,他这里就会有一个蓝色的小点,然后我们再返回到项目文件夹,这时候任务就完成了,这就是多任务的应用, 然后下面我们再一起来看一下,就是创建技能,就是创建 skills, 我 们来到插件这里右上角的创建,然后选择 创建技能,在这里它就会显示一个 skill creator, 这就是创建 skills 的 一个技能,然后我们把提示词复制粘贴过来,在这里我们还是封装一个 ai 提示词,让它去制作一个 skills, 然后我们粘贴过来之后,下面给他的就是帮我创建一个写作技能,直接发送 好了,这时候提示我们创建成功了,它也给我们显示出来了这个创建的路径,在这里我们新建对话,使用我们自己创建的 scale, 让它帮我们去生成一篇文章,在这里我们输入斜杠,然后我们选择 技能,然后找到我们刚刚创建的,可以看一下这个是个人,然后我们选择,然后我们再给它提示词,就是什么是 ai 帮我写一篇 seo 文章,然后我们直接发送,像现在这个状态,它就是调用了我们创建的 skill, 这时候用我们创建的 scale 就 写好文章了,在这里我们只关注一个地方,就是我们提示词里面让它包含问答模块,这时候它也是包含的,它严格遵守我们的要求,这就是我们创建技能和使用技能的所有流程。 然后下一个我们再看一下插件的使用,在这里我再新建一个对话,我们使用插件就需要使用 at 符号去指定, 比如我们还是给他一个提示词,就是如何学习 ai 使用,然后艾特符号,然后我们选择 document 插件,这里就是这个 word 文档的一个插件,然后帮我生成 word 文档直接发送, 这时候就用插件创建好了文档,现在我们打开看一下它生成的一个效果,生成的效果还是非常棒的,它不是那些简简单单的文字,它是给我们排版好的,效果还是非常棒的,这就是 codex word 文档的生成插件的使用。 然后下面我们再来看它的另一个功能,就是自动化,在这里我们来到自动化这里,通过右上角,然后新建自动化功能,然后我们输入 就是每天学习一个 ai 术语提示词,这里就是每天上午八点给我推送生成一个学习文档,比如 token 是 什么, ai 是 什么? webcoding 是 什么,就是每天八点让它帮我们生成一个学习文档,然后我们再选择一下项目,我们选择 demo, 然后每天八点在这里就是选择模型,我们就选择默认的, 然后下一个就是推理的设置,这里我们也保持默认,然后我们直接创建就可以,这时候就创建成功了,然后我们选择这个自动化任务,就可以看到它的一个运行状态,还有一些详情信息, 这就是关于这个自动化任务创建,也是非常简单的,都是可直观的操作。好到这里就是我们 codex 安装到使用的所有操作,我们本次分享的都是一些基础的使用,我们可以先上手使用,然后其他的再边使用边研究就可以。 在这里还有一个拓展分享,就是如果你使用 codex 是 一些日常的任务,大家可以到设置这里面,然后常规选项这里工作模式就选择 适用于日常工作的模式,像这样它的模型是同样强大的,就是技术细节更少一些。好了,这就是我们本期的所有内容,欢迎留下你的想法,我们下期再见。

今天我们会完成桌面板打开之后的第一次设置,那么我们就开始吧。第一次打开 codex 桌面板,我们要先把界面分成三块来看,左侧是项目和一些插件的入口,中间就是我们的一个对话框了,最下面有一个设置面 板管理。对,那么我们新手进来要先处理几件事情,第一个工作模式,第二个选举指令,第三个批准策略,第四个沙盒,第五个插件入口。 ok, 那 我们先进到设置里面看, 在设置里面左侧有十二个分类,包括常规、外观配置等等。第一次使用我们重点来看这几个,我们先点开常规,常规的第一项就是一个工作模作,开发项目的时候,我们一般选择适用于编程, 你选择了这个模式,那么 codex 会更愿意指示文件命令验证方式。如果你平时是以日常工作居多,比如说是以文字创意等等,那你可以选择用日常工作。在下面的权限区域,我们要来看一个重点是完全访问权限,这里记得是关闭的状态,如果这个开关打开之后, codex 可以 直接编辑更大范围的本机文件,运行网络命令,它的风险会明显变高,所以作为新手阶段而言,我们默认把它关闭掉就可以了。这里的速度可以选择是标准还是快速, codex 会基于跟你的一个整体对话,给到你一个相应的建议,当然如果用快速的话,它的套餐用量也是会增加的,那么我们平时用标准就可以。 那接下去我们来看第二个重点是个性化的,这个选项里面有两个,一个是个性,主要是选择 codex 回复的默认语气, 我这里选择的是务实,希望它能够简洁、专注和直接。第二个我们要去关注的是自定义的指令,这里的自定义指令要知道它是局工作规则,所有的项目都会读到它。所以新手我建议你们只要写八行内容就可以,这八行内容我会放在评论区,当然我自己的会 更完整更长一些。我的结构大概是包括使用范围与优先级通用的一个工作流,安全与合规,通用代码规则,验证与测试提交的规范,常见的项目命令工具,然后输出的一个文本规则。还有一些个人偏好,对, 我觉得大家一开始就用前面的这个八行就足够了,后面当你越用越多。你可以跟 codex 去总结你们经常碰到的一些问题,或者是你自己觉得 codex 经常会犯的一些错误,你把它整理成对应的规则放进去就可以了好吗?它有一个记忆的选项,目前是实验阶段,大家可以把起用记忆这个给开启就可以, ok。 第三个重点是配置,我们来看一下配置的页面配置我们来关注两个内容,第一个是批准策略,第二个是杀核设置。批准策略一般我们都会默认的是 on request, 它的意思就是说当 codex 遇到高风险动作的时候,就会停下来让你确认。当然这里如果说你是用 never, 那 就相当于一次执行到底了,不需要你的任何的批准,所以我建议新手都是用 on request 吧。沙盒设置这里它的默认是 workspace right, 它主要在当前项目里改文件,允许网络访问,这里就是默认开启,你可以把这里的批准策略理解成为它是一个确认按钮,哪些时候需要你来确认?把沙盒设置理解成为 codex 的 活动范围, 你给它框定了一个能够编辑文件和改文件的一个范围,它就只能在这个范围里去进行一个行动。我们再来看一个大家比较容易忽略的一个点,或者是比较容易混淆的一个点, 就是在桌面面板的左侧有一个插件,这里的插件它其实包含了 skill, mcp 和 connect。 skill 是 工作流,是我们的一个技能文件,它里面包括一些代码审查、做表格、生成 ppt 等等。同时像 mcp 就是 codex, code 等等。 connect 呢,是第三方账号的一个连接, 比如说像这 eraser, git, a lotion 都会有,所以这里的插件其实它就是一个能力包的一个合集,像 m, c, p, skill, connect 这些都是它里面的具体的能力,大家根据需要去进行一个安装就可以。 ok, 那 我们再回到设置里面剩下的几个,我们只是来做一个印象, 比如说像外观,你可以基于自己的系统去定义主题色,浅色或者是深色,当然这里有一个隐藏选项,它有一个宠物,看到了吗?这个就跟 cloud code 是 一样的,就是最近出了一个宠物,当你选择唤醒它的时候, 你看它的右下角就会出现这样的很可爱的一个宠物形象来陪伴你头顶。 it 主要是来管理分支的,像浏览器使用和电脑操控,主要针对的就是 browser use 和 computer use, 在 我们后面也会去讲到像以规章和使用情况,就是你本地的一个任务的一个管理和一个用量的展示,平时经常的去看就可以了。

codex 是 我过去几个月高频使用的 ai 助手之一,我用它做研究,写文档、做 ppt, 整理内容灵感,做网页原型。上个视频讲了 codex 基础,这期视频讲一个今年很值得先搞懂的 ai 概念 skill, 因为它决定了 codex 到底只是陪你聊天,还是能按你的工作方式反复干活。简单理解一份可以重复使用的工作说明书, 你可以把某类任务的流程规则、检查标准提前写进去,下次再让 codex 做类似的事,他就不用每次重新听你解释一遍。比如你经常让 codex 做网页,你不想每次都重复说页面不要太 ai 味,不要蓝紫配色, 这些都可以写进一个设计类 skill 里。以后你只要让 codex 用这个 skill 检查页面,他就会按那套规则去看代码、改样式,再告诉你改了哪里。 这就是 skill 最实用的地方。把你反复说的要求变成一套固定流程,那么在哪里看和怎么用 skill, 可以 去 codex 的 侧边栏这个入口里看,里面会有一个 skill 子页面, 已经添加或创建过的 skill 会出现在这个列表里。使用的时候,通常可以在聊天里输入 skill 名称,或者用斜杠跳出来。比如你有一个 find skill, 就 可以直接斜杠选中,帮我找一个适合做 ppt 的 skill, codex 就 会按 skill 里的流程去跑。那怎么创建 skill? 有 两种方法, 第一种最简单直接这样说,请创建一个 skill 以后,我给你一个网页项目时,你要先检查移动端排版按钮样式、文字层级、颜色是否太乱,最后输出修改文件和检查结果。这种叫 prompt skill, 但我更推荐第二种,先把流程跑通,再把流程固化成 skill。 举个我刚实测的例子,我想做一种白板手绘风讲解图,我先给他一个参考图,让 codex 按我的要求生成讲解图 第一版如果不满意我就继续改,比如少一点黄色纸张质感画面更像课堂白板。等到有一版我觉得可以附用,我再说。把它固化成一个 skill, 这时候 codex 会反推刚才的流程,它会把这次反复调整出来的规则写进一个 skill。 md, 这样下次我再用白板手绘讲解图, 就不用重新解释一遍审美和结构,直接调用这个 skill 就 行。如果你想让 codex 使用 skill creator, 它会按更标准的格式帮你生成可附用 skill。 我是 ai 知识派,我们下期见。

欢迎来到这期的讲解,今天咱们要聊点颠覆认知的,彻底改变一下你对人工智能的传统看法,忘掉那个只会一问一答干巴巴的聊天框吧。今天我们要看看怎么把 ai 变成你手底下最靠谱最拼命的虚拟实习生。 咱们先实话实说啊,回想一下你每天的上班时间,到底有多少是被那些无脑的搬砖活给撤掉的?比如积极枯燥的数据录入在好几个表格,或者对着同一个按钮点上几百次, 是不是想想就觉得特别心累?那么咱们直接进入第一部分 ai 的 进化,咱们看看它是怎么从一个副驾驶变成咱们的全能员工的。 咱们来看这个非常有意思的对比。以前大家用的 ai, 比如 copilot, 其实就像是个坐在副驾驶的教练,你累的半死地握着方向盘,它在旁边不停地给你提建议,说风凉话。 但是现在的 kolex 呢?它完成了一次巨大的范式转变,它是一位真正的虚拟员工,直接帮你接管方向盘,帮你把活干完。而你这个指挥官只需要舒舒服服地坐在后排,审查一下最终结果就行了。 所以千万别误会,你绝对不需要懂任何敲代码的技术就能用它,它不仅是个搜索引擎,也绝对不是程序员的专属玩具。你只需要用平时说话的大白话告诉他你的目的地在哪,他自己就会动脑筋规划出一条路走过去。 接下来是第二部分,也是今天的重头戏,这小助手到底能干吗?咱们来揭秘一下他的自动化能力。 重点来了,他到底是怎么替你干活的?这就得说到他一个神仙级的功能电脑操作。 用大白话来讲啊,这就像是你电脑里住进了一个隐形的田螺姑娘,她可以真真切切地看懂你的电脑屏幕,然后像个真人一样去挪动你的鼠标,精准地点击窗口按钮,甚至模拟人类在键盘上噼里啪啦的敲字。不管是切换窗口,还是用剪贴板复制人贴,它全都能代替你的双手去完成。 而且最绝的是什么呢?无论你是用 mac 系统还是 chrome 浏览器,他干这些活全都是在后台静悄悄进行的。也就是说,你可以继续一边看网页,一边写文档。他在后台帮你干他的,绝不会突然弹出来打断你的思路,完全不抢你当前的屏幕焦点。 进入第三部分,咱们来看看有了这个能力,怎么帮你彻底告别复制粘贴,变成全自动日常办公神器。 试想一下,如果老板让你从网页上手动抠五百行数据到 excel 里,是不是想想就头大?现在呢,你只要像屎丸小弟一样,用大白话下一道命令,嘿,帮我提取一下数据, 刚才提到的隐形小助手马上就会接管。他自己去移动鼠标框选数据,按下复制,然后自己打开 excel 表格,把数据格式调得漂漂亮亮的粘贴进去,全自动一气呵成。 当然了,他的本事可不止填表格,日常那些特别繁琐的琐事他都能包圆。比如代替你一行行去填那些枯燥无味的网页表单,或者把工作群里乱糟糟的聊天记录,自动给你整理成一条条清晰的任务。 甚至他还能看懂设计图,直接帮你写出网页代码,或者干脆根据你给的大纲,直接啪的一下给你自动做好一套精美的 ppt。 看到屏幕上这个数字,二十四了吗?对,没错,二十四! 它的自动化功能,意味着你雇佣的这位虚拟员工,是真正意义上每天二十四小时连轴转的。晚上你大可以安心去睡觉。而你的这位好帮手呢,会在漫漫长夜里帮你盯着系统的数据大盘,把昨天积压的各种小毛病 bug 分 门别类整理好,默默优化你的工作流, 等你第二天早上睡到自然醒。泡好咖啡,来到电脑前,一份清晰完整的总结报告已经乖乖躺在你的桌面上了, 简直了对吧?那么第四部分,咱们对号入座一下,到底谁最需要这个帮手?他能怎么解决不同岗位的痛点? 你可能会想,这玩意儿对我这行有用吗?其实不管你是干什么岗位的,他都能精准地帮到你。如果你是个销售,每天对着 crm 系统挨个录入客户状态,点得头晕眼花,现在交给他,他替你自动点击登录、打字录入。如果你是个苦逼的运营,天天被一堆杂乱的数据折磨,他能帮你自动提取、清洗、排版。 如果你是个初级程序员,天天跑测试、修 bug, 那 他就是你专属的除虫小弟。发现没有,他对任何胡柳技术背景的小白都极度友好。 哎,那如果你本来就是个懂点技术的程序员呢?他还有个叫 worktree, 也就是工作树的傻手脚儿 们。传统干活只能一件一件按顺序来,干完 a 再干 b。 但现在你可以同时召唤出好几个 ai 小 助手,他们能在同一个项目的不同分支上,同时在那啪啦啪啦敲代码,互相完全不打架,最后还能奇迹般的把工作成果自动合并在一起,这工作效率绝对是开挂级别的。 接下来进入第五部分,咱们也得客观一点,网上现在传的很神的一句话就能做个游戏,到底是真是假?咱们来个现实大揭秘。 其实啊,现实情况稍微有点骨感,并没有网上传的那么神,他确实能瞬间给你画出好看的图片素材,搭出个游戏的基础代码,但这顶多也就占了整个工程六十百分之的基础工作, 剩下四十百分之的关于游戏的打击感好不好玩,界面细节的微调,这些依然需要你这个人类亲自上手去打磨,才能搞出一个百分之百完美的作品。 但是咱们算笔账啊,以前你想做这么个游戏原型,得花大价钱请个开发工程师,吭哧吭哧搞上整整一个月吧。现在有了它打底,你只需要花短短一个小时就能把基础流程跑通,从一个月压缩到一个小时,这可是整整十倍以上的效率提升,绝对是一个不可思议的跨越了。 最后第六部分,也就是今天我想给大家传递的最核心的理念,你来指挥他来执行。这个虚拟员工给你带来的最核心的价值,其实是一场职场身份的巨大转变,把你从一个埋头苦干的执行者,把高成了一个统筹全局的决策者。 当你把那些枯燥的像机器一样重复的电脑操作全都甩给 ai 去执行之后,你在公司的价值就不再取决于你手速有多快,能不能一天复制粘贴完一千个表格了,而是取决于你做出的战略判断到底有多精准。 所以聊到这儿,我想问问屏幕前的你,既然懂了这些,你准备好坐上指挥官的位子,去雇佣你人生中第一位全能的虚拟 ai 实习生了吗?你的第一道命令又打算让他替你干点什么呢?好好想想吧,咱们下期讲解,再见!

codex 做 ppt 真的 太绝了,我直接将论文丢给 codex, 再给他明确一些要求,大概十七页左右, 学校 logo 要出现在每页顶部等,并且告诉他做完之后用 wps 打开,然后他就开始执行 codex。 首先读 word 内容,这里是他用记事本先将论文的总体内容,哪些章节大概写了出来,提炼摘要,硬件软件和调试结果。 这里是生成的。 ppt 的 内容非常详细,把论文中的每个章节也都包含在内。接着把答辩逻辑从排成背景方案,硬件软件测试和结论 图片也不是随便拼凑的,他直接从我的论文里提取电路图实物图和系统截图,生成之后继续渲染预览,检查标题版式页码和图片有没有跑偏,都非常规范,总的来说还是非常满意的。这里是 codex 在 执行命令的的过程和进度都能看到。

嗨,大家好,我是小陈,前面已经教大家使用 colode code 接入了 deepsafe, 这一期的话教大家 codex 接入 deepsafe, 其实 codex 和 code 差 colode code 的 接入方法差不太多,只不过要比它多一个 c c x。 第一步的话,呃,首先还是下载这个 note g s 主播是以 macbook m r pro 为例出的一期教学视频,然后第二个的话,两个都是差不太多的, 就是 windows 和 macbook 都是差不多的,然后第二个的话就安装那个 codex 的 一个本质就是他的桌面版,然后第三步我们直接从第三步来,我是苹果的,我就下载这个。好,下载完成以后给他弄到桌面上, 然后双击解压它,然后解压完成以后把这个东西丢掉,然后再回来,我看我们的教程。好,解压完成以后点击 mac, 然后这里可以看得到,看得到我们的一个。嗯, 首先是这个 e n v 的 这个 e n v 的 这个东西,这里 这个的密钥的话是等一下我们启动服务以后的一个访问密码,然后我们这里我们按照教程来,先是运用这个指令直接去点双击,它是打不开那个文件的,我们要用终端切换到桌面的这个文件夹,然后给他权限, 给他权限以后,然后再给他加上这个这个东西这个指令,然后再给他启动服务, 等一下我们可以先不着急启动服务,我们可以看一下这个,呃,这个文件夹啊,是,是不是有一个 e n v? 好 的,我们看有个 e n v 对 不对?然后这里是密奥,现在是一二三四五六,对不对?我们可以把它改成六个六, 然后把它保存一下,然后在这边的话我们再启动服务。 好,可以看到我们的服务已经启动了,然后把这个管理地址复制一下,随便用哪个浏览器都可以打开。好的,这里要输入密钥,刚刚是一五个六。呃,六个六吗?一二三四五六。好的,看一下,没问题,访问。 ok, 没问题。 然后这里弄好以后,大家可以把这个切换为简体中文,然后现在的话我们要添加渠道,我们是 dbc 的 话,我们首先找到我们的呃, dbc 的 一个开放平台,然后 我们先创建一个 apikey, 随便打,随便打,创建一个,然后复制过来,复制过来以后,然后添加一个渠道,然后第一行添加这个东西,然后第二行我们找到这个接口文档,然后把这个东西复制过去, 然后复制过去以后,然后这里有个详细配置啊,我们点击详细配置,然后复制类型,选择 open ai 的 卡槽,然后滑滑滑,滑到最后面,把这个呃规范化给它打开,然后创建渠道。 ok, 这边创建好了,对不对?然后 配置配置已经好了,然后我们找到那个 cc switch, 我 们把 cc switch 打开。 好的,然后这个是我前面配置的,现在我把它把它删掉,教大家重新配置一下, 点击添加。在哪里呢?找到中间这个就是 open ai, 第一个是圆了我们的可可扣的,第二个的话就是我们的 open ai, 就是 这个 codex, 然后点击加号自定义的,然后 名字可以随便写,你又可以写 delete, 然后呃链接不要,然后 这里的密钥的话,就是刚刚那个六个六,一二三四五六六个六。好,然后 api 的 请求地址, api 请求地址在这里啊, api 请求地址, ok, 大家不要把这个窗户关了,关掉了,关掉以后那这边就就连连不上了,就是 codex 就 不能正常访问了。 我那个教程里面有让他就是一直在线的,就是后面这里不想每次都挂着终端,让 c c x 后台静默,这里有方法的大家可以尝试一下。 好的,我们来获取一下,先获取模型,可以看到已经获取到两个了,这刚好是 v 四 pro 和那个,然后我们点击添加。 好的,然后我们把这个 dbc 可进行使用。使用以后怎么验证呢?打开我们的 codex, 这个是前面的,我们现在看一下能不能连通了,我发个你好过去。 好了,这里是有问题的,我们把它先退出去,重新启动一下, 我们重新打开我们的 codex, 等一下, 等待它打开, 把它打开了,然后这边我们来测试一下有没有连接上。发个你好过去把这个先删掉 哦,可以看到是有问题的,那我们来看一下是哪里配置有问题,这边是可以的,运行中没有问题 哦。大家知道是为什么吗?是我们点的时候,我们点到后,点到,点到其他地方去了,点的可能是第一个可的扣子的,然后我们又把它这里给他删除一下, 我们找的是这个 codex, 配置也是一样的,把这边的复制过来,我们去第一个格子扣的,大家到时候配置的时候一定要看清楚, 复制一下, 然后找到这个 codex, 然后粘贴过来,然后这边的 这边也复制一下,把它粘贴过来。好的,然后在配置这里,然后我们找到 open ai, 然后往下滑,找到这个规范画非常键。 ok, 创建一下。创建完以后,然后我们再来看一下, 再来发个。你好,看一下, 可以看下终端。 可以了,这边应该是没有问题的。好的,已经来了,我们这可以干嘛呢?打开浏览器,搜索 codex 的 相关内容, 尝试一下,看它能不能打开。 然后我们点击 yes, 他打开的是谷歌的呀。那我们可以跟他说一下,你可以说让他打开 e d g 的 浏览器进行搜 索回车。 ok, 那 这边他就是打开的 e d g 的。

你有没有遇到过这种情况,写代码时卡在一个函数上,翻来覆去查文档,或者想实现一个功能,知道逻辑,但懒得写细节。如果有一个 ai, 你 告诉他帮我写一个读取 csv 文件的函数,它就自动生成代码,是不是很爽?这就是 codex。 codex 是 open ai 开发的一个 ai 模型,它专门针对代码进行了训练,能理解自然语言描述。自动生成代码,你可以把它想象成一个懂代码的助理。你说需求它写代码,你不需要记住所有语法细节,只需要描述清楚你要什么。这一系列,我们从零开始。 codex 是 什么,怎么装,怎么用, 怎么把它变成你的编程搭档。无论你是专业开发者,还是刚学编程的新手, ai 编程助手都能帮你提速。这一级,我们先搞懂概念,它不是要替代你, 而是让你更强。 ai 编程助手不是新鲜概念了, github, co pilot, co dex, cursor 这些工具已经在改变开发者的工作方式。它们不是自动编程,你不需要写一行代码, ai 帮你写整个项目还不行?它们是辅助编程,你负责高层的设计、逻辑审核, ai 负责低层的代码生成、股权重复性工作,你可以把它想象成截。对编程,你有一个搭档,你说我们来写一个排序函数,搭档立刻写出来,你觉得不对,让他改,他马上改。 ai 不 会累,不会烦,不会请假,他二十四小时在线,但你永远是驾驶员。 ai 是 副驾驶,方向盘在你手里。 ai 的 建议你可以用,也可以不用,最终决策权在你。这就是 ai 编程助手的定位,增强你, 而不是替代你。理解这一点,你就不会对 ai 产生恐惧,而是把它当成工具。 codex 有 两个主要形态,一个是 github co pilot 背后的引擎集成在 id 里。另一个是 codex c l i 命令行版本。这一系列我们主要讲 codex c l i。 codex c l i 是 什么?一个命令行工具,你打开终端, 输入 codex, 你 想让代码做什么,它就会生成对应的代码,直接显示在终端里。不需要打开 i d e。 不 需要配置复杂的编辑器插件。在任何地方,服务器、云主机甚至平板电脑,只要装了 codex cy 就 能用。它的定位是精量级终端优先,即用即走,适合三种人, 第一,喜欢用终端的开发者,不用切到浏览器查文档,终端里直接问 codex。 第二,需要快速生成代码片段的人,比如写脚本,处理数据自动化任务。第三, 想把它集成到自己的编辑器或脚本里的人。 codex c l i 可以 和其他工具配合,形成自动化工作流。 codex c l i 不是 要替代完整 ide, 而是给你一个更灵活的选择。传统代码补全和 codex 有 什么区别?传统补全,比如 ide 里的智能提示,你输入 deathget 下划线,它会提示 get 下划线 name, get 下划线 value。 它基于当前文件里已有的符号, 猜你接下来要打什么字。像一个智能输入法,你敲拼音,他猜汉字。 codex 不 一样,你输入写一个函数,从 api 获取数据,并解析 j s o n。 它生成完整的函数,包括请求异常处理, j s o n。 解析它不需要你已经有类似的函数。 传统补全像猜单词,基于已有的词汇,猜下一个字母。 codex 像写作文,给你一个题目,它写出一篇文章。传统补全帮你省打字的功夫, codex 帮你省想怎么实现的功夫。举个例子,你想写一个读取 csv 并计算平均值的函数,传统补全只能在你打出 pandas read 下划线时补全。 pandas read 下划线 csv codex, 你 输入描述它生成整个函数,包括 import pandas read 下划线 csv mean return。 两者不是替代关系,是互补。传统补全打辅助, codex 打主攻。 codex c i i 适用于哪些场景?我总结了四个。第一,快速原型。你有一个想法想快速验证,比如写一个脚本, 抓取某个网页的所有链接,你用 codex 生成代码考一下,看到结果不用花时间回应语法,查文档。第二,学习新语言。你想学 python, 但不确定怎么读文件,问 codex 用 python 读取文件,主行打印它生成代码,你看一遍就懂了,比看文档更快,更直观。第三,一次性脚本。你平时主要写 java, 今天需要处理一批 csv 文件,不想打开 i d e 建项目,就用 codex 生成一个临时 python 脚本,用完就扔。第四,代码解释,别人写了一段复杂的代码,你看不懂,贴给 codex 解释这段代码做了什么,他会用自然语言解释逻辑,适用人群很广。新手程序员学语法,写练习,老手程序员省时间写样板代码运,为工程师写自动化脚本处理数据,数据,工程师生成数据处理 cutline, 产品经理快速验证想法,不依赖开发资源。场景很多,核心只有一个,你想写代码,但不想从头写细节,用 codex c i i 工作流程非常简单。六步,第一步,你描述需求,用自然语言,越详细越好。比如写一个 python 函数, 输入是文件路径,输出是文件的行数,而不是只说统计行数。第二步, codex 理解语义, ai, 分 析你的描述,判断要生成什么类型的代码。第三步,生成代码,通常几秒钟,终端里就会出现代码。第四步, 你查看结果,检查代码是否正确,逻辑是否符合预期,如果不对,没关系。第五步,可叠代修改,你可以说不对,要跳过空行, codex 会基于对话历史重新生成。第六步,采用或修改代码,满意了,复制到你的编辑器里,或者手动微调一下整个流程的核心,你不是在写代码,而是在指挥 ai 写代码。 你的角色从打字员变成了产品经理。你描述需求, ai 实现,这不意味着你不会写代码了。相反,你需要更清晰地表达逻辑,更准确地判断代码质量。这是一项新技能提示词工程,来一个真实案例。你需要在项目里验证邮箱格式,传统做法, 回忆正则表达式语法,查文档,写代码测试用 codex, 你 在终端输入 codex, 写一个函数,输入邮箱地址,验证格式是否正确,返回 true, false。 几秒钟后, codex 输出 python import read def validate 下划线 email email pattern 等于二,反斜杠 w 反斜杠加 f 反斜杠 w 反斜杠加反斜杠,反斜杠 w 加美元 return rematch pattern email is not none。 它自动导入了瑞模块,它写了正则表达式,大部分人不愿意自己写,它返回不耳直,你不需要知道正则表达式怎么写,你只需要说验证邮箱格式,你可以进一步迭代,如果邮箱为空,返回 false, codex 会在刚才的基础上修改。这就是 ai 编程助手的威力, 描述意图,它处理细节不是说你不用学正则表达式了,而是你不用每次都用。把重复性、样板式的代码交给 codex, 你 把精力留给更重要的逻辑。怎么从零开始上手 codex c l i 五步学习路径 第一步,了解概念,你已经快完成了,理解 codex 是 什么,能做什么,不能做什么,这是最重要的一步,不会用错工具。第二步,安装配置 java js 环境,用 npm 安装 codex c l i 配置 api 密钥,这个我们下一集会手把手教。第三步,基础使用,学会最简单的命令 codex 你 的问题, 尝试生成简单代码,感受一下。第四步,提示词优化,你会发现描述越详细,代码质量越高。比如写一个排序函数和写一个快速排序函数,输入列表,返回新列表,后者结果更准确,提示词是一门新学问。第五步,集成工作流,把 codex 集成到你日常使用的工具里,比如 vein 插件 vs code 扩展,或者自己写脚本调用。整个学习路径从零到会用不到一小时,比学一门新语言快多了,因为 codex 的 接口是自然语言,你已经在用了。这套视频会带你走完前四步。第五步,靠自己探索 也不难。 codex c l i 的 环境要求高吗?不高,硬件方面极低,你能看这个视频的电脑就够了。 codex c l i 本身不运行 ai 模型,模型在 open ai 的 服务器上,你的电脑只负责发送请求,接收结果,不需要 gpu, 不 需要大量内存,不需要高端 cpu。 软件方面, 第一, node js 十六或更高版本,去 node js 点 org 下载安装,装完后终端输入 node v, 看到版本号就行。第二, npm, 装 node js 时自动带上的 apmv 检查。第三, openai api 密钥,你需要注册 openai 账号,绑定支付方式,生成 api 密钥,这个下一集会详细讲。第四,终端, mac 用 terminal, windows 用 power shell 或 cmd 用 bash, 你 已经有了总结,你能上网,能装 node js, 就能用 codex c l i, 不 需要折腾派送环境,不需要配置 g p u 驱动,不需要买新电脑,门槛极低,事实不亏。快速回顾这一集,第一, ai 编程助手概念,人机写作,你负责设计, ai 负责实现。第二, codex c l i 定位,终端里的编程副驾驶,轻量灵活,即用即走。第三,与传统补全对比,传统补全猜下一个字, codex 听需求写作文。第四,试用场景,快速原型,学新语言,一次性脚本代码解释,新手老手都能用。第五,工作流程描述需求, ai 生成,你审核迭代,采纳,你是产品经理, ai 是 程序员。第六,案例展示,一句话,生成邮箱验证函数,待正则表达式和导入。第七,学习路径,五步,从零到上手不到一小时。第八, 环境要求,能联网的电脑加 node js, 加 a p r 密钥,你现在知道了 codex 是 什么,能做什么,为什么需要它,它不是要替代你,你的判断力、架构能力、业务理解,这些 ai 暂时替代不了,但 ai 可以 帮你省去繁琐的细节,让你专注于更高价值的事情,我们下期见。

我太激动了,我的扣代词已经连续工作了十三个小时了,然后他还在自己干活。扣代词他最近上线了一个新功能,叫 go, 那 这个 go 是 什么呢?简单来说就是你给他一个目标之后,扣代词会把后续的工作围绕这个目标持续的去推进,他还能跟踪状态,耗时跟投跟的使用。 以前我们做项目的时候,哪怕计划方案写的很清楚很详细, ai 也很难一次性的去做完,他会分很多个阶段去做,每次之前完一个阶段,你要去验收,有问题还要跟他多次的去沟通修改,然后再一次去推进。别的阶段,你就需要一直守在电脑前。 说实话,自从使用 ai 编程之后,我基本上很少有周末休息的时间了,不知道有没有相同感受的朋友。但是我今天第一次尝试购给扣代斯设定了一个目标之后他连续工作了十三个小时,我今天白天就出去玩了, 我真的可以不用一直在电脑前去守着了。虽然扣代斯之前也有 remote control, 可以 让我不用一直在电脑前守着,但是在验收某些需求的时候,用手机去调试查看,其实还是不是很方便。 那以前最痛苦的不是 ai 不 够聪明, ai 它会读代码,会写代码,查报错、跑测试,但问题就是它不够让人放心, 它很像一个能力很强,但需要你一直盯着的人。所以很多时候你以为自己在用 ai 干活,但实际上你是在给 ai 当主管,你不敢真的把一个复杂任务交给他,他随时都可能会停在半路。但扣代斯这次更新的这个 go 这功能让我第一次觉得这个状态改变了, 他不是回答完这一轮就结束了,他会一直记得自己要完成什么,会读代码,改文件,看失败日记,失败了再改,改完再测,测,试完再去判断这个目标到底完成没有,他知道自己这个目标没有闭环,就会继续接着往下做。 那怎么使用这功能呢?其实也很简单,你只需要打开勾带子,然后输入斜杠目标,然后选中之后就把你要让他做的事输入上去,他就会不达目的誓不罢休的给你干了。我觉得勾的价值就在于他开始让勾带子围绕一个结果持续推进,他改变的是你使用 ai 的 方式。

大家好,今天我们开始讲 codex 的 入门系列,这期我会从零演示一遍 codex 如何安装,怎么打开项目,怎么让它整理资料,分析表格,最后再基于结果生成一张图片。 看完之后你基本就知道第一词应该怎么用了。很多人第一次听到 codex 会以为它只是给程序员写代码的工具,但是我觉得它真正有价值的地方远远不止写代码它。你可以把 codex 理解成一个可以围绕你电脑资料工作的一个 ai 助手。 相比于传统的这种聊天式的 ai 工具,他不是你问一句,他答一句,他可以基于你指定的文件夹去理解里面的文档、表格、截图和各种资料,然后帮你整理分析跟生成结果。 比如说你要做调研,他可以帮你整理资料,你要做计划,他可以帮你把零散的信息变成了行动目标,你可以分析表格,你可以去提炼脚本大纲,甚至生成配图等等。 所以我觉得 codex 对 于普通人也很有价值,只要你的工作经常发生在电脑上,需要处理文件资料啊,调研等等,我就觉得你应该试一下。 好,今天我们首先从安装开始。安装很简单,我们第一步需要打开 codex 的 官方网站,根据你的系统选择对应版本啊, mac 就 选 mac, windows 也可以, windows 安装过程跟普通的软件差不多,就按照提示一步一步完成就可以了。安装完成以后,打开 codex 登录你的 chat gpt 的 账号 啊,然后第一次登录的时候,他可能会让你选择主要的用途,那这我们可以看到这他是有一个工作模式,你是主要用于编程还是日常工作,这个之后都可以修改,但是如果你选择编程的话,他的回答会更技术性一点,更细节一点点。 登录之后你就来到了这个 codex 的 主界面,这个界面可以简单理解成三个区域,左边这块是这个项目跟任务列表,中间是你跟 codex 对 话的地方,右边通常会显示他正在处理的内容啊,或者可以生成的结果等等。接下来讲第一个概念叫做项目, codex 里面的项目本质上就是你对应你电脑里的一个文件夹,你选择哪个文件夹, codex 就 围绕这个文件夹里面的资料来进行工作。我这里用一个普通的例子,比如说啊,我这里可以选择添加新项目,使用现有文件夹就可以找到你自己对应的一个文件夹去作为你想工作的一个区域。 这里准备了一个很普通的例子,周末去杭州玩两天,这个文件夹里面有一些零散资料,比如说旅行笔记,想去的地方,想吃的店等等,也有一些截图、天气或者是酒店的一些路线信息。 在这个下拉菜单,这可以指定你想要的这个项目的文件夹,在这使用现有文件夹就可以指定你的工作目录,比如说我们可以简单看一下他们前 直接在这对话的形式告诉他啊,你可以查看我这个项目下面的一些文件等等。 比如说如果这我想要他帮忙整理这个文件里面的一些资料,比如说整理一个对应的杭州旅行计划, 我们可以通过语音的形式,在这有一个语音的形式,帮我整理一份杭州周末的旅行计划,内容包括目标行程安排,预算,需要提前准备的事项,以及如果下雨的备用方案等等。啊,需要 dog 的 文档,然后有图文, 对,然后就有语音的形式,在这我们可以选择它的智能的一个高低,一般来说高就足够了,然后除了这个智能,就是它的思考的一个深度, 如果是特别复杂的问题,你就可以选择超高,但它对应消耗的 token 会更多一点点,然后在这儿你可以选择对应的模型,现在最新的就是叉 gdp 五点五的这个模型,速度一般就是有标准跟快速,然后快速会一点五倍的快,但是同样的 token 数会增加。在这我们为了演示选择快速,我就开始 看,经过了这个两分二十秒,他就生成了这个文档,我们打开看一下,那就生成了一份两天两晚的旅行计划,有一个目标概,里面有图片也有表格,有对应酒店的一些住宿的建议, 以及两晚的一些价格,餐厅的一些备选,总的来说是非常全面,也非常友好。对于这种复杂文件整理的情况来说,帮我们完成了多的一个信息整理, 这也是 codex 跟普通的聊天工具最大的区别。普通的聊天工具需要在兑换框里面,你反复的复制粘贴文件,然后告诉他怎么做,他再告诉你怎么做,你可能需要去,然后你自己再去操作。但 codex 真正就是 在你指定的这个文件夹里面去读写,去生成你想要的文件,真正帮你去完成了这工作,我们可以看一下在对应的项目下面,他已经生成了这一份文档,相当于你就不需要去手动的去啊复制粘贴很多重复工作。 你可以想象一下,如果你是学生,你可以把论文资料啊,阅读笔记放到一个啊文文件夹,然后让他去生成论文。提高啊,你是做运营的,你同样也可以把这个沟通资料表格,会议记录,让他生成一个执行方案等等。销售啊,可以让他去根据你的客户资料和沟通记录进行一个跟进的计划, 所以这个就是 context 真正有用的地方,他不是给你建议,也不是告诉你怎么做,而是直接帮你去处理资料生成结果啊,这到就会极大的提高你的工作效率。 接下来我讲第二个概念,就是啊县城,就是对于同一个项目来说,你可以啊开多个县城,比如说这是这个项目本身,然后我们可以开,同时在这下面开一个新的,就叫县城,比如说分析一下,在这我想让他帮忙分析一下预算, 这样它会读写里面的一些表格啊,然后生成表格啊等等啊。同时我还想要调用这个啊, x g b t 的 那个深图模型,那么目前这个模型也是市面上深图能力最强的。 对,这样你看我们在左边就能看到转圈的,是正在运行的,然后黄蓝色的小点表示已经完成,这是帮我们那个预算的,它能够生成一个像 csv 的 一些信息,然后它也能够读取原本里面的一些信息啊,对, 让我们再看一下这个 啊,经过这个几分钟他就生成了啊,然后他就生成了一个图片,我们可以看一下效果啊,还是很不错的。就是根据我们刚才的一些旅行安排,然后生成了一个啊,非常清晰,然后也很信息量比较全面的一个旅行安排。对, 然后这个地方有一个点我也想介绍它的功能,比如说在这个工一开始的过程当中,他是尝试生成一个 svg 的 图片,然后没有调用他的,我想他调的那个工具叫 emoji 键啊,在这儿,所以我就用这个,在这个地方可以打断他,比如说用户他还在生成当中,我可以直接啊, 直接去发送,然后他就可以可以调整他的方向啊。另外大家也可以在这个设置地方可以看到自己的一个使用量,在这个地方设置 下面有个剩余用量,他这边有一个每五小时跟一周的一个限制啊。一般来说如果你是叉 g t 的 plus 账户的话,就是啊,你进行一些高强度的整理文章啊,调研啊来说,一般来说是没什么问题的啊。然后 open i 也经常时不时会重置他们的这个限制啊,所以说相比克拉扣的来说,这一点是非常好的,有点量大管饱的意思, 哎,我们回顾一下这一期,就是第一个就是首先 codex 它不只是写代码,它更像是一个可以围绕你电脑资料这么工作的一个 ai 助手。第二个是 codex 里面的一个概念就是项目,项目本质上就是你对应你你选择的一个文件夹。第三个就是同一个项目里面可以开多个县城啊,不同县城处理不同任务 啊。第四个就是啊,他可以帮你整理资料啊,分析表格,生成图片等等一些工具啊。第五个就是你怎么样去看选择模型,速度以及以及查看你的使用量等等。 这一期只是一些基本的一些概念,但是以及能够看到 codex 的 一些核心价值啊,他不只是在告诉你怎么做,而是真的去帮你去完成一项工作啊。 下一期我们会继续讲一些更进阶也更实用的功能,比如说插件呢啊,技能啊,智能浏览器辅助自动化任务,以及啊怎么把一个复杂的任务拆解成几步让他啊连续几天或者上周的去持续的运行啊。这期先到这,请大家继续关注这个系列。

来看一下秋之 codex 的 一个教程,那首先来看这 codex 和 cloud code 的 一个区别,本质的话都是一个编程的 agent 转为一个通用的 agent, 一个的话是 anthonpy 公司,一个是 open ai 公司开的模型,那个支持 codex 的 话,请用这个 open ai 的 一个 gpt cloud code, 它可以替换任意的模型,你可以接入 deepsea, 对 吧? 接入一些其他的 kimi 啊,什么国产的一些大模型,易用性的话, codex 更友好,适合零基础的一个白领。 cloud code 它自由度更高,偏专业的一个开发者。 功能上来讲呢, codex 它强化了这个浏览器操作,它可以用,对吧?浏览器操作以及 computer use 内置 image 二,它这个深图的以及新增手机端加 hook, 手机端的话,它就是用手机就可以去操作。 cloud code 呢,功能更全。像这个 skill m c p 斜杠命令, hook 更新较慢。 skill m c p 它通用的接口一样的斜杠,用斜杠命令也可以操作斜杠命令,就像那个编程去写那个斜杠命令嘛, hook 更新较慢, 那这个 hook 的 话就相当于是钩子 hook 的 话,它其实就是一个自动地去调用的一些命令, 它就是相当于说呃有一些自动开呃自动触发的一个条件,自动触发的条件更新较慢。价格维度, codex 二十刀的会员的话,对于就白领重度水温的话都是够用了,不分号。而 cloud code 的 话是按这个 api 的 一个调用计费, a 这个 a p i 的 话,它就是去调用,调用这个什么,就调用这个 deepsea 它的一个这个接口去起用这个所呃用的这个额度, 但是我们自己在 deepsea 里面的话,它是就没有 api, 那 我们这个因为你就 cloud code, 它要用别人的模型,这个的话就要去计费了。适用的场景, codex 的 话,它可以用在日常那个办公解决问题, cloud code 的 写作规划,那编程的话,两者都可以给它结合在一起用是最好的。 然后 codex codex 的 安装与基础设置,首先要准备这个 chat gpt 的 一个账户,用免费或者是付费都可以的,它付费的话它就额度更高一点嘛。安装的话就是官网下载安装登录账号初使用的一个设置, 就选择一些日常的工作,选择你的一个什么身份呢?比如说你是学生,是白领,然后你是设计工作什么的。界面来说的话,它是左侧是对话任务管理,中间是进行聊天,右侧的话是输出结果,是非常简洁的一个界面,左侧的话是一个 任务管理对话,中间聊天,右侧就进行结结果,右侧的话就输出这个结果。核心的能力, codex 核心的能力,它与这个 cloud code 与其他的它特别 不一样的一点呢,它是本地的一个文件操作,本地文件操作项目关联,直接去绑定,绑定本地的文件夹,自动去读写,呃,增增删移动文件,不限数量。就比如说 cloud code 的 话,可能你想要让它处理一些文件的话,你就得 呃把这个文件给它上传到云端什么之类的,但是它这个本地的话,你只要去这个文件夹的一个路径给它写上去,那它能自动去读写增删移动文件,就比如说就是你有,有就是几百个,呃, 照片的一个素材,它不限数量嘛?照片的素,视频的素材,但是没有改名字,没有改名字怎么办呢?你可以这样子,需要这个 cloud code 去识别, 识别这个视频里面的内容,给它起一个合适的名字。那 cloud code 的 话它会自动运行去抽帧,就就是这个视频里面去抽几帧,去识别它的核心的内容。比如说雪地上的狐狸这样,然后它就可能给它一个序号,雪地狐狸, 对吧对吧?然后地点,然后在这个对象是什么?嗯,就这样子能够把几百个几百个这个视频它的一个名称都给它修改了。权限模式,就权限模式的话就是你给这个 codex 它的一个权限, 嗯,修改的一个权限默认的话是在文件夹内操作外外需的话就是齐全 自动审查,就 ai 自己去判断。自动审查,自动判断是推荐新新手完全反问全全全部的权限,就是说可能他把你一些东西都改了,删除了,慎用上下文的管理,自动手动压缩或者是斜杠去 给他进行压缩。上下文管理为啥呢?因为上下文的话他就是一个提示词的上下文,他会可能会给你消耗比较多的一个额度, 所以你给它进行压缩,当它就是已经处理到比较下面的任务的时候,可以把它的上下文给它压缩一下。 查看额度的话在设置设置栏里面去看这个状态,能够查看额度案例的话,就是视频的素材批量进行重命名,以及视视频的剪辑合并,都可以用这个 codex。 命令行工具,使用命令行工具的话就像是我们 嗯,电脑就嗯给他就 command, 给他呼起一个,对吧?嗯,比如说让他关机,那你写你就可以 就就是可以就通过通过输入那个文字让它关机,而不是用鼠标的一个操作,这个叫做命令行工具安装。可这个命令行工具可以怎么用呢?首先就是比如说可以安装这个 nod, js、 git 等基础的一个工具部署 agent, 像这个 hermes cloud code, 你可以直接在对话框里面跟他说帮我部署这个 hermes cloud code 等软件的一个管理是什么?像这个 cursor, 然后飞书 cleet, 它这也是命令行工具等的,就给他用安装技能工具。技能工具,你比如说我要去找一些 skill, 也可以让他自己去找飞书 c, 就是 飞书的命令行工具给它安装进来。并行任务是它的一个特特点, 就是多个对话同时执行不同的任务。你可以因为像豆包啊,像 deepsea, 它们都好像就就只能是当前的一个任务,给它回答完了之后它再去做别的,对不对?但它这个完全是可以并行的,就是多任务同时去 执行不同的一个任务。比如说我这视频素材批量重命名和视频剪辑合并的话,两个,或者是说你你另外一个,你去找一个合适的一些图片,合适的一些字体,对吧? 这两个任务是完全不耽误的,可以并行。而且这个理论上的话就是看你电脑的性能,它可以并行特别多的一个任务。 持久的记忆,手动记忆就是 agent md 的 话,全区性、项目性的手动记忆。 agent md 它就什么叫记忆呢?就是一些规则嘛,就是一些规则指令,像全区的话,在设置 设置里面个性化自定义指令,全职生效,它就是对于所有的工作它都就是,比如说你自字体是多少或什么样子的,是吧?它是全职生效的,像项目级就是指对这个项目生效的一些规则的一个记忆,你可以在项目里面手动地去创建 ai, 或 是说 ai 生成。 ai 怎么生成呢?你可以就比如说这个项目进行到一半啊,进行到一定阶段的时候,你可以让这个 ai 去生成一些, 就就是这个全呃,就项目的一些指令。自动记忆,自动记忆开启后对话闲置、自动总结、储存消耗额度,它是不建议手动改。什么叫自动记忆呢?它就是相当于 ai 的 一个自动记忆的功能嘛,就你的一个工作风格,你的一个 偏好什么之类的,有各种各种维度的,那它的话, ai 的 话它会自己进行总结,总结一些规则,然后可以有一些附用的经验的话,就是下一次的话它就会用。还有是 往下看呢,它是一个持久记忆。就图片生成与项目开发内置了 image two, 你 可以用一些就是提示词去生成这个高级感的一个图片, 而且可以不断的去调整自己的一些提示词,什么之类的。计划模式可以去做一个网页 复杂的任务,先列计划,再执行计划模式,他有点像是那个开发的模式案例的话,就比如说个人主页的一个开发,深层修改、预览部署是怎么生成呢?他个人主页的一个开发,你首先跟他说自己的这个 想法,那他的话会给你列出计划的一步一步,而且在每一步上面,他比如说你这高级感的一个图片的话,他会让你去选择某些风格的, 就一步一步去选择,他会给你三四个选择,那所以深层修改,而且右边的话,他可以预览整个个人主页的开发的一个效果, 最后部署的话可以就发布出去使用的功能呢?任务引导纠篇任务引导纠篇是什么意思?就是说你在完成这个任务的时候,你纠篇,你觉得啊,他这个说的不太对了, 你跟他说的话,他其实不会打断这个任务,只会在下一次的时候进行一个调整,这样的话就不会浪费很多的这个额度,嗯,而且也不会让他跑偏。对话分叉 fork, 他 是在就是整个 整个,呃,就是任务结束之后它会有一个 fork, 是 在这个右下角,右下角 fork 的 话,你会觉得它这是不是有点跑偏了你,你会想着说怎么给它纠正这个 fork, 这里面的话可以进行一些小调整。桌面宠物的话是 一个有意思的一个,就是小宠物在这边插件与操控常用的一个插件,它其实常用的一些插件的话,它就是一个 skill 啊, m c p, 然后包括 c c, 呃, c l i 的 这种 类似的一个集合就插件,它就是会实现一些功能浏览器的一个操作, get up, 然后表格 ppt net nullify however vocal 的 这个部署 browse use 的 话,它是浏览器的一个操作,怎么浏览器操作呢?它能够操控浏览器进行点击方页,然后表单自动化,就比如说你可以让它去做一个呃 m b t i 的 一个测试,或者说基于你的一个性格 去去帮你,帮你测试,它能够自己去选择,然后得出一个答案。 chrome 插件的话可以操控已经登录的浏览器,而且后台是它是在后台,后台多任务操作的,就根本不影响你,你自己去去做这个浏览器 的一个,对吧?你自己还要用这台电脑去浏览其他的页面,完全是 ok 的。 computer use 就 操控电脑的 app, 就 仅 mac, 比如说音乐微信剪映,比如说让它去打开一个音乐软件,把这个音乐发给微信,是吧?或者说就把这个音乐加到这个剪映里面,这个它可以操控这个电脑的 app, 仅在 mac 上是可以实现的。 skills 技能定义 skills, 比如 find skills, 自定义一些 skills 创建的话就是整个流程,流程跑通之后,你可以把这个整个流程怎么样,沉淀下来就附用,沉淀下来附用就直接指令,你就说,哎,就按照这个项目流程去创建这次的这个 skills 案例的话,比如说我想要去做这个 写一篇图文推荐的图文,就 get up 上面的一个热门项目的推荐图文,就在我就是不断地去给它调试后觉得这个结果是满意的,那就把上面的这个流程方法生成这个 skill 下一次, 对吧? ugetup 上面的热门项目就大概每周的话它都会更新,那它就是你每周可以做这个 skills。 m c p 连接 m c p 的 话有点像是 u 盘插口,插口去去把外部的一个数据连接外部的一个知识库服务去安装, 可以就是自己去做,也或者是说你直接让这个 ai 自动授权安装案例的话,比如说 notebook l m 的 一个知识库的连接,知识库连接之后你就可以直接去提问这个知识库里面的一个东西,调用知识库里面的一些 呃,就比如说它这里面存的一些呃反弹啊之类的。自动化定时任务创建的方法,可以在自动化面板上面创建,也可以直接跟这个对话,让它创建案例的话,比如说每周都给我 呃生成 get github 的 一个推荐图文,因为我们这个 skills 不是 已经沉淀下来了吗?然后现在的话就给它定时每周生成,那我们都根本不用去记这个事了,它就是它定它到,比如说周一或者什么时候它就会生成,或者说每日的工作日报的一个汇总, 它也能够给它定时生成,这就自动化的,自动化的那就怎么样子不用人为的去给它介入了。手机端的一个操控,前提的话就是这个手机要下载这个 check gpt, 然后电脑的 codex 更新到最新版本,操作的话就是手机端侧边栏的 codex 授权去连接电脑。 功能是什么样子的?手机端操控就是你远程你就电脑,对吧?你就开着那远程去下发任务,控制电脑干活, 直接能够控给他一个指令,他就能够控制电脑干活,免费版可用,支持 mac。 总结的话就是说这个 codex 的 核心能力是文件操控,而且是本地的一个文件操作命令行操作。持久的一个记忆,持久的记忆一些规则深图的开发 插件的操控 skills skills, 然后 m c p 的 话连接外部的一个知识和数据库自动化,可以自动化定时任务。核心的认知呢?我们现在已经从 问 ai 要一些答案,先到管理 ai 准备一些上下文的一个环境,制定目标,检验成果,去沉淀这个流程,去转变核心的认知。就是我们现在已经到了,就说从问 ai 要一些答案,到就是管理 ai 准备上下文,定目标,验 结果,然后沉淀这个,呃,流程,就让它这个整个流程的话给它自动化 sop 是 吧?