有没有朋友其实不怎么关心口袋到底有多牛,只想知道他到底能帮我们解决什么实际问题。 如果你跟我一样是比较实用主义的,那这一篇视频就是给你准备的。从三月份用到现在,我本来以为我很了解他了,但是实际用下来,他的能力总是一次又一次的超乎我的想象。 因为我最熟悉的就是用它去写代码,写文案,然后做短视频剪辑。但是其实它能操纵的东西远比我想象的还要多,因为最近我发现它可以直接操纵 blender 渲染视频,直接操纵 c 四 d 去画图, 甚至可以去操纵 copy u i 工作流。大家不妨可以拿自己手边常用的软件去试试,说不定它都会。那 codex 这次为什么这么火呢? 核心我觉得是被逼出来的,因为 gpt 这种对话式的工具,付费率其实是非常低的,常年只有百分之五左右,那 ai 公司靠这个就非常难赚到钱,反而是向 esrfic 推出的这种 cloud code, 专注于企业场景,率先跑通了 ai 盈利这条路, 估值这两天还反超 openai 了,即将突破万亿美金,那这对于 openai 来说就是一个非常大的威胁了。所以 openai 也要做一个对标 cloud code 的 产品,这个就是 codex。 那这种对标产品你要想做得好,要么你得更便宜,要么你得更好用,要么你得更简单。结果口袋思这一次几乎是全部都做到了,我自己用下来的感受是非常明显的,众所周知, cloud 真的 是太贵了。 所以说呢,口袋思刚出来的时候,我本来是拿它当个加油包用的,把一些杂活啊,整理资料啊,写文件啊,复盘啊这种内容挪过去,帮我省点 token, 降低成本。但是用着用着我发现哎,不对, codex 干出来的活,好像很多时候质量反而还更好了。那 codex 用起来呢?其实没有什么技巧可言,非常非常简单,它动嘴就可以了。 但是怎么给他下任务,怎么组织 ai 帮我们干活,这里面确实是有点门道的,我踩了不少坑之后呢,总结了三个经验给大家分享一下。第一个呢,就是我们要跳出专家陷阱,就是往往我们越熟悉的事,我们越觉得跟 ai 说半天,还不如我们自己干呢, 所以要么试都不试,要么浅尝辄止,就觉得 ai 肯定干不好。我就吃过这个亏,我以前是手搓工作流的,搭一个流程多则的时候要二三十天,所以我根本没有想过让 ai 来帮我。结果前两天我随手一试, 它真的连工作流都会搭了,真的是让我惊讶了一大下,所以我就赶紧逼我自己跳出这个思维怪圈。就是现在什么事我都先丢给 ai 试, 很多时候都会有一些比较惊艳的意外收获的,所以现在我都是顺着 ai 的 能力去调整我自己的工作流程,因为接下来 ai 是 主力,我是要打辅助的,让我少干活, ai 多干活。 那第二个呢,就是要给 ai 定好工作节奏。在实际干活的时候,我们就会发现,其实 ai 是 没有办法替我们做决策的,如果我们比较混乱,那 ai 出来的东西就很模糊。但如果我们非常清晰, ai 出来的东西就很靠谱, 那怎么才能让我们自己的思维更清晰呢?那关键肯定是我们得有足够的信息,我们才能做出好的判断。 我试了半天,我觉得现在比较好的流程就是先让 ai 大 面积的去调研,把相关的资料都帮我整理出来。然后呢,我再跟他讨论具体的执行方案,把一些细节理清楚,最后他再动手。这三步走下来,基本上出来的效果都很稳,都能直接用了。那第三个呢,就是尽量降低阅读成本。 因为我们天生是爱看图而不爱看文字的。在 ai 时代,我们完全可以享受到把我们所有要读的东西都变成这种格式化的形式,这种它不是 ai 生图方式做出来的, 而是让 ai 用 html 写代码的方式做出来的,所以它不但可读性高,而且信息的准确度也是有保障的。那我们可以把一些比如说 ai 调研回来的长报告啊,一些数据啊,都给我们整理成这种好读的形式,阅读效率真的是蹭蹭往上涨。 那是不是有了 codex, 我 们解决实际问题就随便挥挥手就能搞定了呢?我一开始也是这么觉得的,但真正动手去让它解决一些行业问题的时候,我发现这里面还有很多不是那么好用的地方,我一开始就在想是不是我哪一些方法和技巧用的不对, 然后直到这两天读了 open i 发的一个报告,才发现,就连 open i 自己下场去做一些垂类的事情, 都会碰到很多坎坷。比如说在这个 case 里,他们就派了自己的工程师去了一个会计师事务所联盟,帮他们去做一个税务相关的 agent, 但是呢,这个智能体刚刚上线的时候,大家猜猜准确率能有多少? 就只有百分之二十五,那就不能用的水平嘛,所以他们花了前前后后整整六个月的时间,反复的打磨,最后可以把这个准确率做到了百分之九十七。那他们到底是 ai 已经够聪明了, 卡点全部都发生在现实世界里,就要解决 ai 和现实世界交互的三个问题,第一个就是谁来检查 ai 出来的结果,然后第二个, 如果说 ai 发生错误了怎么纠正,然后纠正完了之后怎么让 ai 下次别再犯,那这些流程都属于为了让 ai 参加工作额外制造出来的,不是传统企业天生就有的。 所以这种组织上的改革反而要花大量的时间。但是改好了之后,效率的提升真的是非常惊人的。这个报告里面有一个会计师,他去年做税务整整花了一百八十个小时,今年类似的工作只有十五个小时,整整提升了十二倍。 从这个 case 和我自己去解决一些行业问题实际问题的经验来看,如果我们想要用 ai first 让 ai 成为企业的第一生产力,那我们就要围绕着 ai 的 工作方式去重构我们自己的工作流程,谁能率先有一些好方法,是真的会挺占优势。
粉丝2.8万获赞4.2万

ok, 重头戏来了,这一期主要给大家讲一下怎么使用 codex 和其他工程软件连接,然后完成一些工作。首先的话是 thirdworks, 我 们可以看一下它的工作流,可以看出 thirdworks 不 需要接 mcp 的, 它是会调用 thirdworks com 口,然后通过 vbs 脚本进行建模。也就是说我们只需要给它工程图或者描述我们自己的需求就行, 它自己也能打开 thirdworks, 但是我们自己打开的话会省很多启动时间。第二个的话去 matelab, 我 们看一下它的工作流, matelive 也不需要接 m c p, 我 们也只需要描述自己的需求就行。第三个的话就是 ency, ency 是 需要接 m c p 的, 但是我们可以让他自己接好,就是我们给他说一下,给 ency 接一下 m c p 就 行, 他就会自己接好。接好 m c p 之后,我们就可以通过脚本仿真求解了。当然以上这些操作,包括想要达到我在视频中展示的一键全自动生成,都是给他开放的完全访问权限不, 如果开放这个完全访权限也有一定的风险,大家可以根据自己的需求选择开不开。呃,当然也可以开这个默认权限或者是自动审查,这样的话他会在一些关键操作的时候征求你的同意,就很安全了。或者我们让他在指定文件夹工作,这样的话也很安全。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

就在刚刚, codex 的 电脑操作功能终于官方登录 windows 了,你看,我现在调用这个 computer use 电脑操控的功能,让他给我的微信发一个文件。你看整个屏幕有一个蓝色的渐变框,然后显示 codex 正在使用你的电脑。他已经打开了我的微信,选中了文件传输助手, 把我需要的那个文件发送给我了,整个流程都是他自己完成的。还有一个更有意思的,我让他直接在画图软件中给我画一个皮卡丘啊,你看,他正在操控我的鼠标,按照他的指令快速的会制整个速度。很快啊,我这里并没有加速,全程都是他自己在画,我感觉画的还挺好的,至少比我画的好。 之前在 windows 电脑上, codex 只能在浏览器中实现自主操控,但现在整个电脑都是它的了,比如微信、 word 文档,各种软件,甚至还可以在电脑上帮你玩游戏。因为本质上你和电脑的交互无非就是鼠标和键盘, 现在它也可以用鼠标键盘了,所以你能操控的它都能操控。具体怎么使用呢?通常来说,如果你的 codex 更新了,今天第一次打开它,就会有一个弹窗出来, 你直接把 computer use 开启就可以了。如果没有弹窗呢?在设置中找到电脑操控这里,我们把任意应用这里打开,你在对话中调用 computer use codex 就 可以操控你的电脑了。但注意,我在 win 十的电脑上似乎运行不了,只有在 win 十一的电脑上才可以。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!

欢迎来到我的频道,我是出城,今天这期视频我想了好久到底要不要出,因为基于前车之鉴,前段时间我有个视频是我假人偶呼吸的命中效果被举报了嘛,就是这个视频 跑了四十万,播放被下架了,心里还是挺难过的,想给我的粉丝们分享反决,但是要被一些人恶意举报,以至于现在我在做内容上会慎重考虑, 但想到我只是个两万粉丝不到的小主播,传播影响力不会太大,今天这期视频我还是决定铤而走险给大家分享 c o d x 的 使用,这个东西对编程行业的冲击会很大,我建议大家看完就直接保存,以免下架。 首先我们来到 codex 的 官方下载界面, codex 是 一款高级人工智能纸,它可以帮我们更高效的完成工作, 我们可以把它当做我们的研究助手,他可以直接交付完成了工作成果不限于简历、电子表格、换灯片、视觉素材、消息工具、自动化流程、原型方案以及代码改动,这里点击下载,下载好之后安装, 我们双击打开它会来到这样一个窗口界面,第一个是更新文件编辑查看窗口助手 最左边,这里是我们的工具栏,新对话搜索插件自动化移动版,在下面就是项目, 在下面是对话,然后是设置,右边这一块是我们的命令栏,我们可以在这里输入我们需要的内容 啊。这边有一个自动审查全盘,于是给他权限,有默认权限,自动审查完全访问权限。然后这边是项目,比如说啊,我要做一个程序或者是 ppt 之类的,我这里就添加一个新项目, 这里可以使用现有文件夹,或者新建空白项目,比如说新建一个空白项目,这里直接命名就好。 然后我这里之前是已经建了一个项目,来到我之前做的这个项目。好给大家简单讲一下一个很简单的一个功能, 比如说我想要一个虚线,就是我描述我是一个影视区的教学博主, 然后我想要一个属于自己的虚线,我主要是教 a 的, 然后我这里给他讲我的需求好,他这里就会开始处理啊,这是等待时长, 处理完成之后,他会给我讲他做的这个啊, ppt 里面的内容,让文件在这里也会生成脚本,那这个是校园结果, 因为我这里没有这个 office 的 这个渲染器,所以这里也没有预览图啊,不影响我们在这里找到这个大概方式,在文件夹中打开好,我们生成的 ppt 就 在这个位置, 然后这个是之前的那一把,我对这把有有点不太满意,然后我又对他进行了提示词的修改,然后又改了两三版之后,好来到我们的最后一把,就是这个新版文件还是一样的打开方式,找到啊在这里。然后我们先看一下他给我做的这个 ppt 的 样子, 这里是做一个经典版的,比较简单。好,因为我的提子要求不是很多,就想要一个比较基础的经典版啊,看着美观度还是可以,比较简洁。 然后我后面又尝试做了一版,复杂的就是这一版,这一版呢就主要围绕着二次元角色动画的包装,木偶动画的教学来来讲,这里我可以看一下这个幻灯篇,从当前页开始好, 然后怎么怎么怎么样,这个 ppt 的 效果其实还是不错的,那么我找一下他的进阶一点的功能,这就是我要编的一个程序了,因为我平时要玩摄影嘛,摄影摄像嘛,所以我需要一个导入图片支持压缩,该尺寸 要求是用普通用户支持拖拽。文件夹输出完成之后进新的文件夹不上传任何文件,然后这里他就开始处理了,然后功能已覆盖好,这里已经处理完成,因为我这边没有拍摄啊,好, 就没有窗口测试,然后代码这边,这边怎么样怎么样怎么样用,还是一样的打开方式,来到这里文件夹中打开就是这个,我们按照他的这个指令 怎么怎么样,然后这个就是他做的一个程序,一个图片的批量处理器。 哦,对了,前提是你这里要先把这个装了,编程装了,因为他所需要的工具是用了这个技术线是有配编程的,你得把编程线装了,装好之后,你按照他的要求运行啊,就可以打开这个了。 好,嗯,这是我的另外一个,这个不用看。嗯,可以看到这里有输出的文件夹位置,然后这里可以调整格式啊,比如说我给它调个 g p g, 然后这里的质量压缩这些 啊,你可以根据你自己的需求来改这里的尺寸啊,宽高,这里的文字随意,你如果你要加个肥,你就启动他,让文字这边,你啊给他一个你的名字嘛,说什么下。然后这里的颜色也可以自己选,比如说我要一个这个 橙色吧,橙色好,然后就以位置居中啊,编剧调整一下字号给一点点,然后这透明度要给到百分之百。好,我们就开始处理,哦,对,要先添加一个图片, 比如说我要一个,嗯,这个图片啊, 开始处理啊,这里成功处理了一张。好,打开输出文件夹,我们打开啊,储存默下啊,这个选项就加上了,后面我需要一个本地离线的开始脚本,为了实现 excel 数据填充固定的 word 模板的这么一个脚本啊,也是这个处理的稍微久一点 啊,他做好之后放在这里面,他可以完整的运行代码,还有中文输入,他这个其实做的非常的好,然后你觉得里面有不对的地方,你可以用这个 vs code 来打开他,在他的元代码里面来给他进行更改。嗯,大概就是这样,然后这里有插件,你可以根据你自己的需求添加你要的插件,还有技能, 这里我就不深入讲了,因为这里会,嗯,会很要要复杂一些,会讲很久,因为我这是教学视频,就分享视频,就不讲那么多啊。这里的管理创建,创建,创建技能这些怎么怎么样, 把这个插件放上来,好,这里怎么怎么样要的细节,然后这边默认选项就是,嗯,正常的,然后自动审查,就是 因为我是开了自动审查,还有挖掘访问,这个的话稍微风险就会高一些,比如说一般来说我们用这个自动审查就可以了。 欢乐的时光总是这么短暂,本期分享又来到了尾声,这段时间我在后台很多私信,有想拜师的,有想做技术交流的,还有要进粉丝群的,这里我统一说一下,我觉得人与人之间应该是互相尊重的, 你在寻求别人帮助的时候应应该有基本的礼貌。还有人跑来问我为什么粉丝群不给通过进群验证消息问题我写的很清楚,你直接回答就好。乱回答问题的我这边都是不会通过的,小号加的也不会通过。

今天一个视频教会大家在拷代码中使用 deepsafe 打磨箱,千万别再花冤枉钱了。看我操作,我们选择使用 cc switch 进行配置。第一步,先配置路由,在这里撩开, 然后回到主页面选择拷代码,然后在这里配置供应商选择 deepsafe, 然后把 vpi 也贴过来啊,模型直接点击添加。 第三步,直接点击起用,然后把路由打开。 ok, 接下来让我们打开 call 代码,见证奇迹。这里面已经是 dc 模型了,测试一下啊,没问题, ok 了。

codex 的 windows 版也支持电脑操控这个插件了,具体怎么用,效果到底怎么样?这期我直接用真实任务测试给你看,我会让 codex 丝滑的操控电脑,打开软件做 word, 最后把文件发到我的微信。 第一步,先进入 codex 设置,找到电脑操控,打开这个权限。这里要注意,它不是指控制浏览器,而是可以连接 windows 上的真实应用 权限。打开以后,回到 codex, 我 直接给他发布任务,把 opencloud 的 安装流程整理出来,生成文本和流程图,再发送到微信。文件传输助手你看这里, codex 开始连接 windows 应用, 他不是单纯回复一段文字,而是在后台生成文件,检查内容,准备发送。接着我又加了一个更真实的任务,让他做一份 openclaw 和 hermes agent 的 对比 word, 然后同样发到微信。 这里有个细节很关键,他发现系统里没有 liboffice, 没有硬说自己渲染成功,而是换成检查 docx 结构,确认文档内容和表格都能正常读取。 这就不是会点鼠标这么简单了,它已经开始像一个真正的 agent 一 样,遇到问题会换验证方式。 然后它打开微信,搜索文件传输助手,进入文件选择窗口,选择刚刚生成的 word 安装文本和流程图,最后点击发送。你看结果 word 文件已经发到微信了,安装流程文本和流程图也一起发出去了。 所以这次测试下来,我最明显的感受是, codex 不 只是更会聊天了,而是开始能跨应用做事了。

最近是不是你也被一波普通人一定一定要用着 codex 的 视频疯狂洗脑?我跟你讲,我现在一刷到这种视频呢,我这个血压就上来了。 上个月喊的是一定一定要用上 openclaw, 这个月风口一转改成 codex 了,都感叹的多好多好多强多强,好像不用是他这辈子你就废了一样。我这又好气好笑。 好笑的什么?好笑的是这帮天天喊 codex 牛逼的博主。我赌一包辣条啊,一大半连 plus 都没充过,就算真的充了,我猜你拿这玩意干啥?写文案?对,你没听错,就是屠龙刀,到手拿去干嘛?切黄瓜。 那我问一句,你光喊用上用上,你倒是说说怎么用上?我给大伙数一数,一个普通人想要真正用上得过几关?第一关环境啊,大家很多都懂的。第二关注册,第三关是海外手机号验证, 你加八六的这个人压根不认。第四个,每月二十刀的充值,光这个怎么把钱充进去就能劝退一片人?四道鬼门关关都可以把普通人挡在门外,这些你怎么一字不提呢? 更扎心的来,你不拿它写个文案嘛,整个图文嘛。那我告诉你, deepsea v 四 pro 这边 api 刚永久降价了,百分之七十五 性价比性能直接拉满。日常文那点活他干的又快又好,说白了普通人那点需求啊,人家是价格对着 g p t, 五点五就是降维打击。这个你为什么又不说呢? 我算看明白了啊,一帮自己每个月一百万 tucker 都消耗不满的所谓博主,天天就知道吹,就知道蹭流量,就知道一定一定干货时一点都没有焦虑,给你直接拉满,这个我觉得有点恶心啊, 我不是说扣袋子不好啊,但是他很强,这个我是承认的。我气的什么呢?把工具的门槛给你藏起来,普通人不需要的功能给你吹上天,然后收割你的关注。今天这条我不说一定一定要用什么,我说一句,谁只会喊必须用,却不告诉你怎么用,值不值,适不适合你, 你直接划走,别让他赚这点流量啊。下一条我跟大家讲讲普通的人到底该不该花这个钱,花了钱能不能回本?咱说人话,聊聊干货。

codex 现在可以完美接入国产模型了,而且插件等全功能都可以解锁。我现在接入的就是 deepsea, 速度快而且便宜。主要用到的两个开源项目,第一个是 c c switch, 原来用 cloud code 的 也是使用它接入其他模型, 最新版本支持了 codex 一 键接入国产版本型,非常方便。选择 codex 后,点击这里的加号添加供应商,然后可以直接选择 deepsea。 这里所有的配置已经预制好了,不需要更改。接下来就是在 deepsea a p i 官网复制自己的 a p i k 保存即可,然后在设置中找到路由,开启路由选项后,所有的配置就都搞定了。接下来重启 c c switch 和 codex, 让配置生效。看,我这里已经成功接入了 deepsea 项目,它可以解锁需要登录的插件等功 功能。就这个 codex 加加配置到自己的电脑之后就可以看到 codex 加加这个启动项以后就可以直接从这里启动,不要直接打开 codex。 现在插件等功能都解锁了,国产模型可以完整的使用 codex 所有功能。好了,关注我,了解更多爱干货,感谢大家观看!

这段时间刷屏的都说 codex 比较厉害,忍不住要下手试一试,但这个因为是 oppo ai 的, 所以说网络和大模型肯定是受限的, 那于是第三方的各种工具就出来,那我这里的话用的是 codex 加加啊,然后好,这个是 codex 的 页面啊,我做了一下尝试,然后把 dbx v 四啊 api 的 接口也接进来了, 因为没有对比就没有伤害吗?我,我还是对比我的老朋友去啊,就是我们字节跳动这个去直接说结果不过瘾啊,这扣这个是不过瘾,可能要打击片或者一个人要骂我了啊。我们首先说响应速度,这叫一个慢啊,我们尝试了一下,用一个做一个百度的一个首页的一个演示战,并且要能够实现搜索啊,我交给他 十五分钟都没出来,一直在那墨迹墨迹的一二三四五的转啊转啊转。我这后面的这个是 这个 v 四,它设置的是亚洲的一个节点啊,应该说没有问题,因为这个我去调试过了,亚洲节点应该是最快的。那么直接在确定上面呢,三分钟就出来了, 而且一步一步非常流畅,所有的代码结构窗,窗口很舒服,看着就是你习惯了一个一个你用的舒服的东西,你再用一个没有明确表示优秀这个优势的地方,你就很难受啊,你就很难受。 那么首先说这个界面,你看这个界面,他就是个网页版,你网页版你跟确定那个智能化的一个整个窗口,那肯定是没法比,对不对,我又想到他这个地方也能够打开这个网这个项目的结构,但是不舒服还是不舒服啊?第二个说这个结果 十五分钟跑完之后,他下面测试的结果根本就打不开,那个那个网页的演示站根本就还打不开,那我直接又去通过其他的办法,然后把这个项目权限给它打开,所以说 不是很爽啊。那么第三个,他这个是要花头啃的啊。你就说你接触的不是个微视的话,那不是个微视上面是需要花钱的,对不对?那我做这个演示花了六毛九,而且几分钟时间六毛九,那我做个大项目的话,几十几百块,几十块钱随便说吧。应该啊,因为这个只花几分钟时间对不对? 那么也就是说第一界面上面不到位,第二深层的速度很慢, 最终的结果不大于期。第三, token 需要花费,而且我用这个券的话,我做了这,这应该说这一年吧,高度使用用户一年应该做了三十个,这个项目就全免费啊,可能下步他要什么收费了,对吧?那这也是正常。好,这是第一个 不过瘾。第二个再说一个核心点啊,其实我们做东西,我们又不是专业去搞研究,对不对?既然不是搞研究,那我们就以需求为导向,不管是学一个东西还是去做一个项目,都要以需求为导向,我只要把东西搞出来就行了,我管用什么工具,当然安全性是一个方面。第二个费用可接受对不对? 那现在又有免费的,自动化程度又高,用着又舒服,然后又能把东西搞出来,有什么好比的?拿来就用, 紧盯需求,不管是学还是做,紧盯需求,你想学什么?你想做什么?你想做什么?把东西做出来,瞄准射击,结束战斗就可以了。好吧,你看三分钟大家有什么好的建议?或者说你用 codex 上面有比去更优秀的地方,欢迎评论区留言啊。好,再见。

codex 用 g l m 五点一效果怎么样?前段时间我用 codex 默认的 g b t 五点五测试了用它操作 windows 的 chrome 浏览器,从表现效果来看呢,跟作为对比,基于 g l m 五点一的 cloud code 出彩很多, 那这个功劳到底是 gbt 五点五的还是 codex 本身的呢?大家这个疑问啊,咱们再做一次这样的测试,那就是把 codex 的 模型从原来的 gbt 给换成 glm, 把之前的步骤再跑一遍就知道了。 先说结论啊, codex 把模型换成 glm 五点一之后呢,表现就跟之前 cloud code 用 glm 五点一一样拉跨。 所以这次测试得出的结论是, cortex 之所以能非常丝滑地操作本地浏览器,核心原因是搭配了 gpt 五点五,而不是 cortex 本身的优势。接下来说说这个 cortex 换模型的过程啊。 这里给我印象最深的是 cortex 想要换模型,相比 open claw 跟 cloud code 呢,不但直接兼容的模型更少, 配置过程也要比它们更麻烦。比如换成 glm, 直接改核心配置文件还不行,还必须添加环境变量。而且啊,这个配置有个坑,那就是这里的这个地方不能够直接填 apikey, 只能先填变量名, 然后在操作系统环境变量里啊,再针对这个变量,把真正的 apikey 给写上,需要多绕你一步。换好模型之后,就是测试调用本地浏览器的效果了。 这里的测试呢,分为三步,第一步,把当前已经打开的 chrome 浏览器里再开一个标签页来打开知乎的首页。第二步,给其中的一篇文章点赞。 第三步,再给其中的一篇文章写评论。在执行的过程中啊,只有第一步比较从容的实现了,而后续的两步都需要调用额外的工具以及要编写额外的脚本来完成,很明显呢,这个是不符合预期的。至于为什么会这样,有同学说是 codex 换了模型之后导致协议发生了变化, 新模型识别不了部分能够直接操作本地浏览器的工具,也有同学认为是 glm 没有多摩态,只能够通过写脚本的方式来搞定。 从这次的测试其实也反映出一个现象,那就是 agent 原声默认支持的模型啊,一定是兼容性跟适配性最好的,一般没什么特殊情况,最好不要随便换。

hello, 大家好,我是阿亮,这期视频呢,教大家如何把 codex 接入国产模型,比如说接入 deepsea codex 和 cloud code 呢,不一样,它不支持修改配置文件来切换模型。最初呢,我也是想直接用其他的工具来接,比如说 c c x, 但是折腾了很长时间,发现问题比较多,也很复杂,所以呢,就自己动手来搞定的一个专门的工具, codex 杠 switch, 用这个切换 codex 的 模型就方便多了。接下来呢,就照着我整理的这份 codex 文档,一步一步带大家操作。 首先点击文档中的 codex 杠 switch, 跳转到下载页面,根据自己的电脑 选择安装包。下载后呢,双击打开,我们就以 deepsafe 为例,这里选择 deepsafe, 然后点击这里到 deepsafe 官网去申请 k, 这里有每个模型的申请 api k 的 链接好,点进去呢,就是开放平台,点击 api case, 创建 api k, 然后把拿到的 k 复制到这里就行了。然后点击蓝色按钮,这个时候呢,就切换成 deepsafe 模型了,现在呢,需要重启 codex, 记住这里一定要把 codex 关掉,重新启动, 可以看见这里的模型变成了 deepsafe, 输入一条消息试试,如果它有回复说明呢,就接入成功了。 点击红色按钮,也可以一键切回官方的 jpt 模型。注意切换后必须重启。 codex 这个小工具呢,目前支持主流的啊,国产模型也可以自定义模型,每次启动 codex 前呢,把这个工具启动了,就可以顺畅地用国产模型了。 这一期呢,我们主要是想要通过一个案例带大家整体走一遍流程,更熟悉这个扣带子的使用。很多人觉得呢,做一个案例或者做一个东西之前呢,要先想清楚做什么功能啊,有什么样的风格等等吧,就想了好久好久。其实我们根本没必要 给他最简单的提示词,让他呢先做一个东西出来,然后我们再挑毛病。好了,接下来我们直接开始 新建一个项目文件夹,直接命名为汉堡店,然后新开一个对话,添加新项目需求呢,就一句话,帮我做一个汉堡店的网页回车 codex, 自己理解,自己拆任务,自己给方案,它还可以自己的生图,因为它接入了目前最好的模型啊, gpt 杠一, mate 二,这个是最好的生图模型,我也没仔细看啊,先让它跑一半问出来再说。 哎,过了一会呢就出来了,但是我发现他的主页呢只有一张图片,这样感觉真的是太干了,餐厅也没有什么特色,我想每天都有一个的特色汉堡啊,以一周七天来循环,让他来修改 主视图,图片改为五张图片轮播,设置每天的特色套餐,每日的优惠套餐以一周为一个单位啊,一周为一个周期。每天的菜单呢,可以点击观看,并且每个套餐呢都有相应的配图。 顺便再说一下, codex 是 内置了当下最牛的生图模型,一面之杠二点零模型,比香蕉呢强了不少,改好了来看看效果啊, 这是汉堡店店内环境呢,是必须要有的,然后我输入加入醒目的店内环境图片,分别有,后厨的呃,制作区,冷藏区,前台用餐区,卫生区,冰激凌帐。每个区域呢都有至少两张图片,图片看起来是在同一家店。 好的,等会效果还不错。我们新开一个对话,打开计划模式输入,把这个项目改造成 next js 框架。如果你不知道 next js 是 什么意思,可以再新开一个对话,问他什么是 next js, 然后使用 codex 内置浏览器,我们点开批注按钮,这样的话,你想改哪里啊?直接就能在这里改。比如我想让这个汉堡的价格是零,直接点击这里,价格改为零, 想改哪里呢?都可以在这里直接进行修改。但如果你想让别人也可以打开这个网页,只需要打开 codex, 问他怎么让别人也能打开这个网页。这个也算是给大家留一个作业啊。总之一句话,遇到不会的或者不懂的就去问 codex, 把我们的思路一定要转变过来, 大家有兴趣呢,也可以去尝试着做一点自己的东西。 ai 时代,我们用 ai 工具呢,最主要的就是用来创作,然后提升自己的效率,让我们成为一个 maker。 好 了,这期视频呢就到这里,下一期我们再继续讲 codex, 大家点点关注哈,跟着阿亮学 ai。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

全部给我去用扣袋子,太香了。我昨天研究到凌晨四点搞我那个电商的全自动化商品工具,就自动选品,自动采集自动商家,包括自动合价。我给你们看一下我的进度, 目前是已经完成差不多五分之一了吧。选品自动商家,话不多说,我给你们演示一下吧,好吧。 然后上架时间跳一个月内,一个月内商家的新品,然后点一下来,自动跳到对应的,对吧选品工具,然后筛一个月啊,自动筛,然后自动 获取,比如第一页这二十个所有的产品主图,加上商品 id, 看,现在正在跑了,已经看到没在跑,在跑了,自己在跑。来,我们点一下, 你看一下扣带子界面就很简单,对话就行了,你会提词就可以了,全程不需要自己懂代码,不需要自己写,他帮你写好,帮你做个网页出来。 等一下,因为这一页的话有二十个屏,我们等下把这二十个屏跑完。好吧,我现在是全程没动,我没动鼠标的,你看没自己来跑的。 ok, 搞定,看一下来,现在没有数据吗?对吧?好了,刷新一下,看到没?出来了,呃,产品的品名缩写了对吧?标题以及主图一张,对吧?为什么只需要主图?因为后面会拿这个品去 幺六八八去识别,找同款链接,然后来比价,来筛侵权,来改图, ai 改图,然后再来去用妙手来去,对吧?上架去发布, 所以现在只完成了五分之一,所以只需要主图,然后对应的啊,比如上面 id, 我 点一下,点击之后自动跳转到这个平台,自动输入这个商品 id, 自动搜索,自动到对应这个产品链接,就如果你们想看的话点一下对吧?你看信息有了吗?对不对?比如说 想不想听啊?这是它工具自带的,只说你正常的话你得手动输在 id, 还还那啥自动啊,自动化了回来有人说你这个工具对吧?它本来就自带可以上架的呀,为什么说还要做这个东西呢? 因为听好了。举个例子,我们 y r 选品的话,不光是从,比如不光是从云集看,我们还会看 t k 的 数据,看亚马逊的数据,看店铺前端的数据,看什么各种数据,所以 如果云起这个工具他只是一个来源而已,懂 𠲎? 应该干过,应该懂我意思吧,所以全资的话,对 𠲎。

codex 最近火出圈了,刚上手的人可能不知道用不用插件,体验天差地别。我做过一期插件实测,视频播放就破了百万,你就知道热度多高。今天我把天天在用的五个插件一次性讲清楚,你使用后立刻能感受到 codex 的 魅力。 第一个 hyperfree, 让你用自然语言就能做出动态页面的效果,动态视觉天然有审美优势,当演示用,它比 ppt 动感,当视频用,它能直接渲染出片你看到的这条视频的开头,还有现在这一段, 就是 hyperframe 做的,哪一帧不满意,只需要跟 codex 说改哪里,要什么风格、效果力等可见。第二个重磅的 computer use, 我 觉得它虽然还处于初期阶段,但最具有想象力,我觉得这可能就是 ai 的 未来形态。 codex 对 此也下了很大的力气, 之前只有 macos 版,这两天 windows 版也上线了。它是全能型的网页文档,各种 app, 只要你鼠标能点的,它都能自己点,自 己看,自己记结果,自己操作。说实话,它现在还很慢,像个老奶奶在操作电脑。但是这个插件功能只要跑通了,效率优化只是时间的问题。第三个 chrome 五月初上线,听着简单,让 codex 控制你的浏览器,你想想能干多少事?电商、社交媒体、社区等网站,它都能打开,模拟你的操作,把你要的信息扒出来。 以前要实现这个的确爬中脚本。 payplay 比较折腾,用内置浏览器还容易被登录卡住。我觉得它适合多个网站查找信息,并对数据做汇总、分析、梳理,这样的任务 也适合企业内部系统填写日报、报销等自动化任务,而且这个插件还支持多 tab 页,不像 computer use 要独占电脑,它还不影响你正常使用。第四个, presentation, 做 ppt 用打工人最怕下班时听到领导说明天你做个汇报,那晚上就要熬夜做汇报材料了。这个插件你把一堆文件和素材都丢进去, 马上就生成你要求的 ppt 文档,还能用你公司的模板,做完之后,它还会自己检查文字一没一,出版式 y 没 y, 有 问题就会自己修,输出,就可以直接用的那种。感兴趣的可以看我上一期的对比视频。如果你在提示词里再加一句要用以 made in 这个技能,那 ppt 的 背景素材都是通过 gpt made in two 这个模型生成的,效果会更好。 第五个, superpowers 只要你用上 codex, 走上 web coding 这条路是迟早的事,随时开发自己的提效工具真的太让人上瘾了。这个插件就是最好的启蒙,他把一个顶级编程团队的本事拆解成了一个个 skill, 你 只要说我想做什么, 他不会上来就乱写,反而是问你问题,帮你整理需求,帮你整理思路,再告诉你应该做哪几步,做上几个项目。这套先想清楚再动手的思维就慢慢的长进你自己的脑子。这五款插件形成了完整的链路, 从控制浏览器、做文档、做动态内容,到编程掌控整台电脑。装完这五个插件, codex 就 能替你做日常重复的工作,就能腾出你的时间和精力做更有价值的事情。关注我,我是持续分享 ai 提效工具和方法的小伟。