大家好,最近我在用 codex 的 时候遇到一个挺实际的问题,就是插件功能一直用不了,不管是普通账号登录还是 vip 登录,体验都不完整。后来我找到一个第三方增强工具,叫 codex 插件,今天就简单分享一下我的这个使用发现,呃, 最开始的问题很明确,就是 codex 明明有插件入口,但普通登录方式下就是无法正常使用。我试过普通账号登录,也试过 a p i p 登录,插件能力都没有真正打开,因为这个问题不是不会配置,而是功能。
粉丝137获赞714

好,我们一起来看一下 codex 呢,在五月八号进行了一次最近的更新,增加了一个昆姆扩展的插件,那这一次呢,我们一起来看一下这个插件和相比于其他的方式去操控昆姆有什么区别?好,我们直接点击这个电脑操控这里呢,大家可以看到这个会有存在一个 啊昆姆插件这么一个选项,就是我们点击管理可以看到增加了非常多的配置,比如说像权限历史记录下载上传,那这里呢提供了非常丰富的这种权限控制。嗯,我们可以通过 安装这个插件和 codex 呢进行建立关联,这时候可以看到我们的这个 codex 呢就连接上了当前这个浏览器,那出现了这一个绿色的图标,就说明我们的 codex 呢已经可以完全的托管这个浏览器了。那我觉得这是 codex 呢像全自动操控浏览器迈出的一步哦, 我就挺有趣的,所以今天给大家做一个分享。那如果你把这个开关打开之后呢,接下来呢我们就可以直接去操控了,但是你会发现一个小细节,就是如果你是在国内的环境下,你就直接点击这边去打开呃,安装插件的界面,你会发现这个商品并不能够安装,所以大家呃可以通过我提供的这么一个压缩包去进行补充这个 啊插件,好吧,呃,我们来往来看啊,首先我们来看一个很容易被大家混淆的东西就是,嗯,目前 codex 本身来说是有浏览器,那他操控浏览器和我们的这个插件有什么区别呢?比如说我们在这个 codex 中使用软件到一般是这边新建一个窗口,在侧边会有一个浏览器的选项,那其实这也是我们的第一步,就是我们的这个呃, in app browser, 这是我们的一种内置浏览器,它本身来说是用来调试的,用来开发的,所以和我们 这个插件更新是没有任何关系的,所以大家不要搞混了。那第二种呢?叫做 browse user, 这个是用来操控类似浏览器的,这是相当于前面的这个 in app browse 呢,又往前走了一步,比如说我们在这个设置这边呢,哎,去又往前走一步,这有一个,这个什么有一个啊? browse user, 它可以让呃我们 的 codex 呢去操控这个类似浏览器,去完成一些操作。好,那也就是第三种呢,就是我们刚刚现在讲这种叫 chrome browser, 它可以帮助我们进入真实浏览器状态,去操控我们整个浏览器。 那有小伙伴说了,那其实我的这个 pry white mcp 也可以操控浏览器,或者说我这种外置这个 computer user 也可以操控浏览器,那和这个有什么区别吗?而且区别很全面,对吧?呃,区别的话,呃 computer user 呢?它本身来说它并不是浏览器的插件,对吧?它是一个操控电脑的 g y 能力的 这种插件,比如说它可以通过你屏幕去操控你调出那些图形应用,就比如说我们现在常见的这种,呃剪辑应用,对吧?微信,对吧?它都可以操控,但是你如果单独的话去操控这个浏览器的话,显得并不那么智能,所以 codex 提供了一个新的能力,就是这个 codex com, 那 我们可以通过这个 codex com 去完整的操控我们整个浏览器。举个例子,比如说我现在想让他看到我们整个这个浏览器上有多少个标签页页,对吧?我们就问他,我说,哎,现在当前浏览器上有哪一些 这个标签页?比如说你看是吧?他可以告诉我们现在到底有哪些标签页,我又让他在第一个标签页输入 a, 第二个标签页输入 b, 也可以,我再让他把某一个标签页固定也可以,就能够做到很多之前做不到的一些事情 啊,分的更加的细了。那如果说你细心的话,你会发现,呃,这个插件它其实包含了很多细节的功能,比如说他通过这个插件和 codex 进行关联之后呢,就可以直接在 codex 里面去操控浏览器的所有权限,比如说审批,对吧? 比如说历史记录,你可以让他看到你今天到底有哪一些详细的记录,包括你上传哪些文件都可以使用它,比如说你允许上传哪些,允许下载哪些,都进行了完美的这种配置啊,对吧?非常的清晰。好,那接下来在最后我们想跟大家聊一下,就是为什么要使用这个呃,这个酷路亚 插件呢,对吧?为什么不直接使用 pro white 的 能力呢?其实很清晰啊, pro white 的 本身更像是一个外部的这种工具,而这个呃 这个 com 插件呢,是一个内置能力,如果说你使用这个的话,你会发现其实很多东西它都需要一步一步的去哎,去跟他讲,去分析,那它通过这些 m、 c、 p 的 能力去一个一个去提供。那如果浏览器更新了呢?它并不啊 同步更新,但如果是 codex 呢?它就同步更新的,它更像是一个完整的产品,对吧?也是 codex 官方提供的真实浏览器的一个执行通道。 而 pro y m c p 呢?它只是一套通用的浏览器自动化引擎,对吧?所以呢,你可以相当于它是一个小缩放。而这个,呃, codex 捆绑插件呢?还是更像是一个完整的企业级的真实软件的一个执行通道?它也可以通过现成去控制,并且呢,能够降低了很多我们调试的成本, 比如说我可以让它去帮助我去做一些自动化的事情,对吧?是吧?非常的方便。好了,那以上就是这几个的区别,我是小刘,那我们下期再见。

哈喽朋友们,我是阿水,今天给大家介绍一下,我用 codex 微博抠定了一个可以代替我干活的小插件,从设计稿的生成再到切图交付, u i 设计师必看的这一期,如何一分钟看完别人一整天的活,那这个插件呢?纹身图和图身图 目前都是支持的,首先是在这里可以选择纹身图,那这里呢,我们输入简单的提示层描述就可以,然后要做移动端的话,直接选择九比十六,那或者需要根据自己的需求我们自定义尺寸也是 ok 的, 那图片数量呢?这个就没有啥要求了,好了之后呢,我们就直接点击生成设计稿按钮, 这个速度大概是在一分钟左右就可以完成,好了之后呢,我们就可以选择要切图的图片,点击切图按钮,然后用鼠标直接框选就可以。鼠标拖动的方法切图可以说是非常的方便,我们只需要在页面上点击鼠标 画一个句型就可以选中切图,无论是大一点的 icon 还是按钮,以及我们在底部的这种 tab, 还有页面上的这种小箭头主标题也可以用这个方法来切出来。当然如果我们想要把 icon 的 背景给它变成透明的,我们只需要点击透明的按钮 就可以了,正好的一点就是针对单个的按钮可以自己自定义设置。那切图好了之后呢,我们就可以导进 figma 里面,可以看到刚才切好的图片,它已经单独帮我们进行了图片分层,而且有一个特别好的点是 我们把单独的 icon 切出来之后,它原图的背景上面的 icon 就 会没有,就会消失,并且呢,它填充的颜色也和我们的背景特别的相似,几乎看不出来有颜色填充的痕迹。那其实到这一步呢,完全可以是一个可交付的一个状态了, 因为我们的图已经切好了,只需要交付给开发就 ok 了。那除了纹身图,其实图生图的方法也是一样的,必要是我们手动设计的环节,全程都是由 ai 去工作,而且呢,大家可以看到切完图之后,它的原始背景上面,你当前切图的这个 icon, 其实它已经从背景上面消失了,并且呢,它用了一个色块填充,而且呢,它填充的这个色块也是很好的,而且呢,对于透明的这一点,它做的也非常的好,就是呢,它把你的 icon 主体给你留下了,但是背景呢,它真的是透明了,这个真的是特别的方便。我做这个插件呢,其实 初心是因为我没有飞格玛的教育版,也没有飞格玛的会员,那所以呢,我没有办法去使用 m c p。 然后呢,这个插件就诞生了,这个也是一种 没有会员,没有教育版的一种解决方案。那如果大家对这个插件有什么要求或者建议更好的功能点,那大家可以在评论区和我讨论,而且想拥有这个插件的也可以直接在评论区找我来拿,我是阿水,大家记得点赞关注评论哟,我们下期再见,拜拜。

大家好,我是郑一环,今天我们看一下扣代词自动化任务,扣代词可以把重复工作封装成自动化任务,并且定时自动执行。 比如我每天早上都需要看 ai 热门资讯,用来做自媒体选择题,这件事每天都要做,并且流程完全一样,很适合做成自动化。具体步骤就是我先跟扣代词说, 帮我搜索今天全网关于 ai 方面最热门的资讯,挑选十条发给他。内容生成以后,我们先确认一下内容有没有问题, 没有问题的话我们再给 codex 下新的指令,就是把搜索当日最热门的十条 ai 资讯做成自动化任务,每天早上九点执行,然后发给他。 我们可以看到 codex 已经创建好了任务,后续的话我们可以在左上角的自动化这里查看和管理我们的自动化任务,可以修改自动化任务的内容,也能修改执行时间等等。

我今天用 codex 加 remotion 这个插件跟风去做了一个视频,然后我的文案是之前小红书的一篇文案,呃,提示词没有过多的一些修饰,就是让它根据这个文案去生成五分钟的视频,呃,视频已经做出来了,大家先看一下, 没有统一模板,我行如果没有拿到这些真实内容,就只能靠语言习惯去补全答案。第一个坑是数据根本没位进去,我行查不到财务制度,就会捏造制度条款查, 然后我们其实能感受到他的整个动画效果其实没有那么的漂亮,但是这也是他的一个非常大的优点和特点。 其次呢,这个语音好像也非常的僵硬啊,倒着说哈,这个语音其实它是调用的 mac 里面的一个本地 tts, 然后大家知道苹果本来做这些都,嗯,现在就那个样子,所以确实效果也就那样。但是我想说的是,不管是这个动画还是苹果自带的这个语音,恰恰是在 remotion 这个工作环境里面,它是一个非常大的一个优势。为什么呢?比如说我刚才这个 视频做出来之后,我想去啊替换掉他的这个麦克自带的 tts, 然后我就非常简单的去和 codex 告诉他,我说这个声音听起来非常的下头好,然后我现在有一个啊纤维的模型想用,然后 api 的 啊密奥,我告诉了他,他就直接通过我这句话把刚刚看到的这个视频替换成了一个新的有配音的这个视频效果,大家来感受一下,差异非常大, 真正麻烦的是半级固化数据,比如用户上传的私有知识库、公司规章、经营总账,各种制度文件格式各异,没有统一模板模型,如果没有拿到这些真实内容,就只 好这个是新的视频配音,那么其实在这个视频和这个视频去做对比的话,这两个视频除了配音不一样之外,其他的动画其实都是一模一样的。但也这也是为什么我觉得非常非常棒的地方,因为大家不知道发现没有,不管是这个视频里面的 这种文呃,图案文字,还是说我们刚刚去啊生成的新的 t t s 去给他当配音,他把每一个视频里的要素都变成了一个组建,这个其实也是 motion 工作的底层, 它其实并不是像传统的纹身视频、图身视频的这种软件,也不是说用的这种啊,更传统的一些生成视频的方式, remotion, 它本质上生成视频的逻辑,它就是去调用 ts、 react 这种前端的组建进行拼接, 那么就意味着我对于某一个组建如果说不喜欢不满意的话,我是可以换掉它的。如果我们再往后面去学习,其实我们是可以发现, 比如说在这些时间点上面,它生成之后哈我就可以告诉他我在啊,几分几秒啊,或者说在某一个固定的位置,我想去插插入进去什么样的文字,然后插入什么样的 react 组件,然后想去插入什么样一些模板,甚至于把我预先设置好的 转场的图片呀,视频啊都放进去,而且我直接可以通过语言告诉我需要在哪个时间点去做什么,它其实整个运行逻辑 其实是有点像 skill, 就是 把它工程化、参数化啊,但是呢,就是它比 skill 更强的点是什么呢?就是你可以在一个自然语言交互的过程当中,基于一个现成的视频去告诉他一二三四五六七八九五要去改什么, 而不是每一次就要去写一个新的 skill, 你 直接可以用语言去进行主键的替换,所以这个我认为是 codex 加 remote 有 非常棒的一点,因为 他把这个视频的所有的要素都变成了主键,不管是你看到的文字、图片、视频、配音都可以替换掉,真的非常赞。

你安装的 code 叉是不是也这样?没有 open ai 的 账号就不能正常使用?本视频教你,没有国外的 open ai 账号也能正常使用 code 叉。这里我们打开电脑上自带的这个微软应用商店,然后在这里搜索 code 叉,搜索之后,这里的话我们选选择这一个图标的, 然后这里是已经安装好的,所以它显示打开没有安的话,我们点击获取,等它安装结束即可。安装结束之后呢,我们点击这里, 然后找到这个 code 叉,然后这个 code 叉它默认的话是使用呃 open a a 的 账号来进行登录,我们在国内没办法正常使用,所以的话我们先不要打开它,我们去到这个 来到这个 c c switch 的 啊界面之后呢,我们选择这里点击一下,然后等它来到这里之后,我们直接划到这个页面最底下, 这里我们根据自己的电脑系统的版本来进行下载即可。 windows 的 话我们就直接下载这一个,然后这里是因为已经下载过了,所以我就不点击下载了。然后还有我们也要如果是 mini max 的 大模型,大模型的话我们就选择下载,把这个也下载下来, 然后这里我也是已经下载,我们就点击这里下载就好。这里我已经下载好了,我们就不继续下载了。下载之后的话,我们就直接去这边打开吧这里然后这个是 c c switch 的 开源项目,我们直接双击运行它, 我们就直接点击下一步,然后这里是让我们去选择这个安装路径,这里的话我把它安装在 c 盘,安装在 d 盘吧, 我直接点击安装,点击下一步,然后这里直接点击安装,然后这里就等它安装结束,这里我们把这个勾选去掉,然后点击结束,结束之后这个 这个我们 mini max 的是使用 mini max 大 模型才才用到的,如果不是 mini max 大 模型的话,需要去选择其他的,可以自己去找相应的开源项目,这里我就直接把它解压, 这里剪下之后的话,我们直接在这里,然后打开这个,这里它有需要你安装的,然后我们本地的话是需要安装这个 node js, 这个的话可以看我上一期的视频去安装,然后这里的话我们就直接把这个命令复制一下, 然后我们点击这里,我们直接输入 cmd, 然后回车,在弹出这个页面里,我们直接复制粘贴一下,然后回车。好,它现在已经在安开始安装依赖了,然后我们这里就会多了一个文件夹, ok, 它显示已经安装,音量已经结束。好,我们现在就把它这个点给关闭掉,然后我们点击这个,我们点击运行这里,运行到这里的话我们就不用管,然后我们就打开我们的安装的那个 cs 微棋, 这个是我们安装 cs 微棋的这个图标,我们直接双击它, 然后这里你如果是第一次使用的话,那默认是这里,然后我们要选择这一个,这里我还是,虽然我已经重新安装了,但是因为之前我是安装过的,所以我这边已经是已经配置好的, 如果是第一次使用的话,我们是需要点击,我直接把这个删掉吧,这个删掉先启动下这个,把这个给删掉。 好,我们现在来重新配置一下,这里的话我们选择这里的 open a, 然后之后我们点击这里的加号,这里我们供应商这些我们就不用管,这里我们就随便填我这里我就填这个 mini max 吧,因为我自己用的是这个模型,然后这里的 api key 我 们也是随便填 这里的请求地址,请求地址的话我们就是把这个运行在这里这里给复制一下,然后把它粘贴到这里来, 这里的话我们模型的话我们选择这里都复制一下 往下滑,这里我们是一定要勾选上,勾选上之后我们就直接点击添加啊,我们现在这里已经添加,然后进这里的话,我们点击这个启动, ok, 已经切换了,那这里我们可以进行测试,这里测试应该是会报错的,因为这里我们还没有填这个东西,就我们还是去到这个 这里,这里面我们是需要把这个配置文件,这个我们先复制一份, 然后把这里给改掉啊,这里的话我们把后面这里给去掉, 我们点击四啊,这里我们一定是要这个点 e n v 的 这样子的格式,然后之后我们点击用我们的这个记事本打开,打开之后的话,这个是我要这里要填入你自己的 mini mag 那 个 api key, 然后每个人我们可以自己去获取一下就行了,那这里有因为 api key 比较私密,所以的话 我就不让大家看到了,把它删掉,然后我去把我的给粘贴过来复制一下 啊,然后这里我已经把这个秘钥给配进去了,配进去之后呢,我们这个界面还是要关闭重启一下, 就这个这个界面,我们直接把它给关闭掉,然后我们就点击这个双击一下,等它启动起来,点击运行,因为它现在已经启动起来了。启动起来之后呢,我们这里再点击一下这个测试, 因为他现在表表示已经正常能正常使用了。然后呢正常能正常使用之后,我们就可以把它给擦掉了。然后现在我们再打开我们的这个 color 叉,然后我现在问一下他,你的 他现在已经回复我了,然后其实他这个回复呢也是在这里会看到的。 然后最后界面我们是不能关闭的,不然关闭的话我们这个 qq 叉就不能正常使用了。我的这个 qq 叉默认的话是其实我们安装的时候它默认都是英文的,然后我们要如果要改变这个,呃四 plus, 我 们就选择这个 setting, 然后找到这里,就这里的我们直接找到往下滑这里我们把它改成中文就行了,这样子我们的 control 它就能正常的使用了。

好了,大家好,这段时间 codex 相信很多小伙伴已经上手,开始用了一个非常好用的 openai 的 桌面端的一个 agent 工具。那么今天我想推荐一个 codex 里面的一个很强很厉害的一个做视频的插件叫 hyperframes, 它可以帮你按照网页的形式去做成一个视频,相当于用写前端的代码去做一个视频。首先我们知道 ai 在 写前端代码这块已经是非常厉害的,所以说这个插件就可以帮你 让你的 ai 像写代码一样去做视频。好的,那么我们就直接来试一试这个插件到底有多厉害。使用是在这边点击这个插件下面找到这个 hyperframes, 安装之后我们直接右上角点在对话中使用。这里我把 cloud 的 一个官网给他,我说一句,请根据这个网站做一个产品的宣传视频。好的,我们这里让他开始执行。好的,可以看到他跑了一段时间,他去官网去拉取了一些他需要用到的素材, 他接着在执行。好的,现在他已经生成好了,他已经跟我们说宣传视频已经生成好,在这里只需要点开就可以去预览。 并且他除了宣传片以外,他还使用了官方的素材,产品的文案,他还有动画的分镜,他还给这个宣传片加了旁白的阴鬼。让我们来一起看一下 the ai for problem solvers breakdown complex work together research write analyze data and code with expert level collaboration bring code to your desktop browser tools and team code by anthropic think bigger work clearer。 可以 看到整个效果还是非常好的,除了可能画面中有个别的小细节, 有一些排版上的问题,整个的效果你敢相信是我只用了一句话,没有经过任何修改它就出来的一个结果。随着 ai 进一步的发展,一开始的文字、 图片、视频以及到现在的全自动的生成视频以及剪辑, ai 的 发展只会越来越快,而且这个工具对于很多想要制作一些宣传视频、科普视频的人来说非常的有帮助。

codex 的 plug in, skill admission 这三节课可以说是承载了我们做办公自动化的所有殷切期望,待会儿我来唱歌。那上期关于 codex 的 视频,我们为牛马一号这个员工 导入,并且介绍了 codex 使用的基础功能,那所以这一期视频我们就为我们的另外一位员工马二号通过使用这个 codex 的 三剑客来实现办公自动化。而我们在这个视频里面会跟大家来详细的说明两个成功案例,还有一个半成功案例,让我们就能够很好的知道 codex 三剑客的能力边界在哪里,以及在日常工作里边,我们应该如何去最大程度地榨干它的能力。在 codex 我 们打开之后,它的左边菜单的右上角上 我们可以看到,呃 search 下面有一个 plug in, 那 这个其实就是所谓的插件,当你进入这个 plug in 的 页面之后呢,它其实并列显示了另外一个东西,叫 skills, 也就是技能,然后 这已经是两剑客了。第三剑客就是 plugin 下面的 automation, 也就是所谓的自动化。那关于 plugin, skill 和 automation 这三个的概念,如果用学术的名词解释来讲话,可能对我们小白用户其实不太好理解, 那我们就举一个不太恰当的例子。我们先说这个 skill 所谓的技能就相当于是我们的专家团,那这个专家团里面呢,包含了各色各样的能够为你提供不同服务的专家,包括专职司机、个人私厨、上门按摩、健身私教等等,这些都是我们的专家团, 也就是所谓的 skill。 那 plug in 呢?也就是插件,它要干的事就是通过我们是买高铁票还是买机票,把这些专家团接到我们家里边来。那所谓的 automation 就 更简单了,它其实 就是制定一个作息时间表,让这些不同的专家团乘坐高铁还是乘坐飞机,定期的,定时的,或者按照一定的条件来为我们做上门服务,比如周一上门按摩,周二个人私厨,周三晚上健身私教。所以 plug in skill 和挪威省其实是一个相辅相成,按照你的需求 在常态运行的这么一套工具系统。那我们现在看到在 plug in 的 这个页面里边,其实是已经有 two x 给你推荐的一些插件,那这些插件呢?我们可以通过点击每一个插件左边右边的这个小加号,然后把它安装上。当然呢,这个安装的过程其实就是一个买票的过程, 要有一个验票,比如说你要安装一个 computer use, 也就是让它来控制你的电脑,那这个时候这个过程里边会有一些权限的要求,你要按照它的提示直接点确认就 ok 了。其他的其实没有什么特别的东西,那比如要控制你的 chrome 浏览器, 那就提醒你要去下载或者安装一个浏览器的插件等等,以此类推。那我们可以看到安装好的就会把从一个加号变成一个打勾的状态啊。 当你安装了这些相对应的 plugin 以后,那因为这些 plugin 这些插件,它已经获取了相对应的一些飞机票也好,高铁票也好, 那么它就可以直接连到你的专家团,那不同的这个机票或者车票就能够连到不同的专家团,也就是对应的不同的 skill 技能这里,那这些东西呢,就不需要我们在在这个地方来单独去安装了。 当然你想过来提前进行 plug in 和 skill 的 安装也是没问题的,你就搜索你想要的,或者说你从网上或者听谁说一个 skill 或者 plug in 比较好, 你就过来搜一下,如果有的话直接把它装上就 ok 了。但是其实完全没有必要提前在 plug in 里边去安装这些东西,为什么我们在项目里边跟大家具体说明, 不要装神弄鬼。 ok, 那 我们现在给牛马二号建立一个项目文件夹,那这里的牛马二号里边的字文件夹我们 就可以比较随意了。具体应该如何建可能取决于你的需求,比如说你想搞一个什么样的自动化,比如说你想去获取什么样的一些信息,那具体我们会在项目的说明当中跟大家来详细解释。 ok, 那 对于 codex 来说,我们一切都是从一条 新的聊天开始,那么就新建右上,哎,左上角,呃,建一个 newchat 也是新的聊天。那这里边呢,我们刚才建了一个牛马二号的文件夹, 所以我们可以在下面去找这个牛马二号的文件夹,然后呢在这个牛马二号的文件夹下面,我们看到我要按照我们需要的这个项目建了不同的字文件夹,比如我们接下来要讲的这个呢,我们是先从 邮件的自动处理来进行的,所以我就建了一个 gmail auto 的 这么一个文件夹, 然后我们选择打开,这样的话我们就可以直接定位到这个文件夹下,那接下来所有的输出都可以存储到这个项目文件夹里面去。当然作为自动化的项目,我们也完全可以不在一个 project 里面去 去搞,那这里建议大家建一个文件夹的原因是方便我们有其他输出的信息的时候,可以直接放到这个文件夹里面去, 然后在后面使用这个项目的过程里边,也更容易去找到他,控制他。那我们第一句话就是让他去汇总一个最近一个周的邮件的内容。但大家看这个可能有点疑问,那为什么直接就可以来这样问他?是因为我们在 plug in 的 里面的时候,其实我一开始 是在他之前就已经在 plug in 里边安装了 gmail 的 plug in, 也就是这里因为在这个安装过程里边, 我们已经按照他的指引把 gmail 的 权限全部接入进来了,所以作为你当前所在的 codex 账号来讲,它已经是作为整个工作台 记忆的一部分。所以在这种情况下去汇总最近一个周的一些内容,他自然就会去直接调用你已经安装的 gmail 的 这个插件,包括它里边的这些 skill, 或者叫专家团来进行接下来的工作内容。那一般情况下 codex 他的思考过程都会在 worked for 多长多长时间里边给你隐藏掉,然后给你的是直接你要的这个输出的结果。那这里我们可以点开下面这个 worked for 五十七秒,就这么快,我们可以看一下他具体都做了哪些工作,我们可以看到他用 gmail 的 连接器,其实这个就是所谓的我们刚才安装的 gmail 的 plug in, 然后接着他会去读取搜索所有的 gmail 的 内容, 那这个过程它使用的其实就是我们安装了 gmail plugin 之后,它的 skill 里边带了关于 gmail 的 这一部分的技能。 当然这些东西都是你在这个项目或者你的要求进行过程当中 codex 完全自动化地去完成的。所以我们才看到仅仅就通过这一句话,我们的邮件 信息完全已经可以被他读到了。那接下来我们能做的操作就非常多了,比如说我们可以让他去回复其中的一份邮件,然后呢他可以先给你草稿,让你去确认是不是要回复, 你告诉他可以回复,然后你再去你的发电箱里面去看的时候,就邮件已经发出去了,整个过程你都不需要去登录你的邮箱。然后接下来这个呢就和我们为什么要建这个文件夹有关系了。我这里的例子呢是看到邮件里边有一些 电器费的账单,那我们让它把这个账单单独拿出来做一个分析,然后生成一个 excel, 那 这里边我们需要说明的一点是,生成一个 excel 其实使用的就是一个所谓的 excel 的 skill, 那 如果我们回到 plug in 的 这个 skill 里面去看的话,最下面有一个 spreadsheet, 这个呢其实就是他的对于表格的技能专家。所以到这里其实我们就能够发现,在整个的 java 应用过程里边,其实都不需要我们去主动 安装什么东西,而是在整个过程里边,他会根据我们的需求去自动的去安装这些 skill 和插件,当然这里面如果涉及到相应的权限要求的话,他会告诉你 如何去做,然后你给他权限,那接下来的工作就顺理成章了。那是像我们现在这个案例里面呢,我让他做了一个汇总表,还是改了一下, 那改完之后呢?我们希望他做成一个定时的一个自动化的一个东西,也就是所谓的 automation。 那 他第一次的自动化呢?他其实是按照每小时检查一次 e mail, 看有没有这个账单,然后把它加进去, 那我告诉他不用那么太勤快了,那我们看到这个 codex 这个牛马真的是太勤快了,我让他把频率改成每个周, 那这个时候我们可以看到奥特曼生里边,其实已经把这个奥特曼生加进去了,就是第一条。那奥特曼生这里面我们看一下菜单的操作啊,这个小三角就是你要现在立刻马上要运行一次,你点它就行。 然后小铅笔呢就是要进行一些编辑,那打开之后我们可以看到这里边其实就是一些非常简单的一些配置,那比如说你要把这个重复的这个频率改一改,你可以在这里边直接去操作。当然你也可以回到我们刚才的这个项目所在的这个 chat 里边去,通过 说话打字让他去给你改。所以从这个项目我们可以看出,其实所有的 fucking skill 和秒杀他与你的需求之间的交互其实是非常丝滑的。这就我说为什么如果你用 codex 的 话,其实你不需要太多的去关注 这背后所谓的这些技术性的名词,你要关注的是你想要个什么东西,这就足够了,那这是我们第一个项目,当然到这里呢,我们可能要问, 这毕竟有些人用的不一定就是机密,可能是别的邮箱,比如说,呃,阿里的企业邮箱,那接下来我们就用阿里企业邮箱来做一个同样的测试,那同样在 开始这个 new 的 check 之前呢,我在牛马二号的文件夹里面建了一个新的文件夹,它的名字叫其他邮箱。 那我们要接这个阿里企业邮箱,如何接呢?我们就从这一句话开始,去浏览器的地址栏里边,把我们这个企业邮箱登录进去,登录好,然后把 这个邮箱地址从浏览器的地址栏复制过来,然后告诉他我要接入并处理这个邮箱。那这个时候我们就能看到他其实使用的是第一种方式的这个办法, 也就是用 chrome 插件,也是 chrome 的 codex 插件来直接去操作你的浏览器来读写你的邮件,整个过程也就一分多钟就完成了。然后我们还是老规矩,让他去看一下有哪些邮件需要我们来及时的处理 啊,他可以给我们一些基本的建议,因为垃圾邮件比较多的情况下,他能够准确的告诉你哪些是需要关注的,哪些是完全就是垃圾邮件。然后呢我们要做一个自动化,那作为这种不常用的邮箱或者常用的邮箱也无所谓, 那我们要每周或者每天让他看一下有没有重要的内容,并且提醒我们。那在这个时候呢,其实他给的我们第一种方案就是还是通过浏览器的控制来进行的,那这里呢就需要我们要保持登录的状态,那其实这种情况下我觉得是不太好的,那我浏览器一直要开着,电脑也一直要开着,其实 不是我想要的,所以就问他有没有其他一劳永逸的办法。那这个所谓的办法呢,就是通过 m a p 程序化的接入, 当然这个呢如果你一开始不知道也无所谓,他会告诉你,那告诉你之后呢,你也不需要理解他是什么意思,你就同意他的建议,然后问他接下来我们如何去进行操作。那比如阿里邮箱呢,现在是推荐我们使用三行客户端登录的一个安全密码的这个东西来进行, 那我们就按照他的这个说明去生成一个安全密码,那到这个时候呢,你把 u 盘地址给他,安全密码呢一会他也会跟你去要。到这种情况下他可能会涉及到操作你的电脑的终端 啊,这种呢其实也不用太着急,那到这里其实我们整个自动化就在不知不觉中已经建好了,那我们如果去 看一下左边这个我的美审的菜单之后,我们点进去看一下,每周 imap 检查阿里企业邮箱,他已经给你配置好了,那我们具体看的话,这个时间频率、 model 你 都可以去这里来进行配置。当然你也可以回到我们刚才的这个菜单里面去说话打字,让他给你改。 ok, 那 我们现在来看第二个项目, 那第二个项目呢,是涉及到我们日常办公里边,你有可能要用到公司的一些系统,那这些系统呢?一般情况下你可能通过浏览器或者桌面那些应用给它打开,那比如我们这个例子里面,我们这里是一个追溯的相关的 wmm 系统, 那这个系统呢?我们现在处于登录的一个状态,那接下来这个项目我们就让 codex 来进行一些相关的处理,同样他的处理还是老办法,我们就把这个系统的链接直接贴进来,简单跟他说一下这个系统是干什么的, 然后让他去研究一下功能。那接下来我们其实就能够看到他直接动用了浏览器操作的这个插件,然后对整个系统进行一个向人去看的这么一个操作,只不过他看的速度是飞快的。那在这个过程里边, 当他在对你的电脑进行控制的时候,我们其实是完全可以在浏览器里面看到他打开了这么一个页面,然后呢会随动着鼠标点来点去的,非常奇幻。那接下来呢,既然他已经 能看到我们整个这个系统了,那我们就给他提一些要求,那比如说我们让他去看一下这个系统里面的库存的情况,也是这里面的这个引诱者的情况,然后我们让他去做成一个 ppt, 并把这个输出的材料放到我们这个项目文件夹里面去。 当然这里需要补充说明的一点是,这个呢,我也是提前建了一个所谓 wms 的 字文件夹,在牛马二号的文件夹下面,所以 ppt 一定会放到这个项目里边去,那这个就是它通过查看库存给我生成的一个 ppt, 所以这里边我们再来仔细看的话,整个这个过程里边,它其实又调用了一些 skill。 那 比如我们看这里有个 read presentation skill, 它这个使用的呢就是生成 ppt 的 这么一个专家功能。所以我们就发现这些功能这些 skill 我 在一开始并没有特意的去安装它, 那在这个过程里边它自己就会去安装它。所以再一次印证了,在 codex 里边,我们其实不用去太过的在意所谓的 plugin 和 skill 是 一个什么样的存在,我们要的其实就是一个结果。 当然如果你对这个 ppt 不 满意呢?那你接下来可以让它继续去进行取取拐和美化,也可以把它转成其他的输出形式, html、 excel 等等都可以。 ok, 那 我们来看第三个项目,也就是那个所谓的半成功的项目, 那这个半成功的项目它的意义在于是让我们去了解现在 codex 用来做自动化的控制的时候,它的边界在哪里。因为我们知道不同的这些软件系统在你电脑上运行的时候,他们自己对于安全方面的这些限制 和规则是不太一样的。那比如说我们在这个项目里边,其实我们一开始的预期是让他去读取你的微信里边的某一个聊天记录,并且让他把这个内容提炼出来。实际上呢,这个自动化我在之前的 测试当中是没有任何问题的。但是呢,安卓微信最近更新完之后呢,他把你的桌面自动化这一层给你拦掉了,一旦识别到你用其他的东西来操作微信的时候,他会给你强制下线,当你再重新登录上之后, 你基本上你的微信的界面使用任何的自动化工具就已经没办法识别了。当然我们知道之前有一些 从微信后台的这些数据库里面去通过其他方式来获取你的聊天记录,这种开源的代码库也是有的,但后来也逐步都被微信给封杀的找不着引流了。那这里如果大家有好的办法,也可以一起来讨论一下,那我们再说到这个项目的成功的一部分, 那我们在安装了这个企业微信的时候,那我们就用企业微信在下面又做了一个测试,企业微信的测试是没有问题的,可以通过控制电脑的这种形式来直接读取企业微信里边的这些群聊,跟人聊天,把这些记录里面的信息提取出来。 那其实我觉得从这个角度来讲,如果我们在日常的工作里边,有很大的工作是通过企业微信和你的客户,和你的同事进行交流的话,那么可以通过 codex 这种形式来把企业微信里面的聊天记录进行一个 定期的一个整理汇总,甚至帮你去回复相关的一些信息,这样也能很大程度上节省我们的时间和精力。 ok, 那 今天的视频就到这里,如果大家对 codex 的 基础功能使用不太了解的话,可以去回看一下我之前的牛马一号那期视频啊,我是狼哥,希望这期视频对大家有所帮助,欢迎点赞、订阅、评论、转发,拜拜!

本期分享 codex 零基础上手使用教程,覆盖了办公、编程、自动化等使用分享,让我们每个人可以轻松上手使用。开始之前我们先来了解一下 codex 与 cloud code 相比,它的优点有哪些,第一个就是有更多的额度, 第二个就是不会轻易地限制账号,封账号。第三个就是 ai 升图能力,目前是排名靠前的。第四个就是客户端安装更容易,容易上手。第五个就是不订阅也可以去使用体验,因为它有免费的额度,这是关于 codex 的 一些优势。 第一件事情就是要修改语言,在这里部分伙伴会因为网络原因下载的版本默认的会是英文界面,所以需要修改,如果是打开直接就是中文,可以跳过这个步骤,然后设置语言,是在左下角设置这里,然后选择 设置,然后在默认的常规选项里面,这里有一个语言,在语言这里我们选择中文,这时候就可以切换为中文界面。 下面我们来介绍一下它的功能,我们先从左侧说起,第一个就是新建对话,这里就是创建一个新的对话窗口,在这里我们就可以把它想象成 相当于我们换了一个朋友聊天,然后打开了新的绘画。然后第二个就是搜索功能,在这里就是可以搜索历史对话,这里我们就可以比喻为搜索和朋友的聊天记录。然后第三个插件,这里就是让 codex 更强大,赋予 codex 拓展功能,拥有操作其他软件的能力, 在这个插件这里,它还有技能。这就是我们前面分享了好多次的 skills, 如果大家还不了解,可以看一下之前分享的内容,然后第四个就是自动化, 在这里就是定时任务执行,可以直接去新建自动化功能。下一个就是项目,这里就是我们所有的创建的项目和打开的项目都会显示在左侧,然后下一个就是对话, 当我们在对话窗口没有选择任何项目的时候,我们选择不使用项目,这时候的对话内容就会在 对话栏目下面去显示,这就和我们网页对话使用是一样的,适合做的事情就是一些日常任务,比如搜索资料,写内容等等。分享到这里肯定会有好多小伙伴有疑问,就是上面的项目什么时候用,以及使用的场景是什么?在这里我来分享一下。 这里就是我们需要 ai 生成文件的时候,比如我们写代码,生成 markdown 文档,生成 ppt, 生成 word 文档等等,就是涉及到文件生成的,我们就可以选择创建项目,这样的优势就是生成的内容都会保存到当前项目文件夹,容易编辑和管理。 在这里我就是使用大白话来分享的,就是更容易理解一些,可能还是有些模糊,下面我直接实操,大家来看一下。 在这里我直接新建一个项目,然后在项目这里我们指过来就会有一个添加项目的图标,然后我们选择这里,他有两个选项,一个是新建空白项目,第二个是使用现有文件, 第一个就是我们直接新建,第二个就是如果我们打开某个项目的时候,就选择使用现有文件夹, 在这里我们是新建空白项目,然后我们选择新建之后,可以看一下它,这里就新建了一个项目文件夹。创建之后我们可以去修改项目的名称,我们只到项目名称这里,然后选择三个点,在这里有一个重命名项目,我们在这里 我们命名一下,比如命名为 demo, 然后保存,然后我们看一下对话窗口这里它自动选择的就是这个 demo 项目,在这里我们给它提示词,就是一句话,介绍 ai 生成 txt 文文本档, 然后我们直接发送。现在我们的模式是选中项目文件的,到时候它生成文件的时候,就是生成在当前项目文件夹下面。 好,这时候任务完成了,就显示已生成文本文档。 ai 介绍点 txt, 在 这里我们打开项目文件夹,我们来看一下,然后我们通过项目文件这里三个点,然后在资源管理区中打开, 现在就有了 ai 介绍点 txt 文本文档,这就是 ai 生成的文件内容。如果我们不选择任何项目, 我们选择不使用项目,然后我们再和他对话一句话,介绍一下你自己,然后我们直接发送,可以看一下左侧,他就在对话列表下面,没有在项目文件夹里面,这就是项目和对话的一个区别,经过实操演示,我相信大家已经了解了。 然后如何选择,就是涉及到文件生成,比如文文本档写代码,我们就要创建一个项目,如果只是单纯的和 ai 对 话查资料,我们就不用去创建项目文件夹,直接对话就可以。 下面我再分享一个个人感觉比较好用的功能,就是多任务处理,在这里我还是使用生成个人主页的任务来举例,因为这个应用场景每个人都可以用到,我们先选择我们刚刚创建的这个 demo 项目,然后我们把提示词 粘贴过来,在这里我们就是让它生成一个个人主页,使用 html 加 css, 然后还有就是一些风格指定,还有一些按钮的效果,还有页面布局等等,在这里我们就直接发送 在当前的任务进行中,比如我们突然有一个想法,我们可以使用这个技巧,我们想规定腋角的颜色,比如腋角使用灰色,然后我们直接发送,可以看一下它现在这个提示词就是在排队的状态,如果我们想让它立即执行,在这里我们直接选择这个引导, 可以看一下他这里提示就是提交但不中断模型运行,然后我们直接选择,这时候像我们给他的这个任务,他就直接插队插进来了,就不用等上面的任务执行完毕之后,再执行第二个排队任务, 这是关于这个使用小技巧,可以看一下第一个它会直接在当前工作区生成一个可独立打开的静态文件,然后它这里就有一个已引导对话,它就提示收到页脚,我会做成浅灰色背景,如果我们不点引导的情况下, 它就会等第一个任务执行完成之后,然后再执行页脚使用灰色,好,现在就生成完成了,然后我们打开看一下生成的效果,这就是我们生成的个人主页,这里我们直接自己去修改就可以。 下面我再来演示一下多任务,比如我们在当前项目文件夹下面,我们再有一次对话,就是什么是 ai 一 百字介绍,生成一个 txt 文文本档,然后我们 直接发送,这时候我们就可以在另外一个项目文件夹下面,我们直接选择开始新对话,然后我们再给他一个任务, 如何学习 ai 一 百字介绍生成文档,这时候就是同时进行任务,这就是多任务同时运行,当运行完成之后,他这里就会有一个蓝色的小点,然后我们再返回到项目文件夹,这时候任务就完成了,这就是多任务的应用, 然后下面我们再一起来看一下,就是创建技能,就是创建 skills, 我 们来到插件这里右上角的创建,然后选择 创建技能,在这里它就会显示一个 skill creator, 这就是创建 skills 的 一个技能,然后我们把提示词复制粘贴过来,在这里我们还是封装一个 ai 提示词,让它去制作一个 skills, 然后我们粘贴过来之后,下面给他的就是帮我创建一个写作技能,直接发送 好了,这时候提示我们创建成功了,它也给我们显示出来了这个创建的路径,在这里我们新建对话,使用我们自己创建的 scale, 让它帮我们去生成一篇文章,在这里我们输入斜杠,然后我们选择 技能,然后找到我们刚刚创建的,可以看一下这个是个人,然后我们选择,然后我们再给它提示词,就是什么是 ai 帮我写一篇 seo 文章,然后我们直接发送,像现在这个状态,它就是调用了我们创建的 skill, 这时候用我们创建的 scale 就 写好文章了,在这里我们只关注一个地方,就是我们提示词里面让它包含问答模块,这时候它也是包含的,它严格遵守我们的要求,这就是我们创建技能和使用技能的所有流程。 然后下一个我们再看一下插件的使用,在这里我再新建一个对话,我们使用插件就需要使用 at 符号去指定, 比如我们还是给他一个提示词,就是如何学习 ai 使用,然后艾特符号,然后我们选择 document 插件,这里就是这个 word 文档的一个插件,然后帮我生成 word 文档直接发送, 这时候就用插件创建好了文档,现在我们打开看一下它生成的一个效果,生成的效果还是非常棒的,它不是那些简简单单的文字,它是给我们排版好的,效果还是非常棒的,这就是 codex word 文档的生成插件的使用。 然后下面我们再来看它的另一个功能,就是自动化,在这里我们来到自动化这里,通过右上角,然后新建自动化功能,然后我们输入 就是每天学习一个 ai 术语提示词,这里就是每天上午八点给我推送生成一个学习文档,比如 token 是 什么, ai 是 什么? webcoding 是 什么,就是每天八点让它帮我们生成一个学习文档,然后我们再选择一下项目,我们选择 demo, 然后每天八点在这里就是选择模型,我们就选择默认的, 然后下一个就是推理的设置,这里我们也保持默认,然后我们直接创建就可以,这时候就创建成功了,然后我们选择这个自动化任务,就可以看到它的一个运行状态,还有一些详情信息, 这就是关于这个自动化任务创建,也是非常简单的,都是可直观的操作。好到这里就是我们 codex 安装到使用的所有操作,我们本次分享的都是一些基础的使用,我们可以先上手使用,然后其他的再边使用边研究就可以。 在这里还有一个拓展分享,就是如果你使用 codex 是 一些日常的任务,大家可以到设置这里面,然后常规选项这里工作模式就选择 适用于日常工作的模式,像这样它的模型是同样强大的,就是技术细节更少一些。好了,这就是我们本期的所有内容,欢迎留下你的想法,我们下期再见。

今天是一条适合小白的保姆级 codex 教程,如果你之前只用过聊天式的 ai, 可以 先把 codex 理解成能帮你执行任务的 ai 助手,它不只是回答问题,还可以在你授权的范围内帮你处理文件、生成内容、运行工具、预览结果。 那这期呢,我会从基础使用、真实案例、高级功能等三个方面给大家拆解。 codex 里面会包含三个案例,也会讲到一些插件和特色功能的使用。 那第一次打开 codex 的 时候,你按照界面的提示登录账号就可以了。登录完成之后呢,你会进入 codex 的 主界面,新手先不用纠结各种设置,因为这些后续都可以再改,我们可以先把界面看明白。 那我们现在已经进到 codex 这个页面呢,你只需要理解三块区域就够了。左边是项目和任务列表,你可以在这里切换项目,查看历史对话,也能看到有哪些任务正在跑。 中间呢是聊天和任务输入区,你要做什么就直接用自然语言告诉他,和之前咱们用的 ai 对 话型产品其实是一样的。 那右边呢,是执行过程和结果区, codex 改了哪些文件,跑了什么命令,生成了什么样的结果,网页预览长什么样子,通常都会在这里展示。然后呢,我们来讲几个新手比较容易混的名词。第一个是项目, 那项目就是你给 codex 选中的本地文件夹,你选了哪个文件夹,它就能够围绕这个文件夹读文件、改文件,生成内容。项目呢,也有两种使用方式,一种呢是根据任务类型创建一个项目文件夹, 以后同类的任务可以都放在这个项目里,比如说我自己每天都要做的 ai 新闻板块,我给他建了一个独立的文件夹,叫 daily ai news。 另外一种呢是打开现有的文件夹,那 codex 就 可以处理这个文件夹内的文件了。 第二个需要理解的名词是上下文,上下文可以理解成 codex 当前知道的信息,比如你跟他说过的一些需求,他已经看过的文件,当前任务进行到哪一步,都会影响他接下来该怎么去做。 第三个是模型智能程度和速度,普通任务直接用默认的中度就可以了,比如整理文件,写文案,改一点简单的内容,不用上来就拉满 那复杂任务,比如要跨很多文件,规划项目,排查问题,你可以再把智能程度调高,然后模型这里可以切换不同的 gpt 模型,速度这里直接用默认就可以了。 最后呢是权限,这个非常非常重要,默认权限就是 codex 主要围绕当前的项目文件加工作,遇到联网安装工具,访问项目外的文件的时候,一般都会先来问你。那自动审查呢?是我比较推荐新手日常使用的, 它会根据操作风险来做判断,低风险的时候自动操作,敏感操作的时候就需要你人工审核了。 那最后这个呢,顾名思义就是给 codex 所有的权限,这个只建议你非常明确的任务,也信任当前操作的时候再用好。以上呢,就是一些 codex 的 基础使用内容。

你现在看到的这条视频就是 codex 加 hyperframes 做出来的,包括所有的动画字母以及里面的图片生成内容,包括这条视频也是 codex 自己发出来的。接下来我给大家拆解流程。首先我把这个视频的文文本案复制到 index t t s 去做配音生成,没错,这个视频的配音 也是 ai 的。 接下来在 codex 当中找到插件,下拉找到 hyperframes 白黑键,点击加号,再点击安装,然后就可以到对话窗口艾特这个插件,再把这段音频 一起放到聊天窗口,然后把要求给到它, codex 就 会根据 hyperframes 这个插件做出对应的动画。值得惊讶的是,当我看到这条视频的成片时, codex 居然自己去文件夹看了我的录屏素材,然后自己剪进了成片当中。所以你们会看到鼠标动画,但是我从来没有告诉过 codex, 我 提前录了屏。 这就是 codex agent 的 聪明之处,整个动画都是由 ai 自己调用技能做出来的,包括你看到这里可能会觉得这个动画有点看腻了,那这个时候应该有点真实的动画有点看腻了,比如一个玩美女的滑板,或者一个正在喝帅哥的咖啡, 是因为这个部分啊,调用了今天的 emerge 二生成图片,所以你看起来这个视频才不会那么枯燥。包括这期视频的封面也是 codex 做的, 视频发布也是他自己发出来的,既 computer use 功能发布之后,随之又上线了 chrome 的 功能,所以我就提前登录了视频后台,你才能看到这条完整由 aint 全流程制作,自动发布出来的视频。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

codex 真的 很好用,但是 g p t 五的模型太贵了,再用下去我的钱包要顶不住了, 所以呢,今天呢,我就给大家分享两个 codex 很 实用的插件。呃,第一个插件呢,可以接入我们国内的一些大模型,比如说 deepsafe 啊,字谱啊。好,第一个呢,就这个这个插件 打开之后呢,我们可以先点击模型中心,然后这里可以选择我们这些国内很优质的大模型。然后呢我们点击加号,复制好之后呢保存,保存之后我们再点击应用管理,选到我们的 codex, 选择其中应用 就可以了,而且如果你有多个国内的大模型的话,你切换模型的话,它对话是不会清除的,我觉得这个就很好用。好,现在通过这个插件打开的话,那就是使用的就是我们的这个 啊质朴的模型了。那如果我们是通过 api 的 方式登录的这个 codex 的 桌面版的,那它这个插件是灰色的啊,那我们也可以通过一个插件来把它解锁,就是这个插件 好,把它部署。安装好之后呢,我们先退出我们的 codex。 好 的,然后通过这个插件启动之后呢,就可以看见我们的插件已经解锁了,快去试试吧,让你的 codex 更好用。

codex chrome 插件,别再把它理解成自动点击器,真正值钱的是它能站在浏览器旁边读页面,看文档,跑后台,把零散操作变成可验证的任务流。 用户最在意五件事,多标签能不能串起来,页面能不能读懂,账号会不会乱动,隐私和支付会不会停手?最后结果能不能说清楚? 我的建议让他整理信息,对比页面,生成测试步骤,复盘操作路径,所有敏感确认。必须你来点程序员博主讲这个小题,别讲插件多炫讲工作流变了。 以前 ai 等你复制粘贴,现在他直接进入浏览器现场。会用 codex 跑浏览器的人会比只会问答的人快一个版本。

大家中午好,我想了想,我还是要跟大家录一下,因为最近 codex 跟 anthropic 的 cloud code 真的 太火了,昨天晚上 openai 也发布了 codex, 现在已经可以直接支持谷歌的 chrome 以及 windows, 就是 chrome 在 macos 和 windows 情况下,呃,可以直接调用 codex 的。 我快速录一个视频,教一下大家怎么把这个功能激活。首先呢, 我们要打开最新版本的 codex, 如果不是最新版本的,可以在这里去检查 update, 就是 要确保更新到最新版本的 codex。 更新完之后,打开这个插件 plug ins, 打开这个插件, plug ins, chrome 的 这个选项就会出现了,点击这个 chrome 点击吧,因为刚才我已经点击了啊,可以直接点打开, 打开它会直接跳到你默认浏览器的这个 codex 的 激活界面啊,如果你默认的是 chrome, 就 会正常蹦到这个 chrome 的 界面 crom 蹦到之后直接点击艾特 crom 就 ok 了啊,因为我认为接下来会很精彩的。其实 cloud 大家能看到我的 cloud 已经支持了,就当我点开这个 cloud 的 时候, cloud 的 无论他调用自己大模型也好,还是还是 cloud code 也好,他可以直接操纵我的 crom。 那 现在呢,就是我把 code 也加入到 crom 之后, open up code 也可以直接调用我的 crom 吧。因为今天我想录这个视频的原因就是我认为接下来整个电商的搜索逻辑都会因为世界头部的几个大模型公司会带来天翻地覆的变化。 比如我现在自己日常的使用已经不用去打字了,我调用的是 tapis 会比较多,所以现在目前,哦,现在才五月份,我觉得其实 ai 的 风向已经调了好几次了。比如年初的 open code 火了一阵子, openclaw 就是 龙虾。 那其实我认为到现在为止了, open opencloud 的 风风口或者说营销热度已经完全消退了。那接下来就是 webcoding。 那 目前最主流的就是 codex 和 android 的 cloud code。 就是 cloud 的 code 啊。好吧,今天就跟大家快速录一下。我估计可能很多伙伴不知道怎么在 codex 里面去添加 chrome, 在 chrome 里面去激活 codex。 好 吧,那今天先这样,拜拜。

codex 里有哪些好用的插件?别从名字开始,按任务来选。做网页验证,用 browser 和 chrome, 一个看本地页面,一个接真实登录态 做文件交付,看文档表格演示和 canva, 它们能把想法变成可检查的文件。 做视频和创意,用 react 写视频,一个适合 html 动效和字幕 做沟通和工程流程。看 gmail 和 superpowers 邮件代办调试测试都能接近同一个工作台。 最后的原则很简单,看你卡在哪一步,让插件承担最耗时,最容易出错的那一步。

你现在看到的这条视频就是 codex 做出来的,我只是把我的文案录了音,然后在 codex 当中找到插件,下拉找到 hyperforest by hanger, 点击加号,再点击安装,然后就可以到对话窗口艾特这个插件,再把我录好的这段音频一起放到聊天窗口,再把要求给到它, codex 就 会根据 hyperfamilies 的 这个插件做出对应的动画。这条视频整个动画都是由 ai 自己调用技能做出来的,包括你看到这里你会觉得这种动画有点腻了,那这个时候应该有点真实的照片插入进来, 比如一个玩滑板的美女,或者一个正在喝帅哥的咖啡,这个部分是调用了 gpt image 二生成的图片,所以你看起来觉得不会那么枯燥。如果再偷懒一点,甚至包括我的配音,都是可以全 ai 流程的,这样的做视频方式有没有把你爽到?

这个视频是用 codex 插件上面在这最近比较火的叫 apple frame, 这个插件啊就是帮我自动剪辑的。 嗯,确实就是说调教完之后可以批量去剪辑,前面的话调教的比较多哈,大家如果想要这个提示词也可以就调正,调教完了提示词如果有想要的话可以评论区留言啊。 就是通过几轮调完之后,我们的这视频啊,就是通过这个口袋是剪出来的,嗯, 经过一轮两轮三轮啊,调完之后成最近最终版本,然后就是只要把这个视频文件啊放在这个目录指定这个目录下面,然后他能够读读取包括你的文案的组织稿给他,就是如果说有口播文案的组织稿给他,效果更好一点, 这样子的话把这个要求,嗯啊,甚至一些发音像我这个波克不分啊,英文单词发音不准的情况下,提前把这些发音不准的这种关键词给他。他,你看他这个看到没有,专业术语,我们卡尔扣带斯这些 专业术语啊容易念错,然后就可以,然后把字幕风格给他就 ok 了,然后最终会成为一个, 那就测试,测试完之后就可以跑了啊,那如果说也会遇到这种音画不同步啊,你让他校准一下就可以了,也是时间会反过来,大概十几分钟就能剪完四个视频。