用 codex 首做了一个语音输入,做的原因呢是觉得 tablas 的 体验非常好,但是对我来说订阅太贵了。然后 web coding 了大概一天多,基本上能够到达自己日常使用的状态。用了四个 gpt plus 账号池做的, 可能成本不到十块钱吧。做云书的主链路算比较容易吧。嗯,就是流式的 asr 加上 lm 的 整理,然后再聚焦到当前的输入框, asr 记的是阿里的实时转录, l a m 记的是 g p t 五点四。然后 prom 的 你可以根据自己的需求去写,看看你是想写得扣语化一点还是写得书面语一点。 那你可以自己去改这个 prom 嘛。所以我觉得这类工具的底层能力啊,算是越来越通用吧。然后模型的能力其实不由 tablas 去决定啊,但是产品的体验,交互的细节和对这个产品的理解还是它的价值啊。 但是自己手搓的话,可以用 prom 的 去快速达到你想要的效果。我理解本质上是靠普通 prom 去调就行了。实现上呢,比较复杂的可能就是全剧监听,然后延迟上,不过这个你和 ai 去多推几轮的话应该都能解决。
粉丝48获赞266

啊,出一个 codex 如何进入 deepsea v 四 pro 的 最简单的教程啊?首先首先是在这个网上下载啊,下载自己电脑对应的版本就可以了,把这个下载下来之后,有一个这个,这个装上就可以了,然后需要第二个工具, 第二个就是需要下载一个这个 cc switch, 这个下载之后呢,还需要先把它下载下来啊,还需要另外一个东西,还有另外一个东西,主播写了一个中转的一个一个工具,因为这里面是不能 codex, 是 不能直接用, 不能直接接入 deepstack 的, 然后需要写一个中转的服务,然后在这写了个中转的服务,大家能看到这个地址吧? 这地址要说呢,这是 get 它的一个地址啊,然后就可以把这个把它克隆下来,克隆下来直接 n p m initial, 然后再 n p m 是 大,然后就运行起来了,运行起来之后,然后再回到这个 c c c 位区里边, c c c 位区里边,第一个是客户的,这个先不用管,然后进入这个,第二个,这个这个拆的 g p t 这个, 然后进去这个里边呢?然后点一定要先选中这个,然后再点这个加号,再点这个加号,你主播已经添加了,然后和这是一样的,然后这个里边这个自定义的名字啊,这个这个贴什么都可以,这都不贴,不贴这个屁,随便贴一个这个,这个没有什么用啊,然后然后就这这个地址,这这个地址 就是刚才刚才 github 上边这个项目,这个项目的里面运行起来的地址啊,就贴这个,因为它运行起来就是这个,就是个端口啊,就贴这个,然后这模型名字我们就写的这个 vise pro。 好, 下面把这个勾上, 然后然后这里边有一个内幕啊,往下滑,这有个内幕,内幕这个地方,这个地方的名字是可以自定义的啊,它显示的是在这显示出来的,你希望他让他显示 dsp 和 vga pro, 那 你就把它改一下,如果你这显示成 d s, 那 这个地方就会显示 d s, 那这就好了,把这个弄过去之后,然后点这儿让它启动,让它启动,这样就好了,这个这个它就把它可以关掉,它就常驻在后台就可以了。然后这个时候我们可以看一下啊,这手机这个,然后这儿我问他,你是什么模型, 对吧?他说他是 tiffany 版本,是 vsco 版本,是 vsco, 对 吧? 然后是什么什么什么他可以干什么,对吧?这个就是完全大好,大家可以点点关注啊,到主页加咱们的技术交流的粉丝群在里边,可以有什么问题啊?可以提出来,然后咱们可以一起交流讨论。

分享一下 ai 书桌最新的一个改进,我们把 codex 作为 ai 书桌的一个核心工作台,我们所有的交互都在 codex 上去完成。那我这边做了一些工作,第一步给 codex 加上了一个语音功能,第二步让 codex 可以 去掉取到我们所有摄像头的画面, 让它也可以实时地捕捉到我们书本的内容,帮助我们后续去创建更好的学习交互。 那我给大家演示一下,第一步可能是语音交互,来我们测试一下,你读取一下书本的一个内容,我先用你配置的书本机位走 obs 后台截图,抓一张高分辨率原图,再转一张清亮预览图给你看。 同时我会直接读里面的文字啊,我们看到它,首先它是可以语音回复我们的,这样对小孩子用会更友好一点,顺手检查一下画面是否清晰到能读文字。 好,大家看到它已经可以读取到我们书本的内容,因为通过这样的方式自动化,它会更加的高效和准确。好,它现在进行一个文本的分析, 你看它这样是全程,我们是可以语音交互的,这样对于小孩子,特别是我女儿,她年纪比较小的,我们是可以全程通过语音对语音的一个方式来进行 web coding, 或者去操控整个 codex, 由 codex 去操作整台 mac, 就 后续有很多的想象空间和玩法。首先这里我们一个语音的测试已经成功了,另外一个是截图的方式,就是捕捉到我们书本上摄像头的方式,我们也已经成功了,我们通过 codex 我 们就可以把题目 转换成可交互的学习方式。第一个是带动效,带语音讲解,带交互的一个场景,对不对?先看题目,要把一到八这八个数都用一次,图里已经放好了七和三,我们要让四个加法的结果都一样, 共同的和,可以先定成九,因为七指叉二就到九,三指叉六也到九,剩下的数字也能刚好配成九,先补七,这一组七加二等于九,看到没有,我们是完全可以去生成可交互式的讲解的,先看题目,好,下一步 我们也是可以自己拖动的对不对?那四加一等于五,那整个学习和交互的方式就会发生很大的改变。

hello, 大家好,我是 d p, 今天来同大家分享一个 codex 在 运行长任务的时候,如何让它自动地通过语音来对我们进行提醒。 首先给大家看一张图片,这张图片上我运行了一个 codex 任务,它的时间是一小时二十三分三十秒,在一号位,原则上我们不会盯着屏幕看一小时二十三分,对吧?比如说我去喝个咖啡,我去做一些其他的事情,但是如果这个时候它只运行了十分钟, 然后来到了二号位的,需要你给一个授权,这时候你又恰巧没有看见这个授权,然后你过了两个小时,因为你知道他大概跑一个小时能结束吗?你过两个小时回来一看,好家伙,他只干了十分钟的活,然后都在等你。 那么最简单的解决方法,我想到的就是在需要授权的时候,让他自己播放一个声音,然后我们电脑响起声音提醒我们,我们回来点一个授权,然后他继续自己跑,然后我们呢继续做我们的事情。这就是这期视频想跟大家分享的内容。 首先我们来看一下实际的效果, ok, 接下来我们在 codex app 里来演示一下具体的运行情况。首先我们给了它一个删除命令,然后我们发送这个请求, 确认收到新任务,正在按照你的要求处理。在任务开始的时候,他就会有语音提示,正在运行的任务需要你的授权,请看一下,然后他找到了这个文件夹,需要删除的时候是需要授权的,那么就会播放授权的音乐。 任务处理完成了,我们下个任务见任务结束以后,他就会给一个结束的声音播报,是不是很酷? ok, 接下来我们来进入准备环节。首先你需要打开 dprt 点 live 零零点 com, 在 这里搜索 hox, 找到这期视频对应的文章,把它打开。然后你需要知道的是,这期视频里用到的所有的内容,在这篇文,在这篇文章里你都可以找到。 我们来大概来看一下。首先 a 部分是相关的脚本,也就是说所有的脚本内容我都列在这了,一共是五个脚本。然后 b 部分是用到的三个音频文件,提供了一个网盘的下载链接,我们打开这个网盘看一下 音频在这个 sound mp 三里面有三个,然后外围的这个就是五个脚本,我同时也放上来了,如果你不想复制的话,你就来这边下载, 然后音频实在没有办法直接通过网站的形式下载,所以我就放到网盘了。然后最后 c 部分是一个 open a r 官方的 codex hox 的 说明文档。好的,这就是准备环节的相关内容。 ok, 接下来我们来讲一点点理论的知识, codex hoax 的 生命周期是什么意思呢?就是说一个 codex 的 任务,它中间会有一些关键节点,通过这对这些关键节点,也就是 hoax 的 配置,允许你自动地去运行一些脚本, 那我们播放声音就是用脚本来实现的,那么一共有六个生命周期,第一个是 session star, 就是 打开新窗口。第二个是你 user prompt submit, 就是 你提交的任务提示词。 然后第三个是 permission request, 就是 需要用户授权的场景。另外两个是工具类的使用,最后一个 stop 就是 任务结束,那我们这期视频用到的 hux 就是 一、二、三,这三个 hux 分 别对应的是我们给 codex 发送提示词,一号位,然后二号位就是说 当比如说需要删除文件的时候,需要我们用户给授权,这个时候就是播放授权的音乐,三号位就是整个任务结束以后就 stop 这个场景,所以我们用了这三个生命周期的 hux。 ok, 接下来我们来结合我们视频对应的文章来给大家看看怎么实现这个效果。 首先我这边使用的是一个测试类的项目,然后你需要做的第一件事是在项目的根目录新建点 codex 这个文件夹,然后在下面分别新建 两个文件夹,一个是叫 audio, 一个叫 scripts, 这些都新建好了以后,你需要新建的第一个文件,在这儿它就是 confirm 这个文件,把它新建进来,然后它的内容就是一点一把它复制过来,然后新建完了以后,啊,不好意思,在这儿就是这个效果,保存。然后你新建的第二个文件就是 hux, 点 jason 这个文件的内容就是一点二,文件名在这,你把它复制进来就行。然后我们简单看一下这个文件,这是第一,这个是 hox, 是 最外围的一个结构,然后它是 json 结构嘛,里面就是分别对应三个生命周期 的名称,然后类型就是用 command 就是 命令,然后这个 command 的 呃,就是代表具体运行的命令是什么,然后超时时间是五,这应该是五秒吧,还是应该是五秒?然后这个 command 我 们来打开 简单的看一下,简单的说它就运行了这个项目的,我们讲的是项目级的点 code script 这个文件,然后第一个命令,是啊,第一个参数是 star, 然后下面是放了一个播放的音频,然后剩下的两个是一样,就是音频名不同和那个参数名不同。 好的,这是这两个文件,然后 script 下面你只需要新建一个文件,我是 macos, 我 就新建了这个文件,对应的就是这边的二点一,如果你是 windows, 你 就新建二点二,如果你是呃 linux, 你 就用二点三这个, 然后我就是把二点一的这个名称复制下来,在这里新建一个文件, 然后把这个名称粘进去,然后这个文件新建好以后,把对应的内容通过复制的形式给它粘进来,然后这个运行的脚本就到位了。 然后紧接着你需要做的事就是把三个音频文件下载下来,这三个音频文件在跨个网盘里,然后把这三个文件下载下来,然后放入这个文件夹里,哦,对了,然后这个由于操作系统不同,我在 macos 下是给了这个文件可运行权限,如果你 没有办法运行的话,就尝试给一下权限。好的,到这里所有的配置都结束了,然后在你完成配置以后,有一个点需要注意的是,我把 codex 这个项目打开,就是说它这边会有一个提示, 说的是你的 hux 进行了配置,但是你需要人工的去确认才能正常的使用。那么这边点一下 review hux, 这边又打开,可以看到这边有三个我们配置的基于这个 lm 零零四点一项目级的 hux, 然后它都被拦截了,我们只需要点击这个信任这个按钮就给它放行,然后再回来这边提醒就没有了,那么这个 hux 就 可以正常工作了。 ok, 一 切都就位了,我们来做一个简单的测试。首先在项目的根目录下有一个 v 二十二文件夹,我们给他一个命令,让他去做删除,那我们希望的就是收到命令,他播放一个开始的音频,然后删除的时候问我们要一个授权, 然后删除结束以后播放一个任务结束的音频。好,我们来开始确认收到新任务,正在按照你的要求处理。在这里可以看到上面有一个 hux 的 表述, 正在运行的任务需要你的授权,请看一下这个时候它让我们给授权,然后进行删除,我们点同意 任务处理完成了,我们下个任务见。在这里看到它的它的那个 stop hook 是 触发的,所以它有显示的一个表示,一共是呃三个 hooks。 ok, 我 们来做一个比较简单的总结。首先今天演示的只是如何在 codex hooks 的 生命周期里,利用 hooks 实现不同阶段的音频播放来做提醒。但是我想提醒大家的一个点是, 我们做的视频是音频播放,是为了帮助大家快速的理解和入门,但是实质上这是自动化的一个入口,因为它是用脚本来的脚本,你就可以实现无限多你想要的内容, 然后通过这个音频播放,大家其实可以拓展到扩展通知,日制 代码检查,甚至我们常用的 get auto commit 自动提交,这些都是可以做到的。然后这里还想提醒大家一个点, 我们的 codex 文件夹是放在项目目录下的,也就是说我们设置的 codex 是 对当前项目生效的。但是实际上还有一种场景大家应该想到了,那么就是全局的,我们只需要把相同的内容 跟这个一模一样的内容搬到你用户根目录下的点 codex 文件夹内,实现用户级的 hux, 那 么这个 hux 就 会对你这个用户下的所有的项目都生效,这是项目级和呃全局级的一个差别。 好的,这就是这一期我们透过简单的音频播放来向大家讲解 codex hooks 如何实现自动化工作的一个视频的全部内容。如果这期视频对你有帮助,请帮忙点赞和转发。如果你有相同的经验,想要分享或者遇到相关问题,欢迎留言。 我们正在录制 codex 进阶系列视频,如果有兴趣的话可以点个关注,我是 d p, 谢谢!

你现在看到的这条视频就是 codex 加 hyperframes 做出来的,包括所有的动画字母以及里面的图片生成内容,包括这条视频也是 codex 自己发出来的。接下来我给大家拆解流程。首先我把这个视频的文文本案复制到 index t t s 去做配音生成,没错,这个视频的配音 也是 ai 的。 接下来在 codex 当中找到插件,下拉找到 hyperframes 白黑键,点击加号,再点击安装,然后就可以到对话窗口艾特这个插件,再把这段音频 一起放到聊天窗口,然后把要求给到它, codex 就 会根据 hyperframes 这个插件做出对应的动画。值得惊讶的是,当我看到这条视频的成片时, codex 居然自己去文件夹看了我的录屏素材,然后自己剪进了成片当中。所以你们会看到鼠标动画,但是我从来没有告诉过 codex, 我 提前录了屏。 这就是 codex agent 的 聪明之处,整个动画都是由 ai 自己调用技能做出来的,包括你看到这里可能会觉得这个动画有点看腻了,那这个时候应该有点真实的动画有点看腻了,比如一个玩美女的滑板,或者一个正在喝帅哥的咖啡, 是因为这个部分啊,调用了今天的 emerge 二生成图片,所以你看起来这个视频才不会那么枯燥。包括这期视频的封面也是 codex 做的, 视频发布也是他自己发出来的,既 computer use 功能发布之后,随之又上线了 chrome 的 功能,所以我就提前登录了视频后台,你才能看到这条完整由 aint 全流程制作,自动发布出来的视频。

你好,我是 codex, 一个和你一起把想法做成作品的 ai 合作者。我会先读懂上下文,再帮你写代码、改界面、整理内容。从一句模糊的想法到一个可以继续使用的结果, 我更像坐在你旁边的创作搭档,你给方向我补结构,我们一起做出来。订阅频道继续看创作现场。

这是一期地毯式 codex 教程,如果你还在焦虑谁谁谁又用 codex 做出了什么无敌的应用或者自动化给自己干活了,那你务必看完本期教程,带你最全面的了解 codex 是 什么,它能干什么,并跟我一起实操完成。从 codex 下载 安装到个人网站、文档制作视频动效,自制工具等等等等,全面了解 codex 这个目前为止最强大最全面的个人 a 政策。 codex 的 界面现在我们来到了 codex 的 主界面,这个对话框你肯定很熟悉,对吧?但是你可以看到左边的这个边栏,就可以看到很多不一样的地方。 首先是上半部分,点击这里你可以快速创建一个新的对话框,快速完成一段与 codex 的 对话。这个搜索你可以同时使用 command g 来调出,快速搜索,你与它进行或者对话等等。现在你可以看到技能和插件这两个板块,这里可以说是 codex 的 一大精髓所在。再过来说, codex 是 一个集合了 chatbot, d e 浏览器,自动化工具等等等等的一个大一统的工作台,所以你可以给他安装插件, skill 以及创建自动化任务。这里的插件市场可以让你来随时扩展更多的功能。比方说这里的 computer use 和 browse use 在 我们后半部分的教程中就会用到这两个功能。 再往下看,可以看到项目和对话两个分栏。在项目中你可以点击添加新项目来将你创建好的文件夹给添加进来。在你创建好的文件夹右侧点击开始对话,你就可以创建出一个新的对话框,那么之后你们对话所有产出或者修改的文件,就会在这个文件夹中进行。 正常情况下, ai 如果直接操作电脑,风险会非常高。所以 codex 使用的是沙盒的逻辑,它相当于给 ai 开了一个单独的隔离小型开发环境,它可以在里面读代码,改代码,运行命令,执行测试,但默认是不能随便控制系统的。 在对话这里,你可以选择默认权限、自动审查、完全访问权限三种权限类型,让 codex 来执行还是非常安全的。再往下看,还有一个对话栏, 常用来进行一些临时产生的问题,当我用完,我就会点击右侧的这个归档按钮,把它给归档,那你也可以在设置你归档对话里面去给他找回来。 回到对话框,你可以在对话框中输入任意的问题,或者要执行的操作,比如帮我整理桌面上的这个文件夹里的发票,并统计这些发票总金额是多少,然后统计在一张 excel 表格中,你看很快他就跑完了。 现在我们来使用 codex 制作一个个人网站,首先在桌面上新建一个我网站的文件夹,然后回到 codex, 进入文件夹,点击这个加号,打开计划模式,这样 codex 就 会根据你给的需求,先开始计划他接下来要做些什么,等他计划完成了,他会给你一份详细的执行方案, 然后点击执行,这样就可以去干别的事情。一杯茶的功夫,你就可以等待你的网站。你可以点击右上角调出一个终端, 把它给你的命令复制一下,回车运行,你就可以在 codex 里面预览这个网站的效果,我们点击展开面板。哎,对了,你看 codex 还自带一个浏览器,你可以在 codex 里面直接查看以及批注,这样你就不用回去再想想怎么描述我是要修改什么地方。 文档与 ppt, 那 除了做网页,我现在更高频的用途是用它来做文档。比如说平时很多人会写策划案,汇报 ppt 视频脚本,以前是用 gpt 生成文字,再到 word, 再复制到 ppt 里面,最终再自己排版。但是 codex 现在已经把这些东西都串起来了。比如说我现在告诉他 使用 html ppt 这个 skill 帮我制作一个宠物账号的商业方案,要求包含市场分析、账号定位、内容模型、变现方式,以及未来三个月的执行计划,并生成一个科技感高级风格的网页 ppt。 然后你看到他就会开始创建文件,生成文案,设计页面,制作动画,自动排版。最后给你一个直接可以演示的网址。尤其是你看像我一样要录制这种口播视频的,我这样的 ppt 就是 用 qq 词直接帮我生成的,他做出来东西天然就很适合录屏。 这个时候顺便介绍一下 qq 词另一个非常好用的功能,分叉非常适合这种,你做到一半突然想要尝试一个新的风格, 或者要尝试两种内容的时候,点一下分叉按钮,这个时候不用重开一个新绘画,重新解释项目背景,他会直接分叉当前的上下文。你可以在分叉县城里面大胆做实验,如果效果不好,直接回到原来的主线就可以了。如果效果更好,就可以沿着这个分叉继续来进行开发视频动效。 说到做视频, codex 最近还上线了一个非常强的插件,由黑正推出的 hyperframes, 你 只需要输入一句话的描述,就可以自动生成带动效排版转场。三 d 视觉的高级动效视频,可以说是完全填补了原来视频模型不适合生成精确的带文字、带数据的动效视频的孔雀。 比如说,你可以直接说帮我根据这个养猪场的年报生成一段科技企业的汇报视频,他就会直接调用前端库来生成一段带数据、带图标的动效视频。 skill 与自动化任务普通的 ai 只能回答问题,但是通过 skill, 你 可以把你工作多年的经验或者流程打包交给 codex 自动去跑。比如说你完全可以使用 at skill creator 来描述你的需求,每天自动抓取某个平台的热门视频, 分析标题,提取高赞评论并整理成 excel, 最后生成第二天的选择题。我自己做了一个急梦,排队的 skill, 如果你有批量使用 cds 的 需求,使用我这个 skill, 它就会在晚上帮你批量提交视频生成的任务,自动检查生成出来的视频并保存到本地。 类似这样的 skill 还有非常多,这个部分就留给你们自己去探索。 computer news 这个是我觉得最近 q 版有这个功能,目前只有 mac 版有这个功能, 它运行起来的时候,它就会像一个真人一样看屏幕,移动鼠标,点击按钮,输入文字,打开软件,切换窗口,使用第三方 app。 以前很多的自动化必须要通过写脚本,调接口,配 sdk, 研究文档。但是现在即使某个软件没有开放 a p i, 很多事情扣代码,直接看着屏幕自己就去操作了,你懂这种方式有多震撼吗?最后的总结 可以看到, codex 提供的内容已经非常非常多了,我这里要下一个爆论就是这一类 agent, 他 绝对不会仅限于编程开发等等, 你已经不能简单的给他定义成工具了,但是你也别太焦虑,拥抱 ai, 先从每天自己最烦最重复最浪费时间的小事开始。 比如说整理文档,改革式做表格,生成封面,做网页,写脚本,做汇报,批量修改内容。当这些事情真正开始被 ai 接管的时候,你自己的潜力或许才刚刚被开发出来。

只需要三分钟,让你在 codex 拥有可爱的一二步步宠物。只需要两句提示啊,操作简单易上手,快来试一试吧。好,我们来看一下这个宠物是怎么玩的。点,点开设置之后啊, 然后左边这边有个外观,外观的话你拖到最下面,这边的话就有宠物。宠物,好,我们点开啊,他这边默认的话是有一些宠物的,我们这边的话直接唤醒宠物 啊,把这个宠物唤醒出来,哎,你看这边的话就出来一个,哎,他还跟你招招手啊。好,这样的话呢,就是把这个宠物功能现在打开,接下来的话我们就演示一下怎么创建自己的宠物,你看这边有创建自己的宠物,我们来创建一个吧。 好,那我们要创建一个宠物呢,我们,呃,我也是准备了一些图片啊,自己搞了一些,那我们告诉他呢,这些图片在哪里啊?我们创建一个宠物, 然后告诉他我们要怎么创建好。好了,这边的话我也是准备了一些图片啊,我们直接发给他啊,这边需要注意的话,这个图片的名字啊,需要跟我给出的这个图片需要是一模一样的。 好,然后呢我们就把这些图片根据我的提示直接发给他就可以了。 a few moments later, 好, 他已经改完了,我们看看,看一下他这个怎么玩的。那整个构建过程当中他是有一些, 呃,他一开始啊,没有按照我给他的图片来做啊,那后来呢,就是我告诉他,我给的图片呢就是 g f 的, 你直接按了我的 g f 来做就可以了,然后呢他就把它切完了。切回去之后呢,我们来看一下啊,他生成了两个东西啊,这是什么?看一下。什么哦,他这个哦,是这样的 哦,切成了这样一个东西。好,都已经做完了,我们来看一下。嗯,帮我装进去。好,看起来没什么问题啊,他让我们重启,刚才让我们重启之后可以看到这个宠物。好,我们来看一下吧, 把我们的一二宝哎,拖过来啊,一二宝,来,嗯,我们该干什么呢?今天南京天气怎么样?好,一二宝开始工作了。好,嘟嘟嘟 哦,滴滴啊,可以看到啊,我们的一二同学啊,开始拼命的工作。 好,已经干完了。好的,今天南京天气还不错,有问题。好的,那今天呢,这个就是整个的一个教程。 那也是比较简单的,你只需要把你的图片准备好就行了。那像一二这种网上的图片梗图实在是太多了,自己呢可以研究研究, 给他一些图片呢,然后让他自己做就可以了。好,那这个宠物创建呢还是比较简单的。今天分享就到这边啊,感谢大家的支持,下期再见。

好的,今天给大家分享一个 mac 电脑使用的一个提效的一个信息差。那平时我们在用 code s 啊,或者 code code 呀,或者说在 code 里边去啊,使用的时候要频繁的打字,那效率是比较慢的。 今天提到的是微信的输入法,那我们下载后啊,只需要按住你的键盘的左下角 f n 键,然后呢就可以激活啊,通过语音转文本的形式啊,帮你去完成这个内容的转写啊,可以看到成功率呢也是很高的。 那我们松开之后它就停止输入了,包括我们打开我们的 cloud, 在 这里同样的也是无缝就可以去完成,只要你的鼠标光标选不到一个新的输入框,就可以继续做新的输入啊,包括 我们在打开啊 cloud 的 时候,也是在我们按住按住之后就可以去激活使用了,非常非常的方便。

你有没有过这种感觉,脑子里想法一大堆,但一打开电脑就卡住了。以前你要自己写代码、查文档、调 bug, 现在你可以把想法直接交给 codex, 你 只需要说清楚你想实现什么。 codex 会自己写项目、改代码、跑任务,你负责想象,他负责把想象往实现推进一步。这是一期教学视频, 我将带你从零开始,用 codex desktop 把一个想法变成现实。打开 codex 客户端,首先我们来创建一个项目,点击新建空白项目,在对话框输入需求。我想要创建一个个人简历网站,该怎么办?这是一个关于想法和计划的需求, 你可以点击加号,选择计划模式,选择成功之后,这边会出现计划图标,你也可以通过 shift 加 table 键 进行切换。在计划图标的右边有一个权限控制下达菜单,它有三种选项,一种是默认权限,就是在 codex 的 沙盒中自动运行命令。沙盒你可以理解成是一个与外界隔离的封闭空 间,不受外部的干扰,也不会影响外部环境。第二种是自动审查,它的权限比默认权限更高一些,通过 ai 智能的判断,哪些权限不需要人工审核而进行自动审核。第 三种是完全访问权限,当你选中这个选项, codex 对 你的计算机拥有完全访问权限,它不单单可以操作沙盒里面的内容,也可以操作沙盒以外的内容。 这个选项风险比较高,一般要慎用,不要为了方便而牺牲安全。我一般建议选择自动审查,既考虑到方便,又兼顾到安全。点击这个下拉菜单,可以对模型进行具体设置,选择模型的智能能力时, 一般建议选择中或者高,对于复杂的问题,建议选择超高模型的版本可以选择五点五、五点四或者其他的版本。 code x 客户端目前只能接入自家的模型。 这边的速度有标准和快速两种模式,注意快速模式的速度是标准的一点五倍,但是同时它的头壳用量也是增加的。所以一般情况下,我们选择标准模式。你的需求也可以通过语音的方式进行输入,单机这个按钮 可以进行语音输入,点击确认它就将你的语音转成文字。这些都设置好之后,你就可以点击发送按钮了。在发送之前,你会发现在对话框的下方有这样一些选项,点击它,你知道当前的对话是针对这个项目进 行提问的。你也可以在这边快捷地创建一个新项目,你也可以不使用任何项目进行提问。我们这边选中 new project, 即当前项目。这边还有本地处理 工作树关联。 code xwave 最下面是一个余额查询,它可以显示当前的 token 使用量。我们这边就选择默认本地处理,也就是在你的电脑上运行该项目。 这边还有一个切换分支,当你创建项目成功后,默认使用 git 进行管理, git 帮你创建一个面分支。如果你对 git 不是 很了解也没有关系,直接选择面分支就可以好了。这些选项都配置成功之后,你就可以爽快地点击发送按钮了。 在运行的过程中,它会弹出这样的选择卡片,让你进行选择。通过不断的交互, ai 可以 更加清楚地了解你的需求。比如你希望网站风格是什么, 简历内容如何提供给他,他这边提供四种方式。我们这边可以选择从现有文件提取,直接上传一个文件到对话框,点 击它,然后点击加号添加文件,将你本地个人简历发送给他。接着 ai 问你作品,即主要面向哪些机会?我们这边随便选择一个,你计划把网站发送到什么平台。这边我们选择 git hub pages。 都选择好之后, 我们可以把个人简历发送给他,点击发送这边他接着问你的网站主要使用什么语言展示,我选择中英双语,页面结构偏向于单页。滚动 来阅读一下这个计划书。如果你觉得这个计划书没有问题的话,你可以点击试开始执行。如果还是不满意,你可以在第二个选项里面告诉他进行如何修改。我这边选择试,当选择实施计划时, 你会发现这边的计划模式图标自动取消掉了。接着 ai 就 会根据计划书进行代码的生成。在生成的过程中,你会发现左侧导航栏有个项目,这是我刚刚创建的项目。下面有个对话分类标签,我们可以点击这个按钮, 新建一个对话,然后在对话框中输入今天的天气如何点击发送。这时候你会发现这次对话信息归属于对话分类中,而我们上面的项目是归属于项目分类。你可以在对话分类中新建对话,进行闲聊。而在项目分类中, 你必须要先新建项目,然后在每个项目下方新建一个个对话,这是我刚刚创建的项目,项目中的该对话右侧有一个滚动特效,表示该对话正在运行中。你也可以创建多个项目, 鼠标悬浮在项目分类上面,点击这个文件夹,我们可以创建第二个项目单机,你可以新建一个空项目,也可以打开你电脑上现有的项目,我选择使用现有的项目,点击,找到你电脑上的某个项目, 选择文件夹,点击打开,这个时候在项目分类中就有两个项目,你可以同时对着两个项目进行提问,实现多项目并行开发,提高开发效率。我们现在在每个项目下方 可以创建多个对话,这是一个对话窗口,当你点击它的时候,可以创建第二个对话窗口,你可以在这里进行提问,这时候这两个对话窗口都归属于这个项目下方。在第二个对话执行完成时, 这边就会出现一个圆点,表示执行完成,告诉你这个对话已经执行结束,你可以点击它打开对话窗口进行查看,这边已经完成代码的生成, 同时给你一个网站的预览链接,点击它就可以进行预览。单机后就可以在内置浏览器中预览网站,你也可以点击右上方的这个图标,对右侧边栏进行折叠,再次点击就是打开, 你也可以将内置浏览器进行全屏展开,点击这边的展开面板,这样预览式口变得更加的宽阔。我的简历网站支持中英文切换,点击这个图标可以对整个浏览器进行截图, 这时候截图保存到粘贴板上,你可以将截图粘贴到对话输入框中,然后根据截图进行提问,还可以点击删除按钮,进行截图引用的删除。 回到右边的面板,除了截图功能,还有批注功能,点击批注,你可以选择页面上具体某个区域,例如对这个区域进行批注操作,去掉监 ceo, 写好批注后,点击这边的勾号按钮, 这时批注就会自动添加到对话输入框内,你可以点击发送,让 ai 参考你的批注内容进行修改,这边显示它已经修改成功,你可以点击打开,再次预览一下, 我们发现这边已经修改成功。当然如果你想要撤销修改,你可以点击这边的撤销,那么就恢复到批注之前的状态。你也可以点击这边的审查,看一下代码文件中,它将这行代码进行删除, 然后新增一行代码,除了这个文件内容有改动,其他文件也进行了相关的修改。当前的页面是审查 tab 页,我们可以回到内置浏览器 tab 页。当你发现整个页面 不需要进行任何修改时,你可以将批注开关按钮关闭掉,这样就可以进行很好的预览。点击右上角的图标,可以恢复面板宽 度,这时我们在 codex 界面的中央区域就可以看到完整的历史对话记录,这就是你刚刚添加的批注对话,你可以添加多个批注,点击批注,选择这个区域删除。个人创业,按下回车键,表示添加批注。到对话输入框,按下 command 加回车,表示发送对话内容。 当你发现你的批注描写的非常具体,不需要额外补充任何信息时,你可以直接按住 command 加回车,此时就开始按照批注内容进行修改代码执行成功之后再来刷新页面,个人创业就被成功删除掉了。你再往下方看,将这个爬虫标签进行删除, 点击它加个批注,删除爬虫,按下 command 加回车键,在界面中央区域 e i 开始进行删除操作。删除成功之后,你可以点击刷新,预览一下,发现删除成功,大功告成,删除均被删除, 这时候你可以取消批注。如果这时候你后悔了,你觉得不应该删除爬虫这个标签,那么怎么办呢?你可以点击这边撤销按钮,对代码进行撤销操作。点击撤销后再来刷新页面,这时候爬虫标签就又出现了。 这种操作是对历史对话中最后一轮进行撤销。那么如何撤销到历史对话的具体某个位置呢?例如,你希望从这轮对话开始,往下所有操作均被撤销,那么如何操作呢? 这个时候你可以找到这轮对话,点击这边的分叉按钮,派身到本地,在左侧边栏给你新建一个对话窗口,在这个对话窗口里,我们只能看到这轮对话及之前的对话内容,而无法查看之前的对话内容。 你再次打开预览,这个时候点击撤销,再次刷新一下浏览器,发现被删除的间 ceo 又出现了,这样就可以实现历史绘画记录 撤销到该轮对话位置。回到右侧的内置浏览器。你现在想要对项目模块和经历模块进行同时修改,那么如何操作呢?你发现这两个模块是相互之间独立的,你可以使用工作树找到左侧的对话标题 后,进行右击,点击派生到新的工作数,这时候你发现派生失败,这是为什么呢?在派生之前,你需要进行一次 get 提交,返回到开对话输入框, 输入 commit, 这样就把我们之前所有代码提交到本地 make 之上,这边显示提交成功。如果你不放心的话,可以二次确认是否提交成功。你需要找到项目的源码,点击这边你会发现很多代码, i d e logo 图标,你希望项目源码在哪个编辑器上展示,你就点击哪个图标 标。我一般习惯使用 v s q 的 点击 v s q 的 图标,在左侧边栏中找到版本管理,当你发现这个区域没有任何文件时,说明已经提交成功。回到 q d x, 再次新建工作数,右击派升到新的工作数,这个时候一个新的工作数就新建成功了。为了方便区分, 可以对对话标题进行重命名,点击重命名,修改为项目模块,然后点击保存,这时你就可以对项目模块进行优化。这时候你发现对话框的下方显示工作数三个字。在这个对话窗口状态下,你可以打开内置浏览器,将我们的网站链接复制过去。点 点击复制,然后进行粘贴回车。我们在这个对话框中对项目模块进行优化,选择批注,找到该项目区域,添加三个项目介绍,点击添加,点击发送。接下来再次创建一个新工作数,对精力模块进行优化。同样的操作,选择这个标题,右击派生到新的工作数, 同样对它进行重命名,然后保存,同样打开内置浏览器,把网站链接复制过去,在这边粘贴,然后找到经历区域进行批注。添加多段经历, 然后点击发送。这时你会发现这两个对话框在运行工作,但是它们分别运行在不同的工作树上。对于这个创建失败的对话,你可以选择进行归导,点击确认,它就从对话列表中消失掉。对于我们暂时用不到的对话,你 可以选择进行规党操作。对于对话列表,除了规党,你还可以进行这样的设置,选择右击可以让这个对话置顶。从命名对话规党,对话标记为未读。 在访达中打开复制工作目录,复制绘画 id 等等。更有趣的一点,你还可以在迷你窗口中进行打开。点击该窗口时,它以迷你小窗口形式打开。关键一点,你可以将其置顶。它可以置顶在任何的窗口的最上层,无论你窗口如何切换,它都显示在桌面的最上一层, 点击这里可以将其关闭。你发现两个蓝色实心圆点,表示它们已经运行结束。现在可以预览一下这边它增加了三段项目内容。再来检查一下经历模块,打开预览, 点击经历导航菜单,这边也新增三段经历。你现在回到最初的那个对话窗口,点击它。刷新一下。点击项目,你会发现只有一段项目内容,这边只有一段经历内容,这是为什么呢?这时候你需要将这两个对话框中分别进行的代码修改内容 合并到本地 main 分 支里。在合并之前,我们需要对它进行一个提交,点击经历模块输入 commit。 点击项目模块,输入 commit, 然后让它合并到 main 分 支,此时两边都显示成功合并到 main 分 支。这时候你再点击这个对话窗口,刷新一下,页面上出现项目模块和经历模块的新增内容, 此时这两个对话框的使命就结束了,你可以将它们进行归档处理。回到主分支对话,你可以接着对网站进行深入优化。现在你想要让网站界面变成 ppt 风格,这时候你可以输入美元符号, 然后选择一个专门设计 ppt 风格的 skill, 我 选择这个 skill, 它是我自定义的专属 skill。 接着输入提示词,将网站转换成 ppt 网站,点击发送, 执行成功之后,点击刷新,你会看到这个网站变成 ppt 风格样式。在对话框里面直接调用某个技能, 你需要使用美元符号,这个时候就可以预览 qq 的 x 中安装的所有技能。除了这种方式预览技能,你还可以对技能进行详细的设置。找到左上角的插件导航菜单,在这边选择技能贴报页。技能一般分为两大类,一类是系统内置的技能,一类是用户自己安装的技能。 你可以管理这些技能。点击右上角的管理按钮,在这个界面你可以知道 code x 上安装了多少技能,每个技能分别是什么。 对每个技能可以选择关闭预打开,点击左边的三个点更多按钮,你可以点击打开按钮,这时候看到的是该技能的 scale md 详情,点击这边详情按钮,也可以通过这样的方式阅读 scale, 点 md 文件。当然你也可以点击左下角的卸载按钮, 将这个技能卸载掉。卸载完成后,你可以点击这边的刷新按钮,但是我发现被卸载的 skill 依然存在于技能列表中,这可能是 codex 团队需要优化的地方。右上角有个新建下拉菜单,你可以新建自己专属的插件,也可以新建个人专属技能。 点击新建技能。新建技能的本质是使用 skill create 元技能来帮助你去创建你的专属技能。比如说帮我创建一个技能,该技能的功能是该技能可以审查代码是否规范,技能的名称是悟空 code review。 点击发送自定义技能,创建成功之后,你就可以使用它回到这个对话窗口,在输入框中使用美元符号找到刚刚自定义的技能,但 关机,然后输入进行代码审查。发送该技能就会对当前项目进行代码审查。除了技能可以帮助你实现想法,你还可以使用插件。点击左边的插件导航,你会发现这里面有很多插件,比如常见的 computer use 和 浏览器两个插件,一个是负责操控你的电脑,一个是负责操控内置浏览器。学到这里,你可能好奇,插件和技能是什么关系呢?你可以理解成一个插件包含 n 个技能,它是技能的结合体。比如我们打开 superpowers 插件,你会发现这个插件里面包含了这么多技能。 特殊情况下,一个插件里也可以只包含一个技能。安装插件也很简单,我们回到插件界面,以安装 superpowers 为例,点击这里的加号,点击安装 superpowers 按钮。安装成功之后,点击 superpowers 查看一下插件详情。 默认情况下,这些技能都是起用状态。你会发现第一个技能是 brainstorming 头脑风暴。点击右上角,在对话中试用该插件,这个时候在对话输入框中自动引用这个插件。如果你只想使用该插件里面的某个具体技能,你可以使用美元符号加上插件的具体名称。比 如 brainstorming 头脑风暴技能。如果你只想直接使用插件,而不指定某个具体技能,你可以点击左下角的加号,然后选择插件,找到 superpowers 插件单机。

你看我刚刚 webco 定了一个自动给我推送到苹果 podcast 的 ai 音频简报工作流,它可以每天定时的来给我推送,尤其是对很多像我这样很喜欢听音频节目,不喜欢读文字的人来说,我觉得特别有用。整个流程我探索了很久,也测试了很久, 考量的因素有很多,比如说一个很重要的因素就是 token 的 成本,像这种需要大量的网络搜索在信息汇总的工作,其实是非常消耗成本的。还有就是怎么来解决文字转语音的问题, 大部分这些文字转语音的服务其实还是挺贵的,一个几千字的文章你转下来,你每天这样搞还是得花不少钱的。 最后就是用什么方法可以最方便的来收听这个音频节目。经过我这几天的折腾,我感觉现在我这个方案基本上可以在成本高度可控的情况下,稳定的来给我深层内容,而且收听起来非常方便, 所以我觉得就可以把我这套方案分享出来,然后大家也可以根据自己不同的需求和支付能力来调整。接下来我就跟大家讲一讲我整套流程是怎么样的。 首先还是要用到我们最熟悉的 codex 作为核心的 web coding 工具,我们的第一个环节就是信息收集,我最开始的尝试是让 ai 先写一个脚本,然后我把我想要什么内容提前写好,这个脚本就控制我的浏览器打开切 gpt 去发给他,然后呢等待他自己去完成这些搜索内容,找完后再把内容汇集成简报,然后自动通过脚本把网页上的回复抓取到本地, 把这个简报保存下来,但这样的问题是整个时长太慢了,这个 ai 经常要工作三四十分钟,而且他找的这些信息员我后来感觉也不是很好, 所以我就换了一个思路,我手动收集了很多优质的 rss 信息员,比如说谷歌、 deepmind、 techcrunch 这些,然后还抓取了就是前不久一个 ai 编程大神刘小牌,他自己发布在网上编 ai 开发者的这样一份每日简报。 我把所有内容通过脚本的方式全部给他先抓取下来,然后形成一篇非常非常长的文档。接下来就是我如何要把这个文档变成一份可收听的简报。那么我想 如果这个文档直接去叫 code 处理,真的是有点浪费 token。 所以 我的想法就是通过脚本操控浏览器,把这个文档发送给 qqpt, 然后再附上我预设好的一段提示词。注意,这段提示词很重要,它直接决定了你是希望怎么来收听这份简报。我大概就是让他从国内的国外的 ai 资讯, ai 圈大佬发言, ai 热门产品,社媒上的 ai 热门讨论,再加上刘小牌的那个简报,基于之前那个很长的文档 给我整理,然后按照我要求的格式给我写出来。然后我还要求他不要用那种 ai 味儿特别浓的表达,就是先否定再肯定这种特别傻的句式。 然后整体上我让他再少一些自己的看法,多输出新闻的内容。大概就是这样一篇提示词,然后发给 gpt, 我 这边的脚本就监控 gpt, 看他啥时候回复完。回复完之后呢,他就把回复抓取回来,保存在本地。 接下来的一个环节就是怎么把文字转成音频。这个折腾了我很久,因为我想着我电脑是三零八零 type, 显卡也是不错了,那我应该可以用比较好的本地文字转语音的模型来跑。 我试了一下千问刚出的千问三 t t s, 它的效果确实我觉得非常好了,但是生成的时间太慢,大概四五千字要一个小时,太久了。所以后来我又试了一个小模型,大概生成出来只要几分钟,但生成的质量很差,听着很难受。然后我就在网上找有没有那种免费的 t t s api 的 服务。 后来我找到谷歌有一个每月四百万支付免费额度的 a p i 接口,然后我就用它来做的。音质呢,只能说勉强可以接受,但还是不是特别理想。这个后续可以再尝试一些更好的方案,但如果你不差钱,你就可以直接用 mini max 啊,或者很多现在这些收费的 a p i 服务,音质都是特别好的。 之后我也可以再测一些其他本地部署的模型,看看有没有在推理速度和生成质量上能够兼顾的模型。 音频生成完之后,就涉及到一个很关键的问题,就是我们怎么把这个音频发出去,以及我们怎么在手机上以最方便的方式来收听。我后来发现我现在用苹果自带的这个 podcast app, 就 能很丝滑的实现我的需求。它背后的逻辑是 rss, 你 可以把 rss 理解成一个节目的订阅源, 或者说是一个栏目更新清单,这个清单里面会写清楚你这个栏目叫什么名字,封面是什么样的,每一期节目的标题简介,还有音频文件地址分别是什么? 苹果 podcast 支持去读取这个 rss 地址,然后把你的栏目和节目都识别出来,所以我就让柯黛斯帮我把这一整套东西给搭起来。这里不只是单纯生成一个 rss 文件那么简单啊,它还需要一个地方能够稳定的托管这个 rss 文件以及每一期对应的音频文件。 我这里相当于是借助了 cloud fear 来做这个免费的托管和中转,让这些内容能够有一个稳定的外部访问地址。然后脚本每次跑完之后就把新的音频传上去, 再把这一期节目的信息更新进 r s s, 这样客户端一刷新,新的节目在手机上马上就出来了。最后我再针对这个栏目做一点简单的配置,比如说栏目名、栏目封面稍微调一下就可以正常使用了。整体的大致流程其实就是这样,我这个 skill 理论上来说它应该叫个脚本, 因为这个 skill 里面 codex 本身参与的程度很少,它可能只是负责一些兜底的问题,比如说如果这个流程中哪出了错,它可以自动的去帮忙解决。所以创建这个 skill 的 用处就是我可以在 codex 的 自动化里面直接让它去调用这个 skill, 这样我们就可以定期定时的收到这样一份音频节目了。 当然整个流程是非常个性化的,这里面可以改动的东西特别多,比如你可能对其他资讯感兴趣,比如说你觉得 codex 的 额度完全够用,那你就可以直接让 codex 把抓取下来那份很长的文档整理成一篇你想要的文稿, 就不再需要那个浏览器自动化的脚本了。然后文字转音频你也可以调用更好一点的 a p i 服务,这些都是可以个性化改造的,但整体速度我觉得至少对于我来说,它现在是一个不要钱的方案。当然这个 g p t plus 会员本身我就是一直交着的,所以那个对我来说就不算什么额外的成, 这个脚本经过我多次测试之后,反正执行起来是没有问题的,而且收听起来也很方便,所以我至少觉得它的可用性还是比较高的,唯独音频生成的质量现在还不太满意,这个后面可以再研究研究。 想要更深一步了解的朋友,欢迎大家加群,我们可以一起交流,我也会分享更多的使用技巧和心得。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!
![第111期丽姐的AI悄悄话-上集:Codex使用技巧第一弹,小白新手必看!
[技巧1 - 自动压缩会话]
[技巧2 - @键快速调用插件]
[技巧3 - Markdown渲染+注释]
[技巧4 - 海量插件即插即用]
#codex #AI #agent #编程入门 #软件分享](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/172629e0568ee588746ae17ca65686e1~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2094271200&x-signature=jm4guPIyk4CdL5YqYrS02JzR3Aw%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=2026051614072041545700588ADA68E762)
你有没有遇到过这种崩溃 ai 对 话,越聊越长,上下文爆了,要手动清理! ai 干活时突然想问一个问题,一,插嘴任务直接重置 在 codex 呢?这八个技巧让你的效率翻倍!欢迎来到新手村,今天给你分享 codex 的 八个使用技巧,学完从小白变老手! 技巧一,自动压缩绘画什么意思呢?就是 ai 会自动整理上下文,把废话删掉,保留住精华,不用你去手动清理, 再也不用担心对话太长一出,也不用重新开绘画,用的越久越感觉这货是真懂我呀!技巧二,艾特键快速调用插件 想用插件别翻菜单了,直接敲 at 键,弹出一个插件列表,想用哪个 at 哪个,秒掉出来。不用记命令,不用查文档,手指头一敲,插件就位,这才是真正的一触即发。 技巧三, markdown 渲染加注式敲代码写文档的看过来, codex 原声支持 markdown 渲染,写出来的东西格式漂漂亮亮,阅读体验拉满 还不够?它还有两个小技能,第一个就是它可以一键还原原始 markdown, 想看原码随时切换。第二个就是给某段内容添加一个注视,精准标记问题所在,再也不用密密麻麻的文字里面大海捞针, 还可以精准地给这个 markdown 进行一个注视,然后在对话里面去让 codex 去帮你去修改,非常的便捷,更加的精准化的定位我们的问题。 第四个技巧就是海量插件,即插即用。 codex 呢?它默认支持很多插件,开箱即用,不用你折腾配置,不用你找安装包,点开就用 翻译插件、画图插件、数据分析插件等等,别人还在装环境,你已经开始开工了。好了,这一期就到这,下期我教你进阶技巧多现成自动化的骚操作,觉得有用的话点点关注点点赞,我们下期再见啦!

原来完全不懂代码的人,真的可以让 ai 帮你做工具、写程序,甚至开发软件,哼!这期视频我要分享的是怎么用 codex 来实现上面这三个需求。全程不需要你懂任何编程知识,只要你会打字,会点鼠标就行。 首先登录进去,别的不用研究,咱们不是来当程序员的,不用管那些复杂的项目,文件夹,保持默认设置就好,你只需要找到那个对话框。对,就跟普通的 ai 聊天一样,咱们全程就靠跟它聊天来完成所有操作。 我首先尝试的是是让 codex 帮我做一个自动生成视频提示词的 skill, 这个 skill 的 要求是我之前在网上找到的,直接复制粘贴发给他, 发出去之后 codex 就 开始自己干活了,中间可能会弹出来几个确认框,你什么都不用想,点试就行。等它跑完,它会告诉你做好了,这时候这个工具就已经存在你的 codex 里了,下次你想用的时候,直接艾特这个文件名,它就能自动调用出来,特别方便。 第二件,我试的是调用 github 上的工具,我选的是一个生成 chat gpt 图片提示词的工具。这里有个前置步骤,需要先装备一个 github, 操作也很简单,在界面左侧找到搜索 github, 找到对应的点安装,跟着提示走就行。 装好之后,我就直接告诉 codex, 我 要用某某名称的 get up 工具。接下来还是老规矩,他跑他的,你点你的事。等他配置完,这个工具就在 codex 里直接可用了。如果你想知道以后怎么调用这个技能,直接问他我用这个工具需要输入什么指令,他会清清楚楚告诉你。 第三件事情,我想尝试一下进阶版,我让他帮我做了一个软件,一个真正的可以打开使用的软件。作为一个连 html 是 什么都不知道的小白,我就跟他说,我是纯小白,完全没接触过代码编程,现在想做一个天气预报的软件,你能帮我吗? 他先问我,你要做网页版还是 app 版?我说做 app 版本,然后他就开始自动写代码,自动配置环境,我还是只需要在旁边点几个试, 等他全部跑完,天气预报软件就做出来了。但我拿到之后蒙了,我要怎么使用?我就有直接问他,他又一步步教我怎么运行我的 app, 居然就这么做出来了。 所以你看三件事总结下来,我的核心动作其实就两个,一是把需求说清楚,二是疯狂点事。 codex 本质上就像一个特别耐心的程序员,同事你负责提需求,他负责写代码,你们俩配合就能做出以前想都不敢想的东西。如果你也是完全不懂代码,但又想尝试用 ai 做点实用工具的人,真的可以去试试 codex。

你现在看到的这条视频,不是我一针一针剪出来的,而是 codex 调用 hyperframes 插件自动生成的。 我的操作其实很简单,我先把这段文案录成一段音频,然后打开 codex, 在 插件下拉里找到 hyperframes, 点击加号,再点击安装。安装好之后,回到对话窗口,直接 at hyperframes, 把我录好的音频放进去,再把视频要求告诉他。比如, 当我做一条科技感强一点的视频,画面要跟着配音节奏走,要有转场、有字幕、有动画,不要太像 ppt。 然后 codex 就 会根据 hyperframes 这个插件,自动生成对应的动画视频。 你现在看到的这些画面,包括文字出现、镜头移动、画面、转场,基本都是 ai 自己调用技能做出来的。 如果我想讲 ai 帮学生整理知识点,他还能把一堆笔记变成重点标注、思维导图、复习卡片这种一看就懂的画面。当然,纯动画看久了也容易累, 这个时候就可以让他穿插一些更真实的画面。比如一个人在咖啡店用电脑,一个学生在书桌前复习,或者一个人拖着行李箱准备出发,这些图片可以直接用图像生成模型做出来,再放进视频里。 这样一来,整条视频就不会一直是冷冰冰的动画,而是更像一条有场景、有故事、普通人也能看懂的科技短片。更夸张的是,如果你连配音都不想录,也可以让 ai 来生成声音。 也就是说,从文案、配音、图片、动画到最后的视频节奏,整套流程都可以交给 ai。 以前做一条这种视频,可能要写脚本、找素材、做动画、剪辑、配音,折腾半天, 现在你只需要把想法说清楚,再加一个 hyperframes ai 做视频这件事已经不是能不能做的问题了,而是你会不会把它用起来。

codex 到底是什么?它到底能干嘛?到底什么样的人才会用到它?不是程序员到底能不能用?不会写代码到底能不能用?本来呢,昨天我想出一个基础教程,结果没发出去,现在呢,我就简单口述一下。 首先我要说一下,不一定非得要用 codex, 我 说 codex 就是 指 codex 这一类工具,其实还有很多种工具,比如说像最近开源界比较火的 open code, 像字节出品的 tree, 还有像 carson 等等等等都可以。我只是拿 codex 举个例子,那 codex 到底是什么呢? codex 一 句话总结就是它是 gpt 的 亲兄弟, gpt 呢,就是用来聊天的,而 codex 呢,就是用来干活的。它能干什么活呢?现在能干的活非常多,如果你现在还花大量的时间去做 ppt, 你 现在就可以把这些任务丢给它。现在 ai 做 ppt 能力已经非常强了,我之前做过一次测评, ai 现在直出的 ppt, 简单修改一下,基本上就能够汇报,它还可以帮你做视频,其实我的很多视频都是 koex 或者是 cloud code 帮我做的。 koex 现在能帮我省掉很多剪辑工作,比如说你的电脑驱动坏了,你不知道怎么修,你现在就可以让 koex 帮你修一下,你还可以让 koex 做一个个性化的简报, 如果你真的有想法,你还可以做一个网站,做一个 app。 我 上面说的都是 koex 能力的冰山一角。那 koex 适合什么样的人群? 会写代码?到底能不能用 codex? 很多人以为啊, codex 这类软件就是一个非常专业的软件,这可能是最大的误解之一,你可以问一下你周边程序员的朋友,看看他们现在还写不写代码。今天刚刚刷到谷歌帝麦的研究员姚顺宇的播客, 他说现在大部分项目都不用写代码了,全部都在用 ai coding。 更主要的是像 codex 这类工具,它的使用难度绝对不会比豆包高,当年我学 cad 画图还学了好几个月,才能勉勉强强上手。 而现在的 ai coding 软件,基本上几天的时间就能够学会,最重要的是它不是一个很枯燥的软件。很多人开始 ai coding 之后,它现在连游戏都不玩了, 每天都在等着额度恢复,因为它很容易让你有一个 builder 的 感觉。 codex 其实它的能力跟它的竞争对手 cloud code 还是有一定距离的。 cloud 它更像是一个谋士,在你不知道干什么的时候,它会帮你出主意,而当你确定了想要干什么的时候,并且做好这些规划的时候, codex 就 会派上用场了。它更像是一个总经理,它会帮你认真的完成这些工作,所以两者要结合起来用。

大家好,你有没有在使用 codex 的 时候发现多个现成任务,一一不留神它就过去好久了,结果发现它早就完成了,结果就是你拜拜干等了很久,你想要同时去完成其他的事。为了解决这个痛点呢?想到一个方法,就是在现成任务完成之后,让它触发一个提示音 啊,这个在官方的名字叫 hok, 但是官方是没有这个功能的,所以我想了一个方式,因为我与 codex 的 交互方式是,如果我有无法解决的事情,我就直接把我遇到的情况和难题直接发送给 codex。 正常来说,我就是直接打开录音的功能,让它语音 找文字,然后把我的需求发给 colex, 我 跟他说我遇到了这样一个想解决的问题,并且我希望说我解决问题的方式是否是可实现的。 colex 根据我的情况给出了三个解决方案。第一个是在 colex 的 全区 agent md 文件当中添加一个规则,让 colex 在 每次完成任务回复之前去播放提示音。第二版是写一个本地监听的脚本,检测到我的现成绘画中出现最终的回复时,自动播放提示音和弹出声音。 同时他给出了第三个理想版本,就是 codex 官方本身会提供 task complete hook, 这个是在任务完成之后会触发的一个提示,但是 codex 官方并没有这个功能。他最终给我推荐的是第一个方案,后来我发现采用第一种方案就是 容易漏掉或者一些旧的县城没办法触发,所以我就改成了第二种方案,电脑后台监听器统一监听所有 codex 现成,我点击了同意,他直接在 codex agent 的 全局 markdown 文件当中添加了一个通知中心命令,并且这个过程中我是没有任何上手的,因为我是一个文科生,在这个过程中很多的代码执行以及 加一些命令都是由 codex 帮我进行运行的。在开始的时候,他给我设置的提示音呢,是系统自带提示音,但我觉得这个听着声音太微弱,后面我改成了小猫的叫声,但是我本身没有这方面的素材音, 所以我让 codex 直接给我推荐有没有免费下载猫叫提示音的网站,然后它的效率很快,给我推荐了好几个。然后这些推荐的选项呢,都是超链接的形式,我们可以直接点进去进行下载。下载好文件之后,直接把素材音的文件路径复制告诉了 codex, 然后告诉他我需要用这个提示音。他直接把我这个素材音 n p 三的文件素材格式改成了系统通知能够识别的声音文件,并且在 call desk 当中呢,也改成了使用这个声音。那么后续在开启任务现成的时候,只要对话框当中他的阶段性任务完成,他就会触发这个猫叫的声音。 比如我问他帮我设计动画原型 ip 的 插件有什么 啊,我就可以在一旁边干其他事情,边等他帮我完成对应的任务,并及时提醒我。这期的干货分享到这里喽。