来一分钟给大家分享一下我是怎么生成一个口播的视频呢?很简单,第一步你打开这个 codex, 第二步你告诉他,来帮我从 excel 上面找一个叫 dbs skill 的 这么一个 skill, 帮我安装一下,这个是就这样发过去, 我这里就我,我已经发好了,我告诉大家后面是怎么做的,他帮我生成了一个,帮我安装了一个这么一个 skill。 我我就告诉他,我下一步我要做什么内容,我就告诉他,我告诉我要教大家怎么去使用 skill, 大 部分人使用 skill 的 方式都是错的,他就啪啪啪给我生成一个内容,就这么简单, 你再去优化一下自己的下载过来的 skill 就 可以了。在这里插件技能这里他有一堆 skill, 你 找到这个内容诊断,那你看一下这些东西是不是你想要的,在这里比如有很多个原则,那可能原则一二三四可能都是你想要的,但是原则五可能 你不是知识博主,那你就啊对应的把这个 skill 给它改一下,再使用这个 skill 就 可以了。好,下课。
粉丝202获赞2901

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

这就是 codex 的 强大之处,它不只是写代码,也能通过 computer user 搜索真实软件。打开剪映,导入视频,粘贴完整口簿稿,选择男生朗读,生成音轨,压低背景音,再导出成片。更关键的是,这不是一次性的操作, 我们把整个流程沉淀成了一个 skill, 下一次只要一句话, codex 能重复调用这头能力,把复杂的软件操作变成可附用的自动化工作流。

你是否还在熬夜做慢锯?分镜、配音、字幕、封面合成一集还没剪完,下一集又来了。今天的主角就是这个基于 codex skill 做的自动化工具。 你只要输入小说章节,大概十五分钟就能快速产出一条视频。先看这些章节封面,他们不是我一张张手搓的,也是这条流水线自动生成的封面,分镜图、配音和字幕都能一起跑,甚至连你现在看的这个介绍视频也是这个思维搞出来的。 他自己写分镜生成口,播烧字幕,再合成视频。所以第一个优势很直接,自动化,省时间省精力,少熬夜剪辑,少重复劳动,才能批量快速产出内容。第二个优点是成本低, 虽然质量一般,但成本是真的低。基本我就买了一个 gbt plus, 其他能薅羊毛的地方先薅起来。它的整体架构也不复杂,小说章节进来先快速解析,再生成 storyboard 和 prompts, 接着生图和 dds 并行,最后合成 final 点 mp。 四、 小说快速解析这一块,主要负责把故事拆明白,人物关系、当前冲突、因果链拆及位置,还有最后的钩子 gpt image。 二、生图负责视觉部分,包括章节封面、分镜图、人物参考图和场景参考图,它先保证能批量出图。逆向的秦曼 tts 负责配音,每个镜头的旁白、对白和真实音频时长都会写进 audio manifest memory。 结构负责一致性,人物场景配音偏好和改进记录都会沉淀下来,不用每一集都从零提醒 ai。 当然问题也很明显, 第一,静态图表现力不行,后续回切 grog 不是 为了插件,而是它真的又快又便宜,质量差点,但够用。第二,纯 codex skill 的 灵活性和操作感受太差,后续会做可视化版本,让自动化和质量反修能同时兼顾。说了这么多,最后可以看看第六期的自动化生成效果, 质量一般,但整条链路能自己跑起来,这个价值已经很明显了。下面就是成品片段,不喜勿喷,重点看它是不是省时间省精力,而且能不能批量跑。 宋府危机没有立刻爆开,掀动的是府库十余日里装满金银药材的木箱从后门悄然离去。 楚正守在府库,隐约嗅到不寻常的味道,可他的心神全落在那阵残缺功法上。大周天行其总纲,终于只差最后一步。 入门篇修复完成的瞬间,大量心息涌入脑海。上篇要修复一千次,但入门篇已经足够他踏出第一步。练气入门先讲规矩,不是所有人都该被传术不正暴力!

今天我才发现, codex 不 仅能写代码,还能做视频,简直太丝滑了。首先在 codex 的 插件市场安装 hyperframes 插件, 然后告诉他你想生成怎样的视频,他就会自动写文案,自动配音,自动添加背景音乐,只需要几分钟就能做出一个高质量的宣传片,全程你只需要点确定确定就行了。

我奉劝所有还没有装 codex 的 人,千万不要装 codex, 为什么?因为你一旦装了之后,你发现你根本离不开他,我给你看一下这玩意多恐 怖,他居然用了两分钟时间给我做了一个直播复盘的系统,这东西特别简单,未来可以把你的行业做成个系统,你做你的团队管理,做你的业务交付,都可以用到,给大家去展示一下具体的 流程,这里面有直播的工作台,有四个功能,原创直播稿、访写直播稿、直播数据分析、成交数据复盘。可以点新建项目,新建一个直播项目组,我点开始访写,就可以把同行的直播稿直接传进去,让他去进行访写,他就会进行运行。我访写这个提示词之前做这么一个系统,找 外包的话可能花个几万块钱,但是 codex 基本上可以一键出了,为什么说基本呢?因为有些小功能还需要在模拟。给大家看一下我跟他调用的过程其实非常简单,我把他的需求标装了一下, 告诉他这该怎么做,而且我前置给他做了一张系统的图片,让他根据图片来做系统一步步的推出里面的一个功能。未来呢,就像小孩搭乐高积木一样,一个一个功能栏,一个一个去跟他做,把这个系统整个完善,最后接一个云的服务器,或者接个 api, 我 就可以直接去用了。 未来一个人就是一家公司,我把我怎么去用 codex 的 具体流程分享给大家。评论区回 ai 两个字我来安排。最近我对一句话特别的上头,未来淘汰我们的永远不是 ai, 是 那些会用 ai 的 人逐步在淘汰那些不会用 ai 的 人,你觉得呢?

ai 视频最贵的不是生成,是每一次抽索都在烧钱。所以我不再让视频模型自由发挥。我先用 gpt image 二把人物场景镜头和节奏全部画成故事版, 每一格就是一个指令,该是谁站在哪,镜头怎么推,情绪怎么变,先锁死, 然后再把故事版绘给 cds 二点零。这时候视频模型不再猜你的想法,他只负责执行。我把这套流程做成了一张控制板, 不用懂审美,不用背镜头语言,也不用练六个月看到喜欢的风格截图,加上你的想法,就能让 ai 生成属于你的导演级作品。别再抽 ai 视频了,用故事板控制 它, like this it resets。

用 codex 做内容,一定要装这三个 skill, 否则他只会一直停在写代码。他们不是让 codex 继续改页面,而是让他直接生成图片、视频和数字人素材。 这三个 skill 来自模型调用技能库,让 codex 把内容模型接近工作流。离谱的是,很多人用 codex 做产品,最后还要手动去别的平台找素材。最关键问题是,代码都写好了,封面演示视频和口播人像为什么还要重做呢? 第一个 ai 生图 skill, 能把文字需求直接变成可用图片素材先出来,比如封面组、视觉产品图、角色图、场景图,不需要再让 codex 只写站位图, 它解决项目看起来很空,代码能跑,但页面没有真正视觉资产这个问题啊。第二个 ai 视频 skill, 负责把脚本或画面需求变成可用视频素材。产品演示、开场、镜头转场分为画面,不用每次都手动去素材库里面反复找, 它解决的是 codex 会搭页面,但不会帮你把展示内容做出来的问题。第三个数字人 skill, 负责深层口播视频,适合教程讲解和产品介绍。 以前你要录屏、配音、剪辑,现在可以让 codex 把人物讲解也接近流程里。这三个 skill 合在一起,不是炫技,而是把内容生产变成项目的一部分,先生成图片资产,再生成视频片段,最后用数字人把核心卖点直接讲出来。 codex 真正变强不是只会写代码,而是能把项目包装成别人愿意看的内容。 所以这期讲的不是 ai 生图,而是让 codex 从开发助手变成内容制作助手。你是变量,不是常量,项目会交付也要会呈现,这里是人间变量,我们下期再见。

用 codex 自动剪视频,效果真的很惊艳。你现在看到这条视频,就是用 hyperframes 做出来的。方法其实很简单,把写好的文案发给 codex, 然后艾特 hyperframes, 接着告诉他 帮我把这段文案做成一条视频,合适的地方可以生成真实感 ai 图片,如果你有录屏,也可以直接放进画面里。 codex 会先理解文案,再拆成适合视频表达的镜头,他会判断哪里用图片, 哪里用实录画面。 hyperframes 负责把标题、字幕、图片、录屏和转场组织起来。于是你得到的不是几个素材拼接,而是一条有节奏、有画面、有配音的视频。最关键的是,这个流程可以附用。下一次你只要换一段文案, codex 就 能继续按这套方式生成新视频。 真正省时间的地方是从第二条开始。你不用每次都重新想结构,重新找素材,重新剪节奏,先把表达讲清楚,剩下的交给流程。

好了,大家好,这段时间 codex 相信很多小伙伴已经上手,开始用了一个非常好用的 openai 的 桌面端的一个 agent 工具。那么今天我想推荐一个 codex 里面的一个很强很厉害的一个做视频的插件叫 hyperframes, 它可以帮你按照网页的形式去做成一个视频,相当于用写前端的代码去做一个视频。首先我们知道 ai 在 写前端代码这块已经是非常厉害的,所以说这个插件就可以帮你 让你的 ai 像写代码一样去做视频。好的,那么我们就直接来试一试这个插件到底有多厉害。使用是在这边点击这个插件下面找到这个 hyperframes, 安装之后我们直接右上角点在对话中使用。这里我把 cloud 的 一个官网给他,我说一句,请根据这个网站做一个产品的宣传视频。好的,我们这里让他开始执行。好的,可以看到他跑了一段时间,他去官网去拉取了一些他需要用到的素材, 他接着在执行。好的,现在他已经生成好了,他已经跟我们说宣传视频已经生成好,在这里只需要点开就可以去预览。 并且他除了宣传片以外,他还使用了官方的素材,产品的文案,他还有动画的分镜,他还给这个宣传片加了旁白的阴鬼。让我们来一起看一下 the ai for problem solvers breakdown complex work together research write analyze data and code with expert level collaboration bring code to your desktop browser tools and team code by anthropic think bigger work clearer。 可以 看到整个效果还是非常好的,除了可能画面中有个别的小细节, 有一些排版上的问题,整个的效果你敢相信是我只用了一句话,没有经过任何修改它就出来的一个结果。随着 ai 进一步的发展,一开始的文字、 图片、视频以及到现在的全自动的生成视频以及剪辑, ai 的 发展只会越来越快,而且这个工具对于很多想要制作一些宣传视频、科普视频的人来说非常的有帮助。

ok, 重头戏来了,这一期主要给大家讲一下怎么使用 codex 和其他工程软件连接,然后完成一些工作。首先的话是 thirdworks, 我 们可以看一下它的工作流,可以看出 thirdworks 不 需要接 mcp 的, 它是会调用 thirdworks com 口,然后通过 vbs 脚本进行建模。也就是说我们只需要给它工程图或者描述我们自己的需求就行, 它自己也能打开 thirdworks, 但是我们自己打开的话会省很多启动时间。第二个的话去 matelab, 我 们看一下它的工作流, matelive 也不需要接 m c p, 我 们也只需要描述自己的需求就行。第三个的话就是 ency, ency 是 需要接 m c p 的, 但是我们可以让他自己接好,就是我们给他说一下,给 ency 接一下 m c p 就 行, 他就会自己接好。接好 m c p 之后,我们就可以通过脚本仿真求解了。当然以上这些操作,包括想要达到我在视频中展示的一键全自动生成,都是给他开放的完全访问权限不, 如果开放这个完全访权限也有一定的风险,大家可以根据自己的需求选择开不开。呃,当然也可以开这个默认权限或者是自动审查,这样的话他会在一些关键操作的时候征求你的同意,就很安全了。或者我们让他在指定文件夹工作,这样的话也很安全。

虽然最近 codex 的 热度很高,但 codecode 才是永远的神,这些内容呢,都是干货。你现在看到的这些动画效果都是用 codecode 配合 emotion 生成的,比如这种让人一目了然的数据可化的效果, 这种可以叠加在口播画面上的三 d 卡片动效,还有这种科普视频里常见的动态讲解镜头。哈喽大家好,我是阿亮,今天这期视频呢,将会教会你国内网络安装 cloud code, 配置国产模型,使用 remotion 制作精美动画并剪辑视频。 我用 cloud code 呢,制作了一个详细的 cloud code 中文手册,如果你也需要,我也可以发给你。另外我还开源了一个视频自动剪辑的 scale, 所以 这期内容可千万别错过。 接下来带大家使用国内网络安装 cloud code。 先介绍 windows 的 安装,苹果用户呢,可以直接跳到后面苹果安装的部分。首先 windows 用户呢,先把 get 装上快捷键, windows 加 r, 打开终端。 windows 用户呢,要用 winget 来安装,它是 windows 官方的包管理器。 复制文档中的这行命令,粘贴到终端,跑完呢就会显示成功安装了啊。 get 装好之后呢,接下来安装 cloud code, 把文档中的这行命令复制过来, 等它跑完,提示安装成功。到这里 card code 就 安装好了。苹果电脑的话,需要通过 homebrew 来安装,先在终端输入这个命令。 bro 杠杠 word 如果有这个输出代表呢? homebrew 其实已经安装过了,如果没有,那就打开我们的教程文档,复制这行命令,粘贴到终端,回车, 在这输入密码再回车,安装成功后有一段输出,复制这段内容再回车。 ok, 这样 homebrew 呢就安装好了。 然后开始安装 cloud code, 回到教程文档,再复制这行命令,粘贴到终端,等上一会提示安装成功了,输入 cloud。 看到这个回复,证明 cloud code 搭建好了, 接下来我们要给他装上大脑,也就是配置模型。如果你没有官方的账号,那么我推荐你呢?使用 kimi 的 k 二点六。 k 二点六的代码生成能力和上下文的理解能力呢,相对比较稳定,还原生,支持多模态读图解析,设计稿调 ui 问题都不大。 从价格来看,输入和输出大约只是海外旗舰模型的八分之一,用来驱动 cloud code 的 写代码做分析,更具性价比。配置阶段,我们要用到一个工具 cc switch, 我 们从文档中直接跳转到下载地址,根据自己的电脑版本下载安装就可以了。然后打开应用 点加号选择 kimi, 这里需要输入 api k。 值得一提的是, api k 的 用量呢,相对灵活,和 kimi code 相比,它可以根据个人实际的使用情况来选择。我们打开 kimi api 的 官网,新建 api k, 输入名称, 选择默认项目,复制 api k, 再回到 cc switch 粘贴,点击添加,选择 kmi 启动。然后我们打开 code code, 看到这里显示 kmi 杠 k 二点六的模型,现在我们给他发一个消息,有回复代表呢就配置成功了。 接下来进入今天最好玩的部分,用 cloud code 配合 remotion 做动画视频。 remotion 呢,是一个用代码生成动画的框架,但有了 cloud code, 你 就完全不用去学代码懂代码,只要用嘴,然后说就可以做出动画视频。那么如何安装 remotion? 这里我直接把官方的安装文档和官方提供的 skill 网址扔给了 cloud code, 直接让他帮我安装,等他跑完,让他直接运行下,出现了这个画面,就证明安装成功了。接下来先打开一个终端,输入哎, cd 杠你的目录啊,这步呢,是确保后面制作的内容都保存到这个路径下, 然后输入 clock, 启动命令,运行 clock, 我 们就可以用自然语言来制作视频了。比如我给他这段提示词,让他创建一个八创电池组的动画效果,可以看到他自动帮你搭建了 remote 的 项目啊,安装了依赖,写好了动画代码,等他跑完,打开这个预览效果呢,看一下 整体的动画呢,非常的酷炫啊。再让他做一个行星运动的动画,输入这段提示词来看一下效果。 我一共做了有上百个 remo 神的动画,当我们有了足够多的动画时,就可以制作出更精美的视频。然后我也制作了一个一键剪辑口播视频的 scale, 我 们现在呢,试试这个 scale, 一 键剪口播视频, 斜杠调用这个 scale, 然后把视频文件和字幕文件都扔给 code code 不 用,你写一行代码,一杯咖啡的功夫就制作完了。来看一下效果 好,欢迎收看本期的科技新资讯。智能家居领域呢,有几组值得关注的新数据,今年第三季度,全球智能家居设备出货量突破了两亿台,同比增长百分之十八,其中呢,中国市场占比了超过呢百分之三十五,连续三年保持了全球的领先。 用户最青睐的呢是三大场景,分别是智能照明、家庭安防和节能,合计市场占比超过了六成。 搭载 ai 语音助手的设备呢,整个剪辑过程全部由 cloud code 加 k 二点六的模型搞定,制作了所有的动画效果,自动配上了字幕口播,与动画呢完全的对齐, 还有更厉害的调用这个 scale 呢,还可以一键切换视频的风格,我们换一个风格看下效果。哈喽,欢迎收看本期的科技新资讯。智能家居领域呢,有几组值得关注的新数据, 今年第三季度,全球智能家居设备出货量突破了两亿台,同比增长百分之十八,其中呢,中国市场占比了超过呢百分之三十五,连续三年保持了全球的领先。 用户最青睐的呢是三大场景,分别是智能照明、家庭安防和节能,合计市场占比超过了六成。搭载 ai 语音助手的设备呢,渗透率达到了百分之七十二, 用户平均每日语音交互超过了十次。说明呢,科技正在让家变得更智能, 从安装 cloud code 到接入 k 米 k 二点六的模型,再搭配 remotion, 一 句话生成动画视频,这一套流程下来呢,相信你已经感受到了 ai 工具链组合起来的真正威力, 不用写代码也能做出专业级的视频内容。好了,本期视频就到这里,教程文档也能做出专业级的视频内容。好了,大家点点关注哈,跟着阿亮学 ai!

我教大家一分钟用 codex 生成你想要的视频。不是说一句帮我做个视频小白,真正要学会的是把需求拆清楚。第一步,先写我要做什么,比如我想生成一条关于 审美是第一生产力的科普短片。第二步,说清楚它发在哪里,平台不同节奏、字幕画面密度都不一样。第三步,直接给风格标准,像 apple 发布会,高级有数据、有图文,有可视化,不要 ppt 感,不要廉价感, 这时候 codex 才不是在猜,而是在执行。接下来你看到的这条视频,包括刚才讲解,均由 codex 生成。 审美为什么会成为第一生产力?因为它不是装饰,而是把注意力、信任和选择压缩到同一瞬间。好的审美会降低理解成本,形成品牌记忆,提升转化,也沉淀组织标准。麦肯锡设计指数发现,设计成熟度最高的公司, 收入增长高出三十二个百分点,股东回报高出五十六个百分点。一 m i 统计中, 设计驱动型公司十年跑迎标普五百指数两百一十一百分。之所以审美带来的是更快的选择,更高的价格带核,更低的组织摩擦。 apple、 disney, music、 urba、 iso 战略 低是同一种感知高度。审美不是风格,是决策质量的可塑化。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

家人们,扣代词现在可以直接做视频剪辑了,我只在扣代词里敲了一行字,装上嗨客 friends, 敲键一句话就能生成想要的任何视频。动效、转场、字幕配音全自动,不满意继续打字改就行,秒出新版本,还可以批量生成。下面这个视频是我让扣代词生成人类编程史的视频,太酷了!又会扣代,你就真 正打开了 ai 内容创作的新世界大门!我强烈建议所有自媒体人、内容创作者都要学会扣代斯这套玩法,真的能把效率直接拉高十倍!关注我以后分享更多玩法!

hello, 大家好,我是艺兴,然后今天趁着周末的话就给大家分享一下我最近用啊 ai 的 编程工具,手搓的一个 diy 的 ai 小 工具。 那么咱们这一期主要是通过 codex 这个新型的 ai 编程工具,手把手去手搓自己的专属的微信的小程序,那右边的话是我自己设计的一个个人的 ip 形象是不是很帅。 然后这一期主要是用的两个工具特别简单,第一个的话就是 codex, 大家直接去官网下载就可以了。 然后第二个的话就是微性能开发者工具,因为其实我们这一期是做小程序的项目嘛,所以说是需要呃借助他去进行项目的预览以及配置上线,然后大家也是去他们的一些官方去进行下载就 ok 了。 那其实做小程序和做 app 呃做产品是一个道理,那流程也是非常简单。那首先第一步要先给 ai 描述清楚我们想要什么样的产品,整理好一定的需求文档,然后让 ai 帮我们去完善我们的需求 md。 然后第二步对应好整个 app 的 一个视觉风格,然后告诉 ai 你 想要什么样的效果,让它给给给我们去输出一个规范的一个需求的文档。 第三步用 codex 去直接生成一些结合的一些需求,自动生成一些小程序的一些全部的代码。然后第四步还要通过 ai 帮我们去调试修 bug, 调细节,那全程不需要自己动手,直接通过口喷的方式,最好的方式就能够让 ai 帮我们去干活。 那么好了,废话呃,废话不多说,咱们直接上手开干吧。那么首先的话就是要打开我们已经安装好的 code desk 的 一个桌面端, 然后的话就是要找到我们的微信的开发者工具去新建好我们本次的要到的项目, 然后本次的话主要是做一个体重管理小程序,二嘛,所以说我们要新建好我们的一个项目,然后选择 ok 就 可以了。然后的话这边的话其实是不需要使用云服务的,然后这边的一个 id 的 话,主要是可以让他去所使用 word 的 就可以了。 然后的话就会来到我们这个微信开发者的一个平台,然后整个界面其实会跟我们传统的编程软件会比较像。 然后右边的话是我们的一些 c 稿的预览区,然后左边是我们一些文件夹的一些区域,然后中间是代码,然后一般来说我个人是比较习惯用那个叉的一个尺寸去进行一个预呃设计稿的一个预览的, 然后的话就要回到我们的一个科室,那首先的话就要新建项目文件夹,然后这个文件夹必须要跟我们刚刚所创建的保持一致,这样的话我们的一个文件信息还有设计稿才能够在那边去进行同步预览。 然后的话会结合我们想要的东西给 ai 描述清楚我们这个产品是什么,给大家去描述一些数据文档,然后的话会结合我们的一些模型去进行选择一些合适的模型, 然后这次的话我是通过用他们的五点五的模型去进行一个生成的,然后整体的生成的一个效率的话,其实我觉得呃不是很快,所以说我觉得如果说 talk 比较有限的同学的话,其实要呃用那个标准就可以了, 然后的话他会结合我的需求帮我去输出一个非常完善的一个小程序的一个需求,稍微能打。 然后企业家的话主要是要生成一个我的一个设计的一个说明 md, 然后这次的话我是给 ai 垫了一张图, 然后让它结合我的一个设计的一个垫图的风格,让我让它帮我结合我的需求去生成一个符合它的风格的一些设计规范,设计的一个语言的一个设计的一个 md 的 文档。 然后这次的话我也是会呃用我们的一个刚刚所生成的一个需求的一个说明它的需求分明它跟课程不一样,它是放在我们一些刚刚创建文件夹的一个目录下的, 所以说呃,我会让它围绕着我的一个呃需求的文档去进行一个呃设计风格的一个生成, 然后的话就是发送给 ai, 让它帮我去写我的一个设计的一个文档,然后的话它就会结合我的一些啊电图的一个它的一个程序版,然后它的配色去帮我去进行 ai 的 生成。 然后接下来的话就是要漫长的等待啦。嗯,整体处理的效率来说,我觉得会呃越跑越快吧, 嗯,然后就开始慢慢地等待它去进行思考生成,然后它生成完之后就会也是会生成一个 md 的 文档,整个 md 文档非常的一个详细,包括字体大小,然后设置以及卡片布局,以及它的整体的一个配色,以及我们的一个文本语言、图标风格等等。 然后紧接着的话就是要开始让 code 帮我结合这两个文档去进行首出代码页面了,然后首先会让它新增两个文件夹,让它去帮我去接这两个文件,去生成一些我想要的一些页面的一个配色的一个界面的效果,让 ai 帮我去写代码, 然后的话它就会结合我的一些需求想要的要什么样的页面,然后我的一个配色风格让我去让它去帮我去写代码, 然后整个的一个页面当中其实雏形已经出来了,然后的话其实整个效率还是非常快的,然后整个视觉风格其实会跟我电图那个视觉语言会比较搭。 然后紧接着的话就是呃继续去围绕的我们想要的一些东西,去让 ai 通过对话的方式帮它去帮我们去修代码,然后修 bug, 然后去调一些 ui 的 一些细节,例如我的设置,然后我们的渐距以及我们的一些图标的风格等等。 然后的话指出就是不断地去进行雕花跟跟进,让我们的一个心中想要的一个产品就可以了。 你要最终的话大家看一下我的效果吧。你要最终的话会来回到我们的微信平台去看一下我们整个页面的一个效果。 那其实整个页面来说,我觉得这的纯就是没有通过呃, figma m c p 的 一个代码,呃的一个设计稿生成,纯用一个对话的一个代码生成,我觉得整个效果我觉得还是不错的。然后大家看一下最后的一个手机的一个预览的效果, 那整个风格是走这种暗色系的,然后的话整个配色我觉得还是非常吸睛的,这是我通过一个纯啊对话和代码的方式去实现的一个小程序, 然后整个的空间它也是会自动去用我们一个微信的一个官方的空间去进行一个实现,然后整个图标风格我觉得还是不错的,嗯。

你现在看到的这条视频就是 codex 加 hyperframes 做出来的,包括所有的动画字母以及里面的图片生成内容,包括这条视频也是 codex 自己发出来的。接下来我给大家拆解流程。首先我把这个视频的文文本案复制到 index t t s 去做配音生成,没错,这个视频的配音 也是 ai 的。 接下来在 codex 当中找到插件,下拉找到 hyperframes 白黑键,点击加号,再点击安装,然后就可以到对话窗口艾特这个插件,再把这段音频 一起放到聊天窗口,然后把要求给到它, codex 就 会根据 hyperframes 这个插件做出对应的动画。值得惊讶的是,当我看到这条视频的成片时, codex 居然自己去文件夹看了我的录屏素材,然后自己剪进了成片当中。所以你们会看到鼠标动画,但是我从来没有告诉过 codex, 我 提前录了屏。 这就是 codex agent 的 聪明之处,整个动画都是由 ai 自己调用技能做出来的,包括你看到这里可能会觉得这个动画有点看腻了,那这个时候应该有点真实的动画有点看腻了,比如一个玩美女的滑板,或者一个正在喝帅哥的咖啡, 是因为这个部分啊,调用了今天的 emerge 二生成图片,所以你看起来这个视频才不会那么枯燥。包括这期视频的封面也是 codex 做的, 视频发布也是他自己发出来的,既 computer use 功能发布之后,随之又上线了 chrome 的 功能,所以我就提前登录了视频后台,你才能看到这条完整由 aint 全流程制作,自动发布出来的视频。