人设定了,咱们就要考虑场景了,与人物设计类似哈,还是跟 context 先沟通,确认这篇文章需要多少个关键画面,每个画面放在哪里?每个画面服务正文的哪一个段落?我的提示词是这么写的, 请继续的读这么一篇邮寄和总控笔记和人物一致性备忘录。现在需要你帮我新建一份配图场景清单,不要写生图提示词。这一步呢,咱们只做场景设计,每个场景要包含编号,对应正文的位置, 图片的用途,是否有人物出镜,生成方式,必须出现的元素,禁止出现的元素,建议的文件名等等等等。请控制图片数量,不要每一段都给我配图公众号,它不是相册啊,图片是要服务于阅读节奏的。很快哈, callix 生成了一份配图场景清 单笔记。到这呢,除了刚才林志祥的邮寄之外啊,我们一共有了三份笔记了,分别用来让大模型知道文章讲什么,主角长什么样,每张图应该怎么服务于正文。 你看哈,我说不难吧,全程呢,没有一点需要,你在 obsidian 里面写东西的时候根本没有什么编程,都是自然语言,跟 cortex 讲就行了。对了哈,如果你不喜欢打字的话呢,试试 typeface, 谁用谁知道。
粉丝1012获赞3719

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

分享一个特别实用的小技巧,很多朋友现在喜欢在 gpt 的 官网生成图片,但是如果你想批量做图,做分镜,做短片素材,其实我更推荐的用 codex, 我 为大家演示一下。首先我在 codex 里边告诉他,我想做一个跨服追日的短片,让他帮我生成一个完整的故事,故事出来之后,我再让他继续拆成文字分镜, 这个时候我只需要判断一下这个节奏对不对,画面感够不够。确定分镜没有问题之后,我告诉他,按照这些分镜生成对应的图片,统一放到指定的文件夹里边, 他就会自动的一张一张的生成。结果生成完毕之后,我突然有点后悔了,于是我又让他重新生成竖版的分镜, 它就继续的开始生成。这就是智能体真正有意思的地方,它不只是一个聊天工具,还能围绕着你的目标,一步步的把事情推进下去。我相信未来的 codex, 它很有可能会成为一个超级应用, 它不只是写代码,也不只是生成图片,而是帮助我们普通人把想法变成流程,变成工具,变成作品。

我给 callix 发了一条命令啊,生成我这篇文章需要的全部图片。不到十分钟,这个文件夹里就已经装满了深深好的图片了。如果说你也需要给文章配图的话,那今天的内容就赶紧的要放进你的收藏夹了。 你写公众号发小红书吗?插图你是怎么做的呢?打开某个生图平台的网页,发送这样的一条提示词,等上几十秒,他吐出来四张照片。小姐姐,挺好看的哈,不过四张图根本他不是一个人本。 那你想的是早上画面呢?明显就是傍晚。今天呢,我们就从零开始,全程都用 callix, 你 用别的大模型也可以哈,配合 obsidian 这个笔记软件,让你的文章配图变成一个固定的工作流。以前两个小时的工作量,以后呢,就是一句话的事,准备好了没?那咱们就直接发车。 今天的工作流呢,主要用到两个工具, callix 和 obsidian。 不要划走啊,不需要懂编程,全程都是说人话,真的是 有手就行。总的逻辑呢是,在 obsidian 里面,你已经写好了一篇 markdown 格式的文章,这个格式呢,是目前公认的 与大模型沟通最好的。我们要做的呢,就是让 codex 来帮你读取文章的内容,分析配合文章需要哪些场景,再让它自己来生成提示词,自己生图,一条龙服务。等你用顺了这套工作流之后呢,麻麻再也不用担心你的出图了。实现这一套流程呢,拢共就是四步,阅读、理解、场景、设计其 词、出图。那咱们就从第一步开始配图。最烦的事呢,就是大模型出图啊,老是抽卡,你要的是早上,出来的是下午,你讲的是夏天,出来的是冬装。花了大力气去改提示词啊,这一轮 ok 了,那下一篇呢,又得重新搞这个呢,是因为你没有积累 图片呢,是要服务于内容的哈,所以说,第一步呢,要从文章开始。这篇文章是讲啥的呀?我们的林芝夏小姐姐五一去了成都见老朋友,这是他的一篇心情日记,自然呢,会有很多的自拍照,美食照,风景照。所以说呢,第一件事是要让大模型 读懂这篇文章。我的提示词是这么写的,注意看哈,提示词里的第一行呢,是把这篇邮寄按给 context, 先体会下文章的内容,人物的关系,时间线和情绪节奏,然后帮我来判断哈,这篇文章如果要配插图的话,需要哪些画面,每张图大概放在什么位置, 要解决什么问题?有没有人物一致性的要求?在同一个文件夹里面新建一份配图项目总控笔记,把你的判断整理进去,并作为我们接下来沟通的参考哈,他仔细的阅读理解了这篇文章,他发现呢,这篇文章是 篇生活化篇心情记录的邮寄。他给我的第一轮判断呢,就是说这篇文章要体现整个旅途的过程,比如说呢,出发前的行李箱,机场,成都接机,景点,餐厅,酒店等等这么一些画面。同时呢,他还提醒我哈, 这种游记里面的人物会多次的出现,所以说人物一致性的问题要考虑到。而且他认为啊,我说的建一份项目总控笔记是很有必要的,这份笔记呢,会作为整套配图工作的说明书,当然哈, 你自己甚至啊都不需要读,这本来也是给大模型看的。这个呢,就是我喜欢用 codex 配合 obsidian 的 原因了哈,它不是只在对话框里给你一段回答, 他会真的进入你的笔记库,把这些判断写成一份可以持续迭代的文件。当然呢,第一轮哈,往往不会特别的满意。那我会继续的追问他了, 你刚才的这些场景是不是有点像旅行相册了呀?公众号里面真的需要这么多的图吗?他会重新的收敛一遍,把那些指示好看但不服务于正文的画面给删掉。而且呢,还让他加上了一些画面中不要出现的东西, 比如说不要冬装,不要过度精修,不要把串串化成了高档火锅等等吧。这几轮来回之后啊,项目总共笔记才算是能用了。 这个过程呢,重点不是哪一句提示词最重要,重点呢,是要让你让大模型先读懂文章,再让他给你一个判断,然后呢,继续追问,收敛不约束,这个呢,才像是真的在干活。大模型读懂了你的文章,我们的总控笔记就写好了,现在就到了第二步了。场景设计 这里要包括两块了,一个是人物,一个是场景。人物当然很重要哈,你成都你就玩一天,逛街的时候你不可能换几套衣服几套发型吧,场景呢,也是一样的哈,必须得符合实际的情况。 五一是夏天吗?你就不能穿着羽绒服吧,吃的是串串,你画面就不能搞成了川菜?而我们先说人物,如果是一个正规的作品啊,人物会非常的讲究,需要在开始之前呢,就要确认全部的人设,包括年龄、发型、穿搭、脸部气质、拍摄风格、常见表情,不要出现的画面 等等等等。比如说,我就不希望主角变成网红锥子脸或者是广告模特的样子,他应该就像你身边的一个真实的人。照片呢,像是手机随手拍出来的。 我就这么跟 callix 讲了哈。读取这篇邮寄和项目总共这两份笔记。这个时候你先不要写具体的场景题词,新建一份人物一致性备忘录,用来约束后续所有的人物出镜图片。这份备忘录要包括 主角灵芝下的人物特征、穿搭、发型、拍摄风格、禁止出现的风格,以及配角阿乔的基础特征。请特别注意,这个不是人物小传,不要给我搞什么文学化的描述, 我要的是直接可以给深图模型使用的视觉信息。最后呢,请给出主角和配角的标准照,三式图,深沉建议,方便后面做图深图的参考。很快啊, codex 生成了这一篇备忘录。这份笔记啊,清楚的写到了主角大概二十八岁,黑色中长发, 米白色轻薄外套,浅蓝牛仔裤,真实手机摄影,自然光,生活化构图,不要澎湃,不要商业广告感。更重要的是啊,他会写清楚后面凡是林芝下本人出镜的图片,都要参考这张标准图。由于文章里还有一位配角阿乔哈, codex 还很贴心的把 阿乔的特征也写到了这一份备忘录里。注意哈,不要让大模型写什么美女啊,氛围感呐,高级感啊,这样的一些词,听起来高大上,但是对生图模型来说呀,非常容易跑偏, 他可能就会把人物往什么影楼大片的方向去带。显然呢,不符合邻家小姐姐的人设了。咱们要的是能执行的信息,能量化的信息才是稳定性的来源。 人设定了,咱们就要考虑场景了,与人物设计类似哈,还是跟 context 先沟通,确认这篇文章需要多少个关键画面,每个画面放在哪里?每个画面服务正文的哪一个段落 的提示词是这么写的,请继续的读这么一篇邮寄和总控笔记和人物一致性备忘录。现在需要你帮我新建一份配图场景清单,不要写生图提示词。这一步呢,咱们只做场景设计,每个场景要包含编号、对应正文的位置、 图片的用途,是否有人物出镜、生成方式,必须出现的元素,禁止出现的元素,建议的文件名等等等等。请控制图片数量,不要每一段都给我配图公众号,它不是相册啊。图片是要服务于阅读节奏的,很快啊。 copy 生成了一份配图场景清单 笔记清单会很细,像图的编号,正文的位置、画面用途、生成方式,必须出现什么建议文件名等等。 比如说机场图要体现出发和疲惫。茶馆图呢,要体现成都的小巷和下午的自然。光吃串串的时候呢,就要像玉林路边的小店,你不能搞成什么高级餐厅了,我们来简单的盘点一下哈。到这呢,除了刚才林志祥的邮寄之外啊, 我们一共有了三份笔记了,分别用来让大模型知道文章讲什么,主角长什么样,每张图应该怎么服务于正文?你看哈,我说不难吧,全程呢,没有一点需要,你在 obsidian 里面写东西的时候更没有什么编程,都是自然语言,跟 context 讲就行了。对了哈,如果你不喜欢打字的话呢, 试试 typeface, 谁用谁知道。 ok, 到这呢,咱们才可以开始准备正式的写题词了。 虽然还没有开始写提示词啊,但是我们出图的工作已经完成了一大部分了,上面的所有一切是写好提示词的。提示词 如果一开始就用大模型来写二十条提示词哈,他会写的很热闹,但是大概率啊,伸出来图片你都用不了,因为他并没有想清楚一样的办法。我在 callix 的 对括号里头按他的那几份刚才的笔记,我让他根据要求准备开始生成正式的提示词。我是这么说的, 请读取配图项目总控、人物一致性备忘录和场景清单。现在呢,你 需要新建一份提示词物料包。注意哈,这份笔记不是直接拿去批量出图的正式版,它是一个准备稿结构呢,分成三个部分。第一个部分是写全区,要求包括画面风格、照片质感、比例、色彩真实、手机摄影不要澎湃不, 不要商业广告感,不要过度磨皮,不要让人物换衣服。第二个部分呢,写人物的原型提示词主角长什么样,生成一个标准照和三式图。这一步呢,只做人,不做场景, 因为后面所有的人物出境图都要参考这些原型。第三部分呢,是每个具体场景的提示词,每个场景必须保留编号正文的提示词和输出文件名等等。如果是图生图的话呢, 而且场景变化和动作就不需要在每一条里面反复的长篇描述人物是谁了,人物信息呢,是会放在局要求里,通过标准照路径来引用。你看哈,这些提示词咱们讲的非常的详细啊,你不把任务拆清楚, 大模型就会把所有东西混在一起,越写上下文越乱。所以说呢,提示词物料包必须要包括两层,上层呢是大局要求管统一风格的,下层呢是具体的要求人物原型,管一致性,具体场景呢,管每一张图该干什么, 两层三个东西不要搅到了一起来。我们先看人物原型图哈,如果有问题呢,你就持续让他改 定下来之后啊,咱们就应该先生成主角和配角的人物原型图了,这些是一会正式的图生图的参考物料,很简单哈,你让 codex 按照人物原型的要求 生成两个人物的三式图,就这么一句话。这个呢,就是林芝夏和阿乔的原型图了,人物的发型、衣服、年龄感基本上比较稳定,这个角度来看呢, 认得出是同一个人。等到主角配角的原型图都定稿之后啊,咱们提示词的部分就可以进入最后一步了,我要让 codex 生成一份提示词正视版。这一份正视版呢,要非常的干净,不要保留前面那些讨论的过程, 只保留全剧要求和每一个场景的具体提示词。说白了哈,这份东西呢,才是最终给 image 二点零看的,他就会直接照着他出图了,他读到的是执行文件, 是一份聊天记录。恭喜哈,提示词咱们终于写完了,有没有发现大模型有时候是很笨的哈,他不是一句话就能拿到结果,没有关系啊,他又不会累,又不会生气,达不到要求的时候呢,咱们就跟他多拉扯几轮,总会得到你想要的结果。 到这哈,我们已经完成了百分之九十五以上的工作了。 codex 现在本来就可以直接驱动 emoji 二点零这个最近特别火的 open 的 香蕉刚出道的时候啊, 还要火爆。只要你的提示词写的足够的好,出图就不用操心了。这条视频呢,是我们专门对他做过的一个测评,有兴趣的小伙伴呢可以去看一看哈。 磨刀不误砍柴工,平时出图不满意啊,就是没有花什么心思磨刀。好了,我把提示词的正式版笔记艾特给了高黛斯,来帮我按照这条笔记中的提示词,用你的 emg 二点零大模型生成全部场景的图片。就是这么简单,你的大局要求里面有整体风格的要求, 有人物原型图的存放路径,不管是图身图还是纹身图,每一个画面都有非常详细的要求,这样的话,大模型就不会出错了。图片不少,可以伸个懒腰,咱休息一下哈。不一会呢,你在聊天记录里面和出图的文件夹里头就可以看到这些深沉的图片了,有没有成就感啊? 检查一下哈,大部分的图片都是可用的,偶尔呢可能出现几张不太满意的。没关系啊,咱笔记里不是有编号吗?还是很简单,你就这么说哈, a 零三, a 零九 b 幺五,咱不满意重 新生成。这个时候呢,不用你重新描述一遍那张插管图,还是那张机场图,直接讲编号就完事了。 gmail 会回到那份提示词笔记,按照原来的要求重新来跑对应的图片。这个就是为什么前面要把任务拆清楚,你前面拆的越清楚,后面的反攻呢,就会越轻松。 感谢你能看到这里啊,真的很简单哈,只要你的逻辑清晰一点,完全可以自己来搭这套系统。只要把文章准备好,他就可以帮你拆场景,写题词, 生成图片,按编号返工。公众号配图啊,小红书图文呢,产品体验文章啊,都用得上。或者是做 ppt 封面,课程配图,视频分镜等等啊,都可以。当你能够把你的全部的任务拆解清楚,用一种管件式的方式来跟大模型来写作。把你的判断放进笔记, 大模型就能沿着你的判断来干活。它不再是临时给你一个结果了,而是参与了一整条的生产线。当然哈,可以把这些流程整理成可以附用的 skill, 不知道你有没有兴趣哈。好了,希望今天内容呢,能够真正的帮到你。这期里面所有的提示词文档,我都会打包好,评论区自取。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

比起 opencloudex 可能才更适合普通人使用,能操作电脑做文档、表格、 ppt, 还能生成图片,执行自动化任务,逐渐从编程 agent 走向桌面 ai 助手。那今天这个视频我就给大家带来 codex 保姆级教程。先到 codex 的 下载页点击下载 macos, 下载好后打开安装包, 直接把文件拖进去就可以了。打开 codex, 它的界面很像网页版的 ai 聊天界面,主要可以分为三块,右边这里就是和 ai 对 话的地方。左上角的四个功能,第一个就是开启一个新的 ai 对 话搜索,可以通过标题来找到之前的对话内容, 剩下的插件和自动化功能我会在后面详细讲解。左下角这里是两种和 ai 写作的方式,一种是项目方式,一种是对话方式。 项目方式更适合去做一些长期积累的任务,比如沉淀知识库、做工作流、写代码。有两种方式使用项目,一个是创建新项目,默认会在文稿目录下创建一个项目文件夹,也可以使用你现有的文件夹作为项目, 所有后续的 a 阵子操作都会默认在项目文件夹下进行。第二种对话方式,就像我们平常使用网页版 ai, 可以 临时去做一些任务,比如偶尔查一查信息什么的, 那我们这里就可以新建一个项目,我们也可以在三个点这里给项目改名,在聊天框左下角就可以看到他已经进入了刚才新建的项目文件夹。下聊天框这里的加号, 我们就可以上传图片或者文件给 ai 这里我们还可以开启计划模式,这个模式是不让 ai 直接改动文件,而是先生成一份计划,我们看完没有问题以后才会执行。 权限,这里 codex 有 三种权限,第一种默认权限,就是只能访问项目文件夹下的文件,如果涉及到其他文件或者网络访问,就会弹出审核框让我们去批准。第二种是自动审查,就是 codex 会自动放行低风险操作,高风险操作才会需要人工审核。 最后一种就是给 codex 所有的电脑权限,很方便使用。右边这里我们可以选择模型的推理强度,复杂人物可以选择更高的推理强度。 模型这里我们可以切换多个叉 t b t 模型最后的速度就是可以加快模型的输出速度,不过会消耗更多的 token。 这里直接让 ai 写一个单 html 的 个人播客网站,但我们可能有新的想法,想要加进去就可以直接进行引导, 比如我这里补充整体色彩风格要用孟菲斯风格,还可以继续补充,要用一个板块式,个人作品展示用滑动式般的呈现。我们直接点击这里的引导, codex 就 会在下次执行工具调用后 插入我们新的要求,很适合补充提示词或者纠正方向,不用中断对话,让他帮我们再写一个手工艺的电商网站。使用 react, 那可以看到两个任务就并行执行了,属于转圈的状态, codex 当前步骤完成后就会显示为一个小蓝点。 看完基本使用,我们来看一看一些好用的特性。先来看一下插件功能,插件就是用来帮助 codex 操作各种工具的, 比如 computer use 和 browser use 就是 让 codex 操作你的电脑和它的内置浏览器,下面这两个就可以操作表格和 ppt, 那 往下翻我们还可以看到操作邮箱 canvas 设计软件的,我们点开一个就可以看到。这个插件其实由外部服务调用和技能组成, 那有的插件本身也是一个技能,后面也会给大家演示怎么使用插件。技能这里大家应该就不陌生了,技能就是工作流程的一个分装,如果有不懂的朋友可以看一下我之前讲 agent skill 的 视频, 如果你是以现有文件夹的方式创建项目的,也会把里面的技能同步过来。接下来我们就来看一下 computer use 这个插件, 它是利用 macos 的 屏幕录制和无障碍辅助数,让 codex 既能看到画面,又能精准点击。 这里我让他打开扫雷通关简单模式,这个半透明小光标就是 codex 操作所使用的,不会占用你的鼠标。一开始他尝试标记地雷的时候,发现标记失败了,很有意思的是,他换了一种玩法, 直接打开安全格,然后就是一路门店,推理出所有可能的安全位,直接通关。我就在想,如果以后模型的推理速度和输出速度再快一点,那我们干游戏就只需要用 ai 就 可以了。 下面我们看一下办公三件套和作图插件,这里我让他调研一下英伟达显卡的发布和价格信息,并让他制作成 word 文档, 然后配图。这里他很快先把配图制作出来了,整个过程一共用了十六分钟,第一次用的时候他会自动安装相关运行环境,制作完成后,他还会截图进行复查,发现可以打磨的地方还会进行二次修改。我们打开文档来看一下 发布信息和价格表都出来了,而且还贴心的配了图,最后还有产品线解读和购买建议。然后我让他在这个基础上把价格表整理成 excel, 同样的他在处理过程也会不断修正错误,花了五分钟时间做好。 来看一下表格,所有信息都正确写进来了,唯一有个瑕疵是溢价,这一栏应该是百分比,它这里用的是小数,不过这些都可以通过细化提示词去解决。下面继续让它根据文档做 ppt 分 格,参考苹果信息层级不超过三层。 他做完第一版以后,又对我的信息层级这个要求进行复查。我们来看一下 ppt 整体布局还是很舒服的,满足了我对信息层级的要求,没有堆满字,而且风格也是沿用了英伟达的配色。最后我们来说一下自动化功能, 它就相当于一个定时任务。右上角这里我们可以新建任务模板里有一些关于代码的任务模板。下面这里你可以选择在哪个项目文件夹下进行, 并且设定定时时间,有每小时、每天、每个工作日或者每周。也可以自定义规则,我们可以直接粘贴这个规则,让 ai 帮我们改成任意时间,比如这里就让它改成每周二和每周四的十三点执行。那 那我们在这里也可以让它执行已有的工作流程,比如这里,我之前是用 cloud code 做的,在 cloud 点 md 里已经写好了完整的自动拉取推文的流程,那直接让 codex 执行就可以了,很顺利地帮我完成了定时任务。那以上就是全部教程了,如果对你有帮助的话,记得一键三连。

听说一米七二相图能力很强,今天我就给他一个网页截图,让他完善一下,看看效果怎么样。先截个图,然后丢给他,输入提示词,让他给我改 图片生成中,图片完成了,我们看看效果怎么样。他把右侧完善了,感觉他还是有点保守了,不过我很满意了,已经够用了。 现在有新的页面图,我们让 codex 给我改一下代码,输入一下提示词,复制图片地址,然后等着它自己执行。 ok, 程序已经在跑了。 好了,已经改完了,我们简单看一下,看它改了哪些地方。 刷新一下页面,看看最终的效果,基本没什么问题,完全是按照原型图来修改的。 最后我只能说一句, n b。 今天的视频就到这里了,感谢大家的观看。

这是我用 emoji 二点零和 codex 生成的十五页可支持编辑的 ppt。 这张 ppt 里面所有的标题、文字、图标,甚至是左上角的复旦大学 logo 都是 codex 帮忙生成的,里面的每一个内容都是可以支持编辑的。更关键的是, ppt 里面的文字和数据表格,都是 codex 直接从我 word 版的数字论文当中直接提取的。如果我告诉你,这样一套流程不仅支持去生成蓝色答辩风格的 ppt, 还支持去生成麦肯锡咨询风格、校园竞赛风格以及科技发布会风格的 ppt。 你 会不会想知道这到底是怎么完成的?那这个视频会教你如何用 gpt image 二点零加 gpx 去生成这样一个可支持编辑的 ppt 内容。以前我们做 ppt 其实第一步就是去找模板,但是很多模板其实根本不是配我们所做的内容, 所以我这套流程呢,第一步是去创造模板。第一步我让 gpt image 二点零去帮我生成五张适合于竖式论文答辩的 ppt 的 图片。 那在这个阶段,我们可以自由地定义这个图片当中 ppt 的 类型。我们可以跟他说,这是一个关于复旦大学硕士论文答辩的 ppt, 并且需要蓝色风格里面的 ppt 左上角需要有复旦大学的 logo, 不 时页面需要有标题区,并且有相关的学术素材。你也可以跟他说,我需要麦肯锡咨询风格以及相关的校园竞赛风格,它都可以帮你生成对应的图片。那其实这一步最重要的不是让他一次性帮你生成和支持编辑的 ppt, 而是帮你去定义一些 ppt 的 视觉风格,你可以从这些视觉风格当中去选择几个你比较喜欢的风格,那我们可以看到 emoji 二点零在这方面做的非常出色,他直接给我生成了五张我觉得相对来说视觉还比较突出的这种蓝色风格的 ppt。 第二步,我把刚刚 emoji 二点零生成的五张图片复制到了 codex 里面, 然后我在提示词里面清楚地告诉他,不要直接生成带图片的 ppt 的 内容。也就是说 codex 需要基于我上传的图片,把图 片背后的每一个底层元素都拆解成 png 图片,然后把这些 png 按照图层的形式进一步合成一个支持编辑的 ppt。 那 经过这样一步之后,我们所得到的就不是一张单纯的死图,而是一系列可以拖拉拽的 ppt 的 图层。那可以看到,把这个提示词发出去之后没多久, codex 就 直接帮我们生成了一份 ppt 的 模板。 我点开这个模板查看了一下,发现整体的视觉效果跟刚刚上传的图片的比例以及视觉几乎是一样的,并且是可以支持拖拉拽以及自动编辑的。这样我们就得到了一份由 codex 生成的符合我们视觉意向的这样一个 ppt 的 模板。 下面进行第三步,我把自己的 word 版说书论文发给 codex, 让它基于前面生成的 ppt 模板以及我说书论文的内容,自动帮我把说书论文当中比较核心的内容填充到这个 ppt 模板里面,进去生成一份十五页可知是答辩的,说是论文 ppt, 那 这里之所以用说书论文来演示,主要是因为说书论文对于内容的相似度以及数据的要求比较高, 它可以更加有效的验证 codex 是 否能够真正的帮我们完成一个比较复杂的任务。那大概过了二十分钟, codex 就 把完整版的 ppt 内容给生成了,那我点开仔细检查了一下,发现整体的视觉风格基本上是和前面的内容保持一致的,但是相比较于一个比较完整的硕士论文答辩内容,它整体的文本以及数据稍显单薄,于是我让它做了进一步的优化, 当他把 ppt 当中补充更多的文字内容,以及更多关于数据的表格,体现整个数字论文的严谨性。大概又过了七八分钟, codex 把最终版本的 ppt 给到了我。我看了一下,里面无论是内容的详细性,还是说数据表格的真实性,都基本达到了可答辩的要求。所以到这里,一份可以当做组会汇报甚至是答辩的数字论文 ppt 基本已经完成了。 我们平常做这样一份 ppt 的 内容可能需要花一整天的时间,而且深沉的内容和风格可能也不一定好看,用这样一套工作流可以大大提升我们整体的工作和学习的效率。那以上就是这期视频想要分享的内容。

哈喽朋友们,我是阿水,今天给大家介绍一下,我用 codex 微博抠定了一个可以代替我干活的小插件,从设计稿的生成再到切图交付, u i 设计师必看的这一期,如何一分钟看完别人一整天的活,那这个插件呢?纹身图和图身图 目前都是支持的,首先是在这里可以选择纹身图,那这里呢,我们输入简单的提示层描述就可以,然后要做移动端的话,直接选择九比十六,那或者需要根据自己的需求我们自定义尺寸也是 ok 的, 那图片数量呢?这个就没有啥要求了,好了之后呢,我们就直接点击生成设计稿按钮, 这个速度大概是在一分钟左右就可以完成,好了之后呢,我们就可以选择要切图的图片,点击切图按钮,然后用鼠标直接框选就可以。鼠标拖动的方法切图可以说是非常的方便,我们只需要在页面上点击鼠标 画一个句型就可以选中切图,无论是大一点的 icon 还是按钮,以及我们在底部的这种 tab, 还有页面上的这种小箭头主标题也可以用这个方法来切出来。当然如果我们想要把 icon 的 背景给它变成透明的,我们只需要点击透明的按钮 就可以了,正好的一点就是针对单个的按钮可以自己自定义设置。那切图好了之后呢,我们就可以导进 figma 里面,可以看到刚才切好的图片,它已经单独帮我们进行了图片分层,而且有一个特别好的点是 我们把单独的 icon 切出来之后,它原图的背景上面的 icon 就 会没有,就会消失,并且呢,它填充的颜色也和我们的背景特别的相似,几乎看不出来有颜色填充的痕迹。那其实到这一步呢,完全可以是一个可交付的一个状态了, 因为我们的图已经切好了,只需要交付给开发就 ok 了。那除了纹身图,其实图生图的方法也是一样的,必要是我们手动设计的环节,全程都是由 ai 去工作,而且呢,大家可以看到切完图之后,它的原始背景上面,你当前切图的这个 icon, 其实它已经从背景上面消失了,并且呢,它用了一个色块填充,而且呢,它填充的这个色块也是很好的,而且呢,对于透明的这一点,它做的也非常的好,就是呢,它把你的 icon 主体给你留下了,但是背景呢,它真的是透明了,这个真的是特别的方便。我做这个插件呢,其实 初心是因为我没有飞格玛的教育版,也没有飞格玛的会员,那所以呢,我没有办法去使用 m c p。 然后呢,这个插件就诞生了,这个也是一种 没有会员,没有教育版的一种解决方案。那如果大家对这个插件有什么要求或者建议更好的功能点,那大家可以在评论区和我讨论,而且想拥有这个插件的也可以直接在评论区找我来拿,我是阿水,大家记得点赞关注评论哟,我们下期再见,拜拜。

现在正是毕业季,很多同学都在拍毕业照,如果你只有一张自拍或者照片已经拍了,但不够像毕业写真,可以让 codex 调用 gpt image 来处理 识别人像,匹配校园背景,自动生成或修出一整套毕业照。我还会把这套流程封装成一个 skill, 以后换人换背景都能复用,相信看完这个视频你也一定能够复现。话不多说,让我们开始吧。 首先还是老样子,这里准备了一个文件夹,还有一个文件夹,校园经典,打开点,其实里边就是一些背景。 然后接下来我们打开 codex, 然后选择项目,然后添加使用现有文件夹,选中刚刚的 ai 毕业照项目,然后打开,这样的话整个上下文就跟当前文件夹有关了。那接下来我们只输入一段提示词,大体的意思就是让 ai 根据那个背景还有那个人像进行一个融合,生成毕业照。然后这里强调的是调用 ai 矩阵技能,我再把它艾特一下, 然后我们看一下效果。好,他现在已经列出了当前文件夹下的图片,然后正在进行思考,这里他给出的他目标要生成九张,从 graduation 一 到九,我们再等待他一会。好的,现在我们的第一张照片已经生成了,看一下效果,打开这个图片,可以看到人物的五官都保持的特别好,然后发丝还有这个后边的光影都特别的协调, 看原图基本上人脸没有太大的变化。第二张照片也生成了,不过这张看上去有点太过于有秩序感,就是有点像 ai 生手的感觉,不过我们可以给他提要求,让他在后续的变更中做出修改。那比如说我可以说在后边的照片中让人物手捧鲜花,然后动作可以自然一点,然后把它再发送给他的绘画。 这里有一个很重要的功能,就是引导,这样的引导会立马把这个提示词或者指令发送给 codex, 他 在下一轮的这个指令执行的过程中,会立马的察觉到你给他的一个纠正,然后他会 做出相应的变化。现在第四张已经生成了,我们看一下他有没有遵循我们给他的调整指令。很明显我们戴了学生帽,然后手捧着鲜花,然后没有什么问题,这样的话他成功的遵循了我们在这里的引导,然后让他发生了及时的纠正。 现在所有图片都已经生成完毕了,那接下来我们就看一下升图的效果吧,这个是产物文件夹,在这里面呢,我看上去人物还有背景都融合的比较好,然后装造什么都没有什么问题,看上去还是比较令人满意的,没有什么问题。那 接下来呢?我想把这套流程固化成一个 skill, 再有类似的需求,比如说你的朋友想让你帮他生成毕业证,那你就可以把这套流程让他形成一个 skill。 skill 是 怎么形成的?很简单,你只需要给他说一下就可以,我这里直接给他说,因为这套流程走下来之后, 他知道上面是怎么处理的,所以说就是说把上面这套流程提取为一个名为 ai 毕业照生成的 skill, 然后给他说一下差不多的要求就行,然后给大家演示一下这个 skill 具体怎么用哈,我刚刚不是有一个 ai 毕业照吗?然后我们可以再创建一个 ai 毕业照二,然后背景你也可以换一下,也可以不换。然后这是一个新的文件夹, 然后我就可以在 codex 里面添加项目,然后把新的这个这个文件夹给加进去,选择这个二,然后打开,那在这个二里边呢添加一个绘画,在这个新绘画里边,我们只需要艾特这个 ai 生成毕业照,生成这个 skill, 然后给他说开始按流程处理就行了,那 他现在就可以按照那个流程开始走了,走到一定的阶段他还会问一些问题,这些都是符合那个 skill 里面的设定的,然后让他继续。那接下来流程就和之前是完全一样的,他就会按照这个照片作为人像,然后完全走一遍之前的流程,那这个过程也是完全自动的,我们不需要来看管,这就是一个自动化流程。 那大概介绍到这里就差不多结束了,你也可以自己尝试一下,自己搭建一套这样的 skill。 那 另外考虑到有的同学想生成这样的毕业照,但是没法用到 codex 或者 gpd image 这样的模型, 我也是把这个这套流程已经做了一个 ui 界面,然后大家可以在这里上传你的照片,然后可以在这里挑选一个场景,这里预设了很多场景,基本上是巨大的,很多场景也可以自定义场景,还可以选择十六套装造,还有细分的款式,比如说功课的选,功课的这种, 然后照片的风格都可以选,然后选用这个 gpd image 高清画质,然后来开始生成这些都是一些效果。 ok, 我 们下期再见。

今天我们学用扣带斯制作 ai 爆款带货视频,一张产品白底图,用 qq 直接生成脚本达人类型,分镜头和视频提示词,做跨境都知道产品图好找,视频难做,尤其是开头的钩子怎么抓人,达人怎么设定,镜头怎么拍?英文口播文案怎么写?废话不多说,先看案例。 今天我拿一张粉底液的产品图,用抠蛋斯加 skill 加 c 蛋斯二点零这套组合拳,从零到一,做一条完整的美区 ugc 带货视频,废话不多说,上实操一共分为三个步骤。第一步,制作 skill。 我 们打开抠蛋斯,复制这段制作 skill 的 提示词, 它会根据我们的需求生成对应的 sku 压缩包,并保存到本地。这一步只需要做一次,后期再做其他产品,直接调用这个 sku, 不 用每次重新造轮子。第二步,生成 ugc 包,新建对话,再抠弹死聊天框,输入斜杠, 找到 c, 弹死 ugc 杠 c n 这个 sku, 再把产品图丢进去这里千万不要跟 ai 说帮我做一个爆款视频, 太虚了, ai 听完都想报警。我们就 sku 加产品图直接发送,然后抠蛋死会先跳出制作前的六件事。这一步不是废话,是保险,它会先确认投放地区、发布平台、成片语言、视频形式、达人类型、 视频时长与产品卖点。我们按需求填写美国 tiktok 美式英语真人口播,没有固定达人十五秒产品卖点可以让他先根据白底图去判断,再人工微调确认方向。之后扣单词会生成完整的 ugc 包,里面包括制作参数、产品与受众人物设定、图片提示词、 视频提示词, poke 钩子口播脚本和镜头清单。注意,它不是只给一段文案,它是把策划、编剧、导演、提示词工程师全部塞进一个窗口。第三步,视频生成。先纹身图,在 u g c 包里找到人物图片生成提示词, 附知道引迷局。二、点击图片生成。这一步生成的是 ai 人物手持产品。这里有个重点,人物一定要向真实的 tiktok 达人,不要精修,不要广告,不要一眼 ai 位,最好是在卧室梳妆台自然光前置手机这种感觉, 然后涂层视频,返回扣带斯,在 ug 包里找到英文视频提示词,这里我会再丢回扣带斯,让他帮我修饰一遍。重点是需要把人物和产品都标记好,并艾特出来,保持人物和产品的一致性。其实是我英文不好,怕找不到人物和产品的 位置,但不管怎样,这一步很有用,这样导入 c 单词时,就不会一句一句找谁是人物谁是产品。修饰完之后,把提示词复制到 c 单词,再加上产品图 和人物图,最后看成品。 i'm picky about base makeup because i hate when foundation feels heavy。 从产品白底图到人物出镜,英文口播镜头清单、视频提示词,再到 ai 带货视频,整套流程就好了。以前做一条跨境带货视频,要想交本,找达人拍素材,剪节奏,现在用扣袋子,至少先把百分之八十的方案跑出来, 小白也能从完全不会变成视频大神。需要这个 skill 的 评论区猪脚饭整理好了直接抄作业。最后点个关注点个赞,祝大家爆单!

我给 callix 发了一条命令啊,生成我这篇文章需要的全部图片。不到十分钟,这个文件夹里就已经装满了深深好的图片了。如果说你也需要给文章配图的话,那今天的内容就赶紧的要放进你的收藏夹了。你写 公众号发小红书吗?插图你是怎么做的呢?打开某个声图平台的网页,发送这样的一条提示词,等上几十秒,他吐出来四张照片。小姐姐,挺好看的哈,不过四张图根本他不是一个人。 本来你想的是早上,画面呢,明显就是傍晚。今天呢,我们就从零开始,全程都用 context 配合 obsidian 这个笔记软件,让你的文章配图变成一个固定的工作流。以前两个小时的工作量,以后呢,就是一句话的事。

hi, 朋友们,接下来我将分享一下如何使用 codex 来设计一个比较美观的网页。 我们可以使用一些 scale, 比如说是 get get 第三点 m d 这个网站上,这里面有很多的网站效果图来让 codex 来参考模仿。如果直接使用这个 网站去模仿的话,我们只能生成一些相似的风格,但是我们无法生成一些,比如说一些网站中的图片素材,这个时候我们就可以让 叉列 dpt 来生成一些设计稿,网站的设计稿,然后根据这些设计稿来生成图片中需要的素材,这样给我们的网站来提供更丰富的元素。 我是这么做的,首先我会在酷略斯里面首先跟他头脑风暴,然后想要得到一个想要的网站结构,包括这个就是一个阿斯玛,这个已经 整体上实现了一个结构,然后我直接把这个阿斯玛发给俏丽 g p t, 让俏丽 g p t 来生成一个这么一个的设计效果, 然后生成这个效果之后,我觉得是比较满意认可之后我再跟他发一句提示词,比如说请根据这些图片中的中的素材,让他全部 可以下载我的素材图片,然后他就会把所有的素材图片都给我,都给我切切出来,然后让他给我一个 zippo 包的地址可以下载,然后我就可以直接把它下载下来,下载完成之后我直接把它丢给我的 codex, 然后让他给我生成一个 html, 这个就是比如说他想想要生成的效果, 我们看整体符合还是比较蛮预期的。到后面生成完成之后,我再把一些细化的组建,让他在一个细化拆分,最终形成这个网站。

场景设计这里要包括两块了,一个是人物,一个是场景,必须得符合实际的情况。而我们先说人物,如果是一个正规的作品啊,人物会非常的讲究,需要在开始之前呢,就要确认全部的人设,比如说我就不希望主角变成网红锥子脸或者是广告模特的样子, 我就这么跟 callix 讲了哈。读取这篇邮寄和项目总共这两份笔记,这个时候你先不要写具体的场景贴词,新建一份人物一致性备忘录,用来约束后续所有的人物出镜图片。这份备忘录要包括主角灵芝下的人物特征、穿搭发型、拍摄风格、 禁止出现的风格,以及配角阿乔的基础特征。请特别注意,这个不是人物小传,不要给我搞什么文学化的描述, 我要的是直接可以给深图模型使用的视觉信息。最后呢,请给出主角和配角的标准照,三式图深沉建议方便后面做图深图的参考。很快啊, 格式生成了这一篇备忘录。注意哈,不要让大模型写什么美女啊,氛围感呐,高级感啊这样的一些词,听起来高大上,但是对深图模型来说呀,非常容易跑偏。

有了叉 gpt 和 codex 之后,你一定要试的五个功能,做 ppt、 做漫画、做动画、做游戏,还有养电子宠物这五个功能,今天我给大家一一的去演示一下,那视频可能略长,欢迎大家先点赞收藏,慢慢观看。 第一个做 ppt, 例如你看到了一个好看的图片,比如这张你可以把它发给那个 gpt, 就 在对话框里面,你让他根据配色和设计感,让他帮你出整个模板的设计方案,还有视觉的一些定位等等等等。你看这里,他把这个风格定义为流光花雾,我觉得就非常的准确, 他会把整套的色彩设计用这语言给他做完整的一个设计。哪些页,比如说有些是图标,有一些卡片,有些是引言,有些是结束,他会有一个模板的规划出来。 你看你看这里,我就忍不住说,你可以直接做 ppt 模板文件吗?他可以的,对,他直接可以在里面做可以 编辑的 ppt 文件,这个文件可以下载到本地,然后变成 ppt x 的 格式,你可以自由的去编辑,但是我觉得这个不够还原,于是我让他直接先根据严格参照我这个美学东西,再严格设计。 你看他这里非常的严谨,他先把各种的框架给列出来了,再去列色彩等等的,把草图用这种文字给他画出来,真的非常严谨。让我确认之后,我再让他开始设计, 在这里主要用到 p ppt 现在非常强的两个能力,第一个是图像生成,那这个我猜大家在各种地方也刷到了,它图像生成能力其实极强。那第二个它是能够批量去生图的,你看它一次能生成好几张图,我经过测试,它好像一次最多是能生成十张。 你可以一张一张的让他把这二十页模板的素材都做出来,或者直接在一张图里面把所有的版式都做出来。比如说像这里把一张图里面把所有的版式都做出来,你确认之后,你让他再开始设计,那中间可能需要微调,但我觉得这个最后的还原效果还是挺不错的。 你看它最后还原,你看它效果什么的都挺不错。你下载到本地就可以进行编辑了,做成可以编辑的 ppt 文件,在这里直接可以下载。那我记得这是海外预藏家里面唯一一个能在对话框里面直接生成这种 美学感极强,又能直接编辑 ppt 文件的,这 gpt 现在还是比较的良心。第二个是做漫画,这里你看你可以找到一段小说的剧情,或者任何你自己写的,都可以 把它发给 gbt, 让他去帮你设计整个漫画的方案。你看他会从每一页怎么设计啊,文案什么,画面是什么啊,分清重点是什么的,让他就可以进行一个设计。 那这里我先跳过中间的部分,他同样是可以给你批量生成,你确定一些风格之后,你让他批量生成。在这里我做了一些例如这种国风的美男型的,这个是一个小说人物,把它做成了,我感觉效果还是很不错的, 前几页可能偏洒脱,对,后几页开始逐渐觉醒,他会有一个情绪的递进,那这个其实他在画面还原上也会体现出来,到最后几页就会变得很帅很燃,你看他放一些大招什么的,你还可以让他继续设计, 他一次是能最多生成十页,就跟图像一样,他一次能生成十页漫画。但比如说你要让他更严谨点,逐页生成更严谨也可以更好。 那这个是比如说国风的,还有其他风格,大家可以去试一下,比如说这种可能 p 的 比较乱的,这种黑白,这种彩漫风格、泼墨风格的都可以生成, 效果真的都非常好,非常的帅。第三个是做动画,那其实刚刚开头这个动画其实就是 g p t 给我做的,你看这是我在它的浏览器里面,那这里主要用到两个 skill, 一个是 hyperframes, 那 这样的 skill 可能大家在其他地方都刷到过, 那现在 gbt 是 直接在它官方的 codex 所说的 codex, 它的官方的插件市场里面可以去安装,到我这里给大家演示一下。 大家在这个 codex 的 插件市场里面,在底下这一栏下面就能找到 remotion 跟那个 hyperframes 两个插件,你直接在这里一键就可以进行一个安装。 这两个 skill agent 其实是在很多的 coding agent, 比如说 oracle 或者 jimmy, 什么 anti gravity 或者是 c r 页面都可以用。 但我自己体验下来,我觉得现在 codex 的 可能由于 g b t 它的智能水平非常的高,我自己形容下来非常的省事,而且做出来效果非常好,反正是比 jimmy, nike 要好。如果说大家现在用不了拷 codex, 由于各种各样的原因,可以尝试用 codex 去做一个平替,试一下 他能做什么样的动画,他真的我觉得他什么都能做,我们现在看 remotion, 这就是 remotion, 比如开头这个动画,这个凯片弹出的动画就是他给我做的,还能让他做什么?比如说这个演示是 full 架构,这个可能是一个 ai 的 一个底层的一个架构,普通人我自己反正是不懂,让他去给我设计一些这种很好玩的动画去呈现, 他能图文动画方案什么的自己去全包了设计,你看他就一段能解释清楚,包括你让他做一些,比如说太阳系运行的一些动画,他也能简单做出来,包括一些这种产品演示的,或者是 logo 图形的动画,也可以试一下。对,第二个就是这个 hyperframes, 他 同样也是,我就给了他一句话,你说你帮你,我就跟他说你帮我演示一下人类进化的简史, 你看他做了一个很高级这种,你看从一开始的这种啊,土风火种,到后面我们开始进入农耕文明,到后面我们开始有社会,开始有组织,开始有体制,还有帝国,有宗教什么的。你看他简简单单就写了一个这种 东西,你看你直接拿去录屏讲解,或者是直接做成视频发布,都非常的成立。第四个是做游戏,但首先 codex 里面有内置一个很强的一个插件,它叫根 studio, 我 的理解就这里面其实打包了非常多的那种 很专业的那种游戏设计的经验思路,还有各种游戏的原型等等。首先你一句话就能设计像贪食蛇这样的简单的这种网页游戏,你看这是一个贪食蛇,他死掉了,你看杰杰在这里就可以玩,他是一个完整的一个贪食的游戏,还是一个霓虹风的,这个你可以自己去定义风格。 对,如果说你不满足于这种即食的一个比较简单的游戏,你还可以通过例如说先设计游戏资产 在做比较复杂的游戏,比如这里我让他先又让 gbt 在 兑换往里先给我设计游戏资产,比如说这里有敌人狙决,动作环境等等, 那主要是为了省一些这个 codex 的 额度,你再回到 codex 里面,让他给你设计根据本地的资产什么的游戏。在这里我做了一个横版过关的这个类恶魔城的游戏,给大家演示一下,功能也非常完整,可以上下左右跳,还可以攻击,有小怪, 对,有远程的小怪,有近战的小怪,还有狙盾的小怪,就会射击有点难,我自己都有点打不过。对, 好,这个是做游戏,你看他同时刷新就可以,他有复活的二人跳什么的,对,算是一个完整的一个游戏。最后一个我们回到做电子宠物,那这个其实我相信,如果大家玩 coco 的 可能有发现,那 coco 可能当时没有去认真的做,现在我碰一下他做了 这个宠物有两种玩的方式,第一个你可以用官方自己的宠物,你看这里,你看在大家进到这个设置, 在外观往下滑就能找到它给你内置的一些就能找到那内置那个选择。对,它内置挺多,你你可以再随便选一个开始点,比如说我们刚选过这一点唤醒宠物,它就有这样,这个宠物它是两个功能,一个是说它能显示 codex 的 状态, 你看他自己在跳,他可以显示口袋的状态,如果说完成一个任务或怎么样,他就会跳出来提示你说口袋已经完成任务, 如果说你不满足于这种口袋是给内置的宠物,你可以自己去设计,你可以让他,比如说我就让他给我设计一个兔子形状的这么一个宠物,让他冒出来他会有,你看他也可以自己进行一个拖动,他有这种情况,你可以喂食,可以摸他,可以让他睡觉,让他叫醒等等等等。还有几种状态 你都可以去设计,同样也是说先设计这个动物自己的游戏的,不对,不是游戏就动物自己的动画资产,你看这里有再把它变成动画的功能等等,这就是今天想给大家介绍的五个功能,有一些可能需要去开动 plus 才能体验, 然后总之大家就去玩一下,非常好玩,尤其说我的扣带,可能现在真的很好用,刚跟进什么的,谢谢大家,我是 coco 二。

针对乙方视频工作者,更加实用的 ai 一 键从故事大纲生成单帧图和视频的工作方式,完全解放了繁琐的逐个单帧图生成图的步骤,其过程完全自动化。首先,你的电脑上需要准备一个前端可操作的画布或者是 comui 这样的开源画布。用 comui 的 优势是 comui 的 工作流本质是一个单独可以编辑的 json 文件,直接从原文件进行编辑,可以给 codex 节省大量的 token, 出错的概率也更低。其次,你需要一个闭源的 ai 画图模型以及视频模型。 经过我的实测,开源模型除了在特定场景可以参与写作,并不能承担起商业广告以及宣传片的需求。你可以只在高清放大或者是宽音模型二五幺二转换视角的时候才使用到开源模型。 将闭源模型在康发域外中调用也很简单,你只需要将服务商的 api 文档为给 codex, 它就可以直接编辑对应的可以在康非域外中调用的节点,并且一键帮你放到康非域外的目录下。具体的提示词我会放在评论区。 将一切准备好后,最核心的部分就是将我纯手打的这段提示词喂给 ai。 其工作流程就是先根据故事大纲或者甲方提供的脚本,丰富成拥有详细画面信息的给 ai 阅读的视频脚本,包括画面详细信息、文声图提示词完善、图声、视频提示词完善。 ai 拿到这个脚本后,就会在 comui 中创建相应的工作流,因为 comui 的 单个节点不能互相组合成循环体,属于有向无环图。如果要在 comui 中实现循环, 只能通过将代码写入单个节点作为黑箱模式进行运行,这肯定不是我们想要的,所以我们让 codex 来直接创建需要的生图节点数量,并且根据是否需要参考图进行图生图安排。 这里我们可以看到 codex 非常智能的分辨出了这个脚本中需要持续出现的物品和场景,提前生成了这些需要贯穿剧情的场景和物品图,以此来保障后期视频中的画面一致性。当生图的步骤执行完成后,这个工作流会让 codex 将生成的需要用到的单帧图自动的贴回 excel 表格中 机按照镜头号打包成一个原图无压缩的文件夹图包形式。可以看到这个恐怖短片的案例场景一致性还是非常不错的,基本没有什么 bug, ai 自动分镜也顺畅合理。我目前因为没有升视频 api, 所以 还只做到了单帧图步骤,观众们可以根据自己的需求将其再细化成首尾帧, 或者是完成后面的生视频步骤。但是根据传媒行业的实际案例,做到这里就够了,因为实际项目中肯定还是要把单真图给甲方审阅和修改的。这个项目中需要用的的提示词晚些时候我会捕捉到 get up。 如果认为这个视频对你产生了帮助,可以给我的视频点个赞,谢谢各位的观看,再见!

哈喽,大家好,今天我来给大家分享怎么用 codex 来给你的 app 做一整套 ui 设计。很多人在 web coding 的 过程中,往往只关注功能,却忽视了产品的设计,结果就是得到了一眼 ai 味的产品。 今天我就来分享一下怎么使用 codex 完成 app 的 整套 ui 设计。我的产品目前已经完成了基础功能, codex 也已经理解了产品的核心理念。 接下来我们要优化 ui 设计,首先把这段提示词发给 codex, 让它根据产品定位提炼出一套详细的 ui 规范。 codex 会根据产品的设计理念和功能生成一套详细的产品设计规范文档,也就是你的产品拥有了自己的设计语言。 第二步,让 codex 根据你现有的设计语言和 app 的 功能生成全量的设计草图。 codex 会给你一个全量的产品设计图,包含产品中的所有细节,搭好了产品的骨架,但是目前的设计产品中还无法直接使用。 现在到了第三步,生成切图,再让 codex 根据设计稿输出。最终在代码里要用到的图片资源,明确要求它。根据设计规范,把每一个 icon 都输出成透明底的 png 文件,并且保存到项目的 sets 目录里,方便后续使用。 最后一步,让 codex 替换图标,把刚才生成的这一套设计图应用到项目中,你就会得到一套符合你设计要求的产品界面。 现在我们来总结一下,第一步,定规范,让 ai 总结一套产品的设计语言。第二步,搭框架,让 ai 根据设计语言和产品的功能完成产品的初步设计稿。第三步,做切图,让 ai 根据具体的细节输出实际项目中能用到的图。 第四步,换素材,把这些做好的图片换到你的项目中,全程不需要手动写一行代码,也不需要打开复杂的设计软件,普通人加 ai 就 等于超人,每个人都可以用 ai 做出自己的产品。

这个软件大家一定要用起来哈,真的比小龙虾好玩多了。然后我现在做了一个自动切片的软件哈,然后我们开始批量切片哈,你你可以发现他开始切片了, 但是我不知道他当前任务进度百分之三十,我不知道他在执行哪个任务,写那么多任务。所以我看到第一个问题了,然后第二个问题就是这里有个选择目录,每次切完了之后,我想打开所在目录嘛,是不是没有这个快捷键?然后我就发现这些痛点, 所以说你只要跟上 get 说一下,你就截个图给他,我说我把这个进度放在这里,是不是这样有显示就可以, 是吧?就截个图试一下嘛,我就说我希望在每个文件名称右边都会显示时长啊,对,时长什么意思?就是我这个视频到底多长我不知道,一分钟、两分钟,如果我都看到一个,一个小时三十分钟,我就可以不切,因为太长了,切没多少意义,或者说很浪费时间。让我知道一下每个视频 时长,是不是所以右边显示时长,然后开始识别之后会有个进度,是吧?显,只要显示百分比进度就好,然后最终该视频 完成就显示百分之百。二、双击列表中带切片视频可以播放视频,意思就是我双击这个东西,我就可以马上播放视频,我知道这个视频到底是大概有没有必要切片嘛?不然我要找到这个啊,我的文件管理目录那里找到那个视频就没必要了,所以我可以 这里双击就可以播放嘛,是不是?然后我们看一下第三个啥,最终切片完会有个快捷键叫做打开切片所在 find 哈。 find 什么意思啊?在苹果里就是我的电脑意思打就打开所在目录个字哈,我们叫访达哈, 知道吧,所以这个是苹果专用的叫翻的啊,就就是打开所在目录的意思哈。啊,就放在选择目录旁边或下面都可以啊,就我的意思就放在这里这样点击一下就可以打个目录嘛。所以这就是我的一个需求嘛,是不是我只要发给他, 然后他就马上给你改软件啊?啊,我们看一下他是怎么思考的啊,你看改完之后我按照我立即生成并新的麦克 app 是 吧,他就开开始浏览你的电脑文件了,就是他会看你的代码,这是我代码文件嘛? 是 𠲎, 我 已经把这搞清楚了嘛,是不是他很快的我准备开始改代码啊,这次我干嘛干嘛?然后他开始浏览了这个代码,这意思啊,是不是所以他就有个过程他要思考嘛,开始编代码了嘛,是不是在编辑嘛,加了三个代码就加加了三个代码,然后减了一个代码嘛。啊, 又在思考了啊,然后这是我在切片切了好多是不是?你看我现在他在干嘛我都知道哈,我就把这个一定要一定要把它关掉,我就没什么用,比如之前我是这样切的,看他说的图就知道了,是不是?这是什么?是人还是物?是不是?你看这个明显就是一个春联吗?是吧? 然后呢?我现在我们看一下,因为太多了,你看切片整理,你看他现在就是怎么近景特写啊,我觉得没必要啊,很容易到时候会重名,但是如果说按照日期去的话就不会重名哈。 好了,我们再看一下它是怎么改掉我的,那我已经把功能逻辑修正了啊,然后现在它在编新的 app 哈,在编写新的 app 了,然后,哎,你看这个就有又发现一个 bug 了,没有终止任务,是不是? 是不是?所以我又开始说可以终止,你看只有开始切片工具啊,但是我因为我一下子放了一百七十四个视频哈, 然后每个视频可能就几十上百个镜头,是不是你这样算下来有几万个镜头了?所以说你看现在没有终止,所以你发现 bug 你 就修 bug 嘛,然后你就给他一个命令嘛,给他个命令他就会跟跟你改。好, 我现在终止不了。你看到搞了那么久,只只完成百,总金额百分之一,但是视频已经完成一两个了哈,你看我现在已经完成三个视频了,你看每个视频啊,都有那么多。这个东西是我自己做的一个软件哈,就它会提醒我完成了这个任务。好, ok, 我 们可以单机一下就能打开了, 我们打开看有没有改过来, ok, 我 们把这功能关掉哈,然后添加文件夹,比如我选择这个哈,你看一下 是不是这个。好好,我们开始批量切面试一下哈, ok, 你 看进度六,你看跟这个同步了二十一,你看他就帮我实现了功能,是不是老师上五十八秒嘛,我就知道哪个东西嘛,你看还有三十六分钟的,是不是三十六分钟就我们就要着重一下嘛, 下次我再加个功能,叫点击排序嘛,点击一下就可以排序的,然后这个进度不就是可以随着中指我再加个功能叫中指任务,然后改个红色嘛,是不是可以中指任务嘛?你看 他开始已经识别出来了,他要切片第二个了,但是因为我这些东西哈,都是只有一个镜头的哈, 大家好,我现在在和田的一个枣园里啊,大家可以看到吧,所以他只识别出来一个镜头, 所以现在就是刚刚那几个功能。是不是跟我帮我实现了一个进度条,一个打开所在的翻的,还有你看现在就知道了。切哪个镜头我就知道了他给我切了哪个镜头,我还有个东西叫什么啊?双击可以播放视频, ok, 比如说,我现在测试一下哈,比如说看一下这个, 呃,我穿越又失败了哈,这些双击你看马上能播放了,相信那么久 是吧。双击,咦,牛逼,如果说是吧,所以你基本上你要啥功能他就给你实现啥功能啊,等个几分钟就实现了哈,也不用写代码,也不用干嘛啊?是这样的哈,如果说你们看不懂 我的视频,到时候我会出几期置顶哈,你们可以看一下置顶有没有置顶视频置顶会讲一下。呃,扣代码是怎么安装啊?大概怎么使用,你们学一下入门,你看了入门之后你再看我的这个视频,肯定能看得懂的哈,如果看不懂也没关系。好吧,你们记得先看一下置顶, ok, 反正这个东西我也是随便的锻炼自己的输出能力了,我也不求多少人能看这个视频, 反正就是分更新一些,我在时时在做的一些事情啊,每天出一期两期,是不是我觉得这种视频还是对人有点帮助的哈,就是我的一些思路是怎么做的,是不是比较真实哈?
