你听我说,有人用 qbox 搭配的负五点五整了个大国搭建的网站,能实现真实布料物理模拟焊互动风效果,而且是实时运行,不是渲染出来的布料随风动态超动的物理反馈无比丝滑,交互体验直接拉满。这波操作让 ai 万能解决方案的说法更有 底气了。从代码生成到物理引擎交互设计的全球层卡通, ai 在 技术融合领域的能力又上了一个新台阶。
粉丝845获赞8.1万

分享一个特别实用的小技巧,很多朋友现在喜欢在 gpt 的 官网生成图片,但是如果你想批量做图,做分镜,做短片素材,其实我更推荐的用 codex, 我 为大家演示一下。首先我在 codex 里边告诉他,我想做一个跨服追日的短片,让他帮我生成一个完整的故事,故事出来之后,我再让他继续拆成文字分镜, 这个时候我只需要判断一下这个节奏对不对,画面感够不够。确定分镜没有问题之后,我告诉他,按照这些分镜生成对应的图片,统一放到指定的文件夹里边, 他就会自动的一张一张的生成。结果生成完毕之后,我突然有点后悔了,于是我又让他重新生成竖版的分镜, 它就继续的开始生成。这就是智能体真正有意思的地方,它不只是一个聊天工具,还能围绕着你的目标,一步步的把事情推进下去。我相信未来的 codex, 它很有可能会成为一个超级应用, 它不只是写代码,也不只是生成图片,而是帮助我们普通人把想法变成流程,变成工具,变成作品。

g p t 五点四更新了没几天啊,我终于跑通了,可以用 ai 来做全自动的设计工作流,说白了就可以做到全程用嘴啊,你给我建个专家里面,给我放个点 p e n 设计文件,让我们来开始做什么设计。 当然它对我来说最重要的是可以实现半自动,每一个过程在中间我可以手动的去改,比如说我删掉两个字啊,或者我把这行字挪到这里来啊,哎,或者,哎,这个图片我觉得它裁的不合适,我再把它多裁一点。 那么我们平时在用的 g b t g m 机梦这些东西呢?它是全自动,能做一个设计,它有几个问题啊,一个是它不能去修改,不行你就重新来。但是我这种半自动的,说白了就像一个人坐在旁边帮你用设计软件做东西,你想什么时候停下来,你就停下来,你想什么时候回到上一步就回到上一步, 你想把它推开,你自己上,哎,你也可以自己去挪动一个小图片,去加两行字都没有问题,就它整个工作流主要是用 gpt。 五点四啊,在 codex 里面实现的, 那么调用这个 pencil mcp, 哎,我们就把 pencil 的 设计软件在旁边打开,你这边,呃,数字也行啊,用嘴也行啊,那边的设计软件就开始自动的动,当然这个东西它早就有了,但现在为什么开始好用呢? 一个原因是 gpt 升级了,但更重要的原因是我做了两个 skill。 那 这两个 skill 目前没有开源啊,你在 get 上根本就搜不到啊,因为是我自己做的,那还在实验,也许未来会开源,那我第一个 skill 叫做 graphic abstract skill, 那 这个东西是干嘛的呢?它是把我一篇古早的一篇论文啊,怎么来做版式啊,怎么来做对齐,怎么来做 icon。 然后呢,我把那篇论文 固化到这个 skill 里面,哎,他就来指导我的 ai。 我 们会发现,我们用很多 ai 全自动做东西的时候,他对,尤其是对于这种文字的排版呀,对齐呀,然后呢,图标的大小呀,包括这种标题的层级啊,他用的很难看,我们现在用很多 ai 工具,做海报也好,做些设计也好,你就最多放几个大标题,因为他不会排版, 那么我的那条论文是刚好是解决这些文字排版,对齐等等的问题,所以我才固化了这么一个 skill。 那 我的文字的排版,还有各个设计区域的对齐啊,啊,空间的间距啊,这东西全部都解决掉了。 那么我还做了一个 skill 呢,叫做 visual extraction skill, 那 它是干嘛的呢?它就是设计师的眼睛。但是我的这个 skill 呢,哎,就可以把整个图片网格化,然后通过 ai 识别, 我就指哪切哪,哎,比如说有个戒指在图片呢,比如上方靠左的位置,哎,我就能刚好把它切下来。 我有一堆图片啊,这些图片里面全都有一个戒指,但位置都不一样。但是我现在只想,哎,给我切出来一个圆形的蒙版,里面是个戒指,我可以批量的切一千张图,你想以前这个手工是很困难的, 现在呢,用了我这个 skill 呢,哎,它就等于长眼睛了,哎,它通过这种网格化的智能识别,它就可以指哪切哪,当然,凡是具体坐标的识别,它都能干,它能准确地指到你想指的东西, 当然就靠嘴,就比如说我用嘴说,哎,你给我来个箭头来指下这个眼镜啊,上面写一个圆形眼镜,它这种非常准确的全自动的,哎,一个箭头指到这个眼镜,那么有了我这两个 skill, 再加上 g b t 五点四,哎,又上 codex, 再加上这个 pencil m c p, 哇, 这个全自动的设计工作流就来了,但目前呢,还是需要我的沉淀,就等于说我还得不停的做设计,让它自我学习,因为我是让我的每个 skill 都加入了自我学习跟迭代这个功能。一个是我每个星期每个月可以手动复盘,那更重要的是,我已经把它固化到这个 skill 里面去了, 在很多时候,它会自动激活,它会提醒我,哎,今天你要不要复盘一下,我们要不要升级一下我们的 skill, 它就会自动来打怪升级。 其实我是用一个核心 skill, 下面有一堆 skill, 包括这个设计 skill 呀,剪辑 skill 呀,呃,它是 designer m c p 呀,就各种玩意儿都是用一个总控的 skill 来控制它们。 所以这种 skills 呢,它们就有点像就现在我们大家比较火的这个 open globe, 就 像小龙虾一样,但这些小龙虾它们不可控,哎,所以我就不用。就目前而言啊,就你想稳稳的去跑一个设计工作,我觉得 skill 这种 固化的比较安全的东西还是比较靠谱。如果你想用到我的这个 ai 工作流呢,估计可能你得等一等啊,因为我还得让它自我学习一下啊,也许哪一天就在 get 开源了。如果你感兴趣啊,可以在评论区蹲一蹲。

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

之前 ai 做 ppt 最让人头疼的就是排版乱,审美差,内容不成体系。但这套论文答辩 ppt 是 用 codex 加 gbt image two 自动生成的, codex 负责读论文拆结构, gbt image two 负责生成高质量的页面视觉, 我现在直接演示完整流程,看完相信你也能够复现。首先我这里准备了一个答辩 ppt 的 文件夹,里边有一个大论文 的文,还有一个校徽,作为一个视觉的参考。那接下来我们在 codex 添加新的项目,使用现有文件夹, 然后选中刚刚的答辩 ppt, 打开,这样的话,这个新绘画的所有的上下文就跟这个答辩 ppt 这个项目做了关联。那么接下来给它输第一段提示词,就是提炼 ppt 的 结构,让它生成十八到二十页的大纲,适合八到十分钟的答辩。最后输出一份 md 文档, 那我们这里选的是 gpt, 五点五智能选超高,然后速度就按标准就可以了。 ok, 我 们给它发送,然后我们稍作等待, 这里出现了读取 pdf 的 技能,那如果没有这些插件的话,去把它安装一下,当然默认它好像就是安装的,我也不太确定。比如说 documents, 如果没有安装的话,你把它安装一下插件,那插件里边还有一些,呃,做 ppt 的 这个 presentations 这个插件,还有做表格处理表格的这个插件,这些可以去安装一下,点一下就可以安装了,很简单。那我们再等待它一下, 经过三分三秒钟的等待,这个结果是生成了,我们可以点这个悬浮的这个框,点开一下这个 md 文件,里边就是大纲了,大概是二十页。 ok, 大 体看上去没有什么问题。那我们接下来给他第二段提示词,然后让他确定一个 ppt 的 风格。 这里需要注意的就是,我们必须调用他的一个技能,叫我们使用 at, 然后 image 这个技能,这个技能是他可以直接使用 gpd image 来生成非常逼真的那些图片。呃,里边的一个字都不会错的那种,大家都刷到过那种图片估计。然后我们让他生成 这里给他说,根据学校上传的 logo, 啊,不对,根据上传的学校 logo, 也就是当前这个文件夹下不是有个 logo 吗?他会参考这个视觉元素去生成一套方案。 ok, 又经过三分二十四秒钟的等待,他生成了视觉方案,大体上看还是符合屈服蓝大学调子的,看上去没有什么问题。不过呢,这个东西有点像开盲盒,我刚刚又在另外一个绘画里边让他生成了一下,这个看上去就更有那个学术味。 呃,所以说呢,跟提示词也有点关系,然后跟这个东西生成它本身都是随机性的嘛,所以有点想开盲盒。那既然这样,我们就继续这个再继续做吧。然后我们下一步就是参考,让他参考上面的这个视觉方案和 md 文档,就是这个答辩的 ppt 结构,然后使用 image 键技能。这里必须要艾特一下 image image 键 图片生成技能,生成全部的 ppt 页面,最后拼装成一个大的 ppt 演示文稿,然后让他起用演讲者注视,然后注视里面添加备注。嗯,不要添加任何的元素,然后避免破坏 ppt 的 图片,我会这样让它生成。 那在生成的过程中呢,他还有所顾虑,有点谨慎,他说容易出现错字,也就是生成的那个图片容易生成错字。他提了一个更稳妥的做法,就是生成到视觉图片作为视觉追踪,然后用程序渲染成 png。 但是我直接给他说,哎,不会出现错字,大胆的生成就完了。 这样的话,它生成的二十页资产最后全部都会完整的保留,不会再那个出现可以编辑的文字了,这样的话视觉完全统一,它最后只会在答辩的那个演讲的注示里边添加文字, 这样它现在正在一页一页的生成。 codex 现在的用户体验已经和 cloud 的 桌面版差不多了,你看这里也有这个进度显示,这边点开之后也会有资产的显示,这里是这个实时进度,这里是生成的一些结果 本身。虽然他是面向程序员提供的产品,不过他现在越来越像一个超级的终端啊,不是超级的那个智能体,面向普通人也可以用了。你看在他的设置里面打开设置,我们可以选中这个适用于日常工作的,如果你是不是技术人员的话,你可以选这个模式,那他会回复的过程中会少一些技术性的话语,这样的话看起来更纯净。 ok。 经过了四十三分钟之后,终于生成了 ppt。 它生成慢的原因主要是那些图片一张张的特别慢,我们打开这个缩略图先看看,哎,看上去没有什么问题,视觉上比较统一。那我们继续使用 wps 来打开这个 ppt 看一下啊,看一下,第一眼看上去这个字什么的都没有什么错。然后我们先看一下缩略图,看看整体是什么样,一个感觉 整体上差别也不大,整体的视觉元素,视觉语言保持的还是比较一致的。然后我们看一下细节,第一个问题就是我看这个 logo 好 像有点问题,不过这也好处理,直接把那个 logo 图片导进来给他盖住就可以了。下面这些基本上是没有什么要改的,直接来自论文里面,然后他还生成了备注,这底下有批注啊,这底下有备注,到时候可以照着读的。 然后我们翻一翻,翻一翻大概就是 logo 是 最大的问题,其他的都问题不大,没有什么错别字,哎,这里代码什么都是能做表,然后这个图,这个图表也非常的 nice, 然后这个也可以,都是比较可以比较,可以可以用 哦。我发现还有个问题,就是屈服师范大学底下这个白描的图也有点不对,这不是屈氏大典的元素,不过这个也好解决,让他单独再生成一下这一页就可以了,可以让他给他一些参考,给他一些图片作为参考,让他知道真正的屈氏大的那个图片,然后参考可以生成更逼真的白描, 那整体上就是这个过程。我们最后再来总结一下,我们看一下这个绘画,整体上就是这一个绘画。首先是在这个项目里面有个答辩 ppt, 里边给他提供了我们的完整的论文,还有一个 logo, 学校 logo。 然后第一步要求他生成 ppt 的 大纲,这个大纲就是在这里, ppt 大 纲生成完了之后,我们再让它形成一套视觉方案,参考 logo, 或者说你给他提供更多的一些视觉参考,然后它生成一个视觉方案,生成之后我们再让它参考视觉方案和刚刚的 md 文件,就是大纲,再用这个生成图片,一页一页的生成 ppt。 呃,生成完之后,最后拼成了一个大的 ppt, 那这样的话就完成了整个 ppt 的 生成功。不过这样有问题,就是生成出来的 ppt 你 是没法进行编辑,毕竟它都是一张张的图片。那好在它生成图片比较准确,没有什么错字的问题。如果有简单的一些元素需要覆盖,你像这个 logo 可以 直接用 logo 给他盖上去,真实的 logo 给他盖上去。还有最后这张白描,如果有问题,可以让他单独生成这一张。其他的你像这些图标什么的图标什么字都是没有什么问题的,都是没有问题的,直接就是参考那那个论文里面那些直接读读过来的。 ok, 那 今天的内容就到这里了,如果大家有什么问题的话,可以在评论区聊一聊哦。

这是我用 emoji 二点零和 codex 生成的十五页可支持编辑的 ppt。 这张 ppt 里面所有的标题、文字、图标,甚至是左上角的复旦大学 logo 都是 codex 帮忙生成的,里面的每一个内容都是可以支持编辑的。更关键的是, ppt 里面的文字和数据表格,都是 codex 直接从我 word 版的数字论文当中直接提取的。如果我告诉你,这样一套流程不仅支持去生成蓝色答辩风格的 ppt, 还支持去生成麦肯锡咨询风格、校园竞赛风格以及科技发布会风格的 ppt。 你 会不会想知道这到底是怎么完成的?那这个视频会教你如何用 gpt image 二点零加 gpx 去生成这样一个可支持编辑的 ppt 内容。以前我们做 ppt 其实第一步就是去找模板,但是很多模板其实根本不是配我们所做的内容, 所以我这套流程呢,第一步是去创造模板。第一步我让 gpt image 二点零去帮我生成五张适合于竖式论文答辩的 ppt 的 图片。 那在这个阶段,我们可以自由地定义这个图片当中 ppt 的 类型。我们可以跟他说,这是一个关于复旦大学硕士论文答辩的 ppt, 并且需要蓝色风格里面的 ppt 左上角需要有复旦大学的 logo, 不 时页面需要有标题区,并且有相关的学术素材。你也可以跟他说,我需要麦肯锡咨询风格以及相关的校园竞赛风格,它都可以帮你生成对应的图片。那其实这一步最重要的不是让他一次性帮你生成和支持编辑的 ppt, 而是帮你去定义一些 ppt 的 视觉风格,你可以从这些视觉风格当中去选择几个你比较喜欢的风格,那我们可以看到 emoji 二点零在这方面做的非常出色,他直接给我生成了五张我觉得相对来说视觉还比较突出的这种蓝色风格的 ppt。 第二步,我把刚刚 emoji 二点零生成的五张图片复制到了 codex 里面, 然后我在提示词里面清楚地告诉他,不要直接生成带图片的 ppt 的 内容。也就是说 codex 需要基于我上传的图片,把图 片背后的每一个底层元素都拆解成 png 图片,然后把这些 png 按照图层的形式进一步合成一个支持编辑的 ppt。 那 经过这样一步之后,我们所得到的就不是一张单纯的死图,而是一系列可以拖拉拽的 ppt 的 图层。那可以看到,把这个提示词发出去之后没多久, codex 就 直接帮我们生成了一份 ppt 的 模板。 我点开这个模板查看了一下,发现整体的视觉效果跟刚刚上传的图片的比例以及视觉几乎是一样的,并且是可以支持拖拉拽以及自动编辑的。这样我们就得到了一份由 codex 生成的符合我们视觉意向的这样一个 ppt 的 模板。 下面进行第三步,我把自己的 word 版说书论文发给 codex, 让它基于前面生成的 ppt 模板以及我说书论文的内容,自动帮我把说书论文当中比较核心的内容填充到这个 ppt 模板里面,进去生成一份十五页可知是答辩的,说是论文 ppt, 那 这里之所以用说书论文来演示,主要是因为说书论文对于内容的相似度以及数据的要求比较高, 它可以更加有效的验证 codex 是 否能够真正的帮我们完成一个比较复杂的任务。那大概过了二十分钟, codex 就 把完整版的 ppt 内容给生成了,那我点开仔细检查了一下,发现整体的视觉风格基本上是和前面的内容保持一致的,但是相比较于一个比较完整的硕士论文答辩内容,它整体的文本以及数据稍显单薄,于是我让它做了进一步的优化, 当他把 ppt 当中补充更多的文字内容,以及更多关于数据的表格,体现整个数字论文的严谨性。大概又过了七八分钟, codex 把最终版本的 ppt 给到了我。我看了一下,里面无论是内容的详细性,还是说数据表格的真实性,都基本达到了可答辩的要求。所以到这里,一份可以当做组会汇报甚至是答辩的数字论文 ppt 基本已经完成了。 我们平常做这样一份 ppt 的 内容可能需要花一整天的时间,而且深沉的内容和风格可能也不一定好看,用这样一套工作流可以大大提升我们整体的工作和学习的效率。那以上就是这期视频想要分享的内容。

我用 callix 加 gpt 五点五,只花了五分钟就做了一个自媒体选择题工具,不仅可以一键给选择题打分,分析流量潜力,还能自动生成封面图,效率直接翻三倍。这就是今天要给大家分享的 gpt 五点五加 callix 氛围感编程工作流。它解决了 ai 开发两大痛点,单轮生成无法叠代,优化 没法同时推进多个项目搭配 callix 桌面应用,你不用写复杂代码,可以直接像搭积木一样能做出能用的产品, 使用方法超级简单。第一步,新建项目文件夹,给出基础提示词,搭核心框架。第二步,边跑边叠带,在终端实时修改,不用重来。第三步,跨项目无缝切换,还能调用 cloud 的 优化前端样式。下面给大家分享三个实战场景。场景一, 自媒体博主开头给大家展示的这个工具,高智能筛选、高潜力选择题,自动配图,帮你少走弯路,快速解号,节省大量创作时间。场景二,副业创业者,十几分钟搭建 size 创业验证器,前后端一次性配齐,快速验证商业模式。场景三, 自由职业者不用每次手写题案,直接一键生成专业客户方案,自带报价交付系统和服务流程, 专业度拉满,省时又专业。如果你在做副业自媒体,或者是觉得自己的 ai 产出又丑又难用这个玩法,一定要试试!我是天眼锁,关注我,解锁更多 ai 落地实操技巧,记得点赞关注哦!

我们都知道,我们在 gbt 可以 实现通过生成一张图片的各个元素来实现它的 psd 分 层, 但是呢,通过这样的生成方式生成的元素最多不超过十个,而且它的文字是不可编辑的。这时候大家不妨试一下用 codex 来完成这些操作。 codex 它不仅仅是一款为编程而服务的 agent, 那 同时也能帮我们实现很多工作的自动化。 而且就在本月月初, codex 它的每日安装量已经超过了 cloud code。 另外 codex 本身已经支持了 gpt emoji 二点零的图片生成, 所以今天我们就试一下在 codex 上来实现它对图片的 psd 分 层。我们上传一张和之前一样的图片, 为了方便呢,我们这里选完全访问权限,对于这样偏简单的,我们自然选择中就可以了。跟 gbt 客户端一样,我们只要输入好提示词,然后按发送键就可以让它执行。当然这个提示词我可能要求比较严格,写的比较多, 所以比较长一点。好的一共花了十六分钟,他就给我生成了一个 psd 文件。在整个过程,他其实就是对各个元素进行重新生成,并对其中的文字进行一个 ocr 识别。 在我们的 ps 中呢,我们可以看到它不仅把这些元素分开了,而且把各个文字都转化成了一种可编辑的状态。当然它字体做不到百分之一百还原,但好在它的字体是可以进行编辑和修改其中的具体内容, 而且字体外的图层它同样是分割好可移动的。我们再看一个马克杯的例子,同样是用这一套提示词,当然它这里中断了一次,因为它生成的跟原图差距过大,所以我让它继续生成好,这就是最终生成的 psd 文件。 你看到元素可以移动,文字可以编辑,没什么问题。我们在利用 emoji 是 二点零制作这样的图片。除了文字的问题之外,我们还会遇到一个问题,就是它的图片通常就是生成一 k 的 图, 如果我们想打印图片或者要更高分辨率的图片的话,如果它值出的一 k 图片完全没有办法满足我们。但是它用 api 能生成四 k 的 图片,但是呢,这个 api 一 是要额外收费,而且 它和我们要拆分的过程相背。所以我建议大家在编辑好图片之后,可以通过以下两个方式进行放大。第一种方法,我们可以通过 comfy 里的 c 的 vr 这个模型,把我们一 k 的 图片放大到四 k。 工作流也非常的简单,我这里大概花了一百二十秒, 大家也可以看一下它跟原图的对比,放大效果还行,没有改变太多原图的细节。 如果你完全不会使用 comui 的 话,你也可以用谷歌它的 nano pro, 我 们在这个 ai studio, 我 们可以选择这个 nano pro。 右边这里我们也简单设置一下。首先把画质调到四 k 温度的话,调成零到零点二之间比较好。最下面这个参数呢,我们也给他调成零点五。同时我们输入以下提示词,一分钟后我们也可以得到一张四 k 放大的图片了。 我们也可以看下对比效果,虽然变清晰了,但是比 s d vr 它的重绘幅度稍微大那么一些,但是整体的细节大多数没有改变,可以勉强接受吧。这就是整个在 codex 来实现 p s t。 分 层加上高清放大的 一些基本方法。当然你可以通过 codex 来实现一些更高难度,更精确的 p s t。 分 层和 自动化工作流。我这里只是抛砖引玉一下,你可以把梯子十优化的更好。总之,以后 codex 无论是在编程还是说像这种图像自动化处理流程,都会变成必不可少的工具。我们本期利用 codex 如何将 图片进行 psd 分 层以及 image 二点零图片放大的方法就介绍到这,有关于具体的提示词,还有空 v i 的 工作礼物会放在视频剪辑的下方。 好,如果你觉得本期视频对你有所帮助的话,欢迎帮我点一个赞,我们下期再见!

有了叉 gpt 和 codex 之后,你一定要试的五个功能,做 ppt、 做漫画、做动画、做游戏,还有养电子宠物这五个功能,今天我给大家一一的去演示一下,那视频可能略长,欢迎大家先点赞收藏,慢慢观看。 第一个做 ppt, 例如你看到了一个好看的图片,比如这张你可以把它发给那个 gpt, 就 在对话框里面,你让他根据配色和设计感,让他帮你出整个模板的设计方案,还有视觉的一些定位等等等等。你看这里,他把这个风格定义为流光花雾,我觉得就非常的准确, 他会把整套的色彩设计用这语言给他做完整的一个设计。哪些页,比如说有些是图标,有一些卡片,有些是引言,有些是结束,他会有一个模板的规划出来。 你看你看这里,我就忍不住说,你可以直接做 ppt 模板文件吗?他可以的,对,他直接可以在里面做可以 编辑的 ppt 文件,这个文件可以下载到本地,然后变成 ppt x 的 格式,你可以自由的去编辑,但是我觉得这个不够还原,于是我让他直接先根据严格参照我这个美学东西,再严格设计。 你看他这里非常的严谨,他先把各种的框架给列出来了,再去列色彩等等的,把草图用这种文字给他画出来,真的非常严谨。让我确认之后,我再让他开始设计, 在这里主要用到 p ppt 现在非常强的两个能力,第一个是图像生成,那这个我猜大家在各种地方也刷到了,它图像生成能力其实极强。那第二个它是能够批量去生图的,你看它一次能生成好几张图,我经过测试,它好像一次最多是能生成十张。 你可以一张一张的让他把这二十页模板的素材都做出来,或者直接在一张图里面把所有的版式都做出来。比如说像这里把一张图里面把所有的版式都做出来,你确认之后,你让他再开始设计,那中间可能需要微调,但我觉得这个最后的还原效果还是挺不错的。 你看它最后还原,你看它效果什么的都挺不错。你下载到本地就可以进行编辑了,做成可以编辑的 ppt 文件,在这里直接可以下载。那我记得这是海外预藏家里面唯一一个能在对话框里面直接生成这种 美学感极强,又能直接编辑 ppt 文件的,这 gpt 现在还是比较的良心。第二个是做漫画,这里你看你可以找到一段小说的剧情,或者任何你自己写的,都可以 把它发给 gbt, 让他去帮你设计整个漫画的方案。你看他会从每一页怎么设计啊,文案什么,画面是什么啊,分清重点是什么的,让他就可以进行一个设计。 那这里我先跳过中间的部分,他同样是可以给你批量生成,你确定一些风格之后,你让他批量生成。在这里我做了一些例如这种国风的美男型的,这个是一个小说人物,把它做成了,我感觉效果还是很不错的, 前几页可能偏洒脱,对,后几页开始逐渐觉醒,他会有一个情绪的递进,那这个其实他在画面还原上也会体现出来,到最后几页就会变得很帅很燃,你看他放一些大招什么的,你还可以让他继续设计, 他一次是能最多生成十页,就跟图像一样,他一次能生成十页漫画。但比如说你要让他更严谨点,逐页生成更严谨也可以更好。 那这个是比如说国风的,还有其他风格,大家可以去试一下,比如说这种可能 p 的 比较乱的,这种黑白,这种彩漫风格、泼墨风格的都可以生成, 效果真的都非常好,非常的帅。第三个是做动画,那其实刚刚开头这个动画其实就是 g p t 给我做的,你看这是我在它的浏览器里面,那这里主要用到两个 skill, 一个是 hyperframes, 那 这样的 skill 可能大家在其他地方都刷到过, 那现在 gbt 是 直接在它官方的 codex 所说的 codex, 它的官方的插件市场里面可以去安装,到我这里给大家演示一下。 大家在这个 codex 的 插件市场里面,在底下这一栏下面就能找到 remotion 跟那个 hyperframes 两个插件,你直接在这里一键就可以进行一个安装。 这两个 skill agent 其实是在很多的 coding agent, 比如说 oracle 或者 jimmy, 什么 anti gravity 或者是 c r 页面都可以用。 但我自己体验下来,我觉得现在 codex 的 可能由于 g b t 它的智能水平非常的高,我自己形容下来非常的省事,而且做出来效果非常好,反正是比 jimmy, nike 要好。如果说大家现在用不了拷 codex, 由于各种各样的原因,可以尝试用 codex 去做一个平替,试一下 他能做什么样的动画,他真的我觉得他什么都能做,我们现在看 remotion, 这就是 remotion, 比如开头这个动画,这个凯片弹出的动画就是他给我做的,还能让他做什么?比如说这个演示是 full 架构,这个可能是一个 ai 的 一个底层的一个架构,普通人我自己反正是不懂,让他去给我设计一些这种很好玩的动画去呈现, 他能图文动画方案什么的自己去全包了设计,你看他就一段能解释清楚,包括你让他做一些,比如说太阳系运行的一些动画,他也能简单做出来,包括一些这种产品演示的,或者是 logo 图形的动画,也可以试一下。对,第二个就是这个 hyperframes, 他 同样也是,我就给了他一句话,你说你帮你,我就跟他说你帮我演示一下人类进化的简史, 你看他做了一个很高级这种,你看从一开始的这种啊,土风火种,到后面我们开始进入农耕文明,到后面我们开始有社会,开始有组织,开始有体制,还有帝国,有宗教什么的。你看他简简单单就写了一个这种 东西,你看你直接拿去录屏讲解,或者是直接做成视频发布,都非常的成立。第四个是做游戏,但首先 codex 里面有内置一个很强的一个插件,它叫根 studio, 我 的理解就这里面其实打包了非常多的那种 很专业的那种游戏设计的经验思路,还有各种游戏的原型等等。首先你一句话就能设计像贪食蛇这样的简单的这种网页游戏,你看这是一个贪食蛇,他死掉了,你看杰杰在这里就可以玩,他是一个完整的一个贪食的游戏,还是一个霓虹风的,这个你可以自己去定义风格。 对,如果说你不满足于这种即食的一个比较简单的游戏,你还可以通过例如说先设计游戏资产 在做比较复杂的游戏,比如这里我让他先又让 gbt 在 兑换往里先给我设计游戏资产,比如说这里有敌人狙决,动作环境等等, 那主要是为了省一些这个 codex 的 额度,你再回到 codex 里面,让他给你设计根据本地的资产什么的游戏。在这里我做了一个横版过关的这个类恶魔城的游戏,给大家演示一下,功能也非常完整,可以上下左右跳,还可以攻击,有小怪, 对,有远程的小怪,有近战的小怪,还有狙盾的小怪,就会射击有点难,我自己都有点打不过。对, 好,这个是做游戏,你看他同时刷新就可以,他有复活的二人跳什么的,对,算是一个完整的一个游戏。最后一个我们回到做电子宠物,那这个其实我相信,如果大家玩 coco 的 可能有发现,那 coco 可能当时没有去认真的做,现在我碰一下他做了 这个宠物有两种玩的方式,第一个你可以用官方自己的宠物,你看这里,你看在大家进到这个设置, 在外观往下滑就能找到它给你内置的一些就能找到那内置那个选择。对,它内置挺多,你你可以再随便选一个开始点,比如说我们刚选过这一点唤醒宠物,它就有这样,这个宠物它是两个功能,一个是说它能显示 codex 的 状态, 你看他自己在跳,他可以显示口袋的状态,如果说完成一个任务或怎么样,他就会跳出来提示你说口袋已经完成任务, 如果说你不满足于这种口袋是给内置的宠物,你可以自己去设计,你可以让他,比如说我就让他给我设计一个兔子形状的这么一个宠物,让他冒出来他会有,你看他也可以自己进行一个拖动,他有这种情况,你可以喂食,可以摸他,可以让他睡觉,让他叫醒等等等等。还有几种状态 你都可以去设计,同样也是说先设计这个动物自己的游戏的,不对,不是游戏就动物自己的动画资产,你看这里有再把它变成动画的功能等等,这就是今天想给大家介绍的五个功能,有一些可能需要去开动 plus 才能体验, 然后总之大家就去玩一下,非常好玩,尤其说我的扣带,可能现在真的很好用,刚跟进什么的,谢谢大家,我是 coco 二。

codex 加 html 才是做 ppt 的 王炸组合,今天教你用 codex, 只要四步就能做出可以编辑修改的精美 ppt。 第一步,上传你的文档,让 codex 根据你的文档生成 ppt 大 纲和主页内容,这里的大纲就是后续 ppt 的 内容框架。第二步,让 codex 调用 html 这个 style, 根据刚才的大纲生成三版不同视觉风格的 ppt 预览,以拼图形式输出。 这一步我们是为了快速选择合适的视觉风格,我更喜欢这一张。第三步,让 codex 寄予我刚才喜欢的视觉方案,继续调用 image 帧这个 skill, 将拼图中的每一页依次生成高清单页视觉稿图片。 和直接生成 ppt 相比,先生成视觉稿能更好地利用 m h two 模型的构图设计能力,露出的 ppt 会更有设计感。第四步,也是最重要的一步,复制我这段已经调教好的提示词,让 codex 把单页视觉稿图片还原成可以编辑修改的 ppt 文件。 这里我建议每次单独还原一页视觉稿,如果效果不满意,重新生成会更方便。我这里先还原第五页视觉稿,看下效果。可以直接用 wps 打开,我们可以看到这页的还原效果很好,而且可以随便编辑修改 ppt 内容。 接下来我们对剩余每一页视觉稿图片都执行刚才的操作,最后把得到的多个 ppt 文件合并起来,一份充满设计感并且可以编辑修改的 ppt 文件就生成好了。

这是我用 codex 做的动态图标,这些也是像这样的效果,我们现在不需要 ae, 也不需要 p r, 用 codex 就 能实现。那今天我把这个教程分享给大家,用到的工具是 codex 和一个叫 hyperframes 的 插件,点击左边栏的插件,在这里搜 hyperframes, 然后你会看到这个插件的详细信息,点进去再点击,在对话中试用。这里大家记得先添加好项目文件夹,确定好模型,智能等级和速度,然后就可以把题词放进去。比如帮我做一个 codex 和 cloud code 的 功能对比的分析,视频时长十五秒, 尺寸是横版十六比九,视觉风格是苹果简约高级风,需要增加一些动态效果的展示。 这里写错了哈,因为我用的是 ai 语音工具,完全是口喷的,有些词语可能会识别错误,直接改一下就行, 然后点击发送,让他开始做。你看他先是查了一下官方资料,确保这两个工具的信息是最新的,然后他还会去看 hyperframes 的 要求是啥,确定下来视觉身份,然后再去写 html, 他会主动在我们看不到的地方用网页去搜索资料,那整个的思考过程跟我们人类是一样一样的。他还会单独创建一个文件夹,因为我这个目录里面啊,其实是有其他项目文件的,所以他知道不能碰到别的。我把左边的边栏隐藏掉,现在整个页面都是我们的视频制作过程 他很快就确定下来,主画面用冷白、石墨黑、微蓝和暖金做出高级感。我觉得如果大家有更具体的风格,也可以直接在刚才提示词里面告诉他,那整个过程他会自己产出内容,然后检查有没有问题,再自行更正。这些你都可以看到, 如果不想管,就让电脑开着,让扣贷自己干活。那做这样一个视频大概花了十来分钟,然后文件的位置,他参考了哪些资料,最后都会告诉我们。来,我们看一下它的效果。 大家注意看,这只是第一版哦,我觉得已经非常惊艳了,完全没有预先做任何模板,已经可以拿去用了。那不管是发布在社交媒体上,还是工作汇报,都很顶。 实际上呢,它不仅是可以做这种图表,还可以做产品介绍。比如这个辣条的产品视频,你丢给 codex 一个网页,让它做产品或者品牌的介绍,也可以做一个像 open ai 这样的业绩表,那放在 ppt 里面简直是开挂。 你甚至还能让它做这种 logo 散落的视频,或者是宋代山水风格的 ai 发展史, 你给他一段提示词,也不用特别复杂,让他开干就可以了。一般来说啊,十来分钟左右就能做出来,那如果对效果不满意,再沟通几轮, 那到这里大家可能会觉得,哎,这好像没有什么难度啊,很简单,每个人都可以做。那我再分享几招进阶的方法。 第一个呢,如果视频中涉及到图片类的素材,像 logo 啊,或者人像,建议自行上传。或者呢,可以先让 cloud code 整理出这些 logo, 然后再把这个文件夹打包到项目里,这样失误会更少。第二个是关于审美和风格,如果不指定风格,他做出来的大概率就会比较大众化, 像科技风很容易就做成那种已经用烂了的蓝紫色,所以最好是提前指定风格。那我这里也列了一些,大家可以直接拿去用。 最后是音乐和音效,可以让它生成简单的音效,但是背景音乐呢?大家可以用 solo 生成原创的背景音,或者直接在剪辑工具里面把音乐库的素材放进去,最后我再补录一个哈。很多时候我们做动效视频会需要信息的专业性和准确性。 那对于科研、生物科学、生命科学这些领域来说,我比较推荐 bell render 这个插件,它能够把这些领域的一些复杂概念进行可适化。那结合 paperframes 它们两个就能把一些科研领域专业绘色的信息用非常动态的形式表达出来。 比如说我让他做一个 an apple a day keeps the doctor away 这句谚语背后的一个科普回答, 他就会给到我这样一个视频,我们可以看一下效果。 那我们今天的分享就到这里,我们下期再见。

只需一张图片和一段文本,就可以快速地在 codex 上实现这种日系的尬了 game 的 开发。今天我就来教大家简单地制作这一款小游戏。 首先第一步就是生成美术资源,呃,提示词可以参考我这一段,我要制作一个日系的美少女尬了 game 现在给我生成一系列的美术资源,包括角色人物例会以及 ui 切读和命名。人物的话要有张嘴说话跟闭嘴的两个状态,然后这边就可以看到它已经帮你把美术资源已经生成好了,包括它的命名和一些 icon 图标 都切的非常的详细,这样的话下一步就非常的容易。然后呢,再去生成我们的一个文本,对,因为 adv 游戏的话,他一定是会有些对白剧本的。呃,我让他根据我的这个美术设定生成了一段对白对白的剧本,呃,然后再给我一个分支选项,并且把剧本做成 md 文件给我,其实只要是文本格式都可以。 然后把我们刚刚生成的文本文件跟我们的美术资源图片粘贴到 codex 里面。提示词可以参考我的这一段, 根据我的美术资源和文本文件开发一个日系 a d v 游戏,要有点击交互音效和交互效果,人物对话时要有张嘴和闭嘴的效果。 然后注意在这一段话后面加一个空格,引用我们的指令,以 magic, 以 magic 的 话可以帮助我们把我们的美术资源切图切成一个一个的透明素材,包括人物例会,这些都会是透明的,这样的话方便后续的开发,而且它的视觉效果也会非常的好。 这个时候 qq 代码就开始工作,他第一步会帮我们把美术资源切成各种各样的切图,就像他展示的这个样子,人物例会,然后场景图片,然后一些背景板按钮和图标这一些的都会给你整理的非常清楚, 第一版生成的效果肯定是会有许多小瑕疵的,这个时候我们就需要在 qq 代码提供一个链接,然后呢我们点开之后呢 对他进行一个批注的修改,比如说他来看大小,又或者说他的文字不太规范这些的话都是可以进行一个批注微调的。大概两三轮对话的话,就可以完成一个完整的小游戏了,大家如果对我这个游戏系列的教程还满意的话,请给我点一个小心心或者关注。

你看啊,这张图不就全部帮你拆成 ppt 了吗? gpt 加酷 max 目前啊,是我认为最有效的 ai 工具组合了,不要总想着去订阅一堆工具,才能提高你的工作效率。欧本 ai 现在已经非常全能了, 做 ppt, 做插画,剪动画素材,做编程,还能养养电子宠物,基本上啊,还盖了你在工作中的大部分场景。那废话不多,先来看看做 ppt 到底有多简单。我们出发 ppt 这个东西啊,肯定是属于我们都市牛马的必备技能了。当我们需要做一个全新的 ppt 时,第一个难题就是要找个模板先参考一下,要不然啊,总感觉很难下手。好,那这个好解决啊,我们直接上手就用 ai 来搭建一个模板,一切问题啊,迎刃而解。 先到网上找一张自己觉得满意的风格图片,直接贴给扣带斯,让他根据图片的风格设计一个 ppt 模板,我们来看看他的分享, 深空星河、暖色地平线、山脉剪影、精细型典风格拆解啊,都很到位,要你自己来说啊,这话你可能还描述不出来,毕竟啊,现在 g p t 的 识图能力和作图能力已经是第一题对的了,绝大部分风格啊,都是手拿把枪。其实呢,现在也有很多 ai 工具啊,都可以做 ppt, 我 自己啊,也有试过一些,但是呢,总感觉差点意思。好的啊,这里啊,他已经完成了,我们来打开看一下怎么样, 这个风格啊,是不是比较简约?时间线啊,逻辑线啊,也都是比较清晰的,其中的任意元素如果有什么需要调整的,都可以手动来调。当然啊,如果通用的模板你还觉得不够用的话,我们就再给他升级一下难度, 把这个 ppt 模板改成更适合题案,而且适用于新品上市的投放计划。或者还有更简单粗暴的方法,直接跟他说出你的需求,要调研什么,达成什么目标。如果你没有思路的话,就跟他聊,聊出你想要的内容之后再让他生成 ppt, 一 气呵成。 好,我们来看一下成果,依旧是这个简洁的风格,注意看啊,投放计划的元素都有保留哦,包括人群、场景、节奏,必要的元素啊,全部都有了,怎么样?就这么两三句空话就搭出一个 ppt 模板,老板还满意吗? 那么接下来啊,我们来说一下做 ppt 的 第二大痛点,引用和借鉴。平时我们在做 ppt 的 时候啊,看到一个不错的内容,或者说啊,做的不错的模板,想引用借鉴一下的时候啊,却发现这是一个 jpg 或者 pdf 文件,没办法编辑,这个时候的心情啊,往往是崩溃的, 还我没事,现在我们来试着解决看看啊,先去网上找一个复杂的 ppt 样式,就拿这个图为例吧,我们使用一下这个 skill, 跟他说帮我拆成 ppt, 你看这不就搞定了吗?每个元素都是可以编辑的,这样是不是省事多了?当然啊,关于图片转 pdf 这件事啊,有很多工具都是可以办到的,并不算稀奇,但是呢,可能需要收费,或者就是要你看一段讨厌的广告。 那既然如此啊,还不如直接就用 codex, 因为叉 gpt 实在是太全能了。没想到除了编程能力以外,别的啊也是样样精通,不管任何需求,全部大白话跟他讲就可以了。 那总体来说啊,这个 ppt 功能就已经让你省心省力,提高工作效率了,基于提升生产力的消费投入都是智慧票价的。好,今天就分享到这里,大家还有什么想知道的评论区留言,我来帮大家试试。我是阿月,我们下期再见。

codex 真的 很好用,但是 g p t 五的模型太贵了,再用下去我的钱包要顶不住了, 所以呢,今天呢,我就给大家分享两个 codex 很 实用的插件。呃,第一个插件呢,可以接入我们国内的一些大模型,比如说 deepsafe 啊,字谱啊。好,第一个呢,就这个这个插件 打开之后呢,我们可以先点击模型中心,然后这里可以选择我们这些国内很优质的大模型。然后呢我们点击加号,复制好之后呢保存,保存之后我们再点击应用管理,选到我们的 codex, 选择其中应用 就可以了,而且如果你有多个国内的大模型的话,你切换模型的话,它对话是不会清除的,我觉得这个就很好用。好,现在通过这个插件打开的话,那就是使用的就是我们的这个 啊质朴的模型了。那如果我们是通过 api 的 方式登录的这个 codex 的 桌面版的,那它这个插件是灰色的啊,那我们也可以通过一个插件来把它解锁,就是这个插件 好,把它部署。安装好之后呢,我们先退出我们的 codex。 好 的,然后通过这个插件启动之后呢,就可以看见我们的插件已经解锁了,快去试试吧,让你的 codex 更好用。

之前派藏绘图一般需要 p i 辅助修改代码,然后自己运行,现在我们尝试一下利用 codex 全程自动编辑代码并运行的结果如何?首先开启完全访问权限, 点击左侧加号开启计划模式,该模式可以先生成具体操作的思路,然后询问你的意见,之后决定是否继续执行。接下来上传我们制图所需要的要素文件,然后在对话框输入指令,这个指令尽可能的要详细一点, 以便他能够清楚你的具体需求。点击发送就可以解放双手等待出图了。这里我们进行快进 倒车请注意倒车请注意!倒车请注意,倒车!这个时候就是计划模式,弹出的对话框会询问我们的具体需求, 这里选择仅 png, 然后选择全部标注。请注意,倒车请注意!倒车请注意!倒车!这一步生成了一个具体的执行计划,如果没有问题的话,就在弹出的对话框当中选择继续执行。 请注意,倒车请注意!倒车请注意!这里他很聪明,新建了一个拍脏虚拟环境,为了防止影响到原来的拍脏环境,之后也会自动安装绘图所需要的库,之后就开始自动编辑脚本并运行 到这里,图片就制作完成了, 它会自动进行最后的检查。我们来看一下整张图,除了一些细节上的问题还是可以的,如果出现什么大的问题,比如坐标系不一致导致的错位,或者要素图例的位置摆放不正确,都可以继续在对话框当中向它提出,让它继续修改。 后面我也会研究如何让 codex 自己操作 art 及 js 软件来进行绘图分析并分享出来。今天视频就到这里,感谢观看。

hi, 朋友们,接下来我将分享一下如何使用 codex 来设计一个比较美观的网页。 我们可以使用一些 scale, 比如说是 get get 第三点 m d 这个网站上,这里面有很多的网站效果图来让 codex 来参考模仿。如果直接使用这个 网站去模仿的话,我们只能生成一些相似的风格,但是我们无法生成一些,比如说一些网站中的图片素材,这个时候我们就可以让 叉列 dpt 来生成一些设计稿,网站的设计稿,然后根据这些设计稿来生成图片中需要的素材,这样给我们的网站来提供更丰富的元素。 我是这么做的,首先我会在酷略斯里面首先跟他头脑风暴,然后想要得到一个想要的网站结构,包括这个就是一个阿斯玛,这个已经 整体上实现了一个结构,然后我直接把这个阿斯玛发给俏丽 g p t, 让俏丽 g p t 来生成一个这么一个的设计效果, 然后生成这个效果之后,我觉得是比较满意认可之后我再跟他发一句提示词,比如说请根据这些图片中的中的素材,让他全部 可以下载我的素材图片,然后他就会把所有的素材图片都给我,都给我切切出来,然后让他给我一个 zippo 包的地址可以下载,然后我就可以直接把它下载下来,下载完成之后我直接把它丢给我的 codex, 然后让他给我生成一个 html, 这个就是比如说他想想要生成的效果, 我们看整体符合还是比较蛮预期的。到后面生成完成之后,我再把一些细化的组建,让他在一个细化拆分,最终形成这个网站。

跑一整页 gpt 五点五加 codex 如何跑一整页?我这两天有一个感觉, ai 编程的下一步不是辅助编程,而是可托管的执行单元。 gpt 五点五真正的红利不是少写几行代码,而是把一个人能托管的工作块变大。有人给 gpt 五点五 codex 一 份新项目 prd 只说了一个 go, 他 就跑了几个小时,从 bill 到 visual review, 再继续补功能。 gpt 五点五的变化从更聪明改写成更能被托管。 g p t。 五点五不像以前的模型,需要你一步步指导,它更能理解你的意图后自己把活干完,包括构建、调试、跨文件修改。 g p t。 五点五在 codex 里强化了闭环自主性。 g p t。 五点五在 codex 里对高层次指令响应极强。 openai 的 norm brown 说自己明明是 manager, 但用了 g p t。 五点五以后,比过去任何时候都更像一个有效 i c。 他作为经理,却觉得自己在技术产出上达到了新高峰。 ai 编程这件事,好像开始从你在旁边指挥他写,变成你能不能把一块工作托管给他。这就不像传统意义上的在旁盯着一次次交互改的 ai 辅助编程了。代理式编程越来越关乎时间跨度,而不仅仅是单次智能。 当 codex 这种 agent 可以 连续跑几个小时,十几个小时,甚至官方展示到二十五小时以后,未来我们该怎么把它从辅助编程当成可托管执行单元来管理?这我觉得很重要。 这里面会有一种更大的变化,高级人类会越来越像经理加架构师加验收者的混合体。 大家应该有好奇怎么跑长任务,我时常的提示也喜欢让它跑得久一点,把时间跨度拉长的端到端的来验收。 许多人知道它能写代码,但不知道怎么让它把一个大任务跑完。早在 cloud code 泄露的时候,有人用 oh my codex 赶在天亮之前把它用 python 重构了一遍。据它所述,全程都是 codex 自主执行。 o max 系列还有 cloud code 属于是同一作者所做。 o m x 是 在给 codex 包一层长跑工作流和团队运行时,一句话丢给你的 ai 它自己装完。还有一个可能很多人听过的 superpowers, 它长跑不是靠模型硬扛,是靠方法论,把人类判断外质成流程。回到官方材料里,这件事其实更清楚。 open ai 今年二月发过一篇文章,叫 run long horizon tasks with codex, 里面有一个很夸张的实验, 他们给 codex 一个空 report, 一个任务,让他从零构建一个 design tool。 codex 用 gpt 五点三, codex 在 extra high reasoning 下连续跑了大概二十五个小时,大概十三米 tokens, 大 概三十 k 行代码。 这组数字很容易被拿来当标题党,二十五小时十三密 tokens 三十 k 行代码,一看就很爽。但我觉得这篇官方文章最重要的地方,反而不是这些数字。最重要的是, openai 把它为什么没跑丢 拆给你看了。它不是靠一句神奇 prompt, 它靠的是一套很土但是很工程化的东西。四个 markdown 文件,你得给它项目记忆, 你得给他计划,你得给他验收标准,你得让他在跑的过程中持续写状态,像是在给一个会干活但会忘事的人建工位、排日程,留工单做验收一位 gpt 五点二。早期实践者说 codex 诺任长跑会 do outcome, 需要 continuity guidance, 它的连续运行三小时且思路连贯的方法是下面这个提示词。另外我翻了一下 codex chain log, childgo 中出现 memory extensions、 window 等等相关变更。这些不是宣传剧,但它们说明底层工程也在补。状态恢复、审批上下文本事 越长跑越不像单纯模型,能力越像状态机。权限恢复和审计系统状态机有点不一样,它植入硬编码程序来支撑长跑,在一定时间还能清空上下文。这个值得聊,以后再论。 我看到 reddit 上有人问怎么让 codex autonomous 地跑几个小时,它的痛点很直白,它不想把 codex 当 chat assistant, 它想让它像 autonomous agent 一 样连续做 feature 或 refactor, 但现实是它坐一轮就停,等你继续说 continue。 还有人想让 codex cloud 并行处理四到五个任务,自己只 review code, 每个 runner 大 约每小时仍要人工 approval 一 轮,步骤有限,做完就 summary, 然后等确认 步骤塞多了又容易碰 context limit 或 compression。 cloud 有 时像黑盒任务卡住,但不知道为什么。 github issue 里也有类似的具体症状,用户想形成 continuous loop, 但 codex 每做一个小块就 report back 打断连续执行,最后用户只能 q 多条 continue。 跑 codex 的 关键矛盾不是模型能不能连续工作,而是人能不能在他连续工作的时候保留控制权、证据链和恢复能力。这就是为什么最近很多相关东西都在往智力层长。接着这里还有一些内容,你可以在原文这里阅读。 g p t 五点五是入口, codex 二十五小时是证据,但下一个问题不是它还能跑多久。下一个问题是,跑完以后你凭什么相信它? 如果没有状态机,长跑只是一次更贵的走神。如果没有证据链,睡醒验收就会变成开盲盒。如果没有熔断器,它可能会在错误方向上越跑越勤奋。 如果没有恢复包,你中途打断一次,下一轮就要重新考古好了。这里是 ai 进修生,持续分享前沿 ai 实践,如果不错,点个赞,关注一下,我们下期不见不散!

这是一条 check gpt 模型演进时间线,从会聊天到会完成工作。第一站, gpt 三点五,多轮对话进入大众视野协助界面,由此成型。 gpt 四,提升复杂推理 gpt 四 turbo 把长上下文带进产品工作流。 gpt 四 o 让文字、视觉和语音进入同一场实时交互 o 系列。打开推理分支,先分析问题,再选择工具,最后生成答案。 gpt 五把快打深思和工具调用统一到一个路由系统。 gpt 五系列继续前移,重点转向知识工作、电脑操作和编码代理。结论很清楚, check gpt 正从聊天工具走向真正的工作伙伴。

哈喽,大家好,这是我自己在 codex 里面做出来的一个宠物服装网站,从市场的调研、产品定位、产品图到最后完整的 html 网页,整个过程中我没有手动写代码,也没有来回切换工具,都在 codex 里面完成。 那今天我就用这个真实的案例,想明白普通人到底怎么把 codex 用到自己的创意想法落地当中。一开始我只是给了 codex 一个很粗的需求,我想做一款面向稀泥市场的宠物服装。 他没有直接开始瞎做图,而是先帮我做了非常清晰的执行规划,包括先找到市场依据,定产品的方向,再设计系列以及生成产品图。 这里就涉及 codex 第一个很关键的能力, plan mode, 也叫规划模式,如果要生成同款的计划,你就要把这个规划模式打开。这个模式很适合新手,因为你不是一上来就让 ai 去乱做,而是先让它把任务拆开,告诉你每一步要做什么,为什么这样做,以及最后会交付什么, 你确认方向没有问题之后,再让它开始执行。第二个能力是它可以在项目过程中持续地帮你检查问题,也就是要开启 auto review。 比如网页做完之后,他会检查图片有没有加载成功,按钮有没有溢出,表单字段有没有写进去。那遇到权限和需要选择的操作,比如三种执行方案中,你想选择哪一种,以及需要启动的本地服务访问某些文件之类的风险性操作,他都会弹出弹窗确认。 接下来就开始自动批量生产产品视觉了,通过调用 gpt 的 image 去生产产品图,并存储在本地的文件夹里面,方便我们去找原始的素材。 但是这里我也想说一句实话, ai 第一次做出来不一定完全对,比如他最开始给我的风格就比较普通,我觉得不适合当地市场的审美。 这个时候就用到了 codex 里面很重要的一个能力, steer 也叫做中途接管,可以在对话框中输入你不满意的理由,告诉他这个方向是不对的。比如我要更鲜艳的花朵,更适合女生,更有悉尼精品宠物品牌的感觉。然后点击 steer 去接管方向盘, 他按照我新的反馈去重新调研,重新调整产品系列,重新生成图片。这个过程就好像是你在和一个设计助理协助他负责执行,但是方向盘一直在你的手里。最后,我让柯黛斯给这个宠物服装的项目呢,做出了六个设计系列,每个系列三张图,佩戴的生活方式图, 一张产品的细节,一套平铺图。也就是说,不同于 j b t image 的 单张出图功能,它一次帮我规划并生成了十八张用于落地页的产品测试概念图。 那对于普通人来说呢,这一步就非常省时间了。图片定下来之后, codex 就 把所有的内容整合成了一个静态的落地页, 这个页面里面有品牌管理、产品系列卖点说明、尺寸指南。如果我觉得某个地方不顺眼,也不用自己去改代码,可以直接在预览页面里面指出问题,点击驱动批注,英文是 annotation。 比如标题太大,图片间距不对,或者是按钮的颜色不够明显, 那 codex 会定位到对应的代码并进行修改。这对零基础的人很关键,因为你不需要懂 html, javascript 也能把一个网页打磨到可以测试市场的程度。完成好之后就是这样一个页面了, 最后所有的东西都会留在本地项目的文件夹里,图片、网页、代码、素材文件都在里面,你可以直接在本地打开,也可以部署测试,用来收集用户的邮箱和偏好反馈。所以,如果你想测试一个产品的想法, 一个小众的品牌,一个服务的页面,一个预售的活动。以前你可能要找设计,找前端,找运营,找人写文案, 那现在呢?你可以用 codex 做出一个最小的可行版本,拿去测试真实的用户反应。如果你是 gpt 的 plus pro 或者是 business 的 团队账号,通常会有更完整的 codex 的 使用权限。 所以,如果你已经是 gpt 的 plus 会员,这个功能对于你来说是完全可以去免费尝试的。对普通人来说,它最有价值的地方是, 你不需要在一开始就花钱去找团队,也不需要把想法都停留在脑子里。你可以先用 codex 做出一个真实的页面,跑一轮反馈,再决定这个项目是否值得继续投入。谢谢大家。

曾经我对 cloud code 的 终端爱不释手,但现在我只能说一句, codex 真香啊,真香! 大家好,我是布鲁。随着 codex 近期频繁的更新,我自己的工作站也已经全面的切换过来了。今天就来分享一下我自己的完整使用经验,怎么用 codex 打造一套不打断心流的生产力闭环。 本期视频我把它分成了七个章节,每一张都是我自己实际在用的技巧,希望能对你有所帮助。那我们话不多说,直接开始 第一张,先来介绍一下我的工作站是怎么布局的。左上方是 codex 的 对话框,下方是 terminal 终端。 你可能会问,已经有 codex 的, 为什么还要开一个 terminal 跑 c c? 因为我发现对于一些需要探索、需要设计的任务, c c 的 表现要更出色一些。所以我的习惯是用 c c 来做方案设计,配合 planning with files 这个 skill, 把设计思路直接落成文件, 然后再让 codex 读这份计划,接手后续的具体实施。这样一来, cloud code 负责想, codex 负责做,两者可以各司其职。 右上方这个区域我用来做任务完成后的查看和审阅,比如代码的 review, 文件的浏览,还有浏览器都在这里。虽然现在浏览器还不支持多标签页,但对于日常的任务来说完全够用。这边我就分享一个实际的案例, 我让 c c 参考了最近很火的这篇卡巴西提出的知识库的文章,让他借鉴里面的思路,出一份设计稿和完整的实施计划。目的呢是做一套前端的页面,方便我日常的维护文档使用。 接着 c c 就 会调用 planning with file 这个技能啊,将所有的计划落成文档,然后我就会回到 colex 这边,让 colex 去阅读当前项目内的这份计划文件,然后基于这份计划文件让他进行开发。开发完结果之后,我会在这边 内置的浏览器里面去进行结果的 review, 包括代码的一个审查,整个过程从设计到开发再到 review, 全都在这一个工作站里面完成,不需要切换任何的窗口,这就是我前面所说的,心流不会被打破。 第二章,批注功能。这个功能是我觉得 codex 真正强大的原因之一,也是最能体现沉浸式开发的地方。 以前我们改代码的方式是找到文件定位到哪一行,描述问题,让 ai 修改,整个过程中你的注意力是在代码上的,但现在 codex 的 批注功能让这件事情变了,你可以直接在文件上进行批注,告诉他哪里怎么改,需要怎么改。 更厉害的是,现在这个批注功能不止限于代码文件,你可以直接在前端页面上进行批注,看到哪个按钮位置不对,哪块布局不满意,直接在页面上标出来, codex 就 能理解你的意图,并帮你进行调整。这件事的意义在于,正好对应了 webcodd 的 核心理念, 开发者的重心不在于怎么写,而在于写出来的东西对不对。批注功能把这个理念落地了。 第三章,上下文管理 codex 项目里可以同时开多个县城,每个县城对应一个任务,互相独立,不干扰。对比 cloud code 需要开多个对话窗口, codex 把所有县城都收在了一个项目下,管理起来会清晰很多, 然后是项目的记忆核心就是 a 键的点 md, 这个文件你可以类比为 cloud md, 把项目的背景、开发规范都写进去, ai 每次进来都会读取,不用反复的交代。 还有一点, codex 的 上下文管理非常省心,它会自动帮你压缩上下文,它也没有提供像 cloud code 中 compact 的 那样的命令,这种事情让 ai 自己处理就好了,你专注于任务本身就行。 第四张,自动化这块是我觉得 codex 比其他 agent 做得更好的地方,几个原因,第一,用起来非常的方便,直接在 gui 里面新建自动化任务,还内置了很多模板可以选择, 大到项目管理技术、眼镜,小到个人的生活习惯,都可以交给它来定期的处理。第二,自动化可以调用 codex 自身的能力,比如插件、 skill、 mcp、 浏览器操作、电脑操作等全都能用进来,这就是为什么我说 codex 在 逐步形成自己的生态。 第三,我们可以根据不同的场景来灵活的选择模型和推理强度,简单的任务用轻量模型,复杂的任务上强推理,这样的话头肯可以用的更加的合理。第四,稳定性,我实测下来, codex 相较于其他的 agent, 定时任务的准确性已经能达到生产级别,相当的靠谱。 第五张插件和技能, codex 有 相当丰富的官方插件和 skill 生态。先说说两者的区别, skill 就是 纯文档,本质是给一份 ai 的 说明书,告诉他在特定场景下应该怎么做事。比如说我前面提到的 planning with files, 就是 一个 skill 插件的概念会更大一些,你可以把它理解为 codex 打补丁,里面可以包含 skill, 也可以带上 mcp 配置,甚至集成其他的 app。 一个插件装下去, codex 就 多一套能力。 另外, codex 在 插件和 skill 的 管理体验上面要比 cloud code 的 友好太多了。 cloud codex 需要改配置文件,而在 codex 里直接在界面上点击安装,或者自己创建,整个过程非常的直观。 第六章浏览器和电脑操作 codex 可以 直接操控浏览器,你可以让它自动填表,抓取数据,验证 ui 效果。 比如我需要批量收集一些网页上的信息,直接告诉 codex 去哪个页面拿什么数据,它就能自己打开浏览器去完成操作,整个过程中都不需要你的介入。除了浏览器, codex 还能直接操作你的电脑文件的整理,应用的打开都可以交给它来处理,相当于有一个助手在帮你操作桌面。 不过这里要说明一点,随着 ai 自动化越来越普及,现在已经有不少软件开始加强安全控制,对自动化操作做了限制,所以实际能操作的范围会因软件而异,遇到限制情况也很正常,大家用的时候留意一下。 第七章通用功能这些功能不是 codex 独有的,很多 agent 都支持,但作为一个完整的工作站,这些基础能力 codex 当然也不会缺少。先说 play mode, 在 执行一个比较复杂的任务之前,先让 codex 把完整的计划列出来,你过一遍觉得方向对了再让他动手, 这个习惯能帮你省掉很多返工的时间,大任务尤其推荐开 play mode。 再说 m c p, 也就是模型上下文协议,通过 m c p 可以 把各种外部的工具和服务接进来,让 q d x 能力边界大幅扩展,无论是连接数据库,调用第三方的 api, 还是接入自己家的服务,配置好之后, q d x 就 能可以直接调用。 另外还有一点, q d x 相较于 logot code 的, 有一个非常关键但很容易被忽视的小功能,语音识别。目前我的任务几乎都是语音发起的,连打字都很少了。 ok 以上就是我在使用扣袋子过程中总结的一些技巧,如果对你有帮助的话,希望能得到你的点赞和关注。 最后我想说一句, ai 发展太快了,各家 a 键的功能越来越趋同,但工具再多,适合自己的才是最好的。有时候做做加法,找到真正需要的,做做减法,去掉用不上的,慢慢摸索出一套自己的工作范式才是最重要的。我是布鲁,我们就下一期再见。