粉丝29获赞120

codex 里有哪些好用的插件?别从名字开始,按任务来选。做网页验证,用 browser 和 chrome, 一个看本地页面,一个接真实登录态 做文件交付,看文档表格演示和 canva, 它们能把想法变成可检查的文件。 做视频和创意,用 react 写视频,一个适合 html 动效和字幕 做沟通和工程流程。看 gmail 和 superpowers 邮件代办调试测试都能接近同一个工作台。 最后的原则很简单,看你卡在哪一步,让插件承担最耗时,最容易出错的那一步。

设计师如何创建自己的题诗词网站?只需要两步,打开 codex 网站,将上面这段话输入对话框,等待一会,一个静态的 web 网站就搭建好了。 打开网址即可访问, 不仅可以复制提示词,也有资源概览,还可以按需搜索。是不是很简单,快快行动起来吧!

有了叉 gpt 和 codex 之后,你一定要试的五个功能,做 ppt、 做漫画、做动画、做游戏,还有养电子宠物这五个功能,今天我给大家一一的去演示一下,那视频可能略长,欢迎大家先点赞收藏,慢慢观看。 第一个做 ppt, 例如你看到了一个好看的图片,比如这张你可以把它发给那个 gpt, 就 在对话框里面,你让他根据配色和设计感,让他帮你出整个模板的设计方案,还有视觉的一些定位等等等等。你看这里,他把这个风格定义为流光花雾,我觉得就非常的准确, 他会把整套的色彩设计用这语言给他做完整的一个设计。哪些页,比如说有些是图标,有一些卡片,有些是引言,有些是结束,他会有一个模板的规划出来。 你看你看这里,我就忍不住说,你可以直接做 ppt 模板文件吗?他可以的,对,他直接可以在里面做可以 编辑的 ppt 文件,这个文件可以下载到本地,然后变成 ppt x 的 格式,你可以自由的去编辑,但是我觉得这个不够还原,于是我让他直接先根据严格参照我这个美学东西,再严格设计。 你看他这里非常的严谨,他先把各种的框架给列出来了,再去列色彩等等的,把草图用这种文字给他画出来,真的非常严谨。让我确认之后,我再让他开始设计, 在这里主要用到 p ppt 现在非常强的两个能力,第一个是图像生成,那这个我猜大家在各种地方也刷到了,它图像生成能力其实极强。那第二个它是能够批量去生图的,你看它一次能生成好几张图,我经过测试,它好像一次最多是能生成十张。 你可以一张一张的让他把这二十页模板的素材都做出来,或者直接在一张图里面把所有的版式都做出来。比如说像这里把一张图里面把所有的版式都做出来,你确认之后,你让他再开始设计,那中间可能需要微调,但我觉得这个最后的还原效果还是挺不错的。 你看它最后还原,你看它效果什么的都挺不错。你下载到本地就可以进行编辑了,做成可以编辑的 ppt 文件,在这里直接可以下载。那我记得这是海外预藏家里面唯一一个能在对话框里面直接生成这种 美学感极强,又能直接编辑 ppt 文件的,这 gpt 现在还是比较的良心。第二个是做漫画,这里你看你可以找到一段小说的剧情,或者任何你自己写的,都可以 把它发给 gbt, 让他去帮你设计整个漫画的方案。你看他会从每一页怎么设计啊,文案什么,画面是什么啊,分清重点是什么的,让他就可以进行一个设计。 那这里我先跳过中间的部分,他同样是可以给你批量生成,你确定一些风格之后,你让他批量生成。在这里我做了一些例如这种国风的美男型的,这个是一个小说人物,把它做成了,我感觉效果还是很不错的, 前几页可能偏洒脱,对,后几页开始逐渐觉醒,他会有一个情绪的递进,那这个其实他在画面还原上也会体现出来,到最后几页就会变得很帅很燃,你看他放一些大招什么的,你还可以让他继续设计, 他一次是能最多生成十页,就跟图像一样,他一次能生成十页漫画。但比如说你要让他更严谨点,逐页生成更严谨也可以更好。 那这个是比如说国风的,还有其他风格,大家可以去试一下,比如说这种可能 p 的 比较乱的,这种黑白,这种彩漫风格、泼墨风格的都可以生成, 效果真的都非常好,非常的帅。第三个是做动画,那其实刚刚开头这个动画其实就是 g p t 给我做的,你看这是我在它的浏览器里面,那这里主要用到两个 skill, 一个是 hyperframes, 那 这样的 skill 可能大家在其他地方都刷到过, 那现在 gbt 是 直接在它官方的 codex 所说的 codex, 它的官方的插件市场里面可以去安装,到我这里给大家演示一下。 大家在这个 codex 的 插件市场里面,在底下这一栏下面就能找到 remotion 跟那个 hyperframes 两个插件,你直接在这里一键就可以进行一个安装。 这两个 skill agent 其实是在很多的 coding agent, 比如说 oracle 或者 jimmy, 什么 anti gravity 或者是 c r 页面都可以用。 但我自己体验下来,我觉得现在 codex 的 可能由于 g b t 它的智能水平非常的高,我自己形容下来非常的省事,而且做出来效果非常好,反正是比 jimmy, nike 要好。如果说大家现在用不了拷 codex, 由于各种各样的原因,可以尝试用 codex 去做一个平替,试一下 他能做什么样的动画,他真的我觉得他什么都能做,我们现在看 remotion, 这就是 remotion, 比如开头这个动画,这个凯片弹出的动画就是他给我做的,还能让他做什么?比如说这个演示是 full 架构,这个可能是一个 ai 的 一个底层的一个架构,普通人我自己反正是不懂,让他去给我设计一些这种很好玩的动画去呈现, 他能图文动画方案什么的自己去全包了设计,你看他就一段能解释清楚,包括你让他做一些,比如说太阳系运行的一些动画,他也能简单做出来,包括一些这种产品演示的,或者是 logo 图形的动画,也可以试一下。对,第二个就是这个 hyperframes, 他 同样也是,我就给了他一句话,你说你帮你,我就跟他说你帮我演示一下人类进化的简史, 你看他做了一个很高级这种,你看从一开始的这种啊,土风火种,到后面我们开始进入农耕文明,到后面我们开始有社会,开始有组织,开始有体制,还有帝国,有宗教什么的。你看他简简单单就写了一个这种 东西,你看你直接拿去录屏讲解,或者是直接做成视频发布,都非常的成立。第四个是做游戏,但首先 codex 里面有内置一个很强的一个插件,它叫根 studio, 我 的理解就这里面其实打包了非常多的那种 很专业的那种游戏设计的经验思路,还有各种游戏的原型等等。首先你一句话就能设计像贪食蛇这样的简单的这种网页游戏,你看这是一个贪食蛇,他死掉了,你看杰杰在这里就可以玩,他是一个完整的一个贪食的游戏,还是一个霓虹风的,这个你可以自己去定义风格。 对,如果说你不满足于这种即食的一个比较简单的游戏,你还可以通过例如说先设计游戏资产 在做比较复杂的游戏,比如这里我让他先又让 gbt 在 兑换往里先给我设计游戏资产,比如说这里有敌人狙决,动作环境等等, 那主要是为了省一些这个 codex 的 额度,你再回到 codex 里面,让他给你设计根据本地的资产什么的游戏。在这里我做了一个横版过关的这个类恶魔城的游戏,给大家演示一下,功能也非常完整,可以上下左右跳,还可以攻击,有小怪, 对,有远程的小怪,有近战的小怪,还有狙盾的小怪,就会射击有点难,我自己都有点打不过。对, 好,这个是做游戏,你看他同时刷新就可以,他有复活的二人跳什么的,对,算是一个完整的一个游戏。最后一个我们回到做电子宠物,那这个其实我相信,如果大家玩 coco 的 可能有发现,那 coco 可能当时没有去认真的做,现在我碰一下他做了 这个宠物有两种玩的方式,第一个你可以用官方自己的宠物,你看这里,你看在大家进到这个设置, 在外观往下滑就能找到它给你内置的一些就能找到那内置那个选择。对,它内置挺多,你你可以再随便选一个开始点,比如说我们刚选过这一点唤醒宠物,它就有这样,这个宠物它是两个功能,一个是说它能显示 codex 的 状态, 你看他自己在跳,他可以显示口袋的状态,如果说完成一个任务或怎么样,他就会跳出来提示你说口袋已经完成任务, 如果说你不满足于这种口袋是给内置的宠物,你可以自己去设计,你可以让他,比如说我就让他给我设计一个兔子形状的这么一个宠物,让他冒出来他会有,你看他也可以自己进行一个拖动,他有这种情况,你可以喂食,可以摸他,可以让他睡觉,让他叫醒等等等等。还有几种状态 你都可以去设计,同样也是说先设计这个动物自己的游戏的,不对,不是游戏就动物自己的动画资产,你看这里有再把它变成动画的功能等等,这就是今天想给大家介绍的五个功能,有一些可能需要去开动 plus 才能体验, 然后总之大家就去玩一下,非常好玩,尤其说我的扣带,可能现在真的很好用,刚跟进什么的,谢谢大家,我是 coco 二。

针对乙方视频工作者,更加实用的 ai 一 键从故事大纲生成单帧图和视频的工作方式,完全解放了繁琐的逐个单帧图生成图的步骤,其过程完全自动化。首先,你的电脑上需要准备一个前端可操作的画布或者是 comui 这样的开源画布。用 comui 的 优势是 comui 的 工作流本质是一个单独可以编辑的 json 文件,直接从原文件进行编辑,可以给 codex 节省大量的 token, 出错的概率也更低。其次,你需要一个闭源的 ai 画图模型以及视频模型。 经过我的实测,开源模型除了在特定场景可以参与写作,并不能承担起商业广告以及宣传片的需求。你可以只在高清放大或者是宽音模型二五幺二转换视角的时候才使用到开源模型。 将闭源模型在康发域外中调用也很简单,你只需要将服务商的 api 文档为给 codex, 它就可以直接编辑对应的可以在康非域外中调用的节点,并且一键帮你放到康非域外的目录下。具体的提示词我会放在评论区。 将一切准备好后,最核心的部分就是将我纯手打的这段提示词喂给 ai。 其工作流程就是先根据故事大纲或者甲方提供的脚本,丰富成拥有详细画面信息的给 ai 阅读的视频脚本,包括画面详细信息、文声图提示词完善、图声、视频提示词完善。 ai 拿到这个脚本后,就会在 comui 中创建相应的工作流,因为 comui 的 单个节点不能互相组合成循环体,属于有向无环图。如果要在 comui 中实现循环, 只能通过将代码写入单个节点作为黑箱模式进行运行,这肯定不是我们想要的,所以我们让 codex 来直接创建需要的生图节点数量,并且根据是否需要参考图进行图生图安排。 这里我们可以看到 codex 非常智能的分辨出了这个脚本中需要持续出现的物品和场景,提前生成了这些需要贯穿剧情的场景和物品图,以此来保障后期视频中的画面一致性。当生图的步骤执行完成后,这个工作流会让 codex 将生成的需要用到的单帧图自动的贴回 excel 表格中 机按照镜头号打包成一个原图无压缩的文件夹图包形式。可以看到这个恐怖短片的案例场景一致性还是非常不错的,基本没有什么 bug, ai 自动分镜也顺畅合理。我目前因为没有升视频 api, 所以 还只做到了单帧图步骤,观众们可以根据自己的需求将其再细化成首尾帧, 或者是完成后面的生视频步骤。但是根据传媒行业的实际案例,做到这里就够了,因为实际项目中肯定还是要把单真图给甲方审阅和修改的。这个项目中需要用的的提示词晚些时候我会捕捉到 get up。 如果认为这个视频对你产生了帮助,可以给我的视频点个赞,谢谢各位的观看,再见!

大家好,我是小刘,一个技术相关从业者。最近一周, openai 在 codex 桌面 app 上线了 pets, 我 们 levelify 网页里也上了一只桌面宠物,封面看起来都是猫狗,但能干的事完全不在一个量级。 今天三分钟把两边公屏对比,你看完知道先用哪个?先讲 codex, 它是一只浮在你电脑桌面右上角的小动物。 openai 出的跟着 codex 跑代码的进度洞, 八个默认形象敲斜杠。 hatch, 还能让 ai 给你画一个新的任务,跑完它会喊你,等你输入它会眨眼, 本质是让 cli 跑代码不再是黑盒。再讲 livify 的 桌面宠物,它住在浏览器里,长在 livify 网站每个页面右下角。五种心情会换形象,开心、犯困、工作、警觉、闲。 但这只宠物最大的不一样,不是表情多,是你点它会弹菜单,菜单里能直接让 ai 干活,一项项比先比视觉 codexbatz 这块儿银,八个默认,加上 ai 当场画一个新的 levera, 现在只有五种心情,自定义,还得自己改, 但 levera 的 心情切换是真的。看你状态,五分钟没动鼠标,自动困了,任务完成,自动开始庆祝。 一个赢在多样化性,一个赢在真的关心你,再比关键的能不能干活。 codex pets 是 一只告诉你 codex 在 干啥的小动物, 它只展示,不操作。 level five pet 不 一样,点它弹菜单,菜单里有跑这个技能。建一个任务,看我今天的安排。点一下 ai 就 在后台动起来。 这是因为 live fire 服务端有撤销审计、限速三到护栏,让宠物敢替你按按钮,所以不要二选一,你在终端写代码,开 codex pets, 让它喊你 codex 跑完了。 你在浏览器用 live fire 处理任务,跑技能看通知,让 live fire pet 替你按按钮, 一个负责终端桌面伴侣,一个负责网页应用中输。两边都装 ai, 不 再让你扑空,也不再让你重复点两件事,第一, codex 用户禁设置,把 pet 打开或终端里敲斜杠 pet。 第二,打开 level five, 点 c n, 每个页面右下角都会有 level five 桌面宠物,点它弹菜单试一下。两个都装 ai, 不 再安静地跑完是不告诉你下一期 level five pet 五个关键时刻。

这条视频用一分钟讲清楚 i d 如何配合于 berema 把一个想法变成可渲染的视频。第一步是把目标说清楚, 你可以告诉我的,我要中文讲解横屏比例、技术感、风格,需要旁白和字幕。 i d 会把这些拆成脚本,视觉规范和分镜结构。第二步于 berema 把当做视频源文件,画面、字幕、代码块、 时间轴和动画都写在中波 seed 里,则负责运动大大属性,负责每个片段什么时候出现。第三步, oda 会边写边检查,拎检查结构, inspect 检查文字有没有溢出画面, but will 让你在浏览器里看时间线效果。 最后一步是渲染 yebiramis 把这个中波 seed 捕获成色,也就是说你改代码就是改视频, 尼跑命令就是生成成片。总结一下, ode 负责理解目标生成内容修正问题, yabras 负责时间轴、动画和导出,两者合在一起就是一个可编程的视频制作流程。

只需要给一个 ip, 就 能一键搞定品牌视觉界面设计、活动页面等,并且生成的界面可以直接导入贝克玛进行编辑。哈喽大家好,我是派大仙,因为这都上线有一段时间了,全网都在缺的天花乱坠。 然后我也实测出一套工作流,直接让它生成高质量的 y 界面。所以本期我将从零到一,带大家去搭建这套工作流。 首先打开 loft, 拖入我们的吉祥物和 logo, 输入这段提示词,然后模型这里关掉,自动勾选这个 image 二 o 图模型,点击生成 loft 的 agent 会根据我们的 logo 和 ip 生成一套详细的视觉品牌手册。这一步的目的是为了后面生成产品界面有更好的参考物料。 然后新建一个图像生成器,把我们的规范和 ip 加进来,把模型切换为 mh 二,比例十六比九。最重要的一步,找到想要的风格界面图,拖入进来。 因为目前 ai 对 ui 界面的美感理解几乎为零,所以这一步的目的是让 ai 有 更好的生成参考方向。输入这段提示词,即可根据参考图和 ip 规范生成符合预期的图片。如果没有参考图, 提示词写的再好,生成效果也是类似这样,或者这样永远也达不到想要的效果。通过这个方法,可以快速生成多种风格的界面,直到找到自己想要的风格。也可以通过这种方式生成运营活动页、 app store 商店图等等。 回到首页,进入品牌套件页,将刚刚生成并确定风格的品牌图和界面图全部拉进来,就会根据图片生成一整套可附用的品牌 e i。 然后打开项目, 输入 id, 引用这套品牌套件,就可以在这个基础上进行界面延展。你也可以画好界面原型,让他根据了你的原型图进行生成,出来的界面布局也几乎跟原型一致。 也可以根据品牌套件生成海报 ip 还是保持一致性。点击编辑元素,可以分解海报上的元素并进行调整。如果字体文件丢失,你也可以截图对应的字体,然后打开字体生成器, 粘贴截图, ai 会自动分析并生成字体文件,将字体切换为我的字体即可使用。 把生成的界面图拖入 figma, 打开这个插件,选中界面,点击生成,即可将界面导入 figma 并进行编辑,出来的效果还原度还行, 不过在一些复杂的图标效果会被当做切图显示,只适合导入一些简单的界面,所以我们要用到另外一种方式导入。打开任意一个 ai 编程工具。这里我推荐使用 codex, 因为它支持调用 image。 二、生图。拖入生成的界面图和吉祥物,输入这段提示词, 它会先分析界面内容,并对吉祥物进行单独的切图引用,然后打开生成的 html 文件,可以看到出来的效果基本与界面一致,并且生成的界面还是可交互的。然后使用我之前分享的 web two figma 插件,导入到 figma, 可以 看到整个页面都是可编辑的,图层也做了自动布局, 并且吉祥物都进行了分层处理,相比插件导入的效果会好很多。好啦,整道工作流分享就到这里啦,我也把所有提示词都整理到文档了,有需要的朋友可以直接来找我拿,关注我,带你解锁更多 ai 体校技巧!

大家好,今天用一分钟讲清楚 codex 的 plug in 功能。你可以把 plug in 理解成 codex 的 外接能力槽。 browser 负责打开网页和本地预览,帮你检查页面效果。 imagegen 负责生成封面背景和分镜素材。 harp frames 负责把 html、 字幕、音乐和动画合成为视频 remotion, 提供真驱动的视频工程思路,让动效更稳定。 gigop 插件则能查看议题、拉取请求和持续集成结果。 实际使用时,先说清目标,再给素材约束,最后让 codex 调用插件验证并交付结果。这就是从会聊天到能完成工作的关键一步。

codex 做 ppt 已经进化到这种程度了吗?这是 codex 制作的一个效果啊,非常的不错啊兄弟们, 其实非常简单,就三步,第一步呢,把我们的文章和这段提示词上传,它就会去解析里面的内容,并且给我们生成一段大纲的点 m d 文件啊,我们在这边可以看到第一页封面,第二页研究背景,第三页研究问题,第四页整体思路啊,一直往下 它都它都会帮我们生成好。然后第二步就是让它基于这个点 md 文件生成一个视觉方案,然后我们可以看到在这啊,如果觉得这视觉方案 ok 的 话,我们进行到第三步,就是让它基于这个视觉方案帮我们重新设计一套新的 ppt, 这就是一整个的完整效果啊。 那它目前有一个比较大的问题,就是说它本质是一个点 png 的 图片,然后它是不可编辑的状态,下一期教大家如何把它变成可编辑的。

之前 ai 做 ppt 最让人头疼的就是排版乱,审美差,内容不成体系。但这套论文答辩 ppt 是 用 codex 加 gbt image two 自动生成的, codex 负责读论文拆结构, gbt image two 负责生成高质量的页面视觉, 我现在直接演示完整流程,看完相信你也能够复现。首先我这里准备了一个答辩 ppt 的 文件夹,里边有一个大论文 的文,还有一个校徽,作为一个视觉的参考。那接下来我们在 codex 添加新的项目,使用现有文件夹, 然后选中刚刚的答辩 ppt, 打开,这样的话,这个新绘画的所有的上下文就跟这个答辩 ppt 这个项目做了关联。那么接下来给它输第一段提示词,就是提炼 ppt 的 结构,让它生成十八到二十页的大纲,适合八到十分钟的答辩。最后输出一份 md 文档, 那我们这里选的是 gpt, 五点五智能选超高,然后速度就按标准就可以了。 ok, 我 们给它发送,然后我们稍作等待, 这里出现了读取 pdf 的 技能,那如果没有这些插件的话,去把它安装一下,当然默认它好像就是安装的,我也不太确定。比如说 documents, 如果没有安装的话,你把它安装一下插件,那插件里边还有一些,呃,做 ppt 的 这个 presentations 这个插件,还有做表格处理表格的这个插件,这些可以去安装一下,点一下就可以安装了,很简单。那我们再等待它一下, 经过三分三秒钟的等待,这个结果是生成了,我们可以点这个悬浮的这个框,点开一下这个 md 文件,里边就是大纲了,大概是二十页。 ok, 大 体看上去没有什么问题。那我们接下来给他第二段提示词,然后让他确定一个 ppt 的 风格。 这里需要注意的就是,我们必须调用他的一个技能,叫我们使用 at, 然后 image 这个技能,这个技能是他可以直接使用 gpd image 来生成非常逼真的那些图片。呃,里边的一个字都不会错的那种,大家都刷到过那种图片估计。然后我们让他生成 这里给他说,根据学校上传的 logo, 啊,不对,根据上传的学校 logo, 也就是当前这个文件夹下不是有个 logo 吗?他会参考这个视觉元素去生成一套方案。 ok, 又经过三分二十四秒钟的等待,他生成了视觉方案,大体上看还是符合屈服蓝大学调子的,看上去没有什么问题。不过呢,这个东西有点像开盲盒,我刚刚又在另外一个绘画里边让他生成了一下,这个看上去就更有那个学术味。 呃,所以说呢,跟提示词也有点关系,然后跟这个东西生成它本身都是随机性的嘛,所以有点想开盲盒。那既然这样,我们就继续这个再继续做吧。然后我们下一步就是参考,让他参考上面的这个视觉方案和 md 文档,就是这个答辩的 ppt 结构,然后使用 image 键技能。这里必须要艾特一下 image image 键 图片生成技能,生成全部的 ppt 页面,最后拼装成一个大的 ppt 演示文稿,然后让他起用演讲者注视,然后注视里面添加备注。嗯,不要添加任何的元素,然后避免破坏 ppt 的 图片,我会这样让它生成。 那在生成的过程中呢,他还有所顾虑,有点谨慎,他说容易出现错字,也就是生成的那个图片容易生成错字。他提了一个更稳妥的做法,就是生成到视觉图片作为视觉追踪,然后用程序渲染成 png。 但是我直接给他说,哎,不会出现错字,大胆的生成就完了。 这样的话,它生成的二十页资产最后全部都会完整的保留,不会再那个出现可以编辑的文字了,这样的话视觉完全统一,它最后只会在答辩的那个演讲的注示里边添加文字, 这样它现在正在一页一页的生成。 codex 现在的用户体验已经和 cloud 的 桌面版差不多了,你看这里也有这个进度显示,这边点开之后也会有资产的显示,这里是这个实时进度,这里是生成的一些结果 本身。虽然他是面向程序员提供的产品,不过他现在越来越像一个超级的终端啊,不是超级的那个智能体,面向普通人也可以用了。你看在他的设置里面打开设置,我们可以选中这个适用于日常工作的,如果你是不是技术人员的话,你可以选这个模式,那他会回复的过程中会少一些技术性的话语,这样的话看起来更纯净。 ok。 经过了四十三分钟之后,终于生成了 ppt。 它生成慢的原因主要是那些图片一张张的特别慢,我们打开这个缩略图先看看,哎,看上去没有什么问题,视觉上比较统一。那我们继续使用 wps 来打开这个 ppt 看一下啊,看一下,第一眼看上去这个字什么的都没有什么错。然后我们先看一下缩略图,看看整体是什么样,一个感觉 整体上差别也不大,整体的视觉元素,视觉语言保持的还是比较一致的。然后我们看一下细节,第一个问题就是我看这个 logo 好 像有点问题,不过这也好处理,直接把那个 logo 图片导进来给他盖住就可以了。下面这些基本上是没有什么要改的,直接来自论文里面,然后他还生成了备注,这底下有批注啊,这底下有备注,到时候可以照着读的。 然后我们翻一翻,翻一翻大概就是 logo 是 最大的问题,其他的都问题不大,没有什么错别字,哎,这里代码什么都是能做表,然后这个图,这个图表也非常的 nice, 然后这个也可以,都是比较可以比较,可以可以用 哦。我发现还有个问题,就是屈服师范大学底下这个白描的图也有点不对,这不是屈氏大典的元素,不过这个也好解决,让他单独再生成一下这一页就可以了,可以让他给他一些参考,给他一些图片作为参考,让他知道真正的屈氏大的那个图片,然后参考可以生成更逼真的白描, 那整体上就是这个过程。我们最后再来总结一下,我们看一下这个绘画,整体上就是这一个绘画。首先是在这个项目里面有个答辩 ppt, 里边给他提供了我们的完整的论文,还有一个 logo, 学校 logo。 然后第一步要求他生成 ppt 的 大纲,这个大纲就是在这里, ppt 大 纲生成完了之后,我们再让它形成一套视觉方案,参考 logo, 或者说你给他提供更多的一些视觉参考,然后它生成一个视觉方案,生成之后我们再让它参考视觉方案和刚刚的 md 文件,就是大纲,再用这个生成图片,一页一页的生成 ppt。 呃,生成完之后,最后拼成了一个大的 ppt, 那这样的话就完成了整个 ppt 的 生成功。不过这样有问题,就是生成出来的 ppt 你 是没法进行编辑,毕竟它都是一张张的图片。那好在它生成图片比较准确,没有什么错字的问题。如果有简单的一些元素需要覆盖,你像这个 logo 可以 直接用 logo 给他盖上去,真实的 logo 给他盖上去。还有最后这张白描,如果有问题,可以让他单独生成这一张。其他的你像这些图标什么的图标什么字都是没有什么问题的,都是没有问题的,直接就是参考那那个论文里面那些直接读读过来的。 ok, 那 今天的内容就到这里了,如果大家有什么问题的话,可以在评论区聊一聊哦。


如何设计一套优秀的视觉检测方案呢?我干了十几年,今天关起门来和你说说里面的门道。在设计视觉检测方案之前,最重要的一步不是选设备,而是明确检测需求。一定要客户回答以下几个关键问题。 那在电子产品生产中,常见检测内容会有哪些呢?像我们做视觉的,只有清晰的定义好检测目标,才能定制出优秀的检测方案,从而才能给产线提高检测效率和降低人工成本,不然就会困在客户今天叫你来一下,明天叫你来一下的死局里。

家人们,我们一直都做错了,只要在你的提示词加上一句话,就能让你思考效率提升十倍以上。别再用 markdown 跟 ai 沟通了,那完全是错的。 ai 大 神 carbaby 指出,原因有三,第一,人的理解效率差十倍。 markdown 是 单车道土路,你在大脑里还要翻译 h t m l 是 视觉高速公路,你的理解效率直接翻十倍。第二,浪费大脑带宽。咱们人脑天生是视觉动物, 三分之一都用来处理图像,用纯文字等于自废武功。第三,阅读分工错误。 markdown 是 给 ai 看的, html 才是给人用的,让 ai 直接生成为人优化的视觉结果,这才是正确分工。所以现在就去把你的 prompt 结尾加上用 html 格式回答。

这是我用 gauntax 一 键生成的视频, 这个是蜘蛛的教程,一键就可以出片, one two three four。

大家好,今天我们讲解卷材视觉检测中最容易被忽略,但直接决定成败的核心光源系统。 很多客户反馈设备漏检误报,百分之八十的根源都在光源,没有选对。首先卷材检测主流光源分成四类,明场、暗场、背光、同轴。 明场光源适合检测普通表面,靠反射光成像,但高光反射材料,比如铜箔、铝箔会产生镜面反射,直接导致图像过曝,缺陷被淹没。 这个时候就必须用暗藏光源了,它以低角度入射,只接收缺陷的散射光,背景全黑,缺陷高亮,完美解决了反光问题。 对于透明或者半透明材料,比如光学膜、电池隔膜优先,就选用背光光源,靠透色光凸显针孔裂纹,检测精度可以达到微米级。而同轴光源则适合微小划痕,脏污能消除影响,保证全幅宽,成像均匀。 其次就是波场,选择了金属材质的,我们选蓝光,穿透力比较强,薄膜选白光,还原真实色彩。高光场景呢,就可以选红光,抑制反光干扰。 最后,光源的稳定性必须控制在正负百分之五以内,否则会出现明暗条纹,直接影响算法的稳定性。 我们的设备使用是工业级高亮来离低光源,配合智能亮度闭环控制,能在零到百分百亮度下稳定输出,适配每分钟一到三百米的高速产线,从源头保证质量的检测精度。