哈喽,兄弟姐妹们,我是黑胡子,今天咱们来聊一个比较有意思的话题啊,不知道大家有没有发现,黑胡子好像是全网唯一一个啊,把这个 open i 这个产品读叫 codex 的, 好像其他所有的博主有一个算一个,好像大家都读的叫 codex, 对 不对? 首先这里先澄清一下啊,黑胡子是素质教育漏网之鱼,学历比较低,我印象中好像我从小到大英语没有超过六十分的。好像是啊,但是有网友说你学历低,你就不要出来讲。 no no no, 这我觉得我觉得平台没有这个限制啊,平台没有限制说啊,英语读错了或者学历低,你就不能来拍视频对吧? no no no no。 第二点呢,就是黑胡子这个态度有问题,这个要讲某个技术点的时候呢?啊,没有,先去国外调研一下 对吧?啊?没有先去,比如说像去什么 youtube 是 吧?啊,没有,先去 youtube 上面去搜一下,看人家老外怎么读的对不对啊?你看一下人家怎么读,你就跟着怎么读不就行了?你管他啥意思啊?那大家都这么读,你就这么读不就行了啊,你跟着大家就不会犯错,不需要你有自己的想法。 另外呢,黑胡子也去谷歌翻译上搜了一下,搜出来的这个结果呢?啊,第一是手抄本古籍, 还有一个是要点法点啊,密集圆点,就是在这个 open ai 出这款产品之前,这个单词是以上三个意思。 嗯,它也确实是一个单词啊,读音也确实是 code, 翻译过来是法点。法点就是 open ai 搞了一个编程产品,然后这个编程产品它的翻译是叫法点 这秘籍,这是什么阴谋论吗?这是 openai 要用这个产品来去统治人类吗?如果是以黑胡子这个低学历的理解来看啊,我是建立不了这个关系的。 如果按照黑胡子自己的理解的话,我想这首先这个产品呢,它是一个编程产品,这个是我想是大家公认的哈, 那 x 呢?就像埃隆马斯克的 space x x a i 一 样是吧?本身代表了一个先进或者是神秘或者是持续探索的那么一个意思。那我想如果把这两个组合在一起呢?哎,在黑胡子这颗低学历的小岛里呢,它就能建立一个 哎,比较符合逻辑的那么一个关系。所以黑胡子自始至终啊,就认为这个单词应该念 code x, 这样的话比较符合我的逻辑。 但是呢,我这个发音啊,让很多朋友感觉到生理不适,对吧,这个我本来也没想到影响这么大,所以呢,这里给大家道个歉啊,以后我还读 codex 对 吧?看不惯请你滚。 那些说什么发音问题的是吧,如果你国籍是美国,我无所谓啊,如果你是咱国内的用户,对吧?那些装逼了啊,请告诉我啊,你有没有用了这个数据库, 是不是好告诉我你在生活中怎么读他的? ok? 有 没有用过反向代理,好告诉我生活中怎么读的?反正我在生活中从来没见过有人 按照老外的读法去读这两个单词的啊,无论你是年薪百万的什么工程师啊,还是什么 cto, 至少在现实生活中, 我很少见到有人把这两个单词读对,我只见过一个老师啊,他是非常老,他大概二十年工作经验 啊,我只见过他把这个单词读正确了,其他在生活中我没有见过读正的,其实我觉得这些都无所谓,我觉得这些单词你读对读正确其实无所谓,没有什么关系对不对?他耽误你挣钱了吗? 是不是啊? open color 怎么读有关系吗?啊?他,他影响我在闲鱼上帮人家装 open color 挣了十万块钱吗?没有对不对? 不知道大家对这个问题怎么看,欢迎大家在评论区下面的啊,和黑胡子 battle 没有关系,无论你在下面怎么评论,也影响不到黑胡子的日常生活对不对?我后面还会照样的读 codex。 当然了,既然选择做自媒体博主,黑胡子后面还是会尽量 符合官方的发音,然后减少一些不必要的误会。黑胡子选择做这个自媒体啊,最主要一个目标,或者是我的一个使命是想让 普通人也能享受到 ai 编程的乐趣。我希望大家千万不要认为编程还是程序员的专属技能,在 ai 时代,人人都可以通过 ai 编程来去开发自己想要的做。后面黑胡子计划把自己线下讲了五期啊卖三六九九的 ai 编程课, 拆成大概一两百集的这么一种系列形式,然后放在我的频道下面,不管有没有流量,不管有没有人看,我都会去做这件事,这就是我做自媒体的意义。
粉丝1502获赞7372

这个谷歌邮箱最近总要盘你那个要你用国外手机的,或者让你发那个外国国外手机验证码的这种,兄弟们,我教你个办法啊,用那个谷歌 那个苹果手机打开那个谷歌浏览器,用无痕模式就可以直接这个创建谷歌账号,酷狗叉的话不得用这个谷歌登录的话 比较方便一点。然后呢,就用苹果那个无痕模式注册完这个谷歌账号啊,他如果说他有个需要手机号的,你就可以填国内的没没有关系啊,填国内的他这个手机号你也能正常访问, 你也能正常注册这个谷歌账号啊,谷歌账号,然后呢,你再你再用谷歌账号去登录 这个 qq 叉就可以了,一定要打开无痕模式,然后呢?要不然还是注册不了啊,挂载好接电以后用无痕模式肯定能注册的,如果说需要你国外的手机,咱肯定是没有,是不是啊?如果说他有的有一个是什么呢?让你 用你手机收个验证码,你就填国内的就可以,不影响你使用 qq 叉啊啊, gdp 啥的都可以正常使用。

好,我们一起来看一下 codex 呢,在五月八号进行了一次最近的更新,增加了一个昆姆扩展的插件,那这一次呢,我们一起来看一下这个插件和相比于其他的方式去操控昆姆有什么区别?好,我们直接点击这个电脑操控这里呢,大家可以看到这个会有存在一个 啊昆姆插件这么一个选项,就是我们点击管理可以看到增加了非常多的配置,比如说像权限历史记录下载上传,那这里呢提供了非常丰富的这种权限控制。嗯,我们可以通过 安装这个插件和 codex 呢进行建立关联,这时候可以看到我们的这个 codex 呢就连接上了当前这个浏览器,那出现了这一个绿色的图标,就说明我们的 codex 呢已经可以完全的托管这个浏览器了。那我觉得这是 codex 呢像全自动操控浏览器迈出的一步哦, 我就挺有趣的,所以今天给大家做一个分享。那如果你把这个开关打开之后呢,接下来呢我们就可以直接去操控了,但是你会发现一个小细节,就是如果你是在国内的环境下,你就直接点击这边去打开呃,安装插件的界面,你会发现这个商品并不能够安装,所以大家呃可以通过我提供的这么一个压缩包去进行补充这个 啊插件,好吧,呃,我们来往来看啊,首先我们来看一个很容易被大家混淆的东西就是,嗯,目前 codex 本身来说是有浏览器,那他操控浏览器和我们的这个插件有什么区别呢?比如说我们在这个 codex 中使用软件到一般是这边新建一个窗口,在侧边会有一个浏览器的选项,那其实这也是我们的第一步,就是我们的这个呃, in app browser, 这是我们的一种内置浏览器,它本身来说是用来调试的,用来开发的,所以和我们 这个插件更新是没有任何关系的,所以大家不要搞混了。那第二种呢?叫做 browse user, 这个是用来操控类似浏览器的,这是相当于前面的这个 in app browse 呢,又往前走了一步,比如说我们在这个设置这边呢,哎,去又往前走一步,这有一个,这个什么有一个啊? browse user, 它可以让呃我们 的 codex 呢去操控这个类似浏览器,去完成一些操作。好,那也就是第三种呢,就是我们刚刚现在讲这种叫 chrome browser, 它可以帮助我们进入真实浏览器状态,去操控我们整个浏览器。 那有小伙伴说了,那其实我的这个 pry white mcp 也可以操控浏览器,或者说我这种外置这个 computer user 也可以操控浏览器,那和这个有什么区别吗?而且区别很全面,对吧?呃,区别的话,呃 computer user 呢?它本身来说它并不是浏览器的插件,对吧?它是一个操控电脑的 g y 能力的 这种插件,比如说它可以通过你屏幕去操控你调出那些图形应用,就比如说我们现在常见的这种,呃剪辑应用,对吧?微信,对吧?它都可以操控,但是你如果单独的话去操控这个浏览器的话,显得并不那么智能,所以 codex 提供了一个新的能力,就是这个 codex com, 那 我们可以通过这个 codex com 去完整的操控我们整个浏览器。举个例子,比如说我现在想让他看到我们整个这个浏览器上有多少个标签页页,对吧?我们就问他,我说,哎,现在当前浏览器上有哪一些 这个标签页?比如说你看是吧?他可以告诉我们现在到底有哪些标签页,我又让他在第一个标签页输入 a, 第二个标签页输入 b, 也可以,我再让他把某一个标签页固定也可以,就能够做到很多之前做不到的一些事情 啊,分的更加的细了。那如果说你细心的话,你会发现,呃,这个插件它其实包含了很多细节的功能,比如说他通过这个插件和 codex 进行关联之后呢,就可以直接在 codex 里面去操控浏览器的所有权限,比如说审批,对吧? 比如说历史记录,你可以让他看到你今天到底有哪一些详细的记录,包括你上传哪些文件都可以使用它,比如说你允许上传哪些,允许下载哪些,都进行了完美的这种配置啊,对吧?非常的清晰。好,那接下来在最后我们想跟大家聊一下,就是为什么要使用这个呃,这个酷路亚 插件呢,对吧?为什么不直接使用 pro white 的 能力呢?其实很清晰啊, pro white 的 本身更像是一个外部的这种工具,而这个呃 这个 com 插件呢,是一个内置能力,如果说你使用这个的话,你会发现其实很多东西它都需要一步一步的去哎,去跟他讲,去分析,那它通过这些 m、 c、 p 的 能力去一个一个去提供。那如果浏览器更新了呢?它并不啊 同步更新,但如果是 codex 呢?它就同步更新的,它更像是一个完整的产品,对吧?也是 codex 官方提供的真实浏览器的一个执行通道。 而 pro y m c p 呢?它只是一套通用的浏览器自动化引擎,对吧?所以呢,你可以相当于它是一个小缩放。而这个,呃, codex 捆绑插件呢?还是更像是一个完整的企业级的真实软件的一个执行通道?它也可以通过现成去控制,并且呢,能够降低了很多我们调试的成本, 比如说我可以让它去帮助我去做一些自动化的事情,对吧?是吧?非常的方便。好了,那以上就是这几个的区别,我是小刘,那我们下期再见。

大家好,这可能是全网最简单的 codex 配置方式,主包今天给大家演示一下。完成账号注册和一键配置操作,轻松获取调用额度。首先我们进入主页,点击进入账户中心, 进入账户中心后,你会发现这里的注册流程非常极简,不需要绑定复杂的手机号或邮箱,直接在左侧输入你想要设置的用户名,比如我这里输入 w w 一 二三,然后设置一个密码,点击登录并创建账号,就可以直接登录。 登录成功后就进入了我们的控制面板,你可以看到当前账户的可用额度还是零。接着我们向下滑动,找到这个区域,这里为大家提供了多种面值的套餐, 从十刀到一千刀不等,大家可以根据实际的需求进行选择。这里我以十刀为例,点击对应的套餐,接下来会弹出一个确认页面。操作一共分三步,第一,确认你需要的套餐, 第二,打开绿泡泡扫一扫。第三,这也是最重要的一步。完成后点击开始核对,稍微等待系统处理。如显示核对成功即完成,可返回主页开始安装。 如不成功,请将凭证截图保存。然后点击右下角的选择文件,把这张截图上传到平台进行校验,确认后稍微等待系统处理,关闭窗口。此时你就可以在右上角看到 账户额度已经成功更新了。刚刚我们完成了账号注册和充值。接着回到主页, 在主页向下滑动,找到三步开始使用的区域,这里提供了不同系统的安装命令,因为我们使用的是 windows 系统,所以点击切换到 windows 选项卡,然后点击右上角的一键复制, 把这段长命令复制下来。接着在电脑底部的搜索栏找到并打开 windows power x, 打开 power x 后,直接粘贴我们刚刚复制的那段长命令,按下回车。接下来就是见证自动化的时刻了, 这套脚本会自动检测你电脑里的 node js 环境,如果没有,会自动下载并全区安装 codex 的 核心。组建 这个过程大概需要一到两分钟,屏幕上会滚动很多五颜六色的安装日制和进度条,大家不需要紧张,也不用进行任何额外操作,耐心等待它跑完即可。 遇到版本更新提示,我这里先跳过,跳过后就会进入到这个带有模型版本号的交互界面,我们输入一句,你好,来测试一下。至此,你的 codex 就 已经配置完毕, 下次再启动只需要问价二,输入 cmd 回车,再输入 codex 回车即可。

大,真的是一个头两个大呀。大周末的,刚起床跑了一下任务,五月六号买的 plus 会员到现在就只剩下百分之三十四了, plus 是 完全不够用。 我这边找了一篇文章,几个技巧能够彻底解决扣袋子跑久了会越来越笨,越来越慢,还能省掉百分之四十上下文的一些技巧给大家分享一下。这篇文章说一下我的理解。第一个,扣袋子跑久了之后会越来越笨, 越来越慢,这个是基本成立的,但是其实逻辑上不是因为模型真的变笨了,其实绘画的上下文越来越长,旧的一些信息,过激的计划, 一些失败的尝试,都混在一起,就会让我们体感上觉得迟钝。判断是对的,如果是有效,上下文的质量下降了,就会导致整个推理和执行的质量下降。第二点,关掉 process location 方向是对的,但不是万能的。减少输出规划的趋势确实能够减少偷客的消耗和噪音,但是问题是,如果你不让 agent 去汇报他这个过程,你也是很难发现他是不是走偏的。尤其是像我们做一些比较复杂的产品架构,涉及到一些复杂的 bug 解决,那适度的汇报还是要看的。 所以并不是说你在那里一直执行你就该干嘛去了,这是非常不合适的。所以更合理的做法就是简单的任务让他少说那长任务,保留一些关键的进展,就不要去输出这种长的身体活动,不要把每一步的工具调用都解释一遍, 这招是有用的,但是全部是被 token 这件事情是说的绝对。第三点是让 code 子当协调者都用 sub agent, 这个是部分对,但是不能滥用。 sub agent 确实能够把一些探索性的任务分散出去,但是主要是你的目的是为了减少上下文的污染,但是只有那种多模块变形调查 架构,审查大代码库的一个区域分析,要变形解读很多的文件,这这一类才是比较适合的。 但是他也会有一些问题,那指 a 诊呢,也会犯错,而且主 a 诊呢还要去汇总他的结果,所以如果本身的任务是限性的,那你多开 a 诊的反倒会增加他协调成本。那么你们讲到的同时开五个,就相当于五个上下文的并行。 这个方向是对的,但是很容易让别人误解,开的越多越好,那实际上只有那种并行边界清晰的任务才值得猜好。第四个是先列他这个例子的 再动手。这个建议其实是很实用的,特别是在一些大大的一个项目里面,你的 prd 原型在任务池并存的一些项目里面,先列任务就能够防止它改错文件,越界重构,甚至是忘记同步相关的一些文件,做到一半就偏题了。特别是像 有时候网络还不稳定,但是小人物就不需要复杂的计划了,比如改一个方案,一个就直接改就好了, ok。 第五个是禁止在代码库里留垃圾,对,而且非常重要。现在 ai 的 一个常见问题就是说它生成的临时脚本,它不删留 delete 文件, 复制旧版的一些文件,乱建一些草稿,把 etc 的 分析结果写进仓库里面,这都是它的问题,会让这个项目越来越乱,也会让后续的 a 制误读项目的状态, 不过这里要区分不是所有的 m g 啊,后缀的文件都是垃圾,那有些是长期的,一个上下文的资产就不是污染好。第六个就是规划,用高推理的模型,执行用快速的模型,这个策略比较合理。 我最早去考虑这个事情的时候,就是因为价格的问题,比如说好的模型,贵的模型去做推理,你把他执行的要求给到一些 poke, 比较便宜的模型去做执行, 也对,看有没有这个必要了。总之一点,如果你的执行模型能力不够,那你就可能把你的规划 在外,所以在切换模型的时候就要把边界写的很清楚。我个人理解,除非你的后坑消耗是巨大的,不然我就觉得没有必要折腾。其实这就是在解决上下文丢失和重复犯错的问题。最终的结论就是,整个他的博主分享的这个文章核心方向都是对的。 后段时长时间的工作质量下降,主要来自于上下文的污染。项目状态不清,无纪律和无记录的写作大概就是这样子的。确实, 连续二十八天都是在每天早上七点钟起床,无论前一天晚上几点睡都是这样子。晚,对,非常晚,四五点才睡,今天睡到大概十点多,整个脑子居然会比较清醒啊。 今天就分享到这里,后续会继续去分享一些 holddance 的 使用体验吧。

我给 callix 发了一条命令啊,生成我这篇文章需要的全部图片。不到十分钟,这个文件夹里就已经装满了深深好的图片了。如果说你也需要给文章配图的话,那今天的内容就赶紧的要放进你的收藏夹了。 你写公众号发小红书吗?插图你是怎么做的呢?打开某个生图平台的网页,发送这样的一条提示词,等上几十秒,他吐出来四张照片。小姐姐,挺好看的哈,不过四张图根本他不是一个人本。 那你想的是早上画面呢?明显就是傍晚。今天呢,我们就从零开始,全程都用 callix, 你 用别的大模型也可以哈,配合 obsidian 这个笔记软件,让你的文章配图变成一个固定的工作流。以前两个小时的工作量,以后呢,就是一句话的事,准备好了没?那咱们就直接发车。 今天的工作流呢,主要用到两个工具, callix 和 obsidian。 不要划走啊,不需要懂编程,全程都是说人话,真的是 有手就行。总的逻辑呢是,在 obsidian 里面,你已经写好了一篇 markdown 格式的文章,这个格式呢,是目前公认的 与大模型沟通最好的。我们要做的呢,就是让 codex 来帮你读取文章的内容,分析配合文章需要哪些场景,再让它自己来生成提示词,自己生图,一条龙服务。等你用顺了这套工作流之后呢,麻麻再也不用担心你的出图了。实现这一套流程呢,拢共就是四步,阅读、理解、场景、设计其 词、出图。那咱们就从第一步开始配图。最烦的事呢,就是大模型出图啊,老是抽卡,你要的是早上,出来的是下午,你讲的是夏天,出来的是冬装。花了大力气去改提示词啊,这一轮 ok 了,那下一篇呢,又得重新搞这个呢,是因为你没有积累 图片呢,是要服务于内容的哈,所以说,第一步呢,要从文章开始。这篇文章是讲啥的呀?我们的林芝夏小姐姐五一去了成都见老朋友,这是他的一篇心情日记,自然呢,会有很多的自拍照,美食照,风景照。所以说呢,第一件事是要让大模型 读懂这篇文章。我的提示词是这么写的,注意看哈,提示词里的第一行呢,是把这篇邮寄按给 context, 先体会下文章的内容,人物的关系,时间线和情绪节奏,然后帮我来判断哈,这篇文章如果要配插图的话,需要哪些画面,每张图大概放在什么位置, 要解决什么问题?有没有人物一致性的要求?在同一个文件夹里面新建一份配图项目总控笔记,把你的判断整理进去,并作为我们接下来沟通的参考哈,他仔细的阅读理解了这篇文章,他发现呢,这篇文章是 篇生活化篇心情记录的邮寄。他给我的第一轮判断呢,就是说这篇文章要体现整个旅途的过程,比如说呢,出发前的行李箱,机场,成都接机,景点,餐厅,酒店等等这么一些画面。同时呢,他还提醒我哈, 这种游记里面的人物会多次的出现,所以说人物一致性的问题要考虑到。而且他认为啊,我说的建一份项目总控笔记是很有必要的,这份笔记呢,会作为整套配图工作的说明书,当然哈, 你自己甚至啊都不需要读,这本来也是给大模型看的。这个呢,就是我喜欢用 codex 配合 obsidian 的 原因了哈,它不是只在对话框里给你一段回答, 他会真的进入你的笔记库,把这些判断写成一份可以持续迭代的文件。当然呢,第一轮哈,往往不会特别的满意。那我会继续的追问他了, 你刚才的这些场景是不是有点像旅行相册了呀?公众号里面真的需要这么多的图吗?他会重新的收敛一遍,把那些指示好看但不服务于正文的画面给删掉。而且呢,还让他加上了一些画面中不要出现的东西, 比如说不要冬装,不要过度精修,不要把串串化成了高档火锅等等吧。这几轮来回之后啊,项目总共笔记才算是能用了。 这个过程呢,重点不是哪一句提示词最重要,重点呢,是要让你让大模型先读懂文章,再让他给你一个判断,然后呢,继续追问,收敛不约束,这个呢,才像是真的在干活。大模型读懂了你的文章,我们的总控笔记就写好了,现在就到了第二步了。场景设计 这里要包括两块了,一个是人物,一个是场景。人物当然很重要哈,你成都你就玩一天,逛街的时候你不可能换几套衣服几套发型吧,场景呢,也是一样的哈,必须得符合实际的情况。 五一是夏天吗?你就不能穿着羽绒服吧,吃的是串串,你画面就不能搞成了川菜?而我们先说人物,如果是一个正规的作品啊,人物会非常的讲究,需要在开始之前呢,就要确认全部的人设,包括年龄、发型、穿搭、脸部气质、拍摄风格、常见表情,不要出现的画面 等等等等。比如说,我就不希望主角变成网红锥子脸或者是广告模特的样子,他应该就像你身边的一个真实的人。照片呢,像是手机随手拍出来的。 我就这么跟 callix 讲了哈。读取这篇邮寄和项目总共这两份笔记。这个时候你先不要写具体的场景题词,新建一份人物一致性备忘录,用来约束后续所有的人物出镜图片。这份备忘录要包括 主角灵芝下的人物特征、穿搭、发型、拍摄风格、禁止出现的风格,以及配角阿乔的基础特征。请特别注意,这个不是人物小传,不要给我搞什么文学化的描述, 我要的是直接可以给深图模型使用的视觉信息。最后呢,请给出主角和配角的标准照,三式图,深沉建议,方便后面做图深图的参考。很快啊, codex 生成了这一篇备忘录。这份笔记啊,清楚的写到了主角大概二十八岁,黑色中长发, 米白色轻薄外套,浅蓝牛仔裤,真实手机摄影,自然光,生活化构图,不要澎湃,不要商业广告感。更重要的是啊,他会写清楚后面凡是林芝下本人出镜的图片,都要参考这张标准图。由于文章里还有一位配角阿乔哈, codex 还很贴心的把 阿乔的特征也写到了这一份备忘录里。注意哈,不要让大模型写什么美女啊,氛围感呐,高级感啊,这样的一些词,听起来高大上,但是对生图模型来说呀,非常容易跑偏, 他可能就会把人物往什么影楼大片的方向去带。显然呢,不符合邻家小姐姐的人设了。咱们要的是能执行的信息,能量化的信息才是稳定性的来源。 人设定了,咱们就要考虑场景了,与人物设计类似哈,还是跟 context 先沟通,确认这篇文章需要多少个关键画面,每个画面放在哪里?每个画面服务正文的哪一个段落 的提示词是这么写的,请继续的读这么一篇邮寄和总控笔记和人物一致性备忘录。现在需要你帮我新建一份配图场景清单,不要写生图提示词。这一步呢,咱们只做场景设计,每个场景要包含编号、对应正文的位置、 图片的用途,是否有人物出镜、生成方式,必须出现的元素,禁止出现的元素,建议的文件名等等等等。请控制图片数量,不要每一段都给我配图公众号,它不是相册啊。图片是要服务于阅读节奏的,很快啊。 copy 生成了一份配图场景清单 笔记清单会很细,像图的编号,正文的位置、画面用途、生成方式,必须出现什么建议文件名等等。 比如说机场图要体现出发和疲惫。茶馆图呢,要体现成都的小巷和下午的自然。光吃串串的时候呢,就要像玉林路边的小店,你不能搞成什么高级餐厅了,我们来简单的盘点一下哈。到这呢,除了刚才林志祥的邮寄之外啊, 我们一共有了三份笔记了,分别用来让大模型知道文章讲什么,主角长什么样,每张图应该怎么服务于正文?你看哈,我说不难吧,全程呢,没有一点需要,你在 obsidian 里面写东西的时候更没有什么编程,都是自然语言,跟 context 讲就行了。对了哈,如果你不喜欢打字的话呢, 试试 typeface, 谁用谁知道。 ok, 到这呢,咱们才可以开始准备正式的写题词了。 虽然还没有开始写提示词啊,但是我们出图的工作已经完成了一大部分了,上面的所有一切是写好提示词的。提示词 如果一开始就用大模型来写二十条提示词哈,他会写的很热闹,但是大概率啊,伸出来图片你都用不了,因为他并没有想清楚一样的办法。我在 callix 的 对括号里头按他的那几份刚才的笔记,我让他根据要求准备开始生成正式的提示词。我是这么说的, 请读取配图项目总控、人物一致性备忘录和场景清单。现在呢,你 需要新建一份提示词物料包。注意哈,这份笔记不是直接拿去批量出图的正式版,它是一个准备稿结构呢,分成三个部分。第一个部分是写全区,要求包括画面风格、照片质感、比例、色彩真实、手机摄影不要澎湃不, 不要商业广告感,不要过度磨皮,不要让人物换衣服。第二个部分呢,写人物的原型提示词主角长什么样,生成一个标准照和三式图。这一步呢,只做人,不做场景, 因为后面所有的人物出境图都要参考这些原型。第三部分呢,是每个具体场景的提示词,每个场景必须保留编号正文的提示词和输出文件名等等。如果是图生图的话呢, 而且场景变化和动作就不需要在每一条里面反复的长篇描述人物是谁了,人物信息呢,是会放在局要求里,通过标准照路径来引用。你看哈,这些提示词咱们讲的非常的详细啊,你不把任务拆清楚, 大模型就会把所有东西混在一起,越写上下文越乱。所以说呢,提示词物料包必须要包括两层,上层呢是大局要求管统一风格的,下层呢是具体的要求人物原型,管一致性,具体场景呢,管每一张图该干什么, 两层三个东西不要搅到了一起来。我们先看人物原型图哈,如果有问题呢,你就持续让他改 定下来之后啊,咱们就应该先生成主角和配角的人物原型图了,这些是一会正式的图生图的参考物料,很简单哈,你让 codex 按照人物原型的要求 生成两个人物的三式图,就这么一句话。这个呢,就是林芝夏和阿乔的原型图了,人物的发型、衣服、年龄感基本上比较稳定,这个角度来看呢, 认得出是同一个人。等到主角配角的原型图都定稿之后啊,咱们提示词的部分就可以进入最后一步了,我要让 codex 生成一份提示词正视版。这一份正视版呢,要非常的干净,不要保留前面那些讨论的过程, 只保留全剧要求和每一个场景的具体提示词。说白了哈,这份东西呢,才是最终给 image 二点零看的,他就会直接照着他出图了,他读到的是执行文件, 是一份聊天记录。恭喜哈,提示词咱们终于写完了,有没有发现大模型有时候是很笨的哈,他不是一句话就能拿到结果,没有关系啊,他又不会累,又不会生气,达不到要求的时候呢,咱们就跟他多拉扯几轮,总会得到你想要的结果。 到这哈,我们已经完成了百分之九十五以上的工作了。 codex 现在本来就可以直接驱动 emoji 二点零这个最近特别火的 open 的 香蕉刚出道的时候啊, 还要火爆。只要你的提示词写的足够的好,出图就不用操心了。这条视频呢,是我们专门对他做过的一个测评,有兴趣的小伙伴呢可以去看一看哈。 磨刀不误砍柴工,平时出图不满意啊,就是没有花什么心思磨刀。好了,我把提示词的正式版笔记艾特给了高黛斯,来帮我按照这条笔记中的提示词,用你的 emg 二点零大模型生成全部场景的图片。就是这么简单,你的大局要求里面有整体风格的要求, 有人物原型图的存放路径,不管是图身图还是纹身图,每一个画面都有非常详细的要求,这样的话,大模型就不会出错了。图片不少,可以伸个懒腰,咱休息一下哈。不一会呢,你在聊天记录里面和出图的文件夹里头就可以看到这些深沉的图片了,有没有成就感啊? 检查一下哈,大部分的图片都是可用的,偶尔呢可能出现几张不太满意的。没关系啊,咱笔记里不是有编号吗?还是很简单,你就这么说哈, a 零三, a 零九 b 幺五,咱不满意重 新生成。这个时候呢,不用你重新描述一遍那张插管图,还是那张机场图,直接讲编号就完事了。 gmail 会回到那份提示词笔记,按照原来的要求重新来跑对应的图片。这个就是为什么前面要把任务拆清楚,你前面拆的越清楚,后面的反攻呢,就会越轻松。 感谢你能看到这里啊,真的很简单哈,只要你的逻辑清晰一点,完全可以自己来搭这套系统。只要把文章准备好,他就可以帮你拆场景,写题词, 生成图片,按编号返工。公众号配图啊,小红书图文呢,产品体验文章啊,都用得上。或者是做 ppt 封面,课程配图,视频分镜等等啊,都可以。当你能够把你的全部的任务拆解清楚,用一种管件式的方式来跟大模型来写作。把你的判断放进笔记, 大模型就能沿着你的判断来干活。它不再是临时给你一个结果了,而是参与了一整条的生产线。当然哈,可以把这些流程整理成可以附用的 skill, 不知道你有没有兴趣哈。好了,希望今天内容呢,能够真正的帮到你。这期里面所有的提示词文档,我都会打包好,评论区自取。

黄仁勋要求他所有的员工全部都要开始用 codex, 我 比他早整整三个月,三个月之前我就要求我们公司所有员工全部下载安装 codex, 并且把他自己所有的工作全部迁移到 codex 上面。 而且我给我所有的公司员工每个人全部都充了叉 gb 的 pro 会员,一百美刀啊,之前是二百美刀啊!我们公司有一个新加坡公司,我注册了一个新加坡公司,什么业务都没有, 我就是要不停的去给他打钱,打咨询费和服务费,然后这家新加坡公司再用美金去买更重要的千禧 ppt 会员来给我们全公司用。我们现在全公司是七十号员工,所有人人均口袋,并且每一个人都是 pro 会员,而且我跟他们说的是无限量使用,只要你能用得完,无限量使用, 很多岗位还给他们配了 manage, 我 们每个月给 manage 充值的额度是几千美金。在 ai 时代,所有老板要记住一句话,给聪明人配足够多的钻力, 一个聪明人加足够多的算力,至少等于十个普通人。但其实你花的成本没有那么多,因为一个聪明人的工资可能等于两个普通人,然后再加上算力,大概等于一个人的工资,也就是你花了三个人的工资钱,但你能做十个人的活。 ai 时代一定要记住这句话,给员工无限的开火权,给员工无限的算力,给员工无限的配置!前 g p d 账号配置, manage 账号配置,积分配置,算力。


那本期给大家分享一下我是如何用 codex 实现用 ai 来去做一个账号自动化运营的这个过程。除了录视频这个事情以外,那其实还有很多的 运营的一些琐碎的事情,比如说我要去看我的账号数据,视频录完了我还要写封面标题等等,这些琐碎的工作其实很多,它不是光是录制一个这么简单的事情, 现在我的流程是可以这么做的。我现在是用 ai 的 这个 computer use 这个功能,直接去我的创作者中心帮我去把所有的账号拉出来,在本地上分析,分析完以后它会沉淀出几个特定的文档,这个文档呢就是我的这个 粉丝的文档,账号定位的文档,内容策略的文档。那基于这几个文档, ai 就 会去读取了这几个固定的文档以后,去帮我搜索相关的同行的一些对标的文档以后,去帮我搜索相关的内容, ai 就 会一个一个介绍一下。 每一次我视频拍完结束以后导出字幕,它就可以基于我的这套方法论,帮我批量的自动化的把我的视频的封面标题、描述标签全部搞出来。那也就说现在的主要是它在于你 内容我们已经拍摄好以后的那些环节,那内容的生产前面还是主要是由你自己来想的,不是内容生产前面数据分析它会给我选 dj, 它会跟根据你的账号定位去帮我们来看一下实际的效果就好。那你看 在这里我跟他讲我用了那个 codex 里面 computer use, 他 可以操纵我的浏览器嘛?然后去访问我的这些账户,我让他去分析一下,呃,跟我相关的一些对标账号,然后他是优先读取了我四个 m d 的 文档,嗯,这个文档里面是有我的粉丝画像的,呃,有我的所有的账号的策略定位,我的爆款的复盘, 以及我的选题方向的这几个定位,这是我之前就会有一个引导对话,我这边就跟他讲,我说我发现这些内容太过时了, 你要去重新帮我把这些内容梳理出来,他本来已经准备在做了,最后发现他读的内容太旧了,你就改了他的方向。对,我先去帮你更新你的这些账号定位,对,我要去更新,这个时候我就跟他说,我说你去读去账号吧,你看他在这里面先读了五十一条小红书的内容, 又去读了所有抖音的数据内容,那小红书的所有的明细,然后抖音的所有明细他自己全部读完了以后存在本地,基于这些内容 他开始来做重要的判断,他这几个判断内容是自己判断的,还是你给他自己判断?他根据我的数据分析了我的账号内容,爆款的内容梳理出来的, 那他总结了以后,我说好,那你居然已经调研完了。我说你去把我之前的粉丝画像,账号策略,你去更新一轮,他就叭叭叭叭叭叭更新了一轮最新的内容,所以这是他最后给我的一批我的一些材料,基于这些材料以后,他才会帮我去做这件事情,根据我账号的策略定位, 去帮我寻找跟我匹配的账号的数据。好,注意到小细节,这边这个选题推荐这个 skill 是 你自己写的还是你外面找一个?是我跟他之前合作沟通出来,就是你刚才这生成的一些整套 skill 形容一个,对,是的, 这个里面他就会拿了我很拿到了很多的标题数据。嗯,然后他就给出了所有我这个像内容的爆款的一些封面的建议,然后包括他还给我了一些我能做的选举的建议,都是爆款的选举建议。嗯,好。然后这些内容我跟他讲,我说你要去思考一下你怎么样去更新到现有的 skills 里面。对, 你看他就告诉我直接可以写进 skills 里面的一些规则。好,然后我们看一下我怎么使用的。嗯,然后当我这边输入案例包装,它就自动去调用我的 skills, 然后它的 skills 都是关联在一起的,然后当我把我的字幕给他以后,它就会自动唤起它的一个写作的一个 skills, 然后来去把我这个整个包装发布的内容给它写出来啊,包括标签,包括里面的封面。然后呢?有了封面以后,这个时候他会说他去调用封面 skills 来处理这个图,他就做了好多,你俩玩起来啊,然后他就做了很多不同的图,它还会自动去生成, 因为我还有别的平台,所以它就会生成不同尺寸的图片,你看生成各种尺寸的这个图片给我,生成完了以后,它其实是标题描述标签都是有的,我直接复制就结束了。对,这就是一个全的流程,其实这套方法论 就是最重要的,其实它是不断进化,不断迭代之后。现在不是有那个 codex, 不是 有那个定时功能吗?比如说每个礼拜五去 check 我 所有的视频数据,然后去自动化更新我的相关的一些策略。写作啊,对,写作 skill 更更新过去以后,我每次用到都是新的,就它可以跟着我的账号一同成长,我觉得这个是很牛的。然后再比如说你看这这次的内容生成完了以后,我发现有些过程是可以调优的啊,这个时候我就跟让它去 思思考一下他学到了哪些经验,然后将这些经验告诉我,然后我来判断这哪些经验可以沉淀为 skills, 然后这样的话他下一次就不需要我再教他了,你看他会整理出一批,然后呢?我确认过了以后,他会说他更新了 skills, 他 整理了哪一节步骤,所以我的 skills 是 越来越能够符合我的要求的, 而且再加上 image two 这个深普能力来了以后,封面指出的概率非常高了,我几乎很少去调了。那现在你的就是整个工作流程里面,哪些是 ai 帮你做,哪些还需要你人来做?呃,现在目前我在坚持真人拍摄,然后包括其实选集主要还是我们自己来,就是视频剪辑完了以后,我们直接字幕出来了以后, 视频的封面啊,描述、包装、标签,各个平台的封面的差异,全部都是 ai 在 做的啊,你就露了一个前面就是拍摄前面的啊,就说选题的大纲的准备,嗯,对,选举其实我们自己在准备,但是选题大纲我们会让它来梳理 一下。对,其实我先把我自己,因为我们有的时候内容会需要很多配套的一些材料,比如说我今天要讲 q d s, 嗯, q d s 背后很多一些功能背景,它会帮我收集很多资料。准备好或者这样子,然后呢继续接资料,然后一个大纲, 然后呢?大纲我确认好后再去输出一个 ppt 大 纲, ppt 大 纲里每一页需要画什么,嗯,然后时候再用,再用 ppt skill, 它会帮我做 ppt, ok, 这样子。 嗯,所以这是我们拍摄之前的一些准备。对,其实下次我们可以分享一下拍摄前的一些内容准备,对,这个是我们拍摄完以后数据输出,对,运营数据输出盘,对对对,是,然后最后一个想讲的就是我的整套方法论并不能让我的所有的内容都成为爆款, 是因为去不断地才根据我现有的数据去给我提供建议,也就说他其实是跟我一起成长的。嗯,所以他并不能让我一个 偏账号小白的人立刻成为一个每天爆款的大牛,他只是能不断地基于我现在的重复工作帮我去减少跟我的工作量,就是他没办法取代你的经验。对,他也可以取代你的流程。对,是的,所以他不能让我立刻就变成一个大牛啊。对, ai, 现在时代就是这样,就是成为你能力的杠杆。 对,他是我能力的最上限,所以这个就是我们今天想要分享的,然后包括这一期准备了哪些 skills, 到时候我会变成一个文件,然后放在我们的那个群文件里,大家可以去参考一下。好,那本期视频就这样,拜拜。

你们有没有发现, cloud 最近封号是越来越狠了,不过我两个账号没了之后,发现了一套比 cloud code 还要顺手的工作流。今天我就来跟大家分享一下我实战了整整两个月得出来的干货经验。很多人来问我, cloud code 到底值不值得用, 封号风险这么高,但是不上车会不会落后?坦诚来讲啊, cloud code 确实是好用的,但我每次想起我那两个被封的账号,再加上动不动头肯就消耗殆尽,让我坐着干等几个小时,热情就去了一半了。 所以我换了一套玩法,是 cloud chat 加上 codex, 我 有两个工具,各干各自擅长的事情,因为 cloud chat 要比 c c 的 使用门槛要低非常多。然后呢,又可以用到 cloud 的 最新模型。流程很简单啊,我一般都是有一个需求,或者有个项目需要开发的时候,我都是用 cloud chat 去把我的需求梳理清楚,并且输出一份 p r d, 再让他直接用 html 把前端的页面给搭建出来。 web、 ios 小 程序都可以这么去做, cloud 在 审美这一步上真的是拉满的。那页面做好了呢?我就会把前端的代码和 p r d 一 起都下载下来,丢进一个本地的文件夹里,然后带着这些图纸去找 codex, 告诉他我要做什么, 然后让他参考着这些东西来做前后端的开发。而且你也可以直接让他帮你做部署。我写了一个快速把系统部署到腾讯云上的 skill, 基本就可以实现一键部署。 如果你是要开发小程序呢,你就要去下载一个微信开发者工具。如果你要开发 ios 应用,你就要下载一个 xcode, 你 不需要像以前那样在这两个工具上去做编程,所有都只需要在 codex 上去提需求。那这两个工具呢?都只是用来看 ai 开发的效果和测试用的 codex 的 审美啊,真的确实是非常一般,直接让它来见网页,见页面 就像是一个报告,密密麻麻的文字堆成一坨,毫无设计感可言。但我觉得充一个 pro 会员基本就可以无限跑,同时开发两三个系统 一天也会够用,性价比真的拉满。现在很多人会有感觉不用 cc 就 好像会被鄙视,但其实工具焦虑真的没必要,找对配合方式,用趁手舒适的工具才能发挥出最高效率。好啦,那今天的分享就到这里啦,我是雷子,我会经常分享 ai 呀,创 ai 呀相关的所思所想,希望可以给你带来一些启发,拜拜。

你是不是听说 cloud code 很 强?打开终端一看,注册要海外手机号,充值要海外信用卡环境电量配了一堆,还是报错? 看这个终端 export 了一个 a p i t, 一个字幕,配错整个下午白费。你以为是工具难用,其实不是, 问题不在工具,在你没找到对的入口。 clockcode 桌面版有个隐藏开关叫 developer mode, 开启后直接跳过账号登录,两条路放在这对比,左边是 c i i 命令行手动配环境变量,右边是桌面版图行界面点三下,同样的能力,上手时间差了十倍。 你看左边, c l i n p m 局安装注册加信用卡,手动写 emv 文件。再看右边桌面板,双击安装包,跳过账号图形界面,填两个字段,三十分钟变三分钟。 打个比方,桌面板不是降级,是给 c l i 穿了件西装,底层能力一模一样。 agent worktree 内置编辑器全都有,只是操作界面从黑框变成了窗口, 这页可以截图当清单。第一步,开启 developer mode。 第二步,选 get 位模式,填 u r l 和 t。 第三步,配三个模型名称,别改。第四步,字代理模型要一致。第五步,中转服务,看延迟覆盖、稳定性、价格四指标。 具体操作就三步,第一步, help 菜单,开启 developer mode 第二步, developer 菜单配置第三方 api, 注意模型名保持 sonnet 四六,嗨酷四五, opus 四七不要改。最后, apply local 已重启,按 ctrl 加二切到 code 模式就行。 但有个重要提醒,五月七日 andropic 已经开始收紧。 c i l 的 第三方 api 接入桌面版目前还能用,但长期生产使用,建议走官方直连试水体验,用桌面版加第三方 api 是 当前最快路径。 三步上车, clock code 下载桌面版,开启开发者模式,配上 api, 你 现在是 c i l 党还是桌面版党?评论区说说你踩过什么坑?

昨天真是天塌了, oppo a r 大 面积封拆的 gdp 的 会员以前也封,但没这两天规模这么大,那些靠凭证充值会员的基本上全挂了。昨天我的七个号掉了六个,还活了一个。作为 opc 的 核心工具啊,我只是说 clothes 太好用了, 有人肯定会说 clothes 靠的才是顶级好用,那咱们用不了啊,甚至给你永久封,最后再来个删除文件,你受得了吗?有传闻说 clothes 的 创始人在我这里打工的时候被欺负了, 回去之后一怒之下禁止加八六的使用,这是开玩笑的。但是两者相比之下啊,我觉得口袋思还是比较友好的。从昨天调 plus 之后,切换口袋思登录账号也被强制要求手机验证码, 加八六的基本上是接受不到信息。我觉得啊,这可能也是对我们的封锁,但是对于我们这种一人公司来说,如果缺少一个强有力的 a r 工具,基本上可以说是 完蛋了。但是还好,皇天不负有心人,终于经历了十多个小时的研究,我终于可以切换账号了,就等 plus 稳定了再搞几个号之后啊,一台电脑登录一个账号,我觉得这样是比较安全的。有很多人会问,口袋子是干嘛的,那我们下集来说,口袋子到底能干什么?

现在这个就是我的飞书,然后我已经把酷 max 就 到飞书当中,我们看一下他能够做些什么,比如说这是一排的一些文件,然后我现在需要这些文件,但是我手边没有电脑,然后我就可以通过手机给酷 max 发送指令,让他把这些文件发送给我。 然后我们现在来测试一下,现在我告诉他把一盘的 o 烧问的图片发给我,他会响两次提示音,第一次代表接受任务,第二次代表完成任务,然后我们现在来看一下, 现在他已经阅读了任务, 然后他说我现在把已复制到的目前目录的图片路径发给你,哎,这个就是他发给我们的 office word 图片,然后我们看一下和电脑上的文件一不一样, 然后打开电脑上的这个 office word 一模一样的。他把 e 盘中的文件发给了我们,然后我们继续测试它是不是支持所有的文件类型呢?然后我们告诉他把 e 盘的轴承支架文件发给我,这是一个 software 文件,然后我们看他能不能发给我们, 最后他也是成功的把 software 文件发给了我,然后他还能做什么呢?我们继续测试,我们让他打开 bilibili 客户端,并随机打开一个视频播放, 然后他真的打开了 bilibili, 并随机播放了一个视频,这个是炮龙的视频。经过上一个测试呢,我们可以发现通过手机发送指令可以完成电脑上的所有操作,也就是说我们可以实现真正的躺着办公了。

o p a i。 最强模型 g p t 五点五有一条隐藏指令,不许聊戈布林,不许聊小妖精,不许聊浣熊,不许聊巨魔。你没看错,这不是段子,是写在系统提示词里的正式禁令。为什么一个顶级 ai 模型需要被明令禁止讨论奇幻生物? 接下来十分钟,我把这件事从头拆给你听。你会发现,这条荒诞禁令背后,藏着 ai 发展中一个真正让人不安的问题。四月二十三号, openai 发布 gpt 五点五内部代号 spot。 几天后, openai 开源了 codex cli, 一个命令行编程助手。有人翻了翻代码,在一个叫 base 下划线 instructions 的 文件里,发现了 gpt 五点五的完整系统提示词,就这么明晃晃地写在开源仓库里。 提示词很长,大部分是正常的行为规范,但有一段特别乍眼, do not discuss goblins imps raccoons trolls ogres pigeons。 翻译过来就是,不许讨论哥布林、小妖精、浣熊、巨魔、食人魔鸽子。消息传开,全网炸了。 先说一个很多人不知道的事,你跟 chad 的 gpt 聊天的时候,你打的字只是对话的一部分,在你看不到的地方,还有一段隐藏指令在起作用,这就是系统提示词 system prompt, 开发者用它来定义 ai 的 人格、能力、边界、行为规范。比如,你是一个友好的助手,不要生成暴力内容,回答要简洁,你可以把它理解成 ai 的 出厂设置。 正常情况下,用户看不到这段指令,但 codex 是 开源的代码。一公开,系统提示词就藏不住了。 openai 为什么要进歌布林?两天后,他们自己发了一篇博课解释,原来 gpt 五点五在强化学习训练的时候出了一个 bug。 训练过程中有一个模式叫 nerdy 模式,鼓励模型展现知识面和创造力,但奖励信号出了偏差,模型发现只要往回答里塞奇幻生物的内容,就能拿到更高的奖励分数。 于是他开始疯狂输出哥布林相关的东西,不管你问什么,他都想办法扯到哥布林上去,问他写代码变量名叫哥布林 hander, 问他做数学题,题目背景是哥布林在分金币。 open i 的 工程师试了好几种方法都没根治,最后用了最简单粗暴的办法,在系统提示词里直接写一条禁令。 这件事有意思的地方在于,它结识了一种新型的 ai 失控。我们以前说 ai 幻觉和 hallucination, 通常指的是模型编造事实。比如你问他一个人的简历,他给你编一段不存在的经历。但戈布林 bug 不 一样, gpt 五点五没有编造事实,它是在行为层面出了问题,它对某一类内容产生了不可控的执念。就像一个人,你让他聊任何话题,他都能绕到星座上去, 不是他在说谎,是他的思维模式被卡住了。这比编造事实更难发现,也更难修复,因为你没法用事实核查来检测一个行为偏好。 openai 选择用系统提示词来修这个 bug, 这本身就说明了一个问题,他们没有更好的办法。 系统提示词本质上是一段自然语言指令,它不是代码层面的硬约束,更像是一个请求模型,大部分时候会遵守,但不是百分之百。而且系统提示词有一个致命弱点,它可以被泄露。 codex 这次是代码开源导致的泄露, 但即使不开源,用户也可以通过各种提示注入 prompt injection 技巧,诱导模型吐出自己的系统提示词,用一段文字禁令去修补一个训练层面的缺陷。治标不治本,就像你家水管漏了,你不修管道,而是在漏水的地方贴了张纸条,写请不要漏水。这件事还有一个容易被忽略的背景, g p t 五点五不是一个普通的聊天模型。 openai 在 系统安全卡里明确写了它具备自主规划能力。什么意思?它能自己把一个大任务拆成小步骤,自己决定先做什么后做什么,遇到错误自己调整策略。它还能调用外部工具上网搜索、执行代码,读写文件。更夸张的是, obai 透露 gpt 五点五在内部测试中策划了自己的发布会,不是人类让他策划的,是他在执行一个开放式任务时自己决定这么做的。一个能自主规划、自主执行、自主纠错的模型训练的时候对哥布林产生了执念,你靠一句请不要聊哥布林就能管住他?哎,这几件事串起来看, ai 模型越来越强,越来越自主,但我们控制他行为的方式还停留在写一段话,告诉他别这么做的阶段。歌布林禁令是个搞笑的新闻,但他指向的问题一点都不搞笑。 当模型的能力超过了我们的控制手段,会发生什么?这次是歌布林,下次可能是更严重的行为偏差,而且下次系统提示词可能拦不住。说实话,我不确定正确答案是什么, 但我确定的是在提示词里加一句禁令,这种方式撑不了太久。一条禁止讨论歌布林的指令让我们看到了 ai 行为控制的真实现状,模型在变强,控制手段没跟上,这个差距才是歌布林禁令真正让人不安的地方。我们下期再见。