大家身边如果有一些真正在谈论和使用 codex, cloud code 这样的人,珍惜他,去和他们交流,去和他们做朋友,你进步的概率是更高的。他们普遍都是认知高、执行力强、信息整合能力强、探索欲旺盛的一群人。 就你想想,一个人去主动的拥抱、关注、学习最前沿的这些领域,并且能够真正的去实践他。首先一个他们一定是眼光好,认知高的。再一个进取心强, 执行能力强,持续学习的这种精神好,就你和家人待在一块,你的信息密度,你的思维方式都会整体被拉在网上。
粉丝310获赞9987

好的朋友们大家好,今天我想给大家推荐一个我认为阶阶段 ai 做 ppt 最强的一个实践方式,就是用 codex 再加它里面内置的 image generation 的 这个 skill, 也就是去调用它背后的 image 二模型,再加上 codex 里面的一个 presentation 的 插件, 这三者的一个组合,我认为是当下 ai 做 ppt 的 最强的一个组合和实践。为什么我会这么说呢?我给大家拆解一下。首先第一点, codex 它是作为一个总导演, 一个项目经理的一个角色,他负责去理解你要做什么样的 ppt, 然后他去拆解任务,去决定什么时候用 emoji 二,什么时候用 presentation, 他 也负责整个的文件的管理,素材的管理。第二个 emoji 二呢,我们都知道它是现在最好的闭源的一个深图大模型, 而且它对中文的一个支持非常的厉害,所以它承担的自然是最核心的一个视觉素材的一个生产,包括图片背景以及里面的一个素材。但是它产出的只是一个图片的一个素材, 并不是一个完整的一个演示文稿。很多人可能单独用页面 g r, 它也能生成连续的很多页的一个图片的一个 ppt, 但是这并不是我们真正想要的,所以我们就会引出最后一个 presentation 插件,它负责作版式,放置文字、图片、图表渲染、预览,检查页面的效果, 然后最终导出一个可编辑的 ppt x 的 一个 ppt 文件,所以它们三者连在一起,一个完整的一个制作 ppt 的 一个系统。好的,接下来我就简单的演示一下,其实非常简单,我就以我正在做的这个视频为例,我们想要介绍 ppt 的 这一套系统,让它去做一个 ppt。 我首先跟他说,请按照这个内容做一个八页左右的 ppt, 你 可以先去生成每一页的一个大纲和内容,然后给我预览,预览完成之后,等我提示下一步,你再进行下一步的执行。 好的,这一步,为什么我们不直接让他去做一个完整的 ppt? 虽然他也可以直接去做,但是我想展示的是,其实中间的这些环节,我们也可以通过人为的去把控和一些调整,来达到我们最终想要的一个效果。因为如果你直接让他去跑,能得到的效果不一定是你想要的。好的,现在让我们来看一下,他已经设计好了整个 ppt 的 一个框架, 大纲和里面的内容,包括主线第一页封面标题、副标题页面的一个内容, 还有视觉建议,这里我们大致看了一下,我觉得是没有问题的。好,接下来我们第二步,我们确认好这个内容和大纲之后,如果你觉得这里有问题,你可以跟他说,让他帮你改, 改到满意之后,我们这里就可以跟他说。好的,现在可以调用 image generation 这个 skill 去生产十句的图片的视觉效果,你可以给我三套的视觉风格,每一张图片就浓缩了这八张图片, 然后一张图片里面代表一个视觉风格。好的,接下来这一步,我不是让他给我一张图,一张 ppt 这样输出,因为这样很浪费时间,也很慢,而且可能只是一个单一的视觉风格,万一得到这个风格不是我们想要的,就比较浪费时间,所以我这里采用的一个步骤就是让他把八页 ppt 全部浓缩在一张图里面, 一米九二模型完全有能力做到这一点的,就是一张图里面包含这么多的信息量,然后我可以一次性让他给我三张,且三张的视觉风格不一样,这样我就可以去挑选出一个我认为适合的视觉风格。好的,这边我们看到他已经生成好了,一共给了我们三种不同风格的一个 ppt 缩略图。 第一个是一个比较常规的简约干净的一个 ppt, 第三个是一个非常好看手写风格的一个视觉效果,这三个其实都不错,这个时候就看你喜欢哪一种。这里我就选择第一种常规的简单干净的这种扁平风格。 这里我们检查好里面的一个大概内容,以及确定好我们的视觉风格之后,接下来有两种路径可以选择。第一种比较简单的,如果你不需要编辑这里面的元素文字,你觉得它生成的这个已经够好,你已经可以用了。那么很简单,你直接让 emoji 把这里面的这八张图直接按照图片的格式去生成出来, 最多你可以让他帮你转成一个 pdf, 这样就很快,相当于直接是八个图片去展示好。这是第一种,这种比较简单也很快,但是这不是我今天想真正介绍的,因为这样就没有用上我们刚刚说的 presentation 的 那个插件。我们如果想要得到真正的可编辑的,可拖动每一个元素的这个 pptx 的 文档, 接下来我们就需要调用 imageg 的 所有的元素素材、图片,然后把它们以 png 的 格式生成, 然后再由 presentation 插件去排版排布,然后导出成一个 ppt x 文档。好,接下来让我们就告诉他,请按第一种风格去生成 ppt, 我 需要你把里面的每一个视觉元素、图片、文字都按照 png 的 格式去生成,然后调用 presentation 插件去 制作成一个真正的 ppt x 文档。好的,就这么简单的一句话,这一步可能需要花费的时间会久一点,因为 emoji 它要去生成里面的各种各样不同的元素。好的,这里跑了十分钟,它也是跑完了。我们这边来看一下,可以看到它现在已经生成了一个完整的八页的 ppt 的 内容。我们先简单看一下,内容 基本上都是正确的,它按照这种模式输出出来的。这是一个 ppt x 的 文档,它的每一个元素都是可以去进行编辑的。好的,那么这个就是一个完整的一套用 ai 去生成一个可编辑元素的这么一个 ppt 文件的最佳实践。如果大家有认为更好的一些方法,也可以在评论区分享。

我这期视频的口播就是 codex 帮我剪的,我现在的剪辑速度超快,我最近做了一个 codex 剪口播的 skill, 其因是我看到别的博主做的剪辑 skill, 但是他们适配的都是像达芬奇和 pr 这样的专业剪辑软件, 但是我们日常用的最多的还是剪映,那我就去用我的方式重新做了一下。它实现的功能呢,就是在我录口播的时候说重来, codex 就 知道前面这段不要了。最后呢,它会自动来生成一个本地的剪映草稿。整个处理流程呢,分成四步, 第一步,我把原始素材给到 codex 以后呢,他用 whisper 来做中文转写。第二步,在转写结果里面识别从来和 ok 过。第三步,生成 cut list, 也就是 codex 来判断哪些保留,哪些丢弃。第四步,生成一个本地的剪映草稿文件夹。好,我们直接来演示一下,这个是我刚录好的口播素材, 我把它拖进 codex, 然后调用一下这个 skill, 跟他说你帮我粗剪一下这个口播稿,给我生成一个剪映工程。然后等一会,我们先来到剪映,点击这个大局设置,选择草稿位置后面的文件夹,然后右键在访达中显示,然后把你刚才生成好的工程拖进去,然后我们回到剪映,你看这个时候草稿就出现在剪映的界面里面了, 然后你只需要点击重新链接素材,选择一下你的素材, codex 帮你剪完的时间线就出现在剪映里面了。总结一下这个 skill 的 价值,不是让 ai 替我做创作,而是把我在录制的时候已经做出了判断,稳定地转换成剪辑的结果。对了,这期视频的动效也是 codex 帮我做的。下期视频教你怎么做。

大家好,我是老曾,十几年程序员,转行做跨境已经两年,前两天录了一个视频,关于介绍酷德 x, 就是 把自己的体验感受说了一下,引起了很大的反响,看来大家对酷德 x 还是比较感兴趣。 今天我顺着这个话题继续跟大家分享和讨论一些里面的子子课题吧,或者子话题。呃,第一个话题就是很多人 叫我去用克拉蔻,说克拉蔻的比那个克拉 x 会更好用。 嗯,我两个对比了一下,用了一下,可能是因为我先用了 code x 啊,所以我再去用 cloud code 的 时候,我并没有感觉到有给我有多大的经验。 然后呢?最近抖音上可能也很多人说卡的克克的最近好像降智了,我也不知道是不是因为我遇到了降智版本。那怎么样才能不降智呢?有没有高手来分享一下。 然后还有就是很多人说会封号,这个当然我还没有碰到啊,但是也是瑟瑟发抖, 所以我也没怎么用,因为我还是一个项目,我会不可能用两个辅助吧,我就是大概搞了一下,感觉没有特别经验,所以我还是守着我的科德 x 去继续用。 这是第一个问题。第二个问题就是很多人问说那个插件是什么?就是那个插件叫做修坡炮。修坡炮 那个 github 上 github 上有啊,大家可以自己去搜一下,去搜一下,而且它的那个 superpos, 它的那个大数很高的,非常高的,这个一搜就知道了啊,这是第二个问题。第三个问题就是 刷到了一个观点,就是说未来可能不会再有软件了。 未来都不会再有软件,不是说不会再有软件工程师,未来连软件都不会有,那软件都不会有,那怎么会有软件工程师呢?他的观点就是说未来的代码都是日抛的,日抛就跟隐形眼镜一样, 每天带完就扔。他这么一说,我现在才想起像 gpt 等等这些窗口,他给我们吐出代码的时候,他的右上角都有一个运行的按钮, 应该就是这个设计理念吧。所以这也是挺恐怖的。就是未来我们自认为 ai 不 会替代我们这种大型复杂工程, 但事实上有没有一种可能就是你每天跟他在交互写代码,慢慢的这些代码的架构啊?这个整个的工程管理其实没必要显示的 啊,由人来去管理。就像现在的操作系统,他其实已经淡化了词盘、目录 这种塑形结构,你看现在的手机跟 pad 等等,对吧?包括现在的电脑小白,他就不会再像我们程序员一样啊,要给词盘搞几个分区,分区下面有搞的目录,对吧?每每一层的目录不会超过七个或八个,超过了又管理不过来了,还一直玩。 现在电脑很少,现在我买的新电脑他都没有分区,他一个词盘就一个,所以你不需要理解这些背后的这些组织。那未来的代码项目是不是也是一样?我们现在分各种模块去设计, 那未来呢?未来的软件工程,未来的代码模块的管理是不是 ai 在 背后帮你解决了,你也不用去管理了? 我我觉得这个趋势是对的,就是他不是说干掉了所有的什么软件, 但是他是以另一种新的形式,就是跟影视的就人工程师,他不再需要去管理整个项目,他项目本身 ai 也在背后管,而且他不需要像我们之前一样搞那么严谨的模块啊等等。 所以这个我感觉可能下半年,最迟明年将会成为一种主流,而这个一旦成了主流,那么普通人编程 也将成为主流。现在用 ai 去编程,其实大多数还是程序员,而一旦项目制被废掉了之后,变成日抛制了,那么就是普通人用 ai 编程 成为主流的时候,这是我的观点,你们觉得呢?所以日抛型的这种代码执行, 我觉得会越来越成为主流,而这种能力将会让 ai 编程这件事情将会突破界限,不只是说程序员或者是稍微懂点代码的这些人,而是真正的普通人也会用得上。 应该下半年,最迟明年,那么一旦这个实现了, 那些什么中台啊,项目架构啊等等这些都会废掉,那么随着时间的推移,那么软件没了,那么软件工程师也就没了。 就像以前搞电脑的人, 他是打五笔的,有打字员这么一个角色,你会打五笔,那可是很吃香的,对吧?在那个在九十年代,那个时候,我在零几年的时候,我在零, 我在零几年的时候还接触过,还要学五笔,但是我学不会啊,我怎么学都学不会什么? 我也不知道什么什么根了,词根还是什么偏旁还是什么乱七八糟的,反正我不会,我学也学不会,但是很幸运的是没多久就学拼音了, 那以前真的打字都是一门高级活,但现在人人都会打字,同样的道理, 你现在程序员通过 ai 去写代码,你其实已经把大脑大脑交给 ai 了,这个你不用去争辩了,反正我的大脑已经交给 ai 了,所以我们其实就是叫做 打字程序员,提需求的程序员,那当这种项目制的再进一步解构掉,变成日抛制的,那你这个打资源,程序员打资源也不值钱,对吧?人人都能够去跑代码, 这个这个很快的,真的很快的,所以 时代将会在你还没做好准备的时候,他就已经来了。最惨的就是现在还在大学里面的 计算机的专业的学生,我一直在强调你们得不要一直沉浸在 就是传统的计算机的那些东西,那些真的没有,没有太大的意义,你们一定要利用 ai, 利用自己的学习能力赶紧动起来,就是驾驭 ai 去探索更高维度的东西, 去研究更高维度的课题,也好去开始去。为了避免你日后送外卖送快递, 还有开出租车,你得做更早的打算,你得去搞流量,你得去完成自己的交易闭环, 做就是实现自己的业务交易闭环,这个非常重要,如果你现在还没有意识到这件事情的话,等到你毕业的时候 那会非常的严峻,因为你毕业的时候不会有计算机招聘这件事情,这个事情虽然不能抬到明面上来说主流的他肯定不会承认这件事情,但是 你等到今年九月份秋招,你就知道他不会有岗位的, 所以动起来。好吧,加油吧,拜拜。

一定要想方设法的用上 codex, 如果你还没有听说过 codex 或者 codex, 那 恭喜你,今天我这段视频可能会改变你的财富。那什么是 codex 呢?官方定义它就是一个编程助手,但它不仅仅是一个编程。 黄荣新你们知道吧?就是英伟达那个老总,全世界的首富,已经让他所有的员工都开始用上 codex 和 codex 了。你现在听到的什么?英伟达翻了多少倍?纳斯克暴涨, ai 爆发,其实本质上都是因为这些东西代表了当前最先进的生产力。而我今天为什么一定要聊这个东西呢?因为我越来越发现, 普通人真正拉开差距的已经不是什么,努力的是工具,是生产力,尤其是像我们这种普通人。以前你想要创个业对吧?你要去学技术,学运营,学剪辑,写代码,才能把一件事情真正的做起来。但现在很多事情已经变了。 库尔德斯是现在目前对于普通人来说门槛最低的,成本最低的,他去使用的是世界上最顶级的大模型和智能体。那可乐的可乐呢?对于普通人来说还不一定能搞得定他的注册和网络问题,而且他动不动就封号,并且他非常贵, 所以扩展对于普通人来说就会简单很多。如果说你不知道怎么去使用它,那第一步非常简单,就去注册,下载,搞定网络,然后直接的就问他一句话,你对我有什么作用?接下来把你所有的工作,所有的生活都告诉他,然后问他,你到底能帮助我做什么? 比如说你是一个股民,你就告诉他我是一个股民,我平时炒 a 股,你现在能帮助我什么?然后他就会直接一步一步的去引导你。再比如你现在在工作,你是一个普普通通的上班族,你每天都要打开邮箱,下载邮件,处理数据,包括上传文件, 你就把你整个完整的工作流程告诉他,这种工作你能帮我做什么?你能帮我优化什么样的工作流程,你能帮我提高什么样的工作效率,你能帮助我做出什么样的工具,就这么简单。其实很多人最大的问题不是 ai 有 多难,而是压根就没有真正的开始使用 ai, 包括我现在看到很多的普通人还停留在 ai 会不会取缔我这个阶段,但真正聪明的人已经开始用 ai 放大自己了。如果说你现在是学校的学生或者二十来岁,那 codex 这个东西真的可能会成为你改变你人生的一个工具。就像你现在在食堂打饭一样,突然新开了一个窗口, 那你现在要做的不是在原地的犹豫,而是马上的切过去,排在队伍的最前面。因为很多时候给普通人最大的机会就是新一沙刚开始出现的时候,我是在做艺人公司 ai 创业的老周,有任何的问题都可以跟我聊聊。

一定要一定要想方设法用上 codex! 如果你还没有听过 codex 或者克拉 code, 那 么恭喜你啊,这段视频有可能会打开新的机会。什么是 codex? 很多人只知道它和编程有关,却忽略了它背后巨大的 ai 时代价值。 英伟达十分重视这类智能工具,业内大佬都在率先使用 codex 提升整体效率。当下 ai 行业快速升温, codex 更是当下极具发展潜力的前沿智能工具。 普通人都想用顶级大模型和智能体去卡。在了注册繁琐、网络受限,还花销偏高。而酷 max 完美避开了这些麻烦, 上手特别简单,注册下载,调好网络,直接问他能为你带来什么帮助,把自身需求全盘告诉他就可以了。做自媒体的朋友,直接收听自己日常剪辑文案,解脚本内容,让他帮忙出思路。大框架上班族梳理日常办公流程,让他帮忙精简步骤,提升工作效率。 再叫年轻人更要尽早接触 codex, 借助优质 ai 工具提升自我,拓展发展路径,越早熟练用好 codex, 越早抢占新时代先机。

目前使用 codex 接入国产大模型,我体验下来最好用的方案还能解决用原声插件的痛点。需要用到两个小工具,第一个是模型管理工具 echo bot, 它能帮你管理和切换各种大模型,甚至还能批量管理 cloud code 这类 a 阵的工具的模型比 cc switch 好 用不止一点点。第二个是插件打开工具 codex 加加,用的时候先打开 codex 加加,再通过 echo bot 切换模型就可以了。赶紧去配置试试吧。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

ai 时代最浪费时间的不是工具少,是你选错入口。很多人看到网页就喊 computer use, 看到登录页又拿 browser 应试。记住一个公式,本地页面用 browser, 登录 tab 用 chrome, 桌面图形界面采用 computer use。 案例一,你在改 local host 页面,要点按钮截屏看移动端一出先用 browser, 它不碰你的 chrome 账号,也不需要登录态。案例二,要进 gmail salesforce 公司后台必须用你的 chrome, 登录状态就用 chrome extension, 他会按站点确认权限。案例三,要操作 mac app 改设置,跑 ios 模拟器,或者一个流程跨多个应用才上 computer use, 他 能看屏幕点击输入决策树很简单,有结构化插件或 api, 先用结构化工具, 只是本地网页用 browser, 要账号用 chrome, 不是 网页用 computer use。 安全线也很清楚,不要把秘密沾进网页敏感账号支付权限设置人要在场收藏这条。下次让 codas 干活前先问一句,我要的是页面预览登录态还是桌面控制?选对入口,效率才是真的提升。

哈喽,大家好,我是老曾十几年的程序员,转行做跨境,现在已经两年了,今天聊什么呢?聊 open ai 出的科德 x。 我 之前写代码呢,我觉得我用 ai 用的已经算是非常的娴熟,基本上是离不开了,特别是从二五年的十二月份之后,就感觉突飞猛进。这个 ai 写代码, 所以我基本上有什么需求,只是提需求,然后让 gpt 去帮我写。但是过去的一直的方式就是我提需求,然后呢,提给 q 的 gpt, q 的 gpt 把代码生成之后,我把它拷贝出来,然后贴到我的 pcm 里面的工程里面, 这样去做这样的一个工作啊,如果我要他优化我的代码,我往往会把整个拍摄文件考给他,然后告诉他说,请帮我优化这个文件。优化哪一方面,同时哪些是不能动的啊,哪些是应该要优化的, 请直接返回优化之后的完整的代码给我。我一般都这么懒啊,除非是有指定某个函数的,否则有时候一整个文件要改动的,我都是这么个方式。 所以呢,也现在是四月份,将近五月份了,基本上这半年都是这种,往前也是一样的,就是更多的是用它的 gpt 去编程, 但是最近一个月经常听到的就是叫做 cloud 克的和克的 x cloud 克的可能用的人会更多一些。嗯,听了一个月了, 无论是刷抖音还是刷小红书,这两个名字不断的徘徊,不断的在我耳边响起,但这都不是直接触发我会去用的,触发我会去用的,是 我一个老同学还在一线去写代码的,他不断的安利我。哎呀,你真的应该要用一下克拉的克的或者克的 x, 他 用的是克拉的克的, 但是我没有接触 cloud q 的, 我用 q 的 gpt 的 时候,它老是弹那个 q 的 x 叫我下载,所以呢,前两天我就真的去下载了一个,下载了安装完之后呢,它有两种登录方式,要么用 q 的 gpt, 要么用那个 openai 的 app secret。 我 一开始是用 openai 的 secret, 后来我问了一下,就是如果你用 openai 的 secret, 那 么意味着它是按需去计费的,按照你的 token 消耗量 啊。如啊,如果我本身穿的 gpt 就是 plus 版本 plus 会员的话,他其实只要你不会超出他的量,其实是免费的,他有额度给你的。所以我因为我也不会高强度的写多少代码, 所以我又把它切成了以穿的 gpt 的 账号去登录。这样的话就能省一点钱吗? 因为我现在其实说实话,每天消耗在 toon 上面的费用应该也有一百人民币左右,也就是超过可能有十五十五美金左右吧。 十五美金左右,其实也不算少也不算少,每天十五,每天十五美金,哈哈,所以,所以,所以能省就省一点。然后装了这个科德 x 之后,我发现真的是 太牛了,太牛了,就是我再也不用考来考去了,这是其一,其二就是我感觉他能够整体的理解你的项目, 所以当去改动一个项目,嗯的时候,他会去分析你整个项目的代码老,而且他会把这个分析过程 展示给你看,这个很有安全感,知道吧,一开始我只是我特别怕他把我项目搞崩,所以我只是让他改很局部的代码试一试, 发现还好,慢慢的我就大胆子大一点,有的时候甚至让他改动的东西是全局变量类似的或者是会影响到好几个文件的,发现他也解决的非常的好,非常的好,真的比我们能解决的还要好。 然后呢,他每改完之后呢,他会告诉你他是怎么改的,然后怎么结果,包括后面 他改完之后我会让他说,那你提交代码吧,他会自己操作 git, 去 commit, add 等等,还会的否看一下哪些变化。并且他每次改完之后啊, 他还会有一些 git 指令,我都不会用。我十几年程序员很少用那些偏门的,但是他都会用那些去检查啊,这个搞那个搞,保证什么项目工作空间清洁啊,乱七八糟的。 惊呆了,真的,那才真正的是个老程序员。所以我现在才用了这个 qd x app 大 概不到三天左右,我觉得我已经回不去了。已经已经,如果说哪一天没有 qd x, 我 简直不会写代码我简直不会写代码。 而且我同学说你如果再装一个插件的话,那个牛从提需求到审核到编码到测试用力等等,一条龙帮你服务。 所以真的 ai 真的 是日新月异,还是有些人说,哎呀, ai 取代不了程序员,哎,真这个没有意义对吧。那种就是真正的没有去用 ai 去辅助自己编程的人。 那种就是在民国来了的时候还在脑袋后面留辫子的那群人,没希望跟他们做辩论也好,对吧? 没用,你不需要叫醒那种顽固派保皇党。哈哈哈,保皇党舍不得割辫子的人。所以年轻人啊,你们这些年轻的,特别是零零后, 哎,如果你已经是学计算机的,也不要焦虑,你一定要用上最先进的生产工具,扣的 x 或克拉的扣的,真的,那真的会颠覆你的认知和你的,那你的能力增增强,不是简单的什么十倍百倍,他是能够让你从一个普通人变成陆地神仙的那种感觉。 真的,以前你不敢想象他人的想象力,他不是按限性去扩大的,他是一种指数性的。就你如果能驾驭好 ai 之后,你的想象力还有你的这些构造能力会越来越强,真的会越来越强。 我现在在做跨境电商,但是我也会去用代码,为什么呢?说实话, 我代码自动化的水平已经很高了,如果说一个小公司做跨境电商,他如果是还用纯人工的方式, 那么我现在每天代码帮我处理的工作量可以抵得过十个传统的电商运营人员。毫不夸张的这么讲,所以,而且 我代码的运营水平还不低,所以我觉得这个真的是 日新月异, ai 辅助我们去做这件事情真的很重要,非常的好,非常的好。 总而言之呢, ai 得用起来,特别是年轻人,老头老太就算了,该淘汰淘汰掉,哈哈哈,拜拜。

有了叉 gpt 和 codex 之后,你一定要试的五个功能,做 ppt、 做漫画、做动画、做游戏,还有养电子宠物这五个功能,今天我给大家一一的去演示一下,那视频可能略长,欢迎大家先点赞收藏,慢慢观看。 第一个做 ppt, 例如你看到了一个好看的图片,比如这张你可以把它发给那个 gpt, 就 在对话框里面,你让他根据配色和设计感,让他帮你出整个模板的设计方案,还有视觉的一些定位等等等等。你看这里,他把这个风格定义为流光花雾,我觉得就非常的准确, 他会把整套的色彩设计用这语言给他做完整的一个设计。哪些页,比如说有些是图标,有一些卡片,有些是引言,有些是结束,他会有一个模板的规划出来。 你看你看这里,我就忍不住说,你可以直接做 ppt 模板文件吗?他可以的,对,他直接可以在里面做可以 编辑的 ppt 文件,这个文件可以下载到本地,然后变成 ppt x 的 格式,你可以自由的去编辑,但是我觉得这个不够还原,于是我让他直接先根据严格参照我这个美学东西,再严格设计。 你看他这里非常的严谨,他先把各种的框架给列出来了,再去列色彩等等的,把草图用这种文字给他画出来,真的非常严谨。让我确认之后,我再让他开始设计, 在这里主要用到 p ppt 现在非常强的两个能力,第一个是图像生成,那这个我猜大家在各种地方也刷到了,它图像生成能力其实极强。那第二个它是能够批量去生图的,你看它一次能生成好几张图,我经过测试,它好像一次最多是能生成十张。 你可以一张一张的让他把这二十页模板的素材都做出来,或者直接在一张图里面把所有的版式都做出来。比如说像这里把一张图里面把所有的版式都做出来,你确认之后,你让他再开始设计,那中间可能需要微调,但我觉得这个最后的还原效果还是挺不错的。 你看它最后还原,你看它效果什么的都挺不错。你下载到本地就可以进行编辑了,做成可以编辑的 ppt 文件,在这里直接可以下载。那我记得这是海外预藏家里面唯一一个能在对话框里面直接生成这种 美学感极强,又能直接编辑 ppt 文件的,这 gpt 现在还是比较的良心。第二个是做漫画,这里你看你可以找到一段小说的剧情,或者任何你自己写的,都可以 把它发给 gbt, 让他去帮你设计整个漫画的方案。你看他会从每一页怎么设计啊,文案什么,画面是什么啊,分清重点是什么的,让他就可以进行一个设计。 那这里我先跳过中间的部分,他同样是可以给你批量生成,你确定一些风格之后,你让他批量生成。在这里我做了一些例如这种国风的美男型的,这个是一个小说人物,把它做成了,我感觉效果还是很不错的, 前几页可能偏洒脱,对,后几页开始逐渐觉醒,他会有一个情绪的递进,那这个其实他在画面还原上也会体现出来,到最后几页就会变得很帅很燃,你看他放一些大招什么的,你还可以让他继续设计, 他一次是能最多生成十页,就跟图像一样,他一次能生成十页漫画。但比如说你要让他更严谨点,逐页生成更严谨也可以更好。 那这个是比如说国风的,还有其他风格,大家可以去试一下,比如说这种可能 p 的 比较乱的,这种黑白,这种彩漫风格、泼墨风格的都可以生成, 效果真的都非常好,非常的帅。第三个是做动画,那其实刚刚开头这个动画其实就是 g p t 给我做的,你看这是我在它的浏览器里面,那这里主要用到两个 skill, 一个是 hyperframes, 那 这样的 skill 可能大家在其他地方都刷到过, 那现在 gbt 是 直接在它官方的 codex 所说的 codex, 它的官方的插件市场里面可以去安装,到我这里给大家演示一下。 大家在这个 codex 的 插件市场里面,在底下这一栏下面就能找到 remotion 跟那个 hyperframes 两个插件,你直接在这里一键就可以进行一个安装。 这两个 skill agent 其实是在很多的 coding agent, 比如说 oracle 或者 jimmy, 什么 anti gravity 或者是 c r 页面都可以用。 但我自己体验下来,我觉得现在 codex 的 可能由于 g b t 它的智能水平非常的高,我自己形容下来非常的省事,而且做出来效果非常好,反正是比 jimmy, nike 要好。如果说大家现在用不了拷 codex, 由于各种各样的原因,可以尝试用 codex 去做一个平替,试一下 他能做什么样的动画,他真的我觉得他什么都能做,我们现在看 remotion, 这就是 remotion, 比如开头这个动画,这个凯片弹出的动画就是他给我做的,还能让他做什么?比如说这个演示是 full 架构,这个可能是一个 ai 的 一个底层的一个架构,普通人我自己反正是不懂,让他去给我设计一些这种很好玩的动画去呈现, 他能图文动画方案什么的自己去全包了设计,你看他就一段能解释清楚,包括你让他做一些,比如说太阳系运行的一些动画,他也能简单做出来,包括一些这种产品演示的,或者是 logo 图形的动画,也可以试一下。对,第二个就是这个 hyperframes, 他 同样也是,我就给了他一句话,你说你帮你,我就跟他说你帮我演示一下人类进化的简史, 你看他做了一个很高级这种,你看从一开始的这种啊,土风火种,到后面我们开始进入农耕文明,到后面我们开始有社会,开始有组织,开始有体制,还有帝国,有宗教什么的。你看他简简单单就写了一个这种 东西,你看你直接拿去录屏讲解,或者是直接做成视频发布,都非常的成立。第四个是做游戏,但首先 codex 里面有内置一个很强的一个插件,它叫根 studio, 我 的理解就这里面其实打包了非常多的那种 很专业的那种游戏设计的经验思路,还有各种游戏的原型等等。首先你一句话就能设计像贪食蛇这样的简单的这种网页游戏,你看这是一个贪食蛇,他死掉了,你看杰杰在这里就可以玩,他是一个完整的一个贪食的游戏,还是一个霓虹风的,这个你可以自己去定义风格。 对,如果说你不满足于这种即食的一个比较简单的游戏,你还可以通过例如说先设计游戏资产 在做比较复杂的游戏,比如这里我让他先又让 gbt 在 兑换往里先给我设计游戏资产,比如说这里有敌人狙决,动作环境等等, 那主要是为了省一些这个 codex 的 额度,你再回到 codex 里面,让他给你设计根据本地的资产什么的游戏。在这里我做了一个横版过关的这个类恶魔城的游戏,给大家演示一下,功能也非常完整,可以上下左右跳,还可以攻击,有小怪, 对,有远程的小怪,有近战的小怪,还有狙盾的小怪,就会射击有点难,我自己都有点打不过。对, 好,这个是做游戏,你看他同时刷新就可以,他有复活的二人跳什么的,对,算是一个完整的一个游戏。最后一个我们回到做电子宠物,那这个其实我相信,如果大家玩 coco 的 可能有发现,那 coco 可能当时没有去认真的做,现在我碰一下他做了 这个宠物有两种玩的方式,第一个你可以用官方自己的宠物,你看这里,你看在大家进到这个设置, 在外观往下滑就能找到它给你内置的一些就能找到那内置那个选择。对,它内置挺多,你你可以再随便选一个开始点,比如说我们刚选过这一点唤醒宠物,它就有这样,这个宠物它是两个功能,一个是说它能显示 codex 的 状态, 你看他自己在跳,他可以显示口袋的状态,如果说完成一个任务或怎么样,他就会跳出来提示你说口袋已经完成任务, 如果说你不满足于这种口袋是给内置的宠物,你可以自己去设计,你可以让他,比如说我就让他给我设计一个兔子形状的这么一个宠物,让他冒出来他会有,你看他也可以自己进行一个拖动,他有这种情况,你可以喂食,可以摸他,可以让他睡觉,让他叫醒等等等等。还有几种状态 你都可以去设计,同样也是说先设计这个动物自己的游戏的,不对,不是游戏就动物自己的动画资产,你看这里有再把它变成动画的功能等等,这就是今天想给大家介绍的五个功能,有一些可能需要去开动 plus 才能体验, 然后总之大家就去玩一下,非常好玩,尤其说我的扣带,可能现在真的很好用,刚跟进什么的,谢谢大家,我是 coco 二。

口袋终于实现国产模型自由了, dc 切问质谱随便切,重点是绘画记录还能够完整保留,这下真的不用再整天盯着额度了。这次使用的工具是 echo ball, 你 可以理解成 给口袋加了一个模型切换器,上次我们连接 dc 的 时候还要配 cc 叉和 cc switch, 这次更加的简单,模型都放在同一个面板里面,想用哪个直接切?安装包我都已经整理好了,下载之后直接运行就行。 我们先来打开这个 echo board, 左边点击我们的模型中心,这些模型呢都是可以直接链接的,只要符合 open a 的 协议就没有问题。点 击模型,然后添加我们的模型 id 还有 api key。 接下来我们再点击右边的应用管理,这里可以看到有很多的 ai 工具,但这期我们主要讲的是 code, 所以 我们先找到 code, 点击我们已经配置好的 d c 模型,点击启动就会自动弹出我们的 code, 看已经切过来了,我来测试一下,让他解析一下 echo ball 这个项目。 ok, 没有问题。重点来了,直接回到我们的 echo ball, 切换千问,点击启动就会自动重启我们的 codex, 看刚才的聊天记录都还在继续追问,刚才那个项目他也能够接的上。模型都放在同一个面板里面管理,不用反复去配置,这可比以前舒服多了。最后再给大家补三个坑,第一个我测试的时候发现先换回默认的 open ai 反而会丢失他的绘画记录,检查后发现原来是工具里面的一个小 bug, 不过包里面的版本已经是修复好的。第二点是部分的绘画可能会出现模型切换之后不能继续对话的情况,因为不同的模型对话里加密信息和工具调用状态他不一定能够兼容的。建议切换模型之前呢,先总结一下上下文,然后新建对话,再继续项目。 第三点,很多朋友也反馈过, a p i 模式下没有办法正常的去使用插件,但是我最近看到一些解决方案,这两天我会再去实测一波,到时候再给大家分享,不过目前又是不影响的,是可以正常使用的。今天的分享就到这了,我是木马,每天一起玩 a 的 赛博大志,咱们下期见,拜拜!

hello, 大家好,我给大家介绍一下我做的 codex 的 小屏幕,那它是一个小单板啊,可以看到它可以把 codex 的 所有的状态, 包括你当前 agent 所处的啊,用的模型,推力强度,还有是否是 fast 模式 啊?包括还有几个啊,我们的五小时窗口和周窗口,以及当前的上下窗口的占用啊,都会给你显示出来。然后呢,它还支持语音呢? ok, 我 演示一下,现在是见证奇迹的时刻。 ok, 那 这个就有语音了啊,然后可以把它删除啊,可以把它删除。 ok, 那 现在我让我们让他正式来干个活吧。啊啊,好,这样展示一下会比较好,帮我介绍一下这个项目。 ok, ok, 让他接着干。那我们可以看到,其实可以通过这个窗口,基本上所有的活都可以通过这个小玩意给它 让他干了。那跑起来之后呢,也会有一个跑马灯,也是正在 working。 呃,你的 qd 人才也会 跟着这个小屏幕交互下去,完成相应的工作。 ok, 那 就演示就到这里,大家觉得酷不酷?

跑通了 codex 的 y research 蛮有意义的。它挺有意思的,因为我终于可以用 trevor 这个工具搜索工具做事情了。嗯,现在 codex 就 可以帮你一步步的弄。是这样子的,我之前也是用 codex 做了一些调研,我发现做出来的质量不是我想要的。 通过,哎。这里有一个浏览器的插件,它可以用 chrome 和浏览器的插件来做。呃,检测出来表报告还能看。后面我一顿搜索,找到了 codex y research 这一个东西,觉得确实编排的很不错,希望对你有帮助。

codex 加飞书 c i 简直就是王炸组合,如果你的工作场景里面经常要用到飞书,那我真心建议你一定要把飞书接入 codex, 因为我自己本身就是在做自媒体和内容电商,所以我对竞品内容分析有非常大的需求, 但是市面上很多软件和系统都非常的难用,以及我在用 codex 之前,我自己也搭过一个,只不过是用扣子去搭的一个工作流, 非常的困难,拖拖拽拽搞了我非常久的时间,但这一次用 codex 加飞速 c l i 一个小时不到就帮我全部搞定了,给大家看一下,从提需求到他帮我规划只用了两分钟,然后到确定他帮我搭建这一个系统,只用了二十三分钟。 这个是我让 codex 直接用飞速 c l i 搭建好的一个表格,这个程序它是已经写好了,只要我复制小红书链接,它就可以自动帮我拆解标题,还有正文,还有 视频口播的这个脚本。我觉得视频口播的脚本是对我来说最重要的一个部分。 ok, 那 我们现在复制一个链接,让它试试跑着看, 它现在已经自动在跑了,然后已经在处理中,大家可以看一下。好,它不到两分钟就帮我已经拆解出来了, 对,我们来看一下啊,还是非常非常牛逼的。那其实在我搭建完这一个表格之后,它帮我拆解完视频口播脚本这一部分,其实我没有用到任何的 token, 只是一开始让 codex 帮我开发的时候需要消耗一定的 token, 等后面我再用这一套脚本去跑的时候,已经完全不需要任何的 token, 它花费的额度基本上为零。我在扣子上面搭建这样的一个工作流,还需要我付一定的额度。但其实 codex 已经在这一个文件里面写好了,这个脚本 我在跑的时候就完全不需要消耗额度。但是如果要让 ai 基于这一个口播脚本去分析改写的话,就需要接入一定的 token。 如果你感兴趣的话,我下期也会分享我是怎么用豆包或者是 deep sync 接入到这一个程序当中,让它帮我搭建后面的分析和改写。 所以说大家一定要去接触一下 codex 和飞书 c l i。 如果你也对 ai 加电商, ai 加业务落地感兴趣的话,后续呢,我也会持续更新我的一些实际案例,欢迎大家一起交流。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

很多人用 codex 第一步就错了,前两天我发了一条用 codex 做标书的视频评论区,最让我意外的不是大家不会用,而是很多人还在研究怎么去接这个中转站,怎么去用这个便宜的模型啊。我的观点很简单,就是 你用 ai 去做正经的任务,最不该省的就是模型钱,因为真正贵的它不是调用的,这个费用是返工的成本。 好的模型,你十次里面可能错一次,你检查一下,修复一下就 ok 了。但是你差一点的模型,你十次里面可能会错三次,甚至错五次,每错一次,你都要重新去判断这个逻辑对不对啊?结果能不能交付啊?后面还有没有坑 对吧?就是这里可以看一下啊科特官方的这个 benchmark 的 图,它不是为了证明某个模型永远是第一,而是说明了一件事情,就是在真实的编码的这个场景下,就长模型之间的差距都很明显了,更别说你用这个便宜的模型去代替。 所以如果你只是玩一玩的话,用什么都可以。但是如果你要写方案,要要写代码,去做商业的分析,甚至是你呃,要任何交付给这个别人的东西,你都要用, 就是你直接能用最好的模型就用最好的模型啊。再说 codex 跟 cloud code, 如果你是中文用户,尤其是在国内使用的这个环境下,我会更加偏向 codex, 因为 astropica 它对这个中国的用户限制更加的多,然后它的表述也不是很友好。 而 codex 在 我的使用体验里面的话,它不管是成本啊,能力啊,还是这个中文场景的平衡,它要做的更好一些。就如果说只是国内的 ai, 那 我推荐豆包,而如果是复杂的任务,我还是推荐 codex。 就是 最后一句话, ai 工具它不是说谁单次调用更便宜,它就它就是更便宜的,而是能够让你去少返工,更少的犯错,稳定的能够去交付,所以才是真正的便宜。

大家最近使用 codex 时,额度是不是又不够用了?或者你是一个小白,还不会配置上网环境,连切记 gpt 账号都注册不了, 那么这期视频我会手把手教你,将性价比之王 deepstack v 四接入 codex 中,国内用户直连兼具经济和性能于一体,可以说是国内入门编程者上手的最优解,我们直接从零到一进行教学。首先打开网页,输入 node js, 点击进入,进入官网后我们点击获取 note g s, 之后选择对应的操作系统,点击安装程序,国内直联的话下载速度很慢,大家耐心等待。下载完成后,我们打开安装包,最后一路点击同意完成最终的安装。 下一步呢,我们搜索 codex 桌面端下载,点击第一个我这里以 windows 系统下载为例,我们找到微软应用商店,点击下载之后打开下载的程序, 下载完成后就会出现 codex 桌面端登录的一个页面,然后我们先不用管它,我们还需要 c c x 和 c c switch 这两个工具,有需要我飞书的小伙伴点赞评论加关注,我也会把我的飞书链接分享给大家。 我们将这两个安装包解压,解压之后点击这个 c c x, 然后这里有一个环境配置文件,这里可以看到我们的这个 s k 是 一二三四五六,这个大家记一下之后点击下面这个程序,然后我们找到这个管理界面,把这个链接复制粘贴到网页端, 打开之后我们在这里输入刚才的那个 s k 就是 一二三四五六, 然后我们点击这里切换到简体中文,然后我们点击这个 codex, 点击添加渠道,之后我们进入 deepsafe 的 官网, 点击 api 开放平台,然后我们自行登录之后找到这个接口文档,我们将这个 baseurl 进行复制,然后返回在这里粘贴。之后我们在 deepsafe 的 apikey 里点击创建 apikey, 这里随便命名, 然后点击创建,之后进行复制,同样在这里进行一个粘贴,然后呢我们点击右上角的详细配置,在这里把服务类型选择成 open i chat, 然后我们下滑,找到这个规范化非常键,我们将这个进行开启,之后点击创建渠道即可。接下来我们找到刚才解压的 cc switch 这个软件,我们同样的进行登录, 安装成功后,我们打开 cc switch, 然后在这里选择呃切的 gpt open i, 我 们点击右上角的添加, 选择自定义配置供应商名称,随便起一个名字,这个 api k 还是我们的环境配置的 k, 就是 一二三四五六。 之后 api 请求地址呢,我们就返回 c c x 中的这个 api 地址,我们将这个地址进行复制,然后在这里进行粘贴,之后点击获取模型列表, 这里我们就可以看到我们已经获取了 deepsea 的 v, 已经获取了 deepsea v 四的两个模型,然后我们往下滑,把这个一百万上下窗口进行打开,然后点击添加, 之后我们关闭 codex 进行重启,这里大家稍等片刻,因为是国内网络的指令,所以说它会有一些延迟。重新打开之后呢,我们选择这个 enter api, 然后输入一二三四五六。 进入之后呢,我们点击上面的 file, 然后点击 settings, 我 们在 general 下面往下滑,然后找到呃这个 language, 进行一个汉化,然后我们在这儿选择中文。进入之后,我们输入对话, 可以看到我们的 deepsafe 已经接入到 codex 中了,我们也可以直接让 codex 帮我们安装 skills, 比如我视频开头制作的 ppt, 就是 用这个 ppt skills 制作的。我们只需要在网页上输入我们想要的一个 skills, 找到 github 的 原始仓库,我们打开, 然后将这个链接地址复制到 codex 里,让它帮我安装这个网页里的 skills, 然后它就会一步一步自动化地去执行我们的操作,最终帮我们安装上了这个 skills。 然后我们之后制作 ppt 的 时候,它就会自动调用这个技能,帮我们生成这样风格的一个 ppt。 这个是 skills 的 一个安装技巧。本期视频就到这里,如果觉得对你有帮助,别忘了点赞关注,谢谢大家!

挑战只用抠代码上班办公的一天,比如像这样全自动生成出数据报表这样的 ppt, 还可以把写好的文件做成这种视频演示动画, 同时还可以接入飞书,实现自动做表格修改内容总结,群聊消息,还可以用手机端一键部署任务,发文件等等操作。最后我还打造了一个网站,并且成功上线。以上的几个实际案例呢, 看似没有关联,实际这是模拟真实工作的一天,并且全部用 q 代码完成。故事是这样的, 早上你接到老板发给你的一堆数据报表,老板让你做成直观大气的数据报表,然后又让你把这些报告结合企业情况做成一个 ppt, 最后还要求你把这些内容做成网页,并且今天就要做完,你听到后立马就开干 了。那我们现在先完成第一项任务,就是让 codex 帮我们把这个数据表格转化为更加好看的格式化数据报表。这里我写好要求后, 把权限设置为自动审查,这样在他执行任务的时候,我们几乎不需要操作,只需要等待他完成就可以。模型思考程度我们可以选择中或者高, 如果选择高,他的运行时间会更长,而且消耗的额度会更大。如果是简单一些的任务,我一般推荐使用中等就可以。现在他已经为我们生成好了这个网页,我们看到这里他一共用时了六分钟零三秒。 现在我们打开这个网页看一下,我们可以选择这里,点击直接打开扣代码中直接内置了浏览器,我们打开后就可以预览, 我们可以看到这里它已经把我们的数据做成一个详细的网页了,并且这些按钮是可以点击的,因为我们后续是要做 ppt 的, 我们想把这些表格数据呢插入到 ppt 当中,那我现在让 codex 重新修改一下,把每一个数据报表做成一页 ppt 的 形式。现在我们看到 codex 已经帮我生成好了,并且他告诉我他已经生成好了五个报表的独立网页。我们可以打开我们的项目文件夹来看一下这五个文件。现在他把每个报表都做成了一个独立网页。 考虑到那个万恶的资本家观看的便捷性,我们可以让 ai 把这五个报表都转化为 pdf 文件。我们看到 现在 codex 正在帮我们把网页转换成 pdf, 他 在努力的工作下载各种插件。那现在我们可以不用等他,我们可以继续工作来创建 ppt。 我 们点击这里的创建新对话,这时就会重新打开一个对话窗口,而且之前的任务还会继续运行。 在制作 ppt 之前,我们可以问 codex, 我 想做一个 ppt, 有 哪些 skill 或者插件可以帮助我们提高 ppt 制作的美观和专业度。这时我们可以看到两个任务在同时运行, 也就是你的工作效率现在就是翻倍了。如果你还有其他工作任务,可以继续添加,如果十个任务一起执行,相当于你的工作效率就翻了十倍。我们可以点击这个设置,再点击这个剩余额度, 可以看到当前我们剩余的额度有多少。我个人使用下来基本上 plus 额度就够用了。现在我们看到这个网页报表任务右侧已经变为了蓝色,代表它已经执行完成, 我们点击看一下,这时我们看到这个 pdf 已经完全编辑完成了,如果哪里需要略微调整, 我们可以用其他的软件来手动调整一下。现在我们看到这个安装 ppt 插件的对话也已经显示任务完成,我们点击查看,它告诉我们 已经安装好了五个 skill, 然后它提示我们需要重启 codex 后才能被识别重启。打开 codex 后,我们还是点击这个对话,现在让它帮我们 继续完成这个 ppt 制作。在对话框中我们可以艾特我们想编辑的文件,输入文件名后,它会自动提示我们,然后我告诉他 根据这几个文件内容和刚才你安装的 skill 来帮我制作一个 ppt。 当然我们有其他针对性的要求,也可以直接告诉他。现在我们看到他经历了十三分钟后, 终于生成出来了这个 ppt, 那 我们现在打开看一下,我们点击这个打开按钮, 然后可以选择用哪个程序来打开,现在就可以看到他为我们制作的 ppt。 我 们看后面这几页制作的比较单调,而且格式不太统一, 那我们现在再让它修改一下。又经过了十三分钟的调整后,现在 codex 帮我们调整好了, 我们再打开看一下,现在看到虽然排版还有一些问题,但是已经比刚才好很多了。那这个视频我们不是主要讲如何优化 ppt 的, 我们先忽略掉 目前的一些小瑕疵,如果想调整局部呢?我们可以用这个 office 软件进行细节调整。经过了 codex 一小时的工作,我们现在得到了 ppt 和 pdf 这两个制作好的文件,那我们现在就利用 codex 让它直接把这个 ppt 还有制作好的 pdf 数据表格 发到非输的群聊当中。我们先安装非输的 c l i 终端命令,这个插件的好处就是可以让 agent 在 终端 直接调用飞书的各种功能,比如写表格,上传文件,下载文件。 我们打开飞书的 c l i 网站,我们可以通过手动安装和 agent 安装,如果想要 codex 安装,我们就复制这个提示词。打开 codex 后,我们可以点这个对话, 新建对话,然后将提示词粘贴到对话框,这时它提示我们配置命令已经生成授权入口,我们点击这个链接,在这里我们点击创建,创建好后返回 codex, 这时它提醒我们还需要打开这个网址进行授权, 我们复制这个网址,这里会提示一些权限,我们选择授权。现在它提示我们飞出 c l i 已经安装并配置完成,我们返回到刚才的这个项目,点击创建新对话。现在我让 codex 把刚才制作好的 ppt 和五个 pdf 图标一起发到飞书的工作群聊中,现在 codex 告诉我们他已经找到了这个群聊,让我们确认一下就可以,我们回复确认, 如果在这个过程中,他需要我们授权,我们按照他的提示操作就可以。 现在我们看了一下时间,完成上面两个任务仅仅花了一小时,那我们现在可以潇洒的到公司楼下点咖啡摸鱼了。不一会群里万恶的资本家给了一些反馈意见,但这对咱们来说是小意思, 为了以防万一,我们早就通过手机连通了 codex, 现在根本就不用回公司喝着咖啡,简单一条指令, codex 将继续为我们干活。那如何在 codex 中连接手机端呢?点击左上角的设置, 在这里点击 codex, 然后我们点击连接,在这里提示我们登录的话,我们点击登录就可以, 我们点击授权,这时我们在手机上就可以看到电脑上的项目,点击对应的项目后,我们就可以让 codex 在 电脑端帮我们工作。我现在让 codex 直接把这份 ppt 变为一个网站,我们可以看到在手机端它已经开始执行任务了,并且在电脑端我们也可以看到这个任务。 为了方便演示,我之后还是在电脑端给大家演示功能。如果在执行任务的过程中,我们突然想起来还有一些指令当时没有写完,这时也不需要终止指令, 这时我们提出修改意见后,正常新的命令是需要等上一个命令执行完成后他才开始执行的,这时如果我们点击引导,他就会把这条新的指令注入正在执行的任务中,来,参考你新的指令,重新思考。经过了十二分钟, 这个网页已经制作完成了,我们打开看一下,我们看到整体的排版布局 和色调还是非常不错的, codex 软件内置了一个简易版的浏览器,并且如果我们想修改这个网页,可以给这个网页添加注视, 我们点击注视,如果想修改哪里就在鼠标点击哪里,比如我想修改这个区域,点击后输入想修改的具体内容,我们可以点击发送直接修改, 也可以按住 ctrl 加回车继续添加注视,点击直接发送后,它就会立刻给我们修改。修改好后我们再点击看一下,这时的历史记录已经按照我们的提示修改为时间线的形式。如果我们还想修改其他内容, 也用这种添加注式修改的方法会比较便捷。那现在我感觉这个页面整体都是静态的,比较单调,我想做成一个有动画演示的效果。现在我们开始使用 codex 中的插件,借助插件来达到我们想要的效果。 那我们今天就用 remote 这个插件来演示,这里我已经安装了,如果没安装呢?这里会显示一个加号,这样我们在跟 ai 对 话的时候,可以直接让它调用这个插件。比如现在我新建一个对话,这里我输入斜杠, 再输入插件的名称。现在我让 codex 用 remotion 这个插件来给我们的网页中增加一些视频,让它在合适的地方插入,增加整体网页的动态效果。 现在它已经生成好了,我们来看一下效果。我们可以点击这里,直接使用电脑中的默认浏览器打开我们看它在这里给我们加了一个视频。这种制作视频的方法 不需要任何的剪辑,只需要提供文案和你的想法。这个 remote 插件完全是由代码生成的,那现在我们的这个网站 已经全部制作好了,现在我们只剩下把网站上传发布,任何人都可以访问。那具体需要怎么操作?如果我们不会,还是先问 codex。 在 使用 codex 时,我们要养成一个习惯,每一个新的任务 我们都需要新建一个对话框,如果把所有的任务都集中在一个对话框内处理,随着对话越来越多,他的上下文会逐渐累积,模型的执行能力会下降非常多。比如在当前这个我让他制作动画视频的界面, 我们看对话框中这个圆圈,我们把鼠标移动到这里,它就会显示当前上下文已经使用了百分之二十。那日常使用中, 我建议只要上下文达到百分之五十,我们就需要重新新建一个对话框了,或者我们还可以使用斜杠压缩的命令,这样也可以进行上下文压缩。那我们现在新建一个对话框,那我们现在就问 codex 如何能让所有人都访问到这个网页,并且告诉他如何能免费的部署。我是小白用户,他就会在网上给我们搜索符合我们要求的一些解决方案,现在他给了我们一个解决方案,我们按照他的步骤来执行。 经过简单的几个拖拽之后,我们可以看到网站现在已经可以被任何人访问到了,任何人打开这个网址都可以看到我的网页。 我们现在一看时间才下午两点,现在就把整个项目发给那个万恶的资本家,他肯定还会改改改。那我们再用 codex 的 另一个功能就是自动化,我们可以设置一个定时任务,我们还是在这个项目下新建一个对话框,我们让 codex 帮我们设置一个定时任务,让他在今晚的四点五十九分给我的飞书工作群发一条消息,内容是告诉这个万恶的资本家网站已经上线了, 如果有修改可以给我留言。创建好定时任务后,我们看在自动化这里有一个数字,一代表已经有一个出发任务,我们点开这个任务后,会看到具体的执行命令和出发时间,我们还可以点立即运行, 他就会立刻执行这个任务。在以上的五个实践案例中,已经包含了大多数 codex 的 使用功能,并且我们把这五个案例串成了一条主线。我们总结一下以上几个案例中的知识点。我们把表格数据做成网页, 在对话框以艾特的形式添加文件,设置思考强度,建立项目文件夹。第二, 制作 ppt。 我 们使用了添加 skills, 帮助我们制作出更好看的 ppt, 同时让 agent 调用生成功能插入到 ppt 当中。第三个是安装飞书的 c l i 命令,然后把飞书的 skills 安装到 codex 中,让 codex 可以 调用飞书,实现上传、下载、发消息、回复等操作。 第四个,我们构建了网页使用批注功能,对网页进行了修改,并且使用 remote 插件在网页中添加视频。第五个,我们询问 codex, 让它帮助我们把网页上线,让所有人都能访问。 如果你对这期视频的形式满意,请给一个一键三连,我将继续分享更多 ai 领域的落地实操。我是留言,我们下个视频见。

hello, 大家好,我是艺兴,然后今天趁着周末的话就给大家分享一下我最近用啊 ai 的 编程工具,手搓的一个 diy 的 ai 小 工具。 那么咱们这一期主要是通过 codex 这个新型的 ai 编程工具,手把手去手搓自己的专属的微信的小程序,那右边的话是我自己设计的一个个人的 ip 形象是不是很帅。 然后这一期主要是用的两个工具特别简单,第一个的话就是 codex, 大家直接去官网下载就可以了。 然后第二个的话就是微性能开发者工具,因为其实我们这一期是做小程序的项目嘛,所以说是需要呃借助他去进行项目的预览以及配置上线,然后大家也是去他们的一些官方去进行下载就 ok 了。 那其实做小程序和做 app 呃做产品是一个道理,那流程也是非常简单。那首先第一步要先给 ai 描述清楚我们想要什么样的产品,整理好一定的需求文档,然后让 ai 帮我们去完善我们的需求 md。 然后第二步对应好整个 app 的 一个视觉风格,然后告诉 ai 你 想要什么样的效果,让它给给给我们去输出一个规范的一个需求的文档。 第三步用 codex 去直接生成一些结合的一些需求,自动生成一些小程序的一些全部的代码。然后第四步还要通过 ai 帮我们去调试修 bug, 调细节,那全程不需要自己动手,直接通过口喷的方式,最好的方式就能够让 ai 帮我们去干活。 那么好了,废话呃,废话不多说,咱们直接上手开干吧。那么首先的话就是要打开我们已经安装好的 code desk 的 一个桌面端, 然后的话就是要找到我们的微信的开发者工具去新建好我们本次的要到的项目, 然后本次的话主要是做一个体重管理小程序,二嘛,所以说我们要新建好我们的一个项目,然后选择 ok 就 可以了。然后的话这边的话其实是不需要使用云服务的,然后这边的一个 id 的 话,主要是可以让他去所使用 word 的 就可以了。 然后的话就会来到我们这个微信开发者的一个平台,然后整个界面其实会跟我们传统的编程软件会比较像。 然后右边的话是我们的一些 c 稿的预览区,然后左边是我们一些文件夹的一些区域,然后中间是代码,然后一般来说我个人是比较习惯用那个叉的一个尺寸去进行一个预呃设计稿的一个预览的, 然后的话就要回到我们的一个科室,那首先的话就要新建项目文件夹,然后这个文件夹必须要跟我们刚刚所创建的保持一致,这样的话我们的一个文件信息还有设计稿才能够在那边去进行同步预览。 然后的话会结合我们想要的东西给 ai 描述清楚我们这个产品是什么,给大家去描述一些数据文档,然后的话会结合我们的一些模型去进行选择一些合适的模型, 然后这次的话我是通过用他们的五点五的模型去进行一个生成的,然后整体的生成的一个效率的话,其实我觉得呃不是很快,所以说我觉得如果说 talk 比较有限的同学的话,其实要呃用那个标准就可以了, 然后的话他会结合我的需求帮我去输出一个非常完善的一个小程序的一个需求,稍微能打。 然后企业家的话主要是要生成一个我的一个设计的一个说明 md, 然后这次的话我是给 ai 垫了一张图, 然后让它结合我的一个设计的一个垫图的风格,让我让它帮我结合我的需求去生成一个符合它的风格的一些设计规范,设计的一个语言的一个设计的一个 md 的 文档。 然后这次的话我也是会呃用我们的一个刚刚所生成的一个需求的一个说明它的需求分明它跟课程不一样,它是放在我们一些刚刚创建文件夹的一个目录下的, 所以说呃,我会让它围绕着我的一个呃需求的文档去进行一个呃设计风格的一个生成, 然后的话就是发送给 ai, 让它帮我去写我的一个设计的一个文档,然后的话它就会结合我的一些啊电图的一个它的一个程序版,然后它的配色去帮我去进行 ai 的 生成。 然后接下来的话就是要漫长的等待啦。嗯,整体处理的效率来说,我觉得会呃越跑越快吧, 嗯,然后就开始慢慢地等待它去进行思考生成,然后它生成完之后就会也是会生成一个 md 的 文档,整个 md 文档非常的一个详细,包括字体大小,然后设置以及卡片布局,以及它的整体的一个配色,以及我们的一个文本语言、图标风格等等。 然后紧接着的话就是要开始让 code 帮我结合这两个文档去进行首出代码页面了,然后首先会让它新增两个文件夹,让它去帮我去接这两个文件,去生成一些我想要的一些页面的一个配色的一个界面的效果,让 ai 帮我去写代码, 然后的话它就会结合我的一些需求想要的要什么样的页面,然后我的一个配色风格让我去让它去帮我去写代码, 然后整个的一个页面当中其实雏形已经出来了,然后的话其实整个效率还是非常快的,然后整个视觉风格其实会跟我电图那个视觉语言会比较搭。 然后紧接着的话就是呃继续去围绕的我们想要的一些东西,去让 ai 通过对话的方式帮它去帮我们去修代码,然后修 bug, 然后去调一些 ui 的 一些细节,例如我的设置,然后我们的渐距以及我们的一些图标的风格等等。 然后的话指出就是不断地去进行雕花跟跟进,让我们的一个心中想要的一个产品就可以了。 你要最终的话大家看一下我的效果吧。你要最终的话会来回到我们的微信平台去看一下我们整个页面的一个效果。 那其实整个页面来说,我觉得这的纯就是没有通过呃, figma m c p 的 一个代码,呃的一个设计稿生成,纯用一个对话的一个代码生成,我觉得整个效果我觉得还是不错的。然后大家看一下最后的一个手机的一个预览的效果, 那整个风格是走这种暗色系的,然后的话整个配色我觉得还是非常吸睛的,这是我通过一个纯啊对话和代码的方式去实现的一个小程序, 然后整个的空间它也是会自动去用我们一个微信的一个官方的空间去进行一个实现,然后整个图标风格我觉得还是不错的,嗯。

上个视频评论区有粉丝教我做一个详细的教程, ok, 安排用国产模型,而且要使用完整的 codex 功能,就要解决 api 代理和 codex 的 插件功能,这两个小工具就是解决这个问题的,他们都是的开源项目。 好了,安装 codex 加加,安装好以后会弹出一个命令行,不要紧张,按一回车就安装好了。接下来安装 echobird, 安装好了,打开它,在模型中心配置模型。以 deepsafe 为例,打开 deepsafe 官网,点右边的 api 开放平台,进去以后,先申请一个 api key 复制下来,再到接口文档里把 uio 和模型名记下来,转到 excel 这里配置好,这就全部搞定了。 启动的时候要注意一个问题,就是先打开 codex 加加,再用 excel 版的启动 codex, 不要用 codex 原声软件启动。这么详细的教程,快去点这里关注起来,下期不迷路!