大家好,我是一个完全看不懂代码的 ai 智能体开发爱好者,如果你也喜欢使用 ai 编程工具,那今天分享给你的这个技巧你必须要学会,在开发外包应用时,必须学会让 ai 帮你跑自动化测试。 那目前测试和审查效果最好的是 google 加上 gpt 五点四开发一款应用后,其实最难的是后面, 因为是要不断的去测试验证,测试验证,如果完全靠手动去测试,我们完全无法完成这项任务,因为人为的测试,你只能通过肉眼来辨认是否存在 bug, 但开发项目很多时候隐藏的问题,我们测试是看不见的,这个时候就需要让 ai 来帮我们执行自动化的测试和审查。 那今天我就来分享一下如何在 codex 里使用 play rate mcp 来进行自动化的蹲闹蹲测试。那为什么 codex 加上五 gpt 五点十更适合承担测试任务?如果只看浏览器自动化动作,很多工具都能做到,但当便发现问题 跟解释问题,还有补测试,补修复,在这方面勾带更加稳定。而且在最近新版本发布后,我最近深度的去使用,我感觉他不单单是跑一次测试,他还能根据结果继续定位问题补验证, 或者是给你去补一些脚本,来帮你推进更深度的审查跟修复。那搭配 playrite 这个 m c p 工具可以不需要打开浏览器,它在后端里面去自动化的去运行测试,反复的测试,直到我们的问题被修复,或者说所有的问题 被查找到。像这种适合登录表单、关键业务流程页面跳准交互的一些测试, 这个 m c p 工具完全都可以去做,那这样的开发需求对于我们这些不懂代码的人来说是非常关键的,我们就利用 ai 去完成 ai 需要的测试,这样就形成了一个更完整的 ai 开发并划我们仅需在 q 代码思里面 就可以让 ai 完成测试复测修复,还能根据测试结果继续定位问题,制定一个新的方案,帮我们完成更深度的一些修复。同样的问题,我在使用 anti gravity 加上 cloud opus 四点六模型, 确实有些问题他解决不了。同样使用这个 m c p 测试工具,但是我在 q d x 里面就能非常好的把这个问题解决。那我们大家在使用 ai 编程工具做开发的时候,如果不学会怎么让 ai 去帮我们跑测试,那你开发的项目可能就是个半成品,他一上线之后可能会出现各种问题,那如何使用 codex 加上 playwrite mcp 来进行自动化测试呢?那首先我们打开这个 codex 也变成工具,然后在左侧设置这里,进去左侧的 mcp 服务器, 那下方他会自带这样一个 mcp 工具,你点击安装就可以了,最好重启一下。那回到我们开发的页面,回到项目的对号框里, 如果你的项目已经开发完成,需要执行测试了,那你就跟 ai 说,请制定一个追演方案来使用 playwrite mcp 进行测试,他会给你设计一个测试方案,你看了没问题之后,你就说可以让他执行,那 ai 就 会调用这个 playwrite mcp, 然后去读取我们的网页,当然你这个项目一定要是网页的项目为这个 m c p 工具,它是通过网页浏览器来去帮你做测试的,那如果在测试中它发现问题,它就会给你修复,而且这个工具 他会在后端给你去执行,不需要你打开你的浏览器。那 ai 在 完成真实测试之后,他会告诉我们他测试了些什么内容,做了一些什么测试,非常详细。那我们在使用其他的 ai 编程工具做自动化测试时,给我的感受是 像 anti gravity 加上 cloud opus 四点六去做这种自动化测试,很多时候他会出现遗漏,或者说他的测试不够深度,不够准确。但是使用 code 时 来使用这个 m c p 工具来做自动化测试,它的效果真的是非常好,这可能跟 ai 编程工具和模型的关系有关吧。好了,今天的分享就到这里,感谢大家的点赞和关注,我将持续为大家分享更多实用的 ai 技能,谢谢大家!
粉丝521获赞1621

我最近找到了一个用这个 codex 最小成本进行 web coding 的 一个工作流,只需要花大概每个月二十美金订阅 chad gpt 的 plus 会员,用 cursor 里嵌入的 codex 进行 web coding。 首先我们打开一个 chad gpt 的 新聊天,我们给他要求让他帮这个 codex 写一段提示词,比如说提示词在这儿我直接给它复制下来, 打开一个 cursor, 然后这里打开两个终端,两个终端一个是这个 power shell, 就是 我们具体的执行的命令,在这儿执行一个 codex, codex 帮我们这个 debug, 就 比如说我们把这个指令丢给 codex, 然后回车执行就行了。回车执行之后,这个 codex 会帮我们按这个需求 修改这个代码,然后它自动执行,我们只用,有的时候就是输入这个继续或者回车,当这个 codex 没有权限继续进行的时候,它会给我们一段这个代码,把代码丢到这个 power shell 里面,也是回车之后 power shell 它就会继续运行。 power shell 里面如果出现了 bug, 把整个 bug 复制丢给这个 chang 的 gpt, 我 跟他说让他帮我出一段这个给 codex 的 bug 的 这个 prompt 它就会自己帮我们写,再把这个就是 bug 的 prompt 直接丢给这边的 codex。 如果没试过 web coding 的 可以试试,我觉得真的非常爽,虽然没有像其他博主说的那么轻松,好像轻轻松松动个手指,出现一个很漂亮的网页,但是真的还是很舒服的,特别是用它 debug。

今天这期视频我们只讲一件事,就是普通人怎么用 codex 开发一个小项目,并且部署上线。很多人可能一听到 code 代码就会产生畏难情绪,但你肯定听说过之前的 open cloud, 很 简单,在手机上给他发个信息,他全自动的就给你干完了,但是他贵啊,帮你发一个小红书就可能花你几块钱, 更别说开发一个工具了。但是 codex 作为 ai, 一个 open ai 的 出品,不但可以像 open cloud 一 样帮你完成几乎任何事情, 而且赠送的免费额度就能满足日常所需,如果你是会员,那更是用不完了。更重要的是,学会这种最顶级的 ai 工具,你就具备了做任何产品的能力。这期视频是 codex 的 入门视频, 我会带你从零上手,从怎么安装 codex, 怎么启动 codex, 如何与 codex 对 话,然后我会带着大家从零开始构建一个电影评分网站,并且部署上线。注意啊,就算你完全不懂开发也没关系,这期视频就是为你准备的。 我们开始首先在开始菜单中搜索 cmd, 打开命令行,这是我们与电脑和 codex 沟通的窗口,我们所有的对话都会在这里完成。与此同时呢,我们需要打开一个 check gpt 的 窗口,因为我们都是新手嘛,怎么用这个命令行都需要让 gpt 来告诉我们。 第一个问题,如何在命令行中安装 codex。 他 告诉我,首先确保安装了 node 点 gs, 我 这里已经安装了,如果没有,你可以让他告诉你怎么去安装,这里就略过了。第二步,复制他给我的安装命令,然后 ctrl 加 v 复制到命令行中, 命令行没有报错就说明安装完成了。在命令行中输入 codex, 如果能打开这个界面,就说明我们成功启动了 codex。 第一步,登录 codex 通常都会选择第一个,通过网页端完成登录,登录后回到命令行页面, 点击回车。继续我给大家讲一下最基础的配置。首先点击键盘上的这个斜杠,你可以看到 codex 的 一些基础配置项就出来了,比较重要的是模型选择和权限设置,模型我一般都会选择最新的思考时长,选择 extra high, 这样生成的质量最高。 第二个 permission, 我 选的是 full access, 所有的权限都交给 codex, 不 然它在执行任务中会一直让你去授权,很麻烦。当然这样也是有风险的,有比较小的概率它会删除你的文件,网上就有人遇到过,但是我目前还没有啊。 接下来我们就正式的来做这个电影评分网站,真的超级简单。首先我们创建一个文件夹,作为整个项目的根目录,然后我们要让 codex 进入我们这个项目,怎么操作呢?回到命令行,连续按两下 ctrl 加 c, 退出 codex, 然后复制我们这个项目的地址,打开 gpt, 问他如何让命令行进入这个地址,按照 gpt 的 指示进入后呢? 输入 codex, 这样就在电影打分的这个项目中打开 codex 了。每次重启 codex 后啊,都需要重新设置一下权限,改成 full access。 接着很关键的一步,执行一次启动命令斜杠 i n i t。 执行完毕后,它会在项目下生成一个 agent 点 m d 的 文件,这是 codex 的 一套默认行为规范手册,它会根据文件中的行为规范来完成你的具体任务。 后续你玩熟了,就可以按照自己的要求来修改这个文件了。现在呢,咱们暂时不管它,然后我们就可以来描述具体的需求了。我是这样写的, 由于豆瓣网站的电影评分已经严重失真,我打算做一个新的电影评分网站,基本实现电影的评分和评论功能。你需要完成整个项目的完整开发,并且部署上线。 你需要自动抓取豆瓣上正在上映的电影自动更新。这是一个完整的项目,你负责完整流程,最终交付给我。部署后的网址,你可以利用相关的部署 skill 来帮助你完成。如果没有这些 skill, 你 可以自己去网上搜下载下来用回车发送。 你看,他已经开始自己执行了。突然我想起来忘了跟他说一句话,按一下键盘左上角的暂停键,然后我跟他说,在交付前用肉眼检查一下,没有问题再交付给我, 这样他就会自己用浏览器打开看一下,确保没什么问题。接着他执行了大概二十分钟,最终你看他给我交付了上线的地址,后面简要说了一下他具体交付的内容,我们立刻把这个网址打开,看看效果咋样。 嗯,整体感觉还行,春节档的这几部电影也都在,不过很多图片没有加载出来,界面呢,也不怎么好看。这就是后续你需要不断地跟 codax 沟通来优化迭代的了,包括你后续想用自己的域名,也可以通过跟 codax 沟通来帮你实现。 好了,这期 codex 小 白教学就到这里了,其实还有很多使用的细节技巧,我没有涉及到,你都可以直接通过 codex 或者和 gpt 聊天快速掌握,赶快用起来吧!我是阿猪,关注我,让我们一起在 ai 潮头冲浪!

好,大家好,我是小刘。呃,今天我们一起来快速学一下这个 codex, 最近两个月我一直在使用这个 i 编工具,然后用 codex 的 话用的是最多的,然后我心想为什么要用它啊?因为它用起来非常的顺手,冰非常的爽啊。比如说我们看今天我想要打开任何的 i 工具都可以无缝的去集成,那我用的最多的是这个 iq 啊,打开速度非常快。然后呢,我们在这边开发完之后,想看效果,直接打开任何的地方全部集成过来了 啊,比如说像我们要开发一个东西,对吧?那你要开发两倍速率,你可以看到这个地方有一个 fast, 你 点一下就代表当前的速度是两倍,那很很很有一个细节的点是什么呢?就是你看这是空心的,空心代表什么?标准的你点开来之后呢, 它就变成实心的,代表当前速度是两倍,你也可以选择关掉它。然后呢每一个模型都分为推你的低中高、超高,对吧?然后比如说像我现在开发一个简单功能,对吧?一个学生管理系统给大家演示一下,对吧?那这个时候效果是把它长这样子,这个样子像它的这个啊本地的工作数, 那这时候你可以点这个地方,可以给他派生出去一个新工作数,你可以点这个斜杠,点这个派生,相当于他会把当前的这个节点呢给他来复制一份,在那个复制这个节点上进行开发, 就会有一个数的图标运行在工作树当中,如果你输入 pwd 呢,这时候你会发现它创建一个 walking trees 的 这么一个啊分支,然后呢?相当于在这里开发,你开发觉得 ok 了,然后这时候你点击 提交到本地,它会,哎,相当于给你干嘛给你提交到本地,为什么这里没有提交?是说你本地有一个修改,对吧?你没提交它不允许你你你提交,所以它其实很多地方它整的挺规范的,对吧?你看我现在随便提交一下,你看这时候我要提交本地,你看就可以了嘛,是吧?提交本地, 然后呢?你所有的变更可以在这个地方看,然后你所有的终端,比如说我想从这个地方打开终端,点这个,你看它就就开启这个地方当前的终端, 它就有一个区别嘛。还有就是为什么我很喜欢用 q 代词,我一定要讲一下,就是安装 skill 特别方便,我给大家举个例子啊,比如说我现在安装 skill 这个 skill 呢?我安装下来我可能用了呃几,就是呃三十四秒,我给大家举个例子,就是它这个 skill 呢, 是我目前见过安装最方便的一个工具,没有之一。真的特别方便啊,比如说我现在安装十个 skills, 那 非常简单,我就只需要把这一堆 skills, 哎,我这我这么,我这么跟他说啊,就是你看啊,我安装这个,对不对?按这个我我直接,我直接这样子,哎, 我就这样子,截个图,对吧?截个图好,对吧?帮我安装 skills, 你 就跟他说,然后那帮我安装 skills 回收,然后他会干嘛呢?他就真的吭哧吭哧的全部给你安装,对吧?全部安装 你不用管,就这么简单,你看他会全部的给你一个一个的安装,就是很神奇,你看他就已经开始在读了,你你,你懂吗?他就已经在安装了,就就你看这是我就全部安装好了,你看这这都是我刚刚的那些 skills, 像这些什么 u i pro max, 你 看他会自动的去,哎,去查,然后去给你安装,我就不跳过了,就是就是, 不讲这个了。然后呢,就是第一个 skill 是 安装方便,第二个自动化也方便,比如说我想要定时定点的是创建一个什么样的任务,对不对?你创一个新任务你可以去,比如说帮我总结项目,总结项目 那这个时候它会告诉你,哎,每天你选择某一个文件夹,然后呢?哪一个工作树下面,哎,就几点执行,它自动去帮你执行这个任务,真的用起来特别舒服。还有一个点什么,就是它这个额度你很难用得完, 你即使在那个你你你用起来的时候真的怎么都用不完,然后就这个地方是它的指定,就类似于 curses 的 rose 嘛,对吧?就我一般喜欢用 andy 站六去开发,我觉得这个效果还挺不错的。 还有就是 m c p 服务器也是特别方便,你这边你可以选择添加自己的 m c p 服务器。还有这个环境,你看规章就是当前你它的规章不是给你删除,就类似于回收站那个地方放十五天,然后给你消消失,它是这样子给你删除的,然后呢?包括它的整个风格我都特别喜欢,真的,我是特别的爱这个靠 text 真的 越用越好用, 就是它的功能,你会发现啊,更像是一个聚合体,就是把那些好的特性全部给你进行过来,点这个状态,你看就当前,对吧?就跟是 play 模式对吧? play 模式 i shift 加 table 一 样的,对吧?你看你开发什么东西?开发学生, 呃,管理系统,这时候他会问你问题,就相当于问你你要开发什么样的管理系统,就是相当于,哎,作为一个问群, 嗯,问题,然后还有这个权限啊,就你一般来说不要开这个,除非你对自己的这个,呃,电脑上的文件没有任何的这种,嗯,很很高贵的东西,你就可以开, 对吧?然后你看他,他就会问你一些,弹出一个 question 就 让你去选,做选项,选项题,选择题一样的,噔噔噔噔,你选完,你选完之后,哎,就就就结束了,还有就是这个可以关联云端, 然后呢,你这边有一个剩余额度,你可以从这里看嘛,就是他这个额度,我简单说一下吧,就是五小时,啥意思?就是说你这五个小时里面你能用的数量,你这还有还剩多少?归零之后你就不能用了,但是你过完五小时他会给你刷新,就是给你刷到这个全新的这么一个情况。 嗯,当然了,如果一周的额度清零了,代表你所有的这个额度都清零了,你看啊,现在这个 question 就 出来了,你看它有三个 question, 你 可以选择一次性给他回答了,对吧?你点一下,比如说我要开发一个啊,学习管理,你要开发一个什么风格呢? rockaway 加 and 赞,对吧?啊?他就会去思考,根据你这个,根据你的模式去这个文,这个 贴图也特别有意思,你看我随便截个图,你看贴个图,哎,我回车你看放大是吧,就很用的,很很丝滑。我我觉得我真的是特别的喜欢这个 codex 啊。就是用过我现在用过的好多工具啊。我先先用过了,我用过 cursor。 我 用过这个 kylou 的, 还用过 codex 的 之前的终端版嘛,对吧?我用过的特别特别多,我自己都数不出来了,对吧? 还有真的还有很多很多这种主流我就不会一个一个列了啊,我主要列是常用的。那就那你发现没有,我还是觉得扣袋子是最好用的。扣袋子 app 就是 尤其它这个技能这一块,真的,你比如说我想要部署 cloud flair, 对 吧?你安装这个部署哎步就可以部署了。我想要去跟 gitlab 进行关联,对吧?我想要去和这个 losen 进行关联。点一下又可以玩了,是吧? 非常的 nice, 真的 用的很丝滑,当然它有一些不好的点。那不好的点我,我其实也能够列出很多条条框啊。第一个对吧?它没有自己的这个 id, 呃,第二个就是整个这边居然没有个搜索,真的你要搜索某一个记名称搜不出来,这就很很很蠢的一个设置啊。我觉得真的最好就是有一个搜索, 嗯,我觉得会好很多,然后,呃,就大概这些核心功能吧,简单说了一下,我觉得就已经包含了所有核心功能了。那分支也是一样,你就可以切换你自己合适的分支,和之前一样吗?艾特斜杠,然后你可以去看你当前的这个,当前的这个状态,嗯,当前这个额度, 还有就是当前的这个,你回答的一个个性,嗯,就是学你自己嘛,对吧?好,我觉得现在没有什么核心功能,一般看的懂中文的都都都能学的会吧?这个这个工具没有没有啥好讲的,但是我还是想跟大家分享一下。这个工具真的很好用,很好用,我强烈推荐大家试试。

windows 的 windows 桌面端已经出来了,我深度体验了三天,接下来就跟大家录一个视频,说一下我在使用的过程中遇到的一些问题。首先这个页面就是我们下载的这个页面,直接点进去就可以下载,它是直接连接 微软的软件商店的,所以我下载的时候遇到的一个问题就是我的版本跟这个商店他不符合,因为我的电脑版本我是 win 十,我没有升级到 win 十一,所以说我在下载的时候他就说跟版本不符,我这个时候就准备了一个这样的升级,就是关闭系统防护的升级,还有一个是这里升级的一个文件,就做了一个升级就可以下载了。 下载之后我看到有朋友说下载之后有闪白的问题,所以我没有遇到闪白的问题, 下载了之后就进入到这个界面,其实因为我是代码的小白,我不知道这个界面之后应该怎么去按嘛,我看网上的教程大部分都直接是这个界面了,所以我当时还研究了半天这个地方直接添加项目就好了,添加项目它会让你选择一个文件夹, 我就建建了一个这样的文件夹,再添加项目,选中这个文件夹之后就能来到这样的一个界面。这样一个界面之后,主要我是看一下我们的左下角,它这个地方有一个剩余的额度好像,因为我 gpt 开的是 plus 版本,好像是可以额外再给两倍,反正这个剩余的额度,比如说百分之百,百分之七十六,这个是一周的,每天会给你多少小时,这个就是剩余的额度反,每天都非常的够用, 我看遇到最多的一个问题,包括我自己也遇到,你给他发了一个东西之后,他一直在思考,你看我这个,我三天之前发的,他一直在思考,我又开了一个新的任务,他仍然在思考,这个是怎么解决的呢?我换了一个节点,把 gpt 的 网页版,网页版打开,打开 gpt 的 网页版,打开了之后,换一个节点,我们可以在新建一个新县城,相当于是在这里去给它输入新的任务,最新的应该一一的,它就可以正常的去操作了。 好,下一个就是关于怎么能更好地使用它,其实我是一个代码的小白,我不知道该怎么去使用,有人说这个地方会有一些 skills, 我 没有额外的安装,我觉得基础的就够了。我这里其实主要是想说不要把它当成一个 ai 工具,就把它当成一个纯写代码的一个东西。那么其他的我建议要跟一些 ai 的 工具去做一些搭配着使用。比如说我最开始是搭配着 gpt 去使用的,就相当于用 gpt 给我的一些指令,我再导入到 codex 里面,让它去给我运行。 但是我深度测试了三两天,我发现 gpt 出来的东西仍然不能看,最后出来的这个效果不尽如人意。我在昨天下午我又深度的去换了一下,我换了一个 germanlab juma 之后,我用的 pro 的 模式,虽然我的 gpt 也是 plus 版本的,但是出来的效果不太好。我又用到了 pro 的 这个版本,就 juma pro 的 版本,给它输出我想要的东西, juma 会把它翻译成机器能读懂的这个代码语言,我再导入到这个 codex 里面,让它去给我运行,最后花了半天的时间,昨天满打满算应该是一天的时间,我最终把这个东西给研究出来了,当然 最后的结果是失败了,我开发的这个东西它是失败了,但是我建议大家如果要去使用它的软件搭配着用,就用其他 ai 工具搭配着用,不要直接在 codex 里面去提问。你看我之前就是遇到一部,我就问那个 codex 它该怎么弄,它就给我弄得很乱,因为我不知道怎么写,所以我就跟着它的步骤去, 但是他给我的步骤就又长,他会你问他一句,他说一句,他就不站在那种能完完全全解决这个事情的基础之上。但是 german 呢?给我的感觉就是他想他能够对准我们的这一个核心的目标去给你拆解,因为这是我整体使用 codex 的 一个感想,如果大家有其他的问题,也可以积极的去交流。

虽迟,但到苹果 xcode agent 模式来了,内置 cloud 和 codex, 谁懂呀? ios 工程师终于可以支棱起来了。你只需要一句话描述需求,比如给我用 weatherkit 加个七日天气预报,界面要 lucy glass 效果, xcode 就 会联动 ai 代理,把任务自动拆解成一步步查文档,加权限,写服务层,建示图, 甚至自动构建和修 bug。 还能调用 xcode 的 本身的工具去查官方文档,看项目结构,列出翻译错误,然后自己别带修正。在 ai 领域慢半拍的苹果这次没造新概念,而是用 m c p 协议,把你最熟悉的 xcode 直接升级成了能调度多 ai 智能体的开发中书。第三方分为编程工具,瑟瑟发抖。

为什么我说现在就是你开始 vaping 的 最佳时机?因为现在开始的成本真的很低。 openai 的 创始人 sam ottoman 在 推向上宣布,他家旗下的 codex 能免费用了,而且免费的不是什么渣渣模型,而是 openai 最新的 gpt 五点三。 codex 速度更快,逻辑更强,完全不输隔壁添加了 cloud ops 四点六,那我已经深度使用一个月了,并且已经手搓上线了自己的产品。那么这期视频我们一起来学习一下如何正确使用 codex, 开启你的 web coding 旅程。 给还不了解 codex 的 同学简单介绍一下, codex 是 open ai 旗下的编程智能体,而隔壁 cloud code 是 同一种产品,有了 codex, 再加上 gpt 五点三的模型,就可以愉快的编程了。 一般人看到黑底白字的命令行界面估计就被劝退了。别担心, codex 不是 硬核的即刻工具,它有正儿八经的图形界面,官网下载、安装、登录一气呵成,没有什么要你做的复杂配置, 接下来的内容很关键,你要搞清楚两个概念,工作区和 thread 工作区。你可以理解为你的项目文件夹,比如你想做一个网站, 先建立好文件夹之后,所有的代码文件都会保存在这里。而 thread 就是 一个个的聊天窗,这些聊天窗就是 一个个的任务线。这里有个黄金法则,大家一定要记住,不同的任务要开不同的 thread, 千万别在一个窗口,一会让它改 bug, 一 会让它写新功能。另外你也不用傻,等任务完成,你可以同时开多个 thread, 同时处理多个任务,效率直接起飞。前段时间爆火的 skills 在 codex 里直接格式化了,内置了几十种的 skills, 鼠标点点就能安装了。这些 skills 能让你的 agent 如虎添翼,关键省去了繁琐的搜索和安装过程。 最后分享一点个人使用心得。上一个视频里我推荐了谷歌的 anti gravity, 其实这两个产品你可以一起用,把 codex 的 插件装在了 anti gravity 里面,这样你可以同 同时要用多个模型,比如让 g p t 五点三改 back, 让 jammer 做前端,让 cloud 出方案,不用切屏,不用复制粘贴,一个界面汇集世界上最好的三种模型帮你干活。这套 web coding 的 形态, 你值得拥有。以上就是本期视频的所有内容,欢迎关注艾伦,二零二六年,我会持续创作更多 web coding 和 ai 工作流的相关内容,我们下期再见。

呃,很多小伙伴问我这个到底是怎么操作的?其实很简单,呃,你只要下载一个软件,然后在上面跟它打字就可以了。呃,我下面给你们演示。首先呢你得下载这个叫做 codex 的 软件,然后 它 mac 和 windows 都有,如果你找不到的话,你就直接跟 ai 说,你说我下载 open ai 的 这个 codex, 它会给你链接,然后你直接下载, 下载安装以后他会让你选择一个叫做呃,工具,这个这个项目的一个链接你,你刚打开它就会让你跳出这个东西,你找一个安全的啊,或者你重新创建一个这个文件,然后给他放在里面。 之后呢,很简单,你直接跟他说,因为因为只有这个 g p d 四点五他有操作电脑的功能,而且他只能在 q d s 里面运行,你按在龙虾按在什么地方,他都不能去操作电脑, 所以你就直接去问他,你说我想让让你去直接通过鼠标,哎,通过这些什么 app 去操作,你问他怎么才行, 要他会告诉你,你看分两种,第一个是用这个功能哎,第二个是用视觉加鼠标,那我直接跟他说,我全都要, 然后你跟他说完以后,他会自己给自己按脚本,哎,你看我,我跟他说放款能力更好,然后哪个放款能力更好?他他给你回复以后,那你直接直接就让他开干, 然后这个五点四他只有充钱才有,就是那个两百美刀的会员,然后你们可以去某鱼上搜这个,直接搜扣扣贷, 然后差不多就是八块钱的拼车,他会直接给你一个月体验,直接把这个超高打开,然后他给你操作完以后,接下来你的所有的东西,你只你只要发给他,他就给你远程给你操作, 就包括你要让他发个消息啊,干什么?你直接跟他说,他就发给你。然后我我还让他写了一个这个脚本,就是我打算就是手机远程操作,然后我把这个安全性也告诉他,让他去解决。 然后我手机就可以登录一个网站,然后网在网站上直接去就可以操作这个界面了。我找一下网站,大概是这样子的,给你们看一眼, 如果手机也可以登这个网站,直接在上面输入以后,他会直接给你看当前的状态,然后他当前在办的事情是什么,然后你直接发发命令给他,然后给刷新状态,直接手机就可以操作了,然后他他也可以给你返回他的结果。

大家好呀,今天我一定要向大家安利一下 codex 的 automation 这个功能,对它是一个非常省心的点,这个自动化怎么跑?我就用了它自己内置的一个 summarize git 这么一个功能来做一个演示,我们一起来看一下吧。先说时间,我设定的呢是每天九点钟,只要我的 codex 的 app 是 在运行的状态,它就会自己去手动跑,不需要你触发 这个时间你是可以自己去设定的,你可以设定的是每天定时或者是二十四小时轮动啊。第二点,当它自动化在开始跑的时候,它会自己去创建一个独立的 walk tree 啊,它是在一个工作区里面去跑,会影响你手上的开发,这是第二点。 那第三点呢?它输出的结果就会进到一个 inbox 里面,类似于一个邮件箱啊,只要它完成了之后,它就会发给你,如果说有变化,就会有一个通知你,你就可以去点开查看,那如果说没有变化,它就会自动归档了。 第四点,就是它的整一个自动化的内容,你是可以通过 prompt 去控制的,这个 prompt 你 可以去引用你的 skill, 比如说我想让它的自动化的内容以一个 word 方式或者 excel 的 方式输出,那我就可以去调用这个 excel 的 skill, 只要你说清楚啊,它是完全可以遵照这个 prompt 去进行一个执行的。 对,这个是第四点,那第五点呢?就是他的一个权限是完全遵照你全局杀香的一个设置的,如果你自己设置的是止毒,那么这个自动化一定也是止毒,完全是由你来控制的,当你觉得整个自动化的流程它是安全的,你再进行一个权限的放开, 我觉得这个这个自动化的功能是非常有效的,你可以用它给你内置的一些模板去测试,或者是说你自己来进行一个创建。当然现在只支持苹果的用户,安卓的用户可能还需要再等一等。那么你今天自动化了吗?快去用起来吧,记得一键三连哦,拜拜。

好,今天给大家介绍一款这个软件,它可以说是 codex 中的龙虾,就是它可以完美的实现龙虾想要的那些功能,那这个项目地址就在这里, 那我们知道龙虾的功能就是可以使用手机去操控,或者说跟你的这个 a n g 的 对话,对吧?好,这个不熟悉,也是非常简单,把这个扣的这里,把这个压缩包下载下来就好了,我们等一下大概就五十多兆 啊,下载下来之后呢?呃,就解压出来就行,解压在任何一个地方都行,然后解压出来之后,解压出来之后就是这个样子,这个样子的话主要我们有两个程序可以运行,一个是这个,呃, wrong batch, 这程序我们双击双击打开它就行了,打开它之后大概是这个界面,然后这个界面这里是我的一些聊天的信息,然后我就给它打一个码,然后呢这里的设置 可以点这个,然后这这些设置我们都知道哈,这是沙盒,然后这是,呃,这个是同同一台运行程序的,然后这是模型, 呃,然后这里还有个最重要最重要的一个功能是这个这个账号,这个账号功能可以,你看我这里是有两个账号随时切换,然后如果你再创建一个新的账号,只只需要创建,然后备注完之后, 呃,备注完之后注意你原有的账号,你要先点个这个,点个这个他就能保存他原原有的所有的记录。然后你比如说这里创建备一个账号, 那这里的话,呃,因为他这里是没有任何信息的这个账号吗?没有任何信息,这时候你就需要需要用 用这个命令,行,先退出当前的 codex, 然后再登录一个,登录一会之后,这里会显示你真登登录的账号到底是哪个,然后再点这个,再点这个的话,他他就三个账号,可以随时他会写了,非常简单。 ok, 这里我就不展示了 啊,这是其其中一个功能,然后第二个功能,我在这里,呃,有这个安装包,然后这个是电脑的,你要把这个软件安装上,这是做内网穿透的。呃,然后手机的话也有这个,就是这个 啊,手机和电脑分别安装这个,然后登录同一个账号即可。啊,这边我是安装了,安装了的话我我这边直接打开他,不需要任何,不需要任何。呃,不用任何付费的,我们只需要登录同一个账号, 我是登的 github 账号,里面有很多登录方式,然后我手机也登录了,登录完之后,呃,非常简单,我们只需要运行这个, 呃,运行这个好,这里就会显示这个几条命令。呃,这几条这个 line, 然后呢?我们这两条都是可以用的,后面这几条呢是要在同一个局域网内,然后这两条就可以直接用了。呃,这这两条你直接在哪用呢?也很简单,就是刚呃,我们手机还有个另外一个安装包,就是这个, 这个安装包你安装完之后,你打开把这个链接复制上去,把这个链接复制上去,他就能实现跟龙虾一样的功能。当然他还有非常多好用的功能,比如说在里面可以直接打开他给的绝对路径下的一些文件,然后呃在里面可以 呃管理那些聊天,然后里面可以设置你的呃这个端口,设置你的端口,比如说这个 还是一样的,里面的任何一个对话,你做任何一次呃对话的时候都可以设置任何东西,比如说我的端口呢是七八九七,那我就设置成七八九七,然后如果你的是七八九零,你可以设置成七八九零或者是别的什么的。 然后呃,然后这里的话他可以呃默认打开,就跟这个这个工具是一样的,你看这个工具的这个设置, 你看这个工具的这个设置,他是呃他这里是有这个端口的设置。然后是否使用这个代理,如果使用代理我们知道非常方便,就可以不用去开启这个系统代理了。那他呃使用的过程中就呃可以,比如说让他操控我们浏览器之类的呀,我们就可以 可以说去更加更加便捷,因为我们只是打开那个窗口使用的这个代理,就跟那个指纹浏览器是类似的,效果 好。然后大家如果,嗯,如果觉得还不错的话,可以进群,进进我发的那个群,然后啊那个里面大家可以提提意见什么的,然后我们一起交流交流关于 codex 的 东西。

受到一个开源项目的启发,首先我在这里要重点明确阿桑和拼拼两位大神啊,两位大神给我提供了非常多的灵感, 我现在做的这个东西呢,是基于他们两个人的,阿桑贡献了一个超级厉害的底座,我把他的代码进行了,嗯,就是在新的场景下进行了一个改造,然后拼拼呢给我 的很大的一个启发呢,就是工具的视觉化,然后把它变成了一个页面,前端可进行通过鼠标点选来进行操作的这么一个工具。那话说回来,我做的这个东西是什么呢? 可以看到啊,这个标题写了叫实现从文档到视频的神器啊。那对于这个现在比较流行的漫剧啊,真人剧啊,包括嗯就是爱好者,嗯写的自己的小故事, 都希望把它从文字变成视频。那现在像急梦可灵这样的平台都提供了方便的这个图声视频,文声视频的这种工具。 嗯,但是呢有一个很大的问题呢,就是,嗯是一段一段生成的,或者说它有一个时长的限制啊,一段十五秒,最多一段十五秒。 然后如果说是一个稍微长一点的故事,那就需要有这个多段视频内容的拼接,而拼接,而多段内容视频的拼接的过程呢,还要保证一个场景啊,人物啊,这个一致性的问题。 嗯,当然这个平台做的工具都已经非常厉害了,一致性是能够解决的,但是我开发的这个呢,是希望让他更简单啊。那通过输入文档,我这边呃整个平台的界面啊,大家看到可能这个按钮比较小啊,但是我把整个流程简化了,包括几个步骤 啊,比如说输入这个一个文档,输入一个文档,这是用户最核心要做的,他要把自己想的故事嗯的片段也好放到一个文档里,然后进行上传。 这个上传的步骤呢很重要,它是把这个故事啊进行一个预处理,处理成呃为后面节点进行大大圆模型处理的时候,这个效率更高啊。把用户写的这个比较零散的这个内容,然后呢进行一个呃格式化的一个处理,这块可以看到啊,就是 呃把鼠标放这,这块有很多小的细节在今天进行了一个优化,这些小的按钮啊,都是整个项目 这个运行过程中生产的物料啊,鼠标放上去, mouseover 上去之后,对应的就会展示出来啊。那比如说这个通过呃用户上传故事,然后进行这个预处理之后, 我们可以看到右侧的这个叫什么预览窗口,就有很多的信息出来了。这样的话呢,可以把用户输入的这个故事啊变成所谓的世界资产。所谓世界资产呢,就是基于这个呃视频创作层面啊,这个故事大概的这个概览是什么样的啊?这个这故事的世界观 啊,具体的规则是什么?然后这个故事大模型通过阅读用户上传的文档,来自动的拆解这个文档中有哪些几,有哪些角色,有几个角色啊?主角是谁?然后配角是谁? 然后呢?这个这个故事里面有哪些核心的场景?因为我们也希望在视频生成的时候,场景呃也需要保持这个一致性啊。 嗯,除了场景之外,那最重要的就是道具有没有,就是必须经常出现的这个这个这个道具,道具的描述特点啊,这些都通过预处理进行了这个生成,有了这个预处理的文章之后,下一步呢就是这个, 呃,生成这个叫世界资产的这个方案啊,在第二步世界资产方案,大家看到还是一堆文字啊,这堆文字呢,其实,呃是用于 让用户呢进行检查的啊,判断,呃检查这个 ai 对 于他写的这个故事理解的准确不准确 啊?同时这个这个具体的这个什么视觉的风格是什么样的,然后每个角色的提示词,每个角色的提示词是怎么定义的这块呢?都是可以给到这个用户进行审核啊,不好的不对的地方在这这里面进行编辑修改, 然后呢或者删减,比如说角色他设计的太多了,那我们可以删删除一些,然后不够的话呢,还可以在后期后,后面就有一个节点叫补补正式资产啊,补资产,然后呢缺的内容可以在后面再增加, 然后你看这有角色,有资产,有有这个场景,场景的这种定义,场景的提示词这里,嗯通过这个世界文档,世界资产文档,然后进行了一个很清晰的呈现啊 啊,除了这个这个这个道具之外呢,我们我这边还设计了一个叫做关键桥段的资产,这块我当时的设想呢是说 这个故事可能很长,那如果说为了快速的去吸引用户呢,我就设计了一个 triller 的 这个模式,那让这个 ai 呢就对这个故事的理解之后呢他呢设计几个关键的桥段,把这桥段的图像生成出来之后呢, 用图声视频啊,把这些这个关键桥段变成视频之后,再拼接拼接成一个一分钟左右的。这个这个吹了,能够快速的让用户或者说用,呃快快速让用户感受到整个片子的这个效果,然后呢包括能够快速的进行分享。 那那那生成完这个世界资产之后呢?下一步呢?就是这个把资产里面对应的这个素材,呃进行生成啊,那这这边这个,嗯,这个步骤在右侧啊,任务控制台这块都可以实时的看到这个任务进展的状态。那在这个图像这啊,我们看到, 我们看到这个是这个,呃,叫什么?剧情,剧情的剧情图。那这篇小故事呢?是我用 ai 生成的,叫造网,造网也显灵,这名小故事七百多字。那 ai 的 理解呢?就是它只生成了这么一个场景图,然后建议呢生成一个视频, 然后整个项目啊,整个的这个故事,其实它生成了很多元素啊,比如说这个,呃,这个,这个母亲啊,然后呢小男孩啊,造啊,这我这忘了是造访爷还是谁?我看是造访爷,造访爷,造访爷的这个肉身啊,然后这是道具啊,这是道具,看 道具。然后这八宝粥,然后呢?这是这是一本什么?呃,宝剑啊,叫什么?这个叫叫什么来着?是是一本书啊,是一本书,然后这个是灶王爷的这个形象,然后他他们住的家家的小院啊,灶灶台 可以看到啊,就是这些素材都是通过这个叫正式生成。世界资产这个环节呢,用这个纹身图来生成的啊,就是这些素材都是通过这个叫正式生成这个环节的,同时呢如果你要像这种, 像这种剧情,他呢本身呢就是通过呃上升,呃上传这个参考图,比如说人物角色,包括这个场景,然后呢进行一个合成 啊,在这里面都生成出来了,然后这个平台我,我开发这个平台,这个非常的方便啊,非常方便然后生成这这个栏目叫做产物啊,在整个过程中,现在走到这个前四步的话,每一步都会有一些这个文档或者图像的这个生成,然后在这个界面里面可以方便的鼠标 mouse over 就 能看到 啊这些文档啊,这些这个 jason 文件是给机器看的,但是人也可以随时的去检查啊, review file 就是 可以看到这里面有三个, 这个是一集啊,就是如果说我们慢剧是多集的话,那每一集的这个内容它里面都牵扯到呃结构化的这个信息啊,这一集的这个场景啊、道具啊、剧情啊,然后出场的角色啊,都会在这些文档里面呈现出来,便于用户呃检查 啊,这是这个叫世界资产的这个文档,可以看到这里面主要集中的就是什么角色、场景、道具啊这些信息啊,需要让 ai 生成的。然后这个呢就是执行的具体执行的文档,把这个嗯生成的核心的这个提示词和 之前准备好的这些这个资产进行一个关联跟匹配啊,因为之前的这个文档里面内容里面是没有提示词的啊,都是一个具体的角色道具、场景的这个文字的描述,那在这个生成文档里面就要把图像的这个对应的提示词 啊,都捆绑到一起,然后这个呢是生成的这个视频,我们来看一下, 这个相当于就是这个 trailer 了啊,只有只有十二秒,总会有办法的,妈,东家说今年光景不好,工钱扣了一半。 好,那如果说整个这个 trailer 的 呃,这个场景图对应的多一些,那它生成的视频也会多一些,然后自动的会拼接成一个完整的视频啊,来呈现。同时的话呢,这块还有一个 presentation 啊,那这个 ppt 也是非常方便啊,便于 便于这个团队进行这个交流,我们可以看一下这 ppt 啊, 那 ppt 的 话呢,就是把这个这个项目的大致的介绍啊,视觉风格,角色啊,都进行呈现场景,然后道具 啊,以及最后的这个吹乐的关键,关键关键帧,或者说这个重点的这个,呃,剧情的这个场景都用 ppt 的, 都在 ppt 上进行承载,然后便于团队啊进行讨论啊,就比如说这个场景需要修改这个道具,不对啊,所以呢,生成了这个这个 ppt 的 这个文档, 然后后面的话呢,就是后面的几个任务啊,启动任务的按钮呢,就是把它批量化生产了,因为这个漫剧会有多集内容嘛,那这个每每集的内容都要 经过一系列的这个操作,等于在这个界面里面就基本可以完成了。然后,嗯,整个过程生成完之后,在这个幕产物的这个界面里面就可以轻松的看到。呃,生成的这个素材内容以及最终的视频 啊,整体就是这么一个思路啊,其实这里面还有很多 bug 要修,要修复,还是有很多可以提升的这个空间的啊,包括这个镜头的这个质量。 呃,这里面最大的一个问题就是大模型对于剧本的理解,包括它匹配生成的,呃,画面的规划,镜头画面的规划啊,镜头的每个镜头的这个时长,嗯,这些都有很大的这种优化的空间。 ok, 我 要分享的这个小工具基本就这样,虽然别人已经利用就这个功能,其实在整个行业里面已经有很多成熟的工具已经达到了这个登月的水平。我这个呢刚刚开始造轮子 啊,但是呢,这个对我的意义是在于就是我在生产我自己的这个视频的过程中,这个工具可能用起来会 更顺手,更顺。我的这种,呃,使用的习惯啊,这个视觉效果的这种,比如界面排版的这种,呃偏好啊,更加的就在工具层面更加的个人化、私人化一些。

哈喽,大家好,我们现在来教大家去如何去安装和使用酷呆斯增强版。我们首先 拿到这个 get up 的 地址,我们会在评论区放出来,我们首先访问这个 get up 的 仓库,先进来首先点一个 star, 然后我们再看 安装方法。 mark linux wsl 的 话可以直接使用这一行命令,我们复制它,直接在终端粘贴就可以安装了。 windows 的 也是一样的,复制这一行命令,然后在你的终端 粘贴,然后就可以继续安装了。我们打开我们的终端,然后粘贴刚才的命令,我们直接回车等待它的安装。 安装话跟你的网速有关系,如果你的网速不够快的话,可能需要等一会, 不快,它安装好了,它默认的话会把你二进字文件安装在你的 logo 并目落下的。我们可以检查一下使用命令,我们检查一下它安装好了是不是 ok, 确定安装好之后,我们可以查看一下它的最新版本, 最新版本的话是一点二点零,默认的脚本安装就会安装最新版本到你的本地。 然后我们查看一下当前酷带 s 增强版具体有哪些新增的功能,比如 agent, teams, hux, 繁琐拎拎, ip agent 以及 webui。 我们可以先看一下路由 server 是 怎么实现的,可以看到路由 server 是 使用 httpss 去进行实现的,这样最大的优势呢就是, 呃,你启动多个 c 型只会占用一个进程,这样的话你的进程消耗就会非常少。我们直接使用路由 server 将微博 ui 启动起来。 cordless server 会随机启动一个端口和随机的托克密钥,你拿到这个端口和密钥呢?可以在本地启动一个内网穿透,这样你在外面就可以通过手机访问微博 ui 去进行远程的微博扩顶。 我们可以直接切换到移动界面去进行测试,先随机选择一个目录 发送嗨来进行测试。 ok, 我 们开始测试下一个功能,我们回到仓库地址,我们看一下 agent team 和 hux 以及奥斯突击 api agent, 我 们首先演示一下 agent team, 使 我们来到这个仓库,我们通过 code s 启动。然后怎么使用呢?首先第一步你需要在配置文件里面去启动多媒体的配置,我们 可以看一下在这个配置文件 copy 里面去将这个配置多媒体给它启动, 我们就可以开始那个尝试这个功能了。比如说我们 use agent teams 这样子告诉模型,告诉模型,比如说告诉了五点二, 我们需要需要启动 a 键的 team 来去做接下来的工作。比如说我们分析当前项目,就代表了我们使用 a 键的 team 来分析当前项目, ai 会分析任务难度来判断具体创建多少个 a 帧。 ok, 我 们看到它根据呃项目复杂度启动了五个 a 帧,五个分析帧 这个中括号括起来的这个就是我们的具体的一个执行 aint, 比如说是其中的五个分析的 aint, 然后来去并行的执行分析当前项目,它对于仓库结构 rooster 的 库的代码,然后 build c i 以及文档以及安全 sandbox, 然后去单独的 每一个单独的去进行分析。啊,这五个的话就是在并行的那五个都是同时创建,然后在并行的这里就会有一个等待所有的 a 帧,我们现在可以等他返回。 ok, 全部 a 帧已经返回了,五个 a 帧都已经执行完成,然后返回了他的一个结果,分析结果, 然后五个 a 帧的全部返回成功之后呢?慢 a 帧就会去收集五个 a 帧返回的内容,做一个汇总,然后再去判断当前的分析是否完成了,然后模型会自己去判断 是否还会需要继续的去进行分析,如果不需要的话,他就会直接返回结果,如果需要的,他还会去再次的创建 a 帧去进行分析。 ok, agent teams 全部结束,返回了最终的结果,这就是整个 agent teams 的 一个调用过程。

我用酷币做了一个非常好玩的选股神器啊,没想到他做出来的效果这么好啊,等一下给大家演示一下,这是整个软件的界面,假如我们要找什么股票在这里六零一他就会出来了,对吧? 嗯,然后双击一下,他就这里就会有贴现图啊,那些饼图啊之类的,这里是有五千多只可以选的哈, 我给大家介绍一下我这个软件的一个逻辑啊,非常感谢一个二十多年古灵的一个粉丝啊,给我提了很多意见。 ok, 选股,这里就是我选好的股票,按照我的条件选好了的股票呢,我可以放到选股池这里,那这里呢是实时更新的选股池这里 就是符合我条件的股票,他会全部放到这里来,一旦这里的股票不符合我的条件呢,他又会把它移走,所以选股池这里留下的所有的股票都是符合我最新条件的 股票。我这里设置了一个经验选股,因为每个人买股票他可能都不一样的经验思维,所以每个人都会不一样,这个属于自定义的了。这里呢,我也会放到一些我需要监测的股票,放在这里,重点关注的会放到这里来, 实时去跟进他的一些信息啊,这里可以新建的啊,新建把规则定好了就可以新建 事件。这里呢,就是我还没有想好要放什么东西,可能就是放一些新闻呢,就是你想要看这只股票啊,他有什么新闻呢?可能会放这些东西。这个问答呢,就是说我们有什么疑问呢,就可以在这里去问他啊, ai 会给出一些答案,然后设置这里呢,我是用了 dipstick 的 api kit, 然后数据提供方呢,是用 a, k, c, r 的, 所以整个软件的逻辑就是这样子的,如果大家有更好的一些建议呢啊,也欢迎大家提出来啊,我看一下是怎么样去把它加上去啊, 后面呢,我可能会增加一个短信通知,假如啊,我们在这里的一些股票,它有一些符合你可以购入的条件,才会发信息给你。 现在的 ai 真的 是太强大了,像 codex 这样子的工具呢,以后呢,肯定是会越来越多的,像以前我们要做一个这样子的一个软件的话,你没个几万块钱估计就搞不定,或者是说你的程序员要写好久,那现在很简单啊,只需要一句话就能搞定了。那像这种 ai 工具呢,它适用范围是非常广的, 像很多电商行业啊,你要做数据分析啊,你要靠人力去堆的那些工作啊,其实都可以让 ai 做,因为 ai 最擅长就是数据分析,做报表啊,做什么各种各样的分析,不管你是公司的运营啊,或者要做财务的数据分析啊, 或者是你业务部门呢,要做一些调查报告啊,各种各样的东西,其实都可以用 ai 来去解决,一句话非常简单。


发了一个研究报告,是他们内部的一个小团队做了一个应用,在几周的时间交付了一百万行的代码,完全是用 codex 进行编辑的,完全没有使用人工的方式,这也是他们的一个强制的要求,它整体是搭建了这样的一个系统。 他也说了一下他的一些经验,最终达到的结果就是他们只需要一个提示,然后他们的这种智能体代码,智能体会直接去执行这种各种的一个预设的这种流程来进行完成和最终的发布。 他这个经验报告呢,如果说我们能搭出来这样的一件事情的话,肯定是去完成一个项目是绰绰有余的。而且他这个经验里面我个人觉得非常牛的是两件事情, 因为我们现在用这种 codex 或者说 cloud code, 我 们运行出来并不是说它性能好不好,准确度高不高,而是它跑出来的结果。我们人很大的成本现在来自于如何去做测试。 但是他们这个应用不是说这种桌面版的应用,更多的都就是一个网页前端的应用。他们用了这种 chrome 的 开发者模式,让很高的一个权限给到了 codex, 让 codex 去做检查解锁,达到了自己解锁这个内容,然后重现错误,并且修复,并且分析这些 ui dom 的 一些行为, 这是一个比较大的一个点。还有一个点我是认为非常有趣的,就是吞吐量改变了合并的观念,因为我们做一些修改的时候, 其实我们会非常的小心,特别是一些成熟的项目,你做一些修改,你必须要做非常多的验证,觉得完全没问题了之后,你才会把它合并到主项目的文件这个数中。 但是当 codex 大 模型来了之后,它的规范反而成了反作用,因为它做修复非常的快,所以说你只要能简单的测试它是好的,就直接合并,直接上线,如果有错误它马上就拉下来进行修改就完成了,就没有必要去做非常严谨的这种验证, 因为他的纠正错误的成本十分的低廉,而等待去测试的成本是非常的高昂的。所以说现在的一个策略是会有一定的进行转变的。 我们还是详细看一下这篇报告,他主要也分享了很多他们的一些经验。首先他们就说了一下,他们是人类掌舵智能体进行执行,他们有一个规定就是不允许手写一行代码,从开始 他们不编写任何代码,工程师是做这种框架和需求进行转化成 prom 的 一个工作, 然后是由 codex 进行编写,然后他们就发现了一个问题,他们的瓶颈就是如何审核这些 codex 出来的结果,然后他们解决的方案就是让他拿到更多的这种开发者权限,让他自己能去复现错误,然后修复错误,并且这些日制信息都会暴露给这个 codex。 就是他们的一个经验,是给 codex 提供一张地图,而不是一千页的使用手册。因为 codex 它的上下文就是特别稀缺的,所以说你不要给它过多的指导,因为全是重点,那么就是全部没有重点。 它跟 cloud code 它们的方式是一样的,就是你给它的这种文档是分成树状的结构的,它需要的时候它会到对应的文件夹里面去找去查,而不是你把所有都放在一个文件中。 然后就是智能体读取才是最大的目标,因为上下文是有限的,每一次执行的时候他都要去对应的上下文,所以说你的这些项目必须要让一个新的工程师马上拿到之后,他就知道他的上下文他要做什么,所以说他的文档必须要写的非常详细,而且要非常有结构性, 要对应的文档要放在对应的一个项目,对应的一个模块下面。然后就是其实他这个翻译有点问题啊,他这个意思就是你要保证输入输出就可以了,他具体怎么样实现就让智能体自己去实现,甚至尽量不要使用这种 新的一些库,最好就是让大模型他的训练,在最好就是使用大模型在网络上训练常见的一些库,或者常见的一些原则性、 原理性的代码,甚至让大模型他自己去实现,都比他直接使用某一些库,某一些现有的库会效果更好。因为现有的一些库他在他的训练中看到过的比例是非常少的,所以说他是不擅长的,甚至让他自己去实现他还更擅长一点。然后就是吞吐量,就刚才说的, 然后他也说了一下,他们生成的真正的含义是几乎所有的内容都是由智能体生成的, 他们没有做一行代码的更新,只做了这种优先级的排序,然后将用户的反馈转化成验收的标准,或者说一些新的功能工具,然后把这种 pr 提到代码库中,由 codex 自行进行编辑或者修复,最终达到了很高的一个自主水平, 如果能搭建出这么一套智能体编程的系统,那么就非常的牛了,但是他们没有开源他整个系统或者怎么样使用。然后最后他也说了一下,因为智能体他的自主进行写代码,他也会有非常多的问题,就是他的伤他会非常的混乱。可能这里这里的命名是这样,这里的命名是这样, 最开始他们是由人工去做一些修复或者清理这些遗留的问题,然后后面的话他们就使用每一天去做一下扫描,定期的进行这种技术债的消除。 然后他们说了一下他们的一些欠缺,其实就是设计环境、反馈回路和控制系统,他还是很大的原因就是怎么样去做审核,因为他这个都还是比较好判断结果的一些方式,因为他都是这种外部的应用,如果是一些这种桌面级的应用,他这个也不是那么合适。

强烈推荐大家去使用 open ai 的 ai agent 编程助手的终端 codex, 甚至你可以用 codex 来修复龙虾中的 bug, context 加 openclaw, 简直是天作之合,完美的搭配。而且啊, open ai 在 这个点上还真的是比较大方的, 如果原来你是 openai 的 plus 或者是 pro 会员订阅用户的话,在 codex 上面会给你配备一定额度的 token 的 使用配额。 大家好,欢迎来到玲姐说一 i 这期视频啊,我们聊聊同步在 windows 上线的 codex 的 使用,非常推荐,之前其实他在苹果的终端也上线了,所以我在这里给大家做一波强烈的推荐。 原来你在使用 cloud code, 同样的二十美金或者两百美金的这个订阅计划。大家知道那个配额啊,是很不够用的,稍微干点活就不能用了,就要另外买 token 了。但是 codex 使用的配额还是相对比较充沛的。 open ai 你 花二十美金每个月的订阅啊,给你整个的配额还是挺多的,又可以聊天,又可以申图,还可以用 sora 每天大概十到三十条的 这个使用条数,同时你还可以使用 codex, 现在苹果用户和 windows 用户都可以使用了,赶紧在电脑端把它下载下来。这个编码助手啊,也可以说是 cloud code 的 平替, 当然叫平替啊,也不太合适,我只是说 cloud code 在 这个领域上面我之前讲过,它做过很多刻意的练习,解决过很多开放性的生产任务,所以它整体的位置是行业老大的位置。我说这个领域啊,不是说呃,所有领域 是在这个生产工具的 call 顶的领域啊,它是属于引领的位置,而且它也一直在定义行业的标准,包括大家熟知的 m c p, skill, co work 等等的工作方式。但是呢, codex 这一波的上新呢,确实是有它的创新点在里面的,它用户的交互界面体验比较好, 对于那种比较厌恶命令行的这种交互方式的用法会特别的丝滑。它会有自己的特色,比如说像工作数这样的任务的并行的方式啊,我觉得对于多任务并行啊也特别的友好。另外使用它你基本不用付出 额外的成本和费用,更重要的是加持上了它最新的五点四的模型。 五点四最重要的一个优化是什么?就是它加强了在 computer use 上面的能力,也就是这个 agent 的 编码助手,它有更强的执行操作和理解的能力,相当于它的闭环能力更强了。 所以听到这里,是不是已经迫不及待去微软商店下载 codex 了?这期视频我会给大家介绍 codex 的 特性,以及如何从零到一。使用 codex 我 会给它几个实战任务,看看它这个过程中会遇到什么 bug, 怎么执行解决,会不会有翻车的情况。 如果你是苹果用户呢,直接在 app store 里面去下载就可以了。如果说你是 windows 用户啊,你是 win 十及以上的用户, 你就直接在微软的这个 microsoft store 里面直接下载就可以了,它的整个的下载安装非常丝滑,你就按着它的引导一步步完成就可以了,这里我就不做深入的演示了,这个就是 codex 安装后打开的界面, 是不是一股熟悉的味道扑面而来,特别像 try gpt 的 聊天窗口,对于那种使用命令式的交互窗口,仍然有一些抗拒的。这份使用者 codex 我 认为是一个非常好的选择。 在这里啊,你可以很好地过渡。我就结合 codex 的 使用,从零到一实操,给大家也讲讲 codex 的 使用特性。 首先啊,在设置这个地方,点开,大家在这里登录自己的 try gpt 的 账号,同时在这里可以很快地切换你经常使用的语言,英语或者中文都可以。在这个地方会显示你这个账号的额度, 它是通过两个维度限制你,一个是五小时的使用量,还有一周的使用量。如果说你真的做很多深度密集的 这个使用任务的话,我觉得这个额度可能还是不够。但是对于大部分的使用者而言,我认为这个额度啊,已经比 cloud code 要大方很多了,基本你们都是够用的。 在出事安装的时候,在这个地方,现在我已经弹点掉了啊,就是它会弹一个窗口让你安装这个沙箱。 这个专用的沙箱也是 codex 针对 windows 的 一个设计,有这样的沙箱,让它的整个的命令的执行在一定受控的环境里面,也可以有效地保护你系统本身运行的文件, 就按照它默认的配置去选就可以了。在下面这个位置啊,可以更改权限的范围,除非你非常笃定啊,给它完全的访问权限, 大份情况下建议使用默认权限。另外,在模型这个位置,可以选择不同类型的模型。 现在比较推荐初学者使用的是 g p t 五点四,因为五点四是一个综合型的模型,它既有理解能力,又有推理能力,还有 computer use 的 能力,还有 coding 的 能力,它是一个综合型的模型。另外呢,如果是针对专门的 扣顶的工作,可以选择五点三 context, 它是针对 context 这个环境和 context 的 任务,专门进行过优化的这么一个模型。 在这个地方,推理强度一般默认是高,也可以选择超高,当然这个背后所消耗的 token 数就会不一样。另外在加号这里啊,你可以去上传文件和照片, 这里就会有很多的玩法了,又可以对一些多模态的内容啊进行加工,比如说对视频进行剪辑。同时在这里可以调它的 speed standard 和 fast。 这里啊,我觉得它有一个做得很好的地方,相当于它在用户体验侧的一个优化,它这里有一个计划模式, plan 模式。其实这个技巧呢,我在之前给大家教学 chain 这个软件的时候,也会讲过类似的技巧, 只是说他现在把它单独拎出来了,对于这个功能进行了优化。你在做一些项目的时候,你可以先计划,先和这个 gpt 去沟通, 这个项目怎么规划,它的框架是什么,怎么设计,计划完了之后再开始执行 coding。 所以 从这个层面来说, context 它的定位啊,其实分为三层,第一层它是一个代码助手,它可以帮你写代码,解释代码,审裁代码。第二层,它是一个工程型的 agent, 它可以帮你去识别 bug, 修 bug、 提 pr 等等。而且它还可以做很多并行的任务, 比如说我在这里有个任务啊,你点击这个右击鼠标,在这里啊,它就有一个特色,叫做派生到新的工作树,叫做 walk g, 就是 你在做一个项目的时候,当它出现问题的时候, 你会发现可能有好几个东西要修。如果做过生产实践,你会发现啊,你修 a 的 时候, b 也在修,那么它们有可能把 a 修好了, b 又出了问题,就是它会出现相互的交叉污染这个情况。有了这样的 work tree, 你 就能够并行地进行很多工作任务,那么你发现没有,你的效率就提上来了。 codex 的 第三层,它还是一个电脑操作型的 agent, 比如说我刚刚讲的剪辑视频这样的任务,或者说其他的这个文件名批量命名的任务,整理会议资料的这样的任务,它其实都是电脑操作型的, 它也是一个电脑操作型的 agent, 这是我对 codex 这个 agent 工具的三层的理解。当你需要新建一个项目的时候,可以点击这个位置,这里点击 add project, 新建一个项目文档,然后在里面呢点击这个新县城。 同时呢,它这里有一个功能啊,叫做自动化,你可以让它定期的帮你制作一些任务,那么你就可以设置一些定时任务,比如说让它每天定期的帮你去搜集某个领域的专业信息,或者定期的跑一些这个整理文件文档的这么一个信息 等等等等。这里需要关注的一个点就是它的权限问题啊,你给它开多大的权限?当然它这里也少不了最近最流行的 skill 技能 这个板块我在 cloud code 的 这个视频里面讲过,它也是类似的,你看它这里,它的官方 skill 里面放在最前面的也就是 skill create 创建一个新技能的技能, 你在这里可以去调用它的技能啊,它不是那种命令的交付窗口。比如说你想要用这个 figure 码,你就可以点击这个加号,它就直接帮你安装了这个 skill。 如果说你想用这里面的视频生成工具,你就可以用这个 sora 生成视频的技能,并且啊,你想生成新的技能,点击右上角的新技能, 这里呢,它就自动调用了 skill creator, 你 就可以跟它去交互聊天,告诉你你要创建怎么样的技能,然后它帮你进行封装。并且啊,如果说历史你用的是 vs code 这样的终端,你也可以同步很好地去打开对应的项目, 很好的平移切换到这里。而且我自己用下来的体验,它会比 vs code 更好用一点。所以对于 vs code, 我 觉得大家可以放一放,然后平移切换到 context 这个终端来使用。下面我就讲一些具体的实操的案例来启发一下大家,可以用 context 做什么任务?它有哪些魔力?效果怎么样?好,我们进入任务实操,我先给他一个任务,我让他给我批量修改文件的名称。在这个文件夹里面我放了五条视频,这个视频是我 youtube 上面已经剪辑好的成品视频。 现在他的命名啊,只是有日期的标签,是没有主题的,我希望他能够基于这个视频的前六十秒所表达出来的内容抽取主题,把这个主题加上日期,对这些文件进行批量命名。 在 context 里面,我就把我的要求和希望达到的结果告诉给他,这里是我写的提示词。在任务的进行过程中啊,因为我们对它进行的是一个有限的授权,在一些关键步骤上面,它会来询问你的授权和意见。 比如说这里啊,它问你是不是直接就对这些文件名进行重命名了,你可以回答是,或者一直允许,或者是告诉他如何调整。这里啊,我就允许是 在这个思考过程中啊,他也会说,从命名的这个动作是越过沙箱的一步,可以看到,在这个过程中,你的文件,你的系统内的东西是比较安全的,这也是我比较推荐大家使用 context 的 一个原因。同时在这个任务跑的过程中啊,我再同步地开一个新的项目,新的县城, 点击这里的 add project, 创建一个新的文件夹, orange cad game, 然后选择这个文件夹,这样我就进入了一个新的项目文档。我现在想做的这个任务是类似这个经典的 flappy bird 的 这个网页小游戏这样的开发,把这个游戏的主角形象换一下,把那只经典的黄鸟 换成一只橘猫,飞行员稍微做一个调整。但是整个游戏的框架和逻辑啊,还是去参考 flappy bird 的 这个设计。在这里啊,我就把这个游戏的要求放到这个 context 里面。 注意啊,这个游戏的要求的需求文档和整体的项目框架,我也是让 g p t 给我写的,为什么我会这样操作呢?其实这也是一个技巧,因为虽然 open ai 在 codex 上面的配额还是相对比较大方的, 但是如果你要做比较极致的生产任务,这个配额可能还是不够,所以我就尽量可以省一点,把前面的需求设计和构建的这个阶段蓝图规划的内容交给 gptchat 去聊,用五点四 thinking, 这样子相当于前后的模型,是前后连贯的这么一个状态。先把需求沟通好, 然后呢,再回到 context 里面,在这里面我们还可以再极致一下,再细划一下,打开这里的计划模式,让它再给我规划一下这个游戏开发的任务。这里的推理功能,我选择一个超高,然后点击发送, 在右侧,这里就可以看到不同的项目文档,不同的县城,它们就在并行。如果说你比较关心的县城呢,你还可以使用这里的这个钉钉一下,它就会置顶在前面,这样子你关心的核心在修的一些 bug, 重点在做的项目就在最前面。使用了这么多款 编程助手的终端 app, 我 自己的感觉 projects 是 我整体用下来觉得最丝滑的。这里帮我把整个的开发计划规划出来了,包括需求理解,文件结构,关键接口,七步 mvp 开发计划,以及最后的验收,还有第二阶段的功能等等,都包含了。 他问我是否实施此计划,我点击确认实施。哎,这个文件夹从命名的任务已经完成了,他告诉我每个文件分别从命名了什么,而且他这里还讲了这个转写的逻辑是什么。前六十秒他识别出了 这个视频主要是讲什么内容的,然后提炼出的主题是什么,然后把这个主题加上日期格式的转写,变成了这个新的命名。我们打开 d 盘看一下, 欸,都命名好了,完成的很棒哦,以后这种批量重复的工作啊,都可以尝试交给 codex 来使用。当然对于这个 codex 这个工具啊, gpt 对 它的定位,还是说把它作为一个 agent coding 的 工具, 你要尽量让他做他擅长的工作。再回过头来看,他的执行路径是比较清晰的,因为他扫描发现我这台计算机没有装离线的音频转文字的转写的工具,这个不可用, 所以他就通过工具把这个视频的前六十秒进行抽帧,核心去保留底部的字幕区域。因为我的这个视频啊,有时候也会有这个背后贴了这个 ppt 的 信息,所以他会同时用 windows 的 ocr 去读这个字幕,以及 ppt 的 标题和页面的文字 综合来形成对这段视频主题的判断。最后呢,再把它整合成新的文件名,并且啊,它强调这次的授权仅在这个指定的文件夹里面进行操作,不能够碰其他目录的文件。 整个过程流程清晰,权限的边界也很清晰。这个任务其实对于 codex 都是非常简单的任务啊,我给他上一个高的推理权限,实际上也是有点大炮打蚊子的感觉。我想表达的是可以用 这个工具去执行以往我介绍的在其他终端的其他任务都是可以的,它的能力上限啊,和智能程度还是比较高的,甚至你可以用 codex 来修复龙虾中的 bug。 context 加 openclaw 简直是天作之合,完美的搭配。这个游戏的任务它完成了,总共花了十七多分钟,给了我这个试跑的链接。这个试跑的链接啊,就存在我的 d 盘里面的项目文档里面一个 html, 我 们在浏览器里面打开这个界面啊, 空格,点击上升穿门就得分,我们开始飞行试试。哎呦哎呀,碰到柱子了,再试一下。哎呀,还挺难的,再试一下。哎呀,这个有点难通过呀。 一分,哎呀,一分,结束了, 得两分。哎呀,得两分,这是我的最好成绩了。以上就是 context 的 介绍和实操,它可以帮你写项目,写代码,也可以帮你修 bug, 提 pr, 还能够做电脑的 computer use。 你 打算用它来做什么呢?欢迎在评论区分享你的想法,我们下期再见!记得订阅玲姐说 ai 的 频道哦,拜拜!

今天我们来讲一下如何利用 codex 或者是 cloud code 来进行 opencloud 的 升级,因为很多小伙伴发现升级从 cloud 会直接挂掉,我们最好的方式就是用 codex 辅助我们进行 opencloud 的 升级。 在我们右边的是 codex 的 界面,首先我们第一件事情是要把我们的 openclaw 进行保存 commit, 今天我们要升级 open 了,请你帮忙查看一下最新版本的更新,保证我们我们先让 codex 帮我们检查一下最新的版本 以及这个更新可能带来的影响,这样我们才能够保证我们的更新不会把我们之前培养的小龙虾的配置给改坏掉,它会去分析整个的代码, 我们等一下一路 yes 就 行了。这也是 codex 跟我们的 open cloud 的 一些不同的地方, codex 它在执行很多任务的时候还是需要人为的去进行干预的,但是像 open 呃 cloud 就 可默认获得了整个电脑最大权限,所以在实际使用 的时候,长城的任务里面表现的会更好。它其实已经看到了我们的小龙虾最新版本是二点二二,之前我们版本是二点一九点二, 这是我们的小龙虾的界面,可以看到它其实也说了我们的版本是过时,所以它会帮我们自动进行升级,它可以看到我们中间隔了好几个版本。我现在用的是 cloud code 啊, codex 的 操作其实基本上是一样的,也是先让它去帮忙去看整个的 代码的情况,分析一下差异,看看会不会出现什么问题啊。我们其实可以同时启动一个 codex, 这个是 codex 的 界面,基本上跟这个 cloud code 是 一样的,今天 open 更新了,嗯, 这个是 codex 的 界面,那我们可以看到它这边已经出来了,就是 opencloud 的 一个最新的一个更新,这里可以进行新增模型的选择,内置 out 后台哦, 多语言的改进,我们可以看一下, codex 也在分析,那我们可以让这个 cloud code 这两边操作是一样的,请你帮忙先保证所有 都可密,让他帮我们把变更都可密了之后,我们再来决定是否需要更新啊,那这边 codex 还在跑啊, 通常可能会起两个代理来做交叉的验证啊,这样子呢,保证我们的升级的一些细节不会被忽略啊。 change 这边的 commit 完成了, oodex 已经帮我整理出来整个升级的一些相关影响, 可以看到它整理的其实比这个 cloud 整理的会更加的细致。那我们也看到了,它其实做好了一些升级的准备,停网关,指定到版本,恢复本地的补丁并叫验。因为之前其实我给这个 cloud cloud, open cloud 打了一些补丁,人工打了一些补丁, 那现在其实我怕升级之后把我的补丁给覆盖了。这个 codex 它其实也扫描到了,那我升级之后,它会自动帮我去执行之前我打的补丁, 并且帮我把补丁给打回来,这样保证我的小龙虾还是在我的预设范围内进行更新,到现在开始执行。当然两边的选择我觉得都是可以的,只不过在升级和改代码方面,我更信任 codex, loco 的 会作为我的备选,看看两边的方案会不会有什么差异,会不会有什么遗失。如果没有的话,我们用 codex 为主来进行整个的升级,这边它其实已经停掉了小龙虾的服务了,小龙虾在这边可以看到它已经 disconnected 了啊,升级命令已经启动了, 等它自动帮我, codex 自动帮我升级好之后呢,我就可以正常的跟小龙虾进行沟通了。首先要验证的就是我的三个小龙虾是不是都能够在手机上进行正常的使用, 我的小龙虾呢?其实在整个飞书上面是有三只的,升级完之后呢,我会去做一个验证,那三只小龙虾是不是都能够正常的使用?你看到这是一二三三只小龙虾啊, 那么它其实 get 位已经恢复了,这时候你可以看到它已经连接上了。这边你看王冠已经正常启动,都已经加载成功,我们就发送一条消息来进行验证,随便发送一条 可以就是已经通了,没有任何问题。这样子我们因为已经升过级了,我希望把它做成一个 skill 以后就可以自动帮我完成升级的整个过程, 让他去跑了。这就是我们今天完整升级小龙虾的过程,完全不需要你会任何的代码就可以帮你的小龙虾进行一次安全的升级,并且能够正常的使用。 所以你看是不是很简单,只要我们会用 agent 就 可以帮你能够解决很多的问题,整个升级的过程大概花了我十来分钟,我们下次见,拜拜。