大家好,本期峰哥聊 ai, 给大家介绍一下目前做数字员工最流行的浏览器沙箱技术的一个最新新闻。刚收到一个最新新闻,就是 open ai 发布了 gpt 五点二 codex 的 开放企业接口。这模型最牛的是它能搞定浏览器自动化,比如用 playy 写个脚本,它就能够帮你自动发文章,做网页,制作 百万 talking 上下文,让所有的事情更记得更牢。开发 ai 的 数字员工的朋友们,这波必须要冲。
粉丝70获赞350
![Codex AI编程新王者, 5 大理由让你爱上 Codex 和Claude Code蜜月两月,我却在3天内叛逃到 Codex 。一次语音助手重构让我见识到它在大型代码仓库的“稳、准、狠”,也更贴合我的SPEC驱动开发。视频用5大理由拆解差异,还聊相同模型在不同系统提示下的表现与性价比。看完就知道该怎么选。顺手点个赞订阅,评论聊聊你的体验。
时间戳:
00:00 [为啥3天叛逃?] - 5大理由抢先剧透一下
00:24 [理由一|大仓稳准狠] - 大仓库也能稳准狠在线
01:45 [理由二|稳定与重构] - 语音助手重构全过程惊喜
05:31 [理由三|SPEC更高效] - 三点文档法提升成功率
06:35 [理由四|同模不同解] - Kimi 在 Codex 更冷静
07:12 [理由五|性价比&建议] - 20刀如何花得最划算
#chatgpt #codex #claudecode](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/72d96bed8eac862444581e7220ecbcdb~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2085195600&x-signature=mpbnvApl2spbPBGe2oVvkYcy80U%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=2026013113454565D750F2E2CF295A5AFE)

手机上也能玩 cloud code 或者 codex, 使用 happy 这个开源项目就能实现远程控制。目前这个开源项目在 github 上已经斩获了八点六 k 的 star, 最近的更新是在昨天,这个项目非常受欢迎。它的主要原理呢是我们先在本地运行 cloud code, 之后再安装 happy code c l i, 然后通过 happy 终极服务器实施 同步,端到端加密,最后在手机端远程控制与监控,通过这三步就能顺利安装。第一步,启动终端,通过 npm 这个命令进去安装 happy code, 然后安装成功后 输入 happy 命令来代替 cloud code 的 命令。我们首次使用会让我们选择使用猫标 app 或者是 web browser, 我 们这里以 web browser 演示为例, 选择之后会打开我们的浏览器,然后显示这段内容。我们把这段内容在其他的设备上,比如 电脑或者 ipad 或者手机上面打开,实现远程控制。登录之后需要我们选择接受连接。具体的安装过程小亮已经整理成非常详细的图文教程。连接成功后,在我们的远程设备上就会显示已连接终端,同时显示我们的项目文件夹。 启动新绘画后,我们可以在全线模式中设置接受编辑计划模式、运动模式等。在这个远程控制中,我们依旧可以 调用相关的 compact 和 clear, 这些命令包括我们已经拥有的技能都是可以调用的。此外还支持语音输入,这一点非常方便。当我们处于远程控制状态的时候,我们本地的终端显示的是这个界面,提示我们按下空格键就可以回到本题模式。 当我们处于本地模式的时候,我们远程信息依旧同步,会提示我们已经切换到 local 模式,我们只需要输入任意内容,就可以回到 远程控制模式。总结一下, happycode 这个开源项目实现了对 cloud code codex 的 远程控制,可以跨设备无缝切换,同时实时状态同步,能完成智能推送控制,还可以语音输入控制,使用场景非常丰富,比如通讯录上可以继续观察我们的编码任务, 突发灵感可以随时记录并执行,同时还多设备切换入缝衔接工作流。所有内容小亮已经整理成了非常详细的文档,我是科技小亮,我们下期再见。


谷歌发布的 ai 编程助手 anti gravity 最近加入了对 cloud ops 四点五的支持,这对于很多无法解决 cloud code 封号的用户来说非常有帮助。因为很多想使用 cloud ops 四点五的用户, 在注册了 cloud 官方账号之后,在 cloud code 中使用不到一天就会遇到被封号的问题。而谷歌正好在 anti gravity 中加入了 cloud ops 四点五,这样的话大家就可以在 anti gravity 中使用 cloud ops 四点五 ct 模型执行更加复杂的开发任务。 相比其他 ai 编程工具,在 anti gravity 中它这里还支持多智能体异步工作,我们就可以在项目开发中同时开发前端与后端,来大幅度提升我们的开发效率。本期视频我们将通过几个比较有代表性的案例, 使用 anti gravity 中的 cloud ops 四点五模型来测试项目充购、复杂项目开发等场景, 并且看一下我们在深度使用 cloud office 四点五模型的时候是否会遇到额度限制。好,现在 anti gravity 已经全面支持 micros 系统、 windows 系统以及 linux 系统,我们只需要根据自己的操作系统去点击下载,然后进行安装就可以。 好,安装好之后,我们可以先对 anti gravity 进行一下初步的设置,我们可以先点击自定义,这里我们可以点击这个大局, 然后这里就会打开这个大局的规则文件,在这里我们填入与我们技术站相关的这些规则文件,我们可以详细看一下。 首先第一部分是我设置了与 python 开发的相关规则文件,首先告诉他 python 版本,这里我使用的是 python 三点一一,这里是运行命令,下面这里就是创建虚拟环境的方式,然后这一部分就是运行命令的规范,这里还有代码规范,包括代码风格,并且使用 python 三点一一的新特性, 这里就是依赖管理相关的这些命令。然后我们再看一下第二部分,第二部分这里我还设置了 next js 相关的这些规则文件,这里 next js 版本就是十四版本, css 样式就是 tailwinds css 样式。后端数据库就是 superbase, 包括数据库还有认证方式,还有存储方式,这里还包含强制约束,还包含项目结构,还有运行命令。这个规则文件设置好之后,我们直接保存并且关闭就可以。 在后续项目开发中, anti gravity 就 会遵循我们设置的规则文件里的这些规则,然后我们再点击这三个点,然后我们这里再设置一下 m c p, 在 搜索框我输入 superbase, 然后搜索,然后点击进入 superbase, 这里我们安装好 superbase 的 m c p, 安装之后,这里我们需要设置一下 superbase 的 access token, 只有设置好 token, anti gravity 才能通过这个 mcp 来操作我们的 superbase 数据库。这里提到的 superbase 大家可能还不理解它的用途以及它的作用,可以将 superbase 理解为做 app 或者网站用到的后端全家桶, 把原本需要自己搭建和维护的一堆后台功能打包成一个平台来使用。它为我们提供了数据库服务,还有登录系统服务,还有文件存储服务,甚至还提供了实时更新服务。使 用 superbase 我 们就不需要从零搭建后端就能快速把产品做出来并且上线,特别适合做 mvp 创业原型和小团队快速迭代。 注册并且登录成功之后,我们只需要点击右上角的头像这里,再点击账户这里在左侧我们点击 access tokens, 然后在这里我们就可以点击生成新 token, 然后随便输入一个名称。 token 过期时间这里我们可以选择不过期,然后直接点击生成好。生成之后我们就可以复制这个 token, 然后将 token 填写到这里并且保存。然后我们让 anti gravity 检查一下规则文件,还有 superbase mcp 是 否设置成功,这里它需要运行命令,我们让它直接运行 好,这里是检查结果。 superbase mcp 已经能够正常连接,规则文件也已经成功加载,并且它将严格遵守这一些开发规范。这些设置好之后,下面我们就可以开始测试了。我们先打开一个项目路径,这里我们新建一个文件夹, 选择我们新建的文件夹,并且打开。在对话框这里我们就选择 cloud office 四点五 think 模型。 在对话模式这里我们可以选择 fast 模式,还可以选择 planning 模式,对于简单任务可以直接选择 fast 模式,对于复杂任务可以选择 planning 模式。 我这里先选择 fast 模式,然后我们测试一个简单的项目重构,我们测试一下让它将微软智能体框架编写的智能体代码重构为谷歌的 edk 智能体框架。 这个测试题我们上次用来测试 codex 中的 g p d 五点二,但是 codex 没有为我们实现这个项目, 我们直接完整地复制这个提示词,然后回到 anti gravity, 直接粘贴这个提示词。在提示词中,这里我们先让他阅读谷歌 adk 官方文档,这里是文档的链接,然后告诉他将微软智能体框架编写的旅游规划智能体重构为谷歌 adk 的 智能体框架。 还要求他将大模型的接口改为 mister ai 的 接口,并且将模型设置为 mister 拉至三。这里还告诉他了 mister 的 官方文档, 要求重构后的智能体保持原有智能体的逻辑和功能,并为重构后的智能体加入谷歌 adk 的 ui 操作界面,而且 api 要求放入 env 文件中。下面就是微软智能体框架的这个代码, 也就是刚才我们查看了这个代码,然后我们直接运行,看一下它能否一次性为这个智能体重构这个智能体框架。好,这里提示正在阅读这些文档,可以看到这个速度还是非常快的,像上次我们在 codex 中测试的时候,它的速度非常慢。 然后这里它提示它需要创建 v e n v 虚拟环境,也就是我们在规则文件中告诉它的。我们直接点击允许,这里提示需要运行 p p install 命令。安装项目依赖,我们直接允许,可以看到它的开发速度还是非常快的,这里提示依赖安装成功,现在它会检查项目结构。 好,这里提示项目重构完成,然后它提示是否需要帮助我们启动外部 ui 进行测试。然后我们手动设置一下 api key, 这里我们直接填入 micro ai 的 api key 就 可以。在对话框中我们输入我已经设置好了 api key, 请为我启动外部 ui, 然后直接发送, 然后我们按照它的提示在浏览器中打开这个链接,这样的话我们就看到了这个 ui 界面,我们将它切换成亮色,然后我们选择它创建好的这个智能体,下面我们就可以测试一下,然后输入记事词,规划三天的尼泊尔旅行计划直接发送。 我们看一下他的运行逻辑和运行步骤是否和微软提供的这个智能体的运行步骤完全一致。好,这里执行完成,下面我们看一下他执行的是否正确。输出的第一部分内容就是关于尼泊尔的三天旅行规划,第二部分内容就是当地相关的这些特色,还有活动项目。 然后第三部分就是当地语言专家给出的当地的常用语,他执行的这个步骤还是非常不错的,他实现了这个智能体跟微软智能体框架实现了这个旅游规划智能体,他们的运行逻辑、运行步骤基本上保持了一致。 同样的题目,上次我们在 codex 中测试 gpt 五点二, gpt 五点二就无法给出正确的代码,但 anti gravity 中 cloud ops 四点五它实现的这个效果就非常不错。好,这是我们测试的,让它对智能体项目进行重构。 好,下面我们测试一下让它从零开发一个现代化的宠物领养平台 mvp。 这个测试题上次我们也用来测试 gpt 五点二了,但是 gpt 五点二实现的效果并不是非常好, 所以我们这里使用相同的测试题目来测试一下 anti gravity 中的 cloud ops 四点五模型,我们这里先初步这个仓库,在规划阶段,我们可以先选择 cloud sunny 的 四点五 thinking 模型。 在对话模式这里我们可以先选择 planning 模式让它制定计划,因为我们开发的这个项目要更加复杂一些,然后直接粘贴刚才我们的提示词直接发送,先让它为我们制定计划,当它制定完计划之后,我们再选择 cloud ops 四点五模型, 然后这里我们就可以看到他创建了这个任务,然后现在他需要创建更加具体的计划,然后我们点击就可以查看他为我们创建的这个更加具体的计划。好,现在他提示他需要为我们执行计划, 它执行计划的时候,我们就选择 cloud ops 四点五模型,然后直接点击按钮让它去执行这个计划。这样的话我们就在项目规划阶段使用了 cloud 三内的四点五。在项目执行阶段选择了 cloud ops 四点五, 现在它开始为我们出场这个项目。好,这里它提示 next js 已经安装,现在它需要继续执行这些命令,我们直接允许。 在左侧这里我们就看到了他为我们生成的这些文件,这里提示他正在创建 superbase 相关的这些内容。然后我们就可以看到这个任务已经执行到了数据库的设计好,这个任务执行完成,下面他开始执行第三部分的任务, 可以看到它的执行速度还是非常快的,要比在 codex 中使用 gpd 五点二要快非常多。好在等待了大概十分钟左右,这里为我们完成了项目的开发,然后我们就可以看到它生成的项目代码,这里还有 readme 文件, 这里还列出了所有的功能,这里是安装和运行方式。好,下面我们可以输入提示词,让它通过 superbase m c p 为我们设置好 superbase 数据库,在说明文件中它给出了数据库的迁移方式,然后这里我们就让它调用 m c p, 让它自动设置 好,这里它开始调用 superbase 的 mcp 为我们设置。像这里我们就选了 gemini 三 pro 模型,因为这个任务比较简单,所以我们在使用 anti gravity 的 时候,一些简单任务我们就可以使用 gemini 三 pro 去完成。对于复杂的任务,我们就可以选择 opus 四点五来完成, 这里我们可以详细的看到他使用 superbase mcp 的 完整步骤。好,这里提示 superbase 数据库已经设置完成,他在 superbase 中为我们创建了这个项目,并且成功执行了这个文件。下面我们回到 superbase, 我 们刷新一下,刷新之后我们就看到了他为我们创建了这个项目, 然后这里提示他无法设置这个 env 文件,然后这个 env 文件里的内容他都给出来了,然后我们就手动设置 env 文件, 这里我按照他的提示设置好了这个配置文件,下面我们就可以输入提示词,请为我运行项目。好,这里提示项目已经启动成功。 好,运行之后,我们就看到了这个比较美观而且功能非常丰富的一个主页,在这里就是导航栏,这里是首页,这里可以点击领养宠物,然后我们继续看,这里还给出了领养的步骤,然后我们点击登录看一下效果。 好,这里有邮箱登录,这里还有谷歌登录以及 get up 登录,然后我们先注册一个账号看一下,然后我们点击注册好,这里需要我们去验证邮箱,然后我们点击这个确认链接来验证, 验证完成之后,这里就自动登录成功了,我们点击头像,这里我们就看到了我们刚才注册的邮箱,这里还有个人资料,还有领养申请设置等内容,然后我们可以用发布者的身份去测试一下,然后我们可以点击一下发布领养信息,我们先上传一张宠物的照片, 好,这里上传成功,然后我们随便输入一个宠物的名称,这里选择种类,再输入品种,年龄,给他设置成一岁,再选择性别,再选择体型,再设置毛色,再设置所在地区,这里是健康状况和性格,这些设置好之后,我们就可以点击发布 好,这里提示发布成功,然后我们点击浏览羚羊宠物,点击之后就看到了我们刚才发布的这个内容,只是这里没有成功显示这个图像,我们点击进入查看一下。 好,这样的话我们就到了这个宠物的详情页面,这个图像没有正确显示的 bug, 我 们还可以让 anti gravity 继续修复,我们点击查看这个元素,然后这里我们点击编辑 html, 直接复制这个内容, 然后我们直接输入发布宠物时上传的图像,没有显示下面是元素内容,我们直接粘贴直接发送,看一下他能否一次性就修复这个报错。好,这里他成功修复了,刚才是因为权限问题,然后我们刷新一下,刷新之后我们就看到了这个宠物图像,我们点击进入, 点击进入之后,这个图像显示的也非常清晰,而且还有动态效果,这样的话这个效果看起来就非常不错了,比我们上次用 g p t 五点二实现的效果要好很多,各种细节功能我们就可以让它在当前项目的基础上去不断完善就可以了。 好,通过今天我们两个案例的测试,可以发现 anti gravity 效果还是比较不错的,如果使用 cloud o p 四点五的话,它可以在一定程度上去带 cloud code。 下面我们再新开一个窗口,看一下 cloudops 四点五的额度是否用完,然后我们再输入框,让他随便给我们一个代码,我这里让他给我这个智能体的代码 直接发送,可以看到这里他还调用了网络搜索,可以看到这里他搜索了非常多的内容,这里开始输出这个智能体相关的这一些代码。案例,这里是第一个案例,这里是第二个案例,这里还给出了这些文档的链接。 虽然我们刚才在 antigravity 中完成宠物领养平台用 cloud ops 四点五写了非常多的代码,但 cloud ops 四点五现在还可以正常使用, 这样看来在 antigravity 中 cloud ops 四点五的额度还是非常多的。我登录 antigravity 的 这个账户是 pro 账户,可以看到选择 pro 账户使用 cloud ops 四点五进行项目开发 还是完全够用的。好,本期视频就做到这里,欢迎大家点赞、关注和转发,谢谢大家观看。

cloud code 刚凭终端自主编程刷屏,就逼出了 open ai 的 终极反击,两张王炸直接引爆 ai 编程圈,不仅首度曝光 codex 的 大脑架构, 更晒出碾压及基建实力,这场霸主之争彻底白热化。此前, cloud code 靠能自主读代码、改 bug、 跑测试的端到端体验圈粉无数。正当大家以为 open ai 要被动跟风时,他直接揭秘了 codex 的 核心 agent log 架构。这可不是简单问答,而是能实现观察、思考、行动反馈的完整闭环。 ai 能自己规划路径、检查错误、验证结果,从聊天工具升级为能独立搞定开发任务的专属助手。更令人惊叹的是其极限基建。在分布式架构盛行的今天, openai 仅用一个 post 二 c 库主库加五十个止读副本,就扛住了全球八亿用户的病发。洪峰 靠 p g。 邦 sir 连接时缓存锁定机制优化读路径,还通过 prompt 缓存对话压缩技术,解决了长任务成本爆炸和上下文不足的痛点。一边是 clad code 的 流畅体验,一边是 open ai 成熟的 agent 架构与超强工程能力。 这场 ai 编程工具的争霸赛,不仅是模型的较量,更是工程体系的对决,最终受益的还是咱们开发者。

codex 啊,已经超越了 cloud code 成为了全世界最热门的 ai 编程工具了,它之所以能够超过 cloud code 成为全世界最热门的 ai 编程工具啊,原因在于它的价格相对来说比较亲民,而且对于国内的用户是比较友好的啊,不像 cloud code 那 样经常被 封号,限流和降质。好,那么接下来这个视频呢,就带着大家从零到一的来搭建 codex, 并且在 codex 里面使用当前最火的 skill 来进行 ppt 的 生成啊。好,那话不多说,接下来咱 们就进入正文。好,那么首先呢,你要安装 codex 啊,这块给大家讲两种方式,一种方式呢,就是原生的命令行的这种方式来使用,另外一种方式呢,就是通过 vs code 的 这种 id 的 方式来进行使用啊。 好,那当咱们使用命令行的方式来使用 code x 的 时候呢,首先需要保证咱们本地已经安装了 node js 的 环境啊,如果你本地没有 node js 的 环境呢?好,这时候先去这个网站啊,然后去找到和自己系统相对用的 node js 进行下载安装就行了, 安装的时候呢,没有什么难的,一路下一步就行了,没有注意的事项啊,安装成功之后,这时候怎么样确定自己本地到底有没有安装 node js 啊?你在这输入一个 node, 然后杠 v 啊,如果它显示 note g s 的 版本,说明你本地已经安装成功了啊,那么这时候呢,咱们就可以使用这一行命令啊, npm install 杠 g 啊,全局通用的方式来安装 codex 了,复制它, 当然这个仓库呢,是 openai 的 官方的仓库啊,在它这个说明文档里面有相应的信息,那我复制这个信息,来到命令行窗口里面敲回,这就行了,这时候保持你整个网络畅通,它就可以很快地去安装 code x 了。好, 那么很快呢, code x 它就安装好了,但是要使用 code x 啊,我们需要有叉的 gpt 的 账号,并且我们的叉的 gpt 的 账号 要是 plus 用户才行。那这时候怎么样去注册账号,把账号变成 plus 用户呢?给大家去说一下。首先你去访问这个网址,官方的网址啊,叉点 d p t 点 com, 访问完成之后呢,在右侧有一个免费注册, 然后这个时候 ok, 你 可以使用谷歌账号,或者是使用你自己的邮箱,如果你没有谷歌账号的话,就使用自己的邮箱,然后继续下一步输入密码,然后注册就行了。然后注册完成之后呢,这时候把你的账号升级为 plus 用户。当你把你的账号升级成 plus 用户之后呢,这时候咱们就可以用指令来启动 codes 了。 好,那这时候呢,咱们在里面呢去输入 codes 啊,第一次的时候它会让你弹到这个页面上啊,让你先登录的。登 完成之后呢,那你的用户的授权信息就会加载到 codex 里面啊,那我就可以继续用了。好,那我这个时候我不是一邮箱啊,我是谷歌账号,应该是谷歌账号啊, 咱们来试一下。呃,申请账号的时候也要去保证你的。呃,网络啊,你的网络是 ok 的 才行。好,我这呢应该是这个账户。 ok, 点击继续。好。登录成功了啊,这时候呢,咱们切换到咱们这边啊,切换到这边好, ok, 那 么咱们的状态就已经是登录的状态了。 好,这时候大家可以看到啊,它默认的这个 model 啊,就是使用的是 gpt 五点二呃,控制器的 model 啊,那你要切换的话,你可以杠啊。 model, 敲回车,大家可以看到了,它现在呢有五点二的,这个是一个综合性的模型,还有五点一的啊,五点一 mini 的, 那我目前使用的是五点二啊控制器,那我就使用这个五点二就行了。 那么当你选定完模型之后呢,来到了这个页面了啊,这个页面是针对于这个模型的一个模式选择,它的模式呢?有路啊,有,呃, high, 呃,当然路的这种模式呢,它推理的能力不是特别好,但是它响应的速度非常快。呃,那么 high 的 这种模式呢,它推理的能力很强,但是执行的速度比较慢,所以通常情况下咱们选择第二个啊,中间的就 ok 了,然后敲回车。 好,那么这时候它就使用了最新的 j b t 的 模型来进行代码的编写了。好,那这时候咱们可以首先先进入到一个目录里面啊,进入到一个项目目录里面,然后在一个文件夹目录底下进行操作,当然在这个方底下去操作的话也也行 啊,那相对来说,你后面去找这些文件的话,不太好找啊。那好,那我这时候可以把它关掉啊,关掉,关掉完了之后呢? ok, 我 在我的桌面上去创建一个项目文件啊,项目文件呢,不要是中文的啊,最好是英文的,好起个名字,比如说我这儿呢,就叫做 my coders 啊,好,然后进入到当前的页面里面之后呢,在当前的文件夹里面 c、 m、 d 啊,来去启动命令行,然后完了之后呢?还是啊首先我要去启动我的 coders。 好, 那么第一次登录完成之后呢,以后就不需要去登录了啊,我现在所有的这个操作的话,都是在当前的这个文件夹底下进行相应的一些操作的。好,那这时候比如说我想要让他去生成一个页面的话,我是直接可以给他指令让他去生成的啊。好,比如说我让他去生成 啊,生成一个呃美观的登录页面啊,然后呃页面的名字咱们可以给它规定一下,比如说叫做 log in 点 html 啊,咱们先让它来完完成一个基础的一个工作, 咱们先来看一下它生成的一个质量啊,等这个页面儿做完之后呢,给大家来演示一下怎么样去安装呃 skills, 然后来完成一些扩展工作啊?那什么是 skills 呢?在它生成的这个时候呢,刚好给大家去讲一下 skills 啊, skills 呢,其实它就是给你的 ai 员工 去安装一个员工手册,有了这个员工手册之后呢,那么他每次在执行任务的时候,会按照预期你给他指定的方式来稳定的执行任务,并且在 skills 里面你可以做一添加一些扩展工具,那这时候就可以去增强咱们大模型的能力了啊,所以总体来说你可以认为它是一个 升级版的一个提示词啊,但是在这个提示词里面它有三部分,这个咱们前面讲过了,它有原数据啊,它有提示词啊,我任务应该怎么样去执行的?那么还有一个就是资源包,在资源包里面可能会有一些工具啊,然后我再去执行一个任务的时候,我按照提示词的方式 一步一步来进行,稳定地去执行,然后有一些任务可能需要去调用一些啊, python 文件去完成的,那就去我的这个资源文件里面去调用,去执行。所以说呢,那个 skills 啊,它本身是一个让大模型能够按照预期的方式去执行的一个 技能啊,然后在这个技能里面我可以有一些插件啊,这就是 skills 它本质的东西啊。好,那么这时候呢,它已经生成了,然后问咱们是否同意?呃,写入。好,这时候咱们去同意啊,那么它就可以把刚才生成这个代码呢,然后进行写入了。好,那么写完了之后呢,接下来咱们来看一下。 ok, 在 这个 呃,项目的目录里面呢,就有 logan 的 html, 然后咱们看一下生成的效果如何啊?双击好啊,生成的效果呢?整体来说还不错啊,是吧?还不错啊,当然你可以有一些样式问题的话,你还可以让它继续让它追加啊,让它进行修改也是没有问题的啊。 好,那么咱们,呃基础的功能用完之后呢?那这时候怎么样去给当前的 tools 去安装 skills 啊?给大家来说一下,那么安装的话,咱们首先先要去找到你要去使用的 skills 啊,自己去写的也也可以啊,那么刚开始学之前呢,可以先用别人的。好,那么 astropica 本身是有 skills 的 啊,然后大家可以去这个网站,然后去访问 abstract 它底下这个 skills, 然后,呃,在它这个 skills 目录里面有很多的 skills 啊,其中有一个是关于 ppt 生成的对吧?它还有 pdf 啊, 还有关于 converse 啊等等啊这些,那我这个时候, ok, 必须,比如说我现在要去安装这个 ppt 生成的 skills, 那, 那我就好访问它的这个目录,对吧?啊,复制这个地址,然后回到咱们的这个 mini 行里面啊,然后咱们使用 skills insert, 然后加上那个地址啊,就可以进行安装了,那么也就是这行命令啊, double 符,对吧?啊,你要执行 skills 的 insert 安装了,那然后安装哪个 skills 啊?就是安装这个 skills 就 可以了。好,这时候咱们去敲回车,还是一样啊,同意它进行写入啊。好,那么呃,经过短短的 十几秒之后呢,它就把这个 skills 去安装到呃 coders 的 啊全区目录里面了,所以咱们在 以后任何一个项目里面都可以去使用这个 skills 的。 好,这时候呢,那我就可以去呃问他啊,你包含哪些 skills 啊,那这时候他就会去查询自己的这个 skills 啊,到底有哪些。然后啊,这块呢,大家可以看到里面的这个 ppt x 就是 刚才咱们已经安装的 skills 了啊,但 skills 的 话,这种是在线安装的方式,咱们直接给他输入一个地址,让他去去安装的啊,当然你也可以通过 呃离线的方式手动去下载,然后把它放到文件夹里面,或者是放到全屏目录里面啊,这两种方式都是可以的。那么离线的方式呢,咱们在呃 jamaican 之前的视频里面讲过啊,这块咱们就不说了。好,那我这时候要让它去生成一个。呃, ppt 的 话, skills 的 话,那我就用命令的方式来去告诉它就行了。好,这时候呢,比如说我让它呃,生成, 生成一个关于,然后写主题,对吧?呃,什么是 skills? 什么是 skills 的? 呃, ppt 要求极简风格 啊,其他就不用去输了啊,这块简单给他一个描述就行了。当然啊,如果是生产级别的话,建议大家是 词啊,越多越明确,那么它执行的效果可能是越好的啊,咱们这测试的话,可以简单来写一下。好,这时候咱们来敲回车。好,当咱们去敲完回车之后,其实咱们是可以看到的,它目前是使用。呃,它上面写的,对吧?它用的是 ppt, 呃, skills 啊,然后来去执行咱们的任务的 啊,咱们从网址里面是可以去看到的。好,然后他问咱是否去创建这样的一个 ppt 文件啊?好,咱们点,呃,回车啊,这时候呢,他就开始去创建了。好,然后咱们继续敲回车。 好,那么经过四分钟的执行之后呢, ppt 已经生成好了啊,然后这个时候咱们来看一下生成,呃,最终的一个 ppt 啊。好,咱们来打开看一下,什么是 skills 啊?然后确实挺极简的是吧? 呃,然后是把附用的流程封装成可以调用的能力啊,这个介绍的话还是很 ok 的 啊,然后定义然后它的组成是吧?啊?组成就三部分吧。呃,原数据,然后它的 prompt, 然后它的 scope, 它的这个,嗯,执行的脚本啊,然后最后呢写它适用的地方啊,和它本身 scope 的 价值是啥,对吧?好, ok, 那么大家觉得生成的这个 ppt 质量如何呢?可以评论区留下你的宝贵意见啊。好, ok, 那 么这样的话,咱们的呃命令行的 codex 就 安装好了, skills 呢也安装好并且使用了。好,那如果我想要在 id 里面去用,怎么用啊啊?首先当然啊,咱们需要去呃官网去安装 呃这个 vs code 的, 直接搜索 vs code 的, 然后下载安装就行了啊,安装完了之后呢,这时候呢,在扩展工具里面啊,然后点击扩展工具,然后可以去搜索 open ai 或者搜索 codes 啊,都可以了。好,这时候呢,第一个就是 open ai 官方提供的插件,然后点击安装就行了啊,如果说你本地像我刚才一样已经通过 note g s 的 方式在命令行安装了 codes 了, 那这时候来到 v s code 里面是不需要任何配置的啊,这时候它是可以去共享 codes 命令行进行使用的。好,那么安装完成之后呢, ok, 咱们就可以打开项目啊,打开文件夹,文件夹呢,其实就是咱们 桌面上的这个项目,然后去选择它,然后选择完它之后啊,大家就可以看到了。 ok, 这边就是咱们刚才去执行 codes 的 命令啊,它已经完成了,对吧?然后咱们就可以在啊这个里面啊,这个命令里面上一个绘画命令里面继续来 进行相应的执行了。那么 a d e 相比于咱们的呃命令行窗口,它的优势是啥?它的优势是你可以直接去打开这个文件来看这个文件,而且呢在它里面去执行一些命令的时候,你是可以进行一些回滚操作的啊,然后并且 它进行截图上传的时候是比较方便的,比如说我现在啊,我要让它去复现一个页面,是吧?啊,那我就复制一下,然后 ctrl v 在 这进行粘贴一下就行了,粘贴完之后呢,那我就去写西安的需求,写完之后,那么执行是和咱们在命令行窗口这边执行是 一样的啊,那比如说咱们的这个登录页面,我想让登录页面的这个颜色变成极简的白色啊,那我就可以在基础上去呃,去去去,告诉他啊,这时候呢,咱们就输啊,将将呃 login 点 html 背景换为极简的白色风格啊,然后完了之后, ok, 底下这些设置呢,不需要去动它,这就是咱们命令行的设置嘛。 啊,使用最新的模型好,然后这时候去发送好,然后在 id 里面呢也能看到它的修改啊,它从原来的,这是上面啊原来的,然后加了一些什么内容啊?我可以允许这次的执行或者是原词此次绘画的所有的执行啊,那我就去选择就行了 啊,那么到这儿,呃,它的 login 就 已经修改好了,然后并且有修改的行数啊,然后这块呢,你可以进行回滚啊,可以进行回滚操作,这就是 id 它的优势啊。好,那这时候咱们打开 页面, ok, 已经变成极简的白色了,对吧?好,这时候如果说,哎,你不是满啊,很满意哎,我就需要之前的那个啊,那我这时候就可以撤销啊,回滚到上一个版本了。那么到这咱们关于 codex 的 两种使用方式以及 codex 加上 skills 的 演示呢,就给大家执行完了。我是磊哥,咱们下期内容再见。

大家好,欢迎来到 codex mcp 配置教程,你是否希望你的 ai 编程助手能够自动访问文件、系统操作浏览器、调用、远程服务? 今天我将用最简单的三步配置,教你释放 ai 编程的无限潜能。 mcp, 也就是模型上下文协议,能够让 codex 连接外部工具和服务,实现十倍效率提升。仅需一个配置文件,你就能让 ai 助手拥有文件操作、浏览器控制、 http 服务调用等强大能力。 这是一个最小化教程,只讲核心要点,让你快速上手。准备好了吗?让我们开始吧!首先,让我们了解什么是 m c p。 m c p 的 全称是 model context protocol, 翻译过来就是模型上下文协议,它是连接 ai 与外部世界的桥梁。 mcp 带来三大核心价值,第一,连接外部工具。通过 mcp, codex 可以 访问文件、系统操作、浏览器调用、 http 服务等各种外部资源。这意味着 ai 不 再局限于文本对话,而是能够真正与你的开发环境交互。第二,扩展 ai 能力。 mcp 让 ai 从纯文本交互升级到真实环境操作。 你可以让 ai 帮你自动提取文件、批量处理数据,甚至操作网页元素,实现真正的自动化任务处理。 第三,提升开发效率。有了 m c p, 那 些重复性的、机械性的工作都可以交给 ai 自动完成, 你可以专注于更有创造性的工作,开发效率轻松提升十倍,这就是 m c p 的 强大之处。接下来让我们看看如何配置它。配置 m c p 非常简单,只需要三个步骤。第一步,找到配置文件,你需要定位或创建一个名为 config and tomml 的 配置文件,这个文件是 m c p 配置的核心。 第二步,添加 m c p 配置。在配置文件中编辑内容,添加你需要的 m c p 服务,并定义相关参数。这一步决定了你要使用哪些外部工具。第三步,启动并测试启动 codex, 验证 m c p 服务是否正常加载,然后就可以开始使用了。是不是很简单, 整个过程不超过五分钟,接下来让我们详细看看每一步该怎么做。第一步,找到配置文件。配置文件的位置取决于你的操作系统。如果你使用 linux 或者 mac os 系统,配置文件路径是波浪线斜杠点 codex 斜杠 config 点 toml。 波浪线代表你的用户瞩目路。如果你使用 windows 系统,配置文件路径是 c 盘反斜杠 users 反斜杠,你的用户名反斜杠点 codex 反斜杠, config 点 tom l。 这里有个小提示,如果配置文件不存在,不用担心,你可以手动创建它。 只需要创建点 codex 目录,然后在里面新建一个 config 点 toml 文件就可以了。找到或创建好配置文件后,我们就可以进入下一步了。第二步,添加 mcp 服务配置。打开刚才找到的 config 点 toml 文件,我们需要按照特定格式添加 mcp 服务配置模板是这样的, 方括号, m c p 下滑线 servers 点服务名称,这是服务的标识,你可以自定义。下面是 command 等于引号 m p x 引号,这是执行命令,然后是 argus 等号。方括号里面是命令参数数组, 还可以选择性添加 env, 用来设置环境变量。让我给你个实际的例子,配置文件系统服务,我们写 m c p 下滑线 servers, 点 file system command 等于引号 m p x 引号 argus 等号方括号 里面写引号减 y 引号,引号 at 符号 model context protocol 斜杠 server 加 file system add 符号 latest 引号。最后是你的工作目录路径,比如引号斜杠 workspace 引号。就是这样简单的几行配置,就能让 codex 访问你的文件系统了。第三步,启动并测试保存配置文件后,我们来验证配置是否成功。 第一个操作,在终端中输入 codex, 启动 codex, 查看已加载的 codex 服务列表。 如果配置成功,你会看到类似这样的输出, m c p services 冒号 file system 括号已连接,这个绿色的对勾表示服务已经成功连接。恭喜你,配置完成了。 现在你的 codex 已经具备了访问文件系统的能力,你可以让 ai 帮你读取文件,创建目录,批量处理文件。所有这些操作都变得自动化了。当然, m c p 不 仅仅是文件系统服务,还有更多强大的服务可以使用。让我给你介绍几个常用的 m c p 服务, 每一个都能大幅提升你的工作效率。第一个,文件系统服务,这是最基础也是最常用的服务。 通过它, ai 可以 访问你的文件和目录,帮你读写文件,批量处理数据。配置方式我们刚才已经演示过了。第二个框,开发工具,这个服务让 ai 能够操作浏览器,实现网页自动化,你可以用它来进行网页抓取、 ui 测试、数据采集等任务。 配置也很简单,服务名写 chrome command, 用 npx arcsoft 写 chrome 减 devtools 减 mcp at 符号 latest。 第三个远程 http 服务, 通过这个服务, ai 可以 连接远程 api, 调用第三方服务或云端资源。配置方式略有不同,需要指定 url 参数指向远程服务地址,并设置 experimental 下划线 use 下划线 r m c p 下划线 client 为 true。 这三个服务覆盖了大部分使用场景, 你可以根据需要选择配置一个或多个服务。让我们看一个完整的配置视力,在 config 点 toml 文件中,你可以同时配置多个 mcp 服务,比如这个视力。我们配置了文件系统服务和 chrome 开发工具,保存文件后重启 codex, 这两个服务就都可以使用了。 让我们总结一下今天学到的核心要点。第一,三步配置快速上手,找到配置文件,添加服务配置,启动测试,整个流程不超过五分钟。 第二,连接外部工具服务 mcp, 让 ai 能够访问文件系统,操作浏览器,调用远程 api, 将 ai 从文本世界带入真实开发环境。 第三,十倍效率提升自动化重复任务,让你专注于创造性工作,真正实现高效开发。 mcp 是 提升 ai 编程效率的关键技术,配置简单,效果显著。现在就开始配置 mcp, 释放 ai 编程的无限潜能吧。感谢观看,如果对你有帮助,请点赞关注我们,下期再见!

嗯,好,我们来继续接着使用 codex 来帮我们来完成这个 ai 陪伴 app。 我 们上一次的话,我们是把那个猫咪的知识库完成了,然后呢还把猫咪的知识库接入到了一个本地聊天, 然后今天呢我们要把这个东西正式接入大模型啊,把这个聊天正式来接入大模型了,也就是说把它,嗯 嗯,把它部署到后端了, ok, 然后来看一下,看一下我们目前已经完成了的一个 一个阶段是引导页面,引导页面选择猫咪,选好猫咪之后,我们的一个首页的这个框架也已经做好了的,首页的这个框架,然后还能聊天聊天,哈喽 啊,然后但是这个现在的聊天呢是还是本地聊天没有接入大模型的,所以还不太聪明。然后我们还给每只猫咪的一个知识库给它完善了啊,这个也是 codex 帮我们写的,每只猫给它写了十篇文章。 呃,然后今天的话呢,我们要把那个这个聊天啊以及知识库把它全部搬到云端去,聊天的话就要就走大模型了, 然后我们的 app 再接入到对应的后端 api 就 可以了,调用后端 api, 呃,然后还是让 code x 来帮我们实现, ok, 数据库的话我已经整理好了啊,我起了一个数据库,数据库的名字叫做 get partner 了,放大一点, get partner 了,然后,呃,我把黄金变量都写进去了啊,大家看啊,在这里我就新起了一个云函数 啊,函数计算,新起了的黄金变量我已经放进去,放进去了的,也就是说数据库的一些账号密码什么之类的全都已经 准备好了,包括大模型,我用的是千帆啊,千帆的一个 api, key, appid 全部放进去了,然后还有一个云函数调用 lm 的 一个示范,这个示范我也, 我也准备好了,然后我把这些东西复制一下啊,把这些东西复制一下,扔给 chat gpt, 让来看一下。我,刚刚扔给他的啊, 扔给它了,我,我,我跟。接下 gbt, 我 们继续,就是和上次的进度是一模一样的,接着上次的来做,我的数据库已经准备好了,我怎么让 code x 帮我设计数据库并完成后端 api 呢? 啊?通过云函数调用 l i m 即可,这是云函数的一个黄金变量,这个是调用的一个失地, 然后 x b d, 他 告诉我啊,他说这个场景非常适合用 code x 来做啊,他说了这个话我就放心了,不然我在想我哪些东西还没准备好,到时候, 呃,弄的过程中又搞错了,又得重头来来做,太麻烦啊。 x b d, 这么说我就放心了, 他教我,教我来,在这个仓库根目录里面和 index 点 m d 同级,来建一个文件夹。那我, 那我来建一下啊。呃,我按照他的要求来建一下好了,我们 在那,就在这里,在这里 agent agent 点 m d 啊,和这个同级啊,就在这下面键就可以了 啊。我,嗯,虽然这里是用那个 xcode 打开的,但是的话,嗯,真正的 app 其实代码是在这里的啊。嗯, 看一下啊,咋建来着?复制一下,这是一个文件夹,嗯,啊,先写一个 md, 我 们先把这个 md 写,写好, 右键 empty file 粘贴,这是后端的一个 md, 哎,咋,咋给我变成 swift 了。这,这,这个 logo 有 点有点神奇,我是 md 文件啊。呃,我不太想让它变成 swift 的 这个样子啊。我先不管吧。先不管, 然后把它复制一下, 保存一下 啊。我把它删除一下,我看着感觉有点奇怪啊。删除一下, 右键六六一个 printf 没问题啊啊对的呀,没问题啊 啊。叫做 back end 点 m d 啊啊,现在。对的,刚刚他把我当 swift 了,我可不要。呃,然后把他真实的名字再改一下啊。对,这个名字复制一下 面贴。好啊,现在好了,现在这格式舒服一点啊。给我识别成 md 的 话,你看它这个标题,它也会给我变大。 实现云函数后端使用 my circle 持久化聊天和记忆调用。百度千帆 l l m o p i s d k。 不 做复杂账号体系。先用 device id 或者 user id 来标识啊。对,是的,我也是这想法,一开始的话咱先不要做什么登录注册,太麻烦了,我先 把我自己这个跑通啊。登录注册这东西后面再让它来补,应该是很 easy 的 环境变量。嗯,对,我已经有了 model。 我 已经有了 数据库的一个表的设计。呃,看一下它怎么设计的。 user 有 一个 id user key created at conversations。 这是聊天有个 id, user id cat id cat id 对 应的是四只猫,四只猫 user id cat id title is achieved。 啊,这个什么意思?就是这聊天已经停止了。应该是。呃,嗯,想想。这是一个一条聊天 啊这是一条聊天。对对对,这是就是一个聊天框的聊天,然后 messages, messages 是 这聊天框里面的内容 conversation 点 id 角色 content tokens created at 啊,然后没有图片的,没有图片就没有图片。没关系,我们先简单来 conversation memory 啊,这个是记忆还 memory 啊啊,不管它不管它 user memory 啊,这里你看它这个还给我设计好了,这个比我聪明很多。我,我之前搞这个聊天的时候,我弄得很简单,我压根就没有, 就是去定制化用户信息,没有把用户的偏好记下来啊。拆 g b t, 他 帮我这设计好了,我觉得挺好的。 cat k b items 直接用 reg 都给我弄好了 啊,这挺好的挺好的啊。呃,看一下 api 设计 啊, api 设计可能要改一下啊,我先不改,先按照它的啊,因为,因为我到时候要走路游走右路由的话我,我要加前缀,那会我自己加就好了啊。聊天编排策略组装,上下文 回复结构抢制啊,他扯 gbt, 他 还给我想好了要怎么玩 记忆更新 messages 大 于三十时调用调用 啊啊,它很机智啊,它现在哇,它现在很牛逼,就是说,比如说我们来 和智能题聊天,我们做简单的策略,我们怎么做?就存最近十条,最近二十条,但是它很机智,它全都要, 他全都要,就说我不仅要拿最近的多少条,我还要拿之前的,只不过说我把之前的给它总结一下变成 summary 啊,可能有几千字把它总结到一百三百字啊,这样的话就能够 既保证上下文没有太多,又能让智能体又又能让大模型知道用户和我们在干啥。哎, rag 也做了啊,这, 这感觉挺厉害的,我都还没有真正做过 reg 啊。我,我之前想做,想做个 reg 系统,但是我的知识库不够,都还没有真正做过,他这话把我 reg 也给我做进去了。安全多底啊,还有这个安全多底。 嗯,代码要求。呃,总的看下来是没有问题的总的看下来没有问题。再来再来看一下 gpt。 怎么说? 你需要给 codex 的 总任务指令里面贴这玩意啊?总任务指令贴这个就好了。呃, back end create, back end folder 啊,它会让,它会让这个 code x 来建文件夹的,所以这 back end 文件夹我们也不用建啊。其实现在 web code 也挺爽的啊。就是 怎么说呢,我觉得很重要的一点就是还是我们要有一个阅读能力啊,就你不能说,对吧,尤其是这种关键的指令,你不能说,切, gbt 给你之后你啥都不管,你就给他,你自己要稍微读一下啊,不然你也不知道他他给你弄出来的是什什么东西。 千帆 base url 哎,它还它还给了这个千帆的一个文档,对吧?我来检查一下啊,我,我得确认一下它这个文档是对的,它这文档果然是错的。 那那,那我来找一下 千翻啊,我要用一下这个,我要去找到真正的文档,不然的话,不然库德 x 肯定不知道的。 user the provided 千翻 open ai sdk, 这个我可能要改一下 啊。 百度 ai 有 没有 哦,在下边这个下边这个, 我我应该是这里那个的。我我我拿 safari 啊, safari 那 个一下 先翻啊,应该是这里。 来来我来我来找到它真正的文档啊,不然的话,不然它这个链接是有问题的。你现在的 a r m 调用实体怎么融进去?完全可以附用数据库,怎么让它聪明一点? 追加一句, ios 怎么对接?你需要注意的一件事情,数据库是买 circle 八还是五点七?我看一下啊,应该是八,没问题的。买 circle 八点零。告诉他, 我先把它再告诉他好了。告诉他啊,我把前面的也先做做掉。先 看一下这个文档有没有。文档没有的话也不要紧啊,也不要紧的,其实我是有这个调用势力的,我之前有这个代码调用示范的,但我我不想贴太多。 微信这里有微信的文档,百度的文档有没有,但是我已经给了他这个调用的一个案例了。啊 啊哦,看一下看一下啊,百度那东西找不到。 ok, 我 们先上手吧,遇到问题再说,遇到问题我们再再来改就对了。 so in find 啊,在这文件夹里面,右键 在终端打开。嗯,对的,然后扣的 x 进来。 you can resume a previous conversation by running code x resume。 我 们 resume 一下好了。我觉得可以 resume 一下我们上次,上次编程和上次我们生成知识库让它优化聊天,然后这次的话 我们要把这个东西搬到云动,我觉得相关性还挺大的。然后看代码有没有保存啊。代码代码,上次的应该是存了的啊。上次应该存了的,不管, 等它 resume 一下。 哇,这太厉害了,他连自己做的事情他都他都记录好了的,直接可以一键忍。就我,我之前我还挺担心的,我担心我在想我做完这个任务之后,我肯定这个窗口已经关掉了。呀,那我下一次来继续干活的时候那。 嗯,就是肯定,就上下文就没那么舒服了。 嗯,等它,它 read 用可能需要一点时间。 再看一下叉二 g b t 啊,再 千帆 open a t n s t k。 我 直接搜一下,看能不能搜到百度千帆 这里啊。使用百度千帆大冒险 sdk 替换这里吧,看一下。 用别的也可以啊,这都无所谓的,用啥都无所谓的啊。 ai doc 帮助文档开始使用 inet, 四点五 a v l 嗯,我用的其实确实是和这个类似的一个 文档 模型介绍模型服务调用, 我把这个复制复制替换掉算了啊。呃,再起一个, 然后把叉 g b t 给我的这个调用贴一下啊, 他给的是这个链接。 千帆百渡口比天高 啊。这里有啊,在这地方啊,这是对的那是对的。不好意思,我搞错了啊,调用的时候需要有这个这样子调用啊。我误解切尔 gpt 了,不好意思, 然后看一下。好,已经 ok 了。嗯, ready to continue what i'll take next 呃,贴进去,开始开始干活。 autumny large with autumny 轮锅啊列提高 outlining。 嗯, 然后它这个也很厉害的,它 rejuven 的 话,它也也会把一些 反复杂乱的东西给去掉。你看我之前的话,其实我应该只剩百分之六十的一个上下文了的,就是上次用酷来 x 用了之后,然后这次呢,他帮我 re 用了之后就是把上次的记忆也提取了,它还剩百分之九十四的一个 context 的 啊,它会 因为我会和和他反复纠错嘛,还有一些是累赘的信息嘛,他应该把这些信息给剔除掉了,把上下文给他给精练了, 看他一步一步来做。嗯, schema requirement。 我 来看一下。 其实我的想法的话呢,就是就是做一个这样的一个云函数啊,可以去啊, 就一页代码,其实只有一页,别的都是依赖的第三方库,然后有个 requirement, 有 依赖这些库就可以了,代码全在这里。 但是呢,我不想自己去拼错了,我不想自己拼错,然后呢,我还想它更加智能一点,就是类似于把 reg 那 一套也加进来,所以我让 chat gbt 来帮我更好地 完成这个任务啊,就是它比我自己去做还更强,因为我对很多东西我也不了解,但 chat gbt 它很聪明, 让他到时候文件弄好了之后,我再复制到,复制到那个云函数那边就可以了。他还部署?他不会在本地部署吧? 我看一下应该没有叫他部署吧,必须可以部署到云函数啊。对对的,要求是对的, 他可能在本地,在本地部署一下,看能不能跑通,能跑通的话再给我,因为,因为,因为 codex 他 会自我纠错的。这个挺好的, 类似于它把,我们只是一个开发啊,就我们开发和 chat 二 gbd 聊天,让让 chat 二 gbd 和我们结对编程。但是 codex 呢,它不仅是个开发了,它是一个开发团队,它还有部署 运维,对吧?有,有开发,有运维,还有测试一,一个团队都塞进去了。 然后慢,是有点慢,我看网上好像也说 codex 它很慢,有点慢,但是无所谓的,这都无所谓的, 也就几分钟时间,它一下子给你干掉了几个星期的活。 然后呢,他们说 codex 它的一个质量是很高的,也确实很高。我,我就是还没有写过一行代码,那我一行代码都没有写过,就这个 ai 陪伴 app 我 一行都没有改。我让权势让 gbd 来帮我生成提纲,让 codex 根据这个提纲来完成。看一下啊, runs serverlocal, python backend, 点 app initialize, db schema。 这什么意思?我看一下。我这个。我, 嗯,给切下 gpt 啊,我不管,看一下。 嗯,这样子。呃, code x 已经把指令运行完毕, 接下来该怎么做?我这个函数是需要自己部署到阿里云的啊。我自己做就行, 我自己做就行啊。嗯,然后我的数据库也是云数据库, 我需要手动生成数据表结构吗?问一下他,我也不太确定, 代码已生成,还没跑通的一个阶段。那跑起来啊,出售外云数据库,填写一批 kb 种子数据。我不知道是什么意思。 kb 种子数据用 call 你 的 app 打通 不说。当然这个没问题,但是数据表结构必须先创建。嗯,手动执行最稳。我看一下我怎么我怎么去执行。它给我已经生成了 schema。 呃,收音 find back end 在这儿啊。哎,我有 levit 啊,我有 levit 这个。这这东西啊,现用现学, 最稳的是手动执行 my circle, 不 会因为你填写了就自动有表。你需要的做法,在你的云执行一次 schema 两种做法, 格式化工具 navigate 可以 的,打开全选执行 navigate。 啊啊,那我右键打开 打开了是吧。已经打开了,然后刚好我也在 那我 round 一下,刚好我在 cad partner 这个数据库里啊对,再就这数据库啊,我们再确认一下这个。这个东西一定不要急,先看完啊, 我都是搞云开发了,我不本地跑通云端就是我的一个那个实验场所。 我先问他,笑他什么是 seed, 什么是 k b 啊?什么是 seed? 什么是 k b 知识库?哦,我的知识库 seed 种子啊。先执行 schema 键表啊。先执行 schema 键表,没问题。右键, please select a connection to run 啊, peter latch cartel 啦。啊,没问题啊,跑吧, 跑好了,应该应该跑好了。我来看一下。来了来了,非常好,非常棒。这个东西,它,它的上限比我高太多了,我的上,我都不懂这些东西。 rap 啊, service。 啥情况?他给我生成这么多文件,我只需要一个 app 文件呀, 看一下啊,这些文件都得导进去。 rapper service。 呃, back end。 我, 我来建建一下这个文件夹吧。啊,呃,看一下 右键,在终端打开,我看一下它的一个文件树啊 tree 好 了, 复制一下,让 c g p t 来教我。 呃, schema 点 s q l 我 已经成功执行啊,然后 back end。 文件夹是这样的, 给他,给他。这话别犯错,犯错老姑也挺麻烦的,这改起来太麻烦了。程序员,你知道他给你干活干的慢一点没问题啊,他给你干活 干的跑不起来,很麻烦,或者说干活干出问题来了,很麻烦。 太好了,加代码完整结构啊,一键表,把 k b 灌进去。嗯,我的 k b 在 哪里呀?我看一下。我不是全都给你了吗?没有看到 c 的 点 p, y, u, t, l。 没有,没有完成,还没有做。他知识库还没有放进去, 应该还没有放进去。 推荐让 codex 生成 c 的 点 kb, circle, 一 次搞定。有了 c 的, 你的太牛逼了,一次,他这一下子不知道干了干了这程序员多久的活。 create back end, 买三个八点零。我先确认一下。先确认一下 insert at least sixty comfort 三十条 tiny task, 一 十二个 playbook, 二十个 storesnap, 一 次性搞定是对的。我,我不想麻烦福宝小布丁,西西泡芙。 also, include a few primary items keep connected with each character。 有 了 seed, 你 的 key 才有料可解锁啊。 这走起啊,不知道今天能能能做多少事情,我感觉他已经做了很多很多事情了,但是可能直观上啊,就是从一个移动,从我们的 app 的 角度,可能还没有变化,但是他, 他已经把整个后端的一个代码都已经给你写完了。 太强了,虽然这页面写的有一点点,嗯,就是让付费用户户可能付费意愿没那么强,但这些都是小活, 这些都是都是可以很轻松优化的,我们最主要的,先把这整个 流程跑通,让这个聊天变得更加聪明啊。这个很重要,这个就涉及到后端啊,涉及到后端,涉及到 promote 优化,涉及到 red 解锁,它涉及到知识点就很多了嘞。把这个先跑通, 然后这页面优化,它无非就是只是涉及到 swift ui 啊,那磨一磨就好了 啊,这真的是 ai 编程的一个上限。 code x 看一下啊,它执行完了,我们还是还是那个一点。嗯,呃, code x 已经 执行好了, 一步一步跟他来。呃,他应该是已经生成了啊,我已经看到 c 的 点 k b 点四个 a 啊,我已经看到啊,凳子调矮一点, c 的 点 k b c 的 杠 k b 点 c k l。 接下来我该怎么做?我不需要 在本地跑通,我直接云端运行就行。 没问题啊,云函数吧,我不需要在本地跑通云函数啊,哎,走 user name backend 点,你在本地终端执行,把占位符换成你的云库信息啊,那我等会再输。这个涉及到密码输入, 我下次再再弄这个。我先把云函数部署上去。 c 的 跟 k b 我 看一下能不能用 linux 跑 啊,这些都是好了的。我的我的这个是跑通了的啊。我的云函数和数据库之间连接已经跑通了。这没问题的, ok 啊。嗯,把它上云函数。上云函数,然后我想问一下它 用 navi cat 可以 运行吗? 如果不行的话。啊,可以,对吧。 navi cat 已经连上了的右键啊。非常棒。没想到 今天的进展也是如此顺利啊,这么多啊,又选 play 的 lot 开的 part 的, 走起走起啊。呃, 插到哪个库里面看一下插到哪个表里面。 k 的 kpi, tens 啊,在这里,我们走 好了是吧?好了,看一下。好,进来了,搞定了搞定了。太棒了太棒了。 真的赏心悦目我感觉我感觉真的很赏心悦目,他一下子帮我做了这么多事情。这个太感谢了 啊太感谢了。非,非常好。然后呢?接下来呢?手动,手动,把这个,把 rap, 把这个传上去就好了。手动传上去 back end, 我 把它复制到桌面好了。行,复制到桌面, 然后我看这边能不能直接部署哈。呃, 上传代码,上传文件夹, 我想再选中,不用。嗯,好,上传文件夹啊,走那个桌面 back end, 上传。 保存并部署啊。保存并部署。部署肯定是部署不成功的。 嗯,好。嗯,他这部署成功肯定有问题的。依赖裤依赖裤都没有。 嗯,有点慢,可能我这会得把这个变成直连啊。先变成直连一下。先直连一下 啊。对的,然后来了,对吧。它这 app 是 有问题的。我可以告诉你啊,它 app 五千是有问题的,这个阿里云的这个云函数的话,你得你得按它的要求来,九千八个处 九千这话就好了。然后呢,依赖也得装。依赖不装是不行的啊。依赖不装是不可以的。那个,呃,把那个看一下怎么变成深色模式 关闭了的。呃,我要把那个特米娜拉出来啊。拉一个 p i p。 因此 door flask p i p。 因此 door requirement quamen 啊。杠 t 点杠 r 啊,杠 t 点杠 r 吧。好像要加个杠 r。 杠 t 点试一下试一下。来来,走起 啊,不对看一下。 哎,我,我指指令有错误。指令肯定有错误,杠 t 点干嘛。哎,也不行。我我这个指令我我看一下啊,问一下千万,这会 帮我修复一下。 嗯,对 excel 杠 r 啊,这顺序有问题。我知道,大概是这个样子啊。啊,来, 现在有,现在太适合我这种人了,有这种 ai, 我是 这些东西我是我是记不住的。顺序我真是记不住的。 ok, 等它那个啊,把这些依赖装好。装好了是吧。装好了我再部署一下。 部署一下代码我,我先不用检查啊,然后我把它的一个出发器公网访问地址在这啊,然后再继续问 gpt。 感觉马上就要能开始跑起来了。嗯, c 的 杠 k b 点 circle l 已经导入啊,云函数已经部署。 云函数的访问链接是这个。接下来我怎么让 app 啊,让 code x, 我 可不想自己写这这边你要写这个,你要写写 api 代码写一大堆啊,接下来我怎么让 code x 帮我 完成 api 接入啊。使用 swift 里的 url session 即可啊。云端 没有做 j w t 娇艳的 ok 给他。 哎,马上就要 ok 了哈,这话还能摸摸鱼。刷刷短视频。 短视频刷起来 好。已经好了是吧,这么快? 给 codex 一 条任务指令,让它直接做完一份可直接用的 swift 的 u s 缩写客户端代码,你也可以自己先贴近项目,直接给 codex 任务指令复制粘贴即可。哎, 你也可以加,手动加一个最小的 api, client 可以在基础上。算了。我,我不喜欢啊,我不是很喜欢封装这东西啊。让再加一个后端服务层啊。我不封装,不封装,我直接 直接,咱先跑起来再说哦,好多代码,这代码还挺多的嘞。可以可以,先考过来看一下,检查一下 base ur l 啊, implement 啊,这个没问题没问题啊。嗯,要不咱试一试,试一试?试一试,试一试啊,摸鱼。 嗯,来看一下,把这个拉过来看一下。这个是指令。 太舒服了,围脖扣顶,这样太舒服了。 你只需要能。嗯,能和嵌在 gpt 沟通啊,这是最重要的。然后呢,要是能看你是你能看懂一点点代码,那就更舒服了, 解放双手感觉。 等一下,看一下能不能跑起来啊。那一次给我写这么多代码,说实话,我我自己每和切的 g、 b, d 去沟通,写这么多代码肯定会有问题的,写到这么多代码时候经常会运行不起来的, 但是走了这个 web coding 的 话,要用 code x, 它会保证你的东西能够运行起来。 这效率真的是十倍提升。十倍提升没问题,你想想这个东西我们才做了多久啊?才做了 三个课时啊,才做了三个小时,就是我们在这个和他一起干活的一个过程,才三个小时, 当然别的时间嘛也会构思一下。会构思一下,但是真正和它协助编程的一个过程只有三个小时。 哇,赶紧跑好跑好。跑好的话啊,今天就到这里了,已经快一个小时了啊,不要超时 web coding, 快 乐编程。 但是我我不确定这个能不能跑通啊,说实话就是这一堆这一堆这个代码啊,它这一堆代码,一堆后端代码 啊,不知道不知道能不能关联上。它的一个代码还是很结构化的,像我自己写云函数,我都很很随意的了。我全部塞到这个 app, 点 p y 里面 tags, 点 p y, 嗯, safety 啊, promotes。 嗯,把这些东西全部搞到云端去了,然后再接入大模型来回复,还做了一,还做了一套一套小小的 reg 系统,真的是震惊我了 哎。好嘞好嘞,做完嘞,看一下 啊,先跑一下,我估计大概就是跑不动。 beautiful 啊,这啊这这小问题啊这小问题。这个大家看过我那个 swift 的 ui 的 一个那个编程的话就知道啊,都用这个 command 就 好了。加个 command, 这是 ai 的 一个通病,就是你用 很多大模型他都不会给你加这玩意,他以为 switch 加了 switch 的 ui 就 好了,但是你用这玩意的话,用 observable object 的 话还还得加个 combine。 跑起来了,来聊一下天,看一下就知道了。你是谁呀? 发一下好,再转圈圈把,把这个挪过来看看。挪过来转圈圈,看一下有没有报错。理论上十秒钟之内会给我回复回来。 还没有回复好,哎。我我我,这边也把日历打开哈。这边把日历也打开, 这边来看,再继续看 啊,跑不通了吗?跑不通了,有问题, 网络不可用,他跟我说。嗯,那我那我先把这个弄掉。好吧,先把这个退出啊,先把这退出 退出啊,退出了看。呃嗨,问他简单一点的再看看啊。用网络不可用,它给我自动还切换成本地了。这倒挺好的,但是我今天的一个东西还没跑通 啊,跑不动的话只能下次控制时长,不要让编程变成不开心的事情,而且我们今天已经写了很多很多代码。这么多代码已经写完了, 看一下 levine。 啊,这都是小问题啊,这些警告没关系,来看一下这个网络没有通是吧,网络权限应该是不需要拿的。 哎我操,看一下 还没没,没有给我报错啊啊,再试最后一次 time out 也还是 time out。 嗯,还是 time out。 这个不行啊这个不行啊。啊,看一下, 那只能下一个课时我们再来解决这个问题啊啊,还遇到了一些小问题,留着 留着下课时间。 ok, 那 我们今天先到这里,我们的后端其实也已经部署上去了。我我手动访问一下看行不行 刷,然后拿其中的一个接口 house 啊,看能不能调通。 看接口接口这边有没有问题 啊?可能可能这部署这边有问题,你看这好像没有跑通。再来一下, 我来我来给它设置一下配置 更多配置高额配置访问更多配置啊,我应该是没有,没有开启校验的权限层, 高级配置 无需认证。对,是没有认证的。 test 有 没有啊?这个云函数这边还。

gpt 五点二 codex, 能写三百万行代码的浏览器,你觉得它离独立开发一个完整的商业 app 还有多远?二十三到一个月你会用吗?

在之前的视频中,我为大家演示过多种与 cloud code 和 codex 相关的开发工作流,包括 be my method、 spiket、 openstack 等。 最近我又发现了一个更加工程化、更完整的开源工作流 superpowers, 它是一个面向 ai 编程助手的完整软件开发工作流系统。它支持 cloud code, 还支持 open ai 的 codex, 还支持开源的 ai 编程助手 open code。 而且我在 cloud code 中使用 superpowers 开发了一款 ios 的 时间线笔记的原声应用。在这个时间线笔记中,我们可以记笔记, 比如说这里我们输入一个笔记内容,还可以输入标签,在这里还可以选择图像,比如说我随便选择两张图像, 我们就可以点击发布,然后它就会以时间线的方式显示在最顶部,底下是我之前发布的这一些笔记内容,而且我们还可以对笔记进行编辑或者删除,还可以点击放大这些图像。 superpowers 它的功能不是让 ai 随心所欲的写代码,也就是我们通常所说的 web coding, 而是把一整套接近专业工程团队的开发方法论固化下来,让 ai 编程助手在写代码时能够自动遵循最佳的实践,包括先澄清需求,再编辑计划,再分布实现,而且每一步都有检查点, 从而避免 ai 编程助手采用 web 扣顶的方式把项目越写越乱。它最大的特色就是测试驱动开发贯穿始终,作为铁律,强制执行 每个任务都会委派一个新的 sub agent, 这样就不会造成上下文污染。它的实现方式是把研发流程打包成一组可组合的 skills 与启动指令,并通过指令还有技能库,还有工作流编排的组合,让 ai 在 不同阶段按流程做正确的事。 好,本期视频我们将结合实际项目,带大家测试 superpowers 这个开源工作流的使用方式以及使用效果。因为 superpowers 它对 cloud code 的 支持要更好。 在 cloud code 里它可以借助 cloud code 原声支持的 skills 功能以及插件功能,实现一键安装、加载与自动触发。 所以本期视频我们将重点在 cloud code 中来测试这个开源的工作流项目。在 cloud code 中使用 superpowers 这一个插件非常简单。首先我们打开终端命令行,然后进入 cloud code, 再复制官方给出的这一条命令,然后回到 cloud code 中进行粘贴并且执行。下面我们再复制官方给出的第二条命令,然后粘贴到 cloud code 中直接执行。 在 codex 中安装也非常简单,我们只需要复制官方给出的这个提示词,在 codex 中直接粘贴这个提示词并且执行就可以。在 opencode 中安装也非常简单,我们也是直接复制官方给出的提示词,然后在 opencode 中直接粘贴提示词并且运行就可以。 下面我们就可以在 cloudcode 中输入斜杠命令,再加 super, 然后我们就可以看到 superpowers 它支持的这三条命令。 第一条命令是用于头脑风暴,也就是我们只需要简单的描述我们要开发的内容,与 ai 进行苏格拉底式对话,从而帮助我们厘清我们真正的需求。然后这一条命令是用来写开发计划,它能实现编辑二到五分钟的小任务,包含精确的文件路径, 完整的代码片段,还有明确的验证步骤。在这里还包含第三条命令,也就是执行计划,所以他的执行流程非常简单,先是实现头脑风暴,再实现工作区隔离,他会创建新的分支来隔离开发环境, 再实现项目部署化,再验证测试的基线。然后就是编辑计划,当计划编辑好之后,再分配给这些子代理进行开发。它的原则就是测试驱动开发循环,包括写失败测试最小实现,最后清理优化。 而且它的特点就是两阶段代码审查,第一阶段是规格符合性审查,第二阶段就是代码质量审查。当 superpowers 设置好之后,下面我们就可以用一个实际的例子来测试一下使用 superpowers 它的开发流程以及开发效果。 在开始执行之前,我们可以先在 xcode 中虚化一个 ios 的 项目,然后用 cd 命令进入到我们创建的这个路径,再启动 cloud code。 我们可以直接用斜杠命令来开启 superpowers 的 头脑风暴模式,然后还可以直接输入开发需求,这样的话会自动激活头脑风暴这个 skill。 我 这里输入的开发需求就是开发一个个人时间线笔记的 ios 应用, 像 x 一 样能够发布短笔记,按时间线浏览,还能支持图片和标签。然后我们直接运行,先看一下效果,这里就提示使用头脑风暴这个 skill, 然后这里我们就允许他执行这个头脑风暴。像这样的话,不需要我们去执行命令,我们只需要输入开发需求,他就能自动激活 superpowers 的 头脑风暴,这个技能 好,这里他看到了我刚才创建了一个空的 xcode 项目,他需要查看这个项目的结构,这里提示这是一个新的 xcode 项目。然后他说他理解了我们想创建一个时间线的笔记 app。 这里他需要我们来澄清下面这几个问题。第一个问题就是他希望我们如何来创建笔记,包括他提到是采用类似 x 右下角的加号按钮,点击即可打开拽写窗口。 第二项就是顶部拽写栏,时间线顶部始终可见的文本框,直接输入即可发布。然后第三项是下拉拽写,在时间线上下拉即可显示拽写区域。然后他问我们选择哪种方式,这里我们就选择。第一项,我们直接输入一, 这里他很快输出了回答,他说悬浮按钮既方便又能保持时间线的简洁。然后这里他又开始询问我们问题,他这里询问的是笔记在时间线上应该如何显示。 一种就是卡片样式,每条笔记以圆角卡片的形式呈现。第二种就是扁平列表,形式类似 x。 第三种方式就是气泡形式,类似聊天气泡的显示方式。然后这里我们就选择第一种,让他实现这种圆角卡片的风格,我们直接输入一。 紧接着他又开始询问我们笔记中的图片应该如何显示?第一种就是内嵌式展开图片,在卡片内全宽显示,类似于 x 风格。第二种方式就是缩略图,网格 多张图片显示为小缩略图,点击展开。第三种方式就是单张预览,如果有更多图片则显示徽章。然后他问我们哪种方式最合适,然后这里我们就选择第二项,让他实现缩略图的网格,我们就输入二,然后发送。 下面他又询问我们标签如何运作?第一种方式就是在笔记中内嵌标签,第二种就是单独的标签选择器。第三种就是两者兼备,这里我们就选择第一种, 直接输入一,也就是像 x 中一样,输入井号键就能填写标签。好,下面这里他询问当点击标签后会发生什么? 一种就是筛选时间线,仅显示带有该标签的笔记。第二种就是标签详情页,跳转到专门的页面。 第三种就是快速筛选栏,将标签添加到顶部的筛选栏,可以组合多个标签,这样的话这里我们选择第二项,也就当点击这个标签之后,就能跳转到专门的页面,然后我们这里输入二。 好,下面这里他又询问我们是否需要搜索功能。第一种就是权威搜索,第二种就是锦标签搜索,然后这里我们就选择第三项,我们直接输入三,直接发送。 下面他开始问我们笔记编辑还有删除应该如何操作?第一种是向左滑动删除,向右滑动编辑。第二种方式是长按来显示编辑删除或者复制的选项。第三种是点击查看详情,在详情中包含删除按钮, 然后这里我们就选择第三项。好,这里他又生成了一个问题,他问我们是否需要数据的备份, 一个选项就是不需要备份,为了快速开发,这里我们就选择第一项,不需要备份好,这里他就生成了一个最终的方案, 下面这里就是他分析的这个设计,最后这里他询问这个数据模型看起来是否正确,然后我们直接输入正确,然后发送好。这里他紧接着输出了第二部分,也就是这个项目的结构,还有导航,这里包含详细的交互设计, 然后我们直接让他继续去执行。好,这里他又输出了这个 u i 设计,包括时间线,还有这些笔记卡片。然后我们直接让他继续去执行。 这里紧接着生成了这个项目结构,然后他询问这个结构是否合理,并且询问是否准备执行,然后下面我们就可以输入提示词,然后我输的是这个结构看起来很好,并且让他按照 superpowers 的 工作流继续执行, 让他创建隔离的工作区,然后再使用这个技能创建详细的 t d d 实现计划,然后我们直接运行,看一下效果,这里提示他将先保存这个设计文档,然后继续执行这些工作流, 这里他需要执行 get 命令,我们让他继续去执行。这里他开始使用创建工作区的这个技能,我们允许他执行。这里他选用我们将在哪里创建独立开发的这个工作数。然后我们就直接按照他给出的推荐的第一项,我们直接运行, 像这样的话,它就执行到创建工作区,包含创建新分制隔离开发环境,项目部署化,还有验证测试基线。现在开始运行到了写计划的这个步骤,然后我们直接让它来执行, 这里提示调用了这个 writing plans 的 这个 skill, 这里提示它会创建一个综合性的 t d d 执行计划,在这里它提示它将使用 writing plans 这个 skill 来创建这个执行计划。好,这里提示这个执行计划已经存入到了这个文件里, 在这里它给出了两种选择方式,第一种就是使用 sub agent 驱动的,然后这里我们就选择第一种输入一,然后直接发送,这里提示它需要调用这个 skill, 然后我们这里允许它执行,它将使用 sub agent 来执行我们这个计划。 好,现在生成了这些任务,这里一共生成了十三个任务,像这样的话就到了 sub agent 开发的这个步骤,在这个步骤中,每个任务都会有一个 sub agent, 而且会进行刚才我们提到的两阶段检查, 包括规格检查,还有代码质量检查,通过 tdd 循环,直到通过为止。在等待了大概十多分钟之后,他执行到了这一步,他需要调用这个 skills, 然后我们这里允许他执行好,这里提示在执行第一步,验证测试好,这里提示测试成功,下面他需要执行第二步。 好,这里开始执行第三步,这里给出了三个选项,第一个选项就是本地合并回主分支,我们就选一 让他合并回主分支。好,我们这里允许他执行命令。好,这里提示执行完成,这里合并到了主分支,在这里就提示我们可以运行这个项目了,下面我们就可以测试一下, 在 xcode 中打开这个项目,然后我们运行,这里提示构建成功。打开之后我们就看到了他为我们生成的这个时间线的笔记,我们可以先添加一个测试一下, 然后我们点击发布,这里我们就看到了我们发布的笔记,然后我们再测试一下,然后我们点击图片库,点击添加一个图像查看一下,这里我们随便添加一个,然后我们再添加一个图像,然后点击发布,这里我们就看到了我们发布的第二篇笔记,我们再添加一个, 我们再添加几张图像,然后我们点击发布,这样的话这个图像就按照缩略图的方式进行了显示,然后我们就可以向下滑动来查看我们所发布的这些笔记,然后我们再选一篇笔记,点击进入详情。 好,这样的话就进入到了这个笔记的详情,下面我们点一下这个标签,看一下,这里就将带有这个标签的所有笔记显示在了这里,然后我们点击第二篇笔记,然后测试一下删除,我们点击这个删除这里,确认 好,这里删除成功。这样的话我们就在 cloud code 中使用 superpowers 为我们完成了这个时间线风格的笔记应用的开发,而且一次就通过测试没有出现任何报错。