在 oslopec 发布 agent skills 两个月之后, openai 现在终于支持 agent skills 了, 现在我们就可以在 codex 的 最新版中使用 agent skills。 同时 openai 官方还发布了 gpt 五点二 codex 模型, 我们只需要确保 codex 已经升级到最新版,然后用斜杠命令加 model 就 可以查看。 g p t 五点二 codex 模型我这里选择的它的推理级别,选的是 high, 这里也支持 extra high。 通过我一上午的使用发现 g p t 五点二 codex 模型它最大的缺点就是速度太慢了,像一个简单的任务,它可能需要耗费五分钟甚至更长时间。 本期视频我们将在 codex 中测试一下 agent skills 的 使用方式以及效果,并且在 codex 中重点测试 gpt 五点二 codex 模型的编程能力。 好视频呢,开始我们可以先简单回顾一下 agent skills。 对 于不了解 agent skills 的 用户来说,我们可以先通俗地讲解一下什么是 skills。 aging skills 的 本质就是把人类的专业知识还有工作流程用机器可以理解的方式固化下来,让 ai agent 呢能够稳定可控可附用的来执行任务, 这样的话就能将 ai 从聊天助手变成了可控的工程工具。我们可以将没有使用 skills 的 ai 或者 ai agent 呢理解为一个非常聪明但没有经过培训的员工, 每次布置任务都需要口头讲一遍规范。有了 skills 就 相当于给员工配备了工作手册,所有流程和规范都写在 skills 里面, ai agent 就 可以随时翻阅。比如说我们在让 ai 写测试的时候,如果没有 skills, 每次我们都要告诉 ai 帮我写测试,要使用 test 覆盖率达到多少以上,命名规范是怎样的,每个测试都要怎样怎样,然后 ai 就 会按照我们的提示词来写测试。 当后续我们再要求 ai 来写测试的时候,我们还需要重复一遍之前所用到的提示词,像这样的话非常浪费时间。但是有了 skills 之后,我们可以将测试做成 skills, 也就是将所有的测试规范脚本还有模板都放入 skills 文件中。当给 ai 配置好这个 skills 之后, 我们再需要测试的话,直接告诉他帮我写测试,那么 ai 就 会完全按照这个 skills 里的这些测试规范脚本还有代码自动为我们执行测试。相比 mcp agent, skills 非常节省。 token, 当启动时只加载 skill 的 名称和描述,而且可以根据任务自动匹配。 而且 skills 在 执行时才会完整地加载 skills 里的所有内容还有附属资源。所以有了 skills 的 支持,我们就可以为 codex 增加各种技能以及增加各种知识。在 codex 中使用 agent's skills 非常简单。 首先我们要确保将 codex 升级到了最新版本,然后我们再用命令打开 codex 的 配置文件。 在 features 这里我们要将 skills 设为 true, 下面这里还给它设置了权限,这些设置好之后,我们直接保存并且关闭就可以。然后我们再启动 codex, 再使用斜杠命令来查看 skills。 这里有自带的三个 skills, 这个 pptx, 还有这一个都是我手动安装的。 想安装 skills 非常简单,我们只需要选择这一个 skills, 在 后面我们就可以输入 skills 的 仓库链接,比如说我这里使用 oslopec 的 skills 仓库,我们可以进入这个文件的路径,这里面就列出了非常多的 skills, 比如说我这里找一个前端设计的 skills, 然后直接完整地复制它的链接,再回到 codex, 我 们直接粘贴这个链接,直接运行就可以,它就会为我们安装我们刚才选择的这个 skills。 这里安装成功,我们只需要重新启动一下 codex, 就 可以看到我们刚才安装的这个前端设计的 skills, 然后我们就可以选择这个 skills。 在 后面我输入了提示词,开发一个登录页的 ui, 可以 看到这里它读取了 skill 点 md 文件,这里提示它使用前端设计的 skill 完成了登录页的 ui, 然后我们打开这个页面看一下效果, 打开之后我们就可以看到这个登录页设计的非常不错,非常美观。下面我们还可以测试一下,让它为我们制作 ppt, 然后我们输入命令,找到做 ppt 的 这个 skill。 我 输入的提示词是把这篇关于介绍 agent skills 的 文章做成十页的 ppt。 受众是开发者,风格是极简,深色,语言是中文,这里是要输出的文件名, 这里就是介绍 agent skills 的 文章链接,也就是这一篇文章,然后我们直接发送,好在等待了几分钟之后,它终于制作完成,然后我们打开这个 ppt 看一下效果,它确实制作了十页 ppt, 可以 看到它制作的这个 ppt 效果还是比较不错的,完全符合我们要求的深色极简风格,并且用中文介绍了 agent skills。 下面我们就可以在 codex 中测试 gpt 五点二 codex 模型的编码能力。 在测试之前,我们可以先看一下官方给出的 gpt 五点二 codex 模型的基准测试。在 swebench pro 这个基准测试中, gpt 五点二 codex 达到了百分之五十六点四,超过了 gpt 五点二以及 gpt 五点一。在另一个基准测试中, gpt 五点二 codex 也超过了 gpt 五点二以及 gpt 五点一 codex max。 好, 下面我们开始在 codex 中通过几个案例测试一下 gpt 五点二 codex 模型它的真实能力到底怎样。 好,下面我们准备一张 ui 截图,然后让 codex 为我们复刻这个 ui, 然后我们看一下它复刻的 ui 效果怎么样, 然后我们就可以输入提示词,用最适合的前端技术复刻这个 ui 页面后面我们就跟上这个图像,然后直接运行。在这里可以看到它调用了前端设计的 skill, 在 等待了十九分四十五秒之后,它终于为我们完成了这个 ui 的 复刻。 复刻这个 ui 的 耗时真的太久了,我们如果用 cloud code 的 话,基本上不到一分钟就能复刻完成。然后我们打开看一下它复刻的效果, 可以看到它复刻的这个 ui 总体还算可以,然后这些表格内容跟原图相比效果还算可以。它复刻的第二个表格跟原图相比的话,确实非常不错, 它基本保持了原图中的这些布局,还有样式。好,接下来我们再用一个非常简单的智能体框架转换题来测试,让它将微软的智能体框架 out 站编写了一个旅游智能体的简单代码, 重构为谷歌的 adk 智能体框架。可以看到这个旅游规划的智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的时候,它没有实现将这个智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码。 好,下面我们可以看一下这个提示词,先让他阅读谷歌 adk 的 官方文档,然后告诉他将这个旅游规划的智能体代码重构为谷歌 adk 框架的智能体代码, 要求保持原有智能体的逻辑和功能,并未重构后的智能体加入 ui 操作界面。然后下面这里就是刚才我们查看的不到一百行的旅游规划的智能体代码。我们直接完整地复制这个提示词,然后粘贴到 codex 并且执行。 像这个简单的任务,我们就直接用 web 扣领的方式让它直接阅读文档和代码,并且直接进行改写。 像这个测试题可以测试 gpd 五点二 codex 模型的信息解锁与文档理解能力,还有代码理解与分析能力,以及跨框架迁移,还有重构能力,还能测试多任务协调能力。所以这个题目用来测试 gpd 五点二 codex 模型还是非常适合的。在等待了九分五十三秒之后, 他终于完成了将旅游规划智能体的框架重构为谷歌 adk 框架。下面我们就按照他给的步骤运行一下这个项目,打开之后我们看到了这个 ui 界面,然后再输入框,我们就可以输入任务,让他规划三天的尼泊尔旅行,我们直接发送。 下面我们看一下这个智能体的执行步骤,还有结果是否正确。首先是输出的三天的尼泊尔旅行的一个简单计划,第二部分是当地特色,还有深度体验, 这个是没问题的。然后第三部分,它给出了一个最终的旅行规划,在微软智能体代码中,这里还包含这个当地的语言专家会给出当地的这些常用语, 但 gpt 五点二 codex 它改写后的这个代码就缺少了语言专家这个智能体。所以这个测试题虽然它耗时将近十分钟,但它并没有复刻微软的这个旅行规划智能体所有的执行流程还有逻辑。 好,下面我们准备一个更加复杂的开发项目,让他开发一个 ios 原声背单词应用,这里给出了应用名称,目标用户。这里是具体的技术要求,而且要遵循 mvvm 架构模式,并且使用 swift data 进行数据持有化,还要实现单词发音功能, 还支持深色浅色模式。这里是具体的界面结构,包括首页练习,还有进度还有设置。下面这里就是核心的功能,包括单词卡片, 还有发音功能,还有收藏等。这个测试题我用来测试 cloud code, cloud code 能一次给出完全可以正确运行,而且包含所有功能的代码。在开发之前,我们先用 x code 初步化一个项目,这里我们就选择 ios, 选择 app, 下一步这里我们就输入项目名称,然后我们选择一个文件夹, 然后我们打开终端命令行,切换到刚才的路径,再打开 codex, 我 们先用 edit 命令让它来创建 agent 文件,这样的话它就能学到我们部署化后的这个项目的这些内容。好,这里运行完成耗时将近两分钟。 由于这个测试题目比较复杂,所以在 codex 中我们可以先让它为这个开发任务制定计划,我们直接调出它的计划模式,然后粘贴这个提示词直接运行,先让它根据我们的开发需求来制定一个完整的计划。 好,可以看到这里它调用了制定计划的 skills, 它这里只耗时四十八秒就完成了计划的制定,这个速度还是非常快的,然后这里它询问是否需要调整细节,第二个就是直接实现,第三个就是保存到这个目录,然后我们这里就让它根据计划直接实现。 由于这个项目比较复杂,它开发估计需要非常长的时间,我们直接略过这个开发步骤,直接跳到它开发完成的步骤,这里耗时将近三十三分钟,终于完成了这个项目的开发。下面我们在 xcode 中测试一下这个项目能否正常运行, 我们先点击运行,看一下能否正常的翻译好,这里提示报错,然后我们直接先复制一些报错发给他,让他来修复,这里修复完成,我们再测试一下。好,这里提示翻译成功。 好,这里又出现了报错,然后我们将报错发送给 codex, 这里提示修复完成,然后我们再运行一下,看一下这次能否正常的执行,然后还是出现了报错,我们还是让他来修复 好,这里提示修复完成,我们再运行这里,还是报错,我们还是发送错误给他,然后我们再运行, 还是出现报错,我们还是让他继续修复好,这里修复完成,我们按照他的提示清空一下模拟器,然后我们重新运行好,这里终于能正常打开这个 app, 但是这个界面竟然是英文的,他没有用中文的,可以看到这里可以正常做练习,这里终于加载出了单词, 可以正常翻转 line, 可以 听到能够正常播放声音。下面我们让 cloud code 分 析一下他开发的这个项目是否遵循了我们提示词中的 mvvm 架构模式, 然后我输入提示词,检查这个项目是否符合 mvvm 架构模式,直接发送 cloud code 很 快输出了回答,我们看一下他说这个项目部分符合 mvvm, 然后这里提到了所有代码都在这个文件中,约两千多行。然后我们在 xcode 中查看一下,可以看到这个文件中的这些代码真的达到了两千多行。然后这里就是需要改进的地方,应该拆分为多个文件,并且这里给出了典型的 mvvm 势利。 通过 cloud code 的 分析,我们就发现了这个非常不应该存在的问题,它将两千多行代码都放在了这个文件中,这是非常不应该的。好,通过测试可以发现 g p t 五点二 codex 它确实相比之前的 g p t 五点一有了一些提升。
粉丝1.5万获赞4.3万



因为受到了卡帕西的启发,我自己花了半个小时外部订了一个 rss 阅读器,只要你把 github 里边的链接全都导进来, 你就可以看到全部的播客,而且它会每天更新信息。我还给他加了三个功能,分别是 ai 总结内容,翻译成中文, 还有和他在 ai 窗口用大模型来讨论。前几天卡帕西在 x, 也就是前推特上发帖子,说,他发现现在网站上充斥着很多无效的垃圾信息,尤其是关于 ai 的 新闻。 他自己也是越来越频繁地使用 rss, 这里面都是高质量的长篇内容,而不是那种充满挑衅的、虚假夸张的内容。 它也呼吁我们应该尽快恢复 rss, 因为它是开放的,可定制的。它在帖子里面推荐我们可以下载 rss 阅读器,可以下载客户端的,也可以自己 web 编辑一个。它还给了一个链接,这个链接里面包含了二零二五年最受欢迎的九十二个博客 rss 的 原列表儿。 可能有很多人跟我一样不太懂什么是 rss, 它就有点类似于电子的一个报箱,你订阅了哪一家的博客,它每天会把新的文章推送到你的这个 rss 阅读器里面,就像投递到你的信箱一样,你不用跳转到其他网站,只在阅读器里就可以完成所有的文章的阅读。 你还可以把好的文章打星标记,形成自己的知识库。那今天这个视频我就想分享一下,我是如何手搓并且部署这款 rss 阅读器的, 如何把 github 的 信息导入,如何日常使用这三个方面来分享。我用的 web coding 的 工具是 google ai studio, 我 觉得它是最适合小白的,因为它用自然语言就可以帮你创造一个你想要的工具,过程的修改也是用自然语言最后出来的结果。前端页面非常好看, 我们打开 google a s 九九以后,我们点击这个 build, build 就是 做这种应用和开发的这个区域。在我们做所有东西之前,我们需要先配置一下这个 api key, 它就是一个钥匙,它可以打开 gemini 和谷歌所有 ai 权限的这么一个 钥匙口。当然这个钥匙的使用是花钱的,你每一次调用谷歌的所有 ai 功能,它都会从你这个账号里面消耗钱。我们点开,其实我在这儿已经配置好了一个 apikey, 你 点一下复制就可以了,你要获取它的话,如果你想创建的话,右上角有一个创建 apikey 密钥,点一下, 你可以给他命个名啊,然后选择导入的项目啊,你可以创建一个新的项目,比如说 project 零三,那么你的这个 apm 秘钥就是在这个项目之下 的这个 reader, 这个我们创建秘钥。好,你看刚刚我们创建的就是这个,你给他设置一个结算信息,因为你如果设计的是免费层级的话,你有很多功能都是用不了的。 我们设置一下结算信息,添加结算账号,这是我的一个账号完成设置。如果你刚刚你选不了像我的这个 first 的 话,因为你没有在这个 google cloud 的 控制台当中设置结算账号,你要点一下这个 google cloud 的 结算台,你看这就是我创造的。如果你这没有账号的话,你要先点创建账号 这个付款方式哈,需要你在这里面添加的,因为我已经添加了嘛,所以我就直接提交并且使用结算功能就可以了。 如果你没有的话,你需要用一个 visa 卡去提交一下。配置好以后,我们再回到这个 google a s 丢丢,回到我们这个 build 了。如果你英文不是特别好,小切换中英文的话还是老样子。点击这个浏览器上方的沉浸式翻译,你把它翻译一下, 你就知道了他这都是做什么的了。你就正常的在这个 describe your idea 这里面,你就输入你想要他干嘛。我其实最开始想让他做一个本地客户端,所以我就把我的电脑型号告诉他了,以及我的目的想要达成什么,结果告诉他了,这是我的提示词。 接着他就开始去思考搭建架构,写代码了。这个过程大概会花费三分钟左右,然后你会看到在右侧的这个 preview 里面会显示它已经搭建好的界面,就可以测试了。 例如我点击这个上传圆的这个按钮,并且把 github 里面的这些网址什么的都复制粘贴下来, 贴到这个里面。然后你点击这个每一个频道,你会发现并没有内容显示,你点刷新他也不会有内容显示。他功能现在还有缺陷,我就在左侧聊天窗口里面告诉他这个现象,继续调整修复, 再重复上一个步骤去测试。这回他就刷新出来所有的这个内容源链接了。 但是我发现很多内容它只讲到一半,显示的不完整,我需要看完整的内容,还得点这个 view original source。 我 不想要,这样我就再回去聊天窗口告诉他,我想要直接在这个 阅读器里面能看到完整的内容,再加两个新功能会更方便,一个是 ai 总结,一个是 ai 对 话。很快它就又做好了,这次保证所有功能都 ok 的 同时,还加了一个 ai 总结的功能,点一下, ai 就 会帮你总结这篇文章讲了什么。 但是我发现他总结的不全,把这个问题继续发在聊天窗口里,告诉他修改,并且把有问题的地方截图发给他,这次 ai 总结的功能正常了。另外就是还增加了一个 discuss 的 按钮,我可以在这个窗口里面 跟基于 gemini 的 模型去就这篇文章进行讨论。问问题。现在我要的基本功能都实现了, 但是现在页面还没有那么美观。比如说我在跟 ai 聊天的时候,其他的窗口占用太多了,我需要有一个按钮,能把不用的闲置窗口收起来。在经过修改之后,这个功能也很快就实现了。除了刚刚那些功能以外,我还加了一个翻译的功能,可以把英文翻译成中文,点一下,这就可以了, 因为卡帕西推荐的这些所有的文章基本上都是英文的,我们看起来有些费劲,但这样一转换就好使了, 但是他这个消耗头肯特别多,比如说我是调了两三次,他才帮我成功实现这个功能,他做了一些优化方案的处理。智能啊,你只要告诉他你想要什么结果就行。至于具体的方法,他会去找我们这篇文章的话,你可以点一个星号,那你可以在这个 start 这里面找到,你找到啊,然后所有你收藏的文章都可以在这里面出现啊,比如说我再选一篇,这一篇我喜欢的话,我再记星标,在这里就没有两篇文章了,这样你长期下来就是这些都是你喜欢的文章,定期你可以给它做一个整理汇总, 以及这个你的感悟分享啊。你可以作为自己的知识库放在这,然后因为这个工具我是今天刚开发吗?以后还可以加其他的功能,比如说把所有你打新的这些东西汇总到一个窗口里面去,生成一篇新的文章, 有了 ai 这些所有的功能都可以实现了。最后就是部署在这有一个像时钟这样的一个符号,点一下这个你就可以看到所有的历史版本。 几小时以前呢?你让他修改了哪些地方,他在这里都有保存。如果你发现改乱了,你想回到前一个版本,那你就可以用这个功能去做这个回滚,那你想部署的话,我这里推荐。如果你是个小白,你想增强一下自信心,还是用谷歌它原声自带的这个部署应用,点一下选择一个项目, 因为这个我已经已经部署过一次了啊,如果我想再重新部署的话,我就点这个 re deploy app, 然后它就会又重帮我部署。其实在谷歌这里面部署它有好处和坏处,好处就是简单一键部署, 你不用考虑说你的 api 会不会暴露在网站里面,会被别人拿去,然后消耗你的钱。它是非常安全的,谷歌它有一套安全体系,是保护好你这个 api 的, 而缺点就是你不能换其他的大模型,我们现在所有开发这些功能都是基于 gemini 的这个模型,但是如果你想换 cloud, 你 想换 openai, 那 不行,因为它是封装好的一个体系,这也是为什么谷歌让它变得简单,你依赖它的模型了,你以后想再换就不容易了。对我们小白来说,我们就想练手嘛, 先成再说,所以我们就是哪个简单用哪个先成,然后再慢慢研究那些复杂的。我们复制一下这个 url, 那 再 浏览器地址上敲击这个网址啊,这样你就可以进来了这个网址。那么以后你再想要用这个的话,你就直接可以复制这个网址就可以打开了,不用再过 as 丢丢里,每次再去摁一堆按钮算打开了就比较方便了。记得点赞、收藏、转发和关注哦。


大的来了,叉的 gpt 重磅更新至五点三, codex 编程加推理,双强融合速度飙升百分之二十五,手机平板电脑全适配,多端流畅,用三步快速解锁程序员和办公党必充! 先点视频右下角分享,然后点击分享链接,打开这个蓝色的小鸟没有的宝字,先去下载,打开热门软件资源包进去后点右下角保存就搞定了。

必安拿下了阿布扎比全球市场的三维一体全牌照,成了全球首个手握交易所加清算加经济完整监管资质的加密平台。 这可不是普通的牌照啊,是中东顶级金融中心的合规通行证,二零二六年一月就会切换到受监管的新业务框架,未来的加密只会越来越正规化。 第一,资金安全性升级, adgm 的 监管要求让交易托管环节都有了国际级的风控,用户资金的透明性和保障性大幅提升。第二,行业合规提速啊,巨头带头拥抱严监管, 那些野路子平台都会被加速淘汰,咱们踩坑的概率将会大大的降低。 第三,服务更规范,后续纠纷处理啊,用户权益保护都会有明确监管框架来兜底。加密交易不再是无主之地的博弈,更是一场挑战旧思想垄断的开端。

failure player ha ha ha 啊啊啊啊 啊 啊啊啊啊啊啊 哈哈哈哈哈哈哈哈哈哈 哈哈哈哈哈哈 ha ha ha ha 好好好好 好好好好好好好好 啊啊啊啊啊啊啊啊啊 ha ha 吼吼吼吼吼吼吼吼吼吼吼 ha ha 哈哈哈哈哈哈哈哈哈 哇哈哈哈 ha ha ha ha ha ha ha ha 看噗噗看哈 ha ha ha ha 啊啊啊啊啊啊啊 哈哈哈哈哈哈哈 啊啊啊啊 哈 啊啊啊啊 ha ha ha ha 哈哈哈哈哈哈哈哈哈 哈哈哈哈哈哈哈哈哈 ha ha ha ha ha ha ha ha ha 哈哈哈哈哈哈哈 好好好 吼吼吼吼吼 ha ha ha ha ha 哈哈哈哈哈 ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha ha 哈哈哈哈哈哈哈哈哈 ha。

看完共八集, boris 的 十三条技巧总结 boris 的 十三条技巧建议有几点核心洞察值得你记住。第一, 基础功能用到极致,比黑魔法更加有效。 boris 的 配置确实朴素,没有神秘的 hack, 但它把 play 模式、扩展、 m d 子弹里钩子这些基础功能用得很彻底。 很多时候,我们追求各种花哨的技巧,却忽略了把基础功能练好。第二,并行思维是效率倍增的神器。终端五个,加网页端五到十个, 这个并行规模超出很多人的想象。 ai 时代的开发模式已经从一个人写代码变成了一个人只会多个 ai 写代码。第三,验证机制的关键。第十三条是最重要的给 cloud 验证的能力。 写代码测试,发现问题,修复再测试,这个闭环形成了输出质量就上去了。 orris 最后说, 即使在 glotcode 的 团队,每个人使用的方式也非常不同,没有一种绝对正确的使用方法。其实也就是作者谦虚的说了,它的用法不一定适合每一个人,但他至少给了一个参考。 glotcode 的 创建者自己本人是这样使用的。 当我看完了 boris 的 分享后,感到很受启发,因此我重新审视了我自己使用 cloud code 乃至 ai coding 的 方式和方法。我也希望这个系列能对在屏幕前使用 ai coding 的 你有所帮助。点赞加关注,获取更多的有价值的 ai 新信息。

简历里面加上这么几句话,是不是瞬间觉得高大上了?熟练使用 cloud code 叉辅助编程工具,具备 prime 工程化体系,建立 ai 辅助开发规范体系,自定义了 sq 指令和 m c p, 使用 sparkkit 规范化开发, 实现了 ai 深度参与整个开发全流程,效率提升了百分之五十。不是用过 ai, 是 体系化的,使用过 ai, 知道 ai 在 真实的业务场景当中,他的边界,他的坑,他能干到哪些事情。对整个的流程规范写作有自己的思考, 并不是说在对话框里面输入一个命令而已。能把 ai 嵌进团队的工作流里面,这瞬间觉得高大上了许多。但是你要知道具体是怎么用的, 比如 q m c p spec kit, 具体是干啥的,怎么样自定义的。还有 ai 到底参与了你整个开发流程的哪些阶段,如果 ai 出错了,你怎么都抵?这一系列的问题啊,你都要和面试官讲清楚,并不是我简历里面写的高大上了就可以了。 这样呢,你可以拿到更多的面试机会,但是面试官会根据你写的进行深问。那么为此我整理了整个 ai 相关的面试真题,但还有我们面试当中常考的项目的难点和亮点。前端所有的二十多个场景一一的给大家拆解开了。 具体怎么样写到简历里,对应的话术,包括对应的技术实现,还有难点,亮点怎么样和面试官量标准的 sop, 需要的话大家可以去看一下整个面试,拿到更多的面试机会。第二个点,怎么样提高自己的面试成功率。找工作就这两点,拿到更多的面试机会,提高面试成功率,把这两个做好,我相信你找工作是相对来说是比较容易的。