当你不小心在 ps 后面加上个 s h, 进去后往下看,你就发现这里面藏着两万七千多种 agent, 全都是免费使用的 网页开发设计 agent, 还有自媒体的,甚至还有工作流的 ppt 的, 就没有你找不到的。我们找一个最近很火的 remotion best products, 然后我们直接复制它的地址,然后随便找一个 ai 编程工具帮你下载安装到本地, 从此你就本地部署了一个 ai 做动画的神器,以后你想做动画只需要动动嘴就可以搞定了。还有更牛的,给他一个 excel 表格,他还能根据你的表格帮你做一个动画,出来效果真的非常强,赶紧动手去用上它吧!还有更多 ai 工具也给大家整理好了,关注我,一起带你探索 ai 世界!
粉丝1.2万获赞7.8万

这是你朋友给你发的神秘工具,有的能生成好看的照片,有的能让 ai 越狱,还有的能一键复活。老大,离谱的 ai 用法总是离不开离谱的提示词和工具,渴望学习的你是在评论区找大佬分享,还是晚上偷偷来我家让我教你呢?其实这些都不用,因为这个 game 上爆火的 skills 项目可以解决一切问题。 不过在说它之前,我们首先要知道,最近全网吹爆的 skills 真的 那么万能吗?它背后的原理又是什么呢?小白又要如何用它?本期视频将带你一探究竟,同时也会分享几种离谱的玩法,建议各位在父母的陪同下使用。在使用之前,我们先来诉通一下 skills 究竟是什么。 二零二五年十月份的时候,一家叫 ansopik 的 公司先提出了名为 cloud skill 的 技术,然后基于这个技术又推出了 agent skill 开放标准,让起初只能在自家软件上使用的 skill 也可以在其他软件上使用。不 过即便这么良心,这个标准制作完成后,它还是不温不火。但是随着时间的流逝,它的好处也在慢慢显现,因为 skill 可以 很方便地分享给别人使用。于是有不少人自发的将自制的 skill 上传到 github 上,吸引网友下载, 结果好评如潮。有人夸他的功能非常离谱,有人夸他非常节省偷啃。这是因为他用了一种叫做渐进式批漏的技术, 也就像洋葱一样,一层一层一层的把提示词给 ai 看。例如,这是一个 pdf 处理技能,可以分为三层,第一层叫做原数据,包含技能的名字和描述。第二层叫做指令,这里写着给 ai 看的工作流,比如让他用什么工具从 pdf 中提取文本。 第三层是参考资料和代码,让 ai 在 执行工作流的时候按需阅读。所以相较于传统提示词按需加载的特性,让它不仅能实现复杂的功能,而且占用上下文的长度会更小,也就更节省。头等, 如果你没有听懂的话也没有关系,会用就可以,除非你对 skos 的 底层细节非常感兴趣。那么你可以看看这篇官方文档和架构图, 我在这里只讲它最核心的几点。那么接下来呢?我们讲讲 skills 有 哪些离谱的用法和技巧。我们先来看几个案例,例如你想做一个产品动画,只需要像这样抒你的需求,完全不需要你懂剪辑就可以达到很好的效果,还可以拿来做软件宣传片, 或者那种高大上的数据动态演示,是不是非常香?再看这个剪辑技能,它能帮你下载播客这类长视频,再剪辑出其中的精华,然后生成带双语字幕的短视频,还能配上发布文案,非常适合做切片。另外还有这个漫画技能,想要批量生成漫画,只需要输入一个编好的故事, skill 就 会将 ai 加载特定的提示词,让 ai 一 连串的执行操作,生成这样的效果,看起来是不是画面非常精美,还有分镜和对白。 最后再推荐一个去 ai 味的技能,要比我之前推荐的提示词会智能不少。这里还有一个技能,下载的排行,热门的 skill 都可以在这里找到。以上提到的技能链接以及安装教程我也都整理好了,放在了视频的下方,你可以自取。 看到这里,想必你对 skyo 有 了一定的了解,但我还想提醒的一点是, skyo 并非适用于任何场景,因为简单的任务提示词就够了,复杂的系统需要写代码才行。而 skyo 适合处理中等难度的任务, 当流程繁琐但又不值得为它开发一个 app, 使用它就好了。好了,以上就是本期视频的全部内容了,如果你觉得有所收获的话,不要忘记点赞收藏。最后,我是元宝,一台 ai 和黑科技的挖掘机,我们下期见!

一句话讲透什么是 scale, 以及你为什么需要它。 scale 是 ai agent 的 外挂工具箱,让它能完成单靠模型本身无法做到的事。它将提示词与可执行代码封装成一个标准化的安装包。但 scale 的 最大的价值远不止好用两个字,它 实现了知识的资产化。它能将垂直领域的专家经验固化为可复用、可流通的代码技能,不仅实现了知识复利,更能让你的 agent 像拥有十年经验的行业老兵一样,精准拆解复杂问题, 而且越用越强。在聊具体的神级 skill 之前,必须先谈一个东西, skill 的 s h 它是 worso 官方推出的全球最大 skill 仓库,超过四万五千个 skill。 按下载量和热度实时排名,它解决了一个致命问题,重复造轮子。你不需要在本地攒几百个零散的 skill 文件, 你只需要像装 app 一 样一行命令就能把全球顶级开发者的 skill 推荐原 skill skill 的 skill 一、 skill creator astropica 官方出品创建 scale 的 scale 当你想把自己的独门知识、工作流程、行业经验写成一个专属的 scale, 就 用它。 使用方法极其简单。我想创建一个某某 scale, 它的工作流程是一二三。你只需要描述一个大概的想法,它就会自动帮你把临散的经验生成一个符合 agent 的 标准的完整 scale。 同时,你的知识不再是一次性消耗品,而是可以反复调用的数字资产。二、 find scales windows 官方出品寻找 scale 的 scale scale 的 s h 上有上万个技能,一个浏览器翻找对比下载太痛苦了。有了翻的 scales, 你 只需要说一句话, 帮我找一个写 ppt 的 scale, 帮我找一个能爬取视频的 scale, 它就会自动在 scale 的 s h 里精准匹配,列出最优选项,一键安装。下面我列出了全球下载量最高的前十个 scale, 覆盖前端、共生化、设计、美学、浏览器自动化、垂直领域开发四大方向,根据你的业务需求,按需安装即可。除了 cloud code, 还有哪些工具支持 scale 呢? scale 技术虽好,生态才是关键。目前主流厂商支持情况如下, asterisk cloud code 替零替对,目前对 scale 支持最好、最原生的工具体验最丝滑。 codex gemini cursor tree open code 也是支持的,为什么它比单纯的 prom 强得多?核心就八个字,动态加载、渐进、批漏。 整个过程是这样的,当你安装 scale 时, agent 并没有把几万字的说明书塞进上下文,它只记录了 scale 的 名称和简介。当你问帮我查一下数据库时, code code 路由器发现这匹配了 data bit scale 的 简介。此时系统才会动态提取该 scale 的 详细操作手册和脚本, 执行脚本,获取真实反馈,最后将执行结果返回给你。这套机制的精妙之处在于, agent 拥有了无限扩展的技能数,但平时又保持极度清亮的运行状态,用不到的知识不占资源,用到时瞬间满血加载。

tiktok 上最近出现了一个非常火的项目, agent skills for contest engineering, 发布不到一周就斩获了二点三 k stars。 为什么它能瞬间引爆社区?今天我们深入来聊聊这个项目。你可能有过这样的经历,用 ai 编程时,明明给了足够的上下文,可 ai 要么答非所问,要么被永长的历史信息绕晕。最近 github 上的一个项目或许能解决这个痛点。 这个叫用于上下文工程的智能体技能的项目,发布不到一周就拿下了二点三 k 星。为什么他能这么火?我们从二零二五年末的技术背景说起, 这些年大厂白皮书里反复提到上下文工程,但对每天敲代码的开发者来说,那些理论太飘了。 我们需要的不是什么是上下文的论文,而是能直接用到 cloud code 里的工具。这个项目恰恰填补了这个空白,它把灰色的上下文管理策略打包成十个即插即用的智能体技能,借助 cloud 的 自动加载和触发机制, 让 ai 终于能像资深工程师一样自己管理内存。这就是一套上下文工程的最佳实践工具库。怎么理解它的核心逻辑?项目把上下文拆解成五个部分, 系统指令、工具定义、查找文档、消息、历史和工具输出。其中工具输出是最拖后腿的。研究显示,原始工具返回结果往往占了上下文百分之八十以上的体积,就像你电脑开了太多网页导致卡顿。 ai 的 上下文也有注意力,预算 一旦超支,性能就会下降。项目提出的渐进式路由策略就是解决这个问题的关键。初始状态下,智能体只读取所有技能的名称和简短描述,就像你手机桌面只显示常用 app 图标。 当你输入 prompt 后,智能体会自动进行语义匹配,找到相关能力,再加载详细内容。这跟操作系统的液交换机制很像,确保模型始终处理最相关的高信号信息。 你可能听说过 ai 的 迷失在中间现象,当信息放在上下文中间位置时,召回准确率比两端低百分之十到百分之四十。 除了这个,长对话里还会出现上下文中毒、干扰、混淆、冲突等问题。比如你先问 ai 怎么写 python 爬虫,再问怎么优化 java 性能。旧的爬虫信息可能干扰 ai 对 java 问题的回答。项目里提到的压缩优化技术能帮我们解决这些问题。 比如观察掩码技术,读取原文后提取核心结论,把原文从上下文里替换成引用 id, 这样上下文体积能骤降百分之九十。就像你把厚厚的参考手册换成一张锁影卡,需要时再去查详情。还有铆钉、叠带、摘药技术, 维护结构化的状态快,包括绘画意图、状态清单、决策记录和下一步行动向,让 ai 始终记得对话的核心目标。在多智能体协助场景里,上下文隔离很重要。比如一个项目分三个智能体, 写前端的,写后端的,做测试的。如果写前端的智能体看到后端的代码细节,可能反而会影响它的工作效率。 项目建议,每个子智能体只关心自己的任务,拥有专用工具,减少后选工具数量,实现故障阻断。 就像工厂里的流水线,每个工位只做自己的事,互不干扰。记忆系统也是上下文工程的重要部分。传统的向量检索有个时态盲区,它能找到相关的知识,但不知道这些知识的时间顺序。比如, ai 可能会把二零二三年的旧技术和二零二五年的新技术混在一起。 项目里提到的时态知识图谱就是给知识加上时间戳,让 ai 能区分旧方法和新进展。在工具设计方面,项目提出了一个反直觉的建议, 不要为每个细小功能写一个工具,而是把高度藕合的步骤合并。比如,你要做读取文件加分析代码加生成报告,与其写三个工具,不如合并成一个,这样能减少工具调用次数,提升效率。 项目还建立了完整的评估体系。智能体性能的百分之九十五变异由三个因素决定, token 使用量占百分之八十,工具调用次数占百分之十,模型本身选择占百分之五。这意味着优化上下文比换模型更能提升性能。 最后,项目给出了从 demo 到生产环境的五阶段流水线方法论。第一阶段,先用人肉方式跑通流程,再写代码。第二阶段,利用文件系统作为状态机,管理任务进度。这跟软件开发的最小可行产品思路类似,先验证流程可行,再投入开发。 通过这个项目,我们能看到,智能体开发已经进入了系统工程时代。以前我们可能只关注模型本身,现在发现,上下文工程才是构建确定性系统的关键。就像造房子,模型是地基,上下文工程就是框架, 没有好的框架,再好的地基也建不起高楼。这个项目的意义在于,它把抽象的上下文工程理论变成了开发者能直接用的工具,让更多人能用上高质量的智能体。说到这里,你可能会想, 以后 ai 会不会自己变得越来越会管理自己?我们会不会不再需要花太多时间调整 prompt? 这些问题或许会在未来的技术发展中找到答案。好了,今天的内容就聊到这里了,如果你有什么想法,欢迎在评论区交流,我们下期再见。

最近 ai 圈爆火的 agent skills 到底是个啥?今天用三分钟给你讲,看完直接上手用。我们先上结论, agent skills 呢,就是给 ai agent 配了一个工具箱,里面呢全是你常用的工具和操作流程, 关键是这个工具箱它是你自己设计的。我们先来看一下这张图,以前呢, agent 它只有单技能的这个 mcp 可以用,它没有操作手册,我们呢,就只能自己手把手地去指挥 ai, 去调工具干活。在这种情况下呢,遇见相同的任务,就会经常地给 ai 发送重复的指令, 你说一句他动一下,而且每次都得重复说。现在呢,我们有了 agent skills 这样一个组合技能以后,我们就可以直接把那些常用的重复的操作写进这个 skills 里面,我们就像给 ai 做 sop 的 手册一样,下次呢,再遇到同样的活, ai 呢,它就会自动帮你干了, 你也就再也不用重复的折腾了。比如我这里列了三个技能,第一个技能,你看我们每日的热点筛选, 以前呢,我们都是逐个的让 ai 去做,或者自己搭一个工作流去弄,那这样的话门槛就高了。现在呢,直接可以把搜索分析、写报告、发邮件这样的步骤给他按照步骤执行就搞定了。 还有第二个技能,财报分析,找数据分析,评估预判风险,用代码生成报表。还有第三个技能,海报设计,你把你的公司的品牌规范设计要求都放进去,然后让 ai 按照要求去设计海报,我们呢,就可以把这些常规的动作都给他 打包进这个 skills 里面。如果这个不太好理解呢,我这里再举了一个游戏的例子,这张图呢,玩过王者荣耀的应该都比较熟悉了,你看王者呢,每一个英雄都会给他三到四个技能, skills 呢,相当于就是把这些技能给他配了一个固定的连招,比如三一二 a。 编好以后呢,我们再给他绑定一个咒语,下次呢,只要你一念这个咒语,他就会自动释放这个技能的。当然啊,现在的王者是没有这个功能的,我这里呢,就举个例子,方便大家理解。接下来呢,我们再来看一下这个 skills 他 具体长什么样子。 一个完整的 skills 呢,它主要包含以上四个文件,其中它的核心文件就是这个 skill md 了,我们来看一下它具体长什么样。那一个 skill md 呢,它主要有两部分构成,这个以上部分呢,是它的第一部分,也就是它的核心,然后第二部分呢,就是这一块, 就是他的内容。像第一部分这里呢,主要我们就要描述他的技能名称,还有这个技能的功能有哪些,以及什么时候去调用他。那下面这个部分呢,我们就描述指令使用场景,具体执行步骤,还有以什么格式输出,然后给他一个 demo 例子作为参考。 这里呢,我们就不详细的去聊了,感兴趣的小伙伴可以截个图。这里呢,我再补充一点,看,我这里提到了热点,需要根据我的人设进行匹配分析,那这个人设呢,我们就可以把它写进这个参考文档当中,那 ai 呢,就会从这个参考文档去读取人设内容去进行分析了。 如果你想对 skill 进行深入的了解,我们还可以打开这个 cloud 官方开源的 skill 的 仓库,自己进去看一下,它提供了很多模板,大家可以看一下它具体是怎么写的。那最后呢,我们说一下如何使用啊? 像现在除了 cloud code 以外呢,像 coser 去 open code 还有 codebody, 它们都已经把 skill 集成进去了,而且呢官方都有说这个东西具体怎么用,今天呢,你就可以把这个工具下载下来, 然后把你反复使用的那些操作写进 skills 里面来解放你的生产力。如果你用的是确的话,你看用这个就很简单了,你可以直接通过提示词告诉他,帮我去创建一份能审查我的代码效果问题的 skills, 然后呢 他就会去给你生成一个 skills 的 模板文件,看这里面的内容都写了,你遇到不符合的你自己修改就可以了。如果你觉得用代码来处理比较麻烦呢?他也提供了这种直接新建文件的方式, 就按照他的要求去填写就 ok 了。好了,我们今天的分享就到这里了,你也可以在评论区把你想写进 sketch 的 东西在这里分享出来,我们大家一起讨论,我们下期再见,拜拜。

在 oslopec 发布 agent skills 两个月之后, openai 现在终于支持 agent skills 了, 现在我们就可以在 codex 的 最新版中使用 agent skills。 同时 openai 官方还发布了 gpt 五点二 codex 模型, 我们只需要确保 codex 已经升级到最新版,然后用斜杠命令加 model 就 可以查看。 g p t 五点二 codex 模型我这里选择的它的推理级别,选的是 high, 这里也支持 extra high。 通过我一上午的使用发现 g p t 五点二 codex 模型它最大的缺点就是速度太慢了,像一个简单的任务,它可能需要耗费五分钟甚至更长时间。 本期视频我们将在 codex 中测试一下 agent skills 的 使用方式以及效果,并且在 codex 中重点测试 gpt 五点二 codex 模型的编程能力。 好视频呢,开始我们可以先简单回顾一下 agent skills。 对 于不了解 agent skills 的 用户来说,我们可以先通俗地讲解一下什么是 skills。 aging skills 的 本质就是把人类的专业知识还有工作流程用机器可以理解的方式固化下来,让 ai agent 呢能够稳定可控可附用的来执行任务, 这样的话就能将 ai 从聊天助手变成了可控的工程工具。我们可以将没有使用 skills 的 ai 或者 ai agent 呢理解为一个非常聪明但没有经过培训的员工, 每次布置任务都需要口头讲一遍规范。有了 skills 就 相当于给员工配备了工作手册,所有流程和规范都写在 skills 里面, ai agent 就 可以随时翻阅。比如说我们在让 ai 写测试的时候,如果没有 skills, 每次我们都要告诉 ai 帮我写测试,要使用 test 覆盖率达到多少以上,命名规范是怎样的,每个测试都要怎样怎样,然后 ai 就 会按照我们的提示词来写测试。 当后续我们再要求 ai 来写测试的时候,我们还需要重复一遍之前所用到的提示词,像这样的话非常浪费时间。但是有了 skills 之后,我们可以将测试做成 skills, 也就是将所有的测试规范脚本还有模板都放入 skills 文件中。当给 ai 配置好这个 skills 之后, 我们再需要测试的话,直接告诉他帮我写测试,那么 ai 就 会完全按照这个 skills 里的这些测试规范脚本还有代码自动为我们执行测试。相比 mcp agent, skills 非常节省。 token, 当启动时只加载 skill 的 名称和描述,而且可以根据任务自动匹配。 而且 skills 在 执行时才会完整地加载 skills 里的所有内容还有附属资源。所以有了 skills 的 支持,我们就可以为 codex 增加各种技能以及增加各种知识。在 codex 中使用 agent's skills 非常简单。 首先我们要确保将 codex 升级到了最新版本,然后我们再用命令打开 codex 的 配置文件。 在 features 这里我们要将 skills 设为 true, 下面这里还给它设置了权限,这些设置好之后,我们直接保存并且关闭就可以。然后我们再启动 codex, 再使用斜杠命令来查看 skills。 这里有自带的三个 skills, 这个 pptx, 还有这一个都是我手动安装的。 想安装 skills 非常简单,我们只需要选择这一个 skills, 在 后面我们就可以输入 skills 的 仓库链接,比如说我这里使用 oslopec 的 skills 仓库,我们可以进入这个文件的路径,这里面就列出了非常多的 skills, 比如说我这里找一个前端设计的 skills, 然后直接完整地复制它的链接,再回到 codex, 我 们直接粘贴这个链接,直接运行就可以,它就会为我们安装我们刚才选择的这个 skills。 这里安装成功,我们只需要重新启动一下 codex, 就 可以看到我们刚才安装的这个前端设计的 skills, 然后我们就可以选择这个 skills。 在 后面我输入了提示词,开发一个登录页的 ui, 可以 看到这里它读取了 skill 点 md 文件,这里提示它使用前端设计的 skill 完成了登录页的 ui, 然后我们打开这个页面看一下效果, 打开之后我们就可以看到这个登录页设计的非常不错,非常美观。下面我们还可以测试一下,让它为我们制作 ppt, 然后我们输入命令,找到做 ppt 的 这个 skill。 我 输入的提示词是把这篇关于介绍 agent skills 的 文章做成十页的 ppt。 受众是开发者,风格是极简,深色,语言是中文,这里是要输出的文件名, 这里就是介绍 agent skills 的 文章链接,也就是这一篇文章,然后我们直接发送,好在等待了几分钟之后,它终于制作完成,然后我们打开这个 ppt 看一下效果,它确实制作了十页 ppt, 可以 看到它制作的这个 ppt 效果还是比较不错的,完全符合我们要求的深色极简风格,并且用中文介绍了 agent skills。 下面我们就可以在 codex 中测试 gpt 五点二 codex 模型的编码能力。 在测试之前,我们可以先看一下官方给出的 gpt 五点二 codex 模型的基准测试。在 swebench pro 这个基准测试中, gpt 五点二 codex 达到了百分之五十六点四,超过了 gpt 五点二以及 gpt 五点一。在另一个基准测试中, gpt 五点二 codex 也超过了 gpt 五点二以及 gpt 五点一 codex max。 好, 下面我们开始在 codex 中通过几个案例测试一下 gpt 五点二 codex 模型它的真实能力到底怎样。 好,下面我们准备一张 ui 截图,然后让 codex 为我们复刻这个 ui, 然后我们看一下它复刻的 ui 效果怎么样, 然后我们就可以输入提示词,用最适合的前端技术复刻这个 ui 页面后面我们就跟上这个图像,然后直接运行。在这里可以看到它调用了前端设计的 skill, 在 等待了十九分四十五秒之后,它终于为我们完成了这个 ui 的 复刻。 复刻这个 ui 的 耗时真的太久了,我们如果用 cloud code 的 话,基本上不到一分钟就能复刻完成。然后我们打开看一下它复刻的效果, 可以看到它复刻的这个 ui 总体还算可以,然后这些表格内容跟原图相比效果还算可以。它复刻的第二个表格跟原图相比的话,确实非常不错, 它基本保持了原图中的这些布局,还有样式。好,接下来我们再用一个非常简单的智能体框架转换题来测试,让它将微软的智能体框架 out 站编写了一个旅游智能体的简单代码, 重构为谷歌的 adk 智能体框架。可以看到这个旅游规划的智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的时候,它没有实现将这个智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码。 好,下面我们可以看一下这个提示词,先让他阅读谷歌 adk 的 官方文档,然后告诉他将这个旅游规划的智能体代码重构为谷歌 adk 框架的智能体代码, 要求保持原有智能体的逻辑和功能,并未重构后的智能体加入 ui 操作界面。然后下面这里就是刚才我们查看的不到一百行的旅游规划的智能体代码。我们直接完整地复制这个提示词,然后粘贴到 codex 并且执行。 像这个简单的任务,我们就直接用 web 扣领的方式让它直接阅读文档和代码,并且直接进行改写。 像这个测试题可以测试 gpd 五点二 codex 模型的信息解锁与文档理解能力,还有代码理解与分析能力,以及跨框架迁移,还有重构能力,还能测试多任务协调能力。所以这个题目用来测试 gpd 五点二 codex 模型还是非常适合的。在等待了九分五十三秒之后, 他终于完成了将旅游规划智能体的框架重构为谷歌 adk 框架。下面我们就按照他给的步骤运行一下这个项目,打开之后我们看到了这个 ui 界面,然后再输入框,我们就可以输入任务,让他规划三天的尼泊尔旅行,我们直接发送。 下面我们看一下这个智能体的执行步骤,还有结果是否正确。首先是输出的三天的尼泊尔旅行的一个简单计划,第二部分是当地特色,还有深度体验, 这个是没问题的。然后第三部分,它给出了一个最终的旅行规划,在微软智能体代码中,这里还包含这个当地的语言专家会给出当地的这些常用语, 但 gpt 五点二 codex 它改写后的这个代码就缺少了语言专家这个智能体。所以这个测试题虽然它耗时将近十分钟,但它并没有复刻微软的这个旅行规划智能体所有的执行流程还有逻辑。 好,下面我们准备一个更加复杂的开发项目,让他开发一个 ios 原声背单词应用,这里给出了应用名称,目标用户。这里是具体的技术要求,而且要遵循 mvvm 架构模式,并且使用 swift data 进行数据持有化,还要实现单词发音功能, 还支持深色浅色模式。这里是具体的界面结构,包括首页练习,还有进度还有设置。下面这里就是核心的功能,包括单词卡片, 还有发音功能,还有收藏等。这个测试题我用来测试 cloud code, cloud code 能一次给出完全可以正确运行,而且包含所有功能的代码。在开发之前,我们先用 x code 初步化一个项目,这里我们就选择 ios, 选择 app, 下一步这里我们就输入项目名称,然后我们选择一个文件夹, 然后我们打开终端命令行,切换到刚才的路径,再打开 codex, 我 们先用 edit 命令让它来创建 agent 文件,这样的话它就能学到我们部署化后的这个项目的这些内容。好,这里运行完成耗时将近两分钟。 由于这个测试题目比较复杂,所以在 codex 中我们可以先让它为这个开发任务制定计划,我们直接调出它的计划模式,然后粘贴这个提示词直接运行,先让它根据我们的开发需求来制定一个完整的计划。 好,可以看到这里它调用了制定计划的 skills, 它这里只耗时四十八秒就完成了计划的制定,这个速度还是非常快的,然后这里它询问是否需要调整细节,第二个就是直接实现,第三个就是保存到这个目录,然后我们这里就让它根据计划直接实现。 由于这个项目比较复杂,它开发估计需要非常长的时间,我们直接略过这个开发步骤,直接跳到它开发完成的步骤,这里耗时将近三十三分钟,终于完成了这个项目的开发。下面我们在 xcode 中测试一下这个项目能否正常运行, 我们先点击运行,看一下能否正常的翻译好,这里提示报错,然后我们直接先复制一些报错发给他,让他来修复,这里修复完成,我们再测试一下。好,这里提示翻译成功。 好,这里又出现了报错,然后我们将报错发送给 codex, 这里提示修复完成,然后我们再运行一下,看一下这次能否正常的执行,然后还是出现了报错,我们还是让他来修复 好,这里提示修复完成,我们再运行这里,还是报错,我们还是发送错误给他,然后我们再运行, 还是出现报错,我们还是让他继续修复好,这里修复完成,我们按照他的提示清空一下模拟器,然后我们重新运行好,这里终于能正常打开这个 app, 但是这个界面竟然是英文的,他没有用中文的,可以看到这里可以正常做练习,这里终于加载出了单词, 可以正常翻转 line, 可以 听到能够正常播放声音。下面我们让 cloud code 分 析一下他开发的这个项目是否遵循了我们提示词中的 mvvm 架构模式, 然后我输入提示词,检查这个项目是否符合 mvvm 架构模式,直接发送 cloud code 很 快输出了回答,我们看一下他说这个项目部分符合 mvvm, 然后这里提到了所有代码都在这个文件中,约两千多行。然后我们在 xcode 中查看一下,可以看到这个文件中的这些代码真的达到了两千多行。然后这里就是需要改进的地方,应该拆分为多个文件,并且这里给出了典型的 mvvm 势利。 通过 cloud code 的 分析,我们就发现了这个非常不应该存在的问题,它将两千多行代码都放在了这个文件中,这是非常不应该的。好,通过测试可以发现 g p t 五点二 codex 它确实相比之前的 g p t 五点一有了一些提升。


这是我用 agent skills 做的一整套品牌全案设计,耗时不到一小时,从品牌 logo 设计、品牌视觉系统、 ip 周边延展、包装设计、 电商详情页、宣传、三折页设美、品牌节日素材、产品海报,再到门店空间设计,全在一个画布搞定。首先新建一个项目,这里有五条 skills, 将锤类设计师长期积累的 经验、审美和实战方法做成了直接就能用的设计工作流。做 logo 和品牌延展就选第二条,根据需要修改 skill 后面的提示词模型可以勾选 banana pro 得到品牌 logo。 继续调用品牌设计 skill, 让它基于品牌 logo 进行视觉系统物料周边的设计,全程不动脑,一句话指出品牌系列视觉。选中图片,点击编辑元素,还可以对图片进行分层编辑。 点击这里新开一个对话,做电商产品详情页就选第一个。比如为这个品牌的咖啡豆做一套某宝的详情页,就得到了一套符合电商平台的的主图 banner 详情,甚至可以看到详情出了英文和中文两个版本的,整体来说视觉效果还是不错的,文字也没有出错。 如果对某张图的文本不满意,比如我要这张图的,把步骤改为中文,点击编辑文字,输入内容修改即可继续重开一个绘画。选择第三条四 q, 将提示词进行替换,让它基于品牌 logo 和咖啡豆产品设计一套宣传手册。这里的参考图也可以替换成你喜欢的 品牌宣传三折页就做好了。选择第四条四 q, 基于品牌 logo 得到社媒帖子,比如新春品牌海报。这一套四 q 下来,真的让创作者从第一步就站在专业设计的起点上,而不是从一张白图开始试错。

今天给大家推荐两个东西,来帮助我们发现 skill 和管理 skill。 为什么发一期视频来推荐呢?因为我写了文章,好像没有人看。 呃,这两个东西都是 versal lab 发布的。我们先看它的这个簿课,这一篇簿课,这个簿课发布于一月二十号,它这里写我们发布了 skills。 这个 skills 呢, 就是一个呃, c l i 工具,帮助我们来安装和管理 skill 的。 嗯,这个我们待会具体看,我们先把扑克看完。这里说一个 c l i 用于安装和管理 skill 包 agent 的 包,安装 skill 包,通过这个命令。 呃,到目前为止,这个 skill 已经被使用安装技能,像 a m p。 呃,这些什么 cloud code 呀, cloud bot 呀, code 叉呀, cursor 啊,啊, gmail 啊这种等等,它已经被这些使用了。 今天我们也来介绍一个网站,就是这个 skills, 点 s h, 我 们点开看看, 它这里说是一个目录和一个排行榜, skill 包的排行榜,通过它呢,我们可以发现一些新的 skill, 呃,为我们的 agent。 然后就是浏览 skill, 通过分类和流行这个程度, 呃,这段话的意思是说通过这个东西来安装哦,在整个生态系统中跟踪使用,统计和安装情况。 这里说有一个简单的命令,并且去探索。他说让我们来添加一个 versa lab 的 官方 skill 吧。首先我们说一下 versa 的 这个官方 skill 吧, 他自己出了一套 skill, 呃,只不过的话,这个是偏向前端嘛,然后也是偏向 react 的。 他这里说最最好的实践构建就是 react, 它里面包含的东西, 呃,也挺好的,就是一些 react 的 规范,还有 cloud ai 的 使用,当然还有 web web 设计指指南。 呃,另外的话,关于 vivo 方面,呃,安森富前几天发布了它的一个 skill, 当然它也是有一部分是自己的,它这里有安装使用说明, 它这里有一部分是自己的。像这个 skill, 呃,它以自己的名字来命名它的一些喜好和最佳实践,像一次 link, p n p m 这些, 当然还有一些官方的 skill, 像 v o e n s t p n 这种 v o e 方向的一些生态库的 skill, 当然还有一些非官方的,像,呃, sladeep, 这个是安斯尼夫开发的一个东西,然后 t s down 啊, turbo ripper 啊,还有 vivo use 这些。 vivo use 当然也算是官方的,因为那个创作者 刚发布没几天,就被安斯尼夫给收入给官方的 skill 了。呃,接下来我们讲这个网站, 首先这个网站的话就是一个统计收集 skill 的, 然后它这里有,呃, over time, 就是 说全部使用累积起来的这个使用量排第一的是 find skill, 呃,待会儿我们可以看一下这个, 它这里还有就是说二十四小时内最火的,也可以看到这个 find skill 是 非常火。还有这个 heart, 就是 说当前热度最高的 skill。 然后我们可以点进去一个看,比如说看这个 find skill, 它的话就是 通过这个 skill 来帮助我们发现 skill。 什么意思呢?就是通过我们人类的自然语言,比如说我该怎么做,怎么做,需要一个什么样的 skill, 帮我找一个 skill 之类的这些词, 呃,来帮助我们寻找一个合适的 skill 并安装和使用。当然我们看它这个详细界面啊,这里有基本的安装命令,然后 skill 点 md, 就是 介绍它是干什么用的一些指令啊这些之类的。 当然这里有它的周的使用量、下载量,当然这里有它的使用分布,比如说在 cloud code 里面啊, open code 里面啊,使用了多少? 还有就是第一次,呃,可以说是发布,或者说第一次看到它是在九天之前,然后这里有它的仓库, 对,对应的就是我们刚才的那个 skill c o i, 因为它不仅仅是一个管理的,并且是一个能帮我们发现它有一些命令,比如说基本的添加, 还有像查找我们当前安装了哪些 skill, 这个 find 就是 我们的 find skill, 来寻找一些 skill, 通过一些关键词,呃删除 skill, 然后检查它的更新状态。更新 skill 这个的话检查的话就是看他可不可以更新,这个的话就是直接去更新,这里的话是创建一个新的 skill md 模板,这个的话应该就是我们自己去创建 skill 的 话,可以通过这个来快速生成一个模板。 呃,现在我们来试一下吧。呃,比如说我们来安装安森尼夫的这套 skill, 我 们复制然后粘贴进来安装它,这里就去安装这些 skill。 呃,这里我们可以选择,我选择全部安装,然后它这里让我选择平台,我直接只使用 open code 吧, 找一下 open code, 嗯, 别的没有选择,直接安装,然后这里的话他有软链接,然后这个也容易更新,所以我们选第一个 啊,确定安装,然后这里提示安装完成,然后我们就可以来用他这个来测试一下了。 呃,比如说我们通过 npx skills list 来查看一下我们安装了什么, ok, 它这里把刚才安装的给我列出来了。当然我们一般查看局都需要用到缸机去查看局的安装,比如说我把这些, 呃,我先别删了,我先检查一下 scuse check 这里,它就在检查它们的更新状态,好,所有都是最新的。比如说我执行一下 update, 这里就开始检查,然后如果它可以更新,它就去更新到最后一个版本。比如说我去把它们都删掉,瑞幕, 我直接全部删掉,它这里显示删除完成,然后我们再查看一下 就没有了。他说,你看,他这里说如果要看大局的 skill, 加个杠 g, 然后我们来找一个 skill 吧。 n p x skills find, 比如说 will 一 三, 哦,他这里给了我们一个这个列表,然后给了我们一个指令,那我们可以去添加,我这里,呃,复制一下吧。 比如说,嗯,我来安装这个, ok, 他 就去安装了, 啊,它这里让我选择平台,然后默认选择 open code, 我 就随便选选一下, 然后等它安装完成就行了,然后我们再删掉, 然后我们来试着创建一个吧,比如说我到我的项目下,然后 n g x give it, 再有 v o e 吧。 ok, 然后它这里就创建了我们 ls。 来看一下,这里有一个,我们 cd 进去 用 v s code 打开看一下,它这里就给我出示化了一个 skill 模板,嗯,这期视频就到这里。

哈喽啊, chu 友们,这个和这个是我用 solo 加同一段 prom 做出的头像生成器网页,我们对比一下,看一看是不是右边的这个整个 ui 上看着更精致更高级。其实做它俩时的唯一区别就是我在开发右边这个网页的时候加了 skills。 是 的, chu 现在已经支持 skills 了。 skills 是 基于高标准的重复工作沉淀的可复用技能包,可以持续稳定地按照你的要求输出高质量的产物。 那么如何在 tree 里创建 skills 呢?有两种方式,第一种,直接在对话中描述你的需求,比如我这里对 ai 说创建一份能审查我的代码效果问题的 skill, 你 看 ai 会直接帮我写一个 markdown 文档,然后放在 tree skills 下面的对应文件夹中。第二种,从设置中创建, 点击设置按钮,进入规则和技能页面,在技能模块处点击创建。这里你可以直接导入现成的 skill 文件进行智能解析。因为 tree skills 是 基于开放的 agent skills 标准构建的,完全兼容社区生态。 当然,你也可以手动输入技能名称描述和指令,添加更符合你需求的工作流及工具调用。现在我添加好了一个前端设计的 skill, 我们在做图像生成器的时候就可以用到它了。你看在 ai 对 话流中可以看到它自动调用了这个前端设计 skill。 如果你的任务比较复杂或者需要持续稳定输出的时候,你也可以在 prompt 中明确告诉 ai 要用哪个 skill, 这样你就可以更精准的控制输出结果了。就像这个网页前端设计的优化一样, 使用 skills 是 可以帮你稳定地按照你的标准输出高质量结果的。除此之外呢,还可以自动化你的重复性工作流,甚至成为专业能力规范知识进行沉淀和分享的方式。所以快去吹 solo 中试试吧!中国版和国际版都有哦!

他真的把 agent 搭建讲得太清晰了!最近 agent skills 可谓是全网爆火,直接在 github 上拿下三十六点四 k 星标。很多同学想搭建,但是看到满屏幕代码瞬间蒙了。 所以我特意花了两天时间整理出这份从零到一,手把手搭建企业级多 agent 协助系统,包括从环境准备到运行智能体的全部实现过程,新手小白都能看懂。学会这些不仅可以打造商用智能体, 甚至还可以应聘大模型工程师。如果你也想学好智能铁,就不知如何下手。留下学习,双手奉上。

