大家好,我是郭克很高兴的在素颜。大家我们今天继续我们的 open code skill 从零到一实战教程今天我们讲到了模块五的案例四十啦网页链接转精美总结图这是一个非常非常实用的一个技能啊。 啊还是先简单介绍我们是完全免费教程。呃目前是在更新中,估计会有五分钟,如果你在忙可以先关注收藏后续再看。 好的啊,我们还是两个步骤啊第一部分告诉你这个技能怎么用第二部分告诉你这个技能怎么做 怎么用的话呢很简单你就给你的各种龙虾就行,扣子啊或者是这个啊, qq 可乐啊等等都可以把这个技能给他。你看我已经给他了他也已经啊加载好了。然后呢他说啊因为这个是给链接就行嘛所以他说把链接发给我我来升图 好。好的那我这边的话呢正好我这边刚发了一篇文章啊我把这个我把这个文章我把这个 文章转发给他啊。看一下直接转发直接转发 o 不 ok 不 ok 的 话我就给链接试一下这边 哦对啊因为因为搜不到因为其实是搜不到的。嗯那就只能给链接了。复制一链接然后 用 看一下他这边啊会有会不会有问题啊我们估计会等上两分钟就可以然后呢我们在这两分钟继续啊我们我们继续 啊然后我们去第二部分第二部分的话呢就是告诉你这个练这个技能怎么样来去做做的话两种方式啊一种方式的话呢就是你直接呃直接去跟这个比如说扣子或者龙虾来对话来生成就行,我一会会带你来看一下这个技能是怎么样来去做的。 另外一种方式的话呢,就是你可以直接啊跟我要我的知识库,然后在这里直接下就下载就可以,当然需要费点米啊,然后这两种方式,嗯,那我们我就带着你们来看一下这个技能是怎么样来实现的吧,看一下就是, 嗯,这技能分为这分为这个这样式啊,这是一些样式,一个参考,在这个参考里面看, 然后呢这个是什么?这个就是脚本,脚本的话呢,你看这个就是网页内容提取一个脚本啊,就是你为什么你给他链接他能提取啊?就是因为我做这样一个脚本, 然后呢?这是什么?这就专,这就是主要的这个流程,就是 skill id 嘛,就是它是怎么样去执行执行这个这个东西的。哎,这么快吗?我看一下啊,直接用 流程技能流程来处理,先提取网页内容啊。行,你去提吧,希望不会有问题啊。好,那么这你们接着来看啊,我们接着来看, 从工作流程直接来看就行啊。好,步骤,步骤的话首先有一个步骤,零提取网页内容,你看你看,直接提取, 你看我告诉他如果是 u i l 怎么来做啊?如果是文件怎么做?然后步骤一分析内容,你看 彻彻底底的分析,而且要总结的啊,为什么?为什么?就是一般的大模型他总他总结不好啊?就是因为你没有给他规定好次嘛,你看我给他规定怎么来总结,对吧?然后 总结好之后就生成结构化的内容,生成内容,生成内容之后你看你看我写多详细有章节对吧?有章节有有,但是这个不是我写的啊,我把我的思路给 a a 自己写的啊,不能贪工哈。然后步骤三生成布局,你看生成布局和风格推荐 啊四来确认,然后然后五生成提示词,因为你是要图,你是生成图吗?图肯定是要提示词吗对吧?生成提示词,然后生成好之后生成图像,然后啊输出 啊基本上就没了啊,往下往下的话就是例子了。看往下就是就是例子啊,基本上没东西了啊,就这样的一个 内容啊,当然你你不用这个全给到 ai, ai 也会烦的啊,你就把你的思路给到 ai 让它自己生成一些东西就行,当然这些参考的话你需要去去找一些东西啊,你看我这边参考还蛮多的, 理论上来说你参考给它越多它生成效果会会越好,明白吧?我们来看一下这个这个这个 ai 应该生成的来看 啊,你看看没有,就是你看他这个提取失败了,看到没有啊但是呢但是呢就是就是从缓存里看到这篇文章然后开始生成了,大家看信息图生成你你直接把图片直接把图片给我。 他你说气人呢啊,给我把图片给我,把图片发给我, 希望不会出问题啊,有的时候有的时候是这样的,会有一些意想不到的问题啊。好,把把图片给我就可以了。 好我们来来总结,等他一下我们来总结一下。就是啊第一个告诉你这个技能怎么样来用用的话就是你把这个技能发给龙虾啊,这就可以直接用了怎么做? 嗯哦好了哈哈哈。呃,电商详情页 ai 生成全流程啊。还可以啊,就是就是他这个他这个版式。 嗯,还行,就是详情页可以再换。所以说,所以说的话就是所以说可以再去跟他确认啊。但是我觉得这个版式还行。还可以啊,基本上就是这样的啊,如果你哪里不满意你就让他去改就行了啊。 好的,那我们就是明天见,记得关注我啊。也可以找我啊。就是这个拿到支库。好,明天见。
粉丝8736获赞1.1万

一键我就把 fig 码原形图转换为小程序前端相似度接近百分之百,今天分享给大家我是怎么实现的。第一步,安装 fig 码 m c p 命令我放到这里了, 打开终端,输入 cloud, 粘贴命令好,已经安装完成了。再进入 cloud 输入 m c p, 就 看到有 fig 码的 m c p 了,并且显示 connected, 表示连接成功。 第二步,安装 figma skill 命令我放到这里了, figma 的 skill 有 非常多,我通过大量的测试选出这一个,它会获取设计图的源信息,还会自动下载所有的图片资产,同时对言行图和还原稿拍照,比对两侧差异,自动修复对齐。下面我们来安装这个 skill, 在终端中粘贴刚才的命令,回车,选择给 cloud code 安装,安装范围选择 global, 选择 simlink。 yes, 等待一下就安装好了。在终端中输入 cloud 输入斜杠 skills 会展示出所有的 skill 列表,在列表最后可以看到我们要的 skill 已经存在了, 那么现在就万事俱备,我们小试牛刀。我在斐克马上找了一套小程序点餐的模板,把每个页面的 u i l 复制粘贴给 skill, 只用 skill 把这些原形图转换成小程序前端好,开始执行日之中显示已经开始调用我们下载的斐克马 skill 了。开始拉取斐克马原形图的原信息 啊,根据原形图信息开始生成微信小程序代码。好,他现在列了一个计划,逐步实现每个页面的代码好了,其中一部分页面已经生成完成,他开始截图小程序,和斐克码原形图比对还原效果做进一步的调整 好了,经过一段时间的等待,代码生成完毕,我们去小程序里面看一下,效果好,点击 get star 进来。 整个页面生成的还是不错的,但是底部导航栏有几个图标,应该是没有下载下来好,再打开飞格玛对比一下,基本上是百分百复刻了啊。 相应的图片素材也是直接下载了,基本上再做一下微调就可以直接使用了。当我接到开发需求的时候,我首先会到飞格玛网站上去查找有没有相关主题的原型图。飞格玛网站汇集了全球优质的原型设计, 包含了小程序、 app、 网站等等,上万套原型图,全部免费,任何开发项目都能找到合适的模板,敢改就能用。

今天发现一个非常好用的 skill, 安装之后呢,我们的龙虾就能获得视频转码压缩视频画质增强、视频转移、 ai 深图深视频等功能,我们一起来看看效果。比如我们的视频太大需要转码,可以直接把视频的路径拷贝给龙虾,让他把我们把这个视频压缩转码成 h 二六的格式, 他处理后呢会直接保存到我们的本地。有时候视频的画质太模糊了,我们也是可以要求他帮我们做一个画质的提升。我也看一下画质增强后的画面,有人问我凭咩咁有野心,因为我深信想赢一定赢到吧,睇下 𫪈 边度赢嘅啫。想做王就要守住自己嘅领土。 做自媒体的朋友,如果你还想把自己的内容分发到海外,我们还可以一键转移这个视频支持不同国家的字幕翻译,而且会自动对这一个视频进行一个合成。至于纹身图,纹身视频那就是常规的操作了, 不过视频生成的效果我们可以看到确实一般般,那这一个就有非常多的体态饼了。这个 skill 安装也非常简单,我们直接把 skill 的 网站发给龙虾,要求他帮我们安装就 ok 了。今天的分享就到这里,我们下期再见。

哈喽,我是聪哥,最近很多小伙伴好不容易安上了 open clone, 但是发现它却是一个上不了网的智障空壳,油光龙虾的灵魂全部在这个 channel 里面。今天聪哥爆肝实测精选了七个普通人必备的神级 skill, 前四个大家必须装上,后三个强烈建议安装干货秘籍,点赞关注后再看!顺便插一句,有很多小伙伴纠结,到底是在自带的网页端安装 skill, 还是在绑定的非说里装? 聪哥告诉大家,本质上其实是一模一样的,后台共用同一个大脑。不过我个人更喜欢自带网页端的界面,清爽直观。所以今天的实操咱们直接就在网页端开始搞起。 那我们还是像上期视频说的一样,输入 opencloud dashboard, 打开网关,然后直接跳到龙虾的 web 端口这里,如果大家不懂怎么用命令行来安装的话,没有关系,直接去官方的 cloudhub 插件库, 直接在搜索栏输入 clubhub, 这是龙虾官方的 skill 网址,里面包含了四万多种不同的 skills。 进入之后呢,你可以看到大家平时用的很多的 skills, 我 们任意点开一个,比如这个 self improving agent, 进入以后直接复制网页网址,然后输入给龙虾,等几秒钟搞定。 哇哦,废话不多说,直接上四大必装软件,第一个保命底牌, skill vader! 目前龙虾的 skill 很多,但是里面参杂了很多月全的偷凭证的,或 或者有数据外漏风险的 skills, 这个 skill 可以 说就是龙虾的杀毒软件。安装以后,大家可以跟聪哥一样,直接给龙虾下死命令,以后每次装新 skill 之前,必须先用 viter 查一遍,检查通过了咱们再装, 安全感直接拉满。第二个,打通任督二脉 tabl 搜索,目前 opencl 默认是断网的,装上这个 skill, 立刻让它拥有全网实时查资料的能 相当于给你的 ai 连上了千兆宽带。最良心的是完全不用绑卡就能直接用。不过 tivoli 现在需要在他们的官网去注册账号,我们可以直接进入官网,注册以后每月就会有一千的 credits, 然后复制了 api 以后直接告诉 openclaw, 这样配置就好了。 第三个,强行拔高智商 self improving agent, 这是目前 cloud hub 上排名第一的神迹,简单来说,它能帮 ai 把犯过的错、纠正的逻辑和新学的方法全部记下来,越用越聪明。如果你接的是咱们国产的大模型, 这个必须装。当然你用的已经是 open ai 或者 cloud 这种月三加的顶级模型,那可以当聪哥没说。第四个,万能商家导航 skill finder, 我看网上好多老教程都在推荐去下那个叫 fine skills 的 插件,但是目前好像下架了。聪哥实测了很多 fine skills 的 插件,直接下载带有 c n 后缀的这一个完美平替。以后遇到难题,你直接问龙虾有没有什么 skill 能帮我解决这个问题, 它会自己去库里帮你找,非常省心。基础打牢了,接下来是三个进阶的神器,能让你的龙虾直接起飞。第五个,最强数字脑 anthology, 这是一个明星级的知识图谱系统,它能让 ai 拥有像人脑一样的结构化记忆。 比如你跟他说,记住我妈生日是一月一号,把今天所有的任务和昨天的项目关联起来,他能把每个人每件事都变成实体,记在脑子里,随时查询,极其强大。第六个,赛博触手 agent brozer, 这个功能可以彻底解放你的双手。他能打开一个无头浏览器,全自动的去帮你浏览网页,点击按钮 填表,抓取数据。但是聪哥这里要敲个黑板,遇到那种强制登录或者反叛机制很严重的网站,他还是会翻车。另外,这玩意儿极其消耗 token, 燃烧的是你的超能力,所以用之前一定要先摸摸自己的钱包厚度到底够不够, 哈哈哈!第七个,打工人的最爱 summarize, 顾名思义,一键总结,长网页、无字幕的视频,厚重的 pdf 直接甩给他,你只要说一句帮我提取这十页 pdf 的 核心结论,就能帮你省下百分之八十的无效阅读时间。这七个 skill 安装完以后,你的龙虾才能真正算得上是完全体! 大家赶紧去自己的电脑上试一试, ok! 这就是本期聪哥推荐的七个神级 skill。 如果大家在折腾过程中还遇到了什么好的 skill, 或者遇到了什么 bug, 欢迎在评论区留言讨论。我是聪哥,我们下期视频再见 see you again!

首先我们打开火山的模型开通管理页面, h t t p s 冒号斜杠斜杠 c o n s o l e 点 v o l c e n g i n e 点 com 斜杠不知道怎么开的同学可以看我前面的教学视频,打开后选择视觉模型,然后找到屌爆 see dream 四点五模型, 未开通的会显示开通服务按钮,点击开通服务,找到 crem 四点五勾上,然后点击确定开通即可。接下来我们点击 cdrem 四点五模型进入详情页,我们点击 api 接入,点击快速接入测试, 然后点击红框框起来的复制按钮。接下来我们转到飞书或者你的 open call 界面,这里两个页面都演示一下。首先是飞书,将视频中的一大串内容艾特你的飞书员工,他就会开始创建 skill 了。这里说一下 apikey, 直接在火山控制台 apikey 管理页面创建即可,然后点击对应 key 的 眼睛即可出现复制按钮,点击即可复制 pip, 填写好后点击回车。如果出现这个问题,则需要检查一下飞书开放者平台的权限是否开通, 直接复制他给出的链接即可到达对应权限页面,开通后如图所示,这样告诉他等待执行完毕即可。 聊天界面是一样的,输入内容回车等待他执行即可。在稍等几分钟后,正常情况你的非署员工会告诉你如下内容,表示 skill 生成成功了,如果还有权限不足的提醒,我们复制他给到的链接,直接浏览器打开授权即可。 完成后我们试一下图片生成,稍等片刻后就可以拿到结果了,之后只需要给他 prompt, 让他执行生图即可。大家如果训练过程中遇到了什么问题,欢迎评论区留言,我基本会逐个解答。训练的 prompt 放在评论区了。

上周我介绍的那个现象级设计师 skill github 已经狂飙到三万星了。这周直接炸出了一个更猛的玩法,有人做了一个工具,能把任何网站一键转成 design md 文件,你只需要丢一个 u r l 进去,它会自动帮你解析这个网站的配色、逻辑、字体关系、间距、系统组建规律。然后打包成一份 ai 能直接读懂的语义化设计文档。 程序员以后看到好看的网站,不用再截图存灵感了,直接把人类积累的顶级设计品味转化成 ai 可以 直接消费的结构化知识。这还没完,这次作者直接做了个设计师版 skill 宝藏聚合站,苹果、 cloud space、 耐克这些标杆网站的设计系统,全部变成可一键安装。你不是在抄样式,你是在为你的 ai 助手克隆设计基因。

看完一个干货或者教学视频,然后就把它放在收藏夹吃灰,当时觉得全都懂了,关掉屏幕一响,脑子里一片空白。我花了很久才找到一个真正解决这个问题的办法,今天分享给你。我们看学习视频基本是这个流程,打开视频硬着头皮看完,觉得自己懂了,划走,然后什么都没记住。 所以我一直在找一个工具,能不能让 ai 替我消化完这个视频,直接给我一份能看懂、能保存、能复习的东西。直到我找到了这个 skill, 我 来演示一下你们看这个效果。最终输出的笔记内容完整,逻辑清晰,包括视频封面、通俗易懂的结构化的学习内容。 最关键的是,它能识别视频里的图表、代码、公式,直接给你转化成附用的内容。这个工具叫 excel pdf 是 一个 agent scale, 它不是简单转字幕,它的工作逻辑分三层,第一层,字幕提取,不管视频有没有字幕,它都能拿到完整的文字。 没有字幕的话,它会先把音频下载下来,用 whisper 本地转写。第二层,关键帧提取,每零点五秒截一帧,把视频里的图表、公式、代码,这些字幕捕捉不到的内容全部提取出来。 第三层都不太理解,把字幕文字加关键帧画面一起交给 ai, 让它判断什么是核心概念,什么是案例,什么是数据,然后重新组织一份直接拿来复习的笔记。这就是为什么它生成的笔记不是字幕的堆砌,而是像一个真正懂这个内容的人帮你整理出来的。 安装方式也很简单,运行下面这行命令, card code、 open class 都能用。值得注意的是,需要 agent 有 图像理解能力。

本次为大家带来 win 系列时钟的两项重要功能更新,分别是 web api 接口的全面开放, 以及与开源 ai 智能体 opencloud 的 正式接入。一直以来, win 系列时钟始终坚守纯本地化控制原则, 其核心功能无需依赖任何云平台,这也是微软系列时钟的核心优势之一。此次开放的 web api 接口完整延续了这一本地化特点,用户通过简单的 http 请求便可实现对时钟设备的控制与状态查询。这一设计方便用户将微软时钟集成至自有系统 自动化脚本或是个人智能家居生态中。除 web api 接口全面开放外, win 系列时钟也已完成与开源 ai 智能体 open clock 适配, 同步发布了专属的 win clock skill 开源适配库。这意味着用户无需繁琐手动设置参数,仅通过自然语言对话即可操控 win 时钟的闹钟等核心功能。 以下为大家展示几项核心功能的实际操作演示。第一项演示为查询闹钟数量,用户无需手动翻找设置,仅需向智能体发出我有多少个闹钟的指令,智能体便会立即返回闹钟总数及每个闹钟的简要信息,操作直观高效。 第二项演示为天气播报。向智能体发送播报当前天气的指令后, win voice 时钟会自动播报实时天气。 第三项演示为定时器功能,例如向智能体下达设定一个五分钟后提醒我的指令,智能体会自动将该指令转化为对应时间的闹钟,时间截止时,时钟将准时响铃提醒。 第四项演示为设定闹钟,用户发出我要设定十九点三十分的闹钟的指令后,智能体会反馈设置成功,提示到十九点三十分时,时钟将准时响铃,操作简单高效。 值得一提的是,本次适配 openclaw 的 相关技能源码已完全开源, 用户可直接前往 gitop 获取。无论用户使用的是本地大模型还是 agent 服务,只需稍加配置即可轻松接入问时钟。若用户已安装 openclaw, 仅需输入一行命令,便可为智能体添加 v 隐时钟控制能力,快速上手使用。本次功能更新的核心目的 是为开发者与日常用户提供更多扩展可能,让问时中更灵活地融入用户的本地自动化与 ai 生态,解锁更多实用有趣的使用玩法。后续用户若在使用过程中遇到任何问题,可随时关注官方渠道获取更多详细教程与支持。

哈喽哈喽,大家好呀,我这两天用扣子做了几个 skill, 然后其中有一个是表格图片生成器,然后反复调试了之后,终于做成功了,非常开心,赶紧跟大家分享一下 这个功能呢,就是我简单介绍一下。嗯,我们在用小红书啊 b 站或者其他的内容平台去分享文章的时候,想要去插入这个 excel 表格 的图片,然后,呃,像小红书里面它是不支持你去插入 excel 的 嘛,那我想到的就是把 excel 转化成图片,然后插入图片这种形式。那我直接在豆包啊这种啊 deepsafe 这种大模型里面 去。嗯,发布这个需求的时候,发现它们其实做不太出来,然后呢,我再用 maxclaw 就 嗯,通过这种 agent 去做 才可以做出来,但是要反复调试。然后我现在用扣子的 skill 去做了这样一个产品,然后我们看一下它最终的一个效果,就是我把啊这些文本数据就丢给了我这个 skill, 然后它会最终生成 啊,一个是这个 excel 的 表格啊,大家可以看到这个,它会把我所有的文本数据就直接填入到这个 excel 里面,然后还能够直接生成这样一张图片 啊,就比较简洁直白的。那我们就可以把这个图片下载下来,然后就插入到小红书啊 b 站这种内容平台里面,是不是很方便呀? 我给大家演示一下如何使用这个 skill。 那 我们打开扣子的界面,然后会看到这里有一个 at 的 小图标点,点开它,然后我们搜小红书文本转 表格图啊,他就会出现了,点开,然后我们就把我们想要做成表格图的文本放在这里,那我这里就选了,嗯, openclaw 龙虾的一个选购指南,这样一段文本 我们复制放进去, 然后我们可以看到这里,这个 skill 就 开始工作了,会帮我们把这些数据自动地填入到 excel 里,填完之后会生成一张 jpg 格式的预览图给到我们 啊,最终它会返回给我们两个文件,一个就是这个 excel 表格,嗯,里面它就把这些数据自动填入了。另外一个就是这个 jpg 格式的图片,那我们就可以把它下载下来,然后就啊插入到小红书里面, 就很方便。

做慢剧的朋友们,小时候改剧本是不是快被逼疯了?山不完的水,剧情改完人设丢伏笔,丢完伏笔改剧情,好不容易改完了上集勾搭又接不上下集内容,熬了几个通宵,最后全都白费了。今天直接给你们上硬货, 只要把我想要的 skill 拖到技能包里,就能搞定这套网文转剧本的 skill。 把小说改剧本的坑全部填完了。先说说这个 skill 是 怎么干活的?核心就这三件事情, 剧情、伏笔、人设启动前,一次性问清你的目标受众、单极时长、改变节奏、必保名场面、晋级内容。比如你的目标受众是男频爽文还是女频填宠单极做一分钟还是两分钟,该哪几张?要升成多少级? 这里就有小伙伴问了,我哪记得做什么名场面呢?这个没关系,核心主线和必保名场面不填也没关系,系统会自动规避,系统会自动规避。 等你全部确认完之后,他就开始工作。第一步,他会产出一个文本预处理报告,他会清晰的告诉你删了什么。整部小说百万字,他自动猜分了多少块。这个小说有哪些人物,有什么场景,什么道具,并且标注了哪一张用到什么, 主角的金手指是什么,有哪些伏笔,并且标注哪个伏笔会在哪一张收回,最后给一个预处理结论。我这个小说呢,前期节奏会比较慢,他改编的时候会帮我压缩剧情, 死亡复活机制是这个剧情的核心,爽点他会重点呈现。这个报告出完,你审核没有问题,他就开始出全本小说的核心锚点,总纲,整个故事一托于这个总纲展开。 第一部分呢,包含人设锚点,人物是谁,有什么身份,核心性格怎么样?成长弧线是什么?与主角的关系怎么样?第二部分,世界观设定、修炼体系、中门设定、金手指规则,这些都是小说自动提取的,你的小说有什么,他就提取什么。 第三部分是伏笔台账,给你列清楚哪些伏笔,回收了几个,拿几个带回收。第四部分呢,是对于每集必保名场面。 第五部分是私募结构锚点,由于我上传了四十章小说,这里只有十集,他会告诉你在启程转和私募结构里 主要任务是什么,保证剧情不跑偏。等你确认这些没有问题,系统就开始出全集的分级大纲。那分级大纲会提取总纲的核心锚点,主要人物,承上启下以及爽点来结合原文编排分级大纲。那分级大纲也包含了连贯性标记,伏笔埋射与回收,人物成长线 却完美集剧情完全贴合我们确认过的总纲分析大纲出版才正式开始。每集的剧本里面包含了人物清单、场景清单以及这集所有的镜头表。说白了,这套 skill 是 把小说到剧本的全流程标准化了,不用你再熬夜扣细节,也不用你反复修改,从习稿到出篇, 每集都有钩子啊,明场面留住了,剧情也不断层,拿到手就直接能出分镜,省下来时间,你不香吗?别再瞎改了,用这个 skill 把小说改剧本的设置交给流程,你只需要确认参数,验收结果。

这是一款可以让你直接拥有一个完美风格平替的 ai 助手。今天要讲的是,他直接把峰哥那套带江湖感一针见血的现实主义生存哲学完整蒸馏进了 ai 里。 他不是简单模仿几句口头禅,而是把峰哥的核心表达逻辑刻进了骨子里。先给你不绕弯的直白结论,再用大白话给你掰明白底层逻辑。 能把裁员、失恋、被借钱这种糟心坏事给你翻成止损,看清人的好事,把你拧巴的内耗情绪直接转成能落地的行动。最后再给你一句马上就能执行的建议,半句鸡汤都没有,让峰哥给你狠狠分析。

咱们今天来聊一个能彻底改变你编程方式的工具, ai coach。 如果你还在把 ai 当成一个简单的代码生成器,那可就太浪费了。 你是不是也遇到过这种情况,让 ai 写点代码,结果呢,给你的东西到处都是 bug, 改起来比自己写还费劲,连个测试都没有。如果你发现自己每天都在干这种修修补补的活儿,那我可以很肯定地告诉你,你用 ai 的 方式从一开始就错了。 那到底该怎么用呢?关键就在于一个思路的转变,我们得把 ai 从一个只会干活的代码生成器,变成一个能指导我们的编程。私教 答案就是咱们今天的主角 ai coach。 它是一个开源工具,本质上呢,是 cloud code 的 一个技能。它的核心价值就是一句话,把 ai 从一个只会写代码的工具升级成你的私人编程教练。 我觉得这个比喻特别好,你看健身教练不会帮你取铁对吧?他会教你正确的姿势,让你别受伤,还能练得更快。 ai coach 就是 干这个的。 那么问题来了,这个教练到底是怎么指导我们写代码的呢?其实啊,他有一套非常标准的核心工作流程, 简单来说就三步,第一步,诊断,在动手之前先把需求彻底搞明白。 第二步,拆解,把一个大任务切成一个一个能搞定的小块儿。最关键的是,第三步叫 t d d 先行,也就是凑实驱动开发。在写任何功能代码之前,先把测试用力写好。 所以你看,最有意思的地方来了, ai coach 本身它不直接给你写业务代码, 他输出的是更高维度的东西。一份需求的诊断报告,一个推荐的工作流程,还有一条写的特别完美的,你直接拿去就能用的提示词。他是在教你怎么问,而不是直接扔给你一个答案。 更厉害的是,这个教练还特别懂事,他知道团队里不同的人需要不同的指导, 所以他内置了五种专业角色,基本上包含了开发团队的核心角色,全站、产品、后端测试,还有前端。我们来看看他具体是怎么区别对待的。 看到这个表了吧,完全是量身定制,如果你是产品经理,他会帮你写出 ai 能读懂的需求文档。如果你是后端,他就带你走严格的测试驱动开发流程,如果你是测试,他就帮你规划测试用力。这样一来,整个团队的写作就变得特别专业和高效了。 听到这儿,你可能会想,这不就是一个写的比较复杂的提示词吗?哎,还真不是,它的底层设计理念要深刻的多。 这么说吧,我们平时用的那种 prompt 都是一次性的,用完就忘了,没有记忆。但 ai coach 是 一个持久化的技能,它能记住你的角色,你的上下文,甚至能跨越好几次对话来衔接一个工作流。这跟一次性提示词完全是两个维度的东西。 这张对比表就非常直观了,你看没有教练的时候,我们接到任务一头雾水,写出来的代码 bug 多,团队各干各的,自己有没有进步也全凭感觉。但有了教练之后呢? 他用诊断和拆解帮你顺利开工,用 t d d 保证代码质量,用角色模式统一,团队协助,甚至还能帮你量化你的进步。 哎,说到量化进步,具体怎么量化呢?答案就是这个数字八。什么意思呢? ai coach 每周会从八个不同的维度给你的 ai 编程能力打一个分儿。 就像这张图上显示的,你可以清清楚楚地看到自己在任务规划、测试、实践需求诊断这些方面,哪些是强项,哪些是弱项,然后就能有针对性别。简单拢共就三步, 第一,你得先装好 cloud code 的 命令行工具。第二,把这个技能装上,然后重启一下,最后在终端里输入斜杠 ar coach 就 可以开始用了。 好了,现在问题来了,你是想继续当一个天天修 bug 的 代码修理工,还是准备好让 ai 成为你真正的私人教练呢?

能自己干活的 ai 才是好 ai 啊,我们这个今天打通了一个公众号,自动发布的一个工作流啊,简单给大家演示一下,太帅了。以后就是你只需要 跟他说啊,你要发什么内容,他自己会去打图片,会自己去编文案,然后呢自己会把它发到公众号上,然后放在草稿箱,你去审核就可以了,这个解放双手了,兄弟们,解放双手了,好了,我们简单给大家看一下,就是怎么去操作这个东西。好吧,我们把镜头转过来, 各位开始了啊,那这里啊,就是一个工作的,一个就是他的一个他的工作区啊,就是 ai 的 工作区啊,就是一个实时预览区。然后啊,这次呢,我们一进到底不剪,好吧,不剪,接着呢,我们现在是我简单给大家看一下,就是我们给他说了嘛,就是说我们准备你看啊, 这里嘛,苹果手机发布了嘛,然后呢,我就让他去整理一下苹果的一些乱七八糟的东西,是吧,就是第二次了。然后呢,我简单给大家看一下,这是他生成的一个效果。好了, 我们把这个东西呢点进去,可以看一下他的排版啊,他的排版的力度如何?好吧,现在呢,进来了,你看啊,我给他说了,有个钩子开头,对不对啊?你看什么?就是太香了,对不对?好了,怎么个香法?你看 牌子,把这个东西排给你的工工整整的,是不是排的工工整整的?他现在呢,因为我给他提示词有点少啊,他就给我处理两个,也就说他的图片他是自己拍的,他的文字还有排版,他自己干的。好吧,我们简单给大家说一下,我们这次你看啊, 我们新建一个任务。好,注意啊,你看我现在就说话就行了。好吧, 我今天开发出了一个公众号,自动发布图文的一个 ai 工具啊,就是一个 skill 技能,然后呢, 你现在帮我整理一下,发布到一个我的公众号里面去,那你配一些小龙虾 ai 智能,就是自动发布或者自动工作流的一些内容,然后呢让整个文章充满了一个恐慌感,大概八百字的样子, 好了,让他去干对不对?让他去干 ai 的 时代就是让他去干好了,他现在在思考他会把一个整个工作里头整个想法他自己,因为他这个也是 ai 对 不对?他这个是有脑子的,所以说你不需要去 具体知道是怎么去弄的这个东西。你看他会把他的一个工作步骤啊发到这里来啊。我们先来看一下,就是他工作步骤生成什么这八百字的一个工作流,然后呢?他现在正在生成,你看好吧,你看朋友们 是不是,然后这边他就跑啊?这边这边他应该还没跑,就是他要调动到图片的时候,他自己会去跑好了,把那个思考啊,生成一张,他是直接生成吗? 我看一下。我靠,他是直接自己生成一张好不好?他是自己生成一张,而不是去,而不是去找我看一下子,我,我还没有赋予他这个生成生成图片的一个能力啊。 嗯,生成适合图片好了,他自己慢慢的去嘛,也就说在后续的一个过程当中啊,我们会去升级啊,比如说一个排版是吧?更好的一个排版或者是其他的内容,但是这个版本的话已经我觉得已经很满足大部分人的需求了,你看 图片上传成功,他就是传到你的公众号里面去了啊,哐哐哐的就给你干了,好吧,对不对?他一个工作流就在这里,他不会,但他跟这个其他的是有点不一样的,他是直接做好了就给你结果,比如说我们先打开你在这里, 或者在这里,你是看不到他动来动去的,对不对?他是直接做好了,然后告诉你一个结果啊,他就说完成多少了,百分之几了就可以了。那因为这些你看我们是给他测试过的,所以说那现在呢,我们就静候佳音,对不对 啊?很多小伙伴就说啊,那这个东西费不费钱啊?或者是怎么样啊?对吧?首先这个东西啊,搭界是免费的知道吧?搭界是免费的,然后呢,弄好了之后,我们把那个 q 给给到你,你就直接拿去改善你的那个 ipid, 还有那个密钥,哎,哐哐哐的 就好了。然后呢,以后对不对?以后你想发布文章你就直接说啊,跟他讲,讲完了就一句话就好了,看到没有?草稿创建成功,现在开始怎么怎么样,对吧?就一句话的事情就是你不要去思考了, 你只要有个想法,真的就是只要有想法的时代已经到了,而且不用付费啊,这个是免费的,兄弟们,这是免费的,太造孽了。 其实我很少用炸裂这种词,但是我觉得震惊到我了,自己干活啊,真的自己干活好了,我们还是在这等啊,你看生成一边已经完成到了哪个步骤?上传到这个应该上传图片了, 回任务完成。他这里写的是十八,对不对?十八,但是呢,不用管啊不用管好了,见证奇迹的时刻到了,你看我们这里呢,是这张啊,就是我们之前生成的。好了,我们点 command 加 r 刷新一下。 没过来,是我给他指令不够准确。好吧,我这里跟他讲一下,就是你现在这个文章你放在哪里了?我的希望是放在我的草稿箱里面去, 应该是我没有把这个指令给他说的很清楚。好吧,希望用户希望我能放在草稿,而不是直接发布。难道他帮我发布了,我需要检查当前的 并创建一个草稿箱。那他现在去我的草稿箱去检查了啊,应该是刚才我给他指定没有,你看我没有让他放在我的草稿箱里面去,对吧?应该是这个问题,然后呢,导致了这个问题,他是一个思考的过程,我们等一下他吧,等一下他吧。 好吧,等了他一会之后呢,他又继续开始干了,知道吧?继续开始干了,然后呢,我现在不知道他确定能帮我把这个东西。你看百分之二十啊,我看一下,他已经放在我的草稿箱里面去了。去看啊,现在去看。好吧,砍不掉角儿 哦,看见没有?来了来了吧,看一下林心布。什么意思? 这又是什么好了,应该是什么问题啊,我们现在不太确定他是什么问题。那是这一篇啊,确定是他生成的,所以说 没骗大家,只是翻车了啊,也是翻车了,那后续啊,我们也会把这个东西调试一下,重新更新一篇文章啊,然后让他不翻车啊,告诉各位啊,就是一进到底的那种,各位啊,那 非常的不好意思啊,那就是在演示的这个过程当中呢,他要翻车了,但是呢我们还是很自信的把这东西呢发出来分享给大家,因为这个东西呢,我们已经 洗好了,就是稍微去调试一下,那这个东西就完美了,对不对?我们已经做过一个版本了,但呢没有什么任何一个产品呢,他一出来对不对?他就是一个非常完美的产品,都是需要通过一个更新迭代的,对不对?不然你的系统为什么会从 ios 十六?

skill 拆解,今天拆解 find skills, 你 有没有这种经历?想让 ai 帮你转个视频字幕,或者画个架构图,结果自己先在 github 上翻了半小时,好不容易找到一个看着靠谱的 skill, 装完发现效果完全不行,又得从头再来。 其实现在 ai 的 skill 已经有九万多个了,想找个好用的装上比登天还难,你根本不知道它们藏在哪。想象一下,你走进一个超大的仓库,里面堆满了各种好用的工具, 但没有标签,没有分类,你只能一个箱子一个箱子的翻开看翻, skills 干的事情就是给这个仓库装了一套智能解锁系统,同时去 s k i l s, 点 s h 和 github 帮你搜, 按下载量和来源,帮你筛选靠谱的,排前面,一键帮你装好。举个真实的例子,你说一句帮我找个查天气的 skill, 他 立刻搜出来和天气相关的 skills, 看下使用效果,他会告诉你哪个下载量最多,并推荐最佳的给你,问你要不要装,你说装,几秒钟搞定,直接能用 最爽的一点,你甚至不用主动去找,聊天时随口说一句,我想让 ai 帮我画个架构图, ai 会自动触发 fun skills, 搜完推荐给你,问你要不要装。说白了,他干的不是搜索的活,他干的是技能管家的活。你的 ai 要是现在还靠你手动一个个去找 skill 来装,那真的该让他学会自己逛商场了。关注我,了解更多 ai 知识!

家人们,我火了,上个生成短视频 skill 的 视频彻底火了,目前有五十六万个播放,一点六万个赞,这你敢信?我信你个鬼!那这期视频我就给大家来分享一个我上周做的长播客的视频转成公众号文章的 skill, 也就说你要告诉这个 skill 是 哪个长视频。十分钟以后,这篇文章就默默地躺在了公众号的草稿箱里。 你要知道,公众号文章的浏览量平台是要给发钱的,那有了这工作流,你就可以每天都发公众号文章,没准哪天你的公众号就火了, 就可以靠公众号文章挣钱了。虽然你只是等待了十几分钟,但是这个工作流看起来还是有点死拿的。我们先来看看这十几分钟它到底都发生了什么。首先就是原始素材的输入,这里边是可以是一些字幕文件,访谈记录或者是原始提纲,把这些文件放到你本地的某一个文件夹里, 根据这个文件夹里的内容去生成文案。当然这里边儿需要去定义一些个读写风格的 prompt, 然后它就可以来去整理大纲,生成公众号的 markdown 的 格式的成稿, 光有文章显得太无聊了。所以我们这时候还要生成一些个图片,那目前我只让它生成了一张封面图和两张插图,并且输出这个图片的 prompt, 根据这个 prompt 来去生成封面和正文配图,保存到以文字目录里,如何生图就是见仁见智了。如果你有极梦的 a p i, 就 可以让极梦来去生图, 再把这些图片插回到论文当中,然后就可以把这篇文章上传到公众号的草稿箱了。很多人不知道公众号是可以通过 api 来去调用,那这个方法我已经写在这个 skill 里, 你可以通过加入我的群来去获取这个 skill。 那 接下来我们就来看一下具体操作方法。这哥们就是一人公司最早的倡导者,他用了将近一个小时的时间来去教你你一个人如何加上数字团队来去组成这个 ai team。 我 相信每一个想做一个公司的朋友都会点击进去看一下它的内容,那我们就拿它的内容去创建一篇公众号文章,一定会很受欢迎。 第一步就是我们要把 youtube 视频的字幕下载到这个位置,然后在 codex 的 技能里看到微信 article pipeline 这个 skill, 点击,然后我们在这里边来去点击试用,然后在这里边我就跟他说,请根据这个地址下的字幕文件帮我写一篇微信公众号的文章,并且搞定配图,并发布到公众号的淘宝箱当中,然后点击回车。 哎,我们看,我们看他说这个使用这个 paperline 处理这批字幕的内容,我们要获取工作区的状态,现在开始工作,然后他在浏览这些个文件,他现在正在用凯文凯利的风格来去写这篇文章。来看一下, 他现在正在把文章写到 markdown 当中。 ok, 他 现在正在用 nasa 来帮我生成我的封面图,还有两个配图,为了保证流动性,所以我让他就自动执行了。 ok, 他 现在正在帮我生成封面图啊,然后最终生成的图片他们会放到文章下边这个 image, 这里边就有封面图 文中的第一张图和第二张图,然后他说这图片已经回写到文章了,然后他现在用生成的封面和这个马克当写的文章上传到公众号的草稿箱, 他现在正在执行图片回写到文章的命令。 ok, 他 上传成功了。接下来我们就去公众号里看一下,然后我们打开公众号的后台,我们来看一下。哎,我们可以在这最近的草稿里看到我们刚才上传的这篇文章。好,我们来看一下他到底输出了什么啊?点击编辑,这时候我可以看到我的公众号里边的这篇文章, 文字标题、配图都在这上面。当然决定发不发或者是不是爆款,都由你自己决定怎么样,棒不棒。

使用了,我们现在第一个例子就是如何去调用 skill, 好, 那我现在把 skill 肯定要拿过来吧,假设我们现在定义一个文件文件夹,这个文件夹这点 点妙码好,这是我们妙码智能体的通用智能体的一个开发内容啊,然后把 skill 呢丢过来复制过来,那妙码智能体下面有一个 skill, 这个 skill 呢,就是妙码的智能体所有的一个技能,那这个技能除了唐宋什么诗歌转笑话以外,还有其他很多很多种不同的业务, 不管是剪视频的啊,那我其实这里还可以做基于 f m pack 视频剪辑的文案生成的文案,二创的图文生成的等等,所有这些逻辑呢,这都可以把它沉淀成 skill, 爬虫也可以, skill 都可以啊,有了这个 skill 以后,我们就可以去调用它,但是我们今天重点不是跟大家去讲如何去做 skill, 而是我们偏向于更底层,告诉大家真正 skill 的 调用底层逻辑是什么。那我们在 s r c 里面这个这块呢,我们就来开始调用使用这个 skill 来看一看啊,它的整个调用逻辑是什么样子的。首先呢,我们要触化智能体, 触制化智能体啊,智能体触制化之后,接下来其实就是整个 asian 的 开发内容,那触制化智能体第一步,当然其实在触制化之前呢,我们这里应该严格意义上来说,第一步不是考虑智能体的问题,应该是考考虑模型的问题,模型 初识化,我们用什么模型呢?我们现在都直接用欧拉玛提供的模型, nunchun 欧拉玛,这里来一个欧拉玛 chat 欧拉玛 chat 欧拉玛,然后呢,直接把模型我给它先定义在这,又一个 chat 欧拉玛,谁呢?这个时候啊,就涉及到前面给大家讲过的一个知识点,欧拉玛有什么模型, 大家可以去下载一个九币的模型啊,我其实以前用低那个低参数的模型呢,给大家去试过,呃,太差了,大家尽量的下这个六点六 g 的 这个九币模型,或者更好一点的,或者你直接用你用豆包或者千问的线上模型都行啊,我这里主要就是想给大家去用本地的模型来去演示一下。好,那我们就直接模型里面的名字, model 用谁只用它?铅汞三点五九 b 啊,铅汞三点五九 b。 然后呢, temperature 这个就涉及到温度了,温度呢,到底是越高越好还是越低越好,取决于你的场景,它意思是发散的可能性,你如果温度越高,你就可以理解成它更发散。温度越低呢,它其实就更 严谨,那比如给零零的话,相当于就是没有温度,没有温度,很冰冷的,它就很严谨,不会去太多发散啊。这里模型我们就定义好了。第二步,出土化,智能体,出土化,智能体啊,那智能体怎么出土化呢?在我们这里直接把 depadience 内容给它拿过来, deep agent 里面有一个叫创建智能体, create agent, 不知道怎么卡住了啊? create a deep agent 卡住了。好,那我们先来创建智能体。怎么创建?很简单, agent 等于 create agent 啊, create a deep agent, deep agent 好, 里面有些参数,这些参数呢,第一个 name 我 们就直接就说妙码杠, open codex 啊,就我们就假设叫这个名字,模型来自于哪里呢?就来自于我们这个模型 l m 模型。好,接下来就是涉及到有哪些 沙箱的处理,然后呢,涉及到提示词叫系统级提示词。 好,沙箱的逻辑处理呢?这块我们先跳过,不管它啊,这个沙箱逻辑处理是用通过 backend 来实现来去抽象化的,我们先不管它, backend 先注视在这儿,技能加载是我们的重点的。重点啊,技能在哪里呢?通过 skills 来定义 skills 有 哪些 skill? 我 们可以直接定义当前文件夹下面的, 你看当前文件夹没有吧,我们一定要点点斜线出去,哎,在这儿再进一步的,我们就可以看到有个点妙码, 然后呢,那或者说我们直接这样子吧,对,就直接妙码下面的 skills 下面的唐宋什么什么啊,好,这是 skill, 这是第一个 skill 啊,这个 skill 你 定义好了,那接下来系统及提示词提示词干嘛呢? system prompt。 接下来就是 你是二次元的二次元诗人啊,诗词大拿啊,能贯通古今啊,修改唐宋元啊,唐宋诗歌词 变成笑话。好,就假设就这么一段,接下来还会读取这个 skill 啊。接下来其实我们有什么样的主题给到它,它就能够去做调用的处理,我们就呢直接在这儿来一个 result。 接下来我们这个智能题,当然它也是比较单一的简单的一个智能题啊,我们通过它来执行 invoke, 我 们在这儿呢需要给到一个 a sync 异步调用逻辑,比如说 invoke 来调用一下它。怎么调用呢?直接当前逻辑里面调 agent 点 invoke, invoke 什么呢?里面传递参数进去,当这个里面既然是如果世界上是多模态啊,在这里面调用的话,我们 message 定义好第一个信息,你的用户的这个 角色是什么?比如说我就是普通的 user 或者 ai, 或者用户提示词就 human 都可以啊,有工具信息。那若印出来了 content 呢?有什么样的数据?那么就直接我们把刚才的这个内容复制过来给到他,让他来帮我们写一遍,看效果怎么样啊? 或者我们直接飞流直下三千尺吧,一视迎合。 好,我们假设就给它来这一句,保存一下,我们看它最后执行之后的效果是什么样子。当然这里需要去接收啊,看 star result iterate 接收一下,最后呢调用结果。好,我们这个手呢,来把结果翻译一下,偏偏 build 翻译翻译完之后它是不是输出在这儿了?那这是我们一堆的结果啊。那么接下来调用一下 note disk 目录下面的 index, 点 mgs 回车看效果。现在开始执行了啊, 它说这个 sandbox is alpha 是 一个测试的这样一个版本,现在先不管它,看它执行,我们等它执行完之后输出结果。 本地这个模型一般慢一些啊,因为我那个 codax codax 我 之前用用刚才前面 codax 那 里调的是用的呃, gpt 五点三 codax 这个模型,当然你也可以换,比如说换五点四的这个模型, extra high 也可以,或者你直接选我之前的用的五点三 codax extra high 也可以。 掉完了,哎,没有输出,是我没打印吧。不好意思啊,这里忘记打印了,我们来打印一下,看看最终的 result 打印的是什么。这一下肯定会比刚才快一些,因为第一第一次的话相当于有模型启动啊,这些时间都算在里面了,这个肯定会快一点,所以我们打印一下这个 result, 看下效果, 五零七零的话可以随便跑。我,我其实之前跟有几个朋友算过一笔账啊,如果说自己去做就是有时间啊,就给我举个例子,有时间,比如我可以,我们可以,比如说搞一个,搞几张显卡,买几张显卡,五零七零的显卡, 五零七零显卡呢?成本一一折算完。如果说按照我用 cds 二这类的视频生成模型,一块钱一分钟的这个量来算的话, 那其实只要差不多两个月就能回本,就一张显卡把它并行着啊,就相当于应用化之后,让其他的用户去平摊这个费用,然后在我这个显卡上面去做啊,类似于 c 单十二啊这些模型的调用, 基本上这种一万的显卡已经完全 ok 了啊,因为我的这个电脑是比较特殊啊,因为我前几年买的这个 mac 的 算是一个高配的电脑。呃,基本上平常我跑什么模型都没什么太大问题,只要不是特别大的, 咱们如果说是配像类似于 window 这种这个 window 的 话啊,就是基本上可能如果说跑模型来说五零七零差不多了。好,那大家从这里可以看得出来,那看它最后写的什么啊?写完之后最后输出,这个其实主要就是输出的这一版 叫 reason content, 就是 ai 消息, ai 消息我们人人物消息在这儿飞流直下三千尺,银河银河落九天。然后最后一句,哇,这句词什么太经典了,再帮我们改啊,再帮我们磨改 它,它写了很多版本,其实都是基于我们这个那个 skill 来完成的。那或者你提示词句呢,再给它稍微改一下,因为因为你的这个提示词,它其实没有没有直接看出来说你要用,你要调这个那个 skill, 对 吧?我们可以呢,给它定死,就比如说 使用妙码 ai 啊,就是唐宋它这个 skill 使用这个 skill, 然后呢? 输出笑话,比如我不要了啊,后面那一段我不要了,直接注十把,后面这一段直接叫输出笑话,好,保存一下,使用它输出笑话,我们再来试一下啊。当然这里要重新 build 一下,我们再来用 node 来调用一下。 其实大家没有必要本地部署啊,我只是这里为了直接调用给大家去看一下,包括大家平平时自己如果去练习的话,直接本地部署就用用本地的方式,但你真正如果, 呃,这个开发的话没有,一般不会可能去用本地的。这种形式啊,都是用先用这个三服务化的,比如用巨量引擎的,也不贵啊,像现在豆包二点零 pro 也很便宜。 好,等它跑完看效果,看它最终输出效果。呃,这个跑完之后又没打印,我重新 build 了一下, 这是一个简单案例哈,对于对于这个 deep agent 的 开发这一块儿呢,那内容实在是太多了,我们在这个 vip 的 训练营中间呢,有详细的介绍。从核心层 就整个 deep agent, 从核心层到本地文件系统调用层,到文件系统的读写层啊,再到子 agent 如何去协作?子 agent 怎么去协作啊?怎么去把最终内容汇总? 然后呢,包括 skill 的 调用,包括子智能体,它还可以有自己的 skill, 比如我这个子智能体,它它的 skill 是 这个,我这个这个智能体呢?它的 skill 呢?是这个,那这就是主智能体的 skill 和子智能体的 skill, 它也可以分离。 再然后就是执行沙箱,比如说我可以基于 node vfs, 这个可能很多同学之前学过的 gs 的 话,没有怎么去理解过这个概念文, node js 的 虚拟化文件系统啊,叫 virtual fail system 虚拟化文件系统,看见这个 vfs sandbox, 通过这个 sandbox 可以 去做 那个中转的部署,你看,比如说我可以在这个沙箱中间去下载这个文件 download fails report 啊,然后呢再把这个文件同步到我本地。 整个 sandbox 的 生命周期也有详细的介绍,如果你需要有人为的介入,就会有一个,比如说我现在涉及到执行服务部署,需要有个中间的高风险操作,这个时候我就会人为的去 把它中断,就它自己会中断。中断之后呢来告诉你说,你必须要先把这个部署的操作确认通过之后,我才能够往后去执行,这就叫 h i t l 叫 human in the loop。 所以智能体开发的中间环节还有一个叫人为参与。我不知道刚才大家有没有印象啊?就是我在用这个 codex 的 时候,它是不是一会儿提示我说要干嘛干嘛,是否同意啊?一会儿要提示我说我要创建文件,是否同意,这种就是属于叫做人为中断的,就或者叫人工 审核的部分叫 human in the loop 啊,叫 h i t l 这几个专业术语,如果是长期记忆的话,比如说我们要在多个县城中中间要去分享这些数据,再叫 比如说我们可以存在那个内存缓存,中间我们还想通过流式渲染,或者通过流式输出,不管是子智能体还是主智能体,流式输出有一个 streaming 啊,这些逻辑 好,这个呢,因为时间关系,没办法所有面面俱到给大家去讲到,但是呢,核心的内容包括呢开发的流程以及核心的知识点给大家去做了一个梳理,我们大家可以下来之后详细的去了解啊。这里呢,我们执行完了,最后看一下执行的效果, 写的这一段,然后呢包括提示词,这是 ai 提示词 open context。 最后写完我们来看它输出,那大家看到没有? tool cause 这里有一个叫 read files, 它接下来要去读这个 skill 文件,我们看到了吧,要读取这个 skill 文件,好, skill 文件读取之后,接下来这个读取完了啊,当然它没找到连点斜线的妙吗? skills 它这个 not found, 让我们看一下为什么都是 found 点点斜线,哦,知道了,因为它被打到了这个里面,对吧?它其实就只有一层点点斜线妙码。 skills 下面的内容主要是因为这个 目录的问题啊,目录的问题他没有找到,没有找到的话,他接下来又说让我检查一下技能目录的结构,检查检查完之后呢,最后再去调用它,那调用完整这个结果 找不到,这个我看一下啊, skill skill 点 md, 它自动会去识别这个 skill md 每一步的执行的过程大家都看得到吗?点点斜线到点妙码, skills 没写错吧? 点点斜线妙码 skills 唐宋 probably generator 几内容? generator 没问题啊, skills 不 行的话,我把它放到放到外面来吧。在这个里面定义的话,其实肯定没问题。 main 里面, main 里面的 architecture, 或者说是这个 skill 下面的 project 里面的内容,这个都可以去定义的。那主要是 skills 就是 定义只定义到 skill 那 一层,那我们可以其实这样呃,直接把这块儿 删除出来。是这样子啊, skills 就是 你的 skills 在 哪个目录下?这我给给错了,这应该是再重新执行啊,当然我要重新构建,构建完之后重新执行。

兄弟们,这个技能太逆天了啊,你看他可以让 ai 全自动去接管剪映,你看这几个字,开源免费适配剪映,自动剪辑,现在的 ai 真是太强大了,你看他具体能做什么? 素材导入, ai 配音,字幕生成,自动配乐特效转场滤镜,网页动效转视频录屏,智能变焦,影视解说,自动导出关键帧动画,非常逆天。你看这里,我已经把这个技能啊全部给他下载下来了, 连这个安装包都全部都下载好了,拿到这个飞书文档呢,你只需要把它下载一下就可以了,然后按到这个步骤,一二三四五直接操作就可以了,而且呢,这个机能呢,不限你用哪个 a 机呢?不管是欧本可乐小龙虾,还是脆,还是可乐扣 的,还是扣瑟威斯扣的,全部都可以使用,全平台都可以使用,非常方便。需要这个技能呢,说一下,免费分享给你。

hello, 大家伙儿,今天的视频分享一下我现在的 skill 工作流,我是怎么从一个模糊的想法到一个落地的产品的全流程方法。这里是流程示意图,下面我们正式开始实操。我有一个很初步的想法,想要做一个为图转矢量图的工具。 这里我们用到了第一个 skill brainstorming, 一个开源的头脑风暴 skill。 在 codex 干活儿的间隙,我们一起来看一下这个 skill 吧。为了让大家更好地理解,我把原版的英文翻译成了中文。 我们可以看到这个 skill 设计的目的就是通过提问的方式辅助用户更加清晰明确的输出需求,然后是它的一些输入输出规则,我们快速地看一下就好。有需要的可以在 github 上搜索 brainstorming。 这里我们可以看到 codex 根据 brainstorming 已经在开始向我们提问了,迫使我们进行思考和选择。 在经过了多轮选择后, codex 已经给出了一个相对完善可落地的方案出来。我们粗略地看一下,没有什么问题的话,就可以准备开始下一步了。标准 p r d 的 输出, 这里我们使用第二个 skill pm com prd driver, 这是我自己写的一个根据需求出结构化 prd 的 skill。 我 们来一起看一下这个 skill 吧。这个 skill 是 根据我现在的工作场景内部规范和要求产出的格式,大家可以根据自己公司内部 prd 的 规范来重构模板。 我定义了需求背景、用户故事、竞品分析等背景元素,还有用户旅程、业务流程、成功指标、非功能性要求以及测试用力等需求细节。 最终目标是希望研发拿到这份 prd 后,可以直接丢给 ai 进行 web coding, 可惜暂时这份 skill 标准还达不到,还需要继续调整,不过对于前端项目来说,已经可以作为 mvp 来进行实践了。 可以看到 prd 已经生成完成了,我们检查一下,完全符合 skill 规范。 skill 中所有规定需要输出的内容都已经全部输出了,这里快进了,没关系,后续事例中的材料都会送给大家。这里就是快速检查一下,没有大的问题,方便进入下一步。 p r d。 没有问题后,我们进入下一环节,使用 u x skill 输出标准交互文档。这里感谢 at chris 提供的 skill, 由于这份 skill 不是 我写的,所以在得到授权前不会分享给大家, 不过我们可以一起看一下这份 skill 的 设计思路。我们可以看到这份交互文档 skill 非常完整,包含交互流程、组建状态、可扩展架构设计数据字典、 u x 交互用户反馈机制以及 skill 自检机制。 交互文档输出后,我们也快速检查一下,基本符合 skill 规范,无明显不合理地方,符合设计预期,可以进行下一步。 下一步我们就要根据 prd 和交互文档做 ui 设计和前端项目构建了。这里我们使用最后一个 skill, 因为是零杠一的项目,所以我使用了一套开源框架 shad cn ui, 这是一套非常优秀的 react 开源组建库,组建场景覆盖全面,交互设计合理, ui 设计优秀,非常推荐零到一项目使用。因为是从头开始构建一个项目,所以 sodax 干活的时间还是相对漫长的。 项目已经构建完成,可惜我英文不太好,先让 sodax 给我们翻译成中文吧。 翻译完成我们一起来看一下。首先可以确认的是这东西能用,但是在设计层面也有很多硬伤,比如行高、间距等规范还是有些糟糕的。这时候拿出我的携修方法,使用 html to figma 插件, 插件运行完成后,打开 figma 直接粘贴,然后对不满意的地方进行修改, 修改完成后,右键画板名称复制到链接,然后回到 codex, 使用 figma c p 提取画板内容,让 codex 根据设计稿更新前端。 在经过一段时间调整和等待后,我们再来检查一下前端,前端没问题了,我们再来测试一下功能, 我本以为会出现 bug, 但意外的直接能用,而且效果不错。今天的视频到这里就结束了,如果本期视频对你有帮助的话,麻烦点赞、收藏加关注,这对我很重要,谢谢!