如何用 tree 的 技能?就是现在比较火的这个 skills 去调用扣子的这个工作流。我们今天给大家录这个非常详细的一个视频,来分享一下这个操作。操作的话也非常的简单啊,非常的简单。 在这之前呢,我们要先准备几样的原材料啊?还是一样,它既然调用肯定是通过 api 的 形式,比如说我以这个 my voice audio, 对 吧?这个是文字转音频的,为什么说这么简单的一个?因为这里有我自己录制的我的音频,我的声音,咱们一会在转换的时候可以听一下它是不是我的声音, 需要做啥呢?把工作流点完了之后复制,把这串内容给它复制下来,复制下来它就相当于工作流的 id, 其实 id 的 话,它只需要中间这一段,看见没,但是我们就假装自己不懂,我就放到这, ok, 然后这个令牌呢?令牌在哪看?我们来看一下啊, 在外面,然后点这个 api 管理,管理了之后点授权,授权了之后这有个个人访问令牌里面这是 tree skills 的, 我们再来添加一个,添加个令牌,这个是 s k i i skills 演示 过期时间,我给他选成一天,大家可以去自定义啊,你可以自定义成永久,然后这里呢我们选什么?你要是不知道,你就选选全部指定空间,我们选个人空间,确定就 ok 了。完成之后还是一样,他这有个令牌,我们把这个一复制,复制完之后还是一样给它存下来, 还是给大家讲的这个令牌自己一定要保存好,千万不要把令牌给搞丢了。这个令牌完了之后呢,如果你是一个编码的人那你可能都知道怎么去用了,但是我现在我不知道怎么用。那怎么办?我试着点一点 我点一点他咋用呢?健全方式的概述里面有没有 这里面有没有对吧?好的没有的话那我们来看一下啊我们就假装现在自己是个小白。我到这个文档中心去看看看它有没有对应的,哎。文档中心有有什么呢?有这个 api 和 sdk。 这个 api 我 点开了之后就是点左侧文档中心点 api 我在下面找一找有没有关于对话工作流的,哎还真有有工工作流的对吧我们点一下工执行工作流。注意他这里给你放的全是通过 api 的 形式如何去执行工作流的。我们在下面翻一翻 来找我们请求地址是这个对吧。咱也看不懂呀是不是看不懂 哎臣妾表示也看不懂。看不懂咋办。我看不懂就不懂了不懂就继续往下翻。我要找一个一劳永逸的东西,哎你看他这里是不是有一个同步执行的工作流的事例,哎对不对? 这是返回的事。返回我们不用管啊返回我们不用管我们就管他的请求执行就是请求我们怎么样运行对吧。 干啥了把它一复制复制完了之后还是一样你看我有多偷懒我不用懂他。不是我不懂啊不是我我不教大家怎么懂是我真不懂呀,但是我在不懂的情况下我能把它调通。 ok 好就这样这样完成了之后扣子这边要准备的东西就完了,大家跟上啊。我就不不再不再重复做了来跟上。然后呢我在这里可以新建一个文件夹,这个文件夹是干啥用的? s k i i i s gives 调用扣子 d m o demo 演示,对吧?好,放到这之后呢,这是我的翠,对吧?我要打开刚才我创建的那个文件夹,大家也是一样啊,你自己去打开它,那它那个文件夹桌面上, 因为翠它的使用的话,它就是要打开一个文件夹去用。 ok, 我 们用翠把它打开,打开了之后大家注意啊,你一定要设置一下。设置什么呢? 一定要在 solo 模式下。为啥要在 solo 模式下?因为我们这个视频要给大家分享的是我们如何用 这个吹 ide, 它的技能去掉这个这个这个这个什么扣子的工作流,对吧?你点设置完之后,它这里会有一个规则和技能,对吧?规则和技能这里是创建的,当然呢,我们不需要去在这创建,我也会用人工的方式去创建, 但是要要前提要求是啥?就你必须是在这个 solo 模式下,他才能自动去创建这个技能,而且创建完技能之后,他在哪里呢?他就在你的这个文件夹下,然后这个文件夹放这边啊,他这会有个点翠的一个文件夹。好,我们现在咋做?大家注意看,我把这个内容全复制, 复制完了之后我把它粘到这里。以上是扣子工作流调用的势力和我提供的工作流的 id 和令牌,请帮我 啊,请帮我。怎么一个技能?请帮我创建一个技能。对,创建一个技能能够调用 code 的 工作流, 我这个技能能够实现,当我输入一段文本后,调用 工作流转成音频。好, ok, 我 们就这样去给它发发,发送完之后大家注意啊,静观其变,我们来看一下。 好的,他现在去这个是什么?这个是扣子 api 调用的一个地址,对吧?他会去看,他会去理解这个内容, 然后呢说要创建一个技能,你看他在思考我的过程,思考过程的时候呢,大家再去看扣子调用这个的技能,对吧?然后他要创建一个技能,哎,重点来了,大家注意看啊,他调用的技能,他本身自身有一个技能,叫什么 skill creator, 他就用他自己自身的这个技能去创建技能,就他本身是有个技能,这个技能会根据我们的要求自动创建技能, 非常非常的厉害啊。 ok, 我 们现在就耐心等待一下这个,有人说老师教这个有啥用, 用处可大了。如果你去翻我往期的视频,你就会发现我曾经写了一个,分享一段,一个视频,对吧?那个视频就讲的是什么,我用 tree 的 skills 去掉什么,掉了扣子的 文字转音频,掉了扣子的文字生图,最后呢,他就能够文字转音频,文字生图,全用扣子的技能去帮我生成一个什么?生成一个视频,这是他能做到。 ok, 这是他完成的,对吧?好,完成了之后我们试着啊 应用到全局。好的,我们先来检查一下这个,这个,这个文件夹,你看它是不是这里有个帮我创建这个技能,对吧?这个技能的内容是什么呢?就是在这里。 ok, 好, 我是一名好老师, 正在给大家分享扣子的相关技能,相关知识,对吧?好,请帮我把上面的 文字转成音频,当我给它发完了之后,我们再看 solocoder 这块,它会提示什么内容,对吧?它会提示什么内容?它首先在思考,思考完了之后呢?它说调用技能 code text to audio, 我 们来看一下,它一会是不是会帮我生成一个音频, 当你有了这些操作了之后啊,你就非常灵活的,哎,我,我扣子里面有很多这个工作流,我想掉,怎么办?我还不会去配 a p i, 咋办?你只要会吹,我们在吹里面用自然语言让它去帮我创建技能,哎, ok, 它这样的话就能帮我生成。 好的,我们一会看一下,看,它会告诉我啊,它会告诉我这个,这个音频生成在哪里了, 我调用了音频执行结果, ok, 然后呢?分享知识,通过 debug 用了生成音频,音频在哪呢?没看见,没看着呀,反过头来看一下,哎,这里也没有, 对吧?这是一个非常典型的一个问题,对吧?常用工作流执行情况,我们点开可以看一下, 他不会让我去登录去吧,哎,你看他让我登录火山引擎去了,对吧?那肯定显然不对啊, 并没有,我没有看到你给我生成的音频文件, 请你调整技能,重新运行, ok, 遇到什么问题就给他讲什么问题,这就是我们现在用 ai 的 一个技巧。哎,有人说有,有的小伙伴一听郝老师分享这个内容,到这之后又发现没出来,没出来他就慌,他不知道咋办,哎,郝老师,咋办?别的老师问他就怎么办?不用问, 谁给你出的问题,你就去检查谁就行了啊。你再用 tree, 出了问题,你就直接在对话框里面问他,用豆包啊,用 deepsafe 等等的都是这个思路,所以大家要转化一下,转化一下这个,这个使用 ai 的 一个习惯,对吧? 啊,习惯性去问别人的内容怎么办?要习惯性的去问 ai, ai 给你的答案反而会更精准一些。 你讲他现在做的这些工作,什么调用了?我仅仅能知道他是掉了这些内容,但是咋掉的我确实是不知道,所以我只能通过自然语言的方式去给他说,然后呢, 让他去帮我进行修改,验证参数,对吧?我看一下啊, 使用的参数名称一致哎,一致着呢呀。 text, 哦,我知道了,我知道是什么问题了,你看,咱懂上一点点的还是有点用处的啊,来, ok, 咱们回过头来可以看一下。回过头我们看一下自己的工作流, 我的工作流里面输入的这个变量叫什么?叫 input, 人家叫什么?人家叫 test 啊,我如果改的话,我就直接把这里改成 input 了,那么大家如果不会改怎么办? 工作流输入的变量名称叫 input, 请帮我修改技能。就是因为啊,在工作流调用的过程中啊,你所有的东西它一字不能查,你叫 text, 它叫 input, 它就它就不认识了,对吧?你看,我现在这么一说之后,它一会儿肯定把这就给我改了, 哎,大家看一下是不是,对吧。所以我们在学这个东西的过程中啊,嗯,也要学会去深入思考,这也是我们最近想给小伙伴们去讲这个,讲这个编程的时候担心的一个误区是什么呢?就大家就只会在这说,说完了之后,这里的东西他不看 啊,我们一定要去看,你看多了,你根据你自己的学科内容去理解它就 ok 了。好的,这样的话它就帮我改了。改了之后呢,我们再来看一下 但翔哥的 output 的 任务,可能原因工作流没有正确的配置输出,执行过程出现了问题。我们来看一下啊,工作流配置 output 的 link 没有问题啊,这个工作流的,呃,对对对,这个这个是没有问题的,因为我之前也用这个方法调过机能配置一个,一旦音频转换应该成功,对吧?权限,工作流可能需要吞进权限才能生成音频。没有问题啊, 没有问题,我们再来看一下啊,再来看一下我觉得这样的一个,我们把它发布一下,他刚说有尚未发布的这个修改,请重新帮我 运行,将内容转为音频,我再给他发。发完了之后我们再看一下,看能不能成功,反正调音的方式就是这样,我给大家分享,对吧?然后呢,大家去调,你调完了之后再去试试, 我们再来耐心等待一下,看他会不会帮我把音频生成啊。 调用成功,但返回的 auto 的 应该应 a p i 响应显示不但是由于工作流配置问题导致,请用上方链接登录扣子平台,看它的执行日期,确保正确。结束了音符的参数,我们 清它的一句券。然后呢,到这个平台,我们来看一下它的一个历史,二十三点三十六,那应该去点这个调试, 这里看不到是吧?这里看不到。呃,那它是什么问题呢?我们试着在这里直接输入一段话啊,我是一名好老师, 我这里运行一下,哎,可以生成呀,我是一名好老师,对吧? ok, 那 我继续再给翠翠说,我在工作流 界面运行了,能够顺利生成 音频链接,请帮我检查你创建的技能要求运行之后能够直接生成音频链接。 ok, 我 们再给他提要求,就是我自己也用 tree 的 编程去做了一些内容出来,在做这个内容之后呢,就发现了一些一些问题,问题是啥呢?就是他其实非常耗费时间,也非常耗费你的耐心, 就你明明知道这样能做通,他会出中间出很多很多的小问题,对吧?当然呢,还有一个问题,啥呢?上次我在用的时候是用的 tree 的 国际版。啊,我用的国际版去做这样的国际版的话,它下面用的是国国国外的一些模型,那些模型呢,可能会更聪明一些,当然这次呢,因为要给大家分享,好多小伙伴可能用不到国际版的吹,所以呢,我还是用咱们国内的去给大家分享,分享的时候可能会有一些 一些问题,对吧?可能会慢一些,可能会多交流几次, ok, 他 如果在思考中,我们就不要去打扰他。哎,耐心等待,看他一会儿能给我们做出一个什么花来。 我们来看一下啊,增加了轮询机制的说明,翻译库的时候需要使用不同的参数来确保 正确的参数名,这个已经保证了啊,哎哎,你看这个分析问题就非常到位了,说是 api 调用的时候,对吧? 我刚一调用他就要立即返回,这其实是不合理的。我,我调用完工作流之后呢,他得等一段时间他才能运行到我的结果,对吧?好, 那么我现在再给他说,请把我要求的文本转成音频,大家注意看啊,那我就说这句话,他能不能识别到?我是一名好老师,正在给大家分享 code 知识点,这是他的思考过程, 只要这个点点他是一个正方形的,他就说明一直在思考,对吧?哎,大家注意看啊,我想给大家去表达一个什么样的一个观点呢?就是我,我还要给大家去分享如何用吹去写作,你会发现他的上下文的能力非常强, 我已经说了很多轮之后,他都知道我要表达的内容是这个内容,对吧?因此请通过提供的 debug 的 u i l 我 们来看这个 u i l 在 哪呢?我没有看到它 u i l 呀,我们来看一下这里面有没有啊?复制 在哪里呢?我没有看到。 你能不能直接 生成的音频保存在项目的目录下, 他有啥问题就给他说啥问题。虽然说咱们这个视视频的内容没有一次调用成功,我觉得中间和他去沟通解决问题这个思路也能给大家带来一些这个一些启发。我们再来看一下 复制上面的链接到浏览器中,对吧? ok, 它让我复制,我又复制一下,如果它成了,那说明它就成了。 但是我咋感觉这个这个链接它又会让我再去,再去干啥再去登录呢?运行完成,哎,对对对对对,它是一个这样的一个界面,我们来看一下 output 是 空的呀,参数,哎,再给大家说一个用 tree 的 一个好的 地方啊,我们把它一截图,截图认给他之后传给他,我访问了你的 the bug 链接后, 给我这样的提示,请帮我修复。我还是想直接把生成的音频保存在 目录下,请帮我解决。大家每次遇到问题可能跟我这不一样,所以呢,怎么办?需要 text 参数,而不是 input 的 参数。 text 参数?没有呀, 我这里就是 input 的 参数呀。啊,他说这里输入的是 text, 咱不管他啊,咱不管他,让他去调,他说是什么参数就是什么参数。请帮我 把要求的文案转成音频,我们再来看一下它的内容,它又让我去访问这个 debug u i l 的 这个这个链接,请确保开始节点的输出参数设置为 test。 我明白他的意思,但是我觉得不应该是这样,你看,而且他这个 debug 链接让我去干啥?要让我去,让我去这个,这个叫什么?对对对,这个这个,这个。登录啊, 请不要用 the bug 的 形式反馈结果,你可以用你的方法帮我调用工作流, 然后我的要求是直接输出音频文件, 请你自己想办法,咱是领导,咱给他提要求,让他去想办法,如果我再给他反馈,他解决不了,反到最后人家不得用国际版的。国际版能解决,那说明还是模型之间能力的一个问题。 use context 或 input。 我们来看一下对准的呀,看一下它是什么问题,要不我就叫寄出我的这个 国际版的锤,他这次如果不成功,我们就用国际版的锤去试试一下。好的,他不行,不行就把它一关,关了之后我们试一下国际版的锤。国际版的出货好像把次数用完了啊,我不知道是那一天的用完了还是这个月的用完了, 像猫猫检查技能,我要求输入一段文本后调用 工作流输出,结果工作流的输出输入参数是字符串,名称是 input。 哎,余额不足 余额不足,不足以完成本次请求。哎呀,我们试着 扣个包吧,一百次三美三美金啊,三百次七美金, 六百次十二美金。先搞个三美金的吧,我记得上次就买了个三美金的 rate survey 哦, 不让看,好像是网络的问题,我调整一下网络啊,我们来看一下购买容量包,买个三百斤的,确定它会支付它就自己就扣了啊,我每个月的吹它就是自动扣款的 啊,已经支付完了,支付完成之后呢,刷新一下, ok, 它现在就能分析了啊,然后分析了之后我们把它还是切换到这个来看一下是不是模型的一个问题啊。因为上次我在用的时候就用的是国外的这个模型, 用翠花钱的话一个月也得花个七十多块钱,一年下来一一千块钱,这就是一个很好的一个案例,能给大家去 去讲,去去去直观的去感受一下啊。你看它,它的这个内外模型的一个差别,咱们试着看一下,看它能不能 能不能运行成功啊,平时我们用的一些文本啊,文本类的,我你像我也,我也用国内的,但是内容不复杂,你就根本体会不到一些模型的一个差别。那我之前做的那个软注模拟申请的那个工作流啊,当你在真正的要做到 ai 去编网页的时候,你就会知道它可能不太好弄,哎,你看你看这个就比较 比较聪明,还写了一个拍子啊,但是我给我,我刚给咱国内的吹电 c n, 我 给他说,我说你有你的办法吗?我的要求就是我输一段文本,你能给我生成一段音频就 ok 了啊,你用啥方法呢?我不管, ok, 我 们在耐心等待一下啊。 名称原文本定义的是 text 单元要求的部分,这一实际已修正好。 ok, ok, 我 我我给他说一下,我是一名好老师, 致力于给小伙伴们分享最前沿的扣子内容, 请帮我把这段内容转成音频。 ok, 我 们来看一下,如果说这次他转成功了,那我就就给国际版的税再去充点钱去,哈哈,我感觉 一定要为了好东西付费呢,咱们耽误这些时间。你说一开始思路都是对的,对吧?但是你用国内的就就调不成功,你用国外的,你看好像是要成功了啊,当然还不能乐观,我们再看一下,看是不是真的能帮我把音频生成。我,那个文件夹在哪呢?文件夹在这,对吧? 文件夹在这哦,文件夹放旁边。其实这个给大家现在分享的这个只是一个思路,当你有了这个思路的之后,你就可以去做做很多的这个事情,你可以把你做的这个工作流啦,智能体用很灵活的方式去调那个啥内容啥东西,包括 他在跑这个 python 程序,咱的目标就是把音频给我生成出来, 代表我通过自然语言的方式,我能把工作留给他调成功啊,这是咱的一个目标。有小伙伴说,郝老师,你费这么大劲搞这个事情有用吗?你要相信啊,你把一个程序调通了之后,你很长一段时间你不用再去动他, 哎,我感觉有戏,对吧?你看他这个链接好像就是正正确的 删除三个文章,确定删除他是一些过程文件,测试的过程文件,咱不需要他。 ok, 来我们来看一下啊,这是他的一个音频,我们点一下,我是一名好老师,致力于给小伙伴们分享最前沿的扣字内容。我是一名好老师,这 ok, 这就说明了一个道理啊,你看这是国际版的锤还是国外的模型,在某些方面能力是要远远大于咱国内的模型,这就是今天给大家分享的一个如何用锤去掉 扣子的这个工作流。那我觉得既把如何掉工作流的思路给大家讲了,我们也很直观的啊,非常直观的感受了一下国内的 这个模型和国外模型的一个能能力,一个能力的一个差别。大家可能看到我前面沟通了很多次,但是呢,国外版的话多沟通了一次就 ok 了啊。 ok, 那 么这个视频呢,就分享到这里,也希望能给各位小伙伴在学扣子,用扣子,用最前沿的 skills 掉扣子的这个事情上面能够有所启发。好的,这期视频就到这里,我们下期再见。
粉丝6510获赞1.5万

别再瞎找了,这是你唯一需要的一个 skill。 find skills 就是 帮你找 skills 的 skill。 比方如我想找一个 ios 开发的 skill, 那 就跟 ai 说,用找 skill 的 skill 帮我找一个开发 ios app 的 skill, 它就会自动调用 find skill 找到符合你描述的 skill。 当然,描述的越精确,找的就越精确。安装方法也非常简单,只需要官方的这行命令就可以。 这里需要注意的两个点是,第一是最好选择全局安装,第二个选择复制到所有的 a 阵,否则可能找不到这个 skill。 好 了,如果不会安装,可以在评论区留言关注我,了解更多 ai 干货,感谢大家观看!

大家好啊,本视频分享如何在脆上使用这个技能啊,那么脆在最近版本更新之后啊,已经说了在 solo 模式下可以使用技能,那么我也试了一下,在普通模式下,同样的提示词,让他去给我创建技能,他整个交互过程是没有任何的跟技能相关的, 那么在 solo 模式下,那么同样的提示词的话,他就会调用他自己内置的一个创建技能的技能,然后来走一个这样创建技能的一个流程。所以说大家一定要在这个 solo 模式下去做技能相关了创建啊,或者使用啊,那么在这个普通模式下是没办法触发的。那第二个就是怎么去创建技能呢? 那么你打开这个啊 tree 的 这个工具啊,切换了这个 solo 模式,不管是这个 code 还是 builder 都可以打开之后呢,在这边点这个设置啊,这个加号啊,这边有一个这样的啊,这边设置, 然后的话,这边点击这个规则和技能规则和技能,然后的话在这里在右边这边可以看到技能,然后背他, 然后的话你有了这个地方时候,你就可以在这创建了,所以创建技能的第一种方式就能手动在这个界面里面创建啊,输入这个界面,这个技能的名称最好是不要喊中文描述这个技能是干什么用的,然后通过什么关键词来触发使用这个技能,然后这边就是你要描述的是 这个技能在使用过程中它的步骤是什么样的。那么第二种就是第二种创建技能的方式,就是你现在已经有有了技能,对不对?你已经有了一些可能在别的 ai 编程工具,或者在网上看一些比较好用的技能,那么你就可以 在这边创建的时候啊,在这边创建的时候去导入啊,它支持这个包含这个技能这个文件,这个 z 部文件,或者说点 skill 文件,那比如说我现在选一个啊,比如说我现在选一个, 那我这边是很多别的地方的一些技能要下载下来了,然后打包选中进去, ok, 他 这边就会解压,解压完之后他会把这个信息啊,都会把它写到这里面去,然后点确认,那么你在这个 编辑器里面你就能看到,看到没有你,他就会把这个技能呢放到这个点 tree, 点 skills 里面,然后这个目录里面去, 那这个目录就是 tree 这个 ai 编程工具存放技能的目录了,那么你也可以在设置里面啊,能看到啊,在这边的话是有这个技能的,这个啊列表里面有这个技能的, 那么你就能看到他的描述,对吧?你会告诉你在什么情况下会调用到这个这种方式是可以导入,就是导入你已经打好包的这个技能。那么第三种方法就是你可以让 ai 来下载,就是你觉得啊,你需要的这个网上看到那些技能,比如说举个例子, 比如说现在这个技能啊,非常好用,这个专门用来写计划文档,那定义这个 task 了,那么你就找到这个 github 这个地址啊,你就找到这个 scares 的 目录,看到没有,然后点击进去,然后呢把这个地址复制一下啊,你就说 帮我下载这个技能,然后帮你去把它给下到,下载到这个啊 tree 里面能识别的这个技能的这个目录里面去,所以这个是很关键的,就你路通过别的方式去弄的话,它下载的这个目录啊,不是 不是这个 tree 点啊, scares 这个目录是别的目录它是引不到的,这个是非常的重要的。那么它这边的话,你看它在下载过程中,它也会调用这个 skier 点 creator, 然后他下载完之后啊,你就反正就运行就行了,他会创建这样的目录。 ok, 他 这边已经下载好了,我们来看一下,看到没有,他下载的这个技能会自动到这个目录里面去,然后包含了这个 skill 点 m d, 这就是他的一个技能的说明书,然后还有一个这些引用的文件,然后还有脚本, 这就这就下载下来了。所以说这种方式就是你看到哪些好用的这个 github 上的一些技能啊,你可以直接通过这种方式下载。 那么还有一种最后一种方式,就是可能你用的最多的就是自己去创建技能。那么我这边也准备了一个例子啊,比如说 我发现我在开发小程序的时候,经常会去找这种小程序底部的这个图标啊,这菜单的图标,那么我的流程是通过这种中文的名字去这个 iconform 里面去搜索, 做完这下载,然后放到一个目录里面去,那这个就是一个标准的一个流程啊,那么我们可以把它技能化,这样你就可以去用。这样的话就是我需要创建一个什么样的技能, 然后流程是什么样子的,就把这个流程简单描述一下,那么对于这个吹的话,他收到你这样的提示词,他会主动去触发刚刚的那个 创建技能的技能,然后去帮你去分析来生成这样的技能的文件,所以它是内置了一个这样的一个通用的,像 cloud 的 官方的那个 skill creator 一 样,有一个这样的创建技能的一个很方便的快捷操作,所以他这边已经生成好了。我们来看一下他帮我们做的这个技能是什么样子啊?名称 啊?描述啊?触发,当用户询问下载图标啊,或者说获取小程序图标的时候,或者是搜索这个 icon 的 时候会触发,然后它的流程是什么样子呢?搜索然后的话找找到,应该是找到这个第一个,然后下载, 然后保存,那他这边用到的工具是这个 mcp chrome 这个工具,然后举了一个例子,然后就这样的一个流程 啊,我们可以看一下他有没有效果啊,如果说没有效果你是要去调整的,就是他不是说一次次的技能都有用,你可以让他不断的去调整,我们可以让他试一下,帮我下载一个这样的图标,对吧? ok, 他 这边已经 下载下来了,他找的是这个图标,但其实他调用的这个 m c p 失败了,这个 m c p 失败了,应该是有一个这样的共占用,这个就已经被用了,我们先不管它就整个流程,就大家可以在这里面这个过程中找到这种感觉,就是你平时经常用的 啊,这个流程你可以把它总结或者抽象成一个技能,那这样下次的话,你直接比如说我现在开发不同的小程序,那我就可以直接让他去帮我去下载什么图标,那我就不需要去自己去手动打开网页去下载了,就很方便的去处理,这样的就是重复的东西就提效了。 我们可以看一下他下载下来的是这样这样子的啊,就是一个这样的一个图标底部的图标啊,刚刚我们已经演示了如何使用这个。最后就是来说一下,就是目前这个版本啊,吹这个版本这个技能的一个缺陷啊,第一个就是他没办法设置全局技能, 那我们也可以看到在设置里面他是这个技能只对这个项目是生效了啊,目前是在这个有全局的生效,所以这个可能要在后续的这个版本更新。 那第二个就是没办法共享 cloud 的 技能,就是在 cloud 的 木里面,他是不会去加载技能到垂直的木里面。那第三个就是手动创建这个技能的时候啊,比如我们通过手动创建技能, 他这也是没办法去创建,比如说脚本,对吧?那一个技能的话,如果你做的比较复杂的话,是有一些脚本在里面的,还有一些引用的文件,还有一些资源文件, 就是不只是只有一个 skill 的 md, 还有很多其他的文件,所以说这个你在手动创建的时候是没办法创建创建出来的。比如说我们举个例子,那么在我们使用这个 prane, prane 这个 进入的时候,你看它是有这样的脚本的,然后的话有这样的文档,所以它这个文件是非常多的,通过手动创建只能只能创建一个 skill md, 其实这个还是有,目前还是有缺陷的,但是也可以大家可以去多去尝试一下,就是一定要先用起来,就是把自己重复的这种高频的这个流程啊,用技能包装一下。那有些技能可能比如说刚刚我是涉及到了浏览器的操作,可能不会成功,或者我换一个这种浏览器的这种插件, 那么可能就可以成功,或者说让他调用接口的方式啊,或者说爬虫的方式。反正就是你如果说这个技能没达到你的效果,你就继续去跟他沟通,他会去修改这个技能的。 ok, 那 本期视频就到这啊,谢谢你的关注。

如何在 obsidian 中使用 cloud skill 实现一个 ai 智能体? obsidian 的 ceo stefan 最近发布的三个 skill, 你 用上了吗? 我先来做个展示,如何用一句话让智能体下载 youtube 视频,并总结视频内容,刊写知识笔记,然后在无线画布中画出知识结构图。在 obsidian 界面中,我向 ai 发送了一个 youtube 视频链接,这个视频是油管著名博主单口大神的一条视频, 我让 ai 帮我下载这个视频的文案内容,然后提取视频的核心知识点,并刊写一篇带有 obsidian 专属于法的 macdonald 知识笔记, 然后根据视频的知识内容,在一幅无线画布上画出知识结构图。 ai 在 接收到指令后,先调用了 youtube transcript 这个视频,转录 skill, 下载了视频文案, 然后调用了 obsidian markdown 这个 skill, 拣写了一篇 obsidian 知识笔记,然后调用 jason combs 这个 skill 在 无线画布上画出了视频的知识加固图。后面的两个 skill, 也就是 obsidian markdown 和 jason combs, 就是 obsidian 的 ceo stefan 最近发布的三个 skill 中的两个。 我们来看一下生成的内容。首先是 obsidian 知识笔记,可以看到知识笔记带有详细的元素句区,并且含有 obsidian 专属的 callout 语法。 我们打开当前笔记的关系图谱,就能看到笔记中的双向链接。然后我们来看一下 ai 绘制的无线画布, 可以看到视频的知识架构被清晰的整理到了无限画布中,甚至还带有原视频的链接。那有了这样的智能体能,为我们省下很多重复性劳动,让我们能够专注在学习和思考上。 今天我就用一个视频教会大家这个智能体的实现步骤,整个流程非常简单,具体步骤和相关知识点还有提示词我都整理成了知识笔记,最后会分享给大家。 首先我们来快速安装一下相关的环境。首先是 cloud code, 关于 cloud code 和 cloud skill 这部分内容在我的上一期视频中已经讲得很详细了。如果你还不知道 cloud skill 和 cloud code, 我 强烈建议大家回看我的上一期视频。那么这里我就快速的过一下安装流程。 我们先安装 windows, 直接去官网下载,然后双击安装即可。打开命令行,通过一行命令来安装。卡洛克,如果你在这一步有网络问题,可以使用网络加速,或者使用国内的 npm 镜像。具体的做法是在命令行后面添加额外的参数, 具体的命令我也展示在屏幕上。安装完成之后,我们要把 cloud 的 ai 替换成兼容模型,因为 cloud 对 网络和地区的限制非常严格,且价格较贵。 目前国内的 ai 比如 deepsea、 智普 glm 都支持了 ospec 的 api 接口。相关的官方文档我已经展示在屏幕上。 我们在命令行中分别输入这三行命令,来把 cloud code 的 ai 接口替换成智普 glm, 然后重启命令行,输入 cloud, 然后回车, cloud code 就 运行起来了。那么到此 cloud code 就 安装完毕了。 接下来我们来配置 obsidian, 这里我们需要安装一个插件,名字叫 cloud 点,是专门为 obsidian 适配 cloud code 的 插件,目前这个插件还没有正式发布到第三方市场中, 我们在 github 上找到 clouding 的 仓库,在 reedme 中能看到安装方法。我们手动下载三个文件,分别是 main 点 js, mainfast 点 json, 还有 style 点 css, 然后来到 obsidian 仓库所在的文件夹,在点 obsidian 文件夹中找到 plug ins 文件夹,然后在 plug ins 文件夹下创建一个叫 clouding 的 文件夹, 并且把刚才下载的三个文件放进去。然后我们打开 obsidian, 在 第三方插件界面把 cloudian 这个插件的开关打开, 然后来到设置界面,插件的设置界面有一些基础设置,比如 cloud 应该如何称呼你,这里我填 jason。 然后我们把滚动条拉到最下面,找到自定义变量,这里我们需要设置三个变量, 分别是 ai 的 u, r, l, a, p, i, t 和模型名称,那这里我们依然使用智普 g l l 模型,那你也可以使用 deep six 模型,那具体的参数我已经展示在屏幕上了。 设置完毕后,重启 off c 点,然后在键盘上按下 ctrl 加 p, 打开命令面板,输入 cloud 点,选择 open chat view 来打开 cloud 点的 ai 对 话窗口,在对话窗口中输入一个你好能看到 ai 返回结果,说明配置成功, 那么到此我们就完成了环境的配置。那接下来我们要把相关的 skill 放置进来。首先就是 obsidian ceo 发布的三个 skill, 我 们来到 github 搜索 obsidian skills, 找到 cappano 这个人的仓库,点进来,我们看到说明文档中已经说得很详细了,一共 seven skill, 分 别是 obsidian markdown, 用来拷写含有 obsidian 专有语法的 markdown 知识笔记。第二个是 jason canvas, 是 用来让 ai 帮你绘制无线画布 canvas 的 skill。 第三个是 obsidian basis, 是 让 ai 来帮你创建 obsidian 数据库用的。我们点击右上角绿色的 code 按钮,把整个仓库以 zip 压缩包的形式下载下来, 解压缩之后,把 skills 这个文件夹复制出来,然后来到我们的 obsidian 仓库所在的文件夹,找到点 cloud 这个文件夹,进入之后把刚才复制的 skills 文件夹拷贝进来,那么现在我们的 obsidian 就 已经有这三个 skill 了。 我们回到 abc 界面,在 abc 插件的 ai 对 话窗口输入斜杠 skills, 然后回车 ai 如果能够列出它所拥有的 skills, 那 么我们的整个流程就实现完成了。我的 ai 之所以有这么多的 skills, 是 因为我在 cloud code 的 全句目录下放了很多 skills, 大家可以回看我上一期讲 cloud skill 的 视频, 那么现在我们就可以让智能体来调用 skill 帮我们完成任务了。首先我让他用无线画布 canvas 来画出有关地中海饮食的知识结构图,并把生成的无线画布文件保存到 opposite 仓库的根部部。 我们可以看到 ai 在 接收到指令后,马上选择使用 jason canvas 这个 skill, 经过一段时间的思考之后,画出了知识库的根目录中。我们点开这个无线画布来看一下, 可以看到 ai 画出了地中海饮食的知识框架,并使用不同的颜色模块进行了分组。那么到此我们就成功在 office 界面中调用 cloud skill 来实现智能体功能了。 如果你想要为自己的智能体安装更多的 skill, 可以 到 github 上搜索相关仓库,比如 awesome cloud skill 这个仓库,以及 ospec 官方 github 仓库相关内容大家可以回看我们上一期视频。 这里我想额外说一个问题, stefan 发布的这三个 skill 是 全英文的,如果你向 ai 发送中文指令, 大模型在匹配的时候不一定每次都能精准地认识到应该使用哪个 skill, 那 解决的办法也有很多,你可以在提示词中明确要求它使用某一个 skill, 也可以来到 clouding 插件设置界面中的系统提示词选项, 在系统提示词中,要求 ai 在 接受到用户指令后,优先思考应该使用哪个 skill。 那 这样一来,你的 ai 有 了 skill 的 加持,就能变得更加智能,对特定任务也会完成的更加精确。对于 obsidian 的 ceo stefan 发布的这三个 skill, 我 个人认为更多的是代表官方的态度。 dolphin 他 没有发布在 obsidian 官方的 github 上,而是发布在了自己的 github 账号上。可以看到 minimo 这个外观主题也是在他的这个账号上发布的,因为他是这个主题的作者嘛。至于他之前接受采访中所传达的理念,可以说是知心合一的。 之前的采访中他说过,出于隐私等因素, obsidian 对 于发布官方 ai agent 的 持谨慎态度,这一点是不同于 notion 的。 由于 obsidian 的 文件隐私性,他鼓励用户自己去决定以什么样的方式使用 ai。 也就是说,你如果想要 ai 智能体,就自己手搓一个,而如今他自己亲自下场,带头手搓 agent skill, 并且发布在他自己的推特和 github 账号上,而不是官方账号, 这就非常符合他之前所传达的观点。 obsidian 不 像 notion 那 样环境是封闭的,限制那么多, obsidian 的 文件完全本地化,完全掌握在你自己手里,大家可以根据自己的需求,灵活地通过各种方式使用 ai。 那么今天的视频内容就到这了,大家现在就可以上手把 stefan 发布的 thank you 用起来了。视频中的内容和知识点我都整理成了知识笔记,大家可以在我的主页或频道信息中找到我的个人主页地址来下载资料,有任何问题都可以在评论区中给我留言,记得点赞关注,谢谢大家!

agent skills 最近的热度真的太高了,如果说 m c p 定义了 ai 调用工具的规范,那 skills 就 能让大模型将复杂的任务按规定的流程稳定运行。现在不少国内的 ide 都将 skills 集成到了自己的工具中。本期视频我会以 code 为例, 介绍什么是 skills, 以及如何通过 code 加上 skills, 让 ied 的 能力再上升一档。 skills 由三块内容组成,原数据、指令以及资源和代码。原数据用简短的描述说明了这个 skills 是 干什么的。 这部分数据会始终加载到模型的上下文中,原数据的内容很少,意味着可以同时配置很多的 skills, 而不会产生太大的上下文成本。 第二部分是指令。如果大模型觉得应该使用这个 skill, 这部分指令的内容才会被加载到上下文中。指令中会存放这个 skill 的 主要内容, 比如这是一个处理 pdf 的 skill, 指令部分的内容就定义了拿到一个 pdf 后如何处理 pdf 的 方式。指令和原数据都会放在 pdf 文件中。第三部分是资源和代码,在第二部分的指令中可以引用其他的文件, 比如要使用高级功能,就让 ai 去读 reference dmd, 要填写表单的话就读 form dmd 也可以指定当遇到某种情况就运行某个脚本,脚本一般都是拍存文件或者是有脚本, ai 会直接拿到运行之后的结果。通过这样一个 skill, 能让 ai 直接多了一个遇到 pdf 之后的处理能力。 同理,我们还可以写数据库迁移的 skill, 但把 review 的 skill 或者视频文案标题分面全部自动生成的 skill, 接下来就是怎么把 skill 在 ai 版本。先来看 ai 版本, 比如我现在想把这个 pdf 的 skill 做成用户级的能力,就在这个目录下创建 pdf skill, 里面放的就是 skill 相关的文件了。我现在手上有一个 pdf 文件,我通过这个 skill 让 code 将 pdf 转成图片,一行说明,直接搞定,完全解放双手,把 skill 集成到 id 中就更好用了。 code ide 最值得关注的特性就是它的快捷模式,这是一种完全的自主编程能力,特点就是无需持续人工介入就可以长时间持续执行。现在这个功能也可以通过 skills 扩展自己的能力了。就以这个 pdf skills 作为例子来演示,如果只想在当前项目下使用 skill, 就 可以在项目的点 code skills 目录下将刚刚这个 pdf skill 放进去。 现在我们要做一件事情,通过快捷模式模仿叉叉 u drop 生成一个定时任务管理页面,再通过 pdf skill 直接将产品使用文档整理成一个 pdf 文档。快捷有三套不同的模式可以选择,选择的场景不同,执行的方式也会不一样。我们这次主要是做个网站,那就选择构建网站就可以了,如果要做复杂项目的话, speak 会更加严谨。 另外,快捷模式还支持本地执行、并行执行和语音端服务的执行,我们这次就选择本地执行。快捷在执行前会自动根据需求对任务进行拆分。我们刚刚已经把 pdf skill 配置到项目中了,可以看到任务的最后一步就是通过 pdf skill 创建用户使用文档 quets 对 skill 的 支持是内置的,只需要把 skills 放到对应的目录中, quets 在 执行的时候就会自动去调用。现在通过前面五步任务,一个 web 项目就生成出来了,大家可以看一下生成的效果。第六步,通过 pdf skill 生成的文件也放在了项目目录内,内容十分详细。 代码能自动生成, pdf 文件也能通过 skill 自动生成。现在你就得到了一个完整的权限项目, 以及一份完整的产品使用说明。 pdf 文档所有你能想象出来的,能用代码写出来的功能,现在都可以作为一个个 skill 了。另外,如果你长时间使用 quick 做项目,会发现它对项目的理解会越来越深,这其实是 quick 的 一个技术突破点,可以做到自主进化,快速学习。以上就是本期视频的全部内容,我是鱼仔,我们下期再见。

大家新年好,今天是一个重磅的分享,经常看我视频的伙伴都知道,我在过去的时间里,用不读一行代码的方式,一种黑盒编程的方式,已经把一个项目做出了一个雏形。在这个过程中,我也积攒了一些经验,会陆续做成视频分享给大家。 去年 cloud 推出了这个 agent skills 这个功能之后,我也做了一些视频。现在 skills 的 使用价值已经完全的超越 mcp 了,而且我认为它的使用门槛是相当的低, 但是可能很多朋友还没有学会怎么用,今天我就教你们一个使用 skill 做自动化流程,给自己提效的一个万能公式。所谓的万能公式就是所有人都可以不用写代码就可以用。 那首先提到这个万能公式,我先介绍一个工具啊。这个经验来自于我之前用黑河编程做的项目,我经常让 ai 去做后端测试,他特别喜欢用这个命令, 我根据这条命令就构建了一套它用于测后端的一个脚本,所以我的项目开发的也比较顺。但这个命令我觉得我们不用去学习,你只需要知道,它可以模拟我们所有操作网页的方式。 如果你常用的 web 服务器是支持 api 访问的,那么你只需要让 ai 读一下 api 的 文档,它就可以构建出一套纯自动化的流程。当然这么听可能有点抽象,我会用了这个命令,跟我的这个 万能公式又有什么关系呢?我来举一个例子你们就懂了。我的女儿前几天考这个 g s p 的 五级 c y y 的 一个考试,她没考好,我分析了一下,其实是刷题刷的不够,虽然我给他做了一个 ai 工具,新奥制题助手,这个我之前分享过, 但是这个工具有一个问题,就是他没有自己的题库,这些所有的题其实还是我自己在网上找的,我要通过这个工具的内置功能给它加入进去。 但是这个怎么说也比较麻烦,你得录入题目,你得用 ai 分 析测试点,还得找答案。虽然我也在工具上做了一个类似 a 证的抓网页的功能,但我觉得不好用,而且它只能抓题目,它的测试点和答案你还得另找这个软件,它已经完全落后于这个时代了,我也懒得再去狗尾续貂, 但是我想了另外一个招,这招是什么呢?就是因为我的信号制题助手,它启动之后就会有一个后端服务器, 当初我觉得在这个 electron 里运行一个 python 服务器,这种设计还挺奇葩的,但是现在想想还是挺明智的。我把后端的 api 的 代码喂给这个 cloud code 之后,他竟然就把这个 skill 做出来了。 我只需要打开这个应用,然后让 ai 分 析我孩子的代码,让他有针对性的推荐题目,然后调用我的后端 api 加入我的提库。 所以说如果你有一个学习系统,他也是有后端的, ai 就 可以完全实现。他作为一个可以操作你后端的一个机器人,根据你的要求来操作你的后端,比如说给你出题,或者是帮你分析,可以把所有人需要去做的 任务一下一下点击做的任务,变成一个让 ai 去做的一个工作流,而且实现这个工作流,你不需要干任何事,你只要一句话,他就可以去执行很长时间。 给大家看一下我这个技能,做了两个技能,一个是一个叫 csp, 一个叫对拍。能不能看一下这个 csp 的 这个技能,这个技能 总体来说它就只有一个文档,它就是描述我这个信号制题助手的后端的 api, 它描述了一些场景,比如说它的基础的 url, 它怎么样去管理题库,应该怎么获取编程题,它的这个格式是什么? 给了一些例子,怎么样去获取答题记录,是用什么样的格式?如果你要验证代码,用沙盒验证沙盒的 api 是 什么, 包括你可以 c 加加,也可以用 python, 它描述了一些场景,场景一是怎么样添加新题目,怎么样看学生的答题记录,怎么用沙盒快速验证, 还给了一个文档,这个文档是一个完整的一个 api 参考,我只是把我的这个 api doc 给 ai, 通过这个 sql creator, 它就自己给我全部创建了。我给大家演示一下啊。首先这是这次我女儿没做的这道题,五级的一个题,她没做出来,我就说我就用通过这一个 prompt, 让她来分析她的算法和考点,然后在立扣上帮我找类似的题, 然后制度相关的要求,难度中等,把题单抓下来,放到我的题库里,在入库之后,用对拍这个技能来求解,让他一步一步执行。你看他先做了个计划,他知识点,他分析出来了, 好去立扣抓题,他用了很多的任务,子任务,最后抓到了五道题,这入库的结果,他现在做了五道题,他能获取我们这个资料库,然后找到资料库,把题目放进去,然后就开始就要用对拍工具做对拍来求解了。 当然这个对拍工具我觉得还需要优化,他用的时间巨长无比,他现在已经跑了四十分钟还没有做完。 当然一次搞五道题可能是有点贪心了,但是它还在积极的运行中,如果我们正常的使用来说,其实就可以把它扔这,让它自己去搞就行。好吧,只是给大家演示一下这个 skill 运行好了是什么结果,基本上我到目前为止, 我除了输入那个 prompt 之后,我还没有管过,所以其实基本上就是 one side, 你 可以让它自己一直搞下去。那我们如果再把脑洞开大一点, 比如公司的系统是用来查数据库而做分析的,你也完全可以让 ai 去调用一个 skill 去查,直接做分析。现在的外部架构基本上都是有为 api 的 设计的,所以任何带有后端的服务,我们都可以通过 api 把它做成 skill, 然后让 cloud code 成为它的外挂,而你不需要做任何的开发, 这就是我称之为任何人都可以使用 skill 提效的万能公式。可能有朋友问了,那如果我有一个服务器,但是我不知道 api, 我 没有它的文档,或者说我不会做 skill, 那 该怎么办? ok, 我 今天推荐两个工具啊,第一个就是 chrome devtools 这个工具,它简单来说就是给你的 cloud code 的 一个浏览器,我们来看一下,你看,我现在是让它用 chrome devtools 启动一个浏览器,访问落谷点 com, 它会打开这样一个浏览器,我在这上面做一个操作,接着我让它读一下它网络请求的这个日记。我刚做了个搜索,能不能分析下格式 ai, 它会自动从这个工具里把这个 network 的 请求全部列表出来,然后分析出来这个格式, 它会总结成一个文档,这个 json 格式。刚才我搜索了其实有一个是标签,这里要选标签的标签,标签其实它也是有一个 api 的, 所以我就问他有没有获取标签列表以及标签意义的处理啊?他发现找到了之后,他就给我去列举,他能把所有的标签列举出来,我让他去用这个方法去测试一下 五级减的二分题目,他很快就给我找到了一些这么多题目,五十三道题。有了这样一个东西, 我就可以让他帮我去找题目了。当然并不鼓励大家用这种方式对任何网站做这样的分析。你首先要看这网站允许不允许你这样做,如果他要求必须登录才能用的话,我建议还是不要做,这样 不太好。你们如果说你们自己的系统,比如说你公司内部的一个数据库,那你就完全随便了, 即使你没有这个文档,你也可以用我这种方法来获取。获取完了之后你会发现这整个的上下文就会充斥着这些关于结构的一些知识。我们该怎么做呢?我把以上获取的这个技巧放到一个新的技能,我让它创建技能了。最重要你要提到这个 skill creator, 这个 skill crit 是 一个 osophic 推出 skills 时的一个默认的一个基础技能,但是你需要去安装它, 我等一下说怎么安装?如果你安装好了之后,你在做任何技能的时候,你不需要自己去做,你直接告诉 cloud 用 skill crit 把以上的经验做成 skill 就 好了,就这么简单, 它会放到这样一个结构底下,就是放 skill 点 m d, 然后它会给你创建一堆脚本,当然这个脚本是什么样你们不用管,就反正它做好了,你直接用就行了。那么 skill crate 在 哪里找呢?在这个 repo 里头,这是一个 safari 推出的, 它也提供了一些安装手法, plug in, 通过 marketplace 方式,用 plug in 把这个 skill 安装进去,安装好了之后,它这个文档里头就会有所有的这个技能,其中你们看,这有一个 skill creator, 就是 这个 skill creator。 我 们再总结一下,如果你没有 api 的 文档,你不会做 skill 怎么办?首先你先操作一遍,让它抓取,然后给你生成一个文档, 接下来直接告诉他,用 skill creator 来做一个 skill, 就 这么简单。经常看我视频的朋友知道,我过去还分享过千万三 omni 的 语音互助,还有我的监工 agent 的 项目,还有我的 finnus 上的一些场景。 我相信呢,在今年就一定会实现一个场景,就是我们再也不需要使用 cloud code, 而是直接通过语音发出一个命令,然后我们的 worker 就 会在 boss 上给我们完成一个长线的任务,最后把结果给我们呈现出来。 所以我想说的是呢,我分享的这些内容并不是零散的,他们都是在为了实现这样一个目的,这样一个场景的技术战之一,所以我做的内容并不是为了做内容而找主题,而是为了实现我理想中的 agi 的 场景, 然后把我过程中的一些发现分享给大家,这是一个真实的长线的 ai 的 学习和成长,所以关注我,你们也可以获得同样的成长。 ok, 以上就是今天所有的内容了,谢谢大家。

朋友们用 cloud skills 做出来的前端页面真的很好看,这是我花十分钟做了三个页面,第一个,写作工具。 第二个, ai 简历助手。 第三个, cloud skills 社区, 不用画设计稿,不用写一行代码。接下来告诉你我怎么用同一套 skills 做出不同风格的高质量前端页面。这个 skill 是 在两个神级 skill 的 基础上改造出来的。 第一个神级 skill 叫 flow and design, 它是 called 官方出品的 skill, 它的特点是没有 ai 位,创造力比较强。第二个 skill 叫 ui ux pro max, 它是 github 上的一个神级开源 skill, 它提供了一套规范的 ui 库,让你可以精准复刻某个产品的 ui 规范。 在这样的基础上,我改造出了这个 skill, 它同时具备设计的创造力,还能精准的贴合我要求的 ui 规范。我们先来看一下这个 skill 的 架构。首先有一个主控 skill, 它通过和我对话,理解我的需求,然后判断对应的设计场景,最后再确定调用的方案。 调用方案确定后,执行层的 skill 就 会开始工作。接下来我们看一下完整的工作流程。第一步, ai 会向用户了解设计需求。第二步,主控 skill 会基于需求判断设计场景和确定最终的设计路线。 如果用户想做一个风格独特的网站,但它的规范性没有要求,我们就走路线。一、纯创意的方式把这个网站做出来。 如果用户强调规范性,但他不太在意设计感,那我们就走路线。二,纯参考,但用 u i u x pro max 的 数据库找到一个案例,把它复刻出来。 如果用户既需要有风格,又需要有规范性,那我们就走路线三,先通过 u i u x pro max 提供参考的规范,然后 form and design, 再去主导整个设计语言,给出最终的规范。库数量有限,所以我做了一个 u i u x pro max 提取的 skill, 它的工作方式是输入一个 url, 它就调用 playwrite 进行页面的捕获,同时拿到网站的截图和 css 代码。 拿到代码的截图后,它就会开始进行分析,分析完成后会在 url 叉 pro max 数据库里面新增一条规范,然后把对应的参数全都填进去,这样我们就能快速复刻某个网站的设计规范。有了这套 skill 后,想做出好看有品味的前端页面真的太简单了。 今天的分享就到这里了,你还想用 close skill 帮你解决什么问题?欢迎在评论区跟我留言,我们下期继续。

code 编程出了 skill 技能一键生成的这个功能,而且同步更新了 code 空间,生成了二点零,在对话栏里边直接调用你创建 skill 的 功能,以及其他人发布到商城里边 skill 的 功能。 而且更重要的是它跑通了一个闭环,之前我们想的 code 跟 code 编程创建的工作流智能体发布之后,它没办法让别人购买啊,现在增加了可以购买 涉及价格的这个功能,而且扣子编程可以申请你的商户账号,个人的,还有企业的,这是我等待很长很长时间,他终于出的功能了。我昨天拍视频就说了吗, cloud qq 功能 其实就是扣子空间调用智能铁跟工作流的能力加上去,补充完就是新的这个扣子的版本。如果你还在纠结 cloud qq 怎么用的话,现在已经不用学了。打开扣子编程,你可以直接自然语言去描述,让它生成,不需要写那么多代码,而且我这个扣子的产品经理再预言一下。 接来扣子编程我们做过的 ai 智能体,还有做过的很多工作流,商业落地的工作流可以直接发布到扣子里边,在里边直接调用,而且也可以发布到多维表格里。 我落地的五十多个行业,做了上千个落地的工作流,图文获客,视频获客、数字和客,所有的流程都可以变现闭环了。 下条视频我教大家如何在 qq 编程里边创建自己的 skill 的 这个功能,到完整流程以及发布。但是你觉得 skill 这个东西真的能让普通人快速落地,也能快速应用,而且上手好容易上手,而且商业应用上效率很高, 其实并不会的。如果你要做越复杂的 skill 的 工作流这个技能,那你在每个环节你的题词写的要非常精准,这是大多人是做不到的。 如果你来回去修改的话,它经常会出错,这就是真实的它。目前可能只能做一些比较简单的 si skill 的 技能跟工作流,如果要再商业落地的话,让它批量制作,更实用的就是把工作流跟 skill 直接发布到多维表格进行操作。 之后我也会拍一期视频,教大家如何把工作流 skill 发布到多维表格里边去,综合落地使用,真正能帮你业务上降增效,而不是做一个玩具,一个噱头。

大家好,今天我要讲一个知识库解锁 skill。 那 在我们平时使用 ai 来读取我们的知识库和文档内容的时候,经常我们会面临两个问题,一个是 token 的 极度浪费,因为我们经常会粗暴地把文档为 ai 去读取, 那他会读取一些他不需要的知识,不需要的内容,那这样的话会极度消耗我们的托克,那也算是在浪费我们的金钱。那第二个致命的就是上下文的问题,那所有大模型都有上下文限制,一旦资料量爆棚, ai 就 会失忆,经不住你的指令, 导致后续生成的内容都是胡言乱语的。那么如何在不喂给 ai 全部内容的前提下,可以让他能精准的获取他需要获取的资料呢?那么今天我们就给大家分享一下如何使用 secure 这个工具来打造一个知识库解锁 skill。 那 我让他读取这个 呃创建工具,这个刚刚我之前呃视频里面讲过这个 sku create 这个 sku 工具,它是用来创建 sku 的 啊,你有了它之后,我们不需要要知道怎么去创建这个 sku, 只要用这个工具去创建工具就可以了 啊,那我用了这个工具之后呢,他就去读取啊我的资料,然后了解我的需求,他就给了这个方案,创建一个专业的知识库解锁 skill, 然后他设计了一个三层件件式批漏系统啊,里面设计一个 skill 核心的文档,第二个是一个模块缩影的一个啊啊一个文件, 然后第三个是一个脚本,一个解锁的脚本啊,当这样去设计这样一个呃 skq, 好 的,我一起总共跟 ai 启动了三个对话,第二个对话是让他去对这个 skq 进行一个测试,测试之后我又让他对这个 skq 的 名称进行了一下更改, 那最后这个 skq 他 检查名称都没问题,那最后我们来给他测试一下,试下这个 skq 到底能不能精准。帮我们去查找我们的资料,我让这个 ai 去使用这个 skq, 是 使用这个 sql 来查询一下我们项目使用的对象存储是哪个平台的。好,可以看到他已经使用了这个 sql, 正在读取他找到了 ai 资产架构方案和我们的 os 配置信息,那这些都是我们的运维方面的项目资料,他已经把信息告诉我们了, 我们未来我们当前使用的是阿里云的,那未来我们上线使用的是特训员的,那说明这个是 q 还是有效的。好,我们再来测试一个我们平时经常会用到的一个规范,就是我们在接入 ai 的 api 的 时候的一个规范, 那我输入这个提示词之后,我可以看到 ai 在 搜索到我们这样一个是 q, 经过这个是 q 的 引导和解锁,它读取了我们 ai api 的 记录的规范, 把规范的一个内容发给了我们,所以我们刚才去创建的 qq 的 这个知识库解锁 还是非常有效。那这样的情况下,他都不需要我们去扔一堆的文档,因为有些时候我们在开发任务的时候,可能我们自己也不知道需要给 ai 去读取哪些规范文档, 那这样的情况下,我们有了这个知识库 qq, ai 会根据我们下到的任务提示,他会自己去根据我们这个 qq 的 设计相关的一些规则, 他会去读取他应该读的,我们这里可以看到他读取了这份规范文档的第一行至一百一十行,那这样的话我们是非常节省我们的头壳,而且很关键一点是他不会占用我们太多的上下文,因为我们平时在新建一个对话去执行开发任务的时候,我们这个脚钉窗口他其实是有一个上下门上限的, 我们使用的每个模型他都有上下门的限制,如果超过这个限制,他就像失去记忆一样,面的内容他会忘记,后面的内容他才 记得住,那这样的情况下就会出现一个神经错乱,我们下的任务他可能不会根据我们的指令去执行任务。所以我很建议大家可以去研究下我们前面说到的如何去创建一个知识库解锁的 cq, 结合你的使用场景是非常能高效的提高我们的工作效率。特别是像我们这种 开发场景,它不仅可以降低我们的上下门占用,它还可以降低我们在使用一些 api 模型的时候,降低我们的掏坑的消耗。好了,今天的分享就到这里,感谢大家的点赞和关注,谢谢大家。

这是一个让你实现 skill 自由的网站,让你使用 ai 的 效率提升十倍。每天一个强大的网站。第五十六期,今天要讲的是, 这里有四千多条各领域的专业 skill, 包括写作、前端、后端、营销、自媒体、 ppt 制作等,内容超级丰富,需要哪个用哪个。使用也很简单,以创意为例,找到对应 skill 地址,在创意里点击克隆 get 仓库,输入 skill 地址,等待十几秒,你的编程工具就拥有了这项技能。没有编程工具也可以使用扣子 输入请安装这个 skill, 附上地址就装好了,使用时直接调用就行了。重要是这个网站上的资源免费使用,持续更新,不用注册。恭喜你,离超级个体又近了一步!

二零二六年最值得学习的技能呢,就是 cloud skill, 现在 osopik、 谷歌 openai 已经全部支持 skill 了,分享七个。最近一个月呢,在开元社区热度上涨最高的 skill 项目。第一个是 obsidian ceo, 他 自己写的一个 skill, 非常牛的用法是 直接绘制格式化的 canvas 画布。比如说,我让他创建一个 canvas 来解读刻意练习这本书,它会自动识别出需要调用 jason canvas 这个 skill。 大 概呢,花了两分钟啊,运行完成,生成一张 canvas 图,它直接把刻意练习书里面的内容和相互之间的关联化 出来,整本书的逻辑呢,一目了然。以前看书呢,容易迷失在细节和特定章节里面,现在用这种彩色的画布,让你瞬间纵览全书。再比如呢,让它创建一个读书的阅读管理系统,跟踪目前我读书的进度啊,它会自动识别并调用 obsidian faces 这个 skill, 然后生成一套读书管理系统, 显示了每本书的基本信息以及阅读的情况,并创建了子文件夹,对每本书进行总结。你还可以自行进行扩展,添加更多书籍笔记到书籍文件夹里面。地址呢,在这里。 第二个是 ospec 官方 skill, 里面有非常多的 skill, 比如说对 word, pdf 进行处理的 skill, 可以 从 pdf word 里面提取文本。再比如呢,前端设计的 skill, 最重要的是这个 skill creator, 它可以指导你创建自己的 skill。 地址呢,在这里啊。第三个是 gitup 上二点二万 star 的, 它可以指导你创建自己的 skill。 地址呢,在这里啊!第三个是 gitup 上二点二万 star 的 star, 它可以指导你创建自己的 这套 skill。 什么用呢?第一个,他懂得三思而后行,普通的 ai 拿到需求呢,一般直接开干,但是装了 superpowers skill 之后,他会先按住暂停键,会启动头脑风暴这个模式。 反过来问你这个功能的具体场景是什么,有没有边缘情况啊?他会先和你把需求聊透,把模糊的想法呢变成清晰的文档。第二呢,他是一个不折不扣的计划通,需求确定之后呢,他不会乱写,而是会生成一份详细的 实施计划。他会把大任务呢拆解成一个个两到五分钟就能完成的小任务,就像一个靠谱的架构师,把蓝图呢都给你画好了,你点头呢,他才开工。第三,他强制执行测试驱动开发,这是很多高级的程序员才有的习惯啊。他会先写测试用力,如果测试失败再去写代码让测试通。 最后呢,还要重构,这意味着它写出来的代码呢,其实会更加的健壮。这个 skill 库呢,还有很多功能,地址呢,在这里啊,大家可以去进一步的探索。第四个是模仿 manners 的 skills planning with fields。 这个 skills 借鉴的 manners 的 设计理念,将上下文窗口类比为内存,一时 有限。将文件系统类比为磁盘,持久而且无限。而核心的原则是重要信息均写入磁盘,而不是待在内存里面。 针对每一个复杂的任务呢,需要创建三个关键的 markdown 文件。第一个 task pen md, 用于跟踪任务阶段和进度。第二个 finding md, 储存研究内容与发现结果。第三个文件 progress md, 记录绘画日记和测试的结果。这个 skill 非常适合 多步骤的任务,三步及其以上研究类任务,以及需要多次调用工具的任务。地址呢,在这个地方,第五个是自动上传内容到 notebook l m 的 skill。 这个 skill 呢,也可以让你通过 cloud code 快 速获取带有来源引用的打 答案。对于每一个从 cloud 发出的问题呢,会先通过 notebook lm 进行一次答案的综合,然后再用 cloud 进行回答。这个技能借助 notebook lm 的 预处理能力,让 cloud 仅需要发送查询指令,接收精准答案,大幅地降低了 token 的 消耗。地址呢,在这个地方,第六个啊,是 skill prompt 检测 rater。 这个呢,是用来生成图片提示词的,内置了十二个专业领域的 skills, 比如说人像提示词专家,艺术风格专家、平面设计专家等等。它会根据用户的输入呢,自动匹配 对应的专家来帮助生成图片提示词,从而实现精细化生成的效果。比如说我让他生成生成电影级的亚洲女性张艺谋电影风格。使用豆包得到的图片呢,是这样的,而这个呢,是没有使用这个 skill 的 生成结果。我们可以发现呢,如果没有使用这个 skill, 生成的结果呢,更加的发散和随意。第七个是用来做内容营销的 skill, 可以根据多个关键词来生成文章,适用于 s e o 的 场景。地址呢,在这个地方, skill 呢,将 agent 和工作流的门槛呢,又降低了一个级别。二零二六年注定是各行各业 skill 的 爆发年。 现在看完这个视频呢,你就可以立刻去用起来,有什么不懂的可以评论区告诉我,想系统化学习呢,也可以加入我们的社区,下一期呢继续。

绝大多数人使用 gmail 三的方式,其实依然停留在两年前使用豆包的那个时代。今天我想结合谷歌的官方文档和我的实战经验,给大家分享三个 gmail 三点零的进阶的使用技巧。第一招是能帮你把它训练成你的专属顾问,第二招能够让你更高效地去创建你的 agent skill。 第三招甚至能让你无 现白嫖。顶级算力过程中会有一些提示词的模板,我都会在片尾告诉大家获取方式。我们现在看第一招吧。系统指令。很多人都知道要给 ai 写人设提示词,但是其实大家都没有用。对,如果你只是给 ai 对 话框里发一提示词,它其实只有临时记忆, 你会发现聊着聊着就变味了。而这个系统指令其实是给这个 ai 对 话框写入一个基因代码,它是一个永久的人设或者是思考框架。现在你在这个 google ai studio 里面, 在右侧就可以去写出你的这个系统指令。在 gmail 官网有一个叫 jim 的 地方,也是大家去设置系统指令的地方。那这个系统指令怎么写才让它成为你的专属的战略级顾问呢?我参考了 google 的 官方文档,还有我自己的一些用法,给大家总结了五个模块的万能公式。第一个模块其实就是用户画像,简单说就是亮出你自己, 把你的这个底牌和限制告诉 ai。 举个例子,你像我没有任何的海外公司,那当我想做一个出海的 ai 产品的时候,涉及到支付模块,我的 ai 就 不会给我推荐像 stripe 这样我不具备任何资格的一个方案,而是直接给我能用的平替。再比如像我告诉 ai 说我的电脑是 macbook, 以及我不懂 c 加加,我就是一个 webco 的 用户,那他给我代码的时候就会给我直接能在 mac 终端去运行的命令,而不会给我一些看不懂的 windows 指令。 那第二块其实是关于行为和语气,其就是你和 ai 的 沟通方式。其实 gmail 三有一个特别容易犯错的地方,就是他特别爱讨好人,他训练的时候就默认是一个顺从的助理角色,那你像我这种 i n t b 性格,我一般会给他下个死命,就是你不要谴责我,你也不要附和我, 而且我告诉他就我是 ceo, 你 是执行层,但是你在给我建议之前,你必须像苏格拉底一样去反问我,这样呢?时间长了,他现在给我口头禅就是 ceo, 你 百分百是对的,但是有三个风险在落地的时候要考虑等等,这 就是我觉得 ok 的 沟通方式,当然你也可以找你喜欢的有效沟通。第三个是关于时效性啊,因为 gmail 三的这个模型内置的训练数据都是二五年一月份的,所以我会强制告诉他涉及到一些行业动态,你 必须给我开启 google search, 不要拿这个一年前的这个旧新闻来骗我,在 studio 里面的话,它现在也默认会开启 groundwave。 google search 在 底部大家应该能看到第四和第五个模块是关于逻辑推理、输出规范的,优先评估风险是个永远正确的事情,不确定的给我 ai 幻觉, 并且因为我平时经常整理提示词,所以我会要求他给我输出格式基本是 markdown, 如果有一些专业名词的话,对中文给我参照一下,然后你把这五个模块的这个提示词都填进去的话,你的 jimmy 瞬间从一个只会讲片儿脏话的网友变成一个最懂你的专属顾问。 不过各位注意啊,如果你像我一样经常用 google s studio 的 话,你千万不要放任何的真实的姓名、电话等隐私信息,因为这些会被拿去平台做模型的训练数据的。 那第一招说完,我们再说第二点,建立你的 agent skill 的 实验室。现在 agent skill 这个概念其实真的挺火的,但本质就是用提示词 去封装一套工作流。那你现在已经会了这个系统指令了吧?那其实你就可以在任意一个对话框去创造一个工作流提示词的测试环境。简单说其实就是让 ai 自己卷自己。比如我就会告诉 jimmy 三,你有两个活儿,第一个活儿就是按照我的这个流程写文案生成内容。那还有一个角色是你要站在旁观者的角度去 去记录我的评论,去找茬,去想你刚才哪一轮工作做得不够好,去底层去修改和完善。基本上当我每一轮的任务结束之后,我就会输入复盘这个指令,它就会生成一个升级版优化过的提示词, 以此循环往复,不断的去完善这个核心的一些算法,提示词等等。这个可以给大家看一下,我基本上在我很多的提示词测试的时候,都会在开头加上这样的一些规定,其实比我们自己去复盘在那瞎琢磨效率高了不止十倍。 你在这些实验室里面测试好了,直接搬到 course deal 或者是 webcointing 里面,效率大大的。那还有一个进阶用法,其实是白嫖免费额度。大家都知道免费的 gmail 用多了都会被限制额度,那怎么榨干它的价值呢?我自己平时是用三个策略哈。第一招就是 多个账号, google a s studio 和 gmail 的 官网,它其实是两套额度系统,所以如果你有两套谷歌账号的话,那你每天相当有四波免费额度,可以疯狂白嫖,轮着造。那如果你没有的话,有更好的法,比如说模型混用,简单说就是一些普通的追问或者查资料,你直接让 gmail 三六零 flash 去做,一点不比 pro 差,而且速度快,占用的额度也非常的少。只有你做一些核心的复杂决策,需要回顾上下文,包括第八个的时候,你再找 pro 模型去做好纲要,用在刀刃上。 第三招其实我觉得反而更重要,一定要紧盯着 token 的 使用进度条。免费额度其实它不是看你问了几个问题,它其实看的是你整体的算力消耗,对话越长,上下文越多,哪怕你只发个嗯嗯, 你的消耗也是翻倍的。根据我的经验哈,五万是个小卡,十二点九是个大卡,这个数在哪看呢?在 google a s 六里面,在每个对话框上面能看到这个对话框已经 累积的这些算力。我这个对话框已经快要废弃了,因为一旦它超过了这个预值之后,你会发现它的反应变慢,幻觉增加非额度,用不了几次它就会告诉你到顶了。所以如果你发现已经到这些极限的时候,你就千万不要犹豫,直接开个新对话框,这就叫卡 bug 级的省流。 当然啊,如果大家对这个上下文无损迁移感兴趣的话,我也可以专门出一个视频讲一讲我天天干这个事。最后多一嘴很多官方的一些参数,选用默认值就好了,不需要多刻意的调整,够用的。 其实 ai 好 不好用,强不强就关键看你怎么用,你有这些进阶的方式的话,你就可以在免费的额度情况下发挥它最大的潜能, 这其实就是最大利好于我们普通人的一个时候。今天视频里面提到这些提示词模板,老规矩我都会整理在我的 ai 同款笔记里面,大家去一小说幺零幺回复关键词自助拿走就行。好吧,那我继续去开发我的 ai 产品了,咱们下期再聊吧,拜拜。

先给结论,剪辑式的 skill 本质是专业提示词加工具接口的组合器,同时通过渐近式提示词让 ai 按步骤完成整个剪辑流程, 这不是未来,而是正在发生的现实。 skill 的 两点核心本质,一、加 a 专业提示词加工具接口组合 提示词告诉 ai 风格节奏、剪辑规则,工具接口让 ai 调用剪辑软件素材库、音频处理工具执行操作。二 d 渐近式提示词展现 skill 不是 一条一次性指令, 而是分阶段分步骤驱动 ai。 比如先筛选素材,再剪辑片段,再调整时间轴,再添加转场,再处理音频,再生成字幕,再生成字幕,最后输出多版本。每个阶段的提示词都有明确目标, ai 根据前一阶段结果逐步完成下一阶段任务。第一次点名剪辑师的具体工作内容, 你每天做的事包括 skill。 将每一步拆解成可执行模块, ai 自动按步骤执行,几乎不需要人工干预。 skill 拆解流程示意,一 john 上传素材并选择风格。一、 ai 根据提示词筛选高质量片段。二、抵 a 时间轴排列, ai 按节奏自动剪辑。三、 它我转场特效处理耶, ai 自动添加符合风格的特效。四、 ro 音频处理耶自动匹配音乐和音量 五、 g a 字幕生成一,自动生成并嵌入六天它多版本输出杀不同平台尺寸和格式自动生成,每一步都是渐进式提示词驱动,确保 ai 完整理解目标并执行智能体协调。多个 skill 同时运行,全天候处理几十条视频, 输出,质量可控统一,无需疲劳,企业效率提升数倍,成本大幅下降。最后一句话, skill 的 本质决定了它能逐步替代剪辑师的重复工作,这是不可逆的趋势。

发现一个好东西啊,克洛顿官方提供的一个 ppt skill 哈,可以让你做 ppt 变得非常非常简单,而且生成的是 ppt 文件,而不是像其他 ai 大 模型一样。嗯,或者市面上其他的那种 ppt 制作方式一样,给你制作一个可视化的网页,对吧?那网页你不能修改啊, 他直接帮你用这个 ppt x scale 哈,生成了一个 ppt 文件哈, powerpoint 演示文稿,真的,然后我试用了一下哈,搭配 color code 的 一起用,超级简单。 比如你看哈,我在这里说,打开 color code 的 之后,请帮我制作一个 ppt, 主题是程序员如何做副业,然后他就会调用这个 ppt x 这个 scale 帮我去制作,大家可以看看制作完的效果哈, 看到了吗?就是 ppt 哈,在 powerpoint 当中打开的, 可编辑,可修改,看见了吗?我只给他说了一句话,他就帮我们制作完了,对不对?然后我发现它的制作这个原理也特别有意思哈, 它也是先生成一个格式化的网页,然后将格式化的网页通过一个程序脚本的方式,再把它转换成这个 powerpoint, 就是 这个 ppt 演示文本稿。 所以基于它这个原理呢,我自己打造了一个非常漂亮的啊 scale, 就是 我们可以写自己风格的 ppt, 比如啊 type 演讲的风格,或者是其他风格的,然后我写了一个 scale, 一个提示词啊 scale 技能把它封装了一下,然后让它去调用。大家可以看看哈, 像这个风格的 ppt, 它是一个可说话的网页,对吧?这个是 tab 的 演讲风格的,嗯,一共是十四五页,然后每页一句话提醒大家怎么去演讲的这类啊,特别漂亮的 ppt 吧, 我们可以自己写这种的 skill, 然后写成这样之后呢,生成自己想要风格的,然后再使用这个 skill ppts skill 呢?把它直接转换成 ppt, 很简单啊,我在这里用的是怎么用的?就是输入一篇文章,我写好的文章,呃,扔到这个 type 演讲风格的 ppt, 它就会自动调用我这个 type 演讲的这个 skill ppt 啊 skill, 然后帮我制作,制作完成之后,它会自动再调用这个 ppt s, 帮我把这个漂亮的格式化网页转换成 ppt 演示稿就是文件,大家可以看看那个效果啊,制作成的全程自动化啊,大家可以对比一下啊。 看见了吗?直接给转换了。 看见了吗?直接给转换了,转换的也特别好哈,真的哈,以后你制作 ppt 就 全自动化了,就这样哈,如果使用这个 skill 的 话, 都不需要你去再怎么操作了哈,你,你把这个命令发进去,在 cloud code 当中一回车,整个过程就帮你制作完了哈,特别快。最近 agent skill 不是 特别火吗?就是 cloud 推出的哈, 嗯,可以将你工作当中所有可以流程化的东西, s o p 化的东西都打造成自己需要的 skill, 然后,嗯,全自动的来处理自己的工作。如果大家想学习如何创建 agent skill 的 话,可以联系我啊,我正在出一系列的教程,教大家如何使用 agent skill 来帮助自己的工作自动化。

兄弟们,我只能说它还是太全面了,你看这个需求分析,然后各个子项目它都已经列好了,然后还会说这个会被阻断。三五七,意思是说三五七完成之后才可以,太牛了,太牛了,给个大拇指。 还有一个事情,就是当某一个步骤,某一个 agent 需要用到某个 skill 的 时候,它会调用你的 skill, 然后来处理。 你看每一个 agent 它的颜色都是不一样的,这样子你就清楚地知道某一个 agent 它在做什么事情。这是这个需求的第一阶段,然后创建了五个 agent, 然后后面还有三四五, 这几个要等前面完成之后才可以继续处理。牛掰需求分析师做完了事情了,然后等待其他 agent 的 进展,它已经空闲了, 那就是看看开发,然后还有测试了,会及时的更新各个 id 特的一个状态,做完了他就休息了,然后其他的继续。这就是卡尔做的这个调度,这是最新的状态,看一下 目前跑了一分钟五十二秒,然后使用了十四万的 tucker 是 不是还在做啊?

skill 也特别适合做批量视频来 web marketing, 一 开始我很想用 n 八 n 来做这个流程,因为它里面会涉及到请求好几次不同模型,包括图像模型, banana, 还包括文本的模型,还包括这个视频的模型。但是 n 八有个问题啊,因为像 v u 三,它一个视频就几秒钟,我们完成一个完整的视频,它是需要 生成好几个视频,然后再拼在一起的。但是 n 八 n 去拼视频这个步骤有点麻烦,所以咱们用 skill, 它在 gl code 里面 是可以直接调用本地的这个服务的,那这个服务就是一个专门的去把视频进行拼接的一工具,超级好用。所以今天我对 skill 的 体验感就是,它不仅可以跟 s o p 化的把一些流程性的,批量性的工作把它固定下来,重复的去做,而且呢,它还可以非常方便的去调用你本地的各种文件,然后去使用一些非常好用的本地的服务。 所以这个视频就给大家展示一下这个 skill 是 怎么样制作的,非常简单。先打开 coco 的, coco 的 不会下载的朋友们请看之前的视频啊。 那完事之后我们直接把这个流程输入进来,这个流程里面需要注意的部分哈,首先你自己先是对你这一类视频的套路得是非常明确的,我建议大家最好提前在社交媒体上去找你这个业务的爆款视频,看是不是能够把它非常套路化的拆解出来的。 如果能的话再用这套流程,如果不能的话,那我们再用其他的方案去解决。 ok, 那 如果你已经确定了是可以用这种模板化的方式拆解的话,我们就直接把这些步骤给它输入进去,这个步骤主要就是包括你给他一个基本的图片,让他去生成提示词,再去生成你这个视频独有的分镜图。 接下来呢,再根据这个台词的长短切分成多个不同的视频。最后一步呢,就是用这个本地的工具, f f, m p、 e, g, 把 上一步生成的多个视频把它拼结合成在一起。最后一定记得给他指定一个文件夹保存的位置,可以把过程中所有的内容都保存下来,方便你在测试的时候去 check 到底哪里出问题了。 另外还有个小技巧,就是你第一次去给他输入提示词的时候呢,不用让他直接去干活,你让他先理解一下需求,跟你讨论一下他给你提的问题呢,你都跟他说清楚,这样的话他的成功率会更高一点。像我这条提示词生成的这个 skill, 我 基本上测试的第一次就完全跑通了,可以直接跑出来这个视频了,中间没有遇到任何问题, 所以我个人感觉还是非常方便的,给他剥个外壳,或者是给他直接接入到一些啊工作软件什么飞书里面,我感觉是可以直接大量的去服用了。今天就先分享到这,对这个工具感兴趣的朋友们可以在评论区扣一期,待一见再连下期见。

现在啊, agent 的 skill 已经多到失控了, skill s m b 上面有十一万个 skill, s h 上面啊有三万多个。问题已经不是有没有 skill, 而是你该怎么选。那为什么我们不让 open code 帮我们找呢? 在 skill s h 上面啊,有一个官方的 skill 叫 find skills, 专门帮你找现场的 skill, 比如我直接说我要做 seo 的 优化,有没有好用的 skill, 你 看它会自动调用 find skills 在整个 skill 的 生态里。帮我搜列出来之后啊,再问我要不要装。我们还可以继续让 opencode 帮我们判断哪个更合适 find skill 啊,解决的是有没有更成熟的现成方案, skill 太多不是问题,不会选才是问题。

或者是我自己安装的这些 skill, 第一个就是 skill creator, 对 吧?第二个 skill 就是 专门用来阅读文性的,这是我自己生成的一个可以支持阅读几十篇甚至上百篇的 pdf 文档。第三个就是 academic literature search, 这个是专门用来搜索。第四个是 paper slide deck, 这个是我在 这个官方下载的专门生成什么 ppt 的 skill, 这个是 research to diagram, 这个是用来绘图的 skill, 你 看,你就在这儿可以随便调用,对吧?当你调用它的时候,它就是一个专门能够帮你,它就变成一个 skill 了。当然, 你这个窗口还可以干什么事呢?它可以控制你的电脑,这个就跟接阅桌面是一样的,我在这儿可以操作我电脑当中的只要电脑能干的事儿,你在这个窗口都可以直接。怎么样? hold, 比方说在音频 skill 文件夹里生成二十个 word 文档,行了,他马上就做完了。这你要在过去你生成二十个文档,你还得一个一个打开 word 定存位等等,这个不需要了,他已经做完了,你看一屏 skill, 好, 我等他做。 你是要做的。干什么?你看是不做完了,看到没?这不,文档文档一、文档二、文档三、文档四、文档五、文档六, 一直到文档时是不是已经作完了?你还可以批量改名,干任何事都可以。比方你可以让他在十个文档当中分别写入十个报告,比方说在十个文档当中分别写入十个调研报告,关键词是,比方说家庭社会学, 比方说教师教育等等等等,你写完之后,你就等着就行了,他一会就把这十个文档全部写完,所以其实你将来做调研,做这些东西已经非常简单了。

这是飞克幺二幺八版本,连接上搭建好的服务器,可流畅使用它的各种功能,如定位和虚拟路线。 今天就分享飞克服务器的搭建教程。准备好一台服务器,复制 ip, 查询下它的联通线,非全红状态下即为可用。在终端内连接 s s h, 输入服务器的账户信息和密码。 这里我提前写好了 fake 的 搭建一键脚本, 只需将它复制到服务器终端内,回车等待两分钟即可完成。看到这个绿色的页面, 说明服务器已经搭建成功了。复制好服务器的 ip, 在 浏览器内输入 ip 和八千端口号,如果提示版本号,说明已经搭建成功,然后返回手机,打开 lsp 框架, 在 d i a 模块中找到 faker, 进入后选择大杂烩,找到 h t t b 代理功能,填入 ip 和端口号,端口号为八千,然后重新进入 faker。 先登录好账号,在登录的过程中,账号密码可以随便输入。 登录完成之后,我们可以使用它的功能, 发现甩位置特别干净利落,直接就可以过去。路线模拟也是可以正常生效, 缺点是无法正常使用地图会提示错误, 这时我们需要用到全功能模块来修复地图,目前这个模块不免费开放,重新打开后发现地图已经修复了,可以正常使用。 在路线这里可以使用它的自动寻路功能,设置好起始位置和终点位置, 它就会自动寻路。

这个时候呢,我们看这个设置啊, skills 这里,哎,它就多了一个这个了啊?定位目标组织规格这个, 那我们怎么用它呢?之前我们那个提示的时候是整段把它贴上去的嘛?那现在我们只需要提交那个输入信息, 然后简单说一句话就可以了。刚才那个信息这个嘛,是吧?这是三五科技,这个是要告诉他的啊?然后就说一句,比如说帮我定位目标组织规则, 哎,这样就行了啊,不用再说怎么怎么做了,就把这个能力给他就行了,然后提交。嗯,还是用这个吧, 那么然后它就会这里就会去调用这个来做,然后给出结果啊,那个那么它的输出是按照我们刚才那个 cue 里面,然后提示里面要求那个规格出来的。 主要就是这个好处啊。

这是一份九千多条的订单表,我说了句做份销售分析,它就自动生成全套图表,一篇公众号草稿,直接复制文本就能直接生成配图,这都是直接用 skill 做的,操作特别简单,你不用懂 skill, 甚至不用写一个字就能直接用它干活, 而且建好一次全团队都能用,换其他平台的 skill 粘贴进来,照样一键调用。接下来我教你具体怎么配置上让 ai 真正赋能公司的业务场景。 最近这个 skill 可以 说是 ai 圈最火的一件事情,那我们平台也在第一时间就支持了 skill 这个功能,但是很多小伙伴呢,还不知道怎么去玩,然后也没有一个完善的教程 来去讲解这一块它的一个能实现的一个功能。所以这一期呢,我们就先来讲一下 skill 它的一些核心的概念和在我们平台的一个基础使用是什么样子。 首先先说结论,就如果说二零二六年你必须要掌握一项 ai 技能,那它一定就是 skill。 可以 说在未来的相当长的一段时间内, skill 替代原有的提示词工程工作流已经是 基本上势不可挡的这么一个趋势。那总总结起来一句话来说,就是这个 agent skill 呢,它本质上是一个伪装成 markdown 的 工作流, 它里面可以将我们之前通过提示词工程 m c p 的 工具调用和 ig 能去实现的功能,通过简简单单的写一个 markdown 就 能够实现。所以我们先来看一下就是在传统传统的提示词工程 m c p 和 ig 这三个技术它的一些局限。然后我们再来看 skill 它到底解决了他们的一个什么问题,基本上就知道 skill 它是一个什么东西了。 首先我们来说一下这个提示词工程,提示词工程呢,相当于假设说我现在有很多我的一些知识,这些东西,我需要把它抛给 ai, 让它基于我的这些技友的一个知识去回答我的问题。这时候我的上下文里面 可能必须要把我的这些东西,假设你有一百万字,那你就要把这一百万字全部塞到这个提示词的上下文,这就引起了它的那个 token 的 一个 巨大的消耗。那你说,哎,我是不是可以把它放到那个知识库里面用 i g 去调用呢? i g 它的劣势是什么呢? i g 它的劣势就 i g 它在你的一个文档进行向量化的时候会进行分片,然后 ai 呢会从里面去针对性的去剪辑出来一段,那这个时候的这个逻辑的建立是建立在我的提问, 只是跟我文档里的某一个片段是有关系的,这个逻辑在本身很多的场景当中可以说都是不成立的。如果说我的一个提问只跟文档里的一段,那我还抛给你这么一大一段干什么?但是后面也出现了很多的 ig 的 技术 去能够在文档当中,比如说进行一些权威检讨等等这些技术,但是 ig 他 整个的一个项目实施的难度是很大的,必须要开发人员才能去做。 第三个是 m c p, m c p 呢?就是在很多场景下,这个工具他可能都成百上千上万个,那这么多工具,我们知道就在做开发的时候,他的这些工具全部都是作为一个上下文挂到那个整个的大模型的那个 历史记录里面,那你成百上千上万个工具的时候,这个上下文直接就炸了,这是工具调用它的问题,那同时 m c p, 它还有另外一个核心的问题,就是 m c p, 你 至少要自己去会能开发这个 m c p 的 工具, 也他也只是一个面向开发人员的工具。第四个还有工作流,就我们在很多场景当中,比如像扣子、 define 这一类的工作流,他将某一个流程进行编排,然后中间可能需要调用到 ig, 可能需要调用到那个工具。 但这类工作流他有个巨大的问题,就是你比如说我在 define 上的工作做的工作流,他是只能在 define 上去用的,然后你再去做 n 八 n, 或者你去 做扣子上的时候,你又需要去了解扣子这个平台它的使用,就像它的工作流必须依赖于这具体的一个平台才能去编排和创建以来前面的这几项技术。它存在的问题就是上下文爆炸, 然后解锁,结果不准确,只是面向开发人员,普通人员没有办法去维护这个工具等等这一系列的问题。那我们来看 scale 是 不是都解决了这些问题跟爆炸的问题。传统的情况下,我们再用提示词工程去解决很多呃, 去约束这个模型它的一些技能的时候,然后我们会采用提示词,这个时候就相当于我们给的模型实际上是一本书。而 scale 的 时候它可以用 很多的参考文档,我们可以看到这个 scale 它的一个目录结构里面的 reference 就是 参考文档,这个参考文档呢,它是具体的这本书,但是我们在 给到大模型的时候,只需要给到这本书的一个目录,也就是在我们的 scale 这个 md 的 这个核心指令文件里面,我们只需要制定,比如说当你遇到什么问题,你就去查这本书的第几页,那这就解决了一个 提示词爆炸的一个问题,它在促使的时候加载的那个提示词,它的 talk 消耗是非常小,所以核心的这个指令文件和 reference 这两个就相当于替代了原来的提示词工程和 ig, 也就是原来用提示词工程 ig 这两个做的事情,这两个在目前用这两个就能实现, 这是第一个,第二个,那工具调用这块呢?原来需要工具调用,就是我需要开发一个后端服务去作为一个工具提供出来的。这个时候我们可以看到在整个 skill 目录里面有一个叫 script 脚本,这个是可以替代原有的一些工具调用的。 就我比如说我要发一个请求,请求一个数据,比如我要去处理一个执行一段什么脚本或者代码,那这个地方在 script 里面是可以去实现的。这个 script 里面的一个脚本就相当于我们在 comui, 在 扣子,在 define 当中的一个节点 尽可能更高,就借助我们现在的很多 ai 的 扣顶,其实这部分的工作也是可以非常方便的去实现的。 我们来看一个简单的这个 scale, 它的一个 demo, 我 们可以看到它的这个 demo 里面我们有一些第一步做什么,第二步做什么, 那它其实就是一个为什么我们前面说它是伪装成 markdown 的 一个工作流,其实就在这里,就我们只需要用自然语言去描述,就跟你再去写一个文档一样,去给 ai 描述你要执行的一个步骤就 ok 了。 ok, 我 们理解了 skill 的 核心技能之后,那接下来在我们的平台上去使用 skill 去搭建一个 agent 出来,这个就是非常简单的。注意啊,这个 skill 它还是必须要依赖 agent 去 才能运行的。然后我们这里搭建一个什么呢?搭建一个最简单的就是因为在我们平台上他已经有了很多的这种纹身图啊,就是图纹身视频这一类的图像创作的应用。那我们现在就基于 skill 来搭建一个虚拟试穿的这么一个场景,但这个场景其实如果说不用,如果说在之前的 agent 里面其实也是非常方便的去实现的。那我们再看在应用 skill 来实现的时候,它有什么不同? 在后台管理的智能体开发以及技能管理这里我们点击这个创建技能,可以看到弹出一个对话框,在这个对话框里面的技能的名称就相当于我们在前面看到的那个结构里面的 skill name, 就 等同于这个 skill name。 然后技能描述呢,就等同于在它这个 skill skill 点 markdown 里面写的 description, 它用于去描述这个 skill 具备什么样的能力。在你有多个 skill 给到一个 agent 的 时候,它就是根据这个技能描述去选择我到底要去读取哪一个技能,这是技能描述 技能指令,就相当于是我的这个 skill 点 markdown 里面的那个内容, 然后下面的引用文档就等同于在 scale 的 reference 里面的所有的参考文档 啊。这个是我们的这个创建技能,它跟标准的也就说 cloud 里面的那个技能它的一个对照关系,大概就是这样,这里创建技能支持两种啊,一种我们可以从既有的 啊, pdf, word markdown 或者 txt 的 文档直接上传上来,然后把它作为一个技能。那同时我们也可以从这里 直接通过创建空白的 markdown, 然后在里面从空白的 markdown 里面,然后自己去手写,在线去编辑,然后这样创建一个 reference, 也就是创建一个引用文档出来。那这边我们可以看到我这边的这个 demo 也会,到时候会分享给大家啊,就是大家可以拿着我这个 demo, 然后看这个 demo 它怎么去编辑里面的这个 reference 的 这个文档的 啊?基本上他这个里面就我们刚刚前面其实已经讲过了,他其实就跟你再去写一个参考文档一样的,你就要描述你完成这件事情,达到第一步干什么,第二步干什么,第三步干什么就可以了,而且尽可能的准确,就是你这里写的越准确, ai 他 在遵循你的任务去完成这件事情,就会执行的越 准确。然后我们这边的第一步呢是让他,然后我们这边的第一步是让他先去润色这个提示词,就是我要进行虚拟试穿他的提示词的整个的啊润色的过程。然后第二步是让他调用我们 后台内置的工具,就像我们平台上内置的这么大量的文本和图像生成的工具去生成 虚拟试穿的图,然后并且优先使用拉洛布拉拉这个模型啊,并且提示词的关键里面也写到了一些非常关键的一些内容, 到这一步结束技能就创建好了。那技能创建好了之后呢?我们这个技能它是不能直接使用的,就像前面我们讲到的,它必须要在 agent 去使用,所以我们还需要去创建一个智能体, 创建智能体咱就到这个智能体管理这个模块里面,然后点上面的创建智能体,然后创建智能体之后,我们可以看到在这个智能体的编排里面我们有这些参数,整整个的这边的功能跟扣子 大体上的核心功能是一样的,就我们可以给我们的整个智能体指定一个执行的模型,这个模型它要是支持工具调用的,然后我们这边地方还是像千问 plus 呀,像 cloud 这些都是比较优秀的工具调用的模型。 然后我们这边测试一个千万速度比较快,我们还是用千万 plus 来去测试,然后这里的技能就可以点这里的添加,然后我们可以看到我们所有的技能都在这里,然后我们可以选择一个,也可以选择多个技能给这个智能体,然后这里我们就选择我们刚刚创建的这个虚拟试穿这个智能体。 选完虚拟试穿智能体,我们点开这个高级设置,在高级设置里面我们看到有起用 mcp 工具这一个这个选项,就是说我要不要让这个智能体能够调用我后台的这些所有的 升图,然后升视频这一类的工具,然后这个地方我们把它起用,否则的话你的智能他他是没有这些工具的。然后系统提示词这边呢可以简单的写一下,如果我们的这个任务比较复杂的,这里可以去详细的一个填写,然后这样呢就相当于一个 最简单的智能体就创建完成了,然后我们点这里的发布给他一个啊智能体的名称,然后包括分类之后,然后点这个确认发布 发布之后整个智能体创建就完成了,然后我们这个时候就可以去看这个智能体它实际运行的时候如何去调用这个技能,去完成我们刚刚的这个任务的。 然后我们直接点这个智能体的这个卡片,就可以进入到这个智能体他的调用的一个窗口,我们简单的来上传一张服装,然后简单的写个提示词,让他来生成一个真人模特试穿的这么一个场景,然后我们来等待他的一个调用的 结果,我们可以看到中间我们可以看一下他的整个的调用步骤啊,然后我这中间我们可以看一下他先是会去读取技能, 然后再会根据你的技能描述去读取这里面需要用到哪个技能的详细的参考文,然后之后根据你参考文档里面的指示,然后一步一步的去 调用相关的工具也好,去执行相应的几种脚本也好。然后这个当然我们这里还没有涉及到执行脚本,只是一个最简单的就是去调用内部的工具来去进行深图这么一个简单的 agent, 其实我们可以看到他基本上就跑起来了,而且在最后的这个效果还是可以的,就是基本上的一个核心目的达到了, 这是一个最简单的智能题。当我们在这个里面可能也会有很多的,比如说我们可以看到他生成的这个画面结构还是比较偏简单。那我们 后面就会教大家如何再通过更多的工具的引入,以及我们这个技能文件把它写的 更好更详细,然后让 ai 它更能够把这个工作完成的更好。然后这是我们就是后面会继续推出下一期内容来去讲在 skill 它在我们平台上的一些高阶的应用。 好,今天的内容就先到这里,然后大家可以先在平台上去实际的操作和体验一下,这个体验的过程还是非常关键,那我们今天的内容就到这里了,好,谢谢大家。