粉丝4.0万获赞11.6万

今天这期视频啊,我们只讲一件事情,就是普通人怎么用 cloud code 把自己需要的工具直接做出来。很多人听到 code 这个单词啊,写代码觉得跟自己完全就没有关系,但其实 cloud code 除了超强的这种写代码能力之外, 它还能做很多日常的任务,比如说数据分析啊,比如说这个每日资讯的爬虫啊,比如说文件管理等等,甚至连修图 p 视频这种活啊,它也能帮你把流程搭起来, 因为他啊,不是某一个具体的工具,他是一个圆工具。什么叫做圆工具呢?就是可以搭建其他工具的工具,你用大白话讲清楚自己的需求,比如说我想做一个网站,我想搭建一个自动化的工作流,我想有一个小助手,每天帮我整理资料,他就能帮你一步一步把这些东西搭出来,能跑能用,最后呢,还能帮你去点 现在每天的新工具啊,越来越多,更新的也越来越快,反而呢,会让我们更容易掉进这种效率陷阱里面,学一堆的零碎的工具,越学越忙,效率越学越低。所以我觉得普通人更应该去学这种顶级的通用的工具,学会一次之后啊,以后想要啥就可以做啥。这期视频啊,是 cloud code 的 入门视频,我 会带你从零上手,先用五分钟时间呢,先讲清楚怎么去安装配置 cloud, 当然已经安装好的同学呢,可以直接跳过这五分钟。第二部分呢,我会教大家第一次启动 cloud 怎么用,怎么去提需求,然后会带大家去做几个案例,比如说从零开始,构建一个精美的笔记软件,一些除了写代码之外的其他的生活当中的使用场景。最后呢,再补充一些我自己总结的使用经验,使用建议帮你少踩坑,用的更加顺畅,就算你完全没有写过代码,完全没有用过 cloud code 的 类似软件 也能跟得上。重要的不是用的好不好,重要的是先用起来。好,我们开始啊,首先呢,我们要来安装 cloud code, 那 基本上呢,至少有三到四种方法可以使用 cloud code, 我 们今天只讲最适合新手最省心的一种方法,就是在像 vs code 或者像 cursor 这样的 ai 编程软件当中去使用 cloud code。 这个呢有两个原因啊, 一个呢就是因为现在这些编程软件的进步速度非常快,不断地推出非常有趣的这些新功能,我们可以在使用 cloud code 的 同时呢,能结合这些编程软件推出的新功能。第二点呢就是 cloud code 啊,原声其实是在终端里面跑的,终端大概就是长这样子,就是一堆文字的这样的窗口,新手一上来呢,其实对着这些窗口啊, 很容易直接劝退,但像 vs code 和 ctrl 这样的编程软件呢,其实界面就更加友好,在这个界面上面点点鼠标就可以操作。我们这个视频里面以 vs code 为例啊,你可以直接去这个 scode 的 官网,然后去下载这个 vs code 的 安装包,然后一键安装,完全免费的。安装好之后啊,就可以直接打开 vs code, 可以 点击这里的 open project 新建一个文件夹,名字叫做 cloud code test 创建让这个文件夹信任这个 vs code 的 里面的工具。好了,你看我们刚才建的这个 cloud code test, 这个文件夹已经打开了。安装完这个 vs code 的 软件之后呢,接下来第二步就是我们要来正式开始安装 cloud code。 cloud code 安装呢,其实也不难啊,我们先去这个 node js 的 官网去 去下载安装这个 node js, 然后你可以用比较简单的下载程序包安装的方式去安装。安装完 node js 之后呢,我们再回到 vs code, 打开这里的 terminal 终端,接着呢,我们把这条命令直接复制进终端,直接按回车,确定输入一下密码,然后系统呢就会自动开始安装 cloud code 了。因为我这里已经安装过了,所以呢就不再去演示了,这个视频里面用到的所有命令,所有提示词呢,我都会放在黑猩猩基地里面, 我真心觉得呢,大家不必害怕这样的终端界面,或者是像类似于这样的终端界面,看起来很专业,很复杂,全是文字,但你刚才看到了我们的操作, 只是一些简单的复制粘贴的操作而已。然后再给大家分享一个比较实用的技巧,就是我一般会在 webcoing 的 时候呢,在旁边开一个其他的 ai 聊天窗口,比如说 jimmy 叉 gpt, 都有包前吻,哪个熟悉的你都可以在安装过程当中有任何的报错,任何按钮找不到了,哪一步卡住了,你都可以截图或者复制错误的信息, 然后直接黏贴过来,它基本上都能帮你瞬间解决掉这个问题。到这一步为止呢,其实 cloud code 已经安装好了,我们可以直接在这个终端里面输入 cloud 的 这个单词, 然后新人这个目录,当你看到这个 cloud code 的 logo 的 时候,说明你这个 cloud code 已经安装成功了,我们先退出。但对于小白来说啊,我觉得其实最好再安装一个 cloud code 的 插件,可以提供一个更好的交互界面。我们在这里插件,这里搜索 cloud code, 然后看到这个 cloud code for vs code 之后呢,这里这里有个按钮,直接一键安装就可以了。然后安装完成之后啊,你会在这里发现有一个 cloud code 的 这个小图标,我们直接点击打开,然后我们最终就得到了一个在 vs code 的 编程软件里面的 带插件的 cloud code。 到这一步的时候呢,你 cloud code 的 整个安装流程就完成了。好安装完成之后呢,还有最后一个关键的问题就是 cloud code 的 里面用什么模型, 这个搞定之后啊,你就可以真正的开始使用 cloud code。 cloud code 的 本质上呢,是一个终端里面的这个智能开发工具,所以它自己啊不产生智能,背后必须接一个大模型的服务。官方默认的呢是走这个 elastic 的 cloud 模型,但因为海外服务,大家都知道这个众所周知的原因, 很多人都会遇到网络啊,支付啊,账号啊,稳定型一堆的这个限制问题。但如果你这些自己都能轻松搞定,那你可能也不需要我这期的入门视频了,所以更常见也更适合大多数人的方案呢,是 直接接国内的大模型接口,价格更便宜,稳定性更好,能力也完全够用,比如说智普的 g l m, 比如说 mini max, kimi 等等。为了让整个这个大模型接口的配置过程也更适合小白更友好,我推荐一个接口的管理工具,叫做 cc switch, 大家可以去搜一下这个 cc switch 的 这个下载和使用教程, 它的作用也很直接啊,就是你可以购买多个服务商的不同的模型,比如说有时候这个模型比较便宜啦,有时候那个模型可以有一些优惠的政策啦。 c c switch 可以 帮助你去管理所有的这些不同的模型, 如果你想切换哪个模型,就直接点一下这个启动按钮就好了,非常方便。顺便说一嘴啊,它除了可以管理 cloud code 的 这个接口以外,它还可以管理 codex 和 和 gemina 的 这开发工具的背后的接口。具体怎么使用呢?第一步啊,你要先去这些大模型的官方网站他们的购买页面去购买他们的 coding plan, 买完之后呢,然后去可以去到他们的这个 apikey 的 管理页面去创建一个新的 apikey, 然后把这个 apikey 复制出来,先放好,因为等一下要用一般都是在用户中心的 apikey 管理页,或者是类似的这样的页面里面。第二步啊,打开刚刚的这个 c switch, 然后这里有一个 添加服务商的按钮,然后先选择你的品牌,然后把你刚刚复制的这个 api key 复制进来,然后添加就行了。添加好之后呢,你就可以在这个首页,然后用这个启用按钮启用你刚才新添加的这个考勤 plan 的 这个接口,这些都完成之后呢,就重启你的 cloud code, 然后你的 这个整个 cloud code 以及它后端的这个模型接口都可以生效了。好了,到这里为止啊,就 cloud code 的 所有安装配置流程都已经全部用完了,我们回到 vs code 的 这个软件里面,打 打开这个 cloud code, 接下来我们就来体验一下,为什么很多人说它是二零二五年,甚至到现二零二六年还是最强的 ai 工具。 先介绍一下这个看起来酷酷的这个界面的主要功能,左边呢是项目文件夹,这个就是我们刚开始建议的这个项目文件夹 c c test, 然后中间呢是编辑器,到时候如果有文件生成,你想看某一个具体的文件内容,就会在这个中间显示。右边呢是 cloud 的 核心的聊天窗口,也是你主要跟 cloud 的 交互的地方。正好我们刚刚添加了我们自己的这个大模型接口,所以呢,我们可以在这里直接问他,你现在使用 的是什么模型?他回答呢就是我们刚刚添加的这个新的模型。从刚刚这个这么小的例子当中啊,你可以体会到我们在使用 cloud 的 过程当中啊,不 管你有什么样的问题,你都可以直接问 cloud code。 然后这里呢还有一种更帅的方式,因为 cloud code 里面它自带了很多实用的功能,这些功能呢都可以用斜杠加一些这个英文单词来调取,比如说 输入斜杠,然后后面加上这个 model, 它就会显示你现在正在使用的模型和其他可选的这个模型选项。当然还有很多其他的这个斜杠功能,但我的建议呢是,你完全不需要在现在这个阶段去死记硬背,慢慢用起来,你自然就会记住了我们的思路呢,也是后面用到什么,我们再会去讲什么 好,我们接下来呢来试着用 curl code 做我们的第一个应用。在开始做应用之前啊,我最后再讲一个关键,关键的功能叫做 plan mode, 你 可以在这里看到,现在呢,这个模式叫做 ask before edit, 就是 每次这个 cloud code 想要编辑的文件呢,它都会问你一下同不同意,你按一下它就会变成这个 cloud code 自动去编辑的模式,你再按一下呢,就会出现这个 plan mode。 plan mode 呢,是整个 cloud code 里面极其重要的一个知识点,它的核心价值呢是它不让 ai 立刻帮你去写代码, 而是让你和 ai 来回的去讨论这个方案。把方案定下来之后呢,再去写代码。很多时候,你想让 cloud code 去真正改代码之前,你希望它真正理解你的需求,真正理解你想要去做什么。这就是 plan model 的 这个用途, 先确定它的计划是否符合你的预期,再去执行。很多人抱怨说这个 ai 智能体 ai agent 不 可靠,然后会乱改东西,也实现不了我的需求。但大部分时候啊,都是这个 plan 不 够好的问题。 如果你能正确的合理的使用这个 play mode 智能机啊,大部分时候都会按照你的要求来做事情。还有一点啊,就是如果你不知道什么时候要选 play mode, 什么时候不选 play mode, 那 我的建议啊,就是你所有时候所有场景都把 play mode 给勾选上。好,接下来我们就开始我们的第一个案例。我的提示词是这样子的, 我想开发一款高级的笔记应用,用户能够在一个强大的编辑当中去记录笔记,能够将笔记保存到这个文件夹中,并按照自己的意愿进行整理,甚至还能结合一些 ai 的 功能。 请你为这款应用赚写一份 prg 的 产品文档。然后 cloud code 呢,会反向来问你这个具体笔记软件的一些这个具体的需求,它有了我们的这个回答之后呢,它可以更具体更准确的去编写这个产品文档。好,需求文档写完了,我们先选择我们手动去看看这个需求文档。 需求文档如我们所想一样,就是写的非常全面,包括了产品概述,技术的架构,然后功能的需求。 主要来看一下这个核心的功能点。第一个呢,就是一个笔记的编辑器,然后是笔记的管理。第三点呢,是 ai 智能写作辅助的功能,它还帮我们设想了一些拓展功能,在后续版本当中可以再添加。但说实话,这种 p r d 呢,当然写得很好,但对于小白或非技术人员来说呢, 真的是太完整,太大太全了。对我们来说呢,最稳的方式就是一次只做一个小版本,然后测试,再确认,再加入下一个功能。所以呢,我跟他说,第一个版本啊,让我们先完成这个前端的部分,做一个本地能运行的 demo, 然后把这个模式改成 play mode 发送。 在 clockcode 执行的过程当中啊,它经常会向你问一些问题,以及申请一些权限。然后呢,如果你想一步步每次都确认一下,你就每次都点 yes, 因为我已经用过 clock 很多次了,所以我一般都直接让它默认帮我执行。因为我觉得一步步去 确认比较麻烦,所以我就选择 yes, 在 这个项目当中都会给你这个权限。 clockcode 大 概花了十分钟的时间帮我们实现了这个第一个版本, 看一下它这个历史的聊天记录啊,最后还去确认一下一开始设计的这功能表当中,是不是把这些所有功能没有遗漏的去完成了。最后呢帮我们在本地运行了一个服 务,让我们打开这个网址,去看一下最终的效果。打开之后这个效果呢,我觉得就非常好了,因为我正好要跟大家去讲怎么样在这个 webcoing 当中去 debug, 因为 debug 是 webcoing 当中非常非常重要的一部分, 本来还想说要自己设计一个这个错误,然后来教大家怎么去这个第八个方式,然后正好这里给了我们一个错误。好,我们现在看到了我们打不开这个网站了,那怎么办呢?根本就不用慌,我们可以直接把这里的错误信息全部复制给 cloud code, 当然有时候呢也可以截图,他这直接提供了这个复制按钮, 点击复制,然后直接把这个错误信息复制给 cloud code, 让他帮我们去修复好,他说修复完成了,我们再回到这个网页。哦, 果然修复完成了,你把错误信息直接复制给 cloud code, 在 百分之九十情况下, cloud code 都能帮你去直接修复。我们来具体看一下 cloud code 的 为我们生成的这个笔记软件,光从页面上来看呢,这个第一个版本已经非常像样了,中间应该是这个核心的主要的编辑区域,然后左边呢是这个 文件夹的管理,文件的管理区,我们来新建一个笔记,随便试一下 markdown 格式,标题序列号 也没问题,虽然有一个小 bug 呢,但是这么复杂的一个笔记软件,这么高级的一个笔记软件,能在十分钟之内完成,还是让人感觉到很爽很爽。这里啊,我再给了一个我自己日常使用的一个小建议,前面也顺带提到过,就是在使用 cloud code, 或者是在这个使用 webcoding 的 时候啊, 旁边一定要开一个这个独立的 ai 聊天助手,你随便选一个主流的大模型都行。这样做呢,其实有两个很现实的好处,第一个呢,就是随时救火, 遇到不明白的按钮啊,报错啊流程可以直接把问题丢给他问。 geocode 是 这两年最强的代码智能体之一,主流的大模型啊,基本上都能知道它的常见的用法跟常见的一些坑,所以呢,能给你立即的解释清楚。第二点就是提高复杂任务的这个成功率,有时候一个项目做不成, 一开始方案就不够稳定,在 cloud code 给出它的方案之后啊,我们再用另外一个模型做一次交叉的验证,往往能补出你没想到一些风险点,一些边界的条件,甚至给出更简单的这些替代的路径。具体来说呢,你可以把 cloud code 的 刚刚生成的这个计划直接复制捏切进来,然后问它这么两个问题,一个呢,就是这份计划当中最大的风险跟缺点是什么? 另外一个啊,就是有没有更稳妥,更简单,成功率更高的实现路径,然后把杰米呢生成的这个方案再黏贴回给 cloud code, 让 cloud code 基于新的建议更新计划,并且继续执行。我们开头的时候说了,这个 cloud code 呢,是一个顶级的通用 ai 工具, 之所以叫通用工具呢,是因为它除了写代码之外,还可以做很多其他的日常任务。我给大家演示几个例子,比如说呢,我打开一个新的文件夹,然后呢,这个文件夹里面有之前我的三个视频, 我现在呢想把它们转换一下格式,并且提取视频里面的音频。这对普通小白来说呢,其实是一个蛮复杂的一个技术性的工作。但我现在可以直接在这个文件夹里面打开 cloud code, 我 可以直接跟 cloud code 说,帮我检查一下当前目录下所有的 mp 四文件, 把它们转化一个格式,并且提取它们的音频,单独存到一个 audio 文件夹里面,保留原来的原文件。我们直接发送给 cloud code, 我们看到因为我们缺少一些视频转换的工具, carlo 会发现这个问题,然后自动帮我们去下载安装这个视频转换的工具。好,任务全都完成了,我们来看一下,它给我们新建了两个文件夹,一个是 odo 文件夹,里面有三个对应的音频, 然后是一个 m o v 文件夹,里面有三个 m o v 的 视频,你们看啊,这样一个视频转换跟音频提取的任务就轻轻松松的搞定了。再来一个案例啊,再比如说,我有一个,比如说这样的一个文件夹 面全是杂乱的这个图片跟视频,然后呢,我想让 carlo corder 帮我去整理一下这个文件夹,直接跟 carlo corder 说,根据文件的类型跟日期,帮我把文件夹里的杂乱文件分别对应到文件夹里发送给 carlo corder, 反而会来问,你说按什么方式去组织这样的文件?呃,比如说,我就选一个按类型跟日期。 好,任务完成了,我们来看一下,有三张图片呢,好像没有被整理进去,但没关系啊,我们先不管他,我们来看一下他帮我们整理的结构,在这个图片文件夹下呢, 这个二四年三月份有一个文件,二五年四月份有十一个文件,二五年一月份有一个文件,然后等等等等,我们来看一下真实的这个文件 家里。 ok, 没有问题啊,他整理的还挺好的,然后速度也挺快的,基本上就花了二十秒钟时间嘛。但是他有时候也会有些小问题啊,比如说这三张图片没有整理进去,但如果你让他再去整理一遍的话,他应该也会帮你把三张图片进去分类。当然这样的场景呢,有很多,我不在这里一一举例了, 大家可以自己去体验一下,自己去探索一下。好了,视频到这里为止啊,我们已经完成了一整套的 clock 的 最关键的入门,我们一开始装好了 clock 的, 接好了模型, 在 vs code 里面跑起来用 play 模式啊,从零开始,做出了一个高级的笔记软件应用,然后正好在录制的过程中啊,我们还碰到了一个 bug, 所以 我们还学了一下怎么用这个 curl code 去 de bug。 最后呢,我们还展示两个日常生活当中会碰到的这个任务, curl code 呢,其实还有很多其他的高阶的玩法,大家应该也听说过,比如说 m c p 啊,比如说 skill 啊,比如说 sub agent 啊,这些呢,我们之后也会介绍,但我想说的是啊,这些其实都不重要,重要的就是你自己先玩起来,先用起来。好了,今天的视频就到这里了,我是李超,我们下次见。

cloud skill 到底是什么?应该如何使用?我们先来看一下效果。我在 cloud code 中输入了一段提示词,我要求 ai 读取一个 youtube 视频链接。这个视频是油管著名博主单口大神的一期视频,我让 ai 提取视频中的核心知识点, 并整理成一篇 obsidian 格式的 markdown 知识笔记,然后把视频中的知识结构用无线画布画出一幅知识结构图,最后把生成的知识笔记转换为电子书格式,方便我离线阅读。 我把这个指令发送给 cloud code 之后,我的双手就离开键盘了,完全由 cloud code 来接管这个任务。 color code 调用了四个 skills 来完成这个任务。这四个 skills 分 别是 youtube transcript, 也就是 youtube 视频的文案转录,还有 obsidian, macdunn 和 jason combs 这两个 obsidian 的 skill, 以及 macdunn to epub 这个电子书生成 skill。 我 们可以看到,在当前文件夹下,他先下载了视频的字幕文件点 v t t, 然后提取知识点,并拣写成 macdunn 知识笔记, 然后又用无线画布画出了知识结构图,最后生成了电子书文件。在任务全部完成之后,他还进行了自我检查,确认我要求的文件全部创建成功,然后才结束任务。 我们来检查一下生成的文件,首先字幕文件点 v t t, 可以 看到这是单口大神的原版英文口播字幕是带有时间戳的。我们再来看看生成的 macdunk 知识笔记和无线画布。我们把这两个文件放到 obsidian 中,首先看 macdunk 知识笔记, 笔记中是带有 obsidian 专有语法的,比如 copy 块儿,同时还建立了双向链接,我们可以在当前笔记中的知识图谱中看到它所建立的双链儿。 我们再来看无限画布,在 comics 文件中, ai 根据视频的内容画出了知识结构图。那最后我们用电子书工具打开 ai 生成的电子书文件,可以看到生成的电子书文件也是没有任何问题的, 所以你看,如果你看到了一个知识博主的视频,就可以用这样的方式,只输入一段提示词,就可以实现视频内容的下载和转录,生成知识笔记和结构图。这就是 cloud 为我们带来的智能体以及智能体的专属操作手册 cloud skill。 那 么今天我就用一期视频来快速带领大家安装并运行起来这个智能体整个过程非常的简单,而且我们还可以避开 cloud 的 严格的地区和网络限制, 哪怕你在中国大陆也一样顺畅使用。今天的视频分为以下几个部分,首先我们来快速的安装 cloud code, 并且使用兼容模型,绕过 cloud 的 账号和地区限制。 然后我们来看一下什么是 cloud skill, 以及如何在 cloud code 中使用 skill。 最后我会带大家浏览一些 astropic 官方发布的 skill 以及一些优质的第三方 skill, 大家完全不需要自己手写 skill, 很多常用的 skill 都是现成的,直接拿来就可以使用。那视频中的知识点和详细流程我都总结成了知识笔记。视频的最后会分享给大家,那我们就正式开始。 首先我们快速安装 cloud code, 第一步就是安装 node js, node js 是 我们的老朋友了,我在我之前的 n 八 n 和 m c p 相关视频中都使用过它。安装方式也很简单, 来到 note g s 官网下载之后,双击安装就可以了。安装完毕后,打开命令行窗口,输入 note 空格横线 v 和 npm 空格横线 v, 查看版本号,能够输出版本号则证明安装成功。 然后我们运行一个命令来安装 cloud code。 这个命令我已经展示在屏幕上了。如果你在这一步的安装过程中遇到了网络问题,那么你可以考虑使用网络加速,或者使用国内的 n p m 中转命令,我也展示在屏幕上了。安装成功之后, cloud code 就 已经在我们电脑上了。但是不要急,我们需要解决 cloud 账号的问题。我们都知道 cloud 对 地区的限制非常的严格,封号也很严重, 仅限欧美地区用户使用。那如果你身处欧美地区,并且能够成功申请 cloud 账户,那你现在只需要直接在命令行中输入 cloud 空格 log in, 然后再打开的浏览器中登录 cloud 账号,就可以使用 cloud code 了。 但如果你所在的地区不被 cloud 支持,那么我们可以使用其他兼容的大模型来解决这个问题。 目前类似智普 g l m deep sec 都推出了兼容 astropix 的 a api。 地址相关的官方文档我已经展示在屏幕中了。 我们在命令行中分别输入屏幕上的这三行命令,这三行命令的意思就是把 cloud code 的 背后所使用的大模型 url 和 api t 替换成智普 g l m 的 大模型。那这样一来,我们就不需要走 cloud 的 官网的登录,就可以直接使用 cloud code 了。 那另一种方法是通过修改本地的配置文件来修改这些环境变量。二指的原理是一样的,我已经把这种方法展示在屏幕上了。 在 cloud 的 全句目录下创建 settings 点 json, 把屏幕上的内容复制过去,把里面的 a p i t 替换成你自己的 a p i t。 a p i t 可以 在智谱的官网找到,然后在你的用户目录下找到点 cloud 的 点 json 文件,添加一个属性叫 has completed onboarding 值设置为处就可以了,大家可以自行修改。那么我们切换为 glm 模型,相比于使用 cloud, opus 四点五有什么优劣 呢?在性能方面, cloud 肯定是编程领域的 number one, 毫无争议,但是呢,它对地区的严格限制以及昂贵的价格是它最大的劣势。所以如果你对 cloud code 的 需求并不是那种产业链级别的需求, 要拿它做商业交付式的编码,那么你是没有必要非要使用 cloud 模型的。尤其是像我刚才展示的下载 youtube 视频并转载知识笔记这种任务,肯定是不需要使用 cloud 的, 类似 glm、 deepsea 这样的大模型足够胜任,并且它们的价格便宜,性价比高,网络和地区限制也非常宽松。所以这个方法目前是解决 cloud 的 地区限制的最好方法。 只有当你要做项目级的商业交付的时候,再去考虑用各种中转方式使用 cloud, 同时你要注意风险。 那么到此,我们的 cloud 的 code 就 安装完毕了。我们来到命令行输入 cloud, 然后回车, cloud 的 code 就 启动起来了,随便输入一个你好就能看到 ai 返回结果,那么就说明成功了。 我这里使用的是 glm 四点六模型,因为有免费额度啊,可以专门用来做视频。呃,目前 glm 最新的版本是四点七,性能非常强,大家根据自己的需求来切换模型就可以了。 那么接下来我们来看一下什么是 skill, 如何在 cloud code 中使用 skill。 我 们打开一个 skill 文件,可以看到它是 markdown 格式的,长得非常像我们平时使用的 ai 提示词,那其实它就是一个包含了详细功能指南的,更专业更详细的提示词, 通用的 ai 智能体,比如 cloud code, 它就像是一个刚大学毕业,智商很高,但是没有实际工作经验的大学生, 那它的技能是靠海量的训练数据。而 skill 就 像是给他写了一本专业级的操作手册,告诉他在遇到这样一个特定任务的时候,应该执行哪些操作。那有了这个手册, ai 就 成了这个领域的专家, 你也可以理解为在游戏中你的法师角色学习了一本技能书,什么暴风雪、火球树这些,那么火球树这本技能书其实就是 skill。 那 么我们来看一下如何使用 skill。 首先我们来到 cloud 的 全局目录,默认地址是 c 盘用户你的用户名点 cloud, 在这个文件夹下创建一个文件夹叫 skills, 全小写。然后在这个文件夹内创建一个文件夹,名字就叫 skill 的 名称,比如 markdown to epub。 很 明显这个 skill 就是 把 markdown 转换成 epub 电子书。 而 skill 文件夹内必须要有一个文件是 skill 点 m d, 其中 skill 这五个字母必须大写, 这个文件是必须的,我在屏幕上展示了一个文件夹结构,那除了 skill 点 m d 之外,还可以有一些资源文件,比如代码模板。 至于对于这个目录结构,大家了解一下就可以了,也不要觉得麻烦,因为就像我视频开头所说的,很多通用的 skill 我 们都可以下载得到,一般不需要自己手写。 我现在的文件夹里就是从 github 上下载了二十多个 skill, 比如 pdf, excel, word, ppt 的 相关 skill, 还有关于头脑风暴和前端设计的 skill。 我 们来简单看一下 skill 文件的内部结构。首先是原数据区,它的作用就是匹配用户的指令 属性, name 和 description 分 别代表 skill 的 名称和描述。 description 就 会被 ai 用于匹配用户指令,如果用户发出的指令与这个 skill 的 description 相匹配,那么 ai 就 会调用这个 skill。 那 只有第一部分,这个元素句式会在你发送指令的时候被 ai 读取, 那后面的内容只有在 skill 被调用后才会录取,是非常节省 token 的。 那接下来第二部分就是具体的指令,指令会告诉 ai 遵循什么样的要求去执行任务,这里的内容可以是具体的步骤,以及调用哪些资源和代码。 那第三部分就是资源区,列出 skill 需要用到的具体文件,比如 python, 代码、文档、数据等等,那这些资源就是我们在刚才的目录结构中放置的那些资源文件。 那么以上就是 skill 的 本质,我们在这里创建了 skill 之后就可以直接使用了。在这个 user 文件夹下的点 cloud 文件夹内创建的 skill 是 全局 skill, 你 也可以在你的项目文件夹中创建点 cloud 文件夹并放置 skill, 层级结构是一样的, 只不过这样的话,这个 skill 就 只作用于当前项目。我们来测试一个 skill, 我 这里有一个叫 frontend design skill, 前端设计啊,是生成网页的,这是一个 cloud 的 官方发布的 skill, 我 们在 cloud 的 code 中输入提示词, 为一家叫 nexus 的 ai 初创公司制作一个网页,风格要求是暗黑风发光渐变毛玻璃特效保存到当前文件夹, 然后回车,科拉的 code 就 开始运行了。这里他识别出了我的命令,然后问我是否要使用 frontend design script, 我 直接输入确定,然后他就开始设计网页了,过程中需要一定的时间,我就把过程进行了加速,那最后他生成了一个 index 点 html 的 网页, 我们把这个网页打开来看看,我们可以看到这个网页的样式设计的其实非常好,非常符合 ai 初创公司的风格。 呃,其实说实话,做视频的时候我都被这个样式惊艳到了,不愧是 cloud 的 官方的 skill。 呃,我之前视频里拿 jimmy 的 canvas 做的网页确实比这个丑多了,那么这样我们就成功执行了一个 skill。 那 么我视频开头展示的用一个提示词,让智能体下载视频字幕提炼总结成知识笔记,在无线画布中画出知识图谱,然后再生成电子书,这个任务大家就可以自己进行尝尝试了。 那视频开头我做展示的时候授予了 cloud 的 完全自主权,而不是每次调用 skill 都征求我的同意,想授予 cloud 的 这个权限,你可以在启动 cloud code 的 时候添加参数。那具体的命令是, cloud 空格横线横线 dangerously 横线 skip 横线 permissions。 但是就像这个命令你的内容一样, dangerously 危险。 cloud 有 了完全自主权就可以随意删除代码和文件了,你要谨慎使用这个命令,那我在视频开头完全是为了做展示才这么做 的。那接下来我为大家展示一些可以直接下载的现成的 skill。 首先就是 cloud 官方发布的 skill, 在 github 上,也就是 app 的 官方 github, 大家可以找到这个仓库。 另外一个我推荐给大家的是一个叫 awesome cloud skill 的 get up 仓库,这里面汇总了很多优质的 skill, 我 之前展示的大部分 skill 都来自于这两个仓库。 另外,如果你是 obsidian 用户, obsidian 的 ceo 最近亲自下场发布了三个 skill, 大家直接搜索 obsidian skill 就 能搜就能找到。 那我的下一期视频就会单独针对 obsidian 的 skill 来为大家讲解如何在 obsidian 中调用 cloud code 并执行 skill 来实现 obsidian 的 aia 任何功能。 那么以上就是今天视频的全部内容,大家现在就可以上手尝试使用 cloud code 和 cloud skill 了。视频内容中的知识笔记可以在我的个人简介和频道信息里找到我的个人主页地址,然后进行下载。大家如果在使用过程中有什么问题,可以在我的个人简介和频道信息里找到我的个人主页地址,然后进行下载。大家如果在使用过程中有什么问题记得点赞关注,谢谢大家!


hello, 欢迎目前在直播间的各位,欢迎大家来到 close skills 七天实战营,本次实战营的活动是由 ai 七九八 lab 主办的,我是新一, 是本次实战营的导师。本次实战营只会有一个目的,就是通过实战带大家从小白变成使用 close skills 的 高手。那我们接下来会有三次的直播课程。 第一次,今天晚上我们带大家去全面认识 close skills 是 什么东西,它能够帮你做什么,以及我们大家需要用 skills 的 时候需要准备什么。 那我们第二次直播会在明天晚上七点半准时开始,我们会用实战教大家怎么用 skills 做 ppt, 我 们会给大家一个比较详细的实操教学,一步步带大家从零到一去做出一个优秀的 skills。 那其实第二节课我们的直播,呃,不仅就是教大家实操,我们更多会教大家从实操里面总结出来的一个方法论,那大家在去面对各种各样的问题的时候,都可以尝试用 skills 去把它解决了。 第三次直播本周四后天晚上的七点半,我们会有个进阶的直播,会教大家去用 skills 搭一个相对来说复杂一点的大师级别的自动化写作的工具。 并且我们在第三次直播会有一个额外的加餐环节,就是我们在本地用 skills 做一个很好的工具, 你觉得说当你解决了很大的痛点之后,怎么把这样的一个工具部署上线,他有可能部署上线之后能够给你带来一些商业化的价值,或者能够去提高你的个人品牌影响力。 所以大家可以先点点关注,我们可以在第三次直播的时候教大家怎么去把一个好的工具部署上线。 ok, 那 我们话不多说,马上开始。首先我们先大白话介绍一下什么是 close skills, 其实非常简单,大家可以想象一下,你是一个公司的老板, ai 就是 一个你招进来的一个名校毕业生,他的 iq 很 高,但是他几乎没有任何的实战经验,他没有任何工作经验,但是在他入职的第一天,你就给他一个非常详细的操作手册工作方法, 那他拿到这样的一个技能包之后,他就能够很好去执行你交给他的任务了。那 class skills 其实就是老板给新的员工这个名校毕业生的一个工作手册,他拿到这个工作手册之后,他就能够很好去完成一切你交给他的任务。那我们先来演示一下 我最近用 skills 做了哪些比较有意思的帮我提效的事情。 ok, 第一个工具是一个数据分析的工具, 我以前做数据分析的时候,经常从数据采集到数据分析,到最后做报表,我可能都需要花三到四个小时才能做出来一个完整的并且看起来比较友好的数据分析报告。但我现在用了这个 skills 做了这个数据分析大师之后, 我其实每次只需要大概等十分钟,他就把这个报告很好做出来了。我们来看一下这个报告长什么样子。这份数据是我以前做的一个社图 app 的 一个数据,比较早之前 那我们能看到他会给出不同视角的一些数据洞察,并且每一个数据的观点他都会附有一个特别友好的可直观的报表,我们通过图表就能很清晰的看得出来这里面的结论包含哪些信息。然后 基于这样的一些数据结论,他还能够给我去提供一些比较好的优化建议。所以这份数据报表其实如果我正常做确实需要花很多时间,但是他给出来这份报表确实给我带来了很大的帮助,并且我根本不需要再去花很多时间重复的去做这样的分析任务了。 如果你工作中涉及到一些数据分析的重复任务,非常建议大家去使用这个 skills, 我 也会把我也会在本次课程的文档里面把这个 skills 放到我们的学习资料里面。我们看到第二个工具是一个长视频的总结, 并且生成口播稿的一个工具。因为我经常需要去 youtube 或者是 b 站去找一些比较长的一些视频,这些视频通常都是讲 ai 或者讲科技的一些前沿理论和知识的。 为什么我需要去看这些视频,是因为我需要去了解一些比较前沿的观点,但我通常来说找这些视频都很长,他们可能都一个小时,两个小时,甚至三个小时,我不可能把他们全都看完,我也不知道哪些视频到底不值得,到底值得看,所以我就拿 skills 帮我搭这个工具, 他帮我去总结了所有我关注的频道最近更新的视频,我们打开其中一个看一下,我们能看到他帮我们提炼的这样的内容,比如说这里面包含哪些核心观点,以及这里面涉及到哪些新的概念, 这新的概念他们怎么我们应该怎么去理解这些新的概念,并且他还抛了一些这个视频里面的一些京剧,所以我通过这样一些信息,我就能很好的去判断 这个视频我值不值得看,以及哪些部分是值得我重点去看的。这个工具其实最有亮点,或者是说帮助我最大的功能是它能够直接帮我去生成口播稿。 当我看到一个很有意思的视频,我希望用口播的形式把它分享出来的时候,我就能够直接拿它帮我生成好,生成好的口播稿直接去录视频。 我之前在社媒上发过一个视频,大概是八十万的播放量,我其实就是用这套流程做出来的,从我的录制到剪辑,整个过程我我只花了不到一个小时。但在以前我可能从看完视频到写稿到我录制 可能是需要花五到六个小时的,所以我的效率其实翻了至少五六倍。 ok, 我 们欢迎新进来的朋友。 大家如果不了解我们当前在讲的东西,我可以先跟大家简单介绍一下。我们这个课程主要就是讲 class skills, 一个 ai 的 工作方法,它能够给个人的效率提升以及一些学习上的一些帮助。那我们是整个课程所有的学习资料都是免费提供的,大家可以通过后台私信直接去索要这个资料 就可以拿到这个资料。我看到公屏区有同学问 ai 是 不是一定要用 mac? 其实不是的,我们这个 cloud skills 它是没有系统限制的,我们如果你是用 windows、 linux 或者是 mac 系统,其实都是可以去使用这个 cloud skills 的。 ok, 我 们再来演示一下我做的第三个工具, 他是一个公众号的一个听读工具,这个工具他的特点是什么?他的特点其实就是,哦,不好意思再来,是吧?我们换一个演示,先跳过刚刚那个工具,后面如果大家感兴趣也可以找我要资料。 那工具的特点其实就是他能够去帮我去总结所有的公众号文章,然后帮我提炼出其中值得阅读的部分, 所以我就不用每天花很多时间在公众号阅读上面了。大家如果想要这个东西,也可以直接在后台私信。第三个这个工具是一个点子收集器, 我们做独立开发或者做互联网,我们经常都需要去找一些新的创意或新的点子,看一下能不能把这个点子做成产品,做成应用去上架,给自己赚取一些收益。 所以我们经常是需要去各种各样的社媒平台上面去看很用户的很多帖子和评论,他们在说什么样的痛点,他们在面临什么样的问题。 传统的方式是一个从业者或者是一个独立开发,他每天需要花可能一到两个小时去搜集这样的信息。 但是我现在完全用 skills 帮我实现了这套收集到分析的过程。我用 skills 这套 skills, 它能帮我做几件事情。第一个是我输一个关键词,它就能够基于这个关键词帮我去一些社媒平台,比如说 reddit, 比如说 twitter, 比如说 tiktok 上面去帮我找一些用户说的话,或者用户发的帖子,他拿到这样的一些数据之后,他就会开始去进行分析, 基于我给他设定的一套框架和方法,去分析这里面存在的一些需求和痛点,然后最终给我输出一份产品点子的研究报告。我们打开其中一个看一下, 这个是我最近分析的一个 ai 化妆应用的一个分析报告。首先这个报告里面他会先给一个结论,就是这里面的真实机会是什么样的, 他会告诉我几个他从数据里面总结出来的一些关键的发现。比如说用户可能真的不是想要你去给他用买手推荐什么商品,而是他希望去真的去了解我为什么需要,我为什么适合这种化妆技术, 以及用户可能在用一些通用 ai 的 时候它面临的一些问题,它这里面还会有一些深度分析。比如说我给他设计一套框架,是你需要去刨根问底,从用户说的话去分析它的表层,它的底层动机是什么。 所以通过这样一套刨根问题,他最后能够给我去总结出一个比较合理的一个分析的结论。他还帮我补足了这里面可能存在的一些商业逻辑,比如说这个增长模式可能是什么样的,他市场规模是什么样的,最终帮我去总结出来一个机会点。 同时他也可能会帮我去总结一些分这个项目可能面临面临的一些风险,让我提前去规避。所以通过这样一份报告,我就能够去知道说这个点子他可以去做的方向有哪些,以及我的切入点可能是什么样的?我最小的一个验证的方法是什么样的? 所以这个工具我最近基本上用去找一些新的产品点子,都是用我自己搭的一个 skills 的 工具,非常方便, ok。 还有第四个也是一个我用起来非常爽的一个 skills 工具, 我经常需要去找英文的原文播课,他们会讲很多 ai 或者是硅谷的一些前沿的理论或者是科技的知识, 但是说我英语比较差,我英语其实没有那么好,所以我没有办法听完全程,真的去总结出来里面有什么亮点。第二个就是一个播客太长了,它跟长视频是一个问题,一个播客可能两个小时,三个小时都都非常常见, 所以我很难去每天有这么多的时间成本去做这件事情。所以用 skills 帮我搭了这个工具,一方面是它能帮我英转中文, 他能够直接帮我去分析出其中的一些章节和亮点,我们打开其中一个看一下, ok, 我 们能看到这里有个总览,这个播客是讲什么的,这下面还拆了这个播客的间分段时间切片,我就能够通过这个时间切片知道说他每个阶段具体是在聊什么东西。 如果我对某个阶段特别感兴趣,我也可以直接点击,点击之后他就会进入到一个时间线的这样的一个页面,并且他会自动帮我去跳转到这个播客对应的位置,我就能去收听这个对应的位置,这个播客对应片段的内容了。 所以不论是你学习还是你去想要通过播客去获取一些钱的知识和理论,我觉得都是一个非常 make sense 的 一种解法,欢迎我们新进来的小伙伴, 大家如果想要去获取我刚说的这些工具,他们的操作文档以及 skills 的 内容的话,我们都可以直接后台私信我们的小助手,会给大家统一去发送。 我看公屏区有同学去问说 cloud skill, cloud 的 不稳定,当心以后被封,我们等一下会讲到稳定使用的方法,这位同学不用着急,我们后面会讲到给大家去提供一个稳定使用的方法, 不会有这样的一个风险。 ok, 我 们介绍完了这几个 skills 的 工具之后,其实我还有一些大杀器没有分享出来,但我想在明天的直播给大家呈现出来,我们用 skills 去帮你从零到一,做一个很好看并且内容质量很高的 ppt。 这样的一套,这样的一套工具怎么去搭?今天我们就先不呈现出来,先留个谜底,我明天再跟大家进行分享,大家也可以点点关注,明天我们可以去详细拆解一下 ppt, skills 到底要怎么去做? ok, 我 们讲完了这么多 skills 的 案例之后,你不知道大家有什么感觉, 你是不是会觉得说 skills 几乎无所不能,它其实能做很多很多的事情,理论上所有的重复性的工作,或者一些困扰你很久的觉得让你很烦恼的工作,其实它都可以用 skills 帮你自动化完成,并且可以帮你很高质量的完成。 那我们用 skills 需要去做哪些必要的准备呢?其非常简单,我们这里只需要三步就可以搞定我们 skills 的 一个初设的配置环境了,第一个我们需要去下载一个 bs code, 第二步我们需要在 b s code 里面去安装一个 cloud code 的 插件。第三步会涉及到刚刚那个同学说的 cloud 可能会被封禁的问题。如果你有稳定的使用 cloud code 的 环境,并且你有 cloud 的 会员,推荐你直接使用 cloud 的 会员 它下面的套餐去进行 skills 的 调用。如果你没有,我们在我们的课程文档里面也给大家非常详细的配置方法了,我们可以打开给大家稍微看一下。从这里安装必要的软件 vs code 以及安装对应的插件,我们在步骤里面都写的非常清晰。 下面我们特别给大家列出了一个部分,如果你没有一个非常稳定的使用 cloud code 的 环境的话, 那就建议大家使用下面这个直连 qq 的 方法,其实也很简单,我们还是正常去下载 vs code 的 以及 vs code 的 里面的 qq 的 插件。但是我们在实际使用模型的时候,我们可以使用国内的国产模型,比如说智普 glm 四点七, 或者是 mini max 的 m 二点一都可以。我们这里其实主要就是以智普的 g l m 四点七为例,大家可以按照我们文档里面的这个操作方式一步一步地去实现。在 在我们的 bs code 里面的 cloud code 也可以使用国产模型去调用 skills, 这是一个非常丝滑的体验, 我之前拷 code 用完的时候,我经常会用这个方式帮我去继续跑一些其他的案例,其实用上用下来的体验也是不会说特别差。 虽然说有条件推荐大家去使用 code, 但是 glm 它在一些任务上的执行它是没有那么糟糕的,它是表现的还可以的,那我们欢迎新进来的小伙伴,小伙伴就是这个摸鱼的北北,提到了 opencode, opencode 确实是一个非常好的神器,但是我们这节课程就不跟大家扩展去介绍这个东西了。 有个小伙伴说 deepsafe 没有办法去访问 youtube 的 api, 对, 这是一个问题,所以非常建议大家不要用 deepsafe, 如果你要用 deepsafe, 你 可能还得去设置一些其他的网络环境, 比较推荐大家去用,比如 codex 或者是 cloud code, 或者是你中间再写一个脚本去做一个特殊的环境,才能去访问 youtube。 后续如果大家遇到一些实际实操过程中的问题,可以在后台私信我们,我们给大家去进行分享。 这位同学问我们说 skills 会分享吗?会的,我们刚刚前面提了很多次,我们本次课程所有的资料, 实操课程以及包括 skills 的 文档,我们都会分享给大家,大家只需要去直接通过后台去私信我们小伙伴去私信就可以了,我们就会直接把这个对应的资料发给大家。有小伙伴问说 glm 能不能达到 opus 的 效果,这个其实是得看任务, 我自己实测下来,其实 opus 就是 call 的, opus 四点五确实是在做连续的复杂任务的时候,它的表现是最好的, 但 glm 它在一些特定任务上,其实它表现也不会说特别糟糕,只是说它们能力上确实存在一些档次上的差距。会有同学问说能不能开发 skills 的 skill 当然没问题,并且其实 call 的 官方它们其实也写了一个官方 skills, 叫 skills creator, 其实用那个 skills 就 能很好地帮你去写出好的 skill。 这在后面的课程里面,我也会帮大家去 去分享我构建 skills 的 方法论和流程,其实只要学会这套方法论,我们去面对所有问题的时候,几乎都可以用 skills 去解决。有一个同学说能不能想知道自己怎么去做一个完整的 skills, 我们在明天的直播里面会跟大家去完整的说一遍零到一我们怎么去实操,从问题出发,怎么去做出一个完整的优质的 skills, 我 们欢迎新进来的小伙伴。好,那我们继续。 ok, 我 们接下来跟大家讲一下 skills 它长什么样子。 就是 skills 能做这么多事情,但实际上它长的是很朴素的,它其实非常简单,它就是个文件夹,文件夹里面最核心的文件就是 skill 点 md 就是 一个非常它的核心文档。大家可以理解为大部分的 skills, 其实只需要这个 skills 的 skill 点 md, 它就能跑起来了。 我我给大家演示一下这个 skill 点 md 它长什么样子,其实就是这样的一个东西,它就是一个操作手册。 目前我展示的这个是帮我去分析 youtube 的 视频的一个 skill 点 md 的 文档,它其实就是规定了一些我的抓取的规则,就是我去抓取这个 youtube 视频的规则以及抓取的步骤,抓取之后我要怎么去处理字幕,怎么去,最后去分析内容, 下面规定了一些我分析之后输出出来的板块,比如说我可能需要一个概要,需要一个嘉宾的介绍,需要一些核心观点,我同时还需要一些概念的解释, 最后全部都分析完之后,他会保存,并且按照我给他设定的流程去输出一个完整的格式化的数据。这样就是其实这个 skills 大家就可以很直观的看到,它本质上就是一个 操作手册。跟你以前去买,比如说你买个电视或者买个遥控器,它可能都会给你一个操作手册,你就一步步知道说,哦这个东西怎么弄,怎么开机,怎么去使用, 其实它本质上就是这样的一个说明书和操作手册。所以这个 skill 的 md 是 这个文件夹里面唯一必要的文件,其他的东西都是可选的,你可以写也可以不写,写的更好。比如说我们拿这个 reference 为例,就是这个参考资料,它其实本质上放的东西都是一些比较偏方法论的, 比如说我们去做一个分析数据的 skills, 那 我们 reference 里面可能放的就是一些大师的一些分析的框架和视角,比如说巴菲特是怎么去看股市的涨跌的,他怎么去分析的,我们可能会在这里面放一个方法论和一些分析的原则,分析的行为。 那当 skills 知道说我现在可能要分析股市和分析当前的一些数据的时候,那我可能就会去调用 reference 里面去详细阅读这个文档,我再去开始进行分析,我分析的时候就可以更细致。 第三个这个脚本工具,其实脚本大家可以理解的就是代码,为什么这里可以直接放代码?这其实也是 skills 它设计的一个非常精妙的一个部分。 skills 相比 prompt 就是 我们提示词, 它不太一样的点就是 skills 里面是可以放很多代码片段的。如果你在 palm 里面去放很多代码片段,放很多脚本的话,你的 palm 会很长,会非常占用你的上下文,其实很不友好的。但 skills 里面是可以这样放很多的脚本工具,然后按需去调用的。 打个比方,如果我们还是拿刚刚那个数据分析生成格式化图标为例子,我刚给大家看一眼,就是这样的图标其实都是脚本给我生成的, 我根本不需要自己去写代码,我只需要脚本就帮我生成好了,而且它因为它的脚本,所以它每次都能输出质量非常稳定的这样的一个图标展示, ok。 第三个是一个模板文件, 这模板文件其实它是一个相对来说我觉得没有那么重要的东西,但是在一些场景下面,它是值得放放一些东西进去的。比如说你的 skills, 你 的目的是为了让 cloud code 帮你去写一个非常符合某一种格式规定的 word 文档,或者是 excel 让他帮你去创建这样的一个文档。那你在这个模板文件的文件夹下面放一个模板,放一个你之前做过的模板塞进去,他每次就知道说, ok, 我 知我需要按照这个模板做出格式一模一样的东西出来, 这样能够非常非常精确地控制你的输出格式。 ok, 我 们欢迎新进来的小伙伴,我们这个课程是 close skills 的 一个实战营,我们会通过一个实战实战三式直播给让大家从一个纯小白变成使用 skills 去帮自己解决问题的一个比较高级的玩家。 那我们这个实战实战营里面涉及到的所有的资料,以及刚刚提及到的所有的 skills 的 文档,都是公益性质的分享给大家。所以大家如果想要这样的一个详细的学习资料,实操文档以及 skills 的 文档的话,大家可以直接通过后台私信的方式去获得。会我们继续讲一下 这个文件夹里面的最后一部。一个部分许可证其实是一个大部分情况下你可能都不太需要用到的一个东西,它本质上来说是一个使用使用声明, 有点像是专利说明书,就比如说你想把这个 skills 共享给别人去使用,你希望别人去使 你,你希望你做出了一个好的 skills 分享给别人,那你完全,那你就需要写一个 license 这样的一个许可证,大家去使用的时候需要依照这个 license, 不 然它就是滥用了,它可能存在一些滥用行为, 但大部分情况下面大家可能都不太会把 skills 去分享出去。 ok, 我 们继续讲下一个部分,就是 skill, 它长成文件夹,它就应该放在文件夹里面,所以它它它它它有两种存放的方式,一种是放在电脑的本地, 我我给大家打开一个文件夹看一下这个文件夹,这个是一个系统级的文件夹,就是在 cloud 文件夹下面的一个系统级的一个放 skills 的 一个文件夹,这里面放的就是一个全局生效的一些 skills。 全区生效的意思就是说,比如说我同时在做多个项目,比如说这个项目是分析数据的,那个项目是帮我做图的,那那个项目是帮我写文章的,这三个项目它都能直接去调用这个全区生效的 skills。 比如说这个全级声效的 skills, 它可能是一些像功能测试这样的东西,或者是前端的 ui 展示这个页面要怎么做的好看,那我就可以放这样的一些通用的 skills 放在本地的文件夹,我所有的项目想用这个 skills 的 时候就可以直接调用。 那还有另外一种存放方式是我们放在一个单独的项目里,放单独项目里的意义就是它可以隔离项目,就比如说在在这个做 ppt 的 项目里面,我专门放了一个生成 ppt 的 一个 skills, 它就非常适合,它就只适合放在这个项目里面,它其实不太适合放在其他项目里,或者它其他项目根本就不需要用到这个 skill, 所以 它只需要放在这个单独的项目里面就可以了。 我看到有小伙伴问说可以在视频号放直播回放吗?我们是可以的,但是我们如果你想更快的获得直播回放,可以通过后台私信的方式,我们应该很快就会发出来。 ok, 我 们继续。 接下来我们讲一下这个文件夹,这个 call skills 它是怎么工作的,其实非常简单,它我们用自然语言去跟 ai 去描述一个我要做什么事情, 然后 ai 就 会开始,它大脑就开始扫描一下它现在有哪些技能包是可以用的,它就去调用跟你的需求,跟你描述这件事情相关的技能包,开始放到它的脑子里面,作为它本次任务的一个记忆,它带着这样的一个手册,它就开始工作了。 这个设计非常好的一个点就是它不太需要去长期去占用你的上下文,它是动态加载的,而且它一次的任务是可以去调用多个 skills 的, 比如说 skills, 我 希望我这次提的任务是帮我分析一下 deepsea 的 最新论文,并生成一个讲解的 ppt。 ok, 那 我这个时候的可用的技能包里面可能就有一个是 去搜索并深度研究论文的一个 skill。 第二个 skill 就是 一个做 ppt 的 skills, 那 这样那这样那这样他一次性可以去调用这两个 skills, 按照这个 skills 编排的步骤帮我去完成这个任务非常灵活, 就相当于说你的 skills 种类越多,你的所你的 skills 覆盖的它能做的事情越多,你每次都可以去组合去帮你完成各种各样的任务,真的非常好。我们欢迎新进来的小伙伴。 有个朋友在公屏区问说,指纹浏览器去登录的 cloud 会不会影响使用 cloud skills 应该是不会的, 但如果你遇到问题的话,可以通过后台私信的方式跟我们提出你目前遇到的问题,我们看怎么帮你解决。有个朋友问说,每个 skill 就是 都是一个单独的文件夹,其实是的, 但是有一个非常好的一个设计机制是如果你想去完成一个任务,比如说这个任务是复杂多步,你是可以把它拆成多个 skills, 然后放在同一个文件夹里面的。 这个我们后面在实际项目的实操过程中,我们会跟大家说这个格式要怎么放会比较好一些。它的层级结构是决定了它的调用逻辑的,所以我们在放的时候是需要有一个有序存放的逻辑在这里面的。有个小伙伴问说大量大型的存量项目分析并输出文档这块有好的实践吗? 这块我们说实话,我自己再去做一些分析的时候,确实是没有太涉及到这种这么大量的分析的。 但是您的目的如果是说想要去做一些规范的驱动开发,我觉得应该是可以的,但是这过程中可能大概率是需要结合一些 i g 的 方式去做的。有个朋友问说是不是通过智普需要去买智普的会员?是的,但是这里非广。为什么推荐智普?是因为 它的成本比较低,大部分同学都可以先用一个比较小的成本开始去测试,所以推荐智普,但是如果你想买 mini max 也是可以的。 有朋友问说怎么用 skills 写作,在我们第三次直播的时候会给你一个满意的答复。我们 skills 其实是它能做到很多的工作流的自动化的,它不只能帮你写作,它还能帮你去生成写作对应的一些插图配图,它甚至能帮你去完成写作之后的自动发布。 所以我们在第三次直播的时候再展开来讲,这位同学可以期待一下。朋友们,欢迎新进来的小伙伴,本次直播是讲 kls 的 整个实战应用的, 我们会有三次直播,今天、明天、后天都是晚上七点半开始,大家如果想要去获得这个直本次实战的全部的学习资料, 实实操的文档以及 skills 的 内容的话,都可以通过后台私信我们会直接发给大家啊,那我们直播继续。那我们怎么去使用 skills? 刚刚前面其实也提到非常简单,我们只需要在 拷扣的里面去输入一个,比如说我们提一个需求,就是帮我去写一篇 deepsea 最新论文的解呃讲解文章,然后发送出去。 只要你这个时候你的项目里面存在对应的 skills, 或者你本地有这样的,就是全区的 skills 的 话,它就开始调用这个 skills 帮你去完成工作,所以它是非常方便的。但它其实有一些进进阶的玩法,比如说我们可以通过一些命令行的方式去直接触发它,我们就不用打字了, 但我觉得其实也不会省太多时间。而且我使用大部分场景下面,其实它都可能用自然语言描述的情况多一些,因为它有些时候可能有一些组合的任务。很多小伙伴刚已经问过了, 很多小伙伴刚已经问过,到底要怎么去写一个好的 skills 呢?其实一开始你甚至都不用写,我们现在有很多的 skills 的 仓库,是可以让你先去发现一些 skills 能够去满足于你日常的一些工作任务的。 比如说我们这里推荐三个比较好的仓库。第一个是 skills 的 cloud 官方的一个仓库,它放在 github 上面, 我们可以看到这个仓库里面它已经有很多的 skills 了,比如说品牌设计,这个帮你去做一些简单的图的, 这个是一个文档的读取分析,这边有一个同学我在回答最后一个问题,我们直播就继续。这个同学说,我刚讲的这三个模型是不都不要钱,而其实他们都一定程度上需要钱,但是他有一些免费额度的, 比如说前面有个同学提到 open code, 它上面比如说 glm 四点七,它其实是免费的,它就可以直接用。如果大家关注过一个编程工具叫 kilo, 就是 亚马逊出的那个 kilo, 其实它也可以去用免费的 cloud code, cloud 的 三点七应该是三点七的一个模型的版本。 对,所以大家其实也是可以通过很多的方法去先低成本去尝试开始 build 自己的一些东西的。 好,我们继续,我们刚刚讲到了这个模型,这 call call skills 的 仓库推荐,我们再回来重新讲一遍。第一个,其实现在我们大家其实已经 不太需要,如果你是一开始想要去试一下 call skills 到底能干嘛?其实我们不用一开始上手就直接去做一个 skills, 其实是可以去体验一下官方发的一些 skills 的。 我刚给大家展示的是这个 github 上面 call 他 们官方做的一个 skills 的 仓库, 我们其实能看到这里面已经很多不同领域的 skills 了,比如说做品牌的,做一些简单插图的读取分析, doc 的 帮你去做的前端设计的 skills 非常推荐,它真的很牛逼,它真的很牛, 它能做的这个前端设计,其实它是比较符合 call 的 它本身的这道设计语言的,如果你想做其他,你得去改一下它的提示词, 还有一些其他的,比如说分析 pdf 的, 做 ppt 的, 但是这个 ppt 的 skill 我 觉得用起来它没有那么好用,它其实限制挺多的,所以我明天会带大家去做一个真正好的 ppt 的 skill。 这个 skill creator 刚有个同学问说能不能做一个帮帮我做 skill 的 skill, 这个其实就是这个东西,大家可以试一下这个工具,我平时其实很多的思路都是他帮我去理清楚的, 我想做一个 skill, 我 可能都会先结合他,他给我一些结构上的思路,之后我再去完善这个结构。第二个就是一个第三方的市场,这个我们就不用去做过多的介绍, 很多的 ai 的 新的形态出来之后,都会有这样的第三方的市场。比如说我这里说的这个,其实我也不是特别推荐使用,其实它比较大的缺点就是这种第三方的平台,它其实是没有这种很 很,怎么说是没有这种很明确的评价体系的,所以你并不知道这个 skill 是 不是真的很好用,你可能下载这个 skill 之后,你去用了一下之后发现其实不好用就会浪费你很多的时间。但是它的好处就是我再回来说一下它的好处, 它的好处其实就是它种类更多,它比官方的库它可能更多,它现在这上面应该已经收入了几万个。第三个,其实这个第三个库里面我用过这个库里面的一些 skills, 我 觉得它质量还挺好的, 所以大家也可以去看一下这个第三方的公益库,它也不需要花钱,它是一个免费公益的一个项目。 ok, 我 们欢迎一下进来的小伙伴。大家再跟大家介绍一遍我们这次的系列课程核心的点就是 通过三次直播的实战,带大家从一个小白到真正去能够比较精通的使用 skills 的 的这样的一个过程。我们本次直播里面涉及到所有的学习资料,实操的文档以及我们的一些 skill 的 文档都会发在我们的群里,大家可以直接通过后台私信去获取。有同学问说,到时候演示一下怎么做 skills。 ok, 没问题,我们明天就会演示 大跟大家说怎么去做 skills, 会把一个实操以及方法论很详细的介绍给大家。接下来我们刚刚讲到说怎么去发现好用的 skills, 那 接下来就是怎么去安装了,安装其实也很简单,因为靠已经很强了,所以你其实可以用它直接去自动自然语言安装, 所以,所以,所以其实安装这个步骤也非常简单。但自然语言安装其实有一个潜在的坑,就是他可能会比较烧 token, 因为他需要先去爬这个链接,看一下这个链接到底是什么东西,他再去帮你,帮你安装到对应的位置,所以他每次都需要去理解一遍,其实这是一个 怎么讲还是一个比较烧透根的事情,大家也可以用一些比较简单的命令,就终端的命令去安装。我们在我们的课程里面已经给大家列出了不论是 mac 还是 windows 系统, 你要怎么去全局安装,或者是指定安装到一个位置,怎么去安装这个 skills 非常简单,就一句指定就搞定的事情。我们今天的直播内容其实就差不多到这里,涉及到所有 skills 有 怎么用,它能帮你做什么,以及 skill 是 什么东西,它怎么去工作的, 它的工作原理是什么,我们都给大家讲的非常清楚了,那就是接下来其就是到我们的答疑时间,大家可以去在公屏区上面 跟我提问,我们预留大概十五分钟到二十分钟时间给大家回答问题,现在大家有什么问题都可以直接说, skill 学会了,还要不要学 nba, 这是个好问题。其实我觉得不论是 skill 还是 nba, 其实它都有可能是 ai 提效的,这样的一个 我们用 ai 的 一个它也有有可能都是一个过渡的阶段,但是 skills 的 好处就是它真的是零基础, 我们不需要去了解很多工作流的搭建的基础,我们不需要去学很多的节点,我们才能去搭一个好的工作流。 skill 基本上就是我们通过一套好的思维,然后通过自然语言的精准描述,就能把一个 skills 给搭建出来了。 它本质上是把人类社会的一些成熟的经验去告诉 ai, 它给你生成一个说明书以及一个操作手册。所以我觉得 skills 它是相对于 nba 来说对新手更友好的,非常建议大家就是用 skills, 但是一些比较注重输出质量以及跨平台调用的任务,我建议大家也可以去探索一下 nba, 其实 nba 可能在这方面的跨平台调用的能力,它是更强的。有一个小伙伴问说,如果有完整的企业资料,可以可不可以让 ai 分 析和操作? 当然可以,但是企业企业部署你需要注意一个问题,我们这里分享其实更多是个人使用,个人属于使用很多数据不敏感,但如果涉及到企业就可能会有些敏感数据,所以比较建议你,如果是企业,你就企业企业的本地服务器部署一个自己的模型,去跑 skills, 去跑这样的流程分析比较好, 这样就不会有数据敏感或者是数据泄露的问题了。因为我们其实所有的 ai 工具都会涉及到一个数据泄露的问题, 不太建议大家把一些私密的数据直接上传到 cloud 这种云端的平台去分析。有小伙伴用说 skills 可不可以用在公司的业务项目上,这个跟刚刚那个其实是一个问题,其实我觉得是可以的,但是大家一定要用本地部署的模型, 不要你可以跑 skills, 本质上是给大模型一个操作手册,但是这个大模型用的到底是 cloud 的 本身的自己的能力,云端去分析,还是你本地部署的一个能力,按照 skills 的 步骤去一步步帮你完成任务,都是可以选择的。所以如果你是企业级的使用, 非常推荐大家一定得本地部署模型,让你的工程师布好一个本地的模型,然后去跑 skills, 然后我看一下进行数据分析时,用 excel 做敏感性的分析,用 markdown 去记录步骤,形成 skill, 如果后续还有相关的需求,可可不可以把直,可不可以直接写对应的代码?当然可以,就是其实本质上 skill 就是 包含代码和一些执行的步骤。 skill 它的它设计上一个非常好的点是在于说普通人呢, 我都不会写代码,不会写脚本,我不会写 python 怎么办呢?那我就只能用短语描述让 ko 的 帮我跑。但其实 ko 的 在处理很多数据的时候,请你仔细打开它的 thinking, 你 打开它的思考过程,你去看,你会发现它调用的还是很多都是它写的脚本。所以如果你有写脚本的能力当然是可以的, 但是 skill 的 好处就是它更平民,就是它根本就不需要你去写脚本写代码。然后我看一下有个 有个同学说感觉把 coco 的 变成一个万能 ai 平台。是的,其实大家不要把 coco 的 当成一个写代码的平台,就是他能做的任务超乎你的想象,就是写作,分析数据,处理文件,然后帮你去,甚至可能帮你就是 当你去做一些其他的很多的任务,它其实都能做的很好,所以大家真的不需要去把 code 做成想,想成一个它是一个只能写代码的平台。 no no no, 它真的能做的事情太多了。然后 glm 四点七和 mini max 哪个适合做主代理?我非常推荐大家用 mini max 二点一, m 二点一,因为我实测下 mini mini max m 二点一它执行长任务的能力要比 gmm gmm 四点七要好, 但有可能我跑的任务不够多,但是我自己使用下的感受就是 mini max 的 开发任务开发能力以及他跑长任务的能力会稍强于 g m g l m 四点七。 而且我其实我个人其实非常喜欢 mini max 这个公司,但我不是踩 g l m 四点七啊,我觉得 mini max 这个公司确实比较厉害,他的很多 ai 的 方向上都能力做的很好。 然后有个同学问说服务器的最低配置要求大部分电脑棋都能跑得起 skills 它是一个不占任何,它不太占任何显存和内存的 本质上就是它就是在跑一张 plm, 然后分布去执行任务。它不太像是你要去玩游戏或者是录一个视频,你需要有很多的宽带占用,不需要调用。 glm 做的 skills 会比 cg 做的效果差很多嘛?我觉得 如果你想用 glm 去做 skills, 希望能够跟 c c 做的效果去持平的话,你的 你给他的提示词上面,你给他传授的经验,你给他规定的框架上面,你可能需要花的功夫会更多一些。因为我用 cloud code 的 ultra thinking 就是 深度思考的这样的一个这样的一个方式 去帮我去思考 skills 的 结构,我觉得他思考其实往往都能给我一些启发。但我用国产模型,我觉得可能他的这方面的这种深入思考能力其实还没有那么强。 然后摸鱼的北北还问说就是 glm 和 mini max 哪个模型干什么更上场, 我觉得不太好评价 glm 和 mini max m 二点一,因为我其实我自己用 glm 跑的任务的数量没有 mini max 跑那么多,可能这两个的关系是一比十吧,我用 mini max 跑的还多很多,所以我没有办法在同一个样本量上跟你比较,但我自己个人确实更倾向 mini max 二, m 二点一, 而且我觉得 mini max m 二点一做前端的能力是 ok 的, 非常非常不错。然后我用了 skill, 还需要学习课时嘛? ctrl ctrl 你 可以把它当成 call code 的 呀,这两个没有办法比较,就是这位同学你提的这个问题,其实是一个概念上的问题,就是 skill 呢,是一个所谓的工作流程方法论, ctrl 呢是一个工具,你用你用这个工具,你其实你在 ctrl 里面也可以,也可以用 ctrl skills 的。 然后 ctrl ctrl 的 话,我建议你直接上手体验你,你都不需要去学习,你就能知道它能帮你做一些什么东西了。 然后怎么部署本地模型?用的模型能力跟 cc 一 样吗?这个这个其实推荐你去了解一个软件,了解一个应用叫欧拉玛, 欧拉玛是一个很好的本地部署模型的一个平台,它里面集成了很多模型,然后我觉得能力跟 cc 是 不是一样,这个点呢,我们其实是需要去实测出来的,有些模型其实大部分的模型呢,它的它的能力是不均衡的,它长板可能很长,它短板可能很短。 cloud code 的 好的点, cloud 模型好的点是在于说它很多的能很多,它很多不同方向上的能力都在平,都在水准线以上,并且是比较前沿的,比较 top 的 能力。所以 我觉得如果你没有太多测的时间成本的话,你可能是需要本地部署一些比较好用的模型,但如果你能够有一些资源,能够去跑不同模型的测试的话,非常建议你还是测过之后才能知道说哪个任务用哪个模型更好,所以这个其实没有办法直接跟你说哪个模型的能力是最好的。 然后有个同学说最近在学习 opstine 和 skills 的 结合非常好,就是这个不用取舍。 opstine 是 非常好的一个应用,就是虽然我我我我我最近这段时间用的比较少, 但是 opstine 真的 是特别好,就是它非常适合结合 skills 去搭你的很多个人知识库。之后我也会分享一下我搭个人知识库的一个流程,但我可能不是用 opstine 搭的。 然后我觉得不用取舍,就是 office 点你要用,然后 office 点, office 点里面他们也就是我,他们最近也支持 skills 的, 而且他们已经开源了他们自自己的 skills 了,所以我非常建议你继续使用 office 点 好。这同学说,为什么飞书的文档变了,之前的操作步骤都没了?没有没有删除呀?有问题的话我们我们可以,你可以私信里面跟我们的小助手说是哪里的,哪里的内容消失了,我们可以,我们我们我们等一下回滚一下应该就可以了。 ok。 然后,呃,我们一个个来就是直播回放,哪里可以观看?我们直播回放应该全平台都会发布, 所以如果你当前在哪个平台的话,你就可以直接在这个平台看就可以。然后有个同学问说用的国内模型接口数据也会出境到 ko 的 吗?当然不会,就是 你可以这么想吗?就是国内模型的话,他的数据如果你是,如果你是在本地跑一遍,他是不会上传到云端的, 所以他不会,他不会有任何泄露的风险。然后还有人问说怎么做出海的网页产品推荐这位同学先看一下我们之前的上一期的实战营,十四天的实战营之前也有完整的回放,我们那个时候介绍了详细的 ai 工具, ai 出海工具的一个 从零到一,发布上线,然后做商业化,做用户增长的整套的流程的实操的视频。大家你可以先去回看一下这个,然后如果不知道在哪的话,可以后台私信。 能不能做一个 pdf 转 macd 的 工具,当然可以,就是不需要接别的 api, 就是 首先第一个就是可能有一个信息差,就是你要知道大部分这种 pdf 转 md 的 工具已经有很多开源项目可以直接帮你做,帮你做好了,所以 其实非常简单,你甚至都不用写代码,你就让 call code 帮你去找这样的开源项目,然后做到 skills 里面,你跟他说,第一步读取我的,读取我哪里哪里的 pdf, 指定一个文件夹。然后第二步跟他说步骤二是用这个,用这个开源工具帮我把 t pdf 转化成 markdown, 就 就可以完成你的任务了。这个这个 skills 非常简单。然后有个同学说, cc 怎么开发自己属于自己的 demo 和应用 啊? cc 本质上就是一个写应用的,一个他最开始出名就是他代码能力非常强,所以 cc 怎么去写自己的 demo 和应用?这个这个同学你可以去,我比较建议你先去, 我想想,如果你,如果你脑海里面已经有个 idea, 你 想把这个 demo 做出来的话,你就不要想,你就直接干,你就去打开 coco 的, 然后去描述说我想做一个什么什么什么东西, 然后他就开始帮你开发。那这个过程中呢?你可能会遇到一些问题,比如说你发现说 ai 根本没有办法去玩玩,就是他的,他没有办法去非常完美的把你的需求做出来,把你想要的样子做出来。那你这个时候就需要去优化一些方法论了,比如说你得先用刻薄的帮你写一个 非常明确的需求文档,然后再让它基于这个需求文档做开发计划,最后再去开发,那这个其实就涉及到一套方法论。我想想我,我们现在在我们的社交平台上,我们也发布了 cloud code 的 整个使用教程, 你在 b 站应该能找到我们 cloud code 的 系列教程。这里面的我记得是第第五课,我们讲了怎么跟 cloud 讲好你的需求,那个环节就能很清晰的跟你说怎么去写好一个需求文档,你可以直接去看之前的视频,然后那个那个系列我们也会持续更新, 那个系列我们也会持续更新,你可以去 follow 一下,然后这个同学说怎么去读取网页的内容,需要登录的内容,这个这个其实在今天这次直播里面有点超纲,但是我,我可以在公屏区跟你说一下,就是怎么怎么去读。 首先如果你是微信,你可能能够去找一些比较好的一些,你首先如果你要去找一些比较好的第三方的服务,比如说, 比如说,比如说,比如说有一个服务叫做 v two rss, 然后这个这个工具呢,它能帮你去它这个工具,它能帮你去获得微信公众号的 rss 地址, 最后去帮你去拿到这个原始地址之后,它就它就能够去帮你去爬取这个。然后如果你是,如果你是比如说 youtube 这样的一些网站的话,它应该也有对应的一些方法, 比如说 youtube 上 tapp 上面有一些开源项目,它是能够帮你直接获获得到 youtube 的 原始的链接的,然后通过这个原始链接呢?你能通过一些第三方的 a p i 去帮你提取出对应的字幕稿,就是看你的具体需求是什么, 但是 skills 怎么去读?读取网页内容?我非常建议你不要自己直接手,不要自己直接手写代码,就是建议你的方的实际方式是先用 ko, 先让 ko 的 帮你去找那些 用,先让客户帮你去找那些本身已经存在这个能力的一些开源项目, github 上面有大量这种项目,然后让他帮你去把这个项目接进来,帮你去执行好那个步骤就可以了。然后 skills 做 rpa 嘛,我觉得 ipa 其实是 我觉得本质上 skills 它解决的问题跟 rpa 是 有点像的,但是它可能跟 rpa 不 太一样。就是我,我意思是它解决的一些,比如说它实际技术实现的底层逻辑,或者它实现方案可能跟那个 skill 不 太一样,就是它们两不太一样。 然后有同学问说 minimax 会员多少钱?这个你直接搜就行了。就是我,我这里如果直接说会员多少钱,就非常涉及广告。然后 anti grippity, 就是 anti grippity, 就是 那个 google 的 反重力怎么样?这个这个 google 反重力非常好, 但他的问题就是在于说他的网络条件非常严苛,你需要有稳定的地址,你需要有稳定的 ip, 所以 我们这里不太好直接跟大家说他到底好不好,我自己用下来体验是不错的,但是他的问题是他使用门槛跟 cloud 的 不相上下。然后有个同学说 目前有一个类似于 open skills 的, 感觉有很多 class skills 的 能力,好像可以在科室里面直接用,其实科室里面你也可以直接用 class skills 的, 因为 class skills 它基本上所有这种主流的 ide 就是 我们说的 ai 编程工具, 他们都支持直接去使用 skills 了。比如刚那个同学提的 open code, 包括 codex 就是 gpt 他 们自己的代码模型,其实他们也支持 skill 这样的一个框架了。然后请问老师是有,有什么有用到什么知识库? 看到用 bs code 和 skills 有 什么好的建议?嗯?你这说的是什么意思?就是你说的是知识库的剪辑吗?类似 r ig 这样的东西吗? 这个问题就是木子同学你提的这个问题我有点看不懂。如果你如果你想要去把,想要去获得这个问题的答案,也欢迎在后台私信我们,我们我们再解答一下。 不好意思,我确实有点这个子课我有点看不懂。然后 dues 可以 把设为某个账号的数据吗?当然可以,就是 逻辑上来说,只要代码能做的事情 use 都能做,所以,所以他其实是能扒的。但是我们在这里就不讲实际的操作方法了,我们其实这个同学你可以自己探索一下,有些项目他也可以直接扒,所以我们差不多问题就到这里,大家还有什么问题吗? 我们再给大家最后一分钟的时间,有什么问题可以尽快问,然后最后再跟大家说一遍。就我们本次的实战营不会有任何的收费,就是我们所有的这过程中涉及到的学习的文档 资料,以及我们的 skills 的 内容都是免费分享给大家的,大家可以直接后台私信获取。对,就是这个同学说了,就是确实我们的科室已经官方支持了,没错,但我最近用科室比较少,所以我我确实不知道科室官方支持了 skills 如何复刻别人的网站,可以让他自己去学习复刻吗?你这个想法有点危险,就是原原则上是可以的,就是他可以做到像像素级的复刻别人的网站的功能 ui 设计, 但是我觉得我觉得这是一个不太好的事情,就是复刻会导致这个市场生态崩掉, 因为现在我们其实不即使不复刻,你看到别人的一个想法,然后你就去直接去复刻出来,然后 u i 长的也也一模一样的话, 其实是一个让这个让这个市场出现很多的同类型的产品,其实这个市场会变得很差,所以我比较建议你用 skills 去研究别人的网站,然后去提取他这个网站的亮点,他设计亮点是什么?他的功能亮点是什么?但不太建议,不太建议你直接复刻 我,我只能告诉你可以做到,但是我不会说方法。对,就这样。好,我们最后再给大家三十秒的时间,都非常的谢谢大家的支持。我能看到公屏区有同学送礼点赞, 非常谢谢大家。就是我们直播还是存在一些问题,比如我们刚刚突然断流了,比如我有些时候有点啰嗦,但是非常谢谢大家还能这么长时间把这个直播看完。


大家好,我上一条讲风沫的视频爆了,回复超级多。首先先谢谢大家,但是我发现评论区里有好多小伙伴有一个天大的误区,他们一直没用上 cc, 竟然是以为国内用不了,我用的可都一直是国产模型。 来,我给大家看一下我的 cc 是 怎么用的,我目前接了智普、 kimi、 迷你 max, 还有朋友给我共享的四零九零双卡, 我每次启动的时候会选一个供应商,而且一般我会开多个窗口同时用,有时候用相同的,有时候用不同的, 所以你看,我从来没有在 cloud code 里用过 ontropix, 自家的 cloud 模型一次都没有。那我今天就教大家一个方法吧, 怎么样配置 cc, 使用国产模型,怎么样切换模型?虽然有很多工具啊,但是工具都有一些学习成本,我们不应该花那么多时间来学工具,而是要学会怎么样能用 ai 来解决一切问题。所以今天我就教大家就是用 ai 做个脚本,在启动的时候选择。 我们来看一下。首先你得知道两件事,一个是 c c 的 模型供应商和环境变量的关系,还有一个是它的 api 格式。我们先看第一个 c c 配置模型的供应商是通过这四个环境变量操作的, 你可以给它设不同的值, base url 就是 你的 api key, model 就是 你要用的模型, 这个可以不设,不设的时候有的供应商他就会给你用一个小模型,我是一般习惯把这个变量设成跟他模型一样,这样就始终保持用一个模型,基本上就是你把这四个黄金变量填好之后,启动 cc, 他 就会改改变。对, 还有一个关键就是说这世界上 ai 供应商都提供了三种的格式,一种是 chat completion api, 这有大部分的供应商都有,但是 c c 用不了 responses api 呢?这是 open ai 最新的,但是大部分供应商也不支持 c c 也不用 c c 用的都是 iso 自家的格式,现在一般提供 coding plan 的 厂商都会有这个格式,所以,但你设置的时候不要设错了,不能设成这个了,所以你需要去看一下 它是怎么样,但是我觉得我们都不需要这么麻烦,不需要去调查文档来看一下很简单,就你把这个脚本扔给 dbc, 让它去打开它网页调查或和深度思考,让它自己去查就行了,它会给你生成一个脚本。 我这条 prompt 就是 windows 的 或者 mac 的, 它都会给你生成,然后你复制,复制到你的目录就行了。 哪个目录呢? windows 下在这个目录, mac 下在这个目录,这个就是你们自己需要去看一下。 注意一注意一点,就是 windows 下 c c 点 bat 这个文件,你千万不要用 unico 的, 否则会乱码哦。我,我的 prompt 里头要求写的是英文,可能也不会,但是我建议把它改成 a n s i, 然后你用那个 notepad 打开之后选择另存,然后选那个全部文件,当然把编码格式改成 a n s i 就 行了, 然后 mac 就 无所谓,就是这个目录。还有一个很重要的事,这个是好多朋友可能会因为这个原因导致它一直用不上 cc 或者产生误解,因为 cc 在 第一次启动的时候,它会强制要求你登录 cloud 的 账号, 但是实际上我们配置的是完全不应该有这一步的,这个就是因为这个 cloud layer json 这个文件里这个东西没设置好, 你把它设置好了之后,它再也不会弹出那个登录提示了,所以好多朋友不知道这个它就它就误解了,但是实际上我们稍微把它跳过了 cc, 就 可以用本地模型了。 最后呢,友情提示,你入门 ai 的 时候, cloud code 是 一个很不错的选择,但是一定要记住,一定要有一个国产的或者开源的平替,省得哪天他用不了了你就哭吧。 好吧,国产的 kimi code, queen code, 开源的 open code, 这些都是不错的选择,多条路总没错吧。以上就是本期的所有内容了,谢谢大家!

朋友们用 cloud skills 做出来的前端页面真的很好看,这是我花十分钟做了三个页面,第一个,写作工具。 第二个, ai 简历助手。 第三个, cloud skills 社区, 不用画设计稿,不用写一行代码。接下来告诉你我怎么用同一套 skills 做出不同风格的高质量前端页面。这个 skill 是 在两个神级 skill 的 基础上改造出来的。 第一个神级 skill 叫 flow and design, 它是 called 官方出品的 skill, 它的特点是没有 ai 位,创造力比较强。第二个 skill 叫 ui ux pro max, 它是 github 上的一个神级开源 skill, 它提供了一套规范的 ui 库,让你可以精准复刻某个产品的 ui 规范。 在这样的基础上,我改造出了这个 skill, 它同时具备设计的创造力,还能精准的贴合我要求的 ui 规范。我们先来看一下这个 skill 的 架构。首先有一个主控 skill, 它通过和我对话,理解我的需求,然后判断对应的设计场景,最后再确定调用的方案。 调用方案确定后,执行层的 skill 就 会开始工作。接下来我们看一下完整的工作流程。第一步, ai 会向用户了解设计需求。第二步,主控 skill 会基于需求判断设计场景和确定最终的设计路线。 如果用户想做一个风格独特的网站,但它的规范性没有要求,我们就走路线。一、纯创意的方式把这个网站做出来。 如果用户强调规范性,但他不太在意设计感,那我们就走路线。二,纯参考,但用 u i u x pro max 的 数据库找到一个案例,把它复刻出来。 如果用户既需要有风格,又需要有规范性,那我们就走路线三,先通过 u i u x pro max 提供参考的规范,然后 form and design, 再去主导整个设计语言,给出最终的规范。库数量有限,所以我做了一个 u i u x pro max 提取的 skill, 它的工作方式是输入一个 url, 它就调用 playwrite 进行页面的捕获,同时拿到网站的截图和 css 代码。 拿到代码的截图后,它就会开始进行分析,分析完成后会在 url 叉 pro max 数据库里面新增一条规范,然后把对应的参数全都填进去,这样我们就能快速复刻某个网站的设计规范。有了这套 skill 后,想做出好看有品味的前端页面真的太简单了。 今天的分享就到这里了,你还想用 close skill 帮你解决什么问题?欢迎在评论区跟我留言,我们下期继续。

如何在 obsidian 中使用 cloud skill 实现一个 ai 智能体? obsidian 的 ceo stefan 最近发布的三个 skill, 你 用上了吗? 我先来做个展示,如何用一句话让智能体下载 youtube 视频,并总结视频内容,刊写知识笔记,然后在无线画布中画出知识结构图。在 obsidian 界面中,我向 ai 发送了一个 youtube 视频链接,这个视频是油管著名博主单口大神的一条视频, 我让 ai 帮我下载这个视频的文案内容,然后提取视频的核心知识点,并刊写一篇带有 obsidian 专属于法的 macdonald 知识笔记, 然后根据视频的知识内容,在一幅无线画布上画出知识结构图。 ai 在 接收到指令后,先调用了 youtube transcript 这个视频,转录 skill, 下载了视频文案, 然后调用了 obsidian markdown 这个 skill, 拣写了一篇 obsidian 知识笔记,然后调用 jason combs 这个 skill 在 无线画布上画出了视频的知识加固图。后面的两个 skill, 也就是 obsidian markdown 和 jason combs, 就是 obsidian 的 ceo stefan 最近发布的三个 skill 中的两个。 我们来看一下生成的内容。首先是 obsidian 知识笔记,可以看到知识笔记带有详细的元素句区,并且含有 obsidian 专属的 callout 语法。 我们打开当前笔记的关系图谱,就能看到笔记中的双向链接。然后我们来看一下 ai 绘制的无线画布, 可以看到视频的知识架构被清晰的整理到了无限画布中,甚至还带有原视频的链接。那有了这样的智能体能,为我们省下很多重复性劳动,让我们能够专注在学习和思考上。 今天我就用一个视频教会大家这个智能体的实现步骤,整个流程非常简单,具体步骤和相关知识点还有提示词我都整理成了知识笔记,最后会分享给大家。 首先我们来快速安装一下相关的环境。首先是 cloud code, 关于 cloud code 和 cloud skill 这部分内容在我的上一期视频中已经讲得很详细了。如果你还不知道 cloud skill 和 cloud code, 我 强烈建议大家回看我的上一期视频。那么这里我就快速的过一下安装流程。 我们先安装 windows, 直接去官网下载,然后双击安装即可。打开命令行,通过一行命令来安装。卡洛克,如果你在这一步有网络问题,可以使用网络加速,或者使用国内的 npm 镜像。具体的做法是在命令行后面添加额外的参数, 具体的命令我也展示在屏幕上。安装完成之后,我们要把 cloud 的 ai 替换成兼容模型,因为 cloud 对 网络和地区的限制非常严格,且价格较贵。 目前国内的 ai 比如 deepsea、 智普 glm 都支持了 ospec 的 api 接口。相关的官方文档我已经展示在屏幕上。 我们在命令行中分别输入这三行命令,来把 cloud code 的 ai 接口替换成智普 glm, 然后重启命令行,输入 cloud, 然后回车, cloud code 就 运行起来了。那么到此 cloud code 就 安装完毕了。 接下来我们来配置 obsidian, 这里我们需要安装一个插件,名字叫 cloud 点,是专门为 obsidian 适配 cloud code 的 插件,目前这个插件还没有正式发布到第三方市场中, 我们在 github 上找到 clouding 的 仓库,在 reedme 中能看到安装方法。我们手动下载三个文件,分别是 main 点 js, mainfast 点 json, 还有 style 点 css, 然后来到 obsidian 仓库所在的文件夹,在点 obsidian 文件夹中找到 plug ins 文件夹,然后在 plug ins 文件夹下创建一个叫 clouding 的 文件夹, 并且把刚才下载的三个文件放进去。然后我们打开 obsidian, 在 第三方插件界面把 cloudian 这个插件的开关打开, 然后来到设置界面,插件的设置界面有一些基础设置,比如 cloud 应该如何称呼你,这里我填 jason。 然后我们把滚动条拉到最下面,找到自定义变量,这里我们需要设置三个变量, 分别是 ai 的 u, r, l, a, p, i, t 和模型名称,那这里我们依然使用智普 g l l 模型,那你也可以使用 deep six 模型,那具体的参数我已经展示在屏幕上了。 设置完毕后,重启 off c 点,然后在键盘上按下 ctrl 加 p, 打开命令面板,输入 cloud 点,选择 open chat view 来打开 cloud 点的 ai 对 话窗口,在对话窗口中输入一个你好能看到 ai 返回结果,说明配置成功, 那么到此我们就完成了环境的配置。那接下来我们要把相关的 skill 放置进来。首先就是 obsidian ceo 发布的三个 skill, 我 们来到 github 搜索 obsidian skills, 找到 cappano 这个人的仓库,点进来,我们看到说明文档中已经说得很详细了,一共 seven skill, 分 别是 obsidian markdown, 用来拷写含有 obsidian 专有语法的 markdown 知识笔记。第二个是 jason canvas, 是 用来让 ai 帮你绘制无线画布 canvas 的 skill。 第三个是 obsidian basis, 是 让 ai 来帮你创建 obsidian 数据库用的。我们点击右上角绿色的 code 按钮,把整个仓库以 zip 压缩包的形式下载下来, 解压缩之后,把 skills 这个文件夹复制出来,然后来到我们的 obsidian 仓库所在的文件夹,找到点 cloud 这个文件夹,进入之后把刚才复制的 skills 文件夹拷贝进来,那么现在我们的 obsidian 就 已经有这三个 skill 了。 我们回到 abc 界面,在 abc 插件的 ai 对 话窗口输入斜杠 skills, 然后回车 ai 如果能够列出它所拥有的 skills, 那 么我们的整个流程就实现完成了。我的 ai 之所以有这么多的 skills, 是 因为我在 cloud code 的 全句目录下放了很多 skills, 大家可以回看我上一期讲 cloud skill 的 视频, 那么现在我们就可以让智能体来调用 skill 帮我们完成任务了。首先我让他用无线画布 canvas 来画出有关地中海饮食的知识结构图,并把生成的无线画布文件保存到 opposite 仓库的根部部。 我们可以看到 ai 在 接收到指令后,马上选择使用 jason canvas 这个 skill, 经过一段时间的思考之后,画出了知识库的根目录中。我们点开这个无线画布来看一下, 可以看到 ai 画出了地中海饮食的知识框架,并使用不同的颜色模块进行了分组。那么到此我们就成功在 office 界面中调用 cloud skill 来实现智能体功能了。 如果你想要为自己的智能体安装更多的 skill, 可以 到 github 上搜索相关仓库,比如 awesome cloud skill 这个仓库,以及 ospec 官方 github 仓库相关内容大家可以回看我们上一期视频。 这里我想额外说一个问题, stefan 发布的这三个 skill 是 全英文的,如果你向 ai 发送中文指令, 大模型在匹配的时候不一定每次都能精准地认识到应该使用哪个 skill, 那 解决的办法也有很多,你可以在提示词中明确要求它使用某一个 skill, 也可以来到 clouding 插件设置界面中的系统提示词选项, 在系统提示词中,要求 ai 在 接受到用户指令后,优先思考应该使用哪个 skill。 那 这样一来,你的 ai 有 了 skill 的 加持,就能变得更加智能,对特定任务也会完成的更加精确。对于 obsidian 的 ceo stefan 发布的这三个 skill, 我 个人认为更多的是代表官方的态度。 dolphin 他 没有发布在 obsidian 官方的 github 上,而是发布在了自己的 github 账号上。可以看到 minimo 这个外观主题也是在他的这个账号上发布的,因为他是这个主题的作者嘛。至于他之前接受采访中所传达的理念,可以说是知心合一的。 之前的采访中他说过,出于隐私等因素, obsidian 对 于发布官方 ai agent 的 持谨慎态度,这一点是不同于 notion 的。 由于 obsidian 的 文件隐私性,他鼓励用户自己去决定以什么样的方式使用 ai。 也就是说,你如果想要 ai 智能体,就自己手搓一个,而如今他自己亲自下场,带头手搓 agent skill, 并且发布在他自己的推特和 github 账号上,而不是官方账号, 这就非常符合他之前所传达的观点。 obsidian 不 像 notion 那 样环境是封闭的,限制那么多, obsidian 的 文件完全本地化,完全掌握在你自己手里,大家可以根据自己的需求,灵活地通过各种方式使用 ai。 那么今天的视频内容就到这了,大家现在就可以上手把 stefan 发布的 thank you 用起来了。视频中的内容和知识点我都整理成了知识笔记,大家可以在我的主页或频道信息中找到我的个人主页地址来下载资料,有任何问题都可以在评论区中给我留言,记得点赞关注,谢谢大家!

open code 这个开源项目最近很多人都在聊,说是 cloud code 的 平替功能呢,和 cloud code 也是一模一样的,所有模型都能用,但是对于我们普通人来说,我们要怎么用? 网上评测我看了不少,但是我还没有看到有人用它完整的演示一遍开发流程,所以今天我来做这个事情。 我会用一套平时我在 cloud code 上使用的开发流程,结合 open code 从零开始开发一个服装电商的模特换衣应用,带你走一遍完整的流程,顺便也测试一下它和 cloud code 到底有什么区别。那我们现在开始 这套方法我之前已经分享过两次了,就是这一期和这一期。现在呢,我把它迭代到了三点零版本。整体流程是这样的,首先用毒蛇产品经理技能收集需求,他会通过追问来完善细节, 然后生成产品文档。接着用 ui 提示词,设计师技能根据文档生成原形图的提示词,然后把提示词丢给 nano banana 生成原形图,再用 google ai studio builder 来开发前端,最后用全站开发工程师技能完成后端的开发和后续迭代。 整个流程是由一个主控的项目规则文件 agent 点 md 来进行统一的调度。这个场景包含了需求收集、原型设计、前端开发、后端改造、功能迭代,基本囊括了日常开发的主要环节, 所以用它来测试,基本可以很好地展示 opencode 的 完整的开发流程。打开 opencode 官网,点进下载页面, opencode 有 四种使用方式,在终端里使用,客户端使用、安装 ide 插件或者集成到 github 这类平台。 我们今天讲的是第一种直接在终端里使用, mac 用户建议安装第一条命令, windows 用户建议用第二条。那我是 mac, 所以 复制第一条命令,按 command 加空格,输入 terminal, 打开终端,把命令贴进去,回车直行, 然后等待它安装完成就行了。这里可能会有一点慢,那就看你网速了。好, open code 我 们已经安装完成了,接下来我知道很多新手看不惯终端的命令行,所以我们就在 cursor 里面启动 open code, 应该会对你友好一些。打开 cursor, 在 terminal 里输入 open code 启动, 启动之后有个快捷键,你一定要记住 ctrl 加 p, 按下去会列出所有的命令。大部分命令可以在之后慢慢熟悉,但有一个现在你就要知道,就是 a 键下面的 switch model 切换模型使用后你会发现有很多模型可以选, 像 chatgbt, 五点二, gmail 三 pro, mini max 这些都有,带有 free 标记的,是免费的。其他那些常用的模型需要你自己去配 api, 想用别家的服务,可以按 ctrl 加 a 添加供应商那支持的还是挺多的。配置也很简单, 比如你想用 google 的 api, 那 就选 google, 然后把 gmail 的 api key 贴进去就可以了。接下来我们来开始配置,这个逻辑和 cloud code 是 一样的, cloud code 的 系统文件夹是点 cloud, 那 open code 这边就是点 open code, 然后这是我提前准备的技能文件, ctrl c 复制,回到 open code, 在 点 open code 的 这个系统文件夹下, ctrl v 粘贴,这样就一次性导入成功了。一共三个技能, 独设产品经理、 ui 提示词设计师,还有全站开发技能。接下来是导入项目规则,在 cloud code 里,顶层的项目规则文件叫 cloud 点 md, 那 我们这次用的是 open code, 它的项目规则文件要写成 agents 点 md 文件名不同,但思路是一样的,都是顶层的项目规则。 回到 open code, 把点 open code 的 这个文件夹收起来,然后 ctrl v 粘贴,这样项目规则就导入了。 注意看 agents 点 md 这个文件和点 open code 这个文件是在同一层级的,这点跟 cloud code 不 太一样。 在 cloud code 里, cloud 点 md 是 放在点 cloud 的 这个系统文件夹里面的,这个很重要,放错的话顶层规则就不会被加载。再来看一下文件结构,这是整套开发流程用到的技能文件,是我平时开发应用和小工具时用到的,当时用的是 cloud code, 所以 cloud 点 md 这个名字没改。 不过没关系, open code 完全兼容,能自动识别好技能和项目规则我们都已经导入完成了,接下来我们来走一遍完整的开发流程,用 open code 来开发辅助电商用的模特换装应用,启动主 agent。 这套开发流程分为几个阶段,每个阶段都有对应的指令 输入 slash help, open code 会列出所有的指令,包含从需求收集、生成原型图、提示词到开发和本地运行的全过程。 接下来我告诉他开发一个网页应用,帮助服装电商生成模特图,支持更换模特的姿势动作,调整服装的配色,还能更换新的搭配方案。声控模型用 gemma 三 pro image preview, 也就是 nano banana pro。 收到需求后,毒蛇产品经理的技能被自动调用了,然后开始针对需求进行追问,上来就说,别给我废话,让我选一个核心,那毒蛇味已经出来了, gbt 五点二骂起人来也是不留情面。 我告诉他,目标用户是独立设计师,功能范围需要支持声图姿势调整、配色搭配和编辑功能。确认没问题后让他继续。 那进入到第二轮追问,他问参考图是什么形态,这是个多选项。那我的设想是,上传的参考图可以是模特的人像照服装平铺图,或者是搭配平铺图, 控制方式可以用 prompt 文字指令,也可以从姿势预选库里面进行挑选,同时还要支持配色面板调色。确认没问题的话我们继续。 好。现在进入到第三轮的追问,问的是账号和付费模式,这个工具是我个人用的,所以不需要付费功能。那存储方面,现在是 mvp 阶段,主要是为了快速演示,暂时不考虑保存,先跳过 确认没问题的话让他继续。好。接下来是第四轮的追问,人脸一致性怎么处理?我的想法是核心需求是保留参考模特的脸部特征,成片的标准是多选, 一个是白底电商主图,一个是澎湃的质感效果。确认继续后,这个时候他已经收集到了足够的信息,开始直接编辑产品需求文档了。 好!运行结束后,他帮我们创建了两个文件,产品需求文档, product spec, 还有变更记录 product spec change log。 先看产品需求文档,因为我们的需求比较简单,生图工具和布局交互也都比较常规,所以他没有问太多交互和布局的细节。 那再看一下圈子 log, 现在是项目的初试阶段,变更记录里也只有一条初试记录,接下来我们有两个选择,直接开始开发,或者根据产品需求文档去生成 ui 原形图的提示词。 原形图提示词是可选的,但我觉得这一步能大大的提升最终效果。正好给大家演示一下输入指令 ui, 让它使用 ui 提示词设计师技能,生成圆形图提示词 好,完成了,提示词保存在了 ui prompt 这个文件里。那我们打开看一下,这就是生成的页面原形图。提示词用法也很简单,直接把提示词复制发给 nano banana pro, 生成产品原型就可以。 目前一共生成了三个页面,主页面、图片预览页面,还有报错页面。接下来我还要做一件事情,这套流程有两种用法, 第一种呢,是生成好原型图后,直接把图发给他,让他在 open code 里面进行开发。那第二种呢,是用 google a s studio 里面的 build 来开发,本期我就会演示第二种,这种方法对新手或者是刚刚接触外部抠钉的人来说,更容易上手,效果也更好。 我告诉他,你先别管 apikey 的 事,我会用 google a s studio 开发前端,开发好了之后,我会把代码发给你,你再帮我改造成前后端分离的项目。 他已经明白接下来要做什么,怎么配合我们,而且还直接给了建议,比如用 google a s studio 开发的话,回来时需要教给他哪些内容,或者开发好了之后让 open code 继续迭代,需要提供哪些信息和资料好。原型图我已经提前生成好了, 现在这个页面是 google a s studio 模型,选的是 nano banana pro。 我 做的事情很简单,把刚才生成的三个页面的提示词完整的贴进去, 顶部加一句话,帮我生成一个三宫格竖向排列的长图,这是一套电商模特试装的网页应用,然后他就开始帮我生成原形图了。 那我们放大看一下,这三张图基本上是按照我们的需求文档里的布局和功能描述生成的,当然后面开发的时候, ai 会拿这个图作为参考,并不会完全的百分百复刻,所以这一点你要注意。为什么要用 ui 提示词来生成原形图?主要呢有几点核心考虑, 第一是速度快,外部口令不需要一开始就追求完美,先把架构快速的搭起来,然后后面再慢慢的迭代 ui 和交互。 第二呢是为了好看,如果你不给 ai 参考图,光靠文字描述让它开发出来的页面通常都很丑,不管你提示词写的多好,在我看来都丑的要命。 所以用 nano banana pro 直接生成原形图设计其实很好,再结合我们这套方式,页面好看,功能呢也符合我们的产品需求,一箭双雕。这就是为什么我觉得这一步非常重要,想要给大家看一下。 好,那原形图已经有了,接下来我们打开 google a s studio, 先开发前端,我们先完整的复制一下 prods bike 里面的产品需求,然后回到 google a s studio builder 告诉他,让他帮我开发一个模特换装的应用, 先把 products back 整个贴给他,然后把刚才生成的 nano banana pro 的 原型图也贴上去。 ai 能力选择这边我们选择 nano banana powered app 和 generate images with nano banana pro, 因为我们的应用需要生图能力,必须调用 nano banana 检查没问题,点击 build 开始。接下来它会自动读取文档和我们发过去的截图进行开发。所以我们稍微等待一下 好,开发完成了。有几个注意事项,第一,记得右上角选择一下你的 gemna api key, 否则无法使用 gemna 三 pro 或者是 nano banana pro 这些付费模型。第二,我们来看一下界面的还原度, 那开发出来的界面和原型图已经有九层相似了,布局,色盘选择,模特姿势这些功能都有。好,我们来测试一下。先上传一张模特图, 再上传一张 gucci 的 最新的女装,一条红色的裙子,风格选择澎湃风格,输出四张模特姿势,选动态走路提示词就先空着,先不填,我们点击生成 好,生成完成了。放大看看,模特的真实感几乎无可挑剔,澎湃的风格,无影墙,走路姿势,人物和衣服的还原度都很好。接下来看一下代码,点击 code, 这就是他开发的所有的前端代码。把代码打包下载,然后找到刚刚我们下载的代码, ctrl c 复制,回到 open code, ctrl v 粘贴代码就导入了,然后告诉 open code 前端已经开发好了,代码放在了这个文件夹里, 这个时候他会问原型图有没有,你需要提醒一下他前端已经开发好了,直接看代码就行。后端部分他建议用 node 加 express, 但我决定选 next, 点 j s 看看他怎么处理, 确认没有问题,让他继续执行。等待开发的时候,顺便说一下,为什么我们要前后端分离。 google a s studio builder 开发出来的是存前端代码, api key 是 直接写在前端里的,那这样部署上线 api 就 会暴露,任何人都能看到。所以我们需要把 api 调用挪到后端,前端只负责界面和交互, 而且后端除了负责调用 api 以外,我们后面迭代的时候,比如要加全线连数据库,或者是业务逻辑,这些也都需要放在后端的 好开发完成了。不过它提醒我们,我们发给他的前端代码的基础是 vt, 不是 next 点 gs, 所以 这一版它用了 express 做后段,因为这是最小的成本,最小的改造方案。但如果我们坚持要移到 next 点 gs, 它也是可以帮我们执行的, 那到这里项目基本就快速完成了。所以接下来我直接输入指令 slash run, 让它在本地跑起来。 ok, 我 们可以看到项目它说启动了,但是显示的状态不正常, 不过没关系,他说他可以帮我们定位和修复好。修复完成了,原来是三千,这个端口被我另一个项目占用了,那他帮我们改成了三零零一端口启动, 如果你想随时停止,可以输入 slash stop, 就 会停掉后台的所有的服务。 ok, 项目启动了,界面功能布局都保持了原样,没有什么问题。 项目虽然跑下来了,但是我们不可能一步到位,所以接下来我们来测试一下迭代功能,我要给他加一个新的需求,我告诉他我想增加一个在页面上配置 api, 并且进行校验的功能。那针对这个功能,他开始追问,首先问我 api 怎么保存,那我选择肯定是存在后端, 然后问我校验的方式,这里我选择的是真校验,需要他发个请求,看看 api 能不能跑通, 确认没有问题,开始开发。顺便说一下我使用的这套开发流程,产品经理和全站开发这两个技能会循环配合,每次新增或修改功能,主 a 阵的会先调用产品经理技能,进入到迭代模式,通过追问补充并且更新产品需求文档和更新日期, 然后才调用全站开发技能去实现代码。这样做的好处是文档始终和代码保持同步,不管是日后自己回顾还是重新开窗口让 ai 接手,都能快速的了解项目的全貌。好,完成了,他说已经更新了产品需求文档和更新日期,那我们看一下更新的内容。 产品需求文档这边第四十九行辅助功能下面插入了 gmail api 保存交换的需求。再看圈趣 log 这边新增的 v 一 点一版本,内容是配置 api key 和交换功能。我们回到网页,应用,左下角已经出现了配置 api key 的 功能,我把我申请的 gmail api key 贴进去, ok, 交换成功,没有问题。好到这里,我们整个的开发流程差不多就走完了。最后我来聊聊我用下来的感受。 先说优点,第一,模型自由度非常的高,这是 open code 的 最大的优势。 cloud code 您只能用 cloud, 对 于使用其他的模型,它基本是严防死守。 open code 呢,你可以随便切换,想省钱就用免费的模型,想要效果更好就换 cloud 或者是 gbt 五点二,灵活很多。 第二呢,是整体的体验和 cloud code 非常的接近,指令逻辑既能加载开发流程,基本和 cloud code 是 同一个思路。 如果你用过 cloud code, 那 上手 open code 几乎没有任何学习成本,不过缺点也是有的, open code 是 开源项目,在使用 agent 或者 skill 的 时候稳定性就会差一些, 特别是多 agent 协助主 agent 调用 sub agent, 或者是主 agent 调用 sub agent 在 调用 skill 的 时候,这类场景复杂的话, cloud code 的 表现依然是最稳定的。 但总的来说,如果你预算有限,或者是想尝试其他的模型, open code 目前是最接近 cloud code 的 开源替代方案。而且说到底,工具本身作用其实有限,真正起到决定性作用的是你在用的那个模型,这才是最重要的。 好,以上就是本期的全部内容,如果对你有所帮助,别忘了点赞以及加入废台俱乐部,这对我们频道真的非常重要,那我们下期见。

同样是用 cloud code, 有 人十分钟完成一个完整项目,有人十小时还在和 ai 吵架。差距不是 ai 版本不同,也不是什么 prompt 技巧。真正的差距在于你有没有把 ai 当团队成员来管理, 而不是当工具来使用。一个好的模板,本质上就是给 ai 写的 s o p。 大家好,这里是 l l mx factors, 一个专注于拆解大语言模型时代底层逻辑的频道。今天我们来聊聊如何用模板思维解锁 cloud code 的 真正生产力。 我们先来看看这个效率差距到底是怎么产生的。同样的任务,比如写一个用户登录的 api, a 同学打开 cloud code, 给了一个模板,十分钟后,代码测试文档全部搞定。 b 同学打开 cloud code, 开始一句一句地说需求 code 写完了,他说不对改,改完了又说风格不统一,再改,改到最后十个小时过去了,还在纠结一个边界条件。这个差距真的不是 ai 能力的问题,核心区别在于思维方式。传统思维是把 cloud code 当工具,我说一句,他做一步, 每一步都需要你指挥。模板思维是把 cloud code 当团队成员,我给你 sop, 你 自己干, 只需要告诉他做什么,不需要手把手教怎么做工具,需要你时刻盯着团队成员,只需要你给清晰的流程。所以,什么是 cloud code 的 模板, 本质上就是给 ai 写的 s o p s o p standard operating procedure 标准操作流程。传统 s o p 是 给人看的,告诉员工怎么做事。 ai 模板也是 s o p, 只不过是给 cloud 看的,告诉他怎么完成任务。一个好的模板包含四个核心要素, 角色定义、你是谁、任务边界做什么?不做什么?执行步骤怎么做?质量标准做到什么程度才算完成? 为什么模板能提小?没有模板的时候,每次你都要重新解释,背景约定、规范、纠正方向,大量时间浪费在对齐上。有了模板,背景规范方向都预设好了, crowd 直接进入执行模式。打个比方,这就像招员工,招一个什么都不懂的新员工, 你要从头教招一个带着操作手册来的员工,你只需要说开始。接下来我们来看看六大核心模板。第一个,全站开发模板,适用场景是从零到一搭建完整项目。核心要素包括技术站约定, 比如前端用 react, 后端用 fast api, 项目结构规范、代码风格要求、测试覆盖要求。有了这个模板, cloud 不 会再问你要用什么框架,直接按照约定开干。第二个,代码审查模板是用场景式让 cloud 帮你 review 代码。核心要素包括 审查维度,比如安全性、性能、可读性、严重程度、分级输出格式、规范、 修复建议要求,效果是 cloud 不 再泛泛而谈,而是给你结构化的专业审查报告。第三个, bug, 修复模板,适用场景是定位和修复代码问题。核心要素包括问题附线步骤、模板排查思路、框架、修复方案、评估标准、 回归测试要求,从帮我看看这个 bug 变成系统性排查修复。第四个重构优化模板,试用场景是改善现有代码质量。核心要素包括重构目标、优先级、风险评估框架、渐进式重构步骤、 向后兼容要求,不是乱改一通,而是有计划的系统优化。第五个文档生成模板,使用场景是生成 api、 文档、 redmi 等。核心要素包括文档类型和格式, 必含章节清单、设立代码,要求受众定义。深沉的文档真的能用,不是敷衍了事的那种。第六个测试深沉模板,适用场景是自动深沉,测试用力。核心要素包括测试类型、单元测试、集成测试还是一二一 覆盖率、目标边界条件清单、 mock 策略测试不再是象征性写几何,而是系统性覆盖。有了模板,还需要正确的使用方法。第一个方法论,先选模板再开口。很多人的错误做法是直接跟 cloud code 说,帮我写个登录功能, cloud 按自己的理解乱写, 你又不满意。正确做法是先判断任务类型,这是新功能开发,再选择对应模板,全站开发模板,然后填入具体参数, 最后才开始执行。第二个方法论,模板可以叠加单一模板,解决单一类型任务,但你可以组合模板、 全站开发模板,加测试生成模板、加文档生成模板,一次性产出代码测试和文档,关键是定义清楚执行顺序和交接点。第三个方法论 模板需要迭代。 v 一 版本是通用版,覆盖百分之八十的场景。 v 二版本加入你的个人偏好,比如你喜欢的命名风格,你团队的代码规范、你常用的第三方库。 v 三版本针对具体项目定制模板不是一成不变的, 它应该越用越顺手。这里有一个关键的思维升级需要强调,表面上看,这是一堆模板文件,但本质上,这是一套管理 ai 的 方法论。使用 ai 有 三个层次,第一层, 把 ai 当搜索引擎,有问题就问一句,最低效。第二层,把 ai 当工具,一步一步指挥它做事一般效率。第三层,把 ai 当团队成员, 给 sop, 让它自己执行最高效。模板思维就是从第二层跃迁到第三层的关键,这对你有什么启示呢?第一个启示,投资模板就是投资效率,算一笔账,花二小时整理一套模板, 每次使用节省三十分钟,用十次就回本五个小时,更重要的是减少心智负担,整个开发体验变得流畅。第二个启事,模板思维可迁移, cloud code 的 模板思维可以迁移到 cursor rules, 配置 github compile 的 设置,任何 ai 编程工具都适用,因为本质相同,给 ai 清晰的执行框架。第三个启事,从使用者变成管理者,使用者心态是, ai 是 工具,我来操作,这样很累,而且效率有天花板。 管理者心态是, ai 是 团队成员,我来管理,这样轻松而且可规模化,这是 ai 时代的核心能力转变。我的判断是, 模板会成为新的技术资产,过去技术资产等于代码库组建库,现在技术资产等于代码库加 ai 模板库,未来谁的模板库更完善,谁的团队效率更高。最后,给你三个今天就能做的行动建议。第一,树立你的高频任务, 你每天都在让 cloud code 做什么,哪些任务可以模板化?第二,从一个模板开始,不要贪多,先把最常用的场景模板化。第三, 迭代优化,每次使用后记录问题,持续改进模板。今天提到的模板仓库链接我放在评论区了, 可以直接复制使用。最后总结一下, cloud code 的 效率差十倍不是因为 ai 不 行,而是因为你没把它当团队成员。一个好模板就是给 ai 写的 s o p。 这里是 l l mx factors, 我 们下期见。

这个视频呢,你将学会用 cloud code 来制作视频,有人可能会问呢, cloud code 呢,只是在终端写代码的产品工具而已,怎么来生成视频呢? cloud code 本身当然是不行的,但是加上其他技能它就可以了。今天的主角呢,就是驴谋选,我们现在简单介绍一下什么是驴谋选,驴谋选呢是一个前端开发的代码框架, 可以实现呢视频及代码,通过写代码呢,整合了 web 开发和视频编辑,你可以理解为他是一个混血儿,用代码写出专业的视频 原理啊,其实很简单,首先第一个呢,就是运行这个 react 的 前端代码,把它在浏览器里面进行动画的渲染,渲染完成之后呢,它会进行逐帧的截图。接着呢,会运用工具把这些图片呢再缝合起来, 生成一个 mp 四的视频。所以呢,做出来的视频呢,更像是一个 ppt 播放的感觉。晚上大家看到了很多高大上的介绍呢,大多数是忽悠人的, 并不是直接通过 cloud code 加 remote 来生成的。但是 remote 啊,还是有它非常好的地方,它的用处呢,比如说它可以比较灵活地定制,或者说附用能力比较强,可以通过呢代码来改视频,包括呢,控制时间,走啊等等。 通过我的实践啊,我发现呢, motion 比较适合制作几种类型的视频,首先第一个是动态数据格式化的视频,数学概念的解释,这些动画视频以及做一些程序啊,或者说 ui 的 展示。接下来呢,我就上手来安装和使用一下 motion。 为什么 cloud code 可以 使用 motion 呢?是因为 motion 开放了 agent skills 的 能力,所以我们可以直接进行安装,安装成一个 cloud 的 skills。 首先呢,可以复制这段命令,在你的 terminal 里面进行安装。在 terminal 里面运行这段安装之前啊,你需要确保你电脑有安装 npx 这个命令。如何去安装这个 npx 呢?首先你去 node js 里面,把这个 node js 按你的系统进行安装了,比如说你是 windows 或 mac os 的, 你就先装这个 node js。 安装完成之后呢,你就会有 npm 的 命令了,再运行这段命令,安装 npx。 我这边已经安装好了呀,所以我们直接回到这个页面,把这段命令呢复制下来,在 terminal 里面把这段命令粘贴上去, 然后点击回车,我们进行这个安装。接着呢,它会询问几个问题。首先第一个是你要把这个 agents 安装到来一些的环境里面,第一个呢是 google 的 anti gravity, 第二个是 cloud code, 第三个是 german c r i, 这回是 open code, 因为我们这边是用 cloud code 进行安装,所以我选择第二个 点击回车。接着呢,他会问一下安装的这个范围啊,是按项目安装,就是安装到具体项目的文件夹里面呢,还是全区进行安装?这里我选择的是全区安装。接着呢,安装的方式,它有个推荐的方式,我们直接确定就好了, 继续 ok, 我 们就安装完成了。安装完成之后啊,我们可以先试试官方给你推荐的,比如说它有些选项,你可以创建一个新的 remote project, 这段命令就是 bun create video。 在使用这段命令之前呢,确保你要安装这个命令 b o n 这个命令,我们可以去这个网页选择你对应的系统啊,进行这个 b o n 命令的安装,我这边已经安装完成了,所以我直接复制这段命令过来,在特米诺里面呢运行这段命令, 运行完这段命令啊,你会发现你有很多模板可以进行选择,比如 hello world, nex js 等各种视频制作的模板。我们这边为了演示方便呢,我们直接选择第一个 hello world, 我 们来看一下这个柠檬选声的视频到底长什么样子。 点击回车,接着呢它就会创建一个 project 的 名字,这边直接默认的是 my video 这个名字,我们直接点击确认就好了。接着它会去问你要不要安装一些配置文件,或者说安装一些代码包等等。点击 yes, 这里有 agent skills, 我 们直接点击 yes, ok, 它就会去安装运行了,很快它就搞定了,它告诉你怎么去运行这个视频呢这一个方式,首先呢去这个文件夹里面,接着用 b o n 这个 mini install 安装必要的包。安装完成之后呢,我们再运行 b u n r n f, 就是 运行一个开发环境,点击回车, ok, 我 们就进入了一个页面了,我们来看一下这个 hello world 的 视频到底什么样子, 这个有点像一个视频剪辑的页面,我们点击播放一个动画,去展示这个 welcome to emotion 呢,我觉得还不错这个动画,这就是展示了 emotion 基本的一个技能去制作视频, 其实通过这个前端渲染来制作的。接下来呢就到重头戏了,我们要用 cloud code 来生成视频。首先呢我们可以创建一个文件夹去存放我们的项目文件, 像我这里我就创建了一个文件夹的名字叫 motion video, 去存放我的项目文件。接着呢,我们直接输入 cloud 来启动 cloud code。 首先啊,在具体呃进行视频生成之前呢,我们先确认一下我们的 skills 安装成功了。斜杠 skills, 我 们就看到已经有这个 motion best practices skills, 那 我们已经安装成功了,我们就可以运用这个 skills。 接下来,在具体生成视频之前,我们先切换到 plan 的 模式,按 shift 加 tab 按两次呢,我们就进入到这个 plan 模式就进行规划了。我们先进行一下视频脚本的规划, 我们可以输入这么一段 prompt, 这个是我准备好的一个 prompt, 呃,我的 prompt 是 让它生成一个介绍 cloud code 的 教程的视频,需要给我规划几部分内容。第一个就是视频的目标,它是让不了解 cloud code 的 一些开发者呢,快速在一分钟之内理解它是什么, 能做什么。第二个他目标重塑之前呢,是有基础编程经验的一些开发者,还有视频时长是一分钟以及可用的素材。我准备了一个 cloud code 的 logo, 还有一些风格编号啊,比如说像苹果发布会的风格啊等等,让他给我输出分镜的脚本文案,还有技术实践的提示, 我们点击回车看,他给我们输出了一个结果。 ok, cloud code 已经帮我们编写好了这个视频的脚本和计划,我们来简单浏览一下。首先项目概述,技术站风格定位,他做了一个视频的分镜脚本,六十秒就有几个场景,他这边帮我们规划了有六个场景,每个大概平均十秒左右,然后技术时间方案和 新的主键颜色的方案,还有动画的模式实现的步骤啊等等。最后关键的一些技术点验证了清单,还有可选增强等等,它已经帮我们实现了一个很好的一个视频的脚本和规划。接下来我们还没有那么快让它直接进行实现啊,我同样输入一段新的 prompt, 这段 prompt 能干啥呢?首先就是把刚刚这个分镜脚本呢转化为一个技术需求的文档,然后保存到这个 video prompt 的 markdown 里面,不需要有项目结构,时间线规划,动画规格,素材清单和文案文本等等。然后格式要求通过这个 markdown 呢列出时间线,这是一个文档,去让它生成这个面向 emotion 的 一个技术 需求文档。我们点击回车来看一下,这是他们帮我生成的详细的 video prompt 的 markdown 文件啊,有这个项目的结构组建清单,还有时间线的规划,以及每个场景的描述内容, 还有动画规格的详情。那么有了这个 markdown 文件之后呢,我们可以要求 cloud code 调用 remotion 这个 skill 呢,完成整个视频的制作。我们回到这个 terminal 里面,我们可以直接输入呢,根据这个 markdown 文件去创建一个 remotion 的 视频,接着呢它就会去运行 整个视频的制作,他会规划几个任务,从一到八这个每个任务,然后接着呢,他就会按这个任务一个一个执行啊,我们最终看一下他生成了一个视频的效果。 ok, cloud code 已经帮我们开发完成了,我们来看一下怎么去看这个视频, 他说他已经在这个链接已经在运行了,我们可以直接把这个复制过来,在浏览器打开啊,这个是最终的成品。我们来看一下视频啊,点击播放 视频的速度有点慢,但是整体的这个效果还是动画效果还是不错的,这里可以有一些优化和调整,让它可以做出这种动画效果 啊。对比传统的 core palette 和 cloud code, cloud code 呢是 agent first architecture, 这里应该是 npm in store, 它这个没有数学完成整体的视频我觉得还是不错的,大家觉得怎么样呢?你觉得视频如果没问题的话,可以点击右侧的这个右下角的这个 render, 点击它, 然后选择你想要输出的格式,比如说我直接用默认格式点击 render video, 它就会开始运行这个工作。当然 render 渲染完成之后呢,在这个 out 文件夹子外面呢,就可以得到这个 mp 四的文件。 ok, 这个就是本期内容的全部分享了,如果你觉得我的分享还不错,欢迎点赞收藏和关注,我们下期再见。