这期视频来赶快和大家分享一下我 web 编辑出来的分歧自动化剪辑软件啊,同时呢,也借着这个分享的过程来和大家讲解一下我自己用了什么 skill, 怎么制作属于自己的 skill。 都说 webcointing, webcointing, 很多人都会发现我安装这些工具之后并不知道我要做什么,结果就是我们的 webcointing 就 在安装好 webcointing 的 工具的那一刻就结束了。所以呢,再和大家分享一下我们如何去找到适合自己的一个方向啊,以 集啊这个 webcointing 是 一个怎样的流程,可以让你更好的去开发好自己的这个工具啊?废话不多说,我们先来看一下我的这个剪辑的工具,这个过程呢,就是把我们这个视频的音频提 取出来,转换成文字显示在我的这个框里边,是我只需要选择这个框里边的这些文字保留下来,就相当于把这段视频剪辑完成了。那么我选中的文字呢,就是要留下来的那些 用的片段,它其实就是一个粗剪的工具啊,像我自媒体来讲,最费时间的其实就是整个的剪辑过程,那么剪辑过程中最费时间的又是我的粗剪的过程。第一遍粗剪,很多时候我都忘记了这个素材是什么, 那么我需要把我所有拍摄的素材全部都过一遍之后呢,我再去一个一个的去听,去看啊,里面有一些停顿啊,卡顿重复的话都要不断的去挑选,那么粗剪完成之后,我再 来堆一些素材对不对?配一下音乐,其实很快就可以做好了,所以就可以得出一个结论, web coding 其实不一定非要做出一个 app, 那 其实就是怎么去做一个自动化的流程来提高自己的效率,这个就是 web coding 的 意义,对于普通人来讲确实很神奇啊,这个确实能极大的提高我的效率。 那么就要说到我用到的 skill 了,我这一周主要用到的一个 skill 就是 superpowers, 最常用就是它的那个头导风暴,虽然说我有这样的一个结 剪辑的一个工具要做,但是它有很多的细节要去细化,然后才能做出来。这个过程呢就是我和头脑风暴这个这个一块探讨,到底咱要什么样的效果,它问的越细呢,它的实现呢,也就越符合我的要求,大家可以去 github 上边好好的看一下,拼越多的 skyo 呢,它可能就越好用, 再和大家分享一下怎么制作自己的 skyo, 其实过程非常的简单,就是把我们的需求发给他。以我为例啊,每天只要结束的时候呢,去让他把我进 进度,你知道我想要去优化我想要想做的那些功能,让他去保存到我的文档里面,我每天让他更新,我就得跟他说,你给我总结一下,对吧?开发进度啊,遇到的 bug 还有一流的问题,就跟他说完,然后保存更新到什么名这个文档里面,那其实我每天要发这么一大段话才能让他总 结,其实是比较麻烦的,所以呢,直接就跟他说做成一个 skill, 非常的简单,就是你要做 skill, 那 你就是跟他说不是真正的你去做这个东西,他会帮我去把这 一些 skill 啊,自动的去建立好现在的成果,其实就是我只要跟他说总结一下,那么我以上那些东西呢,他都会自动的都放到指定的那个文件里边啊,大家可以以此入手啊,做一个符合自己工作流的一个 skill。 那 么就给大家提供一下白不扣定的一个思路啊,首先呢的灵感来源一定源于我们的生活,源于我们的工作,你没有想做一个 app 之类的,那你其实可以去看看怎么样能够让自己的工作流自动化起来,像我这个原来可能化 一两个小时要完成的一个东西,现在呢,我只需要几分钟就完成了,那其实对于我繁忙的工作来讲,真的是对我卸下了重担啊。再举一个例子,就比如说我前段时间,那么公司呢,很多的技术文档需要好多个文档里边归总到一个,那么这个时候我就用了 ai 这个方式啊,就是跟他说我这个文档中的哪个 sheet, 哪列哪行啊,哪些数据啊,还有另一个文档中的哪列哪行就 哪些数据啊,对吧?跟他说清楚之后,让他归拢到某一个文档上,很具体的跟他说清楚之后,剩下的我都不用去管了,就是他会把这些很快的去完成。即使 ai 可能不能直接的去阅读这些什么 excel 或者之类的文档,但是它本身啊,它可以通过自己写脚本的方式获取里边的数据,其实也是很神奇的,就是说我们要打开自己的想象力, 而不是 ai, 就是 你只要把你的需求告诉他,他自然有他的一个实现的方式,就是这也是外部确定的一个魅力所在吧, 有了目标,然后就是和他去讨论方案。呃,我们可以用 plan 的 模式,再加上 prepare 这个 skill, 好 好的跟 ai 对 一下,把这些细节给它丰富下来。这个实话就是因为我想要一个剪辑的插件,但是我根本就不知道它该怎么弄,它到底怎么才能让达芬奇去调用它?是一整个不知道啊,就是所有的想法都是 ai 去操作的,也就 就是说他告诉我可以这样,然后并且他完成了这样的事情,讨论出来一个大概的方案之后呢?下一步我们不一定是要开发,我们这个时候就可以一个 read me 啊这样一个 markdown 的 文件啊,先把我们讨论的这个方案啊,先让它放进去,然后其实就是一点一点的让它根据这个方案呢去实施,边实施边开发的这个过程中 就会发现有一些细节确实没考虑到,我们这个时候再去和他讨论,差不多就是这样不断的看他的结果,然后发现问题,然后给给他,他再去解决。是这样几轮几轮下来,然后慢慢你会发现这个工具是越来越有模有样了。那么为什么非要让大家去 写一个 readme 这样的一个文档啊?其实就是因为我们的开发肯定不是一天完成的,所以写这个的目的啊,一个是呢,整体的一个开发思路啊,就是给它记录在里面,以及未完成的一些事件啊,包括一些开发记录都让它存在里面。就是 ai 的 上下文啊,它是有限度的,如果你这次跟它聊崩了,那么它可能存在断档的情况, 你再去和他说的时候,就需要让他去阅读一下完整的这个项目,其实他读完之后肯定有一些信息去遗漏了,那么这个时候我们的这个文档的优势就体现出来了,我们的整个开发方案在里面, 我们想要完成的事情都在里面,包括未完成的事件也在里面。这个东西不光是给咱们自己看的啊,确实是主要是为了给 ai 去看的它,它就可以结合项目里边先要的东西,再加上咱们这个文档啊,就可以把这些信息重新捡起来,哦对了,记不记得我刚才说的那个自己做的那 skill, 大家也可以自己去跟 ai 说一下,让它做一个放在里面超好用的,这样的话你 每次你跟他说一下啊,他就会自动地调用这个 skill, 然后,哎总结一下上述的这些要记录的东西,更新到咱们的 readme 文档当中,现在看到这个视频都是由我自己制作的这个插件来进行粗剪啊,那么最后总结一下啊,不管你是什么样的职业,总有很多的机械化的部分啊,大家可以尝试着去把这些机械化的部分给它变成一种自动化的一个。 我可以想一下啊,原来需要八个小时完成的任务,现在只需要两个小时,只需要用 ai 去让他去做一些事情,就可以大大减少咱们的工作时间啊,那咱们就可以去摸鱼了,对不对?那可是超级爽的一件事情。 那么这期关于我这个拆二的分享,还有对吧这些东西的分享,那么就先到这里了,还是那句话,打开自己想象力出发吧!那么这期就到这里,我们下个视频,再见吧,拜拜。
粉丝283获赞8237

hello, 大家好,我是 winter 喵,一个视频给大家讲清楚 web coding 的 一个懒人开发流程 啊,这是我用这套流程开发的一个 app 啊,在右边它还在开发,我花了半天时间开发到了一个这样的一个完成度,大家可以看一下, 你看,我可以去选择一只猫咪,作为一个陪伴养成的一只猫咪,然后这边的话还能够喂食来养成,这边还能和它去进行聊天啊, 然后这里还有一个,你慢慢说,我都在听啊。对,这边还没有接入网络数据啊,用的都是本地的一个默克数据,然后这边还有猫咪的一些故事啊在里面 啊,这个流程的话呢,也非常简单,它只需要用到两样开发工具啊,一样的话就是 vs code, 还有一样呢,就是我们正常做 app 需要用到的一个工具啊,比方我 这个 app 是 ios 嘛,我,那我就用 xcode 啊,如果你要开发安卓的话呢,那你就用安卓 studio 嘛,如果你想拿这套流程来开发小程序,那也是可以的,你用微信开发工具就可以了啊 啊,所以,所以它的一个呃要求其实是没什么的,只需要多赚一个 vs code 的 就够了。然后呢, 嗯,他还要什么会员呢?也不需要什么会员,就是你只需要开通的 chat gbd plus 就 可以了,就可以直接用 codix, 然后就啊,剩下的都是就 ok 的 啊,如果你没有 开通 chat gbd plus 的 话呢,那你,呃应该也可以用国内的一些代理工具,应该也可以用上 codix 啊,这个我们就不说啊。 ok, 那 我们的话就给大家一步一步来讲解啊,这每一个过程是怎么做的,并且呢通过这个真实的这个项目来给大家演示每一步的一个操作。 ok 啊,第一步的话呢,当然就是先来安装 codex 啊,嗯,我们可以直接去 codex 的 一个官网,在这里 openai 点 com 杠 codex 啊,这就是 codex 的 一个官网,嗯, 直接可以通过这个命令 npmi 杠七 at openai 杠 codex 啊,这个指令就可以 啊,输入到终端就可以安装到我们的一个啊终端里面啊,当然如果你没有 npm 的 话 啊,没有 npm 的 话啊,尤其是 mac, mac 的 话它,嗯,我们像像我做 ios 开发或者安卓开发啊,或者小程序开发,其实我的一个 机器里面我是没有装 npm 的 啊,那你也可以通过不睿来安装啊,在这个 codex 的 一个 git hub 这个页面啊,它里面有安装方式啊,其中第二条就是通过不睿来安装 codex, 不 睿 install 杠杠 task code x 啊,这个指令用来安装也是一样的啊啊,贴到这里,然后回车就可以了啊, ok 啊,然后我这边的话是已经安装过了,所以的话,这一步的话我就,呃,回车就不不摁了啊, 当你装好了 code x 之后呢,你就来创建一个 app 项目啊啊,像我的话是用 x code 的 啊,我已经把这个项目创建好了,并且已经运行好了啊,为了演示的话呢,我这里再给大家来创建一个项目试试 啊,六一个啊,我这边新建一个项目啊,如果你是小程序啊,或者别的,你也用对应的一个那个代码编辑器也同样来创建一个就可以了。 ok, 我 这边创建好了啊,创创建好这个项目了,然后第三步的话呢? 怎么做呢?看一下第三步的话呢,我们来安装 u i u x pro max skia 啊,安装一个这样的 skia skia 是 什么呢啊?嗯,最近非常非常火,但是大家其实 不理解,不了解它没关系的啊,你就把它当做一个工具就可以了啊,我给大家来看一下如何安装 u i u x pro max。 呃,我们直接去它的一个 github 页面啊,因为我们用的是 codex, 所以 我们直接在它的 github 页面搜 codex 就 可以了, 你看啊,就是这个指令啊,这个指令的话你啊复制一下啊,复制一下 enit restoration 啊。哦,在这里现在全区安装一下啊, n p m 全区全区安装一下。全区安装的话呢,也还继续在这个终端里面终端里面啊,输入这个命令去全区安装一下就可以了啊。 嗯,全区安装好了之后呢,我们这个时候我们就要回到 vs code 了啊,先回到我们的这个项目啊,嗯,我们的项目的一个根目录啊 啊,回到这个根目录下面,然后你把你把这个项目偷到 vs code 里面去偷到 vs code 里面我给大家看一下 啊,看一下我这个 cad adventure 这个项目拖到 vs code 里面去。是这样的啊,在这里的话呢,我们要怎么把那个 呃 uix pro max 导进来呢?啊?是这个指令就是这一行指令 啊,这一行指令是在哪里呢?是在这里啊,是在第二步,我们你看它第一步的话先是在全曲安装啊, ui pro cd 嘛啊,然后的话再进入到我们的项目路径下面,然后再来通过这个指令来安装啊。 嗯,也就是说我们在 vs code 里面打开了我们的一个,呃,这个项目之后啊,通过, 然后在 vs code 里面打开对应的一个终端啊,在这里打开,然后把刚刚这个指令 输进去,它就会把这个斯基啊来,嗯,导入到我们的一个对应的一个项目中。导入到哪里了呢?导入到了这里,你看它会自动帮我们生成点 code x 这个斯基啊,这个文件夹,然后它的名称就是 u i u x, pro max, 这些都是它自动帮我们导进来的。 然后这个 skier 它有什么用呢?它可以帮助我们,呃,开发 ui 的 时候更加现代化啊,就是我们做 ui 做起来更加省事一点,你可以这么理解就可以了。 ok, 然后,嗯,然后第三步,对吧?安装这个之后啊,嗯,然后还有还有中间还有一件事情啊,我们通过 vs code, 嗯,来进行下一步开发的话呢,我们我们要在 vs code 里面来安装 code x 的 一个插件啊,在这里,在这个插件这一栏里面搜一下 code x 啊, code x 啊,就找到了。在这里啊,如果你不确定是哪一个的话呢?因为它里它这里有很多个嘛,有一些不是官方的,你可以在官方网站 open ai 点 com 杠 code x 官方网站,你看这里 get start 下面还有一个啊,那第二个就是 vs code 了啊,所以 vs code 它的一个 code x 插件更新是非常勤快的啊,你看啊,就到这里装上去就可以了。 装上去了啊,那我这边装上去了之后呢?我把它挪到了这里啊,啊,怎么挪到这边去呢?你看我挪到这里之后,我点一下,点开这里就是 code x 了,怎么挪过去呢?嗯,你在这里右键它 move to second saddle ball 就 可以挪到这边去了啊 啊这样的话我们的一个呃 vs code 里面的 code x 插件也装上了啊。然后呢?嗯 然后接下来呢就是啊就前置工作我们已经做完了啊接下来的话呢我们就要来整理一下我们的一个项目需求了。嗯我给大家看一下啊就是这个 app 的 一个项目需求 啊,很简单就是我我自己随意写了的啊。项目需求是这样的就是我要做一个猫咪 养成陪伴 app 叫做猫咪奇遇啊啊如果你是安卓的话呢你最好把包名也写进去啊, 因为安卓它的一个代码文件的头部都是会有包名的。但是因为 ios 的 话头部没有包名所以我不写包名也没关系啊。如果你是安卓的话包名你要告诉他你告诉他包名是什么什么啊。然后我的想法是基于四只有完整故事和自己风格的猫咪展开, 请根据我提供的内容帮我完善还需要完善的页面实质成成为一个可以用户付费的 app 啊。嗯然后我告诉他啊我的一个技术需求我是要用 swift ui 开发框架制成 ios 十七以上即可。 然后网络请求的话呢暂时不写暂时用本地啊。因为因为后面的话呢加网络请求是非常方便的。所以我这会先不做先把页面搭出来 啊。然后网络图片的话呢还是要要的因因为我这边给的图片是一个是一个链接嘛,所以的话还是要加载网络图片还是要要的。我直接让他用 log 这个库就好了啊啊如果你比如说你是安卓的话,可能你会用 glad 啊或者别的库啊,都都可以 啊,你是小程序用的话那不需要用酷啊,官方默认就支持的很好。 ok, 然后整个页面的一个风格呢,遵循这个 u i u x pro max 这个斯基啊这个斯基啊啊就是 啊,就是对应的是这这这里啊,好不对啊就是这里啊,就是刚刚我们装的这个斯基啊,我把 我把链接也贴上去了,以防止 ai, 他 不知道我说的到底是哪个东西啊。然后然后我 app 引导页面呢?是这样的啊,用户首次进 app 的 时候会进引导页啊引导页我给大家看一下啊, 嗯重置数据啊啊引导页我的想法就是这样的,但是我的想法其实并不明确啊。我的想法 啊,就是四只猫咪他的一个性格不一样啊,然后,嗯,每只猫咪的性格的一个十六型人格,我也告诉我爱了,我让他就是, 呃能够更贴切一点啊啊就这么写我,我写的很少,其实你看我就写了这么点啊。然后引导页面六呢,我告诉他这个是用来选择选择的啊,选择陪伴宠物的这个页面 啊。然后 app 首页的话呢,我是完全没有头脑啊,我只告诉了他我需要包含猫咪养成、 ai 聊天、猫咪故事这几个功能模块。 ok, 这是一个,这就是我的一个 啊,这个项目需求就是这样的啊,然后呢第五步的话呢,我们就要 来通过这个需求来生成这些文件呢啊这一步非常关键,大家要注意。为什么呢?因为呃如果你直接把整个 promote 直接把刚刚这个需求 扔给 ai 的 话,那它一次性帮你弄,弄好,弄好了之后你要去修改是非常非常困难的啊,比方说我在生成这个, 嗯,这个页面的时候,我,我有好几个细节不满意啊,总体我是满意的,细节我不满意,我要改啊,那,那因为我是 拆了步骤的啊,拆成多个规格文件,所以我改起来会非常轻松啊, ok 啊,那怎么样通过需求来生成这些文件呢?啊?我给大家看一下,是这样子的,也非常简单,你在上边加一句这样的话啊,这个话你可以直接记下来就可以了 啊。你看我,我这样说,我说你好 gpt 啊,因为我用 excel gpt 嘛。啊,请帮我拆分以下 promote, 以便于我用 codex 进行项目开发与管理。我希望使用 ajax 的 md 加 scale 的 行目形式来推进项目, 请给我 agent 点 md 文件,以及每一个阶段要完成的 spec 文件啊,这个话是通用的,你做任何一个项目,这个话都可以这样写来,让 check gpd 帮你来拆分这个,呃,规格文件啊, 然后我这里给大家简单解释一下,什么是 agent 点 md 呢啊?什么是 spec 文件呢啊?呃,我打开这个项目给大家看一下, action 点 m d, 你 可以理解为呢,它就是整个项目的一个宪法啊,它就是整个项目的一个规章制度,一个最终目标, 一个规范。它在这里,你看啊,这边是叉 g b d 给我生成的啊,你看它定义了目标、技术、风格、约束,然后开发策略、产品的定位啊,这些东西 啊,然后 ai, 它每次去生成代码的时候,它都会把 ai 指令 md 记在脑袋里啊,它会遵循这个规范,然后如果你在开发的过程中,你 ai 指令 md 改了怎么办呢?改了的话呢,你得, 你得跟 ai 说一下,你说我 ai 指令 md 文件已经更新了啊,它会重新读一下,重新记住你的一个要求啊,这一点要记住。 然后,嗯,什么是 spec 文件呢啊?这个东西呢,其实就是 propromote 的 一个逐步拆分啊,就是功能的拆分,你可以理解为规格,规格文件,你看, 嗯,我要实现一个这样的一个陪伴, a p p 啊,对吧?那我让拆极 p d 帮我拆成了多个规格文件啊,你看,你看,第零步的话,可能就是定义一下工程的股价, 第一步的话呢,来做一下引导页面,对吧?第二步的话呢,把首页框架做做好 啊,第三步呢,把这个养成系统做做好,就这样一步一步拆分啊,这样的一个目的也非常明了,就是你一次只执行一个文件啊,比如说我,我说啊,帮我实现零零杠, but stripe 点 speck, 点 md 啊,这样的话, 库德 x, 他 就会来看这个文件啊,看这里啊,把这里面的东西帮我实现掉啊,如果实现的有问题的话呢,我可以跟他改, 对吧?改到我满意为止啊,改到我满意为止,我再来进行第二步啊,再来做这个引导页 啊,生成啊,引导页生成有问题我再改,改到我满意为止啊,这样的话,生成的代码他就是可控的啊,他的一个代码是可控的,而且你看他的顶部的话,是先把工程骨架做做好啊,工程的一个整体的一个样式,一些骨架是在这里来做做好的, 所以的话呢,后续的一个迭代就是非常可控。 ok 啊,那,那就是把这段话复制一下啊,你把这段话一起复制一下就可以了, 这上面这段话加上我们的一个需求复制,对吧?复制好了之后呢,直接扔给 ai 就 可以了啊,啊?扔,扔给 ai 我, 我的话我直接扔在 gpt 啊,这个时候你先不要让 codex 来帮你做这个事情啊,因为因为的话呢,我们不要尽量不要增加它的一个上下文的一个开销 啊,因为我要让 codex 专心帮我写代码啊,所以的话,我这边的话,我让拆解 bt 来帮我来拆分,嗯,拆的 gbt 呢,它 明白了我的意思,你看他帮我拆分好了啊,拆分好了啊,给了我 agency 的 m d 文件啊,那他给了我这个文件之后呢,那我们就需要去建一下这个文件啊,这些文件都是我们自己建的啊,在这个项目的 一个根目录里面啊,你看在项目根目录里面,在这里啊,你又建一个,在这里建一个文件,建一个 index 的 md 文件,把它把这个内容填充进来, 填充进去就可以了啊,这边点一下复制就可以了。然后呢 spec 文件也给它一个一个扔进去啊,建一个 spec 文件夹,方便我们日后管理啊,一个是方便管理,二个是呢,我们也知道 ai 它到底做了啥啊, 这样子,我们知道 ar 到底它做做了哪些事情,我们后面来复盘来进行一个迭代,也更加方便一点。 ok, 你 看啊,这节笔记,它我我给了它这个 我们整理好的这个 promote 之后啊,它就帮我进行拆分了啊,拆它拆分成了七步 啊啊,主要是有六步是实现功能的,第七步呢就是抛光与质量啊,第七步我都没做,因为我觉得前面六步做完之后我已经非常满意了。那我对样式很满意了,所以我第七步没做 啊,第七步也不需要做,因为你对样式满意了,你再做没必要做的话,可能他给你做的反而不好,然后他还给了我每个阶段的 promote 啊,给了我一大堆文件。那你不用管这个你不用管,你不要用他的, 不要用他的啊,为什么呢?他写了一堆文件,到时候写出的代码有什么问题你还不知道啊?他你还不知道,也有可能他这边给你写了加了一些坑,对吧?所以你不要用他,这个你不用管就可以了啊。那 接下来呢,我们就是用 codex 来逐步实现每个 spec md 了, ok, 来逐步实现我们的一个功能了。呃,我们把这个页面拖过来啊, 放到这边上啊啊,大家,我给大家来分享一下,看一下我是怎么一步一步让 codex 来帮我来实现这些页面的。 我先把这些打进去啊,我直接在一个新的 codex 的 一个聊天里面 把这个打进去,大家看下这里是什么?这是一个斯基啊啊,这是一个斯基啊,你通过一个多了符号就可以打啊,你看我们引进来的的 u i u x pro max 引进来的,如果你打的时候没有自动补全的话呢?那也不要紧,你来看一下, 看一下你这个 skin 叫什么名字啊?你看这个 name 在 这里定义好了它的名字以及它的描述 啊,你多了符号,然后后面接这个名字就可以了。 ok, 这样子,然后呢,我让他说帮我实现 specs 零零杠布的 stripes, 就 帮我实现这个 啊,这个就可以了啊,那怎么实现呢?实现的话就是要用到这个斯基啊,就是遵循这个样式就可以了。 ok, 然后我 打,打了之后呢, code x 就 帮我在这干活了啊,干活可能要干了个十分钟啊,它很慢的,所以的话我我没法,就是给大家直接 也是啊,因为他干活干的太慢了,然后我还修 bug, 又修了点时间,就大概花了半天功夫啊,弄成了现在的这个样子,就是整个 app 现在这个样子。 你看啊,他帮我做,做好了啊,帮我把代码做做好,这些都是扣的。 x 帮我做好之后打出的日制 啊啊,大家看啊, ok, 然后我跑了之下,跑了一下之后没有问题啊,然后呢,我我再让他来做引导页面啊, spec 零一 onboarding 点 specmd 啊,他帮我把引导页面也做好了, 也做,做好了啊,做好了之后呢,我遇到了一些问题啊,他给我做的页面 就是没有现在这么好看啊,有一些问题,那我那你看,我就这样直接和他聊天,我说一到五页的一个内容,这样画幅太小了,头像呢,可以再加大一点 啊,第六页的一个头像呢,也可以大一点啊啊,这这样他就很懂,因为我刚刚做了,是引导页面吗?引导页面又有问题,我直接这样说,他就很明白啊,如果你让他一下子把整个 app 做完, 那你想调东西是非常困难的,你得指的非常明确,而且有些东西比如说样式这种东西它是千一发而动全身的啊它是全局光年的啊,或者说呢你你改了这个的一个地方别的地方也得你也得一起改它才协调,所以这样子分布是非常好的。你看 我和他再继续再结对编程啊然后他改的还不够好啊我我说第六页的猫咪卡片可以再宽一点,第一页内容还不够丰富,内容太靠放太靠上了,文案也优化一下然后扣点 x, 他 再继续帮我啊继续干活 啊然后呢我告诉他已经舒服很多了啊然后再哒哒哒哒啊再叽叽哇哇再跟我干活啊然后第六页 后面他给我弄第六页的话呢弄的这个卡片弄成了全弄到一排去了 啊那我告诉他这个有这个问题,你帮我稳定弄成四宫格,他又帮我修修好了啊你看就这样子我改需求非常方便啊 然后你看啊这样子啊,试图没填满我再填满了一下当然他填满的过程中呢他他有点笨他没做好啊,那我自己 对吧?我我我自己的话就直接去 x code 里面我自己去改了一下就好了啊有些小细节你自己改改就可以了 啊比方说我对吧我在这里加了个 spacing 啊在 lazy v grid 里面加了有这个 spacing 啊然后它 grid item 里面它没有加这个 spacing 导致它这个。 嗯,横排的间隙和竖排间隙不一样啊。所以的话我自己给他加一下就可以了啊自己加一下也没问题跑起来就 ok 了。然后再往后再给大家看一下啊然后再做第二步嘛做 home 页面 啊做 home 页面啊,它它就照着这个 speck 这个文件,对吧?啊我啊继续来做零二杠 home speck 点 md 啊,就照这个文件来做了,把这个 home 页面做做好了啊, 做好了之后呢,我发现有个问题啊,就是它这个样式,它是一个基于深色的调来设计的啊,但是系统的样式呢,在白天的话呢,是白色的, 白色的,也就是说这个文字是黑色的,主页这个文字黑色的那就很不协调,所以的话我让他把整个 app 默认调成深色模式,你看他给我在 app 里面加了一行代码啊,就这一行代码就搞定了是吧?然后 ok 啦,我再让他来完成这个养成系统啊,他把我养成系统给我啊,叽里呱啦也搞定了搞定了之后呢,那当然也有一些问题,对吧?你看啊,我和他 啊啊有一些问题,跑不起来还为什么跑不起来呢?因为,呃,因为 swift 的 ui 就是 ai, 无论哪个大模型啊,它都都有这个问题啊。它 他有一个毛病,就是呢他不会去加 command, command 这个库他默认不会去加啊,所以的话我 add 词典 md, 我 更新了一下啊,其实我之前就更新了,但是我没有同步,所以的话他不知道啊所以呢啊,所以的话我建议大家呢 也在这里啊,在 add 词典 md 里面你手动去加一行这样的一个代码啊,就如果你是 ios 开发的话 啊,你说,呃, observable object 的 一个对应的一个 structure 或者 class 需要 import combine 这个包才可以啊。 ok, 然后呢?呃 然后对吧,他就帮我修复了我,我让他修复一下这个啊,我翻译的时候我用 xcode 去翻译的时候就是这个类报错了,我让他修复一下啊他就知道问题所在了他就映泊 command 这个报就可以了 啊。然后就是我在点这个东西的时候呢他没有这个气泡啊我也不满意。用户感知力度不强嘛你看现在是有气泡的那我就告诉他 我说你要给我加加一个气泡啊啊那你看我这边一大堆东西是从哪里来的呢我这一堆东西是从 jamaican 里面来的啊因为我用 jamaican 写了个网页版的这个养成这个气泡我觉得做的很好我就把 jamaican 这边做的。好的地方 啊。嗯让 jimmy 来告诉我这个反嗯这个反馈系统是怎是怎么个逻辑啊我就把那个逻逻辑复制进来了。复制进来啊让 q 然后 q x 他 帮我去完善。 晚上好之后呢当然又会有问题啊。有问题很正常大家 ai 编程遇到问题就是太正常了啊太正常了。你看他给我引进了他把金币系统也引进来了啊但但是呢引进了金币系统又会有各种问题啊。所以的话我说直接把金币系统先去掉吧。啊我不搞金币系统先 啊然后去掉了。然后呢又遇到了一些 u i 商的问题啊那他这个啊精力和心情啊我想换个位置啊后来我就我让他换个位置他忘换了啊啊然后呢 就是又有一个问题就有什么呢就经历这个东西他只会下跌不会上涨啊所以的话呢我就让他去 去去把。那我我问他我问他经历是怎么恢复的他说休息可以恢复啊但是我一看没有休息这个按钮呀。 啊所所以我让他修复一下,先用的一个养成逻辑使其闭环,然后他又叽里呱啦给我一起修复,你看我跟他我和他结对编程了很久啊,我才弄到满意啊,但是呢, 就是因为我是一步一步来做的来完成这个项目的,所以的话呢,我改起来是非常方便的啊,你看啊,还有改了很久, ok, 终于搞定了,搞定了之后呢,来继续做,做零四 chat, 点 spec, 点 md, 我 让他实现这个就可以了啊,他就帮我实现啊,实现了这个聊天页面, 聊天页面啊,做的非常棒,你看这聊天页面,你看非常漂亮,而且他还把语音功能也给我做了, 哈喽啊,我打过去,我懂你。哈喽,把心事交给我吧。哎,你看他告诉我,他告诉我,他把语音这个也做了,做了 tts 啊, streaming 他 他打字是一段一段打的,你没发现?你看 啊,白日依山尽,黄河入海流。我打打给他, 别担心,我会,你看,他是一步一步一步给我弄出来的,做了 tts 的 啊,所以后面的话我要把它接入大模型,是非常方便的 啊,我其中我做酷狗 x 实战系列有应该是第三个视频吧,就是接入后端非常方便,就做到这个地步的时候呢,嗯,一个指令他就 一下就给你把整个后端文件都生成了,包括数据库文件啊你。嗯,基本上一个小时就搞定了,所以的话呢,就是后端的话,你不不用急,先把 ui 框架搭起来接后端非常方便。嗯, 然后再继续啊啊,再再继续,对吧,继续的话是来帮我生成这个故事了生成了故事啊 生成故事之后呢他一开始给我生成了三篇故事啊,其实他是以诗歌的形式去生成的你看给他来看一遍回音 你写下今天的心情。他蹭了蹭直角像是盖章你们的心事被好好收起夜色也变温柔了 啊。他是以现代诗的一个形式我觉得还挺有意思的虽然我是想让他生成的是一个猫咪故事啊但是他的这个诗歌也写的非常的一个美现代诗所以的话呢我就索性把我的需求也改了我让他帮我把这个补齐啊每个的话呢做十二篇 那他就给我生成了这样的十二篇时隔啊啊后面的话呢如果我想弄插图的话呢也是非常方便的我让他给我加个插图就可以了。 ok 他 帮我做好了啊做好了之后呢然后再实现 paywall spec 啊就是订阅啊帮我实现订阅。你看这些东西都和订阅已经关联起来了你看啊现在的一个订阅当然是很简单的啊后面的话我们 我们要接入真正的订阅也是非常方便的啊。这个的话呢我我也有个 课时是专门讲订阅的啊就是一个课时就帮你搞定订阅是非常方便的所以这些大家都不用担心是非常方便的。 然后然后再来看啊然后再做设置页啊再再来做 零六啊不对不对,零六的话做的时候已经把设置页做了啊,我再让他帮我把设置页加一些功能啊重置数据啊切换猫咪啊关于啊你看我现在在这里可以切换猫咪你看我可以切到福宝啊,这个页面做的还挺漂亮的。 嗯,我现在的话,你看切到福宝来了啊,然后还可以重置数据的时候呢,他一开始 他没有,他没有给我做那个确认啊,所以的话呢,我我又和他改了一下 啊,我我让他给我加一个确认啊,就是重置数据的时候呢,用户得得确认才行,才有一个确认弹窗啊,你看现在的话就是有确认弹窗的 啊。 ok, 那 这样就搞定了啊,如果我要让他帮我来接入后端的话,也非常方便,我把后端 api 就是 把后端的那个说明文档给他,然后要,嗯让他帮我生成,他就可以帮我无缝来生成。 ok, 那 那个啊,今天的一个分享就到这里啊,感谢大家的一个观看,如果你觉得对你有帮助的话呢,可以分享给他人 啊,也欢迎给我点赞收藏,一键三年啊,感谢大家收看,拜拜。

我最近发现,不管是 viking da adrian, 还是我们正常向 ai 提问的时候,同样的问题,不同的表达方式出来的答案,它的差别都是巨大的。所以呢,我特别想跟你分享一个 skill, 叫做 auto optimize, 比如你看呐,我想让他帮我生成一个好看的画面,但这个好看呢,其实就很模糊,很难定义,对吧?所以呢,这是他生成出来的 u i, 我 就觉得很一般,很不稳定。但如果同样的问题用这个 skill 的 话,这是他给出的结果,你看就很明显,我觉得这个会更好一些。 而且我发现智浦最近上线的这个五点一版本的模型呢,就特别适合用来规划一些长的任务。比如说这个 skill 呢,就是这个版本帮大家搭建出来的,大家可以试试看。 不过它也不是什么设计的 skill, 它其实只是按照你的问题先拆分成三到五个不同的维度去定义什么是好看。然后呢,在每个维度的下面会生成几个不同程度的 prom, 让它们各自生成自动打分和迭代, 最后看看哪个 pro 的 输出效果会更好,哪个更好呢,就选哪个。所以它其实是一套内部自我深层自动修改和迭代的 skill。 所以 除了 ui 之外呢,比如说你想实现某个功能,但是又描述不出来,或者是搭建一套自动化的工作流,中间会有很多繁琐的步骤,你可能搞不清楚的话,那他就特别适合来帮你做,就特别适合那些你有很多想法,但是又描述不清楚自己要什么的那些时候。 然后为什么会有这个 skill 呢?我觉得还是要先给你介绍一下这个前情提要,因为后面有一些具体的操作方便你理解嘛?是因为前段时间呢,我看了 angelica, 他 发了一个能够让 ai 自动跑实验和做研究的工具,叫做 auto research。 他的思路其实很简单的,就是与其让我们自己来调参数,跑实验和对比结果,还不如让 ai 来做这个事情。而我们呢,只需要定义什么是好就可以了,就像前面所说的好看是一样的, 像我之前用 ai 的 时候呢,都是每次遇到问题,然后就问 ai 得到一个答案或者是继续问嘛,对吧,基本都是一次性的,什么都没有留下。而 auto research 呢,就是把你的目标规则判断的标准写清楚之后啊,让 ai 自主运转的这么一套流程,不需要你介入,而是当你第二天醒来之后呢,你就会发现,哎,他其实已经跑了一百个测试,把最好的那一次给你了。 所以我当时研究了一下就发现,其实我们很多人应该都需要这么一套方法吧,就是把你反复跟 ai 沟通的这个过程呢,变成 ai 自己跟自己博弈,然后我们只需要定义那个规则就是什么是好就可以了。所以接下来呢,我给大家分享一下,我到底是怎么定义的,以及这套流程它到底是怎么跑起来的来。 首先呢,它已经是一套完整的 skill 了,所以我会把它放到吉他上面给大家分享。不过为了方便演示呢,我会把每个部分都单独拎出来讲,方便你理解。首先第一个部分就是需求上的定义, 因为很多时候其实我们也很难描述我们自己到底想要些什么嘛,对吧?最开始的那个问题呢,其实是最模糊的,但没有关系啊,比如我这里就说 我想做一个关于运动员身体数据分析的网页,好了,你看我没有提供太多的内容啊,就比较烦。然后呢,把 skill 拉进来选择模型,一般的我都会选择这个 g o m 最近这个五点一的版本,因为他对 skill 的 遵循度其实还是蛮高的。 然后你会看到这部分主要有两个工作,一呢,就是他把模糊的需求拆分成四个比较明确的要素了,比如说产品的功能,用什么技术实现,输出成啥样,以及做到什么程度了。二呢是他会整理成一份明确的验收清单,方便你在接下来执行的时候呢,会有一个对照。 然后第二个部分呢,就是既然需求已经定义好了,那接下来就是你如何把这个需求给到 ai, 让它做到最好。所以呢,我就在后台定义了三到五个维度,每个维度呢都代表着一种说话的方式啊, 比如说抽象程度,就是这个东西你得做到多细才行。比如说是一个简单的功能好呢,还是把每个功能点都列出来,就像这样它里面包含了很多的功能点和技术细节。 然后呢就约束这一块呢,就是你更看重什么?比如说是更少的代码来实现呢?还是说尽可能全面方面以后来扩展?比如这里他系统就选择了比较侧重可维护性啦,还有体验的。 然后扮演角色这一块呢,就是你让 ai 站在哪个角度来思考这个问题?比如说他就带入了体育数据分析师的角度来设立这个平台,这个网页啦,所以每个维度都会生成很多不同的 pro, 你 会看到的, 然后从中选择几个来抛,这样我们就会有很多不同角度的这个需求描述了,就像一道题目不同审题习惯的学生来去做的话,其实它的得分都是不一样的嘛,对吧? 那既然 prom 已经有了之后呢?那接下来第三个部分就是这个 prom 它是怎么生成的迭代的啊?简单来讲呢,就是每一个 prom 它都会生成第一版的答案,这一版的目的就是能用就行。比如说你看呐,我们打开这个结果, 他会先对这一本的答案进行一个整体的评分,然后看一下他们都差在哪里,比如说这里的可维护性才零点七,所以呢,他就会进入第二轮的修改迭代,我们看一下第二轮的答案是多少? 一点二,高了零点五,然后整体的评分呢,高了一点五,所以他就是大概就是这么一个循环的过程,然后直到第五轮结束或者是达标了。 而且我发现他在自己内部评分的迭代的这个过程当中呢,其实他对于模型的依赖其实还是蛮高的,因为很多的模型他并不是完全 follow 你 这个 skill 的, 他们总会有自己的一些想法吧。但 这次智谱更新了这个五点一的版本呢,我发现他的 s w e bench pro 值啊,其实还是蛮高的,意思就是说他在面临一些长任务或者是复杂任务的处理的时候呢, 有些模型他可能做着做着就做歪了,对吧?但 g o m 呢,他就可以从一行代码开始,一路做到一整个完整系统的一个交付,这对于我们不做 y c 顶来说其实还是蛮有用的。 所以在他的配合下,最后最后一个步骤就是对比了不同维度的这些 prom 之后啊,最后他才会给到你一份他认为最好的一个结果。我自己还让 a 对 比了一下第一版和最后一版之间的一个区别。 确实啊,不管从视觉上看还是从功能上看,最后一版的这个效果当然就还是比较好的,差距还是蛮大的。 所以你现在也可以想一想,你平时是不是也有一些你很难去描述出来的一些问题,可能现在都可以通过这种方式来去解决啦。 比如说你很难去描述什么叫做好看,或者是你想要带一个 agent, 但是中间很多繁琐的过程,可能通过这个 skill 都能够让你去迈开第一步啦。所以希望这个 skill 呢,能够帮到你。我也把它分享到电话上面,如果有需要的话,你可以下载下来。 ok, 那 么今天的视频就到这里,希望能够帮到你, respect, 拜拜。

今天给大家分享一款简约高级 ui 风格 skill 来 ios 风格设计,视觉质感耐看。 copy 这个技能链接,添加这个技能包发送安装,添加后我们测试一下输入杠 up, 选择 ios 格拉斯 ui 技能,让它设计一个 cms 后台, 等待 ai 生成。生成好了,看下效果,整体风格跟 ios 接近,看下内容管理列表与表单,风格不错,再看下数据面板,符合预期,大家赶紧去试一下。

哈喽,大家好,上一次的视频我们聊到了怎么在 vs code 的 里面用 gpt 的 codex, 这期视频我们会接着去聊一下什么是 skill, 以及怎么在我们的 ai 里面去使用 skill。 先大概说一下 skill 到底是什么,大家可以理解为它是一个技能包,就是 别人做某一件事情,然后沉淀下来的一个类似于 sop 的 东西,我们拿着它的这个经验 来做这件事情就更加的事半功倍一些。现在网上其实已经有非常多的 skill 了,我们可以展示一下,你看腾讯,它我包在里面就是预安装一些非常基础的 skill, 比如说我们刚才看到的那个 对 dog x, 还有包括像 ppt 这些都是基础的我们操作办公软件的一些。那接下来我们可以去到 这个 vs code 里面给大家分享一下,我拿到一个空的环境之后,会先安装一些什么 skill, 就是 首先第一个必须要安装的叫做 find skill, 这个 skill 是 用来查找我们所需要的 skill 的, 我们直接告诉他帮我们安装 find skill 就 可以了。 用 skill 的 方法就是很简单,一个比较高效的方式,你直接告诉他你要用这个 skill 做什么事情,现在号的它安装完了,哎, 对,你可以用它试一下,比如说你做个 ppt, 让他给你找一个合适的 skill, ok, 他 已经给你找到几个了,他有一些数据支撑你,让你做决策,要不要安装哪一个之类的,这个是 find skill 的 一个用法。还有一个我推荐必安装的 skills, 是 那个 great skill, 这个 skill 可以 帮助你 写自己的 skill, 比如说你自己有一个工作流,你需要沉淀下来,你就可以用这个告诉他我要写一个什么样的 skill, 他 会帮你 创建你自己的 skill。 我 觉得这个也是一个非常有用的,那就是我是不是可以跟他聊了很长一轮之后,我跟他说把我们刚聊的东西沉淀出来的,是一个专门做什么场景的 skill。 是 的,没错,他就帮你新建文件,帮你规划文件目录应该怎么写,应该有哪些文件,每个文件里面的内容应该写什么,他都帮你规划好,帮你写好,你就去修改去看就可以了。我能不能去把张 zara 的 那个 skill 给装了,我就把这个网址 对,让他给你安装。他,现在我这个已经装好了。对,他如果就不知道安装这个 skill 怎么用,万事皆可问 ai, 我 们来展示一下,咱们用一个这是他给你做的 ppt, ok, 还不错,虽然也没有特别超出我的预期就是了,但我觉得这个还不错, 还可以,我觉得至少他整个风格是比较稳定的。也能给特别详细的一些需求吗?对,因为我没有给, 我就只跟他说做一个 ppt。 是 的, ok, 那 我们今天关于 skill 的 介绍就到这里,之后我们也会分享更多关于 webcoding 相关知识,如果大家有什么疑惑的话也可以给我们留言,拜拜!

大家好,我是郑一怀,今天我们来看一个超实用的技巧, codex skill 就是 技能,你可以把 skill 理解成给 codex 写的一份专用操作手册, 比如你经常让 codex 做同一类事情,比如检查文章有没有 ai 味,文案是否符合提词器格式等等,如果每次都重复说一遍的话,就会很麻烦, 所以这个时候我们就可以用到 skill。 skill 的 作用就是把这些重复要求保存下来,下次直接调用就行。 普通提示词就像是临时交代一句话,而 skill 更像是长期保存的 sop 代码词,里面有自己的 skill, 在 这个插件里面点这个技能,在里面你按需进行下载就可以。当然我们也可以创建自己的 skill, 接下来我们就用一个简单的事例来进行演示,创建一个新对话。当我们自己创建 skill 的 时候,我们可以利用 codex 提供给我们的创建 skill 的 skill 就 叫 skill creator, 就是 dollar 符 skill creator。 紧接着我们把我们的要求发给他就行,我们把我们的要求发给他,创建一个技能,名字叫 script checker。 当我们说检查口播 review 文案的时候,对提供的口播文案进行审查,具体要求就是前三秒是否足够吸引人,有没有 ai, word 格式,是否适合提词器,是否像真人聊天等等。 好,我们现在发给他,他现在正在创建 skill, 我 们看到现在这个 skill 他 已经生成了, 下面我们来用一下这个 skill 调这个 skill, 同样是输入 dala 符,然后再输入我们的 skill 名称就行,叫 scrape。 紧接着我们把一段我们事先准备好的文案发给他,文案就写的很官方, 很正式,我们发给他,让他们帮我们优化一下,那现在已经按照我们约定好的流程来进行处理了, 现在他已经改完了,我们大致来看一下,总体上来讲,他就是按照我们的要求,然后对这个文档进行一些优化。好,这是我们自己创建的 skill, 那我们也可以用别人创建好的 skill, 比如我们安装一个插图的 skill, 这个 skill 是 宝玉做的,它可以给文章来生成配图。我们要用别人的 skill, 那 我们第一步当然是要安装,安装方法其实也很简单,我们把人家的 github 链接发给他就行。 例如我们现在在谷歌浏览器里面看一下,我们要装这个 skill, 我 们点进去看一下,我们只需要我们把这个链接发给他,请帮我安装这个仓库中的 skill 发给他。 现在宝玉 skill 我 们已经安装完成了,他需要我们重启,我们来重启一下,重启之后我们来用一下别人的这个 skill, 正好这个项目下面有一篇文章,我们看一下这篇文章原先里面是没有配图的,它里边是纯文本, 里面没有配图。现在我们来用一下人家的 skill 啊,我们要调用人家这个 skill, 还是通过多尔福或者是斜杠,然后进行调用就行。我们现在用的是宝玉杠 article, 然后再输入我们的文章名称, 紧接着我们给他提一下我们的要求发给他,这样子他就会先扫描文章,然后给重点段落生成图片,并且把图片插入到文章的对应位置,他现在对于生图给我们提供了一些建议,我们 确认生成,他现在已经生成了第一张图片,我们看到现在图片他已经生成完成了,而且也插到文章里面了,我们可以看到他给我们插入了一些图片。 嗯,预览一下,这些就是他新插入的图片,我看效果还可以。这篇文章的内容就是今天我们讲的内容,他现在已经给我这篇文章生成了配读,效果还不错。 大家有什么问题的话可以在评论区留言,你要是知道有哪些有意思的 skill, 也欢迎在评论区给大家分享一下。

hi, 大家好,今天给大家分享一个使用 clock code 以及 five coding 时候的神器啊,能帮你大大提效。就这个大名鼎鼎的语音输入法 tablas 啊,我给大家先演示一下它的作用是什么,像在这里我自己绑定的快捷键是 option, 比如说我想跟 clock code 聊一个事情, hello, clock code, 今天的话,我想在我的飞书呃的这个知识库里面呢,去记一个想法,就是我想开发一个有关于小红书的 skill 呢,它有两个功能,第一个功能是我希望能够把任何的小红书的链接 呃,克拉扣能够去识别,而且第一个就它能转换成 markdown 的 文档。那第二点呢?如果说这个小说本身有些图片呢?我希望它能够把这些图片全部都下载到本地,那第三个呢?我希望它把这个本地的 markdown 文档结合这个图片,能够把这个博主的语言风格能够蒸馏出来。嗯啊,前面这个第三点就不要了吧,我想了一下,算了,还是前面就两点吧, 然后你像这样这样再按一下 option, 哎,然后你看到它就会帮你把你说的话给整理下来,而且很神奇的是,你可以看到它前面有识别两点,对吧?一个是转换成 mac 文档,第二个是下载本地,然后前面我说了它的第三点,是不是我说了,就是说我说最后不要了, 它也会能够把它非常智能的删掉,所以它非常适合用来去跟你的 coding agent 或者所有的 ai 工具对话, 然后你看他非常完美的也执行了。哇,这个实在太厉害了。然后这个就是 tabla 的 自己的主界面啊,你看到我已经使用了八个小时三十六分钟了已经,他这边提示已经节省了二十五个小时。但我觉得最重要的是他还会有个非常厉害的词典功能,就 能够让它的语音识别比其他的语音输入法精准的多的多的多。特别是比如说我自己的日常工作里面,在之前我有一个交互设计的一个工作,所以它会有非常交互设计的用语。你知道正常语音输入法是很难识别的,但是只要你在 tablas 里自己平时偶尔有什么专用的名词,你可以在这输进去添加它,在你下次语音识别时候就能精确的识别出来。 那除了正常添加之外,他还可以去批量的添加,我给大家可以演示一下怎么去批量添加,你可以这样跟他说,哎 call 你 好,我想去。呃,我最近的工作会涉及到一些交互设计的应用,你能不能帮我去找二十个交互设计的短语或者英文的那种专有的词汇,然后把它整理成 cv 的 这个表格给到我。好, 你其实只要这样跟 call 去说,然后相应的他就会把这个 cv 给到你,然后下载到本地。那你在下一步呢,你直接把它导入这个 cv 就 可以了。 像前面你看到我这边专门建了一个 tablas 桌面的文件夹,然后建了一个 csv, 你 只要双击它就会自动去导入。最后我说一下 tablas 跟传统的语音书法,比如说像微信呀,豆包书法,它有什么不太一样?那我自己个人觉得呢, 传统的语音书法更多的是把你所说的内容忠实的去给它记录下来,但是 tablas 呢,它其实是把你书的内容去转换成经 ai 整理的结构化的文本,那这个就非常适用于什么场合?非常适用于你跟 cloudco 以及一些 ai 去进行写作的时候。其实你的提示词呢,是需要精练而且准确的,那 tablas 就 可以非常完美的做到这一点。 那目前在桌面端,我自己在 pubc 定的时候已经几乎完全不打字了啊,所所有的东西,包括你跟 cloudco 对 话都用这个对应的一键, 然后让他去记录,去转写就完全可以了。那下一期我会来讲一下,就是我自己在手机端的配置又是怎么样的?因为我自己现在所有的呃端口的输入其实都已经转换成了语音输入, 而不是说传统的打字了,因为打字实在是太慢了。我觉得在现在这个时代,你能够把你的想法比较完美的去呈现给 ai 是 非常非常重要的。但是很多时候你打字其实会 老是要想,哎,我现在打的对不对?对不对?其实是非常有损你的整个思路的,连贯的语音的输入的这种方式绝对是未来的一个非常大的潮流所在。那下一期呢,我会跟大家讲一下,我自己在移动端又是怎么样去配置的,以及为什么桌面端跟移动端我的语音输入工具会有不同的差异。

二零二六年一定是 web coding 年,今天呢就给大家推荐七个超级好用的 skills, 非技术人员也能轻松上手,让你去玩转 web coding。 第一个叫做 superpowers, 装上它以后, ai 不 会去答非所问或者直接去开干, 它会像一个导师一样,一个问题一个问题的去问你,帮你去把任务拆解成一步步的,然后呢才开始去写,对于不懂变成规范的人来说呢,这个真的非常重要。第二个叫做 from and design, 这个是 isopec 官方出的,非技术人员最大的盲区就是你的审美, 你知道页眉很丑啊,但是你不知道怎么去跟 ai 描述你到底想要什么样子,所以你如果不装这个 skill 的 话呢, ai 做出来的页面就是千篇一律,装了之后呢,质感是完全不一样的。 第三个叫做 planning with files, 这个最近在开源社区是疯传的,发布仅四天就收获了三点三 k 的 star, 它复刻了 meta 斥资二十亿美元收购的 minus 公司的核心技术,通过十九画的 markdown 的 文件来管理任务规划来管理进度追踪。厉害之处呢还在于 绘画级别能够去保持上下文的持久化,让 ai 在 构建过程中始终保持正确的方向。第四个 skill creator, 这个我之前的视频也给大家去演示了大家这样的一个 ai 的 新闻的一个爬取, 这个呢也是 noshop 官方出的,工作中任何重复超过三次的事情,你都可以去把它变成一个 skill, 不用去写代码,他问你问题,你回答就好了,自己造工具的感觉非常好。第五个那是 book lm, 简单来说就是让 cloud 直接去查你的资料,你把文档,把笔记丢进 book lm, cloud 回答。 那之后呢?这个 ai 回答问题啊,就不用去靠猜了,直接从你的知识库里面去找答案,这个特别实用。 第六个, best minds, 来自 ai 产品经理陈峰,这个 skill 的 核心思路特别有意思,我们写的提示词有时候反而去限制 ai, 同样的问题,让 ai 去帮你去找,去模拟世界上最懂这个问题的人来回答,你用了真的有奇效。第七个, find skills, 这个呢,就是你的技能搜索引擎,你知道 cloud 能够去帮你去做某件事情,但是不知道用哪个 skill, 那 这个时候你就别去瞎找了,直接用 fun skills, 从庞大的技能库里面去找到你 最合适的那一个。 ok, 那 这七个 skill 的 获取办法我也放在江学展 ai 学习圈了,有需要的朋友评论区也可以安排。那如果想了解更多的 ai 使用技巧和工具呢?也想在 ai 路上和我一起同行呢?我们学习圈去见。

大家都在谈 scale, 好 像万物都可以 scale, 但是 scale 到底是要解决什么问题,很多人是没有搞清楚的。 fold 作为一个通用的大模型是非常强大的, 但是小蓝是个产品经理,小红是个内容创作者,小绿是个研发。你们都使用 cloud, 但是你们使用的场景和流程肯定是不一样的。怎么才能把 cloud 打造成一个跟自己专业领域匹配的工具? astropica 给到的答案是 scale。 通过 scale 可以 让一个通用的模型稳定地处理专业的任务。那这个视频我会带着你从零搞懂 scale 是 什么,去哪里找靠谱的 scale, 怎么安装,以及怎么创建一个适合你的 skill。 那 skill 是 什么呢?最简单的 skill 就是 一个 skill 点 md 的 文件,它主要分成两部分,第一部分是压冒格式的头部,主要定义名称和描述。第二部分就是具体的任务说明,也就是提示词。 比如说我现在要写一个产品经理的周报, skill 大 概是长这样子的名字是 pm weekly report。 description 是 当产品经理说我要写周报或者总结本周工作内容时,将产品经理一周零散的工作内容整理成周报。 下面具体的描述是包括你的输出格式。巴拉巴拉,你的数据来源,巴拉巴拉,禁止出现什么样的内容,巴拉巴拉,这就是一个完整的 skill。 那这里面最重要的就是 description 这一行,因为 cloud 会根据你当前的任务和每个 skill 的 description 去做语义匹配,匹配上了才会加载这个 skill。 你 的 description 如果这样写,用于总结每周工作内容,它很有可能就出发不了。 所以 description 不 只是介绍,它实际上决定了 skill 什么时候处罚。写得越贴近你真实的说话方式,处罚就越准。复杂一点的 skill 不 止一个文件,而是一个文件夹的结构。 skill 点 md 是 说明书告诉 plu 的 这个 skill 是 做什么的,什么时候用,基本流程是什么? script 是 工具箱 放一些可执行的脚本,比如说你要做一些数据的转化,需要靠程序代码来实现就可以用 script。 reference 是 放资料参考资料的,比如说你项目的背景, p r d 的 说明你的 api 文档等等。 ss 是 放一些静态的资源,比如说你周报的格式、实体文档、配置文件等等。 scale 主要有两个来源,第一个是 isropic 官方的 scale 仓库,这里面的 scale 质量都非常高, 也非常适合新手先去学习人家是怎么写的,我自己有几个比较常用的。一个是 frontend design scale, 它是专门用于前端设计的, 装了之后, clog 在 做页面和组建的时候,就会更加关注审美、布局、交互以及视觉的完成度,而不是只给你一个功能能跑通的东西。 另外还有比较常用的是办公套件、 ppt、 pdf、 excel、 doc 等,适合处理日常的文件编辑、格式转化、内容提取和文档生成。 还有一个比较常用的是 web app testing, 它的底层是 play white, 主要是做浏览器的自动化,是可以让 cloud 去调用浏览器的。 第二个来源是 word excel 推出的 scale 市场里面有不少公司和团队官方发布的 scale 整体的质量都非常高,也适合参考大型的团队是怎么去设计 scale 的。 嗯, scale pub 更像是一个聚合的目录,它收入了很多个人开发者发布的 scale, 它的好处是数量,数量多,覆盖面广,但是质量也会参差不齐。这里有一个安全提醒,一定要说 scale 不是 只有文字说明,它可能还会带着 script 的 脚本,而脚本是可以读文件执行命令访问网络的。比如说你下载了一个帮你整理文件的 scale, 但是如果这个脚本里悄悄加了 一些往外发送你文件的信息命令,那你的信息就会被泄露。所以第三方的 scale 尽量下载官方或者是高 star 的, 或者是安,安装之前看看 script 写的是什么。怎么安装 scale。 安装 scale 的 方式有两种,如果你是用的 cloud 点 ai 的 桌面版 astropic 官方的一些 scale 已经内置好了,点击 add scale, 直接在设置里添加就可以了。注意, chat 模式和 code 模式能用的 scale 是 不完全一样的。 如果你是在 vs code 或者终端里使用 cloud code, 要先运行这个命令。这个命令是把 astropica 官方 scale 的 仓库注册成 cloud code 的 插件市场,注册完成之后,你就可以在 cloud code 里直接 使用 plug in 选择需要的 skill 进行安装。如果是第三方的 skill, 最简单的方式就是直接把 github 的 链接丢给 cloud code, 让他帮你安装这个 skill。 安装的位置主要有两种,一个是个人的 skill, 是 放在这个目录下的,只对你个人生效,所有的项目都能用。比如说你自己的周报 skill, p r d 写作的 skill 这类只属于你的工作习惯。 还有一个是项目的 scale, 是 想放在项目的根目录下的,可以提交到 get 仓库,团队成员拉代码后就能一起使用。比如说团队统一的需求评选标准, p r d 的 模板规范、文档发布说明流程等,适合放在项目的 scale 里。那 scale 要怎么创建呢? cloud 有 一个专门写 scale 的 scale, 叫做 scale creator, 创建之前呢,你要想清楚这四件事,这个 scale 是 解决什么任务,应该在什么时候出发,跳出来帮你,它的输出长什么样子,有哪些规矩是不能破的? 这四个问题想清楚了之后,生成出来的 scale 才会真的好用。 cloud code 会帮你生成 scale 文件,但是生成完了之后,还有一个被很多人忽略,但是非常重要的事情就是一定要做测试。 scale 的 测试呢,主要测两件事,第一是能不能触发,用你平时真实说话的方式去描述一下任务,看看这个 scale 会不会被自动的调用,如果没有被触发,那就说明你的 description 写的不够贴近你的真实表达,去改 description。 第二是触发了之后,它的输出对不对, 如果输出的不符合预期,那就说明你的 scale 点 m d 的 论文里的流程约束和事例写的是不够清楚的,需要改论文。当然了,也不是所有的任务都适合做成 scale 的, 主要看这四个问题,第一是它会不会重复的出现一次性的任务,是不值得封装的。 第二是他有没有固定的流程,每次都得临场发挥的封装也没有用。第三是他有没有明确的输出标准,如果你都说不清楚他输出应该是什么样的,那你的 skill 写的也不会清楚。 第四是是不是在特定的场景下才需要,如果这个场景太宽泛也不适合,场景太窄就没有必要。有人也会问, skill 里面也有提示词,可能还会调用工具,甚至还会用到大模型的能力。那它跟 prompt, 跟 mcp, 跟 sub agent 到底有什么区别呢?它的区别不在于内容,在于它解决的是哪个维度的问题, prompt 解决的是这次怎么做的问题。你写了一段提示词,告诉 cloud 这次任务的要求,格式规则,用完了就没了,下次还得重新写。那 prompt 只是一一次性的口头提示,而 skill 解决的是这类任务永远这么做。 skill 里面确实也有提示词,但它是被持久化封装的,你配置一次以后, cloud 遇到同类的任务就会自动加载,不需要你每次都重新说。 mcp 解决的是 cloud 能接触到什么, mcp 是 工具的连接层,没有 mcp, cloud 就 只能看你粘进来的内容。有了 mcp, 他 才能主动地去读 jara chanel 连数据库。 mcp 扩展的是 cloud 的 信息边界,回答的是你能拿到什么样的数据。 那 scale 扩展的是 cloud 的 行为方式,回答的是我拿到了这个数据之后该怎么处理。这两者正好是非常好的配合关系, m c p 负责取数, scale 负责处理。那我们最后再说一下 sub agent, 有 的 scale 也会调用大模型。 你的面试官如果问你在这个情况下为什么不用 sub agent, 而是用 skill 呢?这么问你可能会蒙我换个问法,是不是接入了大模型就是 agent 呢?这个问题是不是就会更简单明确? 是否需要 sub agent 的 关键不是在于调用了大模型,而是这个调用了大模型之后,它是否有独立的目标和自主决策权。 比如说我写 p r d, 我 调用了生图的大模型去生成架构图,这种就适合做成 skill, 因为它的本质还是在做能力的封装。 如果某个问题需要根据目标自主决策,那你就适合交给 sub agent 去做,它是一个具有局部自制能力的小 agent, 用了一段时间之后,你的 cloud 会开始积累越来越多的 skill, 它可以进行 p r d。 的 写作,进行需求的审,进行用户反馈的分析,它就不再是一个聊天工具,它就开始像一个真正懂你的工作节奏的协助系统。

这九个 skill 是 我搞 vip coding 用下来真正离不开的,装上之后效率高到回不去。 以前 ai 写完一堆 bug 还得我自己收拾。装上它们后,规划、测试、安全它全自己包了。 挨个案例。第一个, superpowers, 社区第一神器,他把一整套工程流程装给 ai, 先头脑风暴写,设计出计划,再分头执行自己测试,从此 ai 不 再上来就闷头乱写。 第二个,卡帕西的开发铁律专治 ai 三大病,不确认就乱假设五十行能写完,非写五百行,还有乱改不该碰的代码。 第三第四个,验证和安全,一个让它真在浏览器里点一遍你的应用,一个上线前帮你扫安全漏洞,密钥注入全揪出来 做前端的装 friend friend design 界面不再是一股 ai 模板味。写 react 的 装 arduino 那 个五十七条性能优化规则直接背给他, 再装上联网抓取的 drivercraw 和能跨绘画记住你偏好的 supermemory, 他 就既能查到最新资料,又记得住你这个人。模型已经够强了,拼的是你给他装了什么,挑三五个先装起来,皮感立竿见影。

嗨,大家好,我是齐帅。这两天我接到了一个咨询,是一位朋友啊,有粉丝在后台找到我,想让我帮他做一个智能体,是写标书的工具啊,说实在的,他所在的那个行业我一点都不懂。呃,他那个标书呢,也特别繁琐,字数特别多,页数也特别多。 我首先看了一下之前那些标书,大概是有一千一百多页,是有六十多万字,看到这个数字的时候,我心里就有数了, 因为每次投完标以后,这个标可能会留标,留标之后可能还会有第三次投标。那第三次投标的时候,里边的内容要根据最新的投标的信息去修改和调整,调整本身难度不大,但是问题是页面太多,字水很多, 他需要非常繁琐的从里面摘取信息,找到对应的内容,按照下次投标的要求一条条去调整。你说白了就是前面只要你的思路确定完了,以后呢?后面全是苦力活。他找到我以后,我就开始在想怎么去解决这个问题。 后来我的思路很明确,第一,我会帮他做了一个自动化的工作流,这个流程绝对是自动化的。第二,我得拿到你之前做的标书的标杆标书,因为只有让 ai 去读取你这个标书,你这个标杆标书长什么样, 理解它所包含的内容和思想以后,后面生成出来的标书的质量才会提高。所以说我就把标杆的标书拿到以后,生成了 markdown 格式,我就拿这个 markdown 去训练我的 skill 了。接下来最核心的目标是让这个 skill 能在 collab code 里面被频繁的反复的调用使用, 让 collab code 去学习这份标书以后,我就按照我的要求以及这位朋友的要求,再让 qq 去做约束, 约束完以后再定义它应该产出什么样的内容。经过经过我这边紧轮的调试,这个 skill 算是写完了。刚开始的时候 skill 的 体积比较大,因为它毕竟内部包含了一些其他的参考文件,所以后来我又用又用 codex 帮我把 skill 压缩了一下, 把 markdown 的 内容精简, queue 里面的行数也在减少,尽可能的在约束不变的情况下,减少整个 queue 的 占体积。 queue 做完以后,我想了一个问题,对方这个客户他既没有 cloud code, 也没有扣代码, 所以说最后我又把 queue 做成了元宝、豆包千万等这些国内大模型可以调用的形式。但是有一个非常棘手的硬件条件,因为每份标书上下文的字路实在太多了, 你想想六十多万字,一千一百多页,我担心这些国内的平台根本就读不完,所以说我就试了一下,让它去扣子,但是效果其实也不是很理想。最后没办法,我也是远程去知道它安装 cloud code, 把这个 skill 也给安装上了。 虽然说整个 cloud code 它呃用的界面全是英文的,它其实背后的模型我让它买的是国内的模型安装好以后,我就按照它的要求,当天晚上也尝试了一下整个 skill 生成的,结果 当天晚上尝试了一小点一小部分,感觉结果还不错。第二天他又给我发消息说这个 q 生成的结果非常不错, 说这个东西解决了他很大的问题,效率也得到了指数级的提高。我就跟他聊说,其实你们这些传统行业里面这种重复应用工作非常多,但是由于大家对信息化和 ai 技术掌握不是很足,还只是用传统的方式慢慢的去手搓。 但是站在当下,大模型其实已经可以帮我们去解决非常多的工作了,今天可能帮忙去解决写标书这个场景只是一个引子,希望未来的时候,大家可以带着一个 ai native 的 思维去做工作,去做思考。 后来我们也是慢慢断断续续的去聊,最终产生的结果,因为毕竟能够大幅度的提高效率,所以他也非常高兴,说这个东西写的很棒。这个事情其实到现在为止,我心里也非常高兴,因为毕竟我也是通过这次合作也赚到一些好处,也收获到了别人对我的认可,其实这是我非常高兴的, 但是可能我做这件事情最主要的是立他和站在他的角度来讲,这是一个互利的一个协调关系, 大家都得到了自己想要的东西,所以说是非常高兴的。最后说,如果说你身边也有一些朋友和同事 想要通过信息化,想要通过 ai 大 模型去解决问题的,可以跟我去建立联系。回过头来想这件事情,其实我的感触也挺大的。我们 it 行业,站在互联网行业的角度来看,可能觉得身边的人很多人写 agent 都会写 q, 都非常擅长使用大模型。但是如果说我们把视角往下沉,下沉到具体的传统行业来看的话,其实还有很多人不会用的,所以说后面我可能会去做一些像传统行业的教程以及讲解,希望他们能够通过我的教程能够解决他们日常的工作问题,提高自己的工作效率。

最近做了一个这个 skill, 这个 skill 的 话是可以帮你的 web coding 产品,然后在 reddit 这个论坛上,然后寻找种子用户,然后并且呢自动呢帮你去拣写一个回复的这么一个文案和方案。比如说我这里之前做了一个自动填表单的这么一个小工具,然后我就 安装这个 skill 到 codex 中,然后使用它啊去找这个 redead, reddit 上的这个这 reddit 上的这个种子用户机会, 让它给我生成了这几个报告吧。其实这个 skill 安装完之后呢,实际上它能够帮你生成三个报告,一个是这个 brand, 这个 brand 的 话就能够自动地帮你去总结你当前这个项目中, 你这个产品的定位是如何的啊?然后一些核心的功能,然后一些这个 用户痛点之类的,其实它也是能够帮你去做一个你对自己这个品牌产品的这么一个大概的一个初印象吧,然后它就会给你基于这些呢,然后去 ready 上去寻找一些种子用户,它通过去寻找各个子板块,然后帮你生成一个这个 一个文档方案,比如说这个就是这个的话,他生成了这个之后呢,帮你筛出来值得记录的机会,比如说他可以直接帮你去把这个帖子列到这里, 然后你就可以直接去点就可以看到呃,这个圆帖子是如何的?然后他会基于这个圆帖子呢,给你写一个这个回复的这么一个方案啊,他这里会有一个回复草稿帮你列出来了,然后中英文其实都有哈,你可以自己看,然后去编辑帮你筛选出来一些高价值的,可能转化为重点用户的 这么一些。现在做独立开发其实蛮多的哈,希望这个 skill 呢,可以帮助到大家。然后这个 skill 已经在 github 开源了,可以在我的这个仓库里找,可以稍微给大家放大一下, 直接在 github 上搜这个就可以了。如果有帮助你的话,记得给我一个三连,然后给这个项目点点 star 之类的。好的,今天就先这样,之后呢再分享一些 skill。 最近写 skill 写的还挺多的。

今天给大家分享 cloud code 的 必装的 star skill。 第一个 superpowers, 里面有二十多个子技能,覆盖整个开发流程,但是不要全开,只用 brainstorming 和 t d d 这两个就够,其他的按时加载,全开只会浪费上下文。第二个 planings fails, 把任务计划写进文件里,不存脑子里,上下文压缩了,对话清空了都没有关系,重新读一遍文件接着干,彻底解决做到一半是一的问题。 第三个, uix pro max, 内置六十七种设计风格,加一百六十一套配色方案,直接告别那种一眼看出来就是 ai 出的土味界面。第四个 code review, 多 agent 一 起省代码,还能自动过滤不太靠谱的结果,减少误判。 第五个 code simple file, 代码写完之后啊,自动再过一遍,把重复逻辑合并,勇于的函数清除,写完就是干净的,不用你自己再整理。第六个 web a p p testing, 接入 playwrite, 自动化测试啊,一条指令跑完,测试截图出报告,不用手动,一个一个点。 第七个 wrap loop, 想提前下班,直接 hook 拦截,再塞回去直接着干,直到做完为止。第八个 m c p builder, 四个阶段引导你从零搭一个 m c p server, 不 懂底层也能跑通,省掉大量的踩坑时间。第九个, ppt x, 直接生成可下载的 ppt x 文件啊,不是给你们的文档,让你自己去排版,是真正能打开用的成品。第十个 skill creator, 官方的原技能带 excel 测试框架,内置的技能不够用,自己造这个技能,教你怎么做技能。用上这十个 skill, 基本把 excel 测试框架拉满了。

superpowers 是 一组给 ai agents 使用的工作方法技能。它不是让模型更会聊天,而是让它更会做工程。第一步,先判断任务类型, 想清楚再动手。用 blizzard and writing plans, 遇到故障用 systematic 的 bugging 先找根音写功能,害羞 bug 用 tdd 把验证放到前面, 任务能拆开就用筛选决策 development 病情推进交付钱。用 by verification before completion 来证据说话,需要合并审审,收尾时也有对应的流程技能。所谓 superpower 是 重点是把直觉变成可重复流程。对 codx 来说,它像一套工程纪律,先选对技能,再让 a 阵开始工作。

如果你刚开始使用 skill, 一定要装这五类十二个必备 skill, 包含信息收集、自媒体创作、产品开发、日常办公等等,让你爽到飞起。第一类,找 skill 和做 skill 的 第一个, find skill。 如果你在用 ai 的 时候 不知道该装哪个 skill, 直接把需求告诉他。比如帮我找一个做 ppt 的 skill, 它就会自动帮你搜索、筛选,甚至帮你直接安装。第二个 skill creator, 它可以帮你把 把每天重复的工作,整理资料、写小题、做报告等等,这些封装成一个可附用专属于你的 skill, 持续叠加,长期价值非常高。第二类,资料搜索和知识处理。第一个, agent research, 一个免费的可 以全网帮你找素材的 skill, get 哈布上 stat 数一路飙升。第二个, notebook a o m skill, 它可以把你采集来的资料批量的导入 notebook a o m, 让它帮你微纳分析总结。如果你经常学习和整理资料,再加一个 android 图, notebook a o m, 它可以一键把任何内容 转换成簿刻、 ppt、 思维导图、信息图等等,这个真的很像。第三类,浏览器自动化第一个, rather use 或者 openclean, 你 可以理解成给浏览器装上手和脚,打开网页、点按钮、填表单、截图、爬数据等等,这些重复的操作,它都可以帮你搞定。第四类,产品开发第一个, is talk, 是 硅谷大神 y c 创始人开源的一套工程团队式工作。它通过六个 强制性的问题,帮你从一个想法、酗酒到开发、测试、发布,它都能给你一套成熟的流程,非常适合现在 web 扣 和做产品的人。第二个, and 点赞专治 ai 页面太丑,它能够帮你优化排版、配色、动效、交互细节,让你的页面变得更加的专业,更好看。五类内容创作第一个 billman neither, 它能够帮你把 ai 生成内容改写的更加的自然,更像人类写,非常适合写文章口播和短视频脚本,用它过一遍之后看不出来任何 ai 的 痕迹。第二个宝玉 q, 这是一个内容创作者必备的 skill 的 宝库,图片、 ppt 知识,漫画、文章配图等等各种图片生成 skill, 以及自动发布到各个平台的 skill 全都有了。如果你是做自媒体,这类 skill 非常值得重点观众。第三个就是 cloud 和 codex 官方发布的办公 skill, ppt, word, excel, pdf 等等,这类适合所有的职场人日常办公都可以,用起来,效率翻倍。

tiktok 上面啊,将近有二十万人点赞的 superpowers 到底有多厉害?那作为增长速度最快的开源项目之一啊,连 osrbic 官方都把它给收入了。那 superpowers 啊,它不是一个 skill, 而是一套 skill, 共计十四个,是给 ai 用的工作规范,你可以把它想象成它就像是一个严格的监工。动手之前啊,先把方案写出来,看完没有问题, ai 才能开始干。 另外,不仅 cloud codex 能用,主流的 coding agent 它都可以使用它。那很多人就有疑问,那 superpowers 里面有十几个 skill, 我是 要全部装还是只用装其中几个就可以了?那先说结论啊,新手只需要装这四个核心的 skill 就 够用了。第一个, winstorming, 头脑风暴,装了它之后啊, ai 必须先问完你所有的问题, 确认完需求才能开始写代码,再也不会上来就乱写了。第二个, writing plans, 写计划,它会把你的需求啊确成一个一个小任务,每个任务只有两到五分钟,而且会写清楚要改哪个文件,怎么验证对不对。第三个, test driven development 测试驱动开发,听起来很技术啊,其实就是先写验证,再写功能,确保每一步代码都经过了校验,不会写了又挂。第四个 啊,它会逼着 ai 一 步一步分析原因,而不是瞎猜乱改。那这四个也是 superpowers 要集合中安装次数最多的,放心用,不踩坑安装啊,也比较简单,输入这些命令啊就够了。我把它放在评论区置顶,方便你复制。那下期啊,我会介绍另外一个爆火的开源项目, everything cloud code。 关注奇哥啊,教你从零到一学 ai, 解放你的生产线。

兄弟们,大家在用 ai 的 时候是不是有这种痛苦的体验,当我们想去网上提取某一项数据的时候,发现瞬间托管就没有了,如果是的话,我们花一分钟时间把这个问题解决了。依靠 open c r i, 它内置了 比如 b 站、知乎、小红书等等众多的知名网站的内置命令行,无论是拉取数据、点击按钮或者是提取元素等等,这些对它来说都非常简单。最重要的是它是通过后端命令行方式实现的,这样的话它是不费任何的托管。它还有一个更杂裂的功能,就是当我们的其他网站不在它的内置浏览器之内的时候, 它可以把它直接 c r i 画。话不多说,下面直接上实操,这里已经帮大家梳理出 open c r i 全网最简的使用指南,如果大家有需要的话可以在评论区留言。首先确保我们的 note g s 是 在二零以上的版本,然后只需要复制这条命令,在自己的终端上点击回车就可以安装上了。第二步,打开我们的谷歌浏览器,在里面搜索 open c r i, 然后它自动会安装上,安装好了就是这个样子。第三步,就是验证是否已经安装通过这里只需要复制这条命令,点击回车就可以,当我们看到 anything looks good 就 可以了。 第四步,把我们最喜爱的智能体,例如小龙虾、 hermes 或者 cloud code 等等装上 scare。 本来 opencri 的 它内置了非常多的一些命令行,但是有了这个 scare 之后,我们不需要学这些,只需要用自然语言发任务就可以了。装好之后我们直接让它去搜索小红书最火的五个话题,来验证一下它有多厉害。 这里我用的是 cloud code, 以前当没有装 o n c r i 的 时候,我们根本就不敢让他去执行这一类的任务,因为大家可以想象到小红书上的视频到底有多少。这个任务可能还没执行完,我们都已经开始报 token 不 足了,报警了,而现在我们执行完这个任务,仅仅耗费的是解析这个任务的 token。

大家好呀,特别开心,我的这个项目终于突破一百星了,而且目前同类型的开源项目里还没有类似的上传呢。应很多粉丝的要求,今天就给大家跑个简单的 demo, 话不多说,直接开干。首先我们在 codex 里调用 skills 输入需求就行,比如我这次就输入构造一个拖拉机模型,说实话也挺好奇会生成啥样,咱们一进到底看看。 搞定了,生成的效果还真不错,车架、发动机照、驾驶平台、防翻架、前后轮、轮毂、 胎、快车桥、排气管、方向盘、后挂机和灯具这些细节都有了。不过我这次的提示词其实很简短,大家有什么具体需求直接跟他说就行。比如这次生成的是二轮的,后续要是觉得需要调整也完全可以,毕竟不可能一次就做到完美嘛。 对了,这个 skills 还支持上色之类的功能,你把需求说清楚就好。这次演示就先到这儿,后面我会继续完善这个 skills, 还打算做一个贴合 kata 场景的 skills 呢,希望大家多来用用,给我提提意见, 多多支持呀!感谢大家的关注,之后我还会分享更多 ai 应用相关的内容,咱们下次见。

今天给大家分享一个做的一个 skill, 那 这个 skill 呢?主要是为了满足后端开发, 其实我是想把我们后端开发的整个思路给它去融合到这个里面,那我们 java 开发的话,其实就分几个阶段,第一个是我们最早的 java se, 第二个就是我们单体的框架,第三个是 spring boot 和 spring hard 框架,再往后面就是一些中间件体系,然后到后面会有一些高并发多线层的一些操作,还有我们的设计模式, 还有我们的代码规范和加固设计。那基于这个大的框架,我们把一些 呃行业里面相对排名得分比较高的书籍作为这个 skill 的 凝练的一个内容,然后在整个里面我们去构建了一个缩影的架构。 所以当我们去用这个 skill 的 时候,呃,如果碰到这个语言基础类的问题,他会去到对应的缩影,去碰到这个框架使用的高并发的设计模式的架构的, 都会到目录的文件,那这个文件一个是它的框架,第二个就是到所以里面的一个指引,如果到所以里面比方说如果是高病房的话,可能还会进一步去往高病房的问题去细划。 现在这个模式整个用下来写下来代码质量会比之前高一点,但是整个文档的提样也很大,不知道还有什么新的解决办法。

你有没有遇到过这种情况啊,装上的 skill 在 cloud 里面找不着,或者换到其他的编程工具后啊,又要重新装一遍,尤其是对于新手,根本搞不清楚 skill 安装命令的各种选项的含义。装了一堆 skill, 发现根本没有办法有效管理,于是我做了一个本地的工作台,叫 skills hub, 可以 实时管理你的 skill。 它的作用很简单啊,把你所有的 coding agent 的 skill 全部都放在一起,放到一个地方看,一个地方管。那打开首页啊,你能看到当前有多少个 skill? 那链接的哪些 agent, 哪些已经同步,哪些缺失,哪些异常?那在 skill 的 管理页,你可以像看矩阵一样,看到每个 skill 在 不同 coding agent 下的安装状态。 那在这里,你不用手动地对 skill 进行复制粘贴啊,直接可以选择批量的同步。如果你有新的 skill hub 项目啊,或者本地 skill 目录,也可以输入地址,一次性安装到所有的 agent 里面,比如这里。我们以这个 skill 为例,那我们只需要把它填在这个地方, 直接点击安装。那我们看到这个 html ppt skill 已经安装好了,那我们在本地试验一下, 看这个 html ppt 的 skill 就 已经安装好了, 是不很方便?那另外啊,它还支持直接编辑 cloud 和 codex 的 全局规则。那我们在这里可以直接编辑我们的 cloud dmd 的 这个文件。那这个项目目前已经开园了,你可以根据自己的需求来定制它,或者把这个项目克隆到本地,直接运行即可。那如果你希望加入新的功能啊,欢迎在评论区交流。

上个月我再调一个 prompt, 改了大概十几版,每次改完我都觉得这次应该行了,跑几个测试,有的好了,有的坏了, 继续改。改到第八版的时候,我已经不记得第三版为什么被丢掉了,第六版和第八版到底哪个更好也说不清。这种感觉你应该很熟悉,手工调优就是这样,靠直觉,靠介意,靠运气。那段时间我正好在看 capace 的 auto research, 突然想到一个事儿,他让 ai 自己迭代训练代码,每次改一点跑,指标,好了留下,坏了回滚。这个 loop 跟我手工调 prompt 是 同一件事,只不过他用程序跑,我用脑子跑。后来我又看到 stanford 的 meta harness 论文讲的是怎么让 ai 诊断另一个 ai 的 失败, 再加上 anthropic 的 skill creator, 现成的评测引擎,三个东西拼在一起,我觉得有戏。所以我做了一个 self evolution skill, 不 只是给 skill 用, 而是让任何可评测的制品, prompt 代码、文档、配置都能丢进去跑。自进化 loop 制品,提供数据和指标, loop 负责试错和保留人,只需要定义什么叫好。我先把灵感来源说清楚,不然后面的设计你会看不懂。 三根柱子,第一根 capacity, auto research 给了 luke 的 股价。今年三月, capacity 发了一个六百三十行的 python 脚本,就干一件事,让 ai agent 迭代优化训练代码, 每次改一点,训练五分钟看指标,好了留下,坏了回滚。两天跑了七百个实验,找到二十个优化性能提升百分之十九。后来玉帝狗音卡把这个思路做成了 cloud code skill, 提炼出歪条原则, one metric constrained scope, fast verification, automatic rollback, git as memory。 我 看到这个的时候想的是,这不就是我在干的事吗?第二根 stem for the metahoni 给了诊断的大脑。 这篇 paper 解决的是一个很具体的问题,你让 ai 去优化另一个 ai 的 时候,该给他看什么?答案是完整的原始执行轨迹,而不是分数摘要。它们的消融实验显示,只给分数比给完整 trace 差了百分之四十四。 你可以这么理解,让一个医生看完整的病例化验报告影像,他能给出好诊断。你把这些压缩成三百字摘药,他只能靠猜。这一点对我触动很大。我之前调 prompt 的 时候知道某个 case 挂了, 但不知道挂在哪一步,为什么挂?如果能拿到完整的执行 trace, 诊断精度会完全不一样。第三根 anthropic skill creator 给了评测引擎的底座, 它提供了 quick validate 做结构检查, grader 做逐条打分, compiler 做 a b 盲审,还能自动生成 ground truth 测试用力 评测这件事最烦的是从零搭有现成底座,直接用三根柱子各自解决一个问题, auto research 管循环, meta harness 管诊断, skill creator 管评测。 我要做的是把它们接成一条能跑起来的闭环,而且不限定在某一种制品上。为什么不限定在某一种制品上?我一开始想过只做 prom 的 优化器,但拆到底层就发现,自进化路普需要的输入其实只有三个东西, 第一, artifact 被改的东西。第二, ground truth 测试用力定义什么叫好。第三, execution method 执行方法,怎么从制品、产出、输出公评测? prompt 满足这三个条件, skill 也满足,代码也满足,甚至一份创业 bp 也满足。 只要你能定义什么叫好。所以我没有做 prompt 优化器或者 skill 优化器,而是定义了五种制品类型。 prompt 类就是系统提示词, few shot 模板发给 l l m 补货回复。 skill 类就是 skill md 加 references 加 scripts, 加载 skill 跑 clot code 类,原代码文件跑测试或 shell 命令。 idea 类,商业文档设计方案, l l m 直接评估文档本身。 config 类, eml json 点 emv, 配置应用配置后检查系统行为。这个分类很关键, 因为不同类型的制频 mutation 策略完全不一样。改一个 prompt 关键词是表面层,改它的指令逻辑是核心层,把它拆成 chain of thought。 多步骤是架构层,但改代码的表面层是变量名和常量,核心层是函数实现和算法,架构层是模块结构和接口泛化,不是把 skill 改成 artifact 这么简单。 每一层的 mutation, 边界、评测方式,安全检查都要重新定义核心机制是这样的,怎么跑一次自进化? 整个流程分两部分, face 零的一次性准备,加上每轮迭代的八个阶段。 face 零做的事比你想得多,不只是件目录,它要分析制品类型,检查 get 状态,没 get 自动 in it, 然后准备 ground truth 数据做三路切分, dev 即百分之七十, holdout 即百分之二十, regression 即百分之十。再跑一次 baseline 评测,最后生成一份 evolve plan, 包含评测策略门,空域值起始 mutation 层,这份 plan 决定了后面所有轮次的行为,没有这个 plan, loop 就是 盲跑。每轮迭代八个阶段,大部分是标准流程,读记忆,改代码,写日记。 值得展开的是两个阶段, face 二 i did。 它有一个硬规矩,没有 trace 证据不许动手。每个改动提案必须引用具体的 trace 文件。比如这样, case 十二失败了, 因为 agent 把离职问题路由到了邮箱分类 trace 显示模型,在第三步选择了错误的锁影分支。如果我在 root index 加一个易混淆题时,输出应该从邮箱变成通讯录。没有这种级别的具体证据就不许改。 这不是形式主义,这是防止。感觉,这里可以优化这种 v based mutation l m 特别擅长给你一个看起来合理的建议,但实际没有根据,不加约束的话,很多轮次都浪费在感觉对的修改上。菲斯四有一个反直觉的操作,先 commit 再验证。 为什么不是验证通过了再 commit? 因为 get 是 安全网,每个 mutation 都有 commit 记录,即使最后被 revert 了, 审计轨迹也在。你可以回头看第七轮改了什么,为什么被丢弃,这个信息在 review 阶段会用到。还有一个原子性测试描述这个改动的时候如果需要用和字,就该拆成两轮, 改完之后 diff 超过五个文件,大概率不是原子的。说说三层评测,核心思路是,便宜的先跑,贵的后跑。第一层 quickget 秒集,每轮都跑,纯程序检查,不调 l l m, 查结构是否完整,安全扫描硬编码密钥,危险删除命令,一共十四条规则, 随机抽三个 g t k 试验结构,两条 critical 规则,不过直接阻断坏的迭代成本压到最低。第一层挂了就不跑第二层,这很重要,如果每次都跑完整,评测再告诉你,结构就有问题, token 烧得冤。第二层 devevil 分 中级,每轮都跑,拿全量, dev 级逐条跑,八种 assertion 类型,六种程序直接判 context, redux 这些 二种需要 l, l, m 做 yes no 分 类结果写入 pro case, j, s, o, n 供下一轮诊断用。第三层 strict evo, 大 概十分钟条件触发,不是每轮都跑,它跑的是 hold 到极, 就是优化器从来没见过的数据。如果 holdel pass rate 比 devo 低百分之十五以上,说明过你和了。 holdel 级是从 ml 训练班过来的思路, devo 级上分数涨了不代表真的变好了,可能只是在背答案。 hold down 是 你留的一手验证泛化能力,五维 end 门控每一轮改动都要过五道关,全部 pass 才保留任何一个 n o 就 自动 get revert。 结构第一层评测过了吗?进步 pass rate 够高吗?回归有没有之前过了,现在挂了的 成本? token 和时间在两倍以内吗?安全?有没有新的违规?为什么是 end? 不是 加权求和?加权求和的问题是这样的, 质量涨了百分之十,但 token 消耗翻倍。加权求和可能给你 pass。 pass rate 涨了百分之五,但有二个 case 回归,加权求和也可能放过去。这个决定在实践中被证明是对的。最常见的陷阱改了一个地方,修好了三个 case, 但悄悄搞坏了一个加权求和会放任出离离 and 门控会拦住回归维度,还有一个噪声处理,只有一个 case, 回归跑三次,两次通过,就算 l l m 噪声,不算真回归, 为什么要这样? l l m 评测本身有随机性,同一份制品,同一套 gt cloud, 跑四次, pass rate 能在零点七九到零点九二之间漂移。分层 mutation 思路很直接,从最便宜的地方开始改 类比 ml 里的学习率调度,先大幅调整便宜参数,再精细调整贵参数类 i 一, 表面层 最便宜,风险最低。 prompt 的 措辞和格式,代码的变量名和常量值, 改这些不太可能搞坏什么。 layer 二,核心层主要逻辑 prompt, 指令逻辑代码的函数实现 中等成本,中等风险。 layer 三,架构层,最贵的 prompt 拆成多部 chain of thought 代码改模块结构 高风险,但有时候不动架构就是改不动了。规矩是这样的,从 layer 一 开始,当前层连续三次 discard 才升到下一层,不准跨层, 三层都试过,都没改善。迭代结束一个实际观察,大部分改善发生在 layer 一 和 layer 二, layer 三风险太高,成功率明显低。但有时候问题确实出在架构上, layer 一 和二怎么改都改不动, 升到雷亚三,一刀切问题就解决了。设计想清楚了,工程落地我决定不硬依赖任何外部框架。 skill creator 很好用,但我不想把整个系统绑死在上面。万一你要优化的是一段 python 代码,装一套 skill creator 就 多余了。所以我写了三个独立的 python 脚本。第一个, evaluate assertion, 处理六种程序化 assertion, l l m 类型的标记为 skipped, 交给上层处理。第二个 structural check to py 做第一层的结构和安全检查,十四条安全规则扫描,按制品类型做针对性检查。 第三个 results tracker, pie 管理 results 点 tsv 和 experiments jason 两个日制文件。 gt 格式我做了兼容,你有 skill creator 的 evo 点 jason 直接能用,同时扩展了 contents, redux 等前缀语法, 程序化和 llm 评测可以混用。 trace 的 处理也值得说一句,我没有把完整 trace 塞进 prompt, 那 可能是几万头啃。 propose 只拿到 trace 文件的路径需要哪个自己去读,给地图不给权文,踩过的坑和还没解决的问题。 l l m。 评测的噪声,跑前几轮就撞上了, 同一份制品同一套 gt。 跑三次,结果差好几个百分点。你改了一行文本, password 从零点八五变成零点八七,这是你的功劳还是? l l m 随机波动分不清, 处理方式是优先用程序化 assertion。 l l m。 评测的跑三次取多数票, temperature 固定零, 不完美,但比裸跑好 gt 质量是天花板 gt。 标注本身有问题,无论跑多少轮都修不好那个 case。 我加了一条规则,一个 case 连续五轮没被修复,先怀疑 gt。 不 怀疑质品标记为不可修,排除出评测级成本。 skill 类需要启动 clock 的 进程,每个 case 执行成本不低。 l 二, evo 跑三十个 case, 光 token 就 不少。 l 三,跑一次大概十分钟,十几轮下来钱包能感受到,这不是免费的午餐。前几轮需要人盯,前三到五轮最好看一眼。不是不信任系统,是记忆还不够厚, propose 没有足够历史数据的时候,会提出重复的改动方向,等跑了五轮以上, pattern 积累起来了,后面的迭代方向会准很多。 idea 类型的评测特别难, 技术类制品有硬指标,跑出来就是过或不过。但 idea 类型,比如一份商业计划书,几乎全靠 l l m 判断,噪声大很多。而且有个 assertion gaming 的 问题, l l m 为了通过评测会加一句凑数的话, 但内容质量并没有真正提升。我加了一条,要求深度优先,不许刷分。但说实话,这条规则不算完全可靠。说到最后,这个工具让我改变了一个看法,以前我觉得 prompt engineering 是 门手艺,靠经验,靠直觉,靠反复试, 现在我觉得它更像训练,有数据,有指标,有反馈循环。你定义好 gt, 剩下的让 loop 跑,不需要猜这个改动是不是好了,门控函数会告诉你不需要手动回滚, get revert 自动执行。 但我也想说一句诚实的话,这个系统不会替你想清楚好的质评长什么样。 gt 是 你写的,指标是你定的,它只是帮你更系统的试错。如果你的 gt 本身就偏了,它会非常忠实地朝着错误的方向迭代。该想清楚的事情还是得你自己想。