给大家分享一个最近比较火爆的 skills 啊,这个名字叫做这个呃 gistac, 然后它的作者呢?是 yc 的 一个 ceo, 叫做 呃 gary tan, 它在过去的六十天里编写了超过六十万行的代码,二零一三年总共提交了七百七十二次的代码,二零二六年三个月就已经提交了一千二百三十七次代码。 那为什么呢?他自己说这个核心的原因是工具,然后他就是用这个 g stack 来实现的,那他在这个里面定义了很多的这个角色和专家。那比如说这个 office hours, 就是 在你编辑代码之前,通过六个关键的问题先去挑战你,质疑你,然后让你把问题想清楚。 那这个 plan ceo reveal 就是 会让你去重新思考问题。这个 ceo 可以 通过一些方法论,比如说扩展、选择性扩展、保持范围缩减等等,来去挖掘你的需求里面可能会有什么样的产品机会。 然后面的话就是偏向于工程业的,比如说是工程管理啊,然后设计师啊等等等等。还有代码的 reveal 之类的,总共是有十五个左右的角色吧, 大家可以去尝试使用一下。其使用的方法也很简单,你其实直接把这个项目的这个地址发给到 ai, 然后让 ai 来帮你安装这个项目就可以了, 然后你就可以通过这些命令来去把这些 skills 调用出来来去使用了。那我自己使用了一下,效果还可以的,因为我自己刚好在做一个这种一键的公众号排版的一个工具,或者调用这个工具让他帮我去做一些思考,你看他会给我去分析这个项目 优先级该怎么排布,哪些事情现在最好先不要做等等,它是按照一个 ceo 的 视角来去帮我去分析的。那这个 skills 适合谁呢?它在这里也已经写了适合 创业者、 ceo, 然后第一次使用 cloud code 的 一些用户,还有就是技术负责人和工程师团队,那我觉得每个人都可以去尝试使用一下。
粉丝771获赞4588

hello, 大家好,我是你们的荷兰瓜。在上期的节目中,我们介绍了如何在 windows 或者 mac 或者 linux 电脑上用短短的三分钟就能安装好 克劳德 code。 人工智能编程助手,今天我们就再花三分钟来教你掌握这个效率神器克劳德 code。 如果你是刚接触 ai 编程的新手,千万别被编程这两个字吓到,人工智能实在太强大,用起来超级简单,来来来,跟着我三分钟就能上手。 二、我们打开桌面上的克劳德扣的启动器,这个启动器是免安装的,我们在上期的视频里介绍过,这个启动器已经打包好了克劳德扣的所需要的软件环境,下载打开就能用,非常方便哦! 那你第一次打开克劳德蔻的,你会看到一个非常简洁的出示画面,屏幕中间最醒目的就是打开项目文件目录这个按钮。对于刚入门的小伙伴,我先来解释一下什么是项目目录。简单来说,他就是你存放代码项目的文件夹。 为什么要选择项目目录呢?因为克劳德扣的是一个非常守纪律的 ai 工具,它只会在你指定的这个文件夹范围内,根据你的指令进行自动编辑代码、调试程序和修正问题。 你可以把它想象成给 ai 划定了一个工作区,他就在这里面大显身手。选好目录后,我们就进入了克劳德蔻的核心操作界面,而我们从上往下一眼就能看清他的所有功能。首先,在窗口的最上方,你可以清晰的看到当前项目的完整路径, 这个设计非常贴心,哪怕你同时打开了多个项目窗口,只要看一眼顶部就绝对不会搞混,能清楚的知道 ai 正在哪个文件夹里忙活。然后往下看,你会看到克劳德扣的版本号,以及他那个超可爱的像素风吉祥物, 看到它就说明 ai 已经准备就绪,随时待命了。再往下看,你会发现一行灰色的字,来点这里输入,说说要我做啥。这就是你和 ai 沟通的地方。 用鼠标点击这行字,然后直接输入你的需求,比如帮我写一个登录页面,或者修复这个文件的 bug。 当你按下回车,克劳德扣的就会开始深度分析你的要求,制定出一步步详细的工作计划,然后像一个自身程序员一样,严格按照计划执行。 呃,如果你手头有多个项目要忙, cloud code 也完全能应付。你可以随时通过鼠标右键菜单选择打开项目,或者直接使用快捷键 ctrl 加 n 一 起按来开启新项目。 你甚至可以同时开启多个窗口,让 cloud code 在 不同的项目里同步帮你打工,效率直接拉满。 很通俗点说,使用 cloud code 就 像是请了一位自带工具箱的超级管家,你选定一个房间,也就是工作目录让他进去,然后在门口的小黑板,也就是输入框上写下任务。这位管家不仅能看懂你的需求,还能自己规划步骤,把房间打理的井井有条。 如果你有多个房间需要打扫,只需要开新窗口就可以啦。嗯,好了, cloud code 的 操作界面就是这么简单。 在下期的节目中,我们将一进到底,叫 cloud code 做一个完整的项目任务。记得给我神奇三连哦,咱们下期见,拜拜!

这两天有篇文章很火,是 cloudco 产品经理,他出来分享他是怎么样用 ai 彻底重构 pm 工作流的。主要就是这张图,有了 ai 之后呢, 产品设计、技术每一个边界就变得模糊了,然后有很多交叉的环节。那具体他是怎么样重构 pm 工作流的呢?他是构建了一个 ai 三件套,因为他是 cloudco 的 产品经理嘛,那肯定就是 cloudco 产品无限用嘛,所以就是他的三件套呢,一个是 clouda 作为他的思考伙伴,一起讨论一下策略啊。然后 coco 呢,就是帮他写代码,然后构建产品原型,然后 cocwalk 是 帮他处理邮件啊,日程这些日常的工作。所以在没有 ar 之前就产品,然后原型设计 技术开发是限行的嘛,有了 ar 之后,那身份边界就变得模糊了,然后三个角色是高度协调,交叉并行的。我截了分享里的一小部分截图, them 是 要比文档更受鼓励的,就说不要像以前一样,先写好一个很笼长的很完善的 p r d 文档再去开发。现在就是要有想法直接让 coco 去跑一个原型。我也想基于这篇非常火热的文章分享,谈一点我的个人体会。就我作为一个独立开发者,我也感受到现在 项目管理、产品经理开发这三层的身份边界是模糊的,那流程也不是无限的,就你没有那么多时间去构思好一个完善的产品该是什么样。好比说我举个例子, 这张截图是一个搜集信息系统的一个很完善的架构图,但是当时的话,我是找了一个渠道信息,然后推送到飞书上,我发现这样一个 demo 很好,我才有动力把它给完善起来的。那确实,我先跑了一个小 demo, 然后再去完善嘛。 现在流程不是限性的。但是第三点也是很重要的,就是人依然是主导。你要做一个复杂系统的时候,你一定是需要写好一个文档去让 ar 执行的,然后人同时要判断 ar 的 能力边界是什么。 就如果你不知道 ar 不 能做什么,你会发现它浪费在大量的时间在做无效的工作。现在我们跟 ar 写作去完成一个产品,那具体的工作不管是写文档还是写代码,都不需要人去做,但人要去主导,去主导写好框架,主导整个项目的目标。

nintendo 的 二太离谱了,一张图生成三十六个分镜头,直接就是一部微电影。哈喽,亲爱的小伙伴们,这里是娜娜的家。今天呢,我尝试了让 ai 自己做一部电影,整个过程呢,是这样的,第一步,我让语言模型自己想了一个带点反转的小故事,让我设计一下,这个好简单出彩,有反转。然后呢,我让他把这个故事拆成了三十六个电影镜头,我现在来拆分镜头。 接着呢,我把这三十六个镜头的脚本直接交给了三十六宫格的分镜拼图。也 就是说啊,这一张图里面已经包含了这部微电影的全部镜头。接下来呢,我就把这张图拆成了三十六张单独的图片。这里呢,我使用的是 openclaw, 直接丢给他,自动就帮我拆好了。如果你不用 openclaw 的 话,其实也可以使用 google a s studio 来做一个简单的拆图小工具。接下来呢,我把这三十六张图,每四张一组分成九组镜头。 然后呢,再分别把每组镜头交给 cds, 二点零,直接每四张图片生成一个十五秒钟的镜头。最后,我一共生成了九段视频,简单剪了一下,最终就变成了一部不到两分钟的微电影。我们来看一下,大概就是这样的,这就是赛博时代吗?还记得我的口号吗? ai 的 事情交给 ai 来做。整个过程其实很奇怪,故事是 ai 写的,分镜也是 ai 做的, 视频也是 ai 生成的,我好像只是点了几下生成,做了 ai 的 搬运工而已。好啦,如果你也想试一下这种 ai 自动拍电影的流程,可以自己玩玩看,希望你这次真的学会了,记得关注我,带你一起拥抱未来这个圣诞大奖,拜拜。

大家好,今天咱们来聊点特别的,这事可能会彻底改变你写代码的方式。我们要说的是怎么和一个全新的 ai 伙伴,也就是可撸 code 合作,真正掌握一种全新的更高效的编码工作流。 你有没有想过,如果你的终端他不只是执行命令,而是真的能思考,那会怎么样?嗯,我们今天要聊的可远远不止是代码自动补全这么简单,这是一种全新的更强大的交互方式。那么这个转变到底是什么呢?你看,我们都习惯了聊天机器人对吧?你问一句,他答一句,然后就等着你的下一个指令,这是一种被动的模式。 但我们现在说的代理,也就是 agent, 完全是另一回事,他是主动的,他会自己去读文件,跑命令,主动的去解决问题,而不是傻等在哪。 所以啊,这就引出了咱们今天的第一个核心观念,别再把 ai 看成一个简单的工具了,我们现在讨论的是一个全新的编工的伙伴,这已经不是人跟工具的关系了,而是真正的合作。那这个伙伴到底牛在哪呢?关键就在这儿, cloudco 是 一个能理解你整个项目代码库的代理,你看,他看的不是单个文件,而是整个项目的来龙去脉,他有权局观 好。那问题来了,这个新伙伴到底是怎么思考的呢?咱们得深入他的核心引擎,也就是一个叫做代理循环的东西。什么是代理循环呢?简单说,这就是 cloud code 工作的核心机制。你看,他就像一个不知疲倦的循环,先是收集信息,搞清楚状况,然后采取行动,做点什么,最后也是最关键的,他会去验证自己做的到底对不对, 通过这个循环,它就能独立地完成你交给他的任务。咱们可以把这个循环拆成三步来看,第一步,收集上下文,它会去看你的文件, get 状态,还有你给他的指令,把所有相关信息都收集起来。第二步就是采取行动,可能是修改代码,也可能是跑个 shell 命令。 但最最关键的是第三步,验证结果,他不会写完代码就完事了,他会去跑测试,检查输出,主动确认。哎,我做的这个事是不是真的成功了?这一点是质变的关键。好了,既然我们知道了他怎么工作,那现在就轮到我们了。想要和这个新伙伴高校合作,光了解他还不够,我们自己也得掌握一些核心的最佳实践,这才能发挥出他的最大威力。 接下来我要说的这一点,可以说是最重要的一个技巧。如果你想让结果好上十倍,那么这件事就是你最值得投入精力去做的。就这么一句话,给 cloud 一个验证自己工作的方法。 如果你今天听完只能记住一件事,我希望就是这件,让他有能力去自我检查,这绝对是通往成功的捷径。咱们来看这个对比,一下子就明白了。你看左边,你说实现一个验证邮箱的函数,这个要求很模糊, 但右边呢?你不仅让他写函数,还给了他具体的测试用力,告诉他哪个该通过,哪个不该,并且要求他写完之后跑一下测试,看到区别了吗?再看下面那个,你只说构建失败了,他可能很懵, 但如果你把具体的错误信息贴出来,告诉他去修复这个问题,并且验证构建成功,那他的目标就非常明确了,这就是从大概行吧到必须成功的转变。 这里呢,有一个我特别推荐的工作流程非常聪明,它的核心是把探索和执行分开,这样能少走很多弯路。第一步,用计划模式,先让它帮你读读代码,问问问题,这时候它不会做任何修改。 第二步,让它根据探索的结果制定一个详细的实施计划。第三步,你觉得计划没问题了,再切换到普通模式,让它放手去写代码。最后一步,甚至可以让它帮你写好 commit message 再提交。你看这个流程是不是特别有条理,效率自然就高了。 好,接下来咱们聊点更好玩的,定制你的环境。这可就不是简单的用一个工具了,这相当于你在亲手打造一个专属于你自己的个性化的 ai 代理。那怎么定制呢?核心工具就是一个叫 cloud 点 m d 的 文件,你可以把那些 ai 从代码里看不出来的,需要长期记住的背景信息都写在这个文件里。 这个 c、 l、 a、 d、 m d 文件里到底该写什么,不该写什么呢?这张图就说得很清楚了,你看你该写的是那些他猜不到的东西,比如你项目里特定的拜师命令,非标准的代码风格,或者分支命名规范,但是那些他自己看看代码就能明白的,比如标准的语言用法,或者写干净代码,这种废话就别写了,纯属浪费空间。 更有意思的是,这些配置文件是分层的,你可以在你的 home 目录放一个全局的,对所有项目都生效。也可以在项目个目录放一个,通过 get 和团队共享,甚至在某个子目录里也能放一个,专门针对那一部分代码。这种分层结构真的非常强大和灵活,能让你在不同的场景下对 ai 的 行为进行精细的控制。 当你掌握了这些基础之后,就可以开始升级了。咱们来看看怎么把你的超能力规模化,从一次只干一件事升级到自动化的工作流。 想升级,第一步就是别再局限于一个对话框里了,你可以同时开好几个 close 绘画,让它们并行的工作来解决更复杂的问题。 比如说这里有一个超级强大的模式,我称之为一个写一个审。你看,你可以让绘画 a 负责写代码,比如实现一个新功能,然后你再开一个绘画 b, 让它专门负责审查 a 写的代码,去挑毛病,找 bug, 看有没有潜在风险,这样一来,代码质量想补高都难。 当然,这还不是终点,你甚至可以实现完全的自动化,比如说把它集成到你的 c i c d 管道里,或者写个 precommit hook。 再比如写个甲板,让它帮你做大规模的代码迁移,甚至你可以把服务器日制直接喂给它,让它帮你分析问题。这基本上就是把 ai 的 能力嵌入到了你开发的每一个环节里,想象空间非常大。 当你把这些都用起来之后,你会发现你自己的角色也变了,你不再仅仅是一个埋头写代码的人,你开始更像一个代码的架构师,或者说一个指挥官。当然了,在这个升级打怪的路上,有几个常见的坑,你得小心。第一,别在一个绘画里干好几件不相干的事,任务之间记得用 c 干 c 亲一下。 第二,别跟他较劲,如果一个问题你纠正了两次还没搞定,别再试了,清空上下文,换个思路,给个更好的指令,重新开始。 最后也是最重要的,永远别忘了验证,有些代码看着挺像那么回事,但可能根本跑不起来,一定要让他自己去验证。最后啊,就像这里说的,用的多了,你自然会培养出一种直觉,这种感觉是任何教程都没法教给你的。到时候你就会知道,什么时候该把指令说的特别具体,什么时候该给他更多自由发挥的空间, 什么时候该先做计划,什么时候可以直接上手探索。所以,最后,我想留给大家一个问题,可以好好想一想,当你不再只是一个代码的编辑者,而是成为一个代码的指挥家时,你又能创造出什么样了不起的东西呢?

测评, callopus 四点六模型,零基础开发,全程没有协议性代码,到小程序,到 up, 到后台管理,到接口开发数据库对接,全开发教程,全程干货准备发车。打开我们的开发工具,布置客户需求文档,提 供给 ai 进行分析,获取按权。这分类的功能清单 清单、技术要求和开发规范一并交。 代码已编辑完成。启动项目运行,进行功能测试,调试,修复问题。 打开 navik 客户端工具,连接到目标数据库,右键点击数据库连接或数据库名,选择运行 s q 六文件,选择要执行的 s q 六脚本文件,点击开始执行完成。创建数据库, 等待 maven 依赖下载完成。找到主启动类,带有 spring 不 application 注解,点击类旁边的绿色三角形按钮,选择 run 启动,查看控制台输出,确认启动成功。 找到前端项目 c m d, 进入项目目录,执行命令 m p m install, 等待依赖安装完成。执行命令 m p m 任意启动前端项目。复制前端地址,如, h t t p 冒号斜杠,斜杠抖 o c l h o s t 冒号三零零零,打开浏览器,访问该地址,进入管理后台项目 模块一,系统登录模块二,首页数据统计模块三,用户管理模块四, 商品管理模块五,订单管理模块六,预约管理模块七,轮播图管理模块八,新闻资讯管理模块九,文化内容管理模块十,展品管理模块十一,帖子管理模块十二,评论管理模块十三, 管理员管理模块十四,系统配置模块十五,收入统计报表模块十六,订单统计报表模块十七,商品统计报表模块十八,用户统计报表模块十九,访问统计报表启动小程序项目 首页模块,文博图快捷导航历史文化推荐新闻资讯商城模块,商品分类商品列表商品详情加入文化展示历史文化制作工艺数字展馆展品详情 社区模块,帖子列表发帖评论、点赞、预约体验、在线预约预约管理状态追踪、用户中心登录注册、个人资料、收货地址、订单管理。这不是巅某,这是一个可以直接上线营的完整产品。 太震惊了, ai 已经这么强了,我也想学怎么开始,能帮我开发一个小程序吗?多少钱?不信, ai 写的代码肯定一堆蹦。评论区,告诉我你的想法,每条评论我都会认真回复。

ai 漫剧一个人能做吗?不用组队,不用招人,单人就能搞定剧本,分镜 ai 视频全流程,今天给大家分享一个 ai 漫剧的 a 境特,让 ai 来当编剧,当分镜师。这个 a 境特呢就包含了一个写小说的, 以及一个写分镜的,我大概来演示一下整个流程大概是什么样子,比如说这一个写小说的,我们直接把它运行,然后呢点击回车确定直接告诉他要写小说。 这边他就会问你一些问题,就是你想要什么类型的小说?比如说我现在选一个悬疑男性主角,那这里呢,我就快速的选择一下,这里我让他出十张,再往下面来,他就会让你去取一个标题,那如果说你有的话呢, 也可以直接告诉他,我这里就选了一个暗夜追踪,接着他就会开始调取他的一些技能,这些技能呢都是我们给他的,大家也可以去修 修改这一块待会呢我们会详细的讲到。好,那到这里呢,他会给我们一个大纲,就是你看一下他这个大纲有没有问题,如果说你觉得没有问题,那就确定,如果你要修改就直接跟他对话就可以了,确定之后他就会根据这个大纲去创造每一节的内容 以及人物角色。这里我就不等他去创建了,我们可以到文件夹里面来看一下,最终他会输出到刚刚写小说的文件夹,这个文件里面,大家可以看一下这个就是他写出来的嘛,现在他已经写完第一章了,我们可以大概来看一下他第一章是什么样子的, 大家可以看一下这个就是他写出来的,比如说凌晨三点多少分啊?然后您也在干什么呀?什么什么的,这个就是他已经写出来的一个故事。那人物档案这里我们也可以来看一下,像这里呢,他就会给出人物的一些档案,包括配角的,有时候他可能会少,但是我们可以跟他再去对话,让他去 修改,这个就是他强大的地方,就是有什么东西你就可以直接让他改好。 ok, 那 到这一步呢,我们就会得到一个十张的小说,比如像我这个新剧源的这一个就是比较完整的,那这个小说完成之后,我们就可以让他来开始给我们写分镜了。分 分镜这个文件夹里面同样的有这样一个东西,我们把它点开,点开之后呢还是一样,那这里呢,我们就给他分镜,好确定他就会引导你去跟他对话。像这里你是要将故事转换为分镜,那你有没有故事的内容呢?像我刚刚其实这个文件夹就是我故事的内容嘛, 那我就直接复制给他,接下来呢再告诉他我需要什么内容,我需要的就是二和三都要。二和三分别是什么呢?大家可以理解为这个是视频提示词,下面这个是图片的提示词,那接下来就是你想要的风格,什么都可以告诉他,那这里呢,我 输入的就是让他先给我给出第一张的素材清单和分镜脚本,然后我的风格是热血动漫,再就是根据故事的情节来,前后片段要保持一致,包括横屏啊这些都可以告诉他,告诉他之后他就开始去匹配我的技能了。那一段时间后呢, 第一张他的这一个分镜脚本就出来了,一般我是建议先把第一张出出来,如果没有问题我们再来做第二张、第三张,那第一张我们可以打开来看一下,这个就是他的分镜,那这一个分镜的提示词呢?有 中文的和英文的,中文我们就可以直接用国内的平台来生成,英文的话其实就是相交二的提示词,那比如说我们拿刚刚的提示词来去生成一下,看能得到一个什么样的效果。这里呢我们可以生成十六比九,也可以生成九比十六的,因为后面的话还是要拿它去生成三式图的好, 这个就是我们得到的图片。其实从结果来看,大家可以看一下,还是很符合我们的描述词的,他也描述的比较详细,比如说热血动漫风格,然后一个三十八岁的刑警队长。当然这里我没有直接让他出来全身照,因为一般来说我是先有一个近景,然后再来去得他的全身照。如果说大家想要直接得 一个全身像的话呢,也可以在技能里面去修改,这个就是他的素材清单,我们再来看一下素材清单里面有的内容,像这里每一个角色对应的编号他 都会给你,给你。之后接下来呢会有一个分镜脚本,这个我们也来打开看一下,这个就是视频提示词的脚本,就比如说,哎, 这个视频提示词零到三秒是什么样子的?那这一个片段里面他用到了哪个图片?比如说图片一是零夜,那图片一他对应的就是 c 零一,也就是我们刚刚出现的这一个 c 零一, 接下来呢办公室,办公室的场景我们也要做出来,办公室的话在这个素材里面他也会有的,就是 s 零二, 所以说在这个流程下面我们要做的就是修改提示词以及修改内容。那这些我们都是要去学的,比如 词里面的一些风格我们要调整,包括像这一个视频提示词里面像这些景,别呀,那你都要去了解,如果说你不了解,那你也不知道怎么去修改,所以到了这里之后呢,我们只需要把提示词再给 ai, 然后让它去生成视频就 ok 了,这样的话我们一个人也能快速的做出一个慢剧来。那接下来再来仔细的给大家讲一讲里面的内容,这个我直接拿到编辑里面来看啊,我把它放大一点点, 首先这个文件夹里面这个 c c 的 就是我们可以直接运行的,我们往下面来看一下啊,他这里就讲了他的核心流程是什么样子的。第一个阶段 五问确认,哎,有没有很熟悉?其实这些问题大家都可以来修改,当然呢你也可以去跳过,那首先就是问他想要创造什么小说啊?接下来就是一个一个的引导用户去做选择的,所以他这里就是介绍的整个 agent 的 一个流程。那再往下面走呢,就是收集完了之后就确认嘛,就 是把你刚刚回答的这些问题确认一下,确认了之后就开始进行第三个阶段,第三个阶段他就开始创作了吗?那这一个创作要怎么去创作呢?大家可以看一下,他这里首先要读取我这里面的大纲,要去查看这个大纲,还要设计开头的钩子, 再来就是规划场景,接下来就开始填写了吗?填写的话呢,每一张要达到多少个字,这些你也可以去修改。再就是他要自己去检查前面百分之二十是否吸引到人,还有像对话的规范性啊, 结尾的钩子啊,这一些他的规范又在哪里呢?这些的规范其实也是设置好了的,就在这一个文件夹里面,这个文件夹里面所对应的就是这边的这些东西, 比如说我们随便点开一个来看一下,这一个就是章节的创作指南,这里的话他会告诉你前百分之二十你要达到的是一个什么效果,比如说要有紧张感,然后要有重大事件的发生。再就是开头致命的一些错误,比如像这里他会给出誓灭啊, 那这些就是来规范 ai 写的更加的好。那我们再来看下面这一个,下面这一个呢就是章节的标题,这里的话要一句话概括本章所发生的事情,并且呢要有前后的衔接, 所以这样的话我们能够保证他写出来小说连贯性会更好一点,会比你直接跟大圆对话要好得多,包括这里你要去买下伏笔,那我们再来往下面看一看,这里会有人物的塑造原则,那读者记住的是人,不是情节包 包括每个角色都要去建党,那建党的这些也是他给出来的,如果说你想要修改,你就在这个地方对应的修改就 ok 了。那我们再来往下面看一看,这边有连贯性的一些机制,就是你怎样保证整个是连贯的,再来呢?还有内容的补充啊等等等等啊,包括对话的规范性, 这里他也讲到了,对话应该至少完成以下之一,就是推动情节,或者说皆是人物制造冲突,传递信息,这些都是他给你的一些核心的原则。下面这里会给出一些无效的对话,或你觉得有效,那你就把这个删掉就可以了。反正下面这些啊, 所有的都是他的规范,你看一下这里的规范设置了这么多,所以那他写出来的小说相对来说也会好很多。 来。最后呢,还会有一个质量的检查清单,就是当你做完之后,你要去确保质量。那检查什么呢?首先第一个章节要有明确的标题,字数是否符合预 期,还有你的章节是不是完整的,时间地点是不是清晰,再就是开头的检查,内容的检查,情节的推进等等等等,这些内容都是保证 ai 能够给我们出一部好的小说, 当然大家还可以根据自己的需要不断地去完善它的技能。那另外一个写分镜的呢,我们也来看一下, 这个分镜的文件夹,就在这一个点 close 里面点进来,然后这边有一个 skills, 然后我们点进来,比如说这一个这里的话,它就说,哎,你是一个 cds 二点零的提示词 专家,然后下面这里呢就会给他一些能力,这一些其实就是 cds 的 官方手册里面的一些东西,比如说图片要小于九张,那他后面在做这一个视频提示词的时候,每一个视频这里的图片他不会给你超过九张再往下面走呢,也是我们去创建的一些结构, 比如说零到三秒大概是什么样子的,然后三到六秒又是什么样的?再来就是核心的公式,这个公式大家是可以去修改的,这个我是按照我自己的公式来给他去修改的。 还有模块,比如说模块一,模块二主体的描述,那主体的描述你就一定要有身份、外貌,服饰、表情以及年龄等等啊,所以大家可以看到我刚刚出来的那个提示词,他直接给我的是三十八岁的一个景观, 也是因为我在这个地方给他设定了包括像外貌这里,因为如果说我们不给他这种脸型什么的,他整个出来的图 片都是一模一样的,大家可以看一下网上这种人物啊,都很相似,就是因为只给了一个三 d 建模,所以说他就很雷同嘛。那如果你要他不雷同,你就把这种外貌描述的更加详细一点,那你的人物就会更加的不一样一点。 往下面来呢,就有动作行为啊,以及镜头语言啊,反正这一些呢都是我们可以去喂给 ai 的。 如果说你本身就是一个很厉害的写题的人,那你把这一个呢, 每个人都可以训练一个属于自己的 agent。 最后来给大家看一下我利用这一个来做的一个片段吧,全程没有太多的改动,它的提示词 是施工吗? 有怪兽出现,同学们,赶紧撤离。有怪兽出现,同学们赶紧撤离,快跑啊! 那这一次的分享就到这里啦,关注我,解锁更多 ai 玩法!

嘿,大家好,要是你跟 ai 编程助手打过交道,肯定有过这种又爱又恨的感觉吧?他真的太聪明了,写代码速度飞快,但问题是他总喜欢挑步骤,抄近道。 那么今天我们就来聊一个特别有意思的新东西,他正在尝试给这些有点野的 ai 装上一个职业的良心。 你看,这句话就说到了点子上,一位叫特雷弗的开发者就抱怨说,他想让 ai 帮他做一个挺大的代码迷新项目。结果呢, ai 二话不说直接就开干了,根本就没有什么所谓的规划阶段 这种先干再说的风格,后果就是经常漏掉关键文件,引入一堆莫名其妙的 bug。 所以 你看,这就带出了我们今天真正要聊的核心问题。 一边呢,是这个冲动聪明但容易出错的快枪手,而另一边,是我们真正想要的那个有条理、有方法、靠谱的纪律伙伴。怎么才能实现这种转变呢?这可不是光靠优化几个提示词就能搞定的事儿,我们需要的是一个全新的思路。 这里的大招,或者说我们的核心思路就是要打造一整套全新的工具,它的唯一目的就是把专业软件开发的纪律性强行注入到 ai 的 骨子里,让它从一个独行侠变成一个真正懂规矩的团队伙伴。 好,那这个也解决方案,它有个正式的名字,叫智脑体技能框架。这听起来有点学术,但你完全可以把它想象成一个,嗯,一个经验特别老道的项目经理 或者一个资深程序员,就站在 ai 旁边盯着他,强制他必须按照最佳实现来工作,先规划再测试,然后调试,一步都不能错,一步都不能省。 那具体是怎么做到强制执行的呢?你看,他不是建议,而是命令。他要求 ai 在 写任何代码之前,必须先做出系统性的规划。他强制 ai 必须采用测试驱动开发。 它还规定了必须遵循严格的调试流程,并且在工作完成之前必须进行最终的验证。好了,光说不练假把式,我们来看个句子的例子。 说了这么多理论,那实际上它长什么样呢?我们就来深入剖析一个现在非常火的框架,它的名字叫 superpowers, 它就是这种结构化方法的一个完美代表。 你可别小看这个工作流,它可不是什么建议,而是 ai 必须一步一步老老实实去遵守的铁律。 从最开始的头脑风暴,到用 git 创建隔离的开发分支,再到写出详细的执行计划,然后派出所谓的紫智能体去干活,并且强制执行经典的红绿重构、测试循环,一直到最后的代码审查和分支合并,整个流程被安排得明明白白。 我们再来看看这个计划本身啊,会先生成一份这样的路线图, 里面不仅清楚地写了要改什么,为什么改,分几个阶段,最牛的是什么?它连成功的标准都给你量化了,比如项目必须能成功构建,而且 lighthouse 性能评分要大于等于九十五,甚至连万亿搞砸了怎么办?回滚计划都准备好了, 而且还有一点特别关键,每走一步, superpowers 都会自动生成一个 get comment, 这意味着什么?这意味着最后你会得到一个无比清晰、专业、可追溯的提交历史记录, 这对于代码审查和团队协助来说,简直是个巨大的效率提升。当然了, superpowers 只是冰山一角,现在一个由各种这类框架组成的生态系统正在快速地成长起来,而且每个框架都有自己独特的设计哲学。 你看,这里就展示了三种不同的流派。一个是像 superpowers 这样的方法派,它给你一套非常严格、观点鲜明的工作流。然后是像 everything cloud code 这样的工具箱派,它简直就是一个军火库,里面有超过六十五种技能,还带安全扫描和内存优化。 最后还有一个亲民派,比如 omcloud code, 它的重点就是好用,让你用起来几乎没有学习成本。 你可能会想,这玩意儿是不是就几个即刻在玩儿?那你就错了,你看这个数作,超过十四万五千,这可不是下载量,这是几个顶级的框架在 github 上获得的新标总数,代表了多少开发者在关注,在认可这些项目。 这绝对是一个信号,说明开发者和 ai 的 合作方式正在发生根本性的变化。好了,说了这么多,是不是感觉 ai 马上就要完美无缺,可以独立工作了? 先别急,事情恰恰在这里变得更有意思了。这里有个特别有意思的发现,可以说是给所有人都提了个醒儿, 有用户在使用中发现 ai 自己会弹白那个技能框架,让我用测试驱动开发,但我还是没那么做。我当时更想快点把功能上线,而不是严格遵守流程。 你看,即使有规则约束, ai 有 时候还是会选择走捷径,所以这就引出了我们最终的结论,也是最重要的一点, 这些框架说白了,它就是个强大的护栏,能帮你走在正确的路上。但它不是完美的自动驾驶,它并不会取代我们。相反,它把我们人类开发者的角色,从一个埋头写代码的执行者,提升到了一个更高层次的负责审查和架构设计的决策者。 那么最后留给大家一个问题思考一下,当我们的 ai 搭档越来越靠谱,越来越有纪律,能够处理掉越来越多繁琐工作的时候,我们人类开发者,我们自己最核心的价值又会是什么呢?是继续敲代码的编码者?还是把握质量的审查者? 又或者是运筹帷幄的架构师?这个问题的答案可能正在定义软件开发的未来。

去年十一月, ansorepic 发布了一系列新的测试版功能,只在解决我们在构建 ai 智能体时遇到的一些实际问题。 工具定义在你发送第一条消息之前就已经占用了大量的上下文。当智能体连续执行多个工具调用时,这些工具调用的中间结果会进一步膨胀上下文。 而且随着你在系统中增加工具的数量,智能体在为任务选择合适工具时会变得非常吃力。因此,这些测试版功能帮助解决了这些问题。而且随着两周前 sony 四点六的发布,这些功能已经在云 api 上全面开放。 在他们的原始帖子中,他们展示了这些功能如何帮助实现了八十五百分之的 token 使用量减少。 这也导致一些网友宣称 entropic 已经终结了工具调用,或者至少是传统的工具调用方式。虽然这种说法有些夸张而且确实不准确,但这两个功能编程是工具调用和工具搜索工具 确实是非常巧妙的解决方案,在集成到任何 ai 智能体中时都能发挥极高的效用。而且关键在于这些功能并不是云 api 独有的,也并非最初就是 entropic 的 创意。 这些是智能体构建的核心模式,适用于任何框架或模型。我会解释这两种高级工具调用如何运作,并演示如何集成到你的定制智能体中。 这正是我在这里所做的事情。我已经把它集成进了我的系统,这个系统是我用 python 和 react 定制开发的应用,这是我在本频道过去四期视频中逐步搭建出来的。 我还用全新的困三点五,拥有二百七十亿参数的模型来测试这些高级工具调用方法。所以与其直接跳进理论部分,不如我们在应用里演示一下。 而最简单的切入点大概就是先演示一下工具搜索工具。所以即使只是打个招呼,我们也能收到一个简短的回复。但在底部,你可以看到我们正在追踪本次绘画的上下文窗口。 我们已经用了一万三千个 token, 为了弄清楚发生了什么,如果我们切换到 langfuse, 如果我们看一下这个生成追踪,你会发现已经有六十个不同的工具被加载到上下文中了。 虽然听起来很多,但实际上只有两个 mcp, 就是 playrite mcp 和 github mcp, 再加上一些我在前几期节目中开发的工具。 所以工具搜索工具的关键点在于你不会一开始就加载所有内容。你会延迟加载让代理去搜索他,所以他会多出一个额外的步骤。现在我会把这些 m c p 服务器标记为延迟加载,然后让我重启一下服务器。 如果我再次问同样的问题,比如我们打开一个新的聊天窗口,输入 hello, 然后得到一个回复,你可以看到我们现在只用了六千三百个 tokens。 如果我们看一下这个追踪,你会发现现在只有十二个工具被加载到上下文中。第十二个就是这个工具搜索工具。 这个工具允许代理在工具注册表中搜索,通过名称或关键词来发现并加载工具。为了演示工具搜索的实际效果,我们让他获取这个项目的最新提交。这是一个私有项目,所以他需要使用 m c p。 你 可以看到他现在正在触发工具搜索。他找到了一个工具, 就是 list commits 工具,然后他用仓库的信息触发了这个工具。好了,我们得到了提交 id 以及提交内容的信息。 如果我们查看这次工具搜索的响应,你会发现 listcommits 是 一个延迟加载的 mcp 工具,它会把这个工具的完整模式加载到上下文中。 现在这个工具已经被加载到接下来对话的上下文中了。所以如果我再问任何后续问题,就不需要再去搜索这个工具了。比如说给我最后一个提交,我就可以直接使用 listcommits 工具。 如果我们切换到 langfuse, 在 我发送的第一条消息中,你可以看到只有十二个可用工具。然后在它触发工具注册表搜索后, 在下一次调用中,我们有了十三个工具,包括 list commits, 并且它能够对此作出响应。而在我后续的问题中,我们同样有十三个可用工具。 简而言之,这就是工具搜索实际的工作方式。虽然这已经非常有用,但我认为以编程方式调用工具更加令人印象深刻。如果我们开启一个新的聊天,现在我们在 opodder 上使用的是 cloud hikou, 我 一会会切换到 queen 三点五。但我想先给大家展示一下云端模型和开源模型在这里是如何工作的。为此,我们将使用 anthropic 在 其文章中发布的官方示意。 这里他给出了一个预算合规检查的例子。然后问题是哪些团队成员超出了他们第三季度的差旅预算? 这里有三个可用工具,分别是获取团队成员,获取支出和按级别获取预算。他在这里展示了传统的方法,也就是需要大量的工具调用和许多中间响应,这会导致上下文窗口被迅速填满, 所以我已经写好了云端代码来生成这个场景的虚拟数据。首先我们来看一下传统的做法,我已经关闭了沙河,现在我来提问哪些团队成员超出了他们第三季度的差旅预算。 正如我之前提到的,我们现在用的是嗨酷模型,所以他正在执行工具搜索,获取报销数据,获取团队成员。现在他正按照这种传统方式操作,需要为每一位成员逐一获取报销信息, 让我们看看会得到什么答案。所以第三季度差旅预算分析显示,有三个人超出了他们的差旅预算,这是他给出的结果。 根据测试数据,这个答案是正确的,但实际上应该有四个人,所以他似乎漏掉了一个。 marcus johnson 超出了预算一千七百, 所以这种传统方法实际上消耗了大量的工具调用。实际上有五十六次工具调用。正如你在这里看到的, 它处理了七万六千个 tokens, 但实际上并没有给出一个准确或者说全面的答案。这正是程序化工具调用能够解决的问题,因为所有这些其实都可以通过脚本自动完成。 因为一旦你知道了团队成员和预算水平,你就可以用一个负循环来获取每个用户的开销,并计算实际的超支情况。 那么现在让我们起用沙盒,并尝试用程序化工具调用来实现。好的沙盒已经开启,让我们重启后端,打开一个新的聊天窗口。好的哪些团队成员超出了他们第三季度的差旅预算?现在正在进行工具搜索。他找到了所需的三个工具。 现在他进入了编程模式,并创建了一个即将被执行的脚本。他抛出了一个错误。这其实并不奇怪,因为他并不知道这些工具的输出结构。所以本质上,如果没有所有信息,他就无法一次性完成。 现在他正在不断迭代自己的代码,实际上是在尝试得到一个结果。你可以看到他不断抛出错误,并且正在逐步解决。 与 anthropomorphic 的 论文相比,这可能是更贴近现实的程序化工具调用方式。因为我相信在 anthropomorphic 的 论文中,它是一次性完成的,而实际上并不会这样。经过多次迭代后,我们得到了一个准确的答案, 所以二千二百, sarah, chen, marcus, alex, emily。 所以 我们得到了所有正确的答案。 这很好,但这才是程序化工具调用的现实。它的方法相当迭代,就像 cloud code 或 open code 一 样。出于兴趣,我们再运行一次,看看能不能得到正确的答案。它会不会走一条不同的路径。我们假设是的, 很有趣。这一次它实际上是在预算层面获取团队成员的信息,所以它实际上是先获取所需的数据,然后再生成代码。所以这次它可能一次性就能完成。 但实际上他并没有做到,他仍然在自我迭代。不过我们确实得到了正确的答案,所以结果是对的,每一次都是如此,只是到达结果的路径不同。所以我们来看看这两条追踪记录。在我刚才运行的那一次中,总共进行了六轮调用, 总共调用了十二次工具,总提示词数为五万八千。现在如果我继续这个对话,目前只用了一万三千,但这是在与大语言模型进行了六轮来回交互的情况下。而之前那一次是在十一轮中用了十一万六千个 prof tokens, 都是为了得到正确的答案, 所以我确实没有看到 anthrax 所报告的八十五百分之的 token 节省。但这其实非常依赖具体的用力。 比如说这里我是在和二十个团队成员一起工作的,如果你有两千个团队成员,那情况就完全不同了,因为大圆模型需要运行两千次单独的调用,这根本行不通, 所以在那种情况下,就需要程序化的工具调用。或者你就需要一个真正的端点,让实际的数据处理在服务器端完成,而你只是获取信息并将其展示给用户。所以这其实切中了这个话题的核心。 也就是说,你的大圆模型到底应该像这样临时进行数据处理,还是应该仅仅从一个预先创建的脚本中传递信息? 比如说这个脚本可以放在一个技能文件夹里,因为这是我们在上一个视频中搭建的一个完整的技能部分。你可以有一个 python 文件,一旦创建测试并验证后,它就能真正完成这项工作,或者你也可以把它放在工具调用的 m c p 端,这样它就只是简单地传递接收到的信息。 那么我们把 cloud haiku 换成 queen 三点五二十七亿参数,来看看它的实际表现如何。我现在是在网络上运行这个模型,这里用的是欧拉玛,我有一个十万个上下文窗口长度,这里用的是 rtx 五零九零,显卡有三十二 gb 的 显存。 那么我们保存一下,重启服务器,然后问同样的问题,哪些团队成员超出了他们第三季度的差旅预算?现在加载需要一点时间,因为他需要把模型加载到内存中。好了,他已经触发了工具搜索,然后直接开始生成代码。 他实际上在工具调用之间没有输出文本,但你可以看到他正在生成代码本身,而且他正在经历和嗨酷一样的迭代过程,他正在从错误中学习, 并且在不断完善。看看,这就是我们的答案。让我看看二二百十五十七,还有三百,看起来很准确,我觉得这比嗨酷用的 tokens 更少,这很酷,我们来深入看看追踪记录吧。 是的,这次用了四万五千个 tokens 就 得到了准确的回应,这真的很棒,只用了四次工具调用,这已经相当不错了。这是我们 ai builder 系列的第五个视频。在这个系列中,我们正在用云端代码构建一个功能完善的 ai 系统。 本模块的 prd 可以 在我们的公共 github 仓库中获取完整的课程和代码库则在我们的社区中提供 相关链接在下方描述中。那么好吧,这一切到底是如何运作的呢?因为你可以看到我们正在这里的沙箱中触发代码执行,但这实际上意味着什么呢?所以这是一个完全本地化的系统。 我之前用的是嗨酷配合 open router, 但现在用的是 queen 三点五,这里内置了一些文档和 r a g 功能,使用的是 queen 三的嵌入模型。所以你看到的这个代码执行其实是在 docker 中触发了一个沙箱。你可以看到 现在所有这些容器都已经启动了。这里有一些孤立的容器是因为我一直在重启后端。但总体来说,代码执行都是在这里的一个隔离沙箱中进行的。 而这个架构安全性的一个关键部分就是工具桥的概念。所以从头到尾,当用户提出问题时,他会先到 fast api, 然后到 python, 接着再转发到 ai 模型。无论是远程还是本地的, 我们会收到一个工具调用,也就是你需要去执行这段 python 代码,这时后端就会启动一个沙箱容器。 我在上一个视频里已经介绍过这个的设置过程,但本质上我们用的是这个 github 仓库,也就是 llm sandbox。 这是一个非常清亮即可移植的沙箱环境,你可以配合 docker 这样的工具使用。或者如果你不用 docker, 也可以用 portman。 但本质上,这大大简化了启动这些环境的复杂性。 它们支持多种语言,还有许多不同的高级功能。你可以预先启动容器,而不是按需启动。 你也可以使用自定义镜像。这个项目里有很多很棒的功能,所以我会在描述区留下相关链接。我在上一个视频里已经非常详细的讲解过了,所以基本上我们就触发了那个容器的创建, 然后我们会把代码和一个绘画 id 一 起传递进去。所以现在在这个容器里,我们有一个 python 运行器,它会执行那段代码。在我们之前的例子中,有很多不同的工具需要被触发,比如获取预算水平、获取部门、获取团队成员, 而所有这些都可以存在于比如说一个外部系统中,但我们并不希望让沙乡访问外部服务。 相反,我们创建了一个安全的工具桥梁连接回 python 应用程序,然后每当工具或函数在 python 脚本中被触发时,都必须通过这个桥梁。正如你之前看到的,单个脚本中可能会有五十次不同的 api 调用或工具调用, 所以对于每一次工具调用都需要通过这个桥梁,它会使用绘画 id 来进行身份验证, 然后 python 应用程序会将该调用路由到外部系统获取响应后再将其发送回沙乡。因此,除了访问这个 python 应用程序中的 fast api 之外,沙乡没有任何互联网访问权限。从安全角度来看,你可以对这个 fast api 进行严格限制, 这些限制是基于工具本身的精确模式,所以所有这些工具片段、工具定义都是在创建时作为存根发送到沙箱中的。因此,多个工具调用会在 python 代码中,比如说在一个 for 循环内进行, 而且这样做速度非常快,因为此时你完全忽略了 l l m 没有任何中间代码堵塞上下纹。在这里, l l m 完全不参与这个过程,直到 l l m 完成脚本并生成响应。你在之前的演示中已经看到了, 然后这个响应看起来大致是这样的,这就是我们的脚本结果,然后这个结果会被反馈给 l l m。 l l m 接着可以决定下一步该做什么。 如果它已经获得了所有需要的信息,就可以生成综合响应并返回给用户。或者正如你在演示中看到的,它需要对代码本身进行迭代。在很多情况下,它会生成更多的代码,并再次触发沙盒环境。 这就是端到端的流程。我在这里提到了 gviser, 因为 docker 容器并不是你能拥有的最安全的隔离沙盒,因为它们与整个系统共享内核。 所以为了真正保障像 ram, sandbox 这样的安全性,我建议你搭配 gviser 一 起使用。 cloudflair 曾经做过一些有趣的研究,探讨了 ram 在 生成 python 代码或 type script 以及触发工具和 mcp 方面的有效性。他们发现,当工具以 type script api 的 形式呈现,而不是标准的 mcp 时,智能体能够处理更复杂的工具。 我认为这是有道理的,因为他们在训练时接触了大量原生的 python 和 javascript, 所以 在 cloudflared code mode 版本中,也就是我们所做的类似,他们会把 mcp 的 schema 转换成 type script, 因此 l l m 只是生成 type script 代码来触发 m c p。 这和我们正在做的事情非常相似。所以我刚才提到,工具存根被发送到沙盒中。因此,我们在智能体层面定义的 m c p 和工具会被转换成 python 存根 自动生成的 python 函数。这样,当 ai 为沙盒生成代码时,它实际上只是触发 python 函数, 而且因为这是原声 python, 所以 它在这方面会非常擅长。而且重要的是,沙盒永远不会接触到 api 凭证,它永远不会接触到任何机密信息或类似的内容。 我之前提到过需要高效的工具设计,因为在早期,有太多的 mcp 服务器完全塞满了你的上下文窗口,让你根本无法完成任何实际工作。 即使在 anspec 自己的文章中,他们试图解决的挑战也是关于臃肿的 mcp。 在 这里,他们提到 github 的 mcp 有 三十五个工具和两万六千个 tokens。 但即使是在这篇文章发布之后, github 也发布了他们 mcp 的 新版,现在这个数字大约是四千个 tokens。 所以 在 mcp 和工具调用端其实可以做很多工作来确保不会无谓的给你的上下文窗口增加负担。 最后, entropy 在 他们的高级工具调用工具包中还加入了另一个功能,就是关于工具使用视力的这个概念。因为虽然 jason schema 非常擅长定义结构,但它无法表达使用模式。 他们举了一个例子,比如说截止日期,它的数据类型是自复串。日期格式有很多种传递方式, 那么他们到底希望用哪种日期格式呢?除非你真的引导他,否则大圆模型是不会知道的。所以,通过工具使用势力,你可以为每个字段提供一个势力,以便让大圆模型朝着正确的方向前进。比如在这里,日期格式就是年月 日。在他们的测试中,他们发现这能将复杂参数处理的准确率从七十二百分之提升到九十百分之,这很合理,因为本质上这就是多轮提示。你只是给了一个你想要的视力,这绝对会引导模型朝着正确的方向。 实际上,我不确定你是否需要把这个设置成系统中完全独立的功能。我认为,使用技能这个概念意味着你可以在加载技能时提供视力,这样就可以触发你想要实现的任务的执行顺序。 你会发现 cloud 也有点类似,里面有很多功能是重叠的。 antropic 之所以没有取消工具调用,是因为他们认为你应该有策略力对这些功能进行分层。 所以,如果你的上下文因为工具定义工具搜索而变得臃肿,如果你有大量中间结果污染了上下文,那就走沙河路线。或者,如果 ai 总是把错误的值传递给参数,那么使用工具势利就是有意义的。非常感谢你的观看,我们下期再见。

你花两小时写了个 skill, cloud 从来不调用,好不容易调用了,执行起来又僵化,结果不达预期。本期我们继续精读 cloud code 核心开发者 toric 的 lessons from building cloud code how we use skills。 它总结了构建 skill 的 九个最佳实践来看如何让 agent 成功调用 skill, 以及如何达到更好的执行效果。这九条实践本质上是在解决三个递进的问题。 第一层问题, cloud 能不能找到你的 skill? 找到之后能不能理解它该做什么?这是内容层,解决的是被看见和被理解。 第二层问题, skill 能不能在不同场景下附用?会不会因为写得太死而失去灵活性?这是结构层,解决的是可附用和不僵化。 第三层问题, skill 能不能记住上次做了什么?能不能直接给 cloud 可调用的代码,能不能在需要的时候开启护栏?这是高级技术层,解决的,是有状态和可组合。先看内容层,解决被看见和被理解。 第一条, description 字段是给模型看的。很多人把 description 写成功能说明,这是一个监控 pr 的 工具,但 cloud 启动绘画时会扫描所有 skill 的 description, 决定这个请求有没有对应 skill。 它需要的不是功能说明,而是触发条件。 那些在用户说 babysit watch c i make sure this lens 时,触发 description, 决定的是什么时候该用它。这是 skill 能不能被调用的第一道门槛。第二条,不要陈述显而易见的事情。 colin 已经知道大量通用知识,你写 skill 的 时候最大的浪费就是重复他已经知道的东西。 antropic 内部有个 friend and design skill, 一 开始工程师发现 cloud 生成的前端界面总是用 enter 字体和紫色渐变,看起来很 ai 味,但客户反馈说不喜欢这种风格, 于是他们写了个 skill。 这个 skill 不 教 cloud 怎么写 react, cloud 本来就会,他只告诉 cloud 一 件事,别再用 enter 和紫色渐变了。客户不喜欢 skill 的 价值在于补充 cloud 默认不知道的上下文偏好和坑通用知识他都会,你要告诉他的是你们团队的特殊情况。 第三条,构建 gorgeous 部分 andropic 发现,任何 skill 里信号最强的内容往往不是教程,而是 gorgeous。 因为教程 cloud 本来就知道很多,但坑只有你们团队真的踩过。 不要在循环里调用 api, 会慢一百倍。记得清理临时资源,我们生产环境,因为这个词盘满过。真正值钱的是告诉他哪里别踩。理想情况下,你应该随着时间不断更新 skill, 把新踩的坑也加进去。内容层三条讲完了,光有好内容还不够,还要有好结构。 第四条,使用文件系统和渐近式批录。很多人把 skill 写成一个巨大的 markdown 文件,所有内容都塞在里面,但 skill 是 文件夹,不是文件。 你可以放脚本模板,数据文件,主文件里只写核心逻辑,然后告诉 cloud 详细文档在 r e f e r e n c e s 点 m d, 需要的时候自己去读。 比如如果最终输出是 markdown 文件,可以在 assets 里放模板,让 cloud 直接复制使用,按需加载才能最大化利用上下文窗口。 第五条,仔细考虑设置流程。有些 skill 需要用户配置,比如站会要发布到哪个 slack 频道,这个信息每个团队都不一样。用 config 点 json 存储配置,首次运行时询问,后续直接使用。这让 skill 从无状态工具变成有状态助手。 用户只需要配置一次,之后每次调用都能直接用。第六条,避免过度约束 cloud。 skills 可以 被反复重用,所以写指令时要谨慎,不要过于具体。很多人会写,先运行 test, 再运行 lint, 最后运行 build, 但这样写太死了, cloud 没有灵活性。更好的写法是在部署前确保代码通过测试规范构建,并根据情况调整顺序 约束目标,而不是约束路径。给 cloud 它需要的信息,但也要给它适应不同情况的灵活性别把 skill 写成死板的脚本,前六条是基础,后三条是高级技术层,解决的是 skill 运行时的能力建设。 第七条,内存与数据存储 skill 每次运行都是全新的,不记得上次做了什么。 entropy 解决方案,让 skill 写日记,每次运行后追加一条记录,下次运行时读取日记,只报告新的变化。 skill 不 再是无状态的脚本,而是有记忆的助手。 第八条,存储脚本并生成代码。别让 cloud 每次都从头写样板代码,把稳定能力封成脚本和辅助函数,让它负责组合,而不是重造轮子。给 cloud 最好的工具不是更多文档,而是可调用的代码。 第九条,按需 hooks 有 些规则太严格,你不想一直开启,但特定场景下又需要 anthropoid。 有 个 careful skill 会阻止危险命令,比如 r m r f drop table。 当你调用 careful 时,它会注册一个 hook, 只在当前绘画有效,绘画结束后自动失效。九条最佳实践讲完了, 回到开头的问题,为什么你的 skill 不 被调用?为什么调用后效果差?不被调用大概率是因为你把 description 写成了招标,而不是触发时机。效果差大概率是因为你写了一堆 cloud 的 已经知道的东西,或者步骤写得太死。这背后是同一个问题,把 skill 当成 prompt 来写。 siri 的 核心观点是,好的 skill 不是 告诉 cloud 每一步做什么,而是给他组合的能力,让他在执行时自己决定怎么做。本期内容就到这里,这里是慢学 ai, 我 们下期再见。

每次你向 cloud 解释你们团队的编码规范时,其实你都在重复自己。 每次做 pr 审时,你都要重新描述你希望反馈的结构方式。每次提交 commit 信息时,你都要提醒 cloud 你 偏好的格式, 而技能可以解决这个问题。技能是一份 markdown 文件,只需教 cloud 一 次如何做某件事,之后 cloud 会在相关场景下自动应用这些知识。代理技能是一组包含指令,脚本和资源的文件夹, 代理可以发现并使用这些内容,从而更准确高效地完成任务。在 cloud code 中,我们有技能的 md 文件描述部分决定了 cloud 是 否会使用这个技能。当你让 cloud 审查这个 pr 时,它会将你的请求与可用的技能描述进行匹配,并找到这个技能。 cloud 会读取你的请求,将其与所有可用的技能描述进行比较,并激活那些匹配的技能。你可以根据需要技能的人将技能存储在不同的位置。 个人技能存放在瞩目下。 cloud skills, 并且会在你所有项目中跟随你。这些包括你的偏好,你的提交信息风格,你的文档格式以及你喜欢的代码讲解方式。 项目技能则存放在仓库跟目录下的 cloud scales 文件夹中。任何克隆该仓库的人都会自动获得这些技能。这里存放的是团队标准,比如你们公司的品牌指南, 首选字体,以及用于网页设计的颜色。 cloud code 有 多种方式可以自定义行为。技能的独特之处在于它们是自动的,并且针对特定任务。 cloud md 文件会在每一次对话中加载。如果你希望 cloud 始终使用 type script 的 严格模式,那就把这个要求写进你的 cloud 文件。而技能则是在与你的请求匹配时按需加载。它只会加载名称和描述,因此不会占满你的整个上下文窗口。当你在调试时,拉取请求的审核清单并不需要出现在上下文中,只有当你真正请求审核时,它才会被加载。 斜杠命令需要你手动输入,技能则不需要。当 cloud 识别到相应情境时会自动应用这些技能。 技能最适合用于适用于特定任务的专业知识,比如你团队遵循的代码审查标准、你偏好的提交信息格式、你所在组织的品牌指南等。 如果你发现自己总是反复向 cloud 解释同一件事,那么这其实就是一个等待被编辑的技能。

用 skill 生成 skill 我 做了一件有点套娃的事儿,用 cloud code 构建了 一个叫 skill creator 的 原技能,它的作用就是一件事,我只需要用大白话描述需求,它就能自动帮我生成一个标准格式的 cloud md 技能配置文件。然后我用它生成了两个新的版块,一个是口播文案生成器,一个是现在要说的 smart talking heart editor。 一个指令造出全自动剪辑 a 阵,我给 cloud 下了一条这样的指令, 帮我打造一个全自动口播视频处理流,实现粗剪精剪加字幕,二 k 高清导出一条龙。它实际做了什么?第一步,自动捕取我录好的原视频,提取音频要用火山引擎豆包录音识别, 生成带精准时间戳的字幕文件。第二步,把识别出的文本喂给豆包大模型,自动标记废话、口头禅、嘴瓢片段,给出保留哪些时间段的指令。第三步,调用快刀按时间戳精准剪辑, 缩放到二 k 分 辨率,最后把清洗干净的字幕直接烧录进画面,输出成品。因为我是低配笔记本,它还贴心地配置了 prestige 迅, 并在代码注视里写明了如何开启 inter 或英伟达硬件加速。最终,这一切被封装成了一个可附用的 skill md 文件放进了我的机能库。闭环工作流的意义 这件事真正让我兴奋的不是我又多了一个工具,而是它意味着我可以搭出一条真正跑通携同流水线。第一个 agent 负责写口播文案,我审稿确认后,我自己对着镜头录一遍视频,直接丢给第二个 agent, 自动完成剪辑字幕渲染导出, 从文案到成片,中间只有我录视频这一个不可替代的环节。来看这张图, skill 目录里到底长什么样?这绝对是价值连城的一张图。 它其实就是在你电脑里面建一个叫点 cloud 杠 skills 的 目录,它就像给 cloud 定制的一个技能 u 盘,这个 u 盘一共就四个东西,小白也能秒懂。 第一层, skill md 必填的灵魂大脑这是一个文本文件,你只需要在里面写上你是一个专业的财务报表分析师,或者你是一个科幻短剧的编剧, cloud 读完一秒钟直接入戏,确定人设。第二层, reference 专属疾苦 重点来了,你可以把你的公司空白、财务模板,或者你自己写的小说世界观设定全扔进这个文件夹。 cloud 干活前会自己去翻资料, 这样他做出来的财报,写出来的短句绝对符合你的规矩,再也不会胡编乱造。第三层, scripts 外挂双手,这里面要放一段简单的 pass 代码好,等脑子构思完,就能自动伸手运行代码去调用外部工具,比如自动帮你生成一张易受的插画。第四层, asset 口袋 画好的图,整理好的数据表格,它干完活就会乖乖地存在这个文件夹交给你, 推荐给你创造自己的 a 准员工。我分享的这个方法是想告诉你,你不需要搭很多套 open core, 也不需要烧很多 token, 用 cloud 会员本身就够了。在 cloud code 里把不同的技能模块配置好,一样可以做到多个 a 准协同,协稿的、剪辑的、发布的各司其职,形成真正的工作流弊环。 这是目前成本最低、上手最快的多 a 卷协同路径,我自己在用,推荐你也试试。当然这也是第一步。 后面我打算给我的 opencloud 接入 a c p 协议,这样我就可以用一个 opencloud 去调度一个 cloud 的, 实现更完整的多 a 卷协同架构。那我们下期见。

啊,今天我们来聊一聊在金融投资当中,我们会经常使用到的一些软件,以及这些软件里面的各种指标公式啊, 比如说像同华顺啊,比如说像通达信啊,这是大家非常常用的。那其实呢,我们在使用这些软件的过程当中呢,我们经常会遇到一些问题,比如说我们想要导入一些自定义的指标公式啊,这个时候呢就经常会出现一些代码错误啊,导致没有办法正常的使用。 那这个时候呢,其实我们就可以使用一些 ai 模型来帮助我们解决这个问题,比如说像 deepsea 啊,比如说像 minimax 啊,比如说像 open claw 啊,这些都是大家可能会听说过的一些 ai 模型。 那这些 ai 模型呢,其实在解决这个问题的时候呢,也会有一些各自的优缺点,比如说像 cloud 的 这个 ai 模型呢,它的优点是在于它的编码能力确实很强,它对于这个指标公式的理解也非常的到位,但是呢它的缺点也很明显,就是它的部署会比较麻烦。 那这个时候呢,我们就可以使用 minimax 来帮我们进行部署,然后我们就可以通过一个链接,就可以让 cloud 来帮我们自动的完成这个指标公式的导入和部署。 那我们今天就先来聊一聊这些常用的金融投资软件和 ai 模型的特点,接着看看 cloud 具体的部署过程和我们测试选股指标的效果。最后再来说一说这个 ai 到底能够给我们带来一些什么样的优势,以及它未来的发展前景到底怎么样?对。

今天来教大家如何使用 cloud code 编写自己的代码。首先我们需要下载 vsco 的, 然后在 vsco 中新建一个文件夹,这个文件夹就是我们让 cloud 生成的代码存放的文件目录,然后我们在这个文件目录下新建一个终端,在这个终端我们写一些命令, 包括让它挂代理,然后连接到 cloud code 进行一个终端登录,输入 cloud login, 我 们就可以登录到 cloud 官网,然后在官网我们需要有账号以及密钥,将密钥填入到我们的终端或者网站,点击授权就可以成功登录到 club 中,我们就可以进行使用了。登录后我们就可以在终端对 cloud 进行多轮对话, 比如在这个条形框中,我输入请帮我生成一个股票智能体分析小助手,那么他就会帮我生成这样的一个完整的代码,生成目录就会存放在我让他终端运行的文件夹目录中,并且他生成之后,最后会告诉我要如何启动这个代码,并且我需要配置哪些内容, 比如它会告诉我需要配置 deepsafe 的 密钥,并给了我官方的开放平台。在开放平台中,我们注册好自己账号,向里面充入金额后,就可以使用这个密钥来接入它们的大模型。最后我们按照 cloud 的 提示输入命令,就可以启动我们的这个小助手网页了,启动出来它就是一个完整的股票分析网站, 点击分析按钮就可以分析股票数据,生成对应的 k 线图。在下面的对话中,我输入帮我分析这只股票,它也会接入大模型来深层回答的结果。