粉丝1获赞55

前段时间被 cloud 那 个官方认证给整完了,又是翻墙又是外币卡的,最后还不通过。但我最近发现了一个很好用的中转站,你看它的价格还很便宜, 只有官方的七八分之一吧,它有 cloud, 还有真皮奶模型看,而且还特别好用。 就像这样,你看我只需要创建密钥,然后点这个就有 cc switch, 你 看它可以选择,然后直接选择你要的模型, 点打开 cc switch, 它就可以帮你自动配置好。你看我配置好之后是这样的, 我个人这几天用下来,感觉其实跟官方没有太大的区别,基本上就是一样的,我很推荐大家试一试,而且它便宜稳定,还好用。

今天教你一句话,安装 skill 同时适配三大 ai 编程环境,不用为不同工具重复维护 skill 进入 skill 的 目录核 心。安装逻辑非常简单,执行通用的命令,通过 i 参数指定目标应用名称就能一键安装到对应环境。安装到 open call 参数写 open call 执行完成后,直接就能在龙虾中附用指令和接口安装到如图的内容。 安装后重启终端或工具即可生效。安装到如图内容参数机的修改重启工作环境就能使用。其他支持 skills 的 应用 都可以沿用这个格式,替换对应的应用名称即可。如果安装失败,优先检查三点,是否进入了正确的 skill 目录, skill 名称是否正确,而后面的应用名称有没有拼写错误。 这套安装方式最大的优势就是轻量通用,同一个 skill 只需要维护一份,就能快速部署到所有兼容的 ai 编程工具中。

解, u p i 发布更命令之后,可老的也迅速跟上。很多时候,我们用 ai 最大的问题是它太容易中途收工,或者让你变成 yes 工程师,任务就是点 yes 更命令就是你可以直接告诉他什么结果才算完成,他会自己做测试,测试发现还有失败就继续修,直到全部通过为止。恭喜你,你可以从左手刷视频变成两只手刷视频了。

文科生用 codex web coding 一定要用这三个小技巧。第一,自动测试,直接把我们测试的网站地址告诉 codex, 它就可以在侧边栏直接打开这个本地的网站,看这个小光标。这个时候 codex 就 会开始 自动的模拟用户的鼠标操作,他自己注册了一个账户,自己点点点各种测试,测完了之后出了一个测试报告,而这一切我只是简单的输入了这样的一句提示词。 我一直觉得 ai 控厅的时候测试是最枯燥的活之一,因为它起的代码真的有很多 bug, 然后你就要不断重复的去测,那这种任务交给 codex 来自动化的完成其实就是最好的,而且你还可以把它这个能力跟我们之前说到的 go 结合来使用,让它不断的循环的去自动测试,自己出测试报告,再自己改 bug, 形成这样一个循环,直到它自己检查不出来 bug 为止。这个时候我们人工再介入,其实真的是会提效很多。那第二个方式呢,就是一定要善用 codex 的 侧边栏,那 codex 的 侧边栏有两个好处,第一个是可以浏览的文件格式非常多,你不仅可以在里面预览网页,你也可以在里面去预览表格, excel, 还有各种各样的图片和 pdf 文档。第二个好,就是你不仅可以浏览,你还可以去编辑修改,我们做一个网站,也可以直接圈选中里面的一些空件或者区域, 更加定点的告诉他这个地方要怎么样改,其实真的也是非常方便。那第三个技巧就是一定要用插件里面的 for sale, 你 自己在 coding 的 时候上线,其实目前来说也是有一点麻烦的,因为你得去跳转到这些管上线服务的网站去做一些操作。但是我们在 codex 里面可以直接点击 插件,然后在这个地方直接添加上 word excel 这个官方的插件,就可以更加一站式的在 codex 里面做上线和发布了。整过程其实对我们这种文科生 callin 来讲也是更加丝滑和方便的,推荐大家可以尝试一下。最近用 codex 真的 很上头,明年还会再分享用 codex 做电商相关工作的一些视频,记得关注,下期见。

cloud code 有 几十个命令,但是如果你是新手呢,就一定先掌握下面这九个,其他的你可以先去放一放, 把这九个用熟了,你的使用效率和头肯的消耗都会好太多了。第一个命令就是 config, 这个是 cloud code 的 一个控制中心,那你输入杠 config 呢,就可以去查看和修改当前的一个配置, 比如说是否去自动的压缩对话,是否自动切换思考模式等建议呢,你可以把每个配置项都去过一遍。 第二个命令呢,叫做 model, 想切换模型呢,直接去输入杠 model。 普通的任务呢,你可以去选 sonnet。 复杂任务呢,你可以上 opus, 性价比啊最高,你看,就这么一个简单的选择,也能够去帮你去省不少的 token。 第三个命令是 clear, 聊着聊着呢, cloud 开始抽风了,越来越慢,透坑消耗的越来越快呢,这是因为你的上下文啊,已经太长了,那你呢,可以输入让 clear 去清空当前对话的一个上下文,重新开始一个新的对话。那我建议呢,每个独立的任务都开一个新的对话。第四个命令呢是 compact, 如果你不想完全的去清空对话,但又想减少上下文的一个长度,你可以输入杠 compact, 它会自动的去压缩历史对话,去保留关键信息,简单去理解呢,就是给对话做一次瘦身。第五个命令呢是 resume, 想回到之前的对话,你就输入杠 resume, 就 能看到当前目录下的一个历史对话列表,选择任意一个,就能直接去跳回去继续,相当于给你的 ai 编程加了一个历史记录的功能, 随时去切换不同的任务。第六个命令呢是 revend, cloud 写着写着去偏离方向了,或者提示词写错了,你不用重开对话,输入杠 revend 就 能回到刚才那一步对话,相当于给你的 ai 编程加了一个撤销键。 第七个命令呢,是 btw 任务中途突然想到了一个小的问题,比如这个文件是干嘛的?输入杠 btw, 解释文件作用, cloud 会去回答,但是不会去打断当前任务流程,也不会污染你的上下文。第八个命令域 name, 给对话去重命名有三种用法,第一个就是杠驴 name, 加上首页重构,你可以去做直接命名,然后如果你杠驴 name 不 带参数呢?让 cloud 自动从对话去生成这个名称。 第九个命令 export, 把诊断对话导出成一个 plaintext 文件打杠例 export, 当前的这个对话会被导出,包括每一个提示回复和工具调用,也可以加文件名参数,直接去写入指定文件,适合呢?在去解决棘手问题后啊,这个备份 方便后续的复盘或者分享。 ok, 那 总结一下这九个大的命令啊,覆盖了配置,覆盖了效率、覆盖管理三大场景,显著去改善你使用 cloud code 的 一个体验,输出质量呢,也会更加稳定,透根的消耗也会降低。 至于像 simplify, 像 branch 分 支等功能和 insights 复盘报告可以去,等进阶了再去学。现在已经有两千多位朋友了,如果你想在 ai 的 路上和我一起同行呢?欢迎在评论区我们一起去交流一下。

很多人以为给 cloud 写技能很麻烦,要手写代码,要懂格式等等,其实完全不是。今天我教你最简单的方式,让 cloud 替你写技能。我们先花三十秒了解一下技能长什么样。 一个技能就是一个文件夹,里面通常有几样东西, skill 点 md 核心文件,这个必须有 script, 放可执行脚本,比如自动发邮件,调用 api 的 代码等等。 reference 放参考文档,比如你公司的写作规范,行业术语表等等。 assess 放模板素材,比如固定格式的周报模板,邮件模板等等。 记住一件事就够了。 skill 点 m d 是 灵魂,其他都是配件。 skill 点 m d 分 两部分,第一部分是原数据,就是一段固定格式的说明, name 添技能名称 description, 写这个技能是干什么的,什么时候用, 其中最关键的就是 description, cloud 就 靠这段话来判断要不要加载这个技能。 所以 description 必须说清楚两件事,能做什么,以及什么场景下用, 最好带上你平时真实会说出口的关键词。第二部分是正文,用普通 markdown 写清楚步骤,视力常见问题就行,没有什么特别格式的要求。流程总共分三步,非常简单。第一步,先口头描述需求,把流程跑通。 比如我每周需要整理客户反馈,按问题类型分类,生成一份儿总结报告,然后一起把这个流程完整跑一遍,确认结果是你想要的。第二步,用 skill creator 封装流程跑通以后,直接说用 skill creator 把我们刚才的流程封装成一个技能,它会自动生成格式规范的 skill 点 m d 原数据, description 步骤指令全部帮你搞定。第三步,启用技能这里分两种情况,如果你用的是 cloud, 点 ai 网页端,把文件压缩成 zip, 进入设置里的技能页面上传开启就行。 如果用的是 cloud code 更简单,封装好之后直接就能用,不需要上传任何东西。 cloud 会自动识别本地的 skills 文件, 之后只要你说出触发关键词,它就自动加载,不用每次重新解释。如果你想改,直接告诉 cloud 哪里不对,让它自己改,全程一行代码都不用动。

你知道怎么用好 code code 的 skill 吗?今天告诉你具体的玩法,让你的 skill 从花瓶变成神装。我们知道 skill 就是 写一个 skill, 点 m d 文件,把规则写进去 cloud, 遇到相关任务就自动用了。怎么创建?记住三步,第一步,在命令行敲一行代码,创建目录。第二步,写 skill, 点 m d, 比如写上解释代码必须包含类比和 s k 图标。第三步,直接问他这段代码怎么工作的,他自动按你的要求回答。技能方的位置不同,适用范围也不一样,企业级,整个公司都能用,个人级放 close skills, 所有项目有效,项目级只在当前项目生效。插件级,由插件自带,在 skill 点 m d 顶部加一段研磨配置,可以精准控制技能行为。 name 是 技能名字,也是斜杠。命令 description, 告诉 call 什么时候用 develope model invocation 出,设为出之后 club 的 不会自动出发,只有你手动竖斜杠技能民才生效。技能内容分两种,一种是参考内容,告诉 club 的 一些规范和最佳实践,它干活时自动参考。另一种是任务内容,是具体操作步骤, 比如部署流程,先跑测试,再构建,再上线。前一种让可否的自己发挥,后一种让可否的按流程走。分清楚这俩技能就成功了一半。还有个东西叫 allowed choice, 可以 限制技能执行时可否能用什么工具,比如写个只读技能,只允许 read 和 grip, 其他全部禁掉,安全得很。再看 arguments, 你 写一个 fix a 属技能,然后输入斜杠, fix a 属一二三 cleod 就 知道要修第一二三号艺术参数自动替换,优雅倒库最后三个避坑技巧,既能没出发检查 description 有 没有关键词,既能老乱出发加一型 disable model invocation 处技能太多, cleod 看不到运行斜杠 context 的 检查 设置环境变量加大预算花五分钟创建一个技能,一劳永逸。记住技能等于更强大的 cloud。 关注我,下期教你写一个能自动修 bug 的 技能。

搭一个让 ai 自动生成这样视频的 skill 真的 很容易,咱们先来看一下效果。承认吧,你的二十多岁不过是个拿着身份证的未成年,别再拿三十而立 pua 自己了。社会学专门为这种尴尬期造了个词,奥德赛时期,他借用河马史诗里英雄漂泊归乡的故事,只待从青春期结束到真正扛起社会毒打的这段漫长过渡。 这条视频呢,我没有加背景音乐,只是让它实现了 tds 配音,然后根据我的文案去生成分镜的提示词, 用提示词去生成对应的图片,再用对应的图片去生成视频,它只是经历了这样一个三步的 api 的 调用,就可以批量的产出这样的视频。然后加入了一些基础的功能,比方说关键词的提取,这是它自动识别的, 在关键词动画效果出来的时候,配上一个对应的音效。在这里我先说一下 ai 生成视频目前成本还是比较高的,它主要有两种方式,一种是调用 api, 而电有 a p i 的 话,现在最强的模型,那就是字节旗下的 cds 二点零。如果你的电脑配置足够高,比方说有一个九零系的显卡,那你就可以考虑本地生成,如果是这种风格的话,本地模型也是可以出的。咱们来看一下它的流程。第一步呢,就是来 读取你的文案,你可以把文案放在你电脑里边,用 txt 保存就可以,你可以保存一份文案,或者十份一百份 都可以,他都可以批量的帮你去完成。然后我这里有五个预选的风格,刚才的这种画面,这种卡通风格的画面是一种,你可以去选其他的,你喜欢的,包括现实感的都可以。如果你有对标账号,想参考他的风格,截一张图发给你的 ai, 让 ai 反推风格提示。 然后第二步就是把咱们的文案用 tps 配音,配音的方式模型有很多,有 api, 有 本地,这个就你们自己去选择就行。 第三步就是让 ai 根据你的音频产生的准确的时间轴去把它分分镜,然后生成提示词。生成画面的这里有一个重点, 因为你要和你的画面做时长的匹配,所以这里你要用 tts 返回的准确的时间处,你不能靠文字让 ai 去大概分,这样的话就可能对不上。第四步就是根据你刚才的分镜生成参考图。现在 ai 生成图片和视频的质量已 已经是非常的高了,所以这两步你就是根据你的提示词去调用返回的结果,如果不满意,你再调整风格类型的提示词就可以了。 其中最长的一步就是图声视频,除了耗时最长,也是它的费用最高。前边的所有的这一套流程, 一条视频跑下来可能就是几毛钱或者一块钱,但是徒生视频的这个环节,一个一分钟的视频,如果调用 cds 二点零的话,可能就是十块钱,二十块钱,甚至更高,所以这里一定要注意根据你们自己的需求,你们能承受的一个范围。我这里测试用的是 cds 一 点零, 一点零,我让他帮我估算了一个费用,一分钟的视频大概是十多块钱,这里只是做了一个测试,你也可以选择便宜一些的模型,或者考虑本地去跑,最后一步就比较简单了,就是按咱们的要求,根据一句话,然后匹配对应的画面,导入到剪映的草稿, 然后加一些转场的特效,加一些音效,包括背景音乐都可以让他直接全部加入进来。现在有很多认知类的视频都可以用这种方式去批量生成。 有很多小伙伴关注的 ai 生成短剧的 skill, 其实也是这样的一个流程,只不过你里边会把你的文案划分成剧情,然后让他去拆分分镜的提示词, 最后也是生成图片,图片再去生成视频。最后一个拼接流程都是一样的,只不过中间的步骤需要按你的需求去调整,有时间的话我会出一期专门的教程。最近更新的比较少,因为一直在调试各种视频的,有直播切片带货的, 还有一些帮小伙伴们定制在他们电脑上去远程调试的。大家有想做的视频不知道怎么去搭建的,可以评论区告诉我。

今天呢,我教大家如何使用 coold, 使自己的工作效率提升百倍这样一个技巧。那么 coold 呢? 我当前使用的架构是 coold 加 vs code 加 deepsafe 这样一个模式,那么 coold 它当前整体的一个工作状态是,你提任务需求,然后 coold 出方案, 你在省略,然后 klog 完成,完成呢包括任务具体的内容, 还有最后的叫验,在这里面呢,新手使用 klog 最犯的一个错误就是我一句话,然后不停的点 yes, 也不细看,把一个任务弄得很大, 他在中间细分的时候,我们尽量要去看或者让他去停止。所以说呢,在这里出方案的时候,大家需要注意一点,就是你熟悉专业的地方,或者你专业明确的地方,在这里面 需要你自己去把它截断一下,这是整体使用可漏的一个一个任务的一个基本流程。那么在使用具体项目使用可漏的时候呢,需要注意以下三个技巧。 第一个技巧,在我初步化项目的时候,我要让我的格式一直对我当前任务做的一些预设前前提,比如说我要让它某种提示词偏向于某个方向, 那么在格式的框里面输入一个 int, 这个就是初步化,它会在你的项目根目录里创建一个格式点 m d 文件,这个文件就会记载你当前项目的一个任务 这第一点,第二点,在任务中涉及到的 skills, 在 安装完 ko 的 或者他自己去找的时候,他有些过程呢,也许没有找到或者啥的,那么我们就需要借助第三方工具去查找当前的任务包含了哪些 skills, 把这些 skills 下载下,安装好,在任务中按照它当前具体某一步骤的时候,让它自动去调用这些 skills, 这是第二步。那么第三步呢?就是需要对应的 m c p, 它是做一些非常精确性的操作, 可以在你的电脑上对于一些确定性的操作,比如说访问数据库,类似于 circle 之类的,比如说我要做一些定时任务, 那么类似于传统项目一些定时任务的数据处理,那么这些契合就整体对于 klo 的 外部又加了一些能力的延伸。那么综合这三点呢?其实每一点对于你项目的处理呢,它都是非常重要的啊。 第一点代表的是你在整个过程中它是一个完整的筛选,它里面的信息,你的要求,诉求, 它都会完整的记录。第二点,它对于具体步骤和任务,它能够完成的更好,你比如说中间你要用生成视频的,那么对于视频生成视频的 skill 呢?它有大量的你比如说 有类似于数理公式推导的视频,类似于豆包的 c d, x, c, n d 这样的视频, 那么你就要相关切,切换相关的,当然那个是要切换模型的地方。那么第三个 m c p 呢?相当于对于你当前的任务又向外延了一步,你可以接 更加庞大的业务,这在你使用单次可洛的创建任务的时候,这三个是一定要做的。 能够让可乐在你最原始的这种一句话,让他干一件事情,能够让他的性能提升非常大,原先百分之二十,现在可能就是百分之一百,充分发挥可乐的本身,这个作为大冒险的哈尼斯工程下,他能够非常完败完善的完成你的任务。

你让 cloud 改一个模块,改完一轮它停了,你说继续,它又改一轮,你又得说继续。来来回回十几次,你盯着屏幕,每隔两分钟就要点一下, 烦不烦? go 就是 来解决这个的,你告诉 cloud 一个条件做到什么程度,算完, 然后他自己一轮一轮往前推,中间不等你每轮跑完一个小模型,帮你瞄一眼。条件满足了吗?没满足,下一轮接着干,满足了自己停。 这个思路跟你以前用过的东西不太一样。 loop 也能让 cloud 一 直跑,但它按时间间隔触发,不管任务做没做完。 loop 是 和每五分钟检查一次这种监控场景。 go 是 按条件停止,有明确的终点。 stockhook 也能按条件停止,但它写死在配置文件里,全区生效,每个绘画都触发。 go 只在当前绘画有效,用完就没了。 loop 和 stockhook 是 长期配置。 go 是 一次性的快捷方式, 自动模式,可能很多人已经开了,它能帮你在单轮里自动批准工具调用,不用每个工具都点一下, 但他不会开心的一轮。 go 管的是这一轮做完了,还要不要继续开下一轮。自动模式管的是这一轮里的工具,要不要挨个确认两个是互补的,一起开。一个消工具提示,一个消回合提示。 三种方法,可以在提示之间保持当前绘画运行,根据应该启动下一个回合的内容进行选择。 loop 按时间间隔 stop hook, 按配置条件, go 按完成条件,各有各的最佳场景。 怎么写? go 很 简单,后面直接跟一个条件, go all tests in test of pass and the link step is clean。 写完立刻开始跑,不用再发一条消息。 当目标在跑的时候,界面上会显示 go active, 告诉你跑了多久。每轮结束后,评估器给你一个简短的原因,为什么过?为什么没过?你能看到 cloud 接下来要往哪个方向改? 条件是给评估模型看的,这点很重要。评估模型不跑命令,不读文件,它只看你和 cloud 的 对话记录,所以你的条件要写成能从对话里看出来的东西。 举个例子, testoff 下所有测试通过为什么有效?因为 cloud 跑完,测试结果会出现在对话记录里。评估模型易读,通过 条件满足。如果你写,确保代码没有 bug, 评估模型没法判断条件,要可测量 一个有效条件通常有三层,第一,可测量的最终状态,测试全率翻译通过,文件数达标。 第二,检查方式, cloud 怎么证明 npm test 退出零 get status 是 干净的。第三,重要约束过程中不能改什么,不要改其他测试文件。 条件最长四千字符,够你写非常详细的验收标准了。还可以加时间限制 or stop after 二十 turns。 加了这一句,最多跑二十轮就自动停,防止无限烧 token。 cloud 每轮会报告进度,评估器能从对话里读出来。查状态很简单,敲够,不加任何参数,能看到条件是什么,跑了多久?几个回合?花了多少? token? 评估器最近一次的原因, 想提前停 go, clear, clear, stop off, reset, none cancel 这些别名都行,或者直接 clear 开心对话目标也会被清掉。 绘画断了怎么办?用 resume 或 continue 恢复绘画,目标还在条件保留,但回合技术计时器 token 基线会重置,已经完成的目标不会恢复。 go 还支持非交互模式,一行命令跑到底。 cloud p go change log md has an entry for every pr merged this week。 直接把条件塞进去,它自己跑,直到条件满足。非常适合放 c i 流水线或者定时任务。 放到 pipeline 里,定时任务触发 go 自动验证。非常适合放 c i 流水线或者定时任务。 ctrl 加 c, 可以 在条件满足前中断进程。 go 到底怎么实现的?其实很简单, go 就是 stophook 的 包装。每次 cloud 完成一轮,把你的条件加上到目前为止的对话,发给一个小模型, 小模型默认式嗨酷。它只答一个词, yes 或 no, 外加一句简短原因, yes。 目标达成,清除条件。日制里记一条 no。 把为什么没过作为下一轮的指导,可 out 继续改。评估用的 token 在 你配置的提供商上计费用的模型很小,花费基本忽略不计。 有一些使用限制。 go 需要你在工作区里接受过信任对话框,因为评估器是 hooks 系统的一部分。 如果你开了 disable hooks, 或者托管环境设了 allow manage hooks, only go 就 不能用。命令会告诉你原因,而不是默默失效。 最后一件事,什么时候用够,你有明确的可验证终点,就用它。把模块迁到新 a p i。 每个调用点都能翻译。通过 实现设计文档,所有验收标准都满足。把大文件拆成小模块,每个都在大小预算内处理标记的一树积压队列清空。 一句话, go 的 本质是把你盯着屏幕点继续。这件事交给了条件判断,测试权率比你自己点一百次继续靠谱多了。

哎,我的桌面宠物在桌面玩,对吧?然后这个时候我们把桌面的文档直接丢给它,然后它就会吃掉这个文档,然后自动弹出来一个 cloud code, 然后我们这个时候就可以去使用 cloud code, 只要它在桌面,我们随时随地都可以把文档和文件夹丢给我的桌面宠物,然后它就自动的会弹出来 cloud code, 然后这里我们就可以对 cloud code 进行正常的一个问答。 对,而且这个宠物的状态是和 cloud code 的 状态是一致的,比如说 cloud code 这里是在啊思考,然后他也会啊在思考,并且他的表情也是不一样的,而且啊,比如说这里完成了,他也会去啊做一个完成的表情,并且说完成了, 那比如说我们再再试一遍,我们把那个给他问一些问题,比如说给我出几道题目,然后他这里会仍然在思考,思考的话他的表情和动作都是不一样的。 对,然后我们还能看他的一些宠物的设置,然后他其实这里有一千多个宠物,然后我们可以去选择你 任何喜欢的宠物,然后这里的话我们可以去啊设置宠物的一个不同场景下的一个啊,说什么话,因为这有说什么台词,说什么,比如说这里是你好啊,我是傻子,这样是我自己说的一些啊 制定的一些话,然后宠物就会啊跟着说,然后这里话我们还可以设置宠物的一个啊,不光可以设置大小和移动的速度,还能设置一个长期的记忆啊,对,然后开启长期记忆之后,你可以让宠物记住你啊 所说的话,你只要只要给宠物说你记住我的话,然后他就会帮你记住。比如说我这里啊,我的女朋友名字叫什么?然后我的女朋友名字叫小芳,因为,对,他之前记录我的名字呀,我的女朋友名字叫小芳,然后这里我问他,他就会啊,帮我们做回答。然后这里不同状态他宠物的啊,状态也是不一样的。 对,当然也有很多种宠物,然后供你选择。然后这就是我开发的一个啊,桌面端的一个超级的 ai 宠物。对。

我用 cloud code 做了一个语音转文字插件。嗯,那个你帮我审查一下这个项目,看看 cloud code 还跑不跑的起来。按住一个键,说完话再松手,我说的话就已经干干净净的放进去了。 说话里那些口水词, ai 会自动帮你清掉,让意思更准,执行起来也更顺。而且不用买任何硬件,你的电脑能跑就能用。这一期我会从头分享它有什么效果,又是怎么做到的,普通玩法和进阶玩法你都能用得上。 你想让可乐克的干活,第一步永远是把需求打进去。中文打字慢,需求一长,光打字就够烦的,用系统自带的语音输入,吐出来的全是没标点,带错字,还夹着口水词的句子, ai 读着费劲,你还得自己改。 说到底,让 ai 干活慢的从来不是 ai, 而是你把需求喂进去这一步来看,一次完整的按住这个键,小球变红,开始录音。 嗯,这个交互啊,那个,它不只是 agent 嘛,就是说你平常对话,搜索引擎聊天都都能用。说完松手,小球变成开始处理文字就自己出现了。 你看这个耗时,除去说话本身,从松手到出字,整个过程大概只要一秒左右。 而且它不只是给 cloud code 用对话框、搜索框,聊天,输入任何能打字的地方都行。 把刚才那句话拆开看,我的原话里全是,嗯,那个就是说转写出来口水词全在标点,一个都没有。 ai 清洗之后,口水词没了,标点也补上了,意思却一点没变。它不只是把声音转成字,而是把你随口说的话整理成 ai, 能直接执行的话, 你松手到字出现中间就这几秒,这几秒里它走了四步,录音,把声音转成文字, ai 清洗,还有自动粘贴。下面一步一步拆给你看。 第一步,把声音变成字,你说的话是一段声波,机器得先把这段波切成一个一个字。这件事就叫语音识别。 voice r text, 默认用一个叫 fast whisper 的 模型在你自己电脑上跑,声音不会上传云端,但光靠声音,机器会听错音境的字,比如把 cloud 听成 cloud, 所以 光这一步还不够。 第二步,把这份听写稿交给一个 ai, 让它做三件事,第一是改错字,尤其是专有名词,把 cloud 改回 cloud, 靠的是一份你自己的术语表。 第二是补标点。第三是清口水词,把嗯那个就是说这些全删掉,它只做声音变成准确文字这一件事,不替你改写,也不替你扩写,定位单一,所以好用。 这四步你看不见,但那个小球会用颜色告诉你,他走到哪了。灰色是空闲,红色在录音,橙色在处理,紫色是出错了,一眼就知道他在干嘛。 刚才那四步,普通用法是开箱即用,进阶玩法。其实就一句话,那条流水线上的每一段,你都能换成自己想要的,怎么换?改配置文件里的一行字就行。 先说转文字这一段,它能换。你可以用本地的,比如 face the whisper 或者更快的 sensewise 模型在你电脑上跑声音,不出门 也可以接云端,比如火山引擎这类。国内语音识别本地不花钱,声音不上传,云端不占你电脑算力,换台机器也不用重下模型,你有什么条件就用哪个。 再说 ai 清洗这一段也能换,你有 cloud, 订阅就走,订阅不额外花一分钱。你有自己买的 api, 比如 antropica 或者 deepsea, 又快又便宜,什么都不想接,那就不清洗,直接用听写稿 有订阅用订阅有 api, 用 api 什么都没有也照样能用。换不同后端速度差很多, 本地 sense voice 几乎一瞬间云端要走一趟,网络会慢一点,老的 fast whisper 最慢,所以我默认用 sense voice 还有个花哨的玩法, ai 不 只能清洗,你让它整理,它能直接把你说的话理成 markdown。 说一段乱的出来就是分好层级的结构稿。 同一个工具,新手开箱就能用,老手能拆到零件级。就这一点,我做的时候没将就。 工具我已经开源了,地址就在屏幕上, windows 和 micros 都支持,后面有新需求我也会持续更新,觉得有用的点个 star 支持一下。对了,这一整期视频从需求到脚本,我一个字都没打,全是对着 voice 二 text 说出来的, 如果你喜欢或者不太会用, get up 拿代码关注我再私信我,我直接发给你。我是白梦,我们下次见。

不少人在用 ai 的 时候,会经常遇到两个问题,第一是每次都得重新去教 ai, 它的身份是什么,应该怎么去干活。 第二就是 ai 的 输出结果不稳定,经常要碰运气。但现在已经有一批人在用一种方式让 ai 越用越聪明,一句话就能让 ai 直接自动去干活,这个东西叫做 skill。 今天这条视频跟大家讲清楚四件事情, 第一点, skill 是 什么?第二点, skill 长什么样子。第三点,我们应该怎么把 skill 用起来?第四点,为什么说 skill 是 ai 最关键的能力?首先第一部分, skill 是 什么?一句话总结, skill 是 给 ai 写的一份工作说明书, 它不是提示词,提示词通常是一次性的指令。而 skill 是 把你的能力、流程、经验全部打包成一个可附用的模块。比如说我们写小红书就能固化成一套固定的结构,我们做数据分析就能拆出一套分析流程,做 ppt 也能抽取出一套设计规范, 这些东西全部都可以变成 skill。 而且最关键的一点是,我们不用每次都手动调用 skill, ai 会根据我们说的话自动判断我应该帮用户选哪个 skill 来用。就像一个特别懂我们的 ai 助理,你一开口他就知道这个活应该自动用哪个模块,应该怎么干。 第二部分, skill 到底长什么样子? skill 实质上是一个文件夹,这个文件夹里面最重要的一个文件叫做 skill。 md, 这个文件关键是干两件事,它的上半部分是告诉 ai 什么时候要调用这个 skill, 比如说用户要写文章,或者用户要做 ppt, 要分析数据,只要触发了关键词,就可以挑起这个 skill 模块。它的下半部分是告诉 ai 具体应该怎么做, 比如说第一步做什么,第二步再执行什么操作,输出的格式是什么,应该用什么样的风格。大家能看到这个文件的实质就是给我们的 ai 助理写一份工作操作手册。第三部分,我们日常应该怎么把 skill 用起来?这里讲三种最实用的方法。第一种是直接用别人做好的 skill, 假如你想把一篇文章变成 ppt, 只要三步,第一步,找一个 ppt 的 skill, 第二步,把它丢给 agent。 第三步,说一句帮我安装这个 skill, 那 以后只要你输入一句话,它就会自动挑起 skill 模块,帮你把文章自动变成 ppt, 然后存储在你的电脑里。 第二种是自己做一个 skill, 这是 ai 时代很关键的一个能力。举个例子,假如你是做自媒体的,那你可以做一个 skill, 从自动找热点到生成选择题,最终再输出内容。 那我们只要说一句,帮我找一下今天的 ai 选择题,这个 skill 就 会自动去抓信息给你选择题,接着最终帮你把内容写完。 它的实质是把你的自媒体工作、 sop 工作流固化下来。第三种是让 ai 帮我们做 skill, 我 们可以直接跟 ai 说,帮我做一个 skill, 它的功能是什么,那 ai 就 会自动帮我们拆解需求, 自动生成 skill 的 结构,最终可以直接使用起来,相当于 ai 成为了我们的 skill 开发工程师。那为什么说 skill 是 拉开使用 ai 的 分水岭? 它是 ai 的 关键能力,因为我们会发现大部分人现在用 ai 还是这样的,问一次,然后用一次,但是它没有产生积累。而 skill 会做一件特别关键的事情,就是把我们的经验沉淀下来,固化下来。我们只要教 ai 一 次,它未来就能无限次复用。所以实质上 skill 不是 工具, skill 是 我们能力的放大器,它像一个杠杆一样,把你的优质经验沉淀下来,把它放大,把它加速起来。这就是为什么有些人的 ai 会越用越强,越用越聪明。但如果我们只是停留在对话阶段,还是会存在很多重复劳动,差距就在这里 评论区打 skill, 我 会发你一份完整的 skill 使用指南,我们一起把 ai 用到极致。那我们就下一期视频再见!

让你的 cloud code 日更一百条爆款,只需要这五个 skill, 国外开发者偷偷用了一年,你一个人比绝症号五人通宵都猛。我上周才知道第一件, video use 四千九百个 star 还在涨。让 cloud 替你自动剪视频, 给原始素材自动转写,找简点搜字幕,默认抖音风两字大写,全是他干。第二件, hyperframes 黑键,全球数字人一哥,让 ai 直接出短视频,你说做个九比十六抖音风带配音,他自己写代码,本地一键渲染出片。第三件, remote, 官方 skill, 视频博主天天用的引擎, 官方亲自教 ai 写代码,二十八条规则,三 d 动画音频字幕转场全套覆盖, 视频代码再也不靠运气写。第四件, influence s h, 两百五十个 ai 模型,一句话调用,国外五万人偷偷在用响声图 f l u x 响声视频 v e o 响配音 coco 一 句话搞定,不用多个账号。 第五件,中国大牛 w 书 e, 把 remotion 跟 mini max 配音免费打包好,装上之后你做视频配音用 mini max 写代码用 remotion, ai 全流程接管, 你以为五件独立装就行?大错,一个不装,其他四个白买。我先告诉你结论,一件剪,一件生,一件叫,一件掉,一件包,五个工位连成流水线,缺一不动,一晚跑一百条,听起来吹牛,我给你算笔数学账,你看完就不再怀疑。八小时除以一百条,一条四点八分钟模板批量加定型处理, 普通笔记本就扛得住。你做视频现在用什么?剪映? capcut 还是盆面?评论告诉我,看看哪个能切过来卷剪映,卷到秃叼 capcut 叼到瞎,熬通宵熬到老,唯独装这五件 clone 替你日更一百。你是变量,不是常量,这里是人间变量,我们下期再见。

还不会给 cloud code 配置 deep seek 大 模型吗?我来教你,无需其他操作,一键完成。就是用这个软件,打开之后点击右下角的加号,点击 code 图标, 这里有很多的代码工具,我们选择 cloud code, 在 模型这里就可以选择 deep seek 了。选择好模型之后,再选择你的工作目录,最后选择终端,一般用 command 这个终端点击启动, 这是一个权限问题,回车选择 yes 就 可以了,这样就配置成功。用的模型是 deepseek 杠 v 四杠 pro 的 模型。 deepseek 真的 划算,用了二十九万的 token, 共计花费三块钱。觉得有用的话记得点个关注,我会持续更新 ai 相关的视频。

现在可以端到端的剪辑我的视频了,我只需要拖入一个原始文件,它就能自动剪掉错误和空白的片段。 它能添加你在这里看到的动态图形和动态元素,它甚至能在屏幕的底部添加字幕,就像你现在看到的这样。 所以即使你从未写过代码,或者从未剪辑过视频,这期我会手把手的教你如何用自然语言让 clark 制作这样的视频。 ok, 不 浪费大家的时间,让我们直接进入正题, hi, welcome back to the channel, 我是 jacky, 今天我们一条视频教会你如何让 cloud 制作这样的视频看到。我以前的操作是录制完视频之后,会打开剪辑软件,把错误重复停顿的地方都修剪掉。 然后呢,再去加字幕特效,动画和音效,那一条一分钟的视频少需要一个小时来操作。那现在呢,这个流程基本上就自动化了,现在我还是保留了我自己来录这个视频,但如果你想的话,你也可以选择数字人来代替。 那在初显的部分呢,我们会用到第一个工具叫 video use。 第二呢,我们会用到 hyper friends 来做到我们的加字幕特效,然后包括渲染导出。那这两个工具它们会共用一个大脑,那就是 cloud。 ok, 那 现在我们把这两个 skills 的 链接复制下来,去给到 cloud, 可以看我让他去帮我们直接配置好。 ok, 因为我已经提前配置过了,所以呢,我就直接在这里直接演示。 那可以看到安装完之后呢,他会告诉你已经 ok 了,那你把素材放进一个文件夹,并且启动号,然后把素材给他扔过去。 那其实我是录了一个四十多秒的一个视频,然后这里面呢,我去刻意做了一些停顿和卡顿,包括重复。 那这里可以看到是一个四十二秒的视频,我放进了这个文件夹,那我把这个文件的路径发给 cloud, 并且呢告诉他要去输出到哪一个 output 里面。我 跟他说,我想让你用 video use 这个工具来剪辑这个视频,请分析他删除任何的语气词,停顿和重录的部分, 然后我们要用的是 hyperfun 去添加这个动效,所以首要的任务是减掉错误和语气词。 ok, 他 开始识别一个四十二秒的视频,那他的第一步呢,是会把我们的所有视频里的语音去转文本,然后去识别。这一步 看他转入完成是一共是一百四十九个词。转入完之后呢,他就会去进行识别,哪个地方是静音的,哪个地方是重复的,以及哪个地方是不要的。 他会给到我一个方案,我如果觉得 ok, 我 就直接跟他说直接去执行。 ok, 你 可以看到他渲染完之后就是二十八点六秒, 他会直接导出到这个 oppo 的 文件夹,可以看到我们这有一个 preview, 这就是刚刚的视频,可以看到开头包括一些停顿的卡点,他已经自动帮我剪辑掉了。 ok, 我 看完 preview 之后,我觉得初稿初剪没有什么问题,那我们就到下一步用 hyperforce 去做这个 motion graphic, 那 我现在会跟 nike help 说,我们要开始做这一步了,那我这里可以看到我有个很详细的一个提示词 去发给他,那我把这个详细的提示词呢,也整理进了一个文档,那如果有需要的话,大家可以在评论留文档,然后我会发给你们。你们也看到了,我就是使用自然语言去跟他提需求,而且非常具体, 所以我知道你们可能会在想,如果每次都需要这么具体,那我们真的能省多少时间呢?那其实是因为我们是第一次开始用, 我们需要先训练他知道我们是怎么样的一个需求,等到同类型风格视频积累了五条左右的时候,建立好这个风格,他就会默认去使用这套成熟的规范就可以真正的实现。 我只要拖入原始的文件,他就可以端到端的去全自动去剪辑这个视频。 ok, 可以 看到这里他就是开始自动去跑去渲染加这些动效。 那并不是说每一次他出来的第一版都是非常正确的,可以看到他这边导出完之后会有这个第一版,那我就发现他这个液态玻璃他其实是透明底的, 那他对于其上面的字体的显示并不是那么友好,那我就跟他说了,看他现在是纯白透明底,导致文字上面不清楚,我希望加一点底色, 加高斯模糊。然后另外一个呢,就是我这个刚刚那条视频的布局结尾的时候,他是把人物进行了一个拉伸,那我会跟他说,我不希望拉伸,剪裁就可以了。 ok, 然后他会继续跑,背后呢,他就会渲染出来这一条视频,也就是大家开头所看到的那条视频。 ok, 如果这一期视频对你有帮助的话,可以点个赞和收藏。关注杰克的 ai 成长日记,每天懂点 ai 使用技巧。

这是一期教你如何正确并且省钱使用 cloud code 的 视频,关注我时间长的朋友应该都知道,我是 cloud code 的 死忠粉,作为一个每天使用八个小时,并且用 cloud code 变现了几千块钱的用户,今天我将跟大家分享几个帮助大家省钱而且提高效率的隐藏命令,也许你从入门到精通就差这几个隐藏命令了, ok, 话不多说,我们直接开搞。首先就是 model ops plan, 大家熟知的我们都是通过 model 进行切换嘛。 但是这个命令对于二十美金的 pro 用户来说实在是太友好了,因为它会自动地在你进行一些复杂推理和写计划的时候使用最强的 ops 模型,然后在执行的过程中使用第一档的 sonata 模型,这个就能帮助 pro 用户显著地节省头肯, 你的一倍头肯,能用到三倍头肯的效果。第二个就在命令行输入 remote control, 就是 我们在养龙虾的时候终极梦想,就是我们躺在床上,然后让 ai 自己写代码,那么这个命令就能很好地帮你实现。这一点能够通过手机来操控 cloud code, 你 只需要在对话框里面打斜杠 r c, 它就会生成一个网页, 你用手机打开这个网页的时候,你的整个 cloud code 就 会在你手机上同步,这个功能是让你的手机变成遥控器,远程的遥控 cloud code, 我 只能说憨爆了。第三个命令行是斜杠 export, 它会把我们所有的对话上下文打包成一个 m d 文档。如果没记错的话,我觉得 cloud code 的 上下文窗口应该只有两百 k, 经常出现那种你跟他聊着聊着上下文窗口满了,你需要开一个新窗口的问题, 那么这个命令就能很好地帮助模型去知道啊他现在做到哪一步了,他接下来要做什么?此外,你可以导出到其他的 ai 产品嘛,比如说 codex 上面,然后你继续搞。最后我想讲的这个不是命令行,但是如果你要想在你睡觉的时候让模型继续帮你工作,那么就一定要勾选上这个 permission, 它叫 bypass permission。 我 们是不是很多人在使用 cloud code 的 时候,一会儿一个弹窗,一会儿一个弹窗,你要点击去确认这些权限,但是你选择 bypass permission 的 模式之后,它自己就会去执行所有的命令了。其实我今天本身还是很想讲一个,就是 agent team, 你 一个人怎么去组建一个 agent 军团去帮你干活? 我经常搞十几个 agent 同时并行的帮我完成任务,这种感觉实在是太爽了。但是因为这个篇幅比较长,而且今天时间有限,可能讲不完,所以说大家如果想听的话,可以在评论区里面提需求,如果想听的人多了,我们下期直接安排上,那么我是 holland, 关注我,带你分享更多 ai 变现和省钱玩法。

来让你不用写代码,三分钟就做出,输入个主题人群平台就能出十几种不同风格的文案。开头输入月薪自动来算你的实心,还可以随时来更换你的专属 ui。 关键是以后类似的程序都可以这样来做。 今天也让小白能够流畅的运用上口碑一路飙升的可拉库的编程 ai。 哎,如果你觉得它只能用来做编程,目光短浅了,它还可以整理你本地电脑的文件,了解你的喜好,记住你的习惯,创造出专属于你的文本风格。与其陷入去学一百个不同软件的按钮怎么点?不如直接掌握这个能自动写软件的核心大脑 程序和记事词呢,我也都整理到了视频里。我们 let's go cloud code, 简称 c c, 背后的公司 israpix, 很多人都来自 open i, 但它们出来之后并没有继续拼谁更强,而是干了一件很不一样的事情,把 ai 往更安全、更理性、更向人类思考的方向去做。而 c c 呢,更类似于语言工具,啥意思呢? 就普通工具啊,它是拿来干具体的活的,就像 c s 店里已经做好的车,它已经规定好在什么场景下来使用。而语言工具呢,是拿来造干活工具,工具通用,通过你自己调教,用自然语言告诉他你的要求,一步步的给你做成成品。 所以它就不只能做编程,还可以拿来写文案,查资料、整理资料、分析数据、做表格、写报告,都 ok 的。 那我们要用上 c c 呢?总共有三到四种办法。今天我们只聊最适合小白最省心的办法,就用终端 cursor u u studio code 这种 ai 编程软件中来使用,因为在终端中呢, c c 的 工作流程更接近我们真实的办公场景,能在你的电脑上来执行,而终端呢是长这个样子了, 有点太原始了,小白用起来呢还是比较吃力一些,放到编程软件里呢,它的界面会比较友好一些,并且这些软件的更新速度也很快,我们在使用 c c 的 过程中呢,也能结合它更新的这些新功能, 那我们这次呢就来使用 vivo studio code, 那 谷歌反重力呢,我们之前也有聊过,感兴趣的朋友呢,可以去看一下。那我们进来之后点击这个新建,然后新建一个文件夹, ok, 创建好后呢,我们在这个地方就可以看到了,那接下来我们就来安装一下 c c, 这里输入这行命令, ok, 我 们点击回车。那当你看到这个经典的小 logo 之后,就说明 c c 已经安装好了,但这个页面对于小白来说只好那么一丢丢,那我们可以通过插件来让这个页面变得更加好理解一些,然后这里点击一下,然后我们在这里再点一下, 它的这个页面呢就会变成这个样子了。到现在呢, c c 就 算已经安装好了,但是还有个关键问题,就是我们在 c c 里面要用什么样的模型,因为可劳斯扣的它本质上呢就是一个使用模型的工具入口,所以呢它不能自己的去产生智能,而不同的场景呢,又需要不同能力测重点的模型。当然 c c 呢也有默认的模 型,但因为条件问题,大部分的朋友呢是用不了的,那我们呢就可以直接接入国产模型,可以解决这个问题,那我们这次呢就用 c c 的 位置来演示,点击这里呢需要添加你的 api key, 那 回来以后呢, 我们点击这个启用,那再使用的时候呢,就是我们添加的这个模型了,直到现在我所有的操作呢都是在复制粘贴到对应的位置,所以啊大家不用太过于害怕这样的页面,包括大家在使用过程中,我们都可以在旁边另开一个 ai 软件,如果有任何的 bug 问题,我们都可以截图发给他,大部分的问题呢都可以帮我们立刻解决。 那我们来到里面以后,最左边竖条的就是工具栏,像文件夹查找 get 插件, 而在这里呢你就可以看到你的文件输了,再有一些具体的内容,它呢就会在这个地方去显示,那这边呢就不难看出了,就是你和 c c 沟通说话的地方,下边这个斜杠就能看到里面的所有指令了,和我们在 c c 终端里直接输入斜杠是一个意思, 这么多我哪能记得住啊,大家不用全都记住,记住几个常用的就 ok 了。那斜杠 come back, 它就是压缩上下文,这个命令呢就会把我们之前的一些对话压缩成一个关键的节点,也避免了因为上下文太多。 c c 在 回答我们问题的时候呢,不太聪明了, 那斜杠 model 输入之后呢,就能帮我们切换高中低档的模型,当然这个呢是需要我们在 c switch 里边提前配置好的, 我的建议呢是大家先用着,时间长了呢我们就都知道了。而其他的一些常用指令呢,我也整理到了课后文档里,那我们先来问问他用的是哪个模型好? 他回答我们呢,就是刚才我们安装的那个模型,而 c c 呢,一共有四个模式,是让我们可以来回切换的,那我们先做一个比较简单的实心计算器,在这个过程中呢,我们来逐步解锁, 包括经常用到的一些知识点。那我们先把这里的模式改成全线最小的规划模式。自变意思啊,只规定计划先给方案,你同意了呢,他才会继续往下执行。那我们把要求用自然语言发 ac, ok, 我 们稍等一会儿。 好, cc 呢,现在给了我一个完整的开发计划,他给了我们三个不同的选项,那第一个呢,就是我们同意这个方案,并且呢切换到自动编辑模式。第二个就是我们马上来执行这个命令,在后续的编辑命令里呢,需要我们同意,他呢才能一步步的往下去执行。那这个呢,是我们不同意再继续修改,那我选第二个。 那在这里我们可以看到它的这个模式呢,已经切换成了编辑前询问,在这个模式下,每次修改文件跑命令需要你的批准, c c 呢才能逐步的往下去执行。 ok, 它现在呢是需要把文件写到本地的一盘里来询问我们了,那我们点击同意好,它现在呢是写好了的, 可以看到这里的模式呢,又切换成了自动编辑模式。而在这个模式下, c c 再去改什么它呢,都是默认的状态,不再逐条向我们确认了。不过呢,终端命令和网络请求还是来回询问你的,那有没有都不需要我参与,我知道有风险,但我真的不想每次都被卡住了。有的第四种模式, bypass permissions 开启之后呢,他呢就不再逐条向我们确认了,而是直接执行,直到最后的呈现。那我们来到左下角设置,然后搜索这个,他呢就出来了这个选项,那我们勾选之后就开启了这个模式。 那还有一个方法呢,就是在终端里,然后我们输入这个,可以看到这里呢是已经生效了。 ok, 我 们再回到最初的网页,然后让他呈现出来,那他现在呢是直接帮我们打开了,那我们来试用一下。 ok, 我 们都给他输入。好,哎,他现在呢就给了我结果,嗯,不错。 那直到现在我们知道了整个页面的排布情况,四种模式,他们呢都有什么状态,我们又怎么来触发他们?我们还做了一个简易的实心计算器,给自己点个赞,你是最棒的。但是这个网页啊,简易的太简易了,没有色彩。那我们除了可以用自然语言和 cc 沟通之外,还可以给他一张图片,让他按照这个配色来完善我们的程序。 ok, 他 这个配色完成的还是不错的。那还有一个就是我们一直忽略的点,就刚才我们给实心计算器只是一句简单的话,而在我们日常的使用中,肯定不止这么一个简单的要求,那我们要是在命令行里去输入这么一大片命令要求的话,还是挺费劲的。所以呢,我们可以把这一长串的命令放到文档里, 然后把这个文档再给 c c, 让他按照这里面的要求来工作。另外我们开头也说了, c c 呢是可以在你的电脑上来执行的,修改你的文档安装到你的电脑上,我们呢就可以把放了五个视频的文档给他,让 c c 转换一下格式,然后提取一下音频。他呢现在是已经给我分类整理好了,还是不错的。 当然这些呢只是更基础的,后面呢还有更好玩更高级的。我呢再慢慢跟你说,大家也不用太着急,用得动的高深,你先用一段试试,很多感觉呢是你用出来的, 更重要的是我们习惯这种和 ai 写作的方式。再往后一点,可能很多事情你只需要一个开头,它呢就能帮你走完全过程。好啦,喜欢这种内容的朋友呢,看好我呦,下次见啦。