ai 圈最近有点离谱了, green sock 官方居然开始给 ai agent 做 skill 了。现在 ai 已经不是生成 demo 了,他开始自己拆文字,自己编排镜头,自己控制动画节奏,甚至开始理解动画节奏。以前这种动效需要高级前端手搓,现在 ai 已经开始生成完整的 run time 了。 很多人还觉得 ai 只能写 c r u d, 但实际上 ai 已经开始吞动画行业了。以后真正值钱的可能不是会不会做动画,而是你能不能设计 ai 动画拍 plan。
粉丝1396获赞5573

大家看到的所有的效果,屏幕上的大字,还有图标,人物位置的切换,百分之百都是由 ai 完成。而我做的呢,只是给他素材,然后用自然语言告诉他我要什么。那所以呢,这一期我们就来实操一下,看一看这个流程到底是怎么跑起来的。 先说工具核心呢,就有三个,第一个叫做 code code, 我 们可以把它理解成一个会写代码的 ai 助手,我们就直接告诉他我要什么样的效果,那他就会直接帮我把这个代码写出来,完全不需要我自己懂编程。第二个叫做 video use, 它的作用呢,是读懂我们的视频,我的视频里面我说了什么画面应该在哪个地方,切哪一段,适合加什么样的效果,它都会帮你分析清楚。第三个叫做 have frame, 这一个呢是专门负责给视频加动效的,比如字幕、动画、 动态图表,这些视觉的效果都是由它来实现的。那这三个工具怎么配合?一句话说清楚,你跟 cloud code 说你想要什么样的效果,再让 have frame 把效果给它加上去,你全程只需要开口说,不需要碰任何的代码。 好,我们正式开始打开 cloud code, 新建一个空文件夹作为工作的目录。然后呢,我们把这个 hyferry 的 github 的 地址,哎,给他复制一下,帮我把这个开源项目下载下来,初步化,我要做一个横版的视频,之后告诉我一切是否正常。就这一句话,那他会自己去拉代码,装环境, 跑起来,然后告诉你,哎,我装好了,这里呢,有一个小细节,我说初使画完告诉我一切是否正常,那是因为我不想他一口气做太多,我要确定每一步没问题之后再往下走,那这个习惯很重要,后面会省很多的偷看。同样的方式,我们还需要安装一下这个 video use, 同样复制一下他的链接,安装一下这个,把地址粘贴给他。 整个项目跑起来之后,我把我的口播文件素材放到文件夹里面,告诉 cloud code, 用 video use 帮我编辑一下这个视频,你去分析它, 把它那些不要的词,停顿,重新录的部分全部给它删掉之后,我们会用 happy frame 加动效。现在你只需要做剪辑这一步 看,这里已经剪好了,这里是十五秒,你看我们的素材呢,是十七秒,这里呢,已经把视频里面的口误给剪掉了,并且生成了一个带时间戳的文件。那有了时间戳的字幕,他就能精准的记住每一个词,他在哪个地方,那他的动效才能对得上。 那剪辑完成之后呢,我们进入到最好玩的地方加动效。接下来我们用 type n 给整个画面做封境表,我们需要三个东西,第一个就是刚刚口播的文案, 第二个这是场景图,第三个就是风格参考这里的模型呢,我们一定要选择 g b t image。 二 好,这已经生成好了,我们来点开看一下,整个效果非常好,审美也非常不错。那我们只需要把这张图扔给 cloud code, 让它根据这个效果去用 hifer 去生成对应的动效。接下来 让他根据分镜的内容,把具体的动效给它描述出来,切换到 play 模式,让他把计划列出来给你看,确定没问题之后,再让他去真正的去生成代码,把计划确认之后,让他生成第一版,然后在 have free 的 预览界面里面看效果,这是第一版出来的效果,大家看一下。 我最近发现一件很荒谬的事,我花了五年时间学剪辑,学调色,学转场,学怎么在剪辑软件里面做各种各样的效果。 然后有一天,我把这一段刚拍好的恐怖素材扔给 ai, 用中文跟他说帮我剪一下,加一点字幕,搞的高级一点,那他就做完了。 底板大概率是有问题的,你现在要做的呢,就是具体告诉他哪里有问题,越具体那他改的就越准,你浪费的 token 呢,就越少,改了两三轮,基本上他就能达到你想要的效果,然后渲染,叫他给你导出最终的文件。 我最近发现一件很荒谬的事,我花了五年时间学剪辑,学调色,学转场,学怎么在剪辑软件里面做各种各样的效果。然后有一天,我把这一段刚拍好的恐怖素材扔给 ai, 用中文跟他说帮我剪一下,加一点字幕,搞的高级一点,那他就做完了。 整个流程其实很简单,就初步化项目,然后给他素材和字幕,接下来让他自己去剪掉多余的气口,根据我们的描述去生成动效,然后不断的去修改迭代,最后渲染 不需要拖时间走,也不需要记更容易的快捷键,它就直接可以生成。但我想说的呢,不是 ai 有 多厉害,那我觉得更有意义的是你花在学工具上的时间,现在可以花在想清楚你要表达什么方面, 那剪辑从来也不是创作的核心,它也只是执行的部分,那现在执行的部分可以外包给 ai。 那 你剩下的时间就应该想想我到底想说什么?这个内容到底值不值得做?那如果这些对你有帮助的话,希望能给我点个赞。那我是姚艺,我们下期见。拜拜。

这是 coco 帮我剪的云南旅行 vlog。 做 vlog 视频最麻烦的一点就是零碎的素材特别多,经常光是看素材就要花上好几个小时。比如说这次云南旅行的 vlog 一 共有一季多的视频,一共有六十几个, 一个一个看的话会花很长时间,更不要说还要把这些素材手动拖到剪映里面去,一一的做对齐剪辑了。 但今天呢,我直接是用 cloud code 尝试了一下,基本上一个多小时就把整个流程都跑通了,而且这中间我人工也只参与了十多分钟,剩下时间都是他自己在跑任务。 整个过程其实非常简单,而且也是个特别典型的人机协助的一个过程,就是我们人类呢,就负责给他定目标,定任务、给素材以及进行检查 cloud 这种 agent, 它就可以自己去拆解任务,找适合的工具,然后再去执行反复迭代。所以大家如果五一出行想剪辑 vlog, 直接按照下面的步骤操作就可以。首先第一步,我们把这个任务布置给 cloud, 其次呢,再把你自己的各种视频素材还有文案也都一起给到它,它就可以开始规划整个任务的流程了。大家不同的 agent 给你规划的流程可能是不一样的,播这个流程是完全跑通的,所以大家可以自己去录口播,然后发给他。 第二步呢,他会去读这六十多个视频素材,然后在里面抽关键帧,根据关键帧的读图效果给这个素材打标记,比如说画质好不好呀,清不清晰啊, 以及视频里面到底展现了什么样的内容,你看他甚至还自己规划一张一张读图太慢了,他把每个视频的关键帧拼成一张大图,直接一次性读, 这个都是 a 阵的自己非常高效和智能的地方。第三步呢,他就会开始去把文案跟素材做匹配,去自行规划到底哪些文案要配哪一段的视频素材。在这一步,建议大家让他生成一个分镜表,你自己可以审核一下, 不同的视频节奏是不一样的。比如说我这里想节奏舒缓一点,我就会嫌他给我剪的分镜太碎,时间太短了,所以就会要求他把分镜的时长再拉高一点。 那当这个规划表咱们确认之后呢,就可以开始让它直接去剪视频了。在这里呢,用的还是我们之前常说的这个工具啊,叫 f f m p e g, 是 一个本地的剪辑工具,非常好用。它剪的其实很快,它剪完之后,你可以检查一下成片。比如说我这个地方大概检查了两次,它有素材重复的问题,然后有些素材尺寸不一致的问题,你就 跟他说让他去改就好了。我这边其实检查两次之后就完全搞定了,很完美。最后一步,咱们来去稍录字幕。稍录字幕这一点听起来简单,但他容易出现的问题包括 一行的字幕有时候会太长,以及他每行字幕之间的截断跟语义不一致。这种时候推荐大家让他先配一个三十秒的, 你检查一下,有问题你就大白话跟他讲,让他把这三十秒片段修改到你满意之后,再来做全篇的字幕。这过程真的并不复杂,推荐五姨拍了很多素材,想做 vlog 的 朋友们可以直接尝试一下。 ok, 今天就分享到这了,后面还会有更多跟 aj 的 相关内容,记得一键三连,下期见。

和我一起百慕克顶丝滑卡点视频生成小工具。每次旅行白天拍了好多照片,但到了晚上都累到不想剪视频。之前刷到这种照片贴地砖的卡点视频觉得很有意思,可是用剪映剪至少要半小时,还没开始就想放弃。 不过这个太适合百慕克顶一个小工具了。于是我把参考视频链接直接发给 cloud code, 让他下载后抽帧分析,并且用 jimmy 参考原视频的地砖图生成背景图。 很快 ai 就 把工具写好了,但是生存的视频里照片没有对齐砖块,因为让 ai 基于生成好的砖块图去计算每一张照片的坐标实在是太困难了,换了好几种不同的方法都不能解决。 突然我想到能不能把顺序反过来,先让 ai 写好最终的坐标代码,画出一张图,再让 jimmy 参考这个坐标图去生成地砖图,结果每一张照片都能完美贴合地砖。因为卡点是让 ai 自己去解锁识别节拍的算法自动生成好的上头的。我直接做了四个不同的模板,并且部署上线了,来看看最终的效果吧。

上面的这条视频全程都是由 ai 帮我做的,并且呢,全程我只给 ai 说了两句话,他就能帮我生成这样的视频。虽然现在 ai 的 剪辑水平还算不上很好,但是 对于技术中等的剪辑来说,这简直就是噩梦了。因为我用的工具都是大家熟知的工具,就是 gpt 或者 cloud code。 我 今天分别用了这两个 ai 帮我剪了同样一个内容, 开头的那个是 cloud code 做的,而下面这个是 gpt 帮我做的 ai 层层的完整版视频我放到了最后,有兴趣的话可以拉到最后去看。下面我就分享一下如何使用上面的两个工具做出这样的影片。 首先你需要一个 gpt 或者 cloud 的 账户,如果你用的是 gpt, 你 需要下载它的一个编程助手叫做 codex, 虽然它叫编程助手,但是不要怕,完全不用,自己编程,请放心使用。另外,无论你用的是 codex 还是 cloud code, 都要用到一个工具叫做 remote, 它是帮我们制作影片的一个插件。如果你用的是 codex, 直接在插件市场里面搜 remote 装上就可以了,后期直接艾特就可以调用出来。如果你用的是 cloud code, 可以 去对 应的 github 上装一个 remote 插件。那怎么装呢?直接复制网页链接发给 cloud 说帮我装上这个插件就可以了。 装完之后恭喜你,你已经搞定了最难的部分,因为后面的就非常简单了,就是你跟 ai 不 断的对话,其实就可以了,全程不需要你写代码,也不需要你懂剪辑。比如说我让他做一条全球电影票房 top 十的一个视频,我没有写很复杂的提示词,就一句命令, 剩下呢,全是他自己想的。那第一版呢,这两个 ai 都给我装成了一个纯文字版的一个动画,没有电影的一个画面,说实话不是特别理想,那我就跟他说,你需要把电影的素材也要放进去, 他们就自己开始上网找预告片。 ai 的 整个流程呢,也都列得清清楚楚,先核对数据,再搭工程文件,然后再做排行榜和动画,最后渲染自查,最后交付 ai, 每一步做到哪了,你都能看得一清二楚。而 ai 做出来的第二版,就是我们刚刚看到的那个呈现的效果,说实话,效果很不错了。 分别用了这两个 ai 之后, cloud code 和 codex 在 视频制作方面到底有什么差异呢?那我觉得这两个 ai 在 交互的成果上其实已经差不多了,应该说是各有优劣势。 previews 这边呢,数据更全,但是它的节奏很一般,后期呢,还需要自己再剪一下,而 cloudcoat 节奏也舒服,审美也在线,不过它数据没做好,居然没有把哪吒这部电影放进去, 可能是数据采集稍微旧了一点。最后想说一下,如果这种片子放到以前,我自己动手剪,怎么着也得花上一天的时间,现在不到一个小时, ai 就 能帮我自动出片,视频创作的门槛又被 ai 往下拉了一下,这个对于剪辑师来说可能是噩梦,但是对于小白来说,其实是机会。最后呢,给大家放上完整的原片,大家看一下。 哇哇,头盔 in the far into a zoo ooh ooh, i just wish i knew what we had to do to you're not to take this away from me the dark side a j i'm a j, i'm supposed to fight。 你觉得 codex 和 cloud code 哪个剪得更好呢?评论区一块聊一下,我是 mike, 关注我,带你了解更多 ai 内容,我们下个视频再见。

让你的 cloud code 日更一百条爆款,只需要这五个 skill, 国外开发者偷偷用了一年,你一个人比绝症号五人通宵都猛。我上周才知道第一件, video use 四千九百个 star 还在涨。让 cloud 替你自动剪视频, 给原始素材自动转写,找简点搜字幕,默认抖音风两字大写,全是他干。第二件, hyperframes 黑键,全球数字人一哥,让 ai 直接出短视频,你说做个九比十六抖音风带配音,他自己写代码,本地一键渲染出片。第三件, remote, 官方 skill, 视频博主天天用的引擎, 官方亲自教 ai 写代码,二十八条规则,三 d 动画音频字幕转场全套覆盖, 视频代码再也不靠运气写。第四件, influence s h, 两百五十个 ai 模型,一句话调用,国外五万人偷偷在用响声图 f l u x 响声视频 v e o 响配音 coco 一 句话搞定,不用多个账号。 第五件,中国大牛 w 书 e, 把 remotion 跟 mini max 配音免费打包好,装上之后你做视频配音用 mini max 写代码用 remotion, ai 全流程接管, 你以为五件独立装就行?大错,一个不装,其他四个白买。我先告诉你结论,一件剪,一件生,一件叫,一件掉,一件包,五个工位连成流水线,缺一不动,一晚跑一百条,听起来吹牛,我给你算笔数学账,你看完就不再怀疑。八小时除以一百条,一条四点八分钟模板批量加定型处理, 普通笔记本就扛得住。你做视频现在用什么?剪映? capcut 还是盆面?评论告诉我,看看哪个能切过来卷剪映,卷到秃叼 capcut 叼到瞎,熬通宵熬到老,唯独装这五件 clone 替你日更一百。你是变量,不是常量,这里是人间变量,我们下期再见。

前两天在 github 上面出现了一个新的开源项目叫 viewuse, 这是一个帮你全自动剪辑视频的 skill, 你 只要用自然语言就能够做好视频的剪辑。它的用法呢,也非常简单,只要把用好的原始素材放到一个文件夹里面, 然后呢,你打开任何一个智能体平台啊,不管是海外的 color code, open code, 还是咱们国产的 tree 或者是 work party 都可以啊。直接把 github 的 网址告诉这个 ai, 然后呢,跟 ai 说,帮我把这个 skill 装上去,然后呢,用这个 skill 把文件夹里所有的素材剪成一个发布的视频就可以了。 那么 ai 它会自动地先去过一遍所有的素材,来自动地去识别每一个这个录制里面每一个词儿到底说的什么, 然后在哪一个时间点,谁在说话,哪里有笑声,哪里有停顿,甚至他还不会直接去剪啊,他会先给你输出一个完整的剪辑方案让你来确认,那你确认方案之后,他会自动的完成所有的剪辑, 自动去掉废话,还有停顿,然后自动的去调色,自动加字幕,甚至还可以在关键的节点里面自动给你叠加一些动画啊,图标这些东西。最后他会直接给你输出一个完整的 m p 四文件。 那它最棒的点呢?我觉得是因为它是基于 skill 的, 所以在整个过程中呢,你随时可以用自然语言去反馈你,比如说开头这段太拖拉了对吧?或者某一段要换一下,或者呢字号字体要大一些,那么 ai 都能够帮你直接去改。 而且呢,他在交付给你之前呢,他会先做自检,他会在剪辑的每一个切点的前后呢,多看一点五秒,然后来检查一下画面呢,有没有跳动,音频连不连贯,还有字幕有没有被遮挡这些问题,那如果有问题的话,他会自动的去修,而且最多的可以帮你修三轮, 自检通过之后他才会交付给你。说真的,这个习惯我觉得比很多真人的剪辑师都要好,虽然之前也有很多帮忙剪视频的 skill, 但是这个项目是我目前看到的做的最完善的一个,那它背后的技术原理是什么呢?其实最核心的就是怎么让 ai 去理解视频, 一个视频哪怕只有一分钟,你想一下,如果说每秒是三十帧,那就是一千八百帧,如果你把每一帧的视频就要烧掉几百万个头肯, 那这种成本是谁都扛不住的。而 video user 它的做法非常的聪明啊,它不会一上来就让看视频,它会先做音频的转录,它会用 scribe 这个软件来做逐词识别的语音的这个识别,然后注意啊,这里面不是逐句啊,是逐词, 也就是说每一个词都有精确到毫秒的时间戳,而且还会标注是谁在说话啊,哪里有笑声,掌声,叹气。然后把所有的素材的转录会打包成一个文本文件,整个项目所有的素材打包完之后呀,通常呢也就几 k 或者是十几 kb, 那 这个压缩比是非常恐怖的, 而且呢, ai 它不只是读这个文本,它读完之后它会去判断哪一部分,要实际的去看一下,你比如说一段话读了两遍,要选哪一段对吧?停顿要不要去切掉?还有切点的这个位置,画面是不是连贯,而且最牛的?是啊,就算它决定要去看视频,它, 它也不用看原始视频,它一般呢是看你的关键帧,还有你的音频的波形,一张图就可以判断,不用去看原片。所以呢,速度非常快,成本也很低。而且它还沉淀了十二条的剪辑硬规则,每一条呢,都是踩过的坑, 你比如说字幕啊,必须在最后再加上,那否则的话,这个素材就很可能把字幕给盖住啊。我相信很多剪过视频的人都知道这个痛点,那所以这十二条的均规呢,就直接写在这个 skill 里面,是非常值得你参考的。 还有一个持久记忆的设计,就是你每次的剪辑,你的策略,你的决策的理由,你的遗留的问题,它都会被写入到一个叫做 project 点 md 的 文件,你下次呢,只要打开同一个项目, ai 呢,只要读一遍就知道上次哪里做对了。那这对于需要反复去打磨的视频呢,是非常实用的。不 过啊,这个项目呢,它来源于海外,那如果你直接用它剪中文的视频,能不能用呢?当然可以啊,但是呢,会有几个硬伤, 最明显的就是语音识别,那它用的是 scrip 啊,虽然说支持中文,但是要花钱注册呢,也比较麻烦。那你可以让它呢,直接给你修改啊,修改成国内的替代方案,比如说阿里的范 a s r, 它也支持逐字的,时间戳,精度也很高,关键是可以本地部署啊,零成本。 之前呢,我在 ai 成长圈的日课里呢,也介绍过范 a s r, 然后呢,就是字体啊,它默认用的字体呢,都是希文字体,那如果你要用中文的话,你可以换成思源黑体 video。 柚子呢,展示了一个非常好的 skill 的 设计思路啊,不是让 ai 去干所有的事情,而是让 ai 去干他擅长的事情, 让 ai 去理解内容。他尽量用读文本的方式,那最后实在不行了,他再看图去验证。这种文本优先。视觉暗虚的设计思想几乎可以迁移到所有的多媒体的处理场景。 如果你经常要剪视频,那这个 skill 绝对值得一试。好了,我是 c 哥,如果这个视频对你有帮助,别忘了点个赞,这对我非常重要,咱们下期见。

我不懂代码,但只花半天做出了这样一个自动剪口播的 ai 工具。上传视频后,它会自动识别字母,帮我去掉所有的口屁和食物,然后直接导入 final cut pro, 就是 剪好的视频给我省了大量时间, 我一行代码都没写,甚至没看 type of coding 做出来的这期视频会分享在这个过程中都有最有用的四个经验和技巧。如果你也和我一样不懂代码,但又想自己做点东西,那这些经验应该能帮到你。 剪映其实有智能剪口播这个功能,但又想自己做点东西,而且它要花钱。再一个,我剪辑用的是 final cut pro, 剪辑替代 不了,但最关键还是因为我的目标不止是 ai 剪口播。长期来看,我想 ai 逐步接管我的整个视频工作流,这种剪映是不可能实现的,他不会为我个性化定制,所以这个东西我必须自己来做。这也是 web coding 的 魅力。像过去这种想法,我们只能想一下,但现在可以自己来实现。 有了想法之后, web coding 第一步绝对不是从零开始写,这是很多小白,包括我以前常犯的错误。互联网发展这么多年,其实已经有大量成熟的开源项目,你想做的事情肯定有可以附用的地方, 所以我会让 ai 先帮我全网搜集,看看有没有现成的项目可以用。结果找到了一个叫 video cut skills 的 开源项目,他做的事情就是用语音识别,把视频转成带时间戳的音频字幕,然后让 ai 做语义处理。但有个问题,他是直接给你剪出一个视频来,而我需要的是生成 final cut pro 的 时间线导入,再做二次精简,所以我需要在这个项目的基础上去做二次开发 的。语音识别和处理的逻辑我都是可以服用的开发工具我用的是 cloud code, 刚开始模型用的 cloud 的 订阅,但 web coding 消耗 token 是 真猛,基本上半小时就限额了,只要满足需求,得升到 max 套餐一个月小一千。 说实话,我觉得对大多数人来说都太贵了。于是我打算换其他模型。本着用新不用旧的原则,刚好 mini max 发布了 m 二点七。因为我的小龙虾之前一直跑的是 m 二点五这个模型, 他家的风格就是性能够用,而且很快很便宜。这次新发的 m 二点七在软件工程和项目交付这两个主流编程性能上也还不错,和 cloud 的 g p t 一个水平线,应该够用了。于是我打算试试。开了个 plus 极速版,有一百 t p s 的 退率速度,加上每五小时一千五百次请求,实际用下来还真可以, 速度比 cloud 的 快了不止一倍,主要是不担心跑的一半突然被限额。我基本是用 m 二点七完成了后续全部的开发,所以如果你要 webcoding, 可以 考虑刚出的 m 二点七 模型,定了准备开发。虽然我们可以不懂代码,但是你得了解项目的整体框架和逻辑,这样你才能跟 ai 说清楚你要改什么,改哪里。有个方法很简单,我直接让 m 二点七把整个项目读一遍,然后生成了一个格式化的页面,把框架和逻辑直接展示出来。我不用看懂代码,全程只用对着这个页面和 ai 说需求,一步步开发,这个方法尤其适合非程序员朋友。 web coding 还有一个很常见的痛点,就是 ai 帮你写出来的界面功能没有大问题,但就是丑,一眼就能看出来这是 ai 做的。你想让它好看一点,但我们又不是设计师,不懂专业词汇,没法用语言精准表达。 我找到了一个叫 impeccable 的 神级 skill, github 上一万多星,它的作者是 jacqueline ui 的 创始人,全球几百万网站都在用它做的东西。它在 google 还做过创作者生态的负责人。这个 skill 呢,是它把自己多年的设计经验打包成了二十条指令, 每条都携带完整的设计专业知识,作为上下文安装即用。比如像我用了这个 audit 指令,让 m 二点七模型直接帮我审查全部代码,并输出一份完整的前端报告。它按照影响程度划分了问题优先级,并且还整理好了后续怎么修复的命令,真的是有手就行。 然后还有像 polish, 能帮你把界面打磨的更精致, boder 能增强这个页面的视觉冲击力。这是我这个工具优化前后的对比图,你看变化还是很明显的。最后说到这个剪口拨的工具,我目前还在打磨迭代,等完善了后面会考虑开源出来。如果你也想开始或者已经在 web coding 自己的产品上面,这些方法我推荐你可以去试试。 目前国产模型用来 web coding 的 性价比真的很高,大家不用去掉 a p i, 而是订阅它们的套餐会更划算。这次立刻聊 i 姐,分享 ai 干货,我们下期见!

最近经常有小伙伴问我, ai 剪辑的视频效果是什么样的啊?你可以看一下我的这一条口播的视频,首先可以看到现在他已经帮我拆分的非常细了,因为我的口播视频是整体的,给他了一条二十多分钟的,帮我把说错的话、啰嗦的话、重复的话全都给删除了。有人会说这个和剪映的经典是不是就一样? 我想说的是,首先抖音的经典他不会删除你重复的话。第二点就是你把 skill 固定好以后, ai 帮你生成,可以一句话生成十条二十条,然后还可以加入类似于这种的动画效果,还有你的音效在哪里,让他加上你的背景音乐是什么, 你的视频导入进来的速度和音量,这些全都是你可以自己去设置的。接下来我来演示一下到底是怎么实现的,我现在使用的是 codex, 呃,从左边可以看到我有几个文件夹的目录,这都是我按项目来分的, 每个里边都有我设置好的固定的 skill。 比方说我今天先演示这个 ai 科技口播的,那么我只需要把这个文件夹复制给他,然后跟他说一句话,帮我把这个文件夹所有的视频用这个执行, 只需要跟他说这样的一句话就可以了,他就会自动调用 sku, 把你这个文件夹所有的视频去剪辑。我的 ai 科技口播的 sku 已经用了很久了,我的账号里边所有的视频全都是我录完让他帮我剪到剪映草稿,最后我再微调一下就可以了。 这个 sku 也是比较简单的,就是第一步让他调用豆包去提取我视频的文案和带 srt 的 时间戳的字幕,然后再整体的去分析我的语义,其中制定了几个规则,比方说没有生页的部分删除, 还有那些明显是碎句子的要删除。如果前后两句话他的语意想表达的意思是一致的,那就只保留后边那句话前边的删除。这就是咱们日常在路口播可能会重复会返工的地方,这里就直接等他去跑就可以了。一会咱们看一下他运行了多长时间,然后咱们看一下剪映里边的成品。 现在这个口播视频的 skyo, 他 是在帮我渲染视频的动画,这一部分是让他本地渲染的,速度稍微慢一点,但是如果你不需要的话,可以不要这个效果。刚才这两条他一共用了二十分钟,然后他主要的时间是在渲染我跟他提的动画上面, 这里边他一共是出了十六段动画,从这里就能看得到啊。切的很碎是因为我录制的时候段子重复的内容太多了,然后他加了什么?加了动画有一点点的问题,因为他一句话给切成了两行, 这个是需要再调的,但是呢,整体的效果咱们已经出来了,切好的,没有啰嗦的句子和画面,然后一点二倍速的变速,包括它的音量已经帮我调成了七点二,这都是我要求的。还有下面背景音乐,背景音乐是默认的, 其实 ai 剪辑视频我感觉看效果是没有意义的,你只需要看 ai 能帮你实现哪些功能。现在我这个 screen 也有很多需要调试的部分,比方说这个动画现在只是刚刚加上 很多细节,还需要去不断的微调,如果你的电脑上还没有部署一个可以帮你干活的 ai, 看一下我置顶的视频,建议大家一定快点用上。

我用 cloud code 跑通了视频自动剪辑,给大家实操展示一下,现在的 cloud code 太牛了,我深度使用了一个半月了,它能解决电脑上百分之九十的事情,我养过小龙虾一阵子,那 open clock 就是 个智障儿童。 这个剪辑软件已经开源了免费软件,我放在了评论区,给大家看一下。剪辑过程简直是自媒体的福音,从此不用再吭哧吭哧花时间剪视频了,开始实操。 运行了这个免费的开源工具以后,他开始帮我解析视频,看到我的视频有十二秒我的视频一个内容的结构,这是我拍的一个口播的数字人,他分析完我的视频以后,因为我全程没有口气词, 嗯,十秒一进到底,语速偏快但清晰,所以他给出了一个建议,方向,加字幕调色,加动画叠层,想问我往哪个方向走。接下来他就自动开始写脚本,写代码,我全程没有操作。 然后他开始生成三个动画,进行一个渲染,现在到了渲染环节,这是最终的一个产物,这是最终的视频,我们拉到最下面啊,直接直接丢出来了一个这个视频,结果牛不牛?现在 ai 太牛了,卡的酷的,赶紧用起来,点个关注,谢谢!

如何在 vs code 中使用 cloud code, 并且接入最新的 deepsea v 四模型?首先打开 vs code, 点击扩展,搜索 cloud code, 选择第一个,然后点击安装,安装完成后,右上角会出现 cloud code 图标, 点击图标弹出 cloud code 页面,首次打开时会提示登录账号,如果没有账号,可以通过修改配置。绕过登录按键盘 c t r l 键加逗号,弹出菜单,选择 extensions, 选择 cloud code, 点击编辑配置, 粘贴这两段参数,然后保存,这样就不会再提示登录了。那么该如何接入 deepsafe, 打造自己的 agent 呢?我们需要用到一个第三方工具 cc switch, 打开其 github 地址,然后点击 releases, 然后找到安装包下载地址, 这里我们根据电脑的系统版本选择 windows 五 c, 点击后等待下载完成,然后安装即可,因为我之前已经安装过了,就不再重复安装。然后打开 c c switch, 点击右上角添加, 选择 dipstick 下面的信息,默认只需要填入 apikey 即可,也可以根据实际需要修改其他参数,比如模型、版本等。 如何创建 deepsafe 的 apikey, 在 这里就不过多介绍了,很简单,网上教程也很多,登录 deepsafe 官网注册一个就行。然后将 apikey 复制粘贴到 cc switch 中,点击添加即可。这样就全部配置完成,开始使用你的智能题吧。

我用 cloud code 跑通了自动剪辑视频,我现场给大家实操一下,现在的 cloud code 真的 太牛了,我深度的使用了一个半月,它能解决电脑上百分之九十的问题,我尝试了市面上非常多的 ai 自动剪辑软件, 真的像智障一样。这个剪辑软件呢,已经开始开放了,可以在评论区说出你的行业,给大家看一下整个剪辑过程呢,简直是自媒体的福音呐。来,我们打开小马自动剪辑软件,我们要生成一个营销短视频, 现在我把我想要生成的文案放在了 tst 里面,然后上传,我点击创建营销视频任务,点击以后就开始生成了,我们看一下生成的任务 进度表,可以看到进度表非常快,好了,已经完成了。这里啊有三个重要的节点,第一就是他会进行一个素材与基础视频的一个准备工作,接着他会根据你上传的每一句的文案自动去生成语音,接着每句语音去寻找你拍摄素材里面最合适的画面,来进 行自动的匹配,最终来进行下载成片。好了,我们完成了一个下载工作,我们来打开看一下,同时呢,我们来对比一下文案, 花潮大赏沾花篮 npc 逍遥宝典画面青岛乐园青岛啤酒文创国潮 dj, 所以 每句话都精准的匹配啊,一键成片, 光仿古诗集,品尝糖葫芦,薄饼等烟火美食,田园五谷花肠场景随手出品抖音小红心爆款美食前百元穿古装的顾客游客,这个五一来广州穿古装 对人提携喝啤酒来获取流量,赶紧用起来吧,从此啊,你不用再吭哧吭哧的花时间剪辑啦。

就我昨天不是讲了那个 codex 以及这个 cloud code 将会在极短的时间之内摧毁甚至是颠覆人类的这种旧的写作方式和社会关系吗?然后这个这个视频算是爆了吧。然后我想给大家讲一讲,就是我觉得 就是普通人想学会使用这些工具,我觉得真的很难,因为难,难不是在于你的智商,是在于你的 你没有生产环境,就是就是你没有生产环境。什么是生产环境呢?就比如说我现在在做这个快电商,我做快电商呢?为什么我非常有兴趣,然后非常有动力每天都在研究这个东西呢?是因为他真的能够帮我产出收益,他能够实际的帮我挣钱,说白了就是, 所以我就就是我会,我会疯狂的去研究他,你看我,呃,我,我前几天搓出的这个工具,搓出的工具大概长什么样子啊?这就是一个视频的剪辑工具, 这就是呃,我一个完全不懂代码的人能够搞出来的东西,虽然他里他这个有很多 bug, 有 很多 bug, 但是他最起码能用了。 然后我做这个东西,哎,其实也非常简单啊,这个,这个 u i 什么的,我我我都还没没弄,就就就很简单的东西,这东西可能在懂的人、懂代码的人里面,懂前端后端交互的人的眼里面就不算什么,但是对于我来说简直是智的突破呀。就是 这是他原代码,原代码他不有个有个几百行吧?然后这是他的这个,呃,前端的这个交互界面吗?大概是什么东西呢?就是呃,我的需求是能够高效的 去把我的视频从中文版本去变成呃美国版本,或者说是欧洲版本,或者是西班牙语,或者说日文等等这些东西。然后呢?呃这个东西他就能够去帮我实现我输入一个原视频,就比如说这是我输入的原视频, 然后呃去设置这些东西,比例啊、宽度啊、高度啊、语言等等发布平台等等,他就能够。呃,然后我再给他,给他这个文案,包括这个还有时间出的这个文案,然后再给他 呃我的这个想要的语气配音的那东西,然后让他去执行执行,嗯,生成之后他就能够给我一个大概的, 就他就能够给我一个完整的完整这个版本,但是现现在又出 bug 了,我等会又要秀他,就他总会时不时出 bug。 接下来说就这样,就这个东西现在人人都可以干出来了,就你只要是一个拥有能够去用自然语言,这都是自然语言。这边这边东西不要看他很很可怕,这个东西 你完全不用管这些东西,因为反正你看不懂,这个东西就是我实际的这个生成的过程,实际生成过程,当然这是改过那个很多版的,我之前在很多的窗口都和他聊过很多轮了,简单来说就是他这个就他的后端嘛,然后这个就他的前端嘛,前端的交互页面嘛,大概就这样,就现在 现在这个代码的,现在这个懂技术的这个人啊,就是他的呃,差距在逐渐的缩小,或者说是是被无限的缩小吧。 呃,原先你学这个 java 语言,学这个披风啊,什么之类的, c 加加什么之类的,我靠,你要学个不说,不说,不说,五年吧,你学个两三年你才能入门吧,但我们现在就能够掌握这个, 但是最好的方式是什么呢?就是一个产品经理加上一个技术人员,呃,由这个产品产品经理就是,呃,对比一下产品经理是什么意思啊?产品经理就是类似于我,我现在就是一个产品经理,我拥有挖掘需求能力,我拥有定义需求能力,然后我想要我我知道他最终要成一个什么样子, 然后呢?我把这个圆形搓出来,把这个 demo 搓出来,然后,呃。当这个 demo 搓出来之后,想要把它固定,固定好,把它变成一个稳定的可运行的工具的时候,这个时候就让技术人员入场,让懂技术的人来帮你去填补这些 bug。 是你要上线的话,你自己一个人是玩不尽的。就是能够在本地跑和这个项目能够上线,能够变成产品去卖,能够大规模的去协助,那是完全不一样概念好吧,就是专业的人仍然有专业的优势,只不过把一些低端的程序员或者说水平没那么高的程序员 迅速淘汰了,就像现在淘汰呃低质的美工一样。就是现在这个,呃,这个 g p t 深图已经非常牛逼了,非常牛逼了。 然后昨天还有人问我这个屏幕的这个屏幕是什么来着?还有那个 lg 的, lg 的 什么型号来着?我给忘了,反正就是在苹果官官网卖的。只在苹果官网卖的那款是那个专用版啊,他这个有有那个 反向充电吧,反向直充,就我这个笔记本,他这样连着就可以充电,他不用再多搞一个这个充电线了,假如说就这样,所以我觉得如果你正儿八经想学会怎么使用 codex 以及 cloud code 的 这种工具的话, 一定要找一个环节,找一个能够生产的环节。好吧,不然我感觉你很难学会啊兄弟。

怎么安装 cloud code? 怎么把 deep 四 v 四 pro 百万上下文的满血版接近 cloud code, 以及怎么在 vs code 的 里面正式用起来? 这期视频带大家全部搞定, mac 和 windows 用户都可以看。嗨,你好,我是大牙。前两天我刚发了一条 web coding 的 完整零基础的入门教程,现在已经有十几万人看过了,非常感谢大家的点赞和支持。也有不少人真的跟着我的视频做出了自己的第一个软件,或者是自己的第一个网站。 但是呢,我注意到评论区和私信出现的最多问题不是问我怎么写需求,怎么写提示词,而是 cloud code 要怎么安装, deep seek 要怎么接进来。 如果你也卡在了这个地方呢?这条视频就是专门帮你补齐开始前的这一步的,新来的朋友可以看完这期视频之后,继续看我的上一期 web coding 的 零基础教程。那么我们现在正式开始 第一步,我们先来安装 cloud code, 但是在安装 cloud code 之前,我们需要先安装一个必备的前置环境,也就是这个 node 点 j s, 大家可以看一下这里的网址,自己输入一下吧,我不方便 放出来。然后在进入到这个页面之后,我们可以选择下面这个地方去点击你自己是 windows 电脑还是 mac 电脑, 然后去选择这里的对应的安装包,下载之后安装即可。安装完成之后, mac 用户打开电脑里自带的这个终端 app, 然后 windows 用户去搜索 powershell 这个软件,然后以右键管理员身份运行。 我们在自己的页面里面去输入 n o d e 空格杠 v 再回车, 这样我们能看到两个版本号,就代表我们安装完成,但是 windows 用户还有一步要做的就是我们要来到这个 get 官方网站,这个网址大家也可以自己手动敲一下, 然后在这里选择好你电脑对应的安装包,然后去下载,之后安装也是一路 next, 然后完成安装它就好了。 这一步所有的前置环境都部署完,我们现在来正式安装 cloud code, 其实真的非常的简单,我们只需要在我们的终端窗口或者是你的 power shell 里面, 我们粘贴上这一行一行的命令之后,按下回车,等待它自动安装完成就可以搞定了。 安装完成之后,我们还是在这样的一个终端窗口里面去粘贴这样一段命令, cloud 空格横杠横杠 version 之后再回车,这里就会出来我们 cloud 的 版本号,看到这一个就代表我们 cloud code 已经真的安装好了。 现在我们来到了第二步,就是把 deep seek 接入到 cloud code, 我 们进入 github 这个网站,然后去搜索 c c switch, 看到是这样的一个项目,我们点击进来,然后我们往下滑,看到这里 releases, 然后再次点击,然后我们继续往下翻,找到下载列表, mac 用户我推荐大家直接去下载这个 dmg 的 安装包,然后 windows 用户推荐下载这个 msi 的 安装包,也是下载之后直接下一步,下一步,下一步完成安装就好了。再下一步我们就要来到 deepseek 的 开放平台, 我们可以登录或者是注册创建你自己的一个新账号,然后我们再去做一下充值,这个金额呢是可以自定义的。充值完成之后,我们点击左侧的 api keys, 然后来创建一个新的 api key, 比如这个时候你可以给他叫 cloud code, 或者任何一个你喜欢的名字都好。然后我们点击创建,这里就会弹出来一串英文数字的字母,这个大家一定要现在就记好, 你可以把它复制下之后发送到一个你可以保存的地方,先保存下来,因为我们一旦这个时候点击了关闭,那这一整串的完整字母我们是不会再看到了,你只能去删除它,然后再重新创建。 还有一个就是你的这一串 api key 一定不要给你不信任的人或者是其他的陌生人去使用,因为这串 key 他 拿到的话,他可以拿去用,然后扣你的钱,所以大家一定要保管好自己的 api key。 接着我们再打开刚刚安装好的 c c switch 这个软件,其就是我们的一个给 cloud code 更换 ai 模型大脑的一个工具,它可以让我们自己去接入很多其他的 ai 模型。然后我们要注意这里的图标一定是要点在 cloud code 的 这个图标上的,再去点添加, 然后这里我们选择 tipsick, 然后这里有其他的很多的 ai, 大家都可以根据自己的需求去选择创建对应的模型就好了。 这里我们继续以 deepsafe 来举例,然后这里的 apikey 我 们把刚刚复制好的那串字母粘贴在这里,然后我们来配置模型的名称,我们继续回到我们的 deepsafe 的 开发接入文档,然后点击这个接入 agent 工具,然后再点击 cloud code。 在这里大家就可以看到,官方其实是有说明,我们如果要使用百万上下文的满血版,我们要配置这一个模型的名称,我们把这个模型名称复制一下, 然后在这里的主模型或者是 opus 模型,我们都可以让它变成这个模型,然后其他的这两个模型呢,我们都可以去配置一下我们的 v 四 flash, 然后我们继续复制这个模型的名称 粘贴,粘贴,然后打开最大强度思考之后就可以点击添加了,添加完成之后,大家可以先点击这个图标来测试一下它的连接状态,我们点击 看到这里显示正常运行了就没有问题了,像我还配置了小米的咪某,我如果要用的话也是直接一键起用就可以切换了。 现在我们来到了最后一步,也就是下载安装 vs code, 并且在 vs code 当中去使用我们的 deep seek, 我 们在这里去打开 vs code 的 官网,这个大家还是自己要手动输入一下这个网站啊,点开之后呢,我们就可以看到它这里会有一个下载提示按钮, 对应你的电脑的操作系统,我们直接点击这个下载就可以了。大家安装好了 vs code 之后,我们可以直接打开你的程序,然后先到左边的第五个按钮扩展这里点击, 我们先搜索 cloud code, 然后去下载这个有 a 社官方认证的这个插件,我们可以点击安装。 安装好这官方插件之后,我们再搜索 chinese, 然后大家可以按自己的喜好去安装简体中文还是繁体中文,我们继续在这里点击安装就好了。安装完成之后,在整个 v s code 的 左下角会弹出一个框,提示我们可以重启 v s code 来更换这个语言的显示。 要使用 cloud code, 我 们需要先创建一个项目的文件夹,这里呢,我以上期的 web coding 教程的项目为例,就是这个历史粘贴。 我们新建好一个项目之后,打开这里,其实左边是他的所有的文件列表,我们在这里可以去查看所有 那个档的所有的文件,然后我们可以在这里进行查看编辑修改。如果我们要使用 cloud code 呢?我们需要点开右上角的,这里有一个 cloud code 的 图标,我们点击 哎,就会出现这样一个对话的窗口了。在这里我们就可以正式的开始向他提出任何你想要的需求或者问题。比如我们可以再进行一次他的身份确认,先问他你是什么模型, 回车,然后他应该是会回答他是 d p 四 v 四 pro 的 呐,果然他现在说他自己是 d p 四 v 四 pro, 而且他的上下纹的是一百万的 tokens, 这就代表我们的所有的配置都没有问题。正式可以开始去 跟他提出你任何的需求,去创建你任何想要的项目,这就搞定了。其实可洛克的能做的事情真的不只是写代码, 他还可以帮你管理你电脑里的文件。你给他一个 obsidian 的 仓库,他能直接在这里帮你新建或者是编辑整理你的所有笔记,甚至还能帮你做每日代办的管理等等等等。他能做的事情真的非常非常多。下次有机会我再和大家分享 cloud code 在 除了编程以外的 曾经使用的经验。如果你还不会 webcoding, 可以 继续回看我的上一期的视频安装的过程,或者在使用上还有任何的疑问,我们在评论区接着聊。那这期视频就到这里结束了,我是大牙,我们下期视频见,拜拜。

曾经我对 cloud code 的 终端爱不释手,但现在我只能说一句, codex 真香啊,真香! 大家好,我是布鲁。随着 codex 近期频繁的更新,我自己的工作站也已经全面的切换过来了。今天就来分享一下我自己的完整使用经验,怎么用 codex 打造一套不打断心流的生产力闭环。 本期视频我把它分成了七个章节,每一张都是我自己实际在用的技巧,希望能对你有所帮助。那我们话不多说,直接开始 第一张,先来介绍一下我的工作站是怎么布局的。左上方是 codex 的 对话框,下方是 terminal 终端。 你可能会问,已经有 codex 的, 为什么还要开一个 terminal 跑 c c? 因为我发现对于一些需要探索、需要设计的任务, c c 的 表现要更出色一些。所以我的习惯是用 c c 来做方案设计,配合 planning with files 这个 skill, 把设计思路直接落成文件, 然后再让 codex 读这份计划,接手后续的具体实施。这样一来, cloud code 负责想, codex 负责做,两者可以各司其职。 右上方这个区域我用来做任务完成后的查看和审阅,比如代码的 review, 文件的浏览,还有浏览器都在这里。虽然现在浏览器还不支持多标签页,但对于日常的任务来说完全够用。这边我就分享一个实际的案例, 我让 c c 参考了最近很火的这篇卡巴西提出的知识库的文章,让他借鉴里面的思路,出一份设计稿和完整的实施计划。目的呢是做一套前端的页面,方便我日常的维护文档使用。 接着 c c 就 会调用 planning with file 这个技能啊,将所有的计划落成文档,然后我就会回到 colex 这边,让 colex 去阅读当前项目内的这份计划文件,然后基于这份计划文件让他进行开发。开发完结果之后,我会在这边 内置的浏览器里面去进行结果的 review, 包括代码的一个审查,整个过程从设计到开发再到 review, 全都在这一个工作站里面完成,不需要切换任何的窗口,这就是我前面所说的,心流不会被打破。 第二章,批注功能。这个功能是我觉得 codex 真正强大的原因之一,也是最能体现沉浸式开发的地方。 以前我们改代码的方式是找到文件定位到哪一行,描述问题,让 ai 修改,整个过程中你的注意力是在代码上的,但现在 codex 的 批注功能让这件事情变了,你可以直接在文件上进行批注,告诉他哪里怎么改,需要怎么改。 更厉害的是,现在这个批注功能不止限于代码文件,你可以直接在前端页面上进行批注,看到哪个按钮位置不对,哪块布局不满意,直接在页面上标出来, codex 就 能理解你的意图,并帮你进行调整。这件事的意义在于,正好对应了 webcodd 的 核心理念, 开发者的重心不在于怎么写,而在于写出来的东西对不对。批注功能把这个理念落地了。 第三章,上下文管理 codex 项目里可以同时开多个县城,每个县城对应一个任务,互相独立,不干扰。对比 cloud code 需要开多个对话窗口, codex 把所有县城都收在了一个项目下,管理起来会清晰很多, 然后是项目的记忆核心就是 a 键的点 md, 这个文件你可以类比为 cloud md, 把项目的背景、开发规范都写进去, ai 每次进来都会读取,不用反复的交代。 还有一点, codex 的 上下文管理非常省心,它会自动帮你压缩上下文,它也没有提供像 cloud code 中 compact 的 那样的命令,这种事情让 ai 自己处理就好了,你专注于任务本身就行。 第四张,自动化这块是我觉得 codex 比其他 agent 做得更好的地方,几个原因,第一,用起来非常的方便,直接在 gui 里面新建自动化任务,还内置了很多模板可以选择, 大到项目管理技术、眼镜,小到个人的生活习惯,都可以交给它来定期的处理。第二,自动化可以调用 codex 自身的能力,比如插件、 skill、 mcp、 浏览器操作、电脑操作等全都能用进来,这就是为什么我说 codex 在 逐步形成自己的生态。 第三,我们可以根据不同的场景来灵活的选择模型和推理强度,简单的任务用轻量模型,复杂的任务上强推理,这样的话头肯可以用的更加的合理。第四,稳定性,我实测下来, codex 相较于其他的 agent, 定时任务的准确性已经能达到生产级别,相当的靠谱。 第五张插件和技能, codex 有 相当丰富的官方插件和 skill 生态。先说说两者的区别, skill 就是 纯文档,本质是给一份 ai 的 说明书,告诉他在特定场景下应该怎么做事。比如说我前面提到的 planning with files, 就是 一个 skill 插件的概念会更大一些,你可以把它理解为 codex 打补丁,里面可以包含 skill, 也可以带上 mcp 配置,甚至集成其他的 app。 一个插件装下去, codex 就 多一套能力。 另外, codex 在 插件和 skill 的 管理体验上面要比 cloud code 的 友好太多了。 cloud codex 需要改配置文件,而在 codex 里直接在界面上点击安装,或者自己创建,整个过程非常的直观。 第六章浏览器和电脑操作 codex 可以 直接操控浏览器,你可以让它自动填表,抓取数据,验证 ui 效果。 比如我需要批量收集一些网页上的信息,直接告诉 codex 去哪个页面拿什么数据,它就能自己打开浏览器去完成操作,整个过程中都不需要你的介入。除了浏览器, codex 还能直接操作你的电脑文件的整理,应用的打开都可以交给它来处理,相当于有一个助手在帮你操作桌面。 不过这里要说明一点,随着 ai 自动化越来越普及,现在已经有不少软件开始加强安全控制,对自动化操作做了限制,所以实际能操作的范围会因软件而异,遇到限制情况也很正常,大家用的时候留意一下。 第七章通用功能这些功能不是 codex 独有的,很多 agent 都支持,但作为一个完整的工作站,这些基础能力 codex 当然也不会缺少。先说 play mode, 在 执行一个比较复杂的任务之前,先让 codex 把完整的计划列出来,你过一遍觉得方向对了再让他动手, 这个习惯能帮你省掉很多返工的时间,大任务尤其推荐开 play mode。 再说 m c p, 也就是模型上下文协议,通过 m c p 可以 把各种外部的工具和服务接进来,让 q d x 能力边界大幅扩展,无论是连接数据库,调用第三方的 api, 还是接入自己家的服务,配置好之后, q d x 就 能可以直接调用。 另外还有一点, q d x 相较于 logot code 的, 有一个非常关键但很容易被忽视的小功能,语音识别。目前我的任务几乎都是语音发起的,连打字都很少了。 ok 以上就是我在使用扣袋子过程中总结的一些技巧,如果对你有帮助的话,希望能得到你的点赞和关注。 最后我想说一句, ai 发展太快了,各家 a 键的功能越来越趋同,但工具再多,适合自己的才是最好的。有时候做做加法,找到真正需要的,做做减法,去掉用不上的,慢慢摸索出一套自己的工作范式才是最重要的。我是布鲁,我们就下一期再见。

ai 是 怎么实现剪辑影视类混剪的?咱们今天就拿这个短剧来举例子,咱先看一下效果,你身上那股老肉味熏死人,滚,别想给我扫了我们全家的兴,我养了三十年的家,把我当温室妈,你是不是脑子不好使?我昨天千叮咛万嘱,从这个轴里边可以看得到啊,它分了很多个步骤, 这一条是通过十多集的一个短剧生成了三条视频。它是怎么分割的一个逻辑呢?就是开头用高光去抓人, 然后开始正常的去试,但是把一些平淡的过度的把它删除掉了。这样做呢,一是为了咱们情节的紧凑, 再有一个就是为了一个去除,比方说这部分就是他的第二集,一共是出了三集,他找这么大年纪的月嫂,忘了之前被老经验坑的事了,把宝宝弄红爬给你补到堵奶。同样是一个剪辑的思路,但是后两集呢,他会加了一些前情故事的一些, 你要脑子皮了?菜市场太早没开门,那你不会凌晨四点就去买,然后再开始叙述后边的内容?这个模式呢,也是跟一个做 t k 的 短剧引流的一个小伙伴去聊的,他就是用这样的思路来产生视频 剪辑。这样的视频让 ai 是 很容易帮咱们实现的。比方说我的一个短剧,或者说是一部电影,一部连续剧,咱们只要是用原声来帮它剪辑的话,只需要告诉 ai 去提取短剧所有的 s r t 的 字母文件就可以了,因为 s r t 字母文件它会有时间戳。 我现在习惯调用豆包的音频文件提取这个的费用,一小时的视频文件大概是五块钱左右,当然也有很多免费的本地部署的 软件可以实现这些功能,但是可能会有一些准确度的问题,如果咱们的时长比较长,那他前边 一段差一秒,可能等到二十级以后,他可能就有二十秒的一个误差,所以最近我使用豆包的话,他准确率还是比 高的。当有了全部的文案和时间戳以后,让 ai 去操作那就非常的容易了。咱们可以根据自己的要求去告诉他应该怎么去截取,怎么去抓取,看一下我这个 sku 是 如何设置的。它实现的流程其实就五步,第一步呢就是批量的转写, 你只需要把你的视频文件放到文件夹里面,告诉他文件夹的路径名就可以了,然后我这里调用的是豆包的 api。 第二步,我做了一个合并和转写稿,因为短剧它的下载下来以后就是一级一级的, 所以说让 ai 自己去核定一下,这些流程都是咱们不需要操作的。我加了一个向量化的和去重的场景边界,然后怎么去精准的识别? ai 现在有一个比较大的弊端就是它的上下文是有限的,当你想让它处理过多的内容的时候,有的时候它就会犯错。 举个简单的例子,你给他的一大段话,然后达到他上下文的上限,它就会只记住开头的话和最后的要求,中间的话你产出的内容就是不稳定的。 有的时候当你的工作流程你感觉设计和要求的已经非常好了,但是 ai 就是 做不好,首先要考虑一下它的上下文的问题, 所以这里我用了一个向量化的方式来解决,不用感觉听不懂,你只知道有一个这样的功能,然后告诉 ai, 它就可以帮你去实现。 然后第三步它做了一个剧情的分析,这个分析其实就是根据你个人的需求来制定的,因为我们做自媒体也好,做视频也好,每个人都有自己的一个想法,一个工作流程,这里你就需要一步一步的去告诉 ai, 你想要的内容是什么样的。比方说我的这套流程就是开头一定是高光来抓人的,这个是大家通用的一个方式,然后呢,中间 你看是不是要把这些啰嗦的过度的地方去掉,或者说像这种短剧里边可能会有一个旁白,要不要把这些拖慢节奏的旁白去掉,这都是你自己跟 ai 去要求就可以了。相当于 ai, 它识别了权威的文案,权威的对白, 那么按照你的要求,他来提取出你需要的部分。所以第四步就是构建一个剪辑的计划,就是按你的要求把这些需要的部分提取出来。第五步就最简单了,直接导入到剪映的草稿,像这种短句的话,一般都是不需要其他的内容, 不需要背景音乐,也不需要配音,然后你可以加的可以加一些特效,可以加一些转场,或者加一些花字、关键字,包括一些驱虫的手法,其实这些让 ai 都可以直接帮你做好。当这样的一个 skyo 你 搭建好以后,比方说你这一个文件夹里边下载了三部短剧,或者说是三十部短剧, 你都可以跟他说一句话,让他用这个 skill 去全部执行,到最后你得到的就是一个一个的短剧草稿。我这里最近会比较乱,因为同时测试了很多个类型的视频,可以简单看一下,比方说像这种 直播切片带货,尤其是黑色这种,你就直接像健身人士这么外穿,你看多帅就放心拍,这个衣服的质量非常好,你能穿好几件,然后按照品类先把它进行一个拆分, 拆分完品类以后,再把每一个品也是用同样的方法把它的字幕提取出来,因为这种是带字幕的,他就比较好实现。 ai 有 一个固定的抓手,最后只是你要求把啰嗦的话去掉,然后把开头提取一个高光的片段, 一步一步按你的要求去做就行。然后像这个他就加了音频,然后还有加了视频的变速,还有加了关键字,就放心拍,这个衣服的质量非常好。这个画面的边框是因为测试,所以还没有用那种处理完 的。这种影视解说就是比较复杂的,给他一个文案,给他一部完整的剧,最后直接出这样的一个成品, 现在还是在调试当中,这个文案有也有点长,是五分钟,一抬头就发现了他们这段剧情喜感。结束准备下一个经典名梗,从警局出来营地开车来接他们,结果上车的时候一使劲把镜子给震碎了。最后还有一个很多小伙伴比较关注的,现在这种 ai 类型的内容, 怎么让 ai 一 键去生成像这条视频呢?就是给他了一个文案,然后 ai 自动调取 api 去生成对应的图片,分镜的图片,然后通过图片再自动生成视频, 然后就会有一个这样的二十多岁别再拿三十而立 p u a 自己了。社会学专门为这种尴尬期造了个词,奥德赛时期下期视频吧,我详细讲一下这个的操作流程,其实它和生成 ai 短距就是一样的一个流程。

虽然最近 codex 的 热度很高,但 codecode 才是永远的神,这些内容呢,都是干货。你现在看到的这些动画效果都是用 codecode 配合 emotion 生成的,比如这种让人一目了然的数据可化的效果, 这种可以叠加在口播画面上的三 d 卡片动效,还有这种科普视频里常见的动态讲解镜头。哈喽大家好,我是阿亮,今天这期视频呢,将会教会你国内网络安装 cloud code, 配置国产模型,使用 remotion 制作精美动画并剪辑视频。 我用 cloud code 呢,制作了一个详细的 cloud code 中文手册,如果你也需要,我也可以发给你。另外我还开源了一个视频自动剪辑的 scale, 所以 这期内容可千万别错过。 接下来带大家使用国内网络安装 cloud code。 先介绍 windows 的 安装,苹果用户呢,可以直接跳到后面苹果安装的部分。首先 windows 用户呢,先把 get 装上快捷键, windows 加 r, 打开终端。 windows 用户呢,要用 winget 来安装,它是 windows 官方的包管理器。 复制文档中的这行命令,粘贴到终端,跑完呢就会显示成功安装了啊。 get 装好之后呢,接下来安装 cloud code, 把文档中的这行命令复制过来, 等它跑完,提示安装成功。到这里 card code 就 安装好了。苹果电脑的话,需要通过 homebrew 来安装,先在终端输入这个命令。 bro 杠杠 word 如果有这个输出代表呢? homebrew 其实已经安装过了,如果没有,那就打开我们的教程文档,复制这行命令,粘贴到终端,回车, 在这输入密码再回车,安装成功后有一段输出,复制这段内容再回车。 ok, 这样 homebrew 呢就安装好了。 然后开始安装 cloud code, 回到教程文档,再复制这行命令,粘贴到终端,等上一会提示安装成功了,输入 cloud。 看到这个回复,证明 cloud code 搭建好了, 接下来我们要给他装上大脑,也就是配置模型。如果你没有官方的账号,那么我推荐你呢?使用 kimi 的 k 二点六。 k 二点六的代码生成能力和上下文的理解能力呢,相对比较稳定,还原生,支持多模态读图解析,设计稿调 ui 问题都不大。 从价格来看,输入和输出大约只是海外旗舰模型的八分之一,用来驱动 cloud code 的 写代码做分析,更具性价比。配置阶段,我们要用到一个工具 cc switch, 我 们从文档中直接跳转到下载地址,根据自己的电脑版本下载安装就可以了。然后打开应用 点加号选择 kimi, 这里需要输入 api k。 值得一提的是, api k 的 用量呢,相对灵活,和 kimi code 相比,它可以根据个人实际的使用情况来选择。我们打开 kimi api 的 官网,新建 api k, 输入名称, 选择默认项目,复制 api k, 再回到 cc switch 粘贴,点击添加,选择 kmi 启动。然后我们打开 code code, 看到这里显示 kmi 杠 k 二点六的模型,现在我们给他发一个消息,有回复代表呢就配置成功了。 接下来进入今天最好玩的部分,用 cloud code 配合 remotion 做动画视频。 remotion 呢,是一个用代码生成动画的框架,但有了 cloud code, 你 就完全不用去学代码懂代码,只要用嘴,然后说就可以做出动画视频。那么如何安装 remotion? 这里我直接把官方的安装文档和官方提供的 skill 网址扔给了 cloud code, 直接让他帮我安装,等他跑完,让他直接运行下,出现了这个画面,就证明安装成功了。接下来先打开一个终端,输入哎, cd 杠你的目录啊,这步呢,是确保后面制作的内容都保存到这个路径下, 然后输入 clock, 启动命令,运行 clock, 我 们就可以用自然语言来制作视频了。比如我给他这段提示词,让他创建一个八创电池组的动画效果,可以看到他自动帮你搭建了 remote 的 项目啊,安装了依赖,写好了动画代码,等他跑完,打开这个预览效果呢,看一下 整体的动画呢,非常的酷炫啊。再让他做一个行星运动的动画,输入这段提示词来看一下效果。 我一共做了有上百个 remo 神的动画,当我们有了足够多的动画时,就可以制作出更精美的视频。然后我也制作了一个一键剪辑口播视频的 scale, 我 们现在呢,试试这个 scale, 一 键剪口播视频, 斜杠调用这个 scale, 然后把视频文件和字幕文件都扔给 code code 不 用,你写一行代码,一杯咖啡的功夫就制作完了。来看一下效果 好,欢迎收看本期的科技新资讯。智能家居领域呢,有几组值得关注的新数据,今年第三季度,全球智能家居设备出货量突破了两亿台,同比增长百分之十八,其中呢,中国市场占比了超过呢百分之三十五,连续三年保持了全球的领先。 用户最青睐的呢是三大场景,分别是智能照明、家庭安防和节能,合计市场占比超过了六成。 搭载 ai 语音助手的设备呢,整个剪辑过程全部由 cloud code 加 k 二点六的模型搞定,制作了所有的动画效果,自动配上了字幕口播,与动画呢完全的对齐, 还有更厉害的调用这个 scale 呢,还可以一键切换视频的风格,我们换一个风格看下效果。哈喽,欢迎收看本期的科技新资讯。智能家居领域呢,有几组值得关注的新数据, 今年第三季度,全球智能家居设备出货量突破了两亿台,同比增长百分之十八,其中呢,中国市场占比了超过呢百分之三十五,连续三年保持了全球的领先。 用户最青睐的呢是三大场景,分别是智能照明、家庭安防和节能,合计市场占比超过了六成。搭载 ai 语音助手的设备呢,渗透率达到了百分之七十二, 用户平均每日语音交互超过了十次。说明呢,科技正在让家变得更智能, 从安装 cloud code 到接入 k 米 k 二点六的模型,再搭配 remotion, 一 句话生成动画视频,这一套流程下来呢,相信你已经感受到了 ai 工具链组合起来的真正威力, 不用写代码也能做出专业级的视频内容。好了,本期视频就到这里,教程文档也能做出专业级的视频内容。好了,大家点点关注哈,跟着阿亮学 ai!