粉丝131.2万获赞700.4万

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

梅猴王朋友们, agent skill 最近真的太火了,但很多朋友肯定还是很困惑, skill 到底是啥?有什么牛的?没关系,草旅从 skill 大 全它来了。 今天呢,我们会通过一个逐步升级的案例来理解 skill 的 结构和原理,然后我们还会学会定制自己的 skill 这个 skill 呢,只需要我们说帮我做一个促销海报啊,优惠券,员工服装,它就会生成符合我们品牌风格,带 logo 的 物料图片。 另外,我也会推荐给大家一些好用的必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成教学网页,一句话处理表格等等等等。 我还做了个秋之技能生成器,大家只要回答一下 ai 给的选择题,为你量身定制的技能就轻松完成了。并且今天所有的资料链接以及补充资料我都做成了一个网页,大家只需要一步步的跟着做,跟着看,就一定能搞定, 非常值得一个点赞收藏关注哦!来吧,准备好我们 go go! go! 首先,到底什么是 skill skill 呢?翻译过来就是技能呗, 它其实和人类的技能是类似的,比如说你是一个厨师,那你就有炒菜的技能,处理食材的技能,摆盘的技能等等等等。那每个技能里面,比如说炒菜技能,这里面就包含了你的流程,你要先炒什么,后放什么, 还有你的配方,你的油温多高,盐放多少。有了流程和配方呢,你可能还会需要一些工具,需要煤气灶什么的, 甚至你可能还会有一些独家的材料,有一勺秘制辣椒酱什么的。那 agent 的 技能也是同理,它要来做菜,它也得有流程、配方、工具和材料。 所以在 agent skill 的 术语里面呢,它就是 skill 点 md, references, scripts 和 assets 这些东西打包成一个文件夹,这就是一个技能,一个 skill 了。我们先来个简单的, 比如说我们要做一个写作 skill, 那 我们就在 skill 里面可以要求他先去啊这些网站去搜集信息,然后再按这个爆款原则去写个大纲,然后再参考这个语气来写稿啊,最后按照平台要求来审稿等等等等。那有朋友就很疑惑, 那这不就是写提示词吗?哎,本质上还真是的,毕竟啊,我们跟大模型的交互其实都离不开提示词, 但是呢,这并不是 agent skill 的 全部,它在工程上是有很多优势的,能做的肯定比我们拷贝粘贴提示词要多很多。好处我们后面都会说到,那先让我们通过创建一个 skill 来理解它的结构和原理, 我这里用的是谷歌反重力来做编辑器来看文件,然后呢,用的是 cloud code 来做 agent 来处理任务。这俩东西的下载方式呢,我也都放在资料里了,非常清晰简单,大家一步步跟着做就行了。 接着你只要在反重力的这里创建一个项目,比如说我的就叫丘之 project 吧,然后呢,我们调出终端, 输入 cloud cloud code 就 调用出来了,这个界面大家看着会有点复杂,但是不要怕,跟着我一步步来就可以了,之后我们跟 agent 的 对话都会在这里进行。 ok, 那 我们开始创建, 那我们先要做的是一个最简单版本的 skill, 后面呢,我们会逐步升级的哈, 那现在假设我是一家轻食店的老板,那这是我们秋之餐厅的一个品牌 logo, 那 我希望做一个 skill 呢,能够按照我的品牌调性和视觉规范,帮我们去想各种物料的创意,做一个创意生成器。 那按照 cloud 的 规定,我们创建一个 skill, 得在规定的点儿 cloud skills 文件夹里面去创一个 skill 文件,那我们用最原始的方式,直接手动的来创建这些文件夹哈,点儿 cloud skills, 然后我们再创建一个文件夹,这个文件夹的名字呢,就是我们 skill 的 名字,我们叫它秋之创意吧。那这个 skills 的 文件夹里面呢,必须规定有一个 skill 点 md 的 文件,这个大写的文件,那文件里面放啥呢?我已经写好了, 粘贴进来,那就是这么些文字。好了,这就是一个 skill 了,大家先压住脑子里面的问号,我们再来细看一下,那这个文件里呢,上面这两个横线里面的它叫做元信息 matlab, 写着两个东西啊,一个呢是 skill 的 名字,一个呢是 skill 的 描述,这两个东西专门用来告诉 ai 这个 skill 叫什么名字,是干嘛用的,什么时候可以用它,那我这就写着是做创意物料用的啊,当用户说要做个海报什么的物料,他就自己触发它了。 而下面这些信息呢,叫做指令 instruction, 其实就是具体告诉 ai 怎么样做的一些提示词喽。 ok, 那 我这写了我们的餐厅叫做秋之餐厅,品牌的风格有这么些要求,输出的格式让他是这样等等等等,非常的简单哈,那我们保存好一个 skill, 真的 就创建完了?来,我们启动 cloud code 来问问他,你有哪些 skill? ok, 你 看,他现在就已经识别到了我们的秋之创意 skill 了。 ok, 我 们直接问他,我要做一个秋之餐厅的春节促销海报,让他给个创意 好,他这里就开始提示我们,他正在加载这个 skill 了,我们同意 ok, 他 就输出了创意,并且是按照我们的要求和格式来的。 那有朋友就受不了了,哎呀,这一通操作不还是提示词吗?跟我自己写一段这个提示词存着给 cloud code 看有什么区别呢?最大的区别之一在于它是按需加载的, 什么意思呢?其实啊,当我们正常的这样跟 cloud 去聊天的时候,大模型它只会看到我们这个 skill 里面这两行短短的圆信息。 只有当我们说我们要做一个秋之物料的时候,他才意识到,哦,该看具体的指令了,他才会去加载这下面这部分的完整指令,否则这些他都不会看到。 这样的好处就是方便我们可以同时拥有很多个 skill。 每次 a 正的都会看一遍所有 skill 的 简短的原信息,但是只有当 a 正的意识到他要去具体调用一个技能了,他才会去看下面的一大堆指令,而且 ai 的 回答也会更精准, 因为他没有了其他提示词的干扰,那 ai 加载的少了, open 自然也就省了一堆。那这是他按需加载的第一层。 当然了,刚刚这个 skill 实在是太基础了啊,就算一口气把它下面的指令都加载完,好像 token 也不多哈。 但是如果我们的要求变得复杂了呢,比如说我们秋之餐厅的物料其实分很多种, 常规的呢,有海报、菜单,也有比较特别的一些实体物料要设计,比如说餐盒、杯子,员工服装,还有一些社交媒体的物料,比如说公众号封面,微博配图等等等等,他们的尺寸都不一样,配色要求也不一样, 还得符合各平台的一个规范。每一个物料呢,我们都假设它有详细的长长的说明,那这时候我们如果把所有物料的要求都写进 skill 点 m d 里面,那这个文件就会变得巨长。 但是很多时候呢,我只是想做一个,比方说实体餐盒的设计大模型,根本就不需要知道公众号封面的规格,但是 ai 还是得把整个文件都读一遍,那这就造成了 token 的 浪费,也可能会造成一些信息干扰。那怎么办呢? isopec 就 又规定了一个文件夹叫做 references, 我 们呢可以把实体的物料和社交媒体的物料这个两个规格单独拆出来,单独的给它放到这个 reference 文件夹里面去。 那这个实体物料规格点 md, 我 们就写一些线下的工服呀,餐盒之类的要求, 那这个社交媒体物料规格呢,我们就去写公众号封面呀,微博配图这些的尺寸和要求,甚至我们都可以拆得更细。 然后呢,我们只需要在 skill 点 m d 这个总指令里面只留下那几个常见的物料要求,并且我们还需要写上一个指引 啊,告诉他如果用户要做线下物料的话,那就要去读这个实体物料规格点 m d。 如果要做社交媒体类的图,那就要去读社交媒体规格点 m d, 那 现在同样的一句话, 他给出的方案就更精准了。这样当我们只做常规物料的时候,这两个 reference 的 文件大模型压根就不会看。然而当我们说做实体参合的时候,他也会通过 skill 点 md 的 指引,只去看 reference 里面的这个实体规格文件, 那这就是它的进一步按需加载了。那我们可以想象,我们可以有好多种不同情况的 reference, 反正它只会在需要的时候自己去看指定的文件。 但是现在我们的秋之创意 skill 呢,只能输出创意,还得我们自己去做图,所以呢,我就还想让它可以按照我们的品牌规格,直接帮我们把图做出来, 也没有问题。那这就要用到 skill 的 另一种文件夹了,叫做 scripts, 那 这个 scripts 里面呢,一般放的是一些可执行的脚本, 那我这里呢,实际上也就放了一个非常短非常简单的脚本,其实就是在调用 nano banana 的 api 来生图的一个脚本。那有了这个脚本之后呢,我们还得去 skill md 里面在指令里说一声,告诉他,如果用户要求直接生成图片, 那他就得把之前我们想的这个创意转化成生图的提示词,然后按照这个命令去调用这个生图脚本,这样他就能一句话自动去生成精准的图片了。 不然我们还得自己去拷贝提示词,打开软件再粘贴,再生成,再下载保存,现在我们一句话就搞定了。 另外我还有个需求,我希望深层物料的图片能保持秋之餐厅的 logo 不 变, 所以我们还得给他几张 logo 图作为深图的这个参考。那我们就可以再建一个 最新规定的一个 s s 文件夹,我们把两张的 logo 图片放到这个文件夹里,当然我们还要回到 skill 的 md 里面,告诉他参考图在这个 s s 文件夹里面,如果要深图的话,需要把这个图片当做参数给脚本传进去来执行。 好朋友们,现在这个 skill 就是 一个完整的官方完全形态了,其实有点像我们在用自然语言写程序,对吧?那我们先来试试效果,来帮我做一张周六饮料免费的一个实体海报, 你看它发生了什么?它先是加载了这个 skill, 然后它内部可能发现啊,要做的是这种实体物料,它就要去看另一个解说,于是它去检查了这个实体物料的规范。那并且它意识到我们需要的是直接生成图片, 所以呢,它又生成了提示词,把这个提示词和 logo 图片一起给到,并且运行了这个脚本。那最后它输出的图片告诉我们,在这里我们看看结果, 你瞧瞧它这个尺寸,配色 logo 是 完全符合我们这个品牌规范的啊。那为了防止这个是一次性的结果,我还多试了几次,它这个深层的效果都很不错。 然而如果我们的要求还跟之前一样,我们只要创意并不要直接深图的话,那他的这个脚本他也不会被执行。 而且呢,刚才我们说到这个 scripts 脚本,这里面其实还有一个重点,这个脚本里的代码它是写好了的, agent 根本就不需要去看里面写了什么,它只要知道我们在 skill 点 m d 里面写的那些指引,告诉它传什么参数,会输出什么,它只管运行脚本就行了。 所以不管我们在 scripts 里面写了多少行代码,大模型它都不会去读取,一点 token 都不占。 当然了,如果我们在 skill 点 md 里面的那个指引写得不够清楚,大模型不知道怎么用这个脚本,那他有可能也会不得不自己去看一下这个脚本,但他的机智和园艺是不需要去读这些脚本的。 好,那我们来回顾一下,其实创建 skill 就是 在指定的文件夹下去创建一些文件,那最简单的 skill 呢?只要一个 skill 点 m d 就 够了,里面有这个原信息和指令,而完整形态的 skill 可以 加上 references, script s s 这些可选的文件,那这些东西是怎么配合工作的呢?这就是 skill 最重要的设计。按需加载的三层结构,第一层,源信息。 这一层呢,是始终加载的, ai 的 每一次对话都会看一眼所有的 skill 的 源信息,它去看到自己有哪些技能,就像一个目录。那第二层,指令层, 这层是只有当 ai 判断并且决定我要用这个 skill 的 时候,它才会去加载完整的 skill 点 m d 文件。第三层,资源层, 这层包括了 reference 里面的参考资料, scripts 里的脚本, assets 里的资源。只有当 ai 进一步判断任务需要更详细的信息,或者它需要执行某个脚本的时候,它才会去按需加载,并且脚本它是只执行不读取的,完全不占用托克。 好了,这下我们完全理解 skill 的 按需加载,也就是官方定义的渐进式批漏机制和三层结构了。可是对于普通人来讲,这又是写 markdown 又是脚本的,好像创建一个 skill 还是挺复杂的。 no no, no, 现在谁会用手写呢?我是用这个创建 skill 的 skill 啊,秋之 skill creator 创建的。 那这个呢,是我基于很火的 skill 创建器改良的一个更加互动式,更加小白的一个 skill 创建器。那大家把它下载下了以后,放到这个点儿 cloud skills 文件夹里面就好了。那下好之后,我们想要创建什么 skill, 直接打开 cloud 直接跟它说就行, 或者我们也可以斜杠来调用他,那他呢,会开始一步步的引导和追问我们,来帮我们梳理这个需求。而且我特意设计的是这种用选择题的方式来追问我们整个过程,我们就只需要用大白话回复他的问题,以及按一按上下键做一做选择题就好了。 他这个追问的过程啊,到时候大家问题可能和我现在这个不一样,因为他会根据你的需求去做灵活的调整啊,他都是现编的。 然后呢,这个过程中因为我们要做图片,所以我们还需要给他提供 logo 图的参考,以及那个 nano 不 nana 的 a p i 和文档。那我也给他直接拖到了这个项目文件里,然后告诉他了一下这个文件的路径, 他就会自己去参考和把它们放到 excel 文件夹里面。那这两个素材我也都已经放在了我们的课后网页上了,大家可以去用做练习来试试复现它。 那问完这些问题之后呢,他还会给我们核对一下方案,如果我们看着方案没问题,那他就会自动帮我们生成所有的 skill 文件了。 那做好 skill 之后呢,他还会帮你想几个例子来跑一下测试。我们这里其实测了好几个,风格都很一致,很好看。大家在这个调整的过程中,也可以去点开他写的这些 skill 文档来手动的修改一些,反正都是提示词嘛。 所以总之只要你有明确的输出要求,或者有明确的方法规范流程知识,创建器就会指引你帮你来写出一个定制的 skill。 而且除了自己创建,网上也有很多现成的 skill 资料里,我也整理了一些集合网站和 skill 仓库,成千上万的 skill, 大家可以去逛逛。并且我也给大家打包了几个普通人常用的必备 skill, 比如做 ppt, 处理文档, excel, pdf 这些基础的,我们直接把它拖进 skill 文件夹就可以,一句话让它帮你把乱糟糟的表格梳理得整整齐齐。 还有这个官方的前端设计 skill, 这是直接让 cloud code 生成的前端网页,而这个是挂载了这个前端 skill, 做出来的网页,效果明显大幅提升。还有这个动画生成的 skill, 用这么一段提示词就可以做出这样一段演示动画。 当然大家也不用去装一堆自己根本用不上的技能,一个游戏英雄也只需要四个技能 q w e r 就 能杀遍全场。所以最有效的还是把你最最高频做的几件事,打磨成一个你独家的稳定产出的 skill。 尤其是你对结果有明确的要求,你有经验和方法,你验证过的事情。 比如说打工人,你的周报每周都要写,那就做一个让 ai 来主动采访你,然后出周报的一个 skill。 比如说老师每节课都要背课,那就做一个你只要给出课题,就能给你一整套课件习题和 ppt 的 skill。 又比如说,你总是要给你的文章配图,那就做一个给他一篇文章,他就按你的风格做配图的 skill。 又比如说,你总是在审核,那就做一个按照你的规矩自动批阅合同来写备注的 skill。 因为大多数的人都不需要成为一个技能开发者, 我们只要先把自己掌握的小技能交给 ai, 让他替你重复劳动。好了,资料链接都在评论区了,大家动手试试吧!这个时候呢,点赞、收藏、关注的技能就该出发了,我们下次见了!

没有啊, ai 进入物理世界了。狗狗今天偷吃猫粮了吗?偷了,今天下午一点二十二分,狗狗偷吃了。嘿,涂鸦我在今天真的太累了。听起来你今天挺辛苦的,要不要放点轻音乐? 哎,我新的 wifi 密码多少来着? wifi 密码是一二三四五六七八。 ok, 我 准备打游戏了。好的,祝你游戏愉快。帮你开启了电竞模式, 朋友们不需要三十万一台的机器人,也不需要从装修就开始铺的那种全屋智能。我发现了一个东西,用很轻巧的方式让 agent 接管了你的家。点好、收藏、关注、赞,我们一起来看看。 那这个东西呢?叫做,嘿,涂鸦,是一个能够操控物理世界里家电的家庭 a 阵的。那有朋友可能会想问,这跟大家都说的那种智能家居有什么区别呢? 好问题,其实传统的智能家居说白了就有一点像把遥控器给搬到了手机 app 或者是音箱里,其实按钮还是我们人来按的, 什么开哪关哪,这都是我们自己决定的,顶多是可能有固定写好了几个程序,什么感应到有人进屋就开灯之类的,但是 a 真的 不太一样。 来,如果我们把黑涂鸦改名叫做管家,图姐你就好理解了,人家图姐可不是某一盏智能灯,某一个智能音箱, 他是帮你管着看着和操作所有这些设备的一个管家,不管什么牌子的什么牌子的空调,只要接入了涂鸦系统,那就都归图姐一个人管了。甚至说我们老旧的压根就不智能的那些电器, 只要插上一个智能插座,也能纳入他的管辖范围。而且最关键的是,他真的是一个智能体,所以按什么按钮啊,决定到底要开哪盏灯,关哪盏灯,这些事都交给他来决 定了。人家是有感知、能决策、能记忆,还能长期优化的 agent, 我 们一个个来看他的具体效果啊。 先说感知,原来我们家里装一个摄像头就挺先进了吧,但是摄像头里面实际上拍到了什么,还是得我们自己人来看,顶多他可能设置一个什么 活体识别,告诉你什么时候有人动了。但是我们想知道当时真正发生了什么事,我们还是得去翻记录,那如果翻起监控记录来,那就真的非常耗时间了。 但管家图解就不太一样了,人家是一个多模态的 agent, 人家就是能看视频的,所以他替我们看着发生了什么,我们就可以像问人一样来问他,狗狗今天偷吃猫粮了吗? 你看看他就会直接给你结论啊,说偷了,还一口气的把什么时候偷的和当时偷的那段视频都一起给你看。 你想这个能力就非常方便了,不只是防盗什么的,等于你有了个二十四小时帮你盯着的保安。你甚至可以问孩子今天写作业有没有开小差。 再比如家里有老人的,他这里也有个智能警告功能,你也可以直接开一个智能警告。哎,一旦发现有人摔跤,警报就响了,而且很快他还会出自定义功能,你就可以自己去说明一些什么情况是高危的情况, 相当于我们主动去告诉图姐。哎,你以后啊,要是看见有人摔倒啊,或者是有孩子往柜子上爬,或者是厨房里有烟雾,这些都属于比较危险的情况啊,你得赶紧提醒我,非常的智能。 第二,再说他的决策能力,那原来的智能家具决策其实都还是人做的,每一次我们都得下很具体的命令,什么把客厅的三号灯打开,把走廊的灯带打开,卧室的空调打开等等等等。东西一多了,我们自己都记不清楚, 但有了 agent 就 不太一样了,他得自己有眼力见,开哪关哪的灯。这还用得着我们说吗?比如我说,嘿,涂鸦, 今天真的太累了。听起来你今天挺辛苦的,要不要放点轻音乐? ok, 我 准备打游戏了。好的,祝你游戏愉快,帮你开启了电竞模式。 发现没有,我们不需要每一次都下很具体的指令,有时候我们只是表达我们的状态,管家就得根据你的状态帮你来安排。 当然,他可能现在这种察言观色的能力还不够强,但是我能想象,总有一天,我们每个人身边都能有一个像苏培盛那么贴心的管家。 第三,他还能记事。他有个家庭备忘录功能,我们只需要跟他说一次,记住,我的传位照书藏在了客厅正大光明牌匾后面,我记住了, 以后想查的时候可以来问我,那这里就会出现一个他永远不会忘记的事件。然后当我们自己忘了的时候,就可以随时去问他,我的传位诏书藏哪了?传位诏书藏在了客厅正大光明牌匾后面,哎,他就说出来了。当然了,对于诏书这种事情,保密性可能差了点, 但是呢,我们可以让他记住很多琐事了呀,非常实用的。比如说我的钥匙放哪了?你的钥匙放在门口抽屉里。我跟小李约了几号去爬山来着?你和小李约了十八号去爬山,而且你也可以让他到点了提醒你 记得提醒我八点吃药。以为你创建代办事项。今天早上八点吃药。看看有个私人管家的,感觉真不错。 那最后随着家里的电器越来越多,用电管理也是个问题,原来要知道哪个电器耗电不耗电的,我们全凭经验和瞎猜。那涂鸦呢?有个这个节能 agent, 只要是接上了支持涂鸦的插座,它就可以去调取各个电器的数据。当然我们自己看到这些数据其实也看不懂,所以说我们也需要它来帮我们分析和管理啊,给我们找出用电最凶的设备啦, 给你分析你的用电习惯了,给你节能建议了,甚至我们也可以让他出一个节能策略,到时候呢,他就会按这个策略来帮我们自动执行开关,比如说制冰机,到了晚上他就给你关掉了之类的。 当然了,这个 a 政策呢,现在也刚刚才推出来,还是有一些不足的,比如你跟他语音的时候,他都会偶尔抢话,而且太模糊的指令,他也不一定有那个情商能理解。但是就算他现在能做的事情还有限,我还是觉得很兴奋的。 你想想,以后每一个人都能有一个管家,你想想得多富饶的世界。我预言 ai 进入物理世界就在今年开始。 那目前这个 age 呢?还在陆续开放,大家如果想用的话,需要升级到最新版,然后点击申请体验,然后连上支持涂鸦的任意设备就好了。 ok, 如果这些视频对你有一定帮助,记得点赞、收藏、关注我们,下次见了。

朋友们,最近我在抖音破一百万粉丝了,而且我还拿到了抖音二零二五年度精选内容,感谢抖音。然而我是一个纯讲 ai 的 博主,你知道这个意味着什么吗? 意味着你在一众刺激好玩的视频里面选择了认真看我讲 ai, 还学了想了点赞了留言了,有时候还跟着操作了 这个奖杯装的都是你们沉甸甸的求知和努力啊!所以二零二六年我也会继续跟大家分享更多有价值的内容,也欢迎大家来抖音精选 app 关注我, 明年都该你变强,掌心发财我说的。

没有啊朋友们,我的龙虾管家 qcloud 今天正式开园了,所有想玩想用 opencloud 或者是想基于这个项目继续开发新功能的朋友, github 也已经上线了项目,大家可以看看改改,当然也欢迎大家只是顺手给个心心。 那这期视频呢,我想跟大家好好聊一聊,怎么用 qq 玩龙虾,以及我们为什么要做这个工具,我们又是怎么极限搞出来的?以及大家最近可能特别关心的关于壮民的史末好,大家点好收藏、关注、赞,我们直接开始! ok, 先给新朋友介绍一下什么是 qq, 简单地说, qq 就是 我们开发的一个帮你更轻松更傻瓜式的用上 openclaw 管理龙虾的桌面工具。 因为大家都知道 open club 很 强,很多人很想用,但说实话,我最初本来想出这个教程的时候,我就发现想装上一个 open club, 从环境、安装、配置权限到模型到报错,每一步对小白来说都很劝退。 评论区也有大量的朋友说动手装了,但是一直卡住,甚至有人准备花五九九找人上门安装了,已经放弃了的朋友可以扣个一。 我就觉得这不行啊,这个 ai 时代,大家本来就很容易 formal 了,如果连试一试的门槛都这么高,那普通人该怎么办呢?所以呢, qpl 要做的事情很简单,就是把那些安装、配置、管理的门槛给打下来,让大家直接就像操作传统软件一样,跟着界面点点点就好了。 nice, 我 简单演示一下 qcloud 的 关键功能啊,官网呢?上线了新版的 qcloud, 我 们双击安装,装好了之后呢,它就会自动帮你检测环境,然后你只需要去填写你的 api key, 然后选择你要连接的这个服务,然后扫一个码,你就可以在软件里跟它对话了。 如果你的 qq 号有问题呢,你还可以在面板中进行管理,比如说自己重启网关啦,一键修复啦,这里可以切换模型啦,下载 skill 啦等等的管理功能比较清晰简单吧。 那与此同时呢,我其实也花了很多心思去做一些正经产品基本不会做的事,比如把教程做进了软件里面,比如说装这个 open cloud 的 过程中有很多选项,小白一看就很慌,这啥意思?不敢乱点啊?那我们就在旁边做了这个大白话的解释,卡片。 那再比如,当时连接飞书的时候,大家经常会迷糊,我到底要去哪里去复制这么一大串东西呢?那我就把这些原本要写在外部的一个教程里面的步骤,给它嵌到了软件的交互里面, 大家觉得还应该有什么功能,也可以在评论区告诉我,咱慢慢上。搞笑的是啊,中间有一版,我把所有的报错提示都改成了大白话。内部测试的时候,小伙伴就吐槽, 哪有这种报错,显得咱们产品太不正规了,后面我们才收敛了一点,给他改回去,不知道你们觉得呢,我是应该保留还是应该正经一点? 那所以呢, qq 也确实是一个带有很强个人色彩的产品,他不太按套路出牌,但是呢,目的绝对是想做成一个贴心的龙虾管家。 ok, 那 接下来呢,我们就来聊聊很多朋友在评论区疯狂艾特我的壮明事件。 首先,咱们为什么要叫 qq 老?其实非常简单,老粉都知道,早就有很多朋友叫我秋秋、秋子、 qj qg, 我 私下的这个社交媒体呢,也一直都叫 qq 秋秋, 所以说把大家的称呼跟 openclaw 结合一下,再简化一点,哎,你可能都能想到叫 qq 老吧。 于是呢,基于粉丝朋友们给的灵感,那我们就定了这个名字叫 qq 了,我自己也很喜欢,很大气,很可爱。那本身我们这个频道和这个 qq 了,都是在粉丝的支持和鼓励下才有了今天。 qq 呢,也是为了方便大家才做的东西, 所以我们团队的小伙伴为了保护咱们共同的产物,也非常的认真。那就在这个期间呢,陆续的把商标、域名、社交媒体都注册了, 其实还花了不少钱呢,那为什么这么谨慎呢?不知道大家之前有没有看到过,我们确实是看到过一些博主的新闻,说他自己的名字被抢住了,或者是他跟粉丝特有的一些说法,被人拿去做了盈利的招牌,而且还都是些大博主, 最后呢,要么还得给人家钱,要么又得被逼改名。但老实说,我自己那几天其实是非常忙的,一边开发 qq, 一 边在写文案,一边准备直播,一边准备装修,一边在面试,完全是分身乏术。所以名字这个事呢,我也没太当回事,这个行政来问我,我还觉得他小题大做。结果 我们发布之后,评论区和其他的朋友们都给我们转了一条新闻,某大厂就在我们发视频的前一天,发布了一款名字相似,功能相似,甚至连 logo 都有点相似的产品,我当时就呆了, 还有这种事?那我们团队的小伙伴也都非常惊讶,大家就说,这怎么弄啊?大象和蚂蚁还能撞衫了? 当然了,我们短暂的这个惊讶之后,哎,反应过来我们应该高兴啊,这不正好说明我们在 ai 领域的洞察,我们对产品的直觉和对这个起名,这个 sense 跟巨头都英雄所见略同了。 开玩笑,我们当然还是一个非常非常小非常非常开你的自媒体小团队了。不过呢,大厂做这个是为了他们的生态布局嘛? 那我们来做这个免费的开源软件,只是因为评论区里面粉丝们的龙虾焦虑,而且虽然大厂背靠技术,有渠道有资源,但是作为离小白用户最近的人,我们也有跟粉丝朋友们的默契,有大家的支持,对吧? 因为 qcloud 对 我来说,它确实不是一个冷冰的产品,它也是我跟粉丝朋友之间的一种连接纽带。因为我们开发的时候,大家的评论和脸我都是有画面的,我都能想象到大家使用一些功能的心情和出 bug 的 样子, 像一种非常搞笑也很珍贵的对话,就像有的朋友看我的公众号文章说都能听见声音一样,是吧,咱这个铁铁都是很铁的。然而,就在我们准备开源前夕,发生了一件神秘事件, 我们在大长版的 qq 号发出来之前就注册好了的公众号,突然变成了未命名账号,理由是涉嫌对用户混淆,误以为是其他官方主体, 就是这样。那至于重名这件事后续怎么处理呢?如果有进展,我会第一时间跟你们分享。再顺便说一下,我们 qqlab 核心代码已经完全在 app 开源,大家也可以在官网免费下载使用,也欢迎大家多多来参与我们这次不太一样的开源共建。稍等,我会详细说一下哪里不一样。 ok, 那 我们是怎么在这么短的时间内做出 qqlab 的 呢?先说结论,除了肝,当然就是靠 ai 了。 除了第一版的测试版是百分之七十左右的 web coding, 后续的版本基本上做到了百分之九十九。 light 版本呢,实际是我们一周之内完成了对整个架构的重构,所以整个过程本质上也是一次非常极限的 web coding 和 ai 写作的挑战。龙虾 cloud code, codex 都是主力。再给大家看个好玩的,我们的 logo 真的 就是龙虾生成的。而且我只用了一句话, 因为当时龙虾有我们更多的上下文,他了解我们的项目,也知道我一些倾向和喜好,所以我就说了一句,他就设计成了这个样 子,然后发到群里,大家都觉得不错,哎,就这么定了,他有一个三 d 的 这个虾爪,然后上面有一个开机键,然后我们想到把它倒过来变成了 q, 既可爱又有我们的品牌字母,又有 open cloud 的 属性,又有开机键来代表这个龙虾管家的意向。 我只能说,请把决打在公屏上。不过呢,由于我们的 logo 是 偏替给转的 svg, 所以 中间有一次我们发出去的中间版 logo 是 糊的,还就有人反馈,这咋 logo 都糊了, 的确是五毛钱的 logo, 因为 nasa banana 身图刚好五毛一张 那,但是啊,整个过程它也没有听起来那么轻松,整个开发过程真的也不是说我一句话, ai 就 咔咔咔都做好了,产品的设计,功能的取舍,交互的梳理,架构的方向到问题的排查,我们自己也蛮好算力的, 实际写代码的时候呢,也得跟龙虾斗智斗勇,揭穿 cloud code 和 codex 的 谎言和敷衍,反复的跟它打磨。 而且龙虾也是一个年轻的开源项目,他一直在更新各家的插件,也一直更新,模型也一直更新, bug 也有很多,我们有时候甚至都分不清这是龙虾的 bug 还是插件的 bug, 还是我们自己的 bug, 修完你的修你的,修完你的修你的。 所以虽然是 vip 顶,但是这一个月也还是挺累的。老粉应该发现了,我们最近视频更新的有点慢了,其实我们团队很多人过年都没回家了,中间还熬了非常多个大夜,人事都在帮忙做测试剪辑,都在群里帮人解决 bug, 大家可以看我们非常凌乱的这个战场,而且吃了很多顿宵夜,我感觉我都胖了。而且为了开发这个 qq 老,我们其实也推掉了一些商业合作,专心的做这个可能没有什么收益的实验。不过虽然如此,压力也更大了,但是最后大家还是非常有成就感 的,也真的要特别感谢团队里两位年轻的开发小伙伴,我们大家一起用 ai 做了一件能帮到更多人的事。 好,那开头就说了,今天我们把 qcloud 正式开源了,那我知道很多朋友他不是程序员,所以我也简单科普一下什么是开源。 简单来说,开源就是把自己的代码全部公开,任何人都可以拿去用,拿去改,拿去做自己的东西。比如我们每天用的手机底层,它就是谷歌开源的安卓系统。 那更近一点的 deepsea, 他 们也都一直在开源他们的模型,分享他们的技术报告,全世界的公司都可以去学习,所有的企业和个人也都可以下载他们的模型。那你看现在国产大模型百花齐放,有了更多强大的开源模型,这就是开源最酷的地方, 前人种树,后人乘凉,后人呢,又再种了更多的树。那我作为 ai 博主,原本我的工作就是给大家去宣传讲解这些厉害的开源模型和项目, 那这个过程中我也实打实的收获了大家给我的关注和信任。所以虽然跟这些伟大的项目相比, qcloud 只是一个微不足道的小小工具,但是我们也希望加入这个让我们受益的行列, 从克服者也变成一个贡献者,帮到更多需要的人,甚至影响更多人也成为贡献者。而且说实话,只靠我们团队几个人呢?肯定是还有很多做不到,想不到也来不及做的地方。在开源的这两天,我们都还在不停的修 bug, 并且追这个 openclaw 的 更新和新的这个微信官方插件。当然现在我们已经支持最新的 openclaw 了, 那社区的力量肯定是更强大的。所以我也特别想说我有一个小小的愿望,因为过去大家总觉得参与开源贡献、提 pr、 提 e show 好 像都是专业开发者才做的事情,但是我希望 qcloud 这个项目 不是这样的,我希望所有感兴趣,所有有想法的人都可以参与贡献,哪怕你之前不会写代码,只是在尝试纯歪不扣顶,哪怕你只是用了之后发现了一个 bug, 提了一个建议,只要有价值,我们就会通过审核,或者是社区的朋友一起帮你把它改到通过审核,把你的想法变成现实。 总之,我希望所有不论技术水平的人,在这个项目都可以平等的参与,上到大厂的专业团队,下到第一次尝试 web coding 的 普通朋友。我也很希望有一些朋友通过 qq 老完成他人生的第一次开源贡献。 所以,大神欢迎,小白欢迎, web coding 欢迎,传统手艺也欢迎。那我也要特别感谢这次内测群里面的这些朋友, 我们也在项目的主页对部分朋友表示了感谢,感谢大家提出了重要的反馈,顺便我也要打个广告,欢迎开发相关的人才加入我们。虽然我们可能暂时不能提供和大厂一样的顶级薪资, 但是我们能给你一个绝对纯粹,没有各种汇报 ppt 内耗的一个创作环境,而且 ai 工具不限量,如果你热爱 ai, 并且想和我们一起折腾出更多真正有用有意思的东西,不要犹豫,加入我们, ok, 那 最后我还想说,我之所以这么做,这么希望大家都能参与,也是因为我在做 qq 的 过程中更加相信一件事,在 ai 时代,一个小团队,甚至是一个人,真的有机会做出一些帮到很多人的东西。 所以,如果你过去有什么觉得自己做不到的事,真的请你大胆尝试,哪怕现在他还很小很粗糙,很不完美。没关系,先把第一步迈出去,跟 ai 一 起成长,你会发现这个时代还挺有意思的,你也会发现原来你可以做到一些事。 好了, qq 了已经在 github 上了,去看看吧。用它改它,或者只是点个心心,或者把视频转发给你认为需要的朋友,还有点赞、收藏、关注我们,下次见了。

你好啊,朋友们,说话就能剪辑,你敢信?剪映出 agent 了,一键成片、 ai 转场、 ai 剪口播、 ai 旁白、 ai 深视频深图等等很多吓人的功能。真的,剪映已经不能说是一个纯粹的剪辑软件了, 它现在是一个集 ai 生成和剪辑为一体,还能用 ai 操作这一切的新物种。好吧,点好、收藏、关注、赞,我们一起来了解一下创作新范式。 其实剪辑原来真的是一门专门的高级技术,光是会用那些复杂的剪辑软件就是一个门槛。你要再想做一点酷炫的效果,这是真的要学两年。 那剪映其实一直都在致力于降低这个门槛,只是我没想到他这么快有这么大的野心,要把这个操作门槛降到了一个点。一个 ai 对 话框,这个框背后是一个可以调用剪映那些成千上万的模板小功能, 并且可以理解你的素材,理解你的语义的一个多模态 a 卷的 ok? 那 对于用户来说,它最基础的功能就是帮你解放一些重复性的动作,什么简口播、调音量、改画符、加字幕,这些东西不难,但是很费时间的一些动作。现在呢,你就可以丢给 ai 做了。比如说这条带脏话的视频, god damn did you shit! god damn is that a fart! 我 就直接摁住它,把所有说了脏话的地方剪掉, 这才十几秒的时间,它就剪好了。 listen what is that i don't know what is that did you shit is that a fart。 你 可以想象一条几小时的采访,或者是批量出几十上百条切片视频,这能给你省多少事?当然,像电影那种细致到真的那种剪切感觉,他现在肯定是做不到的,毕竟我觉得很多人也做不到。 但是他在做一个初减阶段的批量化操作,真的就很可用了。你像忽大忽小的素材音量,也就说一句,把所有的片段音量调到一致就 ok 了。这真的很难想象啊,这简直就是 web cutting 啊 耶!另外还有个很实用的,大家以前追美剧啊,追日本翻剧啊,都是要苦哈哈的去等字幕组来出熟肉的。那现在这个 agent 呢?就是你的字幕组?那我导入了这个乔布斯的英文演讲,我直接就让他识别字幕并生成中文, today, i want to tell you three stories from my life, that's it no big deal, just three stories。 他 就一口气做好了转写、翻译,再到双语字幕的排版。而且他的准确度真的很不 错。那除了批量化的操作,剪辑师其实还有一大部分工作都是在找东西、找工具、找功能、找模板。 现在呢,你就可以让 ai 帮你找了。比如我说给这段视频添加酷炫的反转片效果,他就自己找了这个效果,再应用到这个片段上,最后你再微调一下参数,这就成了。 当然,有的朋友呢,是剪辑小白,甚至也不知道什么叫做反转效果,没事,模糊的指令他也没问题。比如说,有的短视频创作者本身拍的东西很有意思,但他不会剪辑,哎,你就可以直接说帮我做一个合适的包装, you know and i was like, i like the capitalizing x, just autonomously, so? 看这个效果真的很夸张吧?音效、动画、大字这一整套东西,它都在正确的时间,正确的画面位置帮你编辑好了,不算精致,但是有那个味了。 那就算你的素材是没有台词的也没关系,你可以先让他根据视频内容生成旁白,他会自己识别画面,然后先用 ai 生成这个对应的文案,你看他还知道条纹沙发,那确定文案之后呢,你也可以自己去挑选一个音色, 最后旁白就好了,一场猫狗大战一触即发。黑白边牧端坐在甚至十几条没逻辑的素材丢给他,只说一句,剪个 vlog, 你 看看这效果。先是出发,然后上路,然后又游览,他是真的有这个剪辑线索的, 而且这个字幕、音乐转场也都是他自己配的。因为这个 agent 它是基于庞大的工程文件作为数据来训练的,它生成的是可编辑的工程文件。所以好处是如果不满意,我们也可以直接上手改它,就不像普通生视频那样,我们只能重新抽。 不过呢,以上这些都还没有展露出这个 agent ai 用 ai 的 魔力, 因为他现在也能在剪映里面去用豆包系的各种图片视频模型,所以 ai 视频也可以一站式的在里面 边生成边编辑边剪辑了。比如说我们刚才那段旅拍素材,我们想给他再补一个极光的镜头啊,放到后面,那我们就不用找素材了,我们直接一句话就让 ai 生成了,他就给我们自动接在后面了。 你也可以给自己生成一个片尾的 logo, 你 再选一个图片,让它生成视频片尾。 ai 创作的过程就变得不用换软件了,非常丝滑。 然而还有更丝滑的,就叫 ai 丝滑转场。那这一系列呢,是单独的 ai 功能,虽然它这个 a 帧呢也能调用,但是我们手点着也很快。比如说有这么一系列图片,我们可以直接在它连接的这个地方选择 ai 转场效果, 那做成这种很火的 ai 首尾真视频的一个效果提示,词都不用写。还有这个我很喜欢的改词翻唱,我们只用选中音乐,然后点这个改词翻唱,你可以输入歌词,也可以让 ai 来想歌词。来,大家听我这个剪映版星星摇啊。 好!最后压轴的是还有一类朋友,他什么素材都没有,光有一脑袋想法来给你介绍他这个文字成篇,我们可以选择一个合适的画风,把你的想法或者是你的文案发给他,然后点点 点,他就直接成片了。多年来我记得他爱吃的罐头,虽然说这个精致程度肯定是差了点,但是他快啊,哪怕我们去跑一个 demo 来做一点灵感,或者是做一点素材准备,他这个效率就很可怕。 当然目前剪映的 age 呢,现在才刚刚第一版嘛,现在还停留在适合粗剪的阶段,但你也可以看到他在解决创作中真正需要被解决的那些问题。 而且我们可以从他现在的范式去推断,你看他素材可以在这里 ai 生成,他还有成千上万个原子化的精细工具,然后这一切都可以让 a 这么来操作。真的视频创作 all in one 了。 未来我们的创作过程岂不是就像一个导演丁片一样,在旁边动动嘴,只管要求和调度就好了?其实适合做这件事的我,还真就只能想到剪映了, 虽然我也不知道彻底到那一天需要多久,但是我确定的是,他一定会让更多人的才华不用卡在不会软件这道坎上。好了, 欢迎大家把视频转给有剪辑需要的朋友,告诉他这个消息。还有你们最期待 ai 帮你解决什么功能?评论区见,记得点赞收藏关注我们下次见了!