之前使用 codex 加 hyperframe 自动化剪辑了一款视频,当时存在一个问题,就是原视频如果有些卡顿点,那么通过 hyperframe 剪出来的视频,这卡顿点依然存在,这并不是我想要的。那怎么解决这个问题呢? 我通过咨询 ai 给出一个方案,叫使用 video use 这个 skill, 这个 video use 的 技能就是 判断视频哪里该剪,哪里不该剪,它可以根据语音停顿内容来去判断哪些是废话需要删除, 哪里有明显的停顿需要删除和缩短,哪里有口误需要删除,哪里是重复表达的,也可以去删除。剪辑的后选点主要是来自于语音的边界和这种静音 间隔。那怎么去使用这个 video use 呢?首先在 codex 里面去装这个插件,这个插件需要从 github 上去下载,所以这里我就给 codex 输入了这样的一条提示词, 并给了 video use 的 github 地址。对于我们后续的自动化简历调用,我就重新 去剪辑原来的片子。这次的剪辑流程是使用 codex 去调用 wechat use 来去判断原视频哪些地方该剪,哪一个地方不该剪, 然后再通过 hyperframe 去渲染输出这条视频。这里我给 codex 输入了其实词,这个其实词是我用 ai 去给我写的, 我就把我的需求告诉了 i i。 我 的目标就是来个死刑医院,为 u u s 加 f f f 们去剪辑出一条人物陪美颜,有记录调色,有自动字幕,关键词高亮,有必要的标题这样的一条视频, 然后他就会给我输入这样的一个制词,然后我就直接输入给 codex, 他 就能直接把我去自动化剪辑了,这是他输出的。但这个视频又有一个问题,你可以看一下这个问题在哪里。 真正的靠谱的方式。这个视频的问题在于,本来是一行的话,他会变成两行、三行或者四行, 比如真正的靠谱的判断是一行话,它会变成真正的一行,靠谱的一行,判断一行。我就纳闷了, video use 不是 知道怎么去剪辑吗?知道怎么去断句吗?怎么会这样?后来我发现是我的 video use 没有调用成功, 因为使用微调 us 还需要给它配一个 api k, 所以 我要去给它一个 api k, 这个是 api k 的 获取地址, 输到浏览器里面之后呢,你就可以获取微调 us 的 微调地址,然后再输入给 codex, 让它配得到环境里面去,这样我们才能真正的去调用微调 us。 最后我又重新调了这一套流程,让他数出一个完整的视频来看一下他剪辑的成果。真正的靠谱的,他的方式很简单,看他有没有完整的作品,作品这就是他最终生成的视频,整体效果还算满意, 但是对于整个视频的一些精细化编辑,人物的美颜亮度、色度、对比度的一些细节把控的还不是很好。看每个人的需求吧, 这些粗剪混剪还是可以去满足的。如果我们把流程固定好,批量的输出一些视频,这个是能做到的。但是对于一个片子精细化的去剪辑,达到我们的 高度要求还挺难的。按需索取,或许未来他会剪的非常不错,但现在我没看到啊,所以我也不知道目前那些使用 typeface 们剪出来高质量平常是怎么剪辑的?或许我的能力还不够啊,再目中无措,那就先这样。
粉丝12获赞50

今天我们会完成桌面板打开之后的第一次设置,那么我们就开始吧。第一次打开 codex 桌面板,我们要先把界面分成三块来看,左侧是项目和一些插件的入口,中间就是我们的一个对话框了,最下面有一个设置面 板管理。对,那么我们新手进来要先处理几件事情,第一个工作模式,第二个选举指令,第三个批准策略,第四个沙盒,第五个插件入口。 ok, 那 我们先进到设置里面看, 在设置里面左侧有十二个分类,包括常规、外观配置等等。第一次使用我们重点来看这几个,我们先点开常规,常规的第一项就是一个工作模作,开发项目的时候,我们一般选择适用于编程, 你选择了这个模式,那么 codex 会更愿意指示文件命令验证方式。如果你平时是以日常工作居多,比如说是以文字创意等等,那你可以选择用日常工作。在下面的权限区域,我们要来看一个重点是完全访问权限,这里记得是关闭的状态,如果这个开关打开之后, codex 可以 直接编辑更大范围的本机文件,运行网络命令,它的风险会明显变高,所以作为新手阶段而言,我们默认把它关闭掉就可以了。这里的速度可以选择是标准还是快速, codex 会基于跟你的一个整体对话,给到你一个相应的建议,当然如果用快速的话,它的套餐用量也是会增加的,那么我们平时用标准就可以。 那接下去我们来看第二个重点是个性化的,这个选项里面有两个,一个是个性,主要是选择 codex 回复的默认语气, 我这里选择的是务实,希望它能够简洁、专注和直接。第二个我们要去关注的是自定义的指令,这里的自定义指令要知道它是局工作规则,所有的项目都会读到它。所以新手我建议你们只要写八行内容就可以,这八行内容我会放在评论区,当然我自己的会 更完整更长一些。我的结构大概是包括使用范围与优先级通用的一个工作流,安全与合规,通用代码规则,验证与测试提交的规范,常见的项目命令工具,然后输出的一个文本规则。还有一些个人偏好,对, 我觉得大家一开始就用前面的这个八行就足够了,后面当你越用越多。你可以跟 codex 去总结你们经常碰到的一些问题,或者是你自己觉得 codex 经常会犯的一些错误,你把它整理成对应的规则放进去就可以了好吗?它有一个记忆的选项,目前是实验阶段,大家可以把起用记忆这个给开启就可以, ok。 第三个重点是配置,我们来看一下配置的页面配置我们来关注两个内容,第一个是批准策略,第二个是杀核设置。批准策略一般我们都会默认的是 on request, 它的意思就是说当 codex 遇到高风险动作的时候,就会停下来让你确认。当然这里如果说你是用 never, 那 就相当于一次执行到底了,不需要你的任何的批准,所以我建议新手都是用 on request 吧。沙盒设置这里它的默认是 workspace right, 它主要在当前项目里改文件,允许网络访问,这里就是默认开启,你可以把这里的批准策略理解成为它是一个确认按钮,哪些时候需要你来确认?把沙盒设置理解成为 codex 的 活动范围, 你给它框定了一个能够编辑文件和改文件的一个范围,它就只能在这个范围里去进行一个行动。我们再来看一个大家比较容易忽略的一个点,或者是比较容易混淆的一个点, 就是在桌面面板的左侧有一个插件,这里的插件它其实包含了 skill, mcp 和 connect。 skill 是 工作流,是我们的一个技能文件,它里面包括一些代码审查、做表格、生成 ppt 等等。同时像 mcp 就是 codex, code 等等。 connect 呢,是第三方账号的一个连接, 比如说像这 eraser, git, a lotion 都会有,所以这里的插件其实它就是一个能力包的一个合集,像 m, c, p, skill, connect 这些都是它里面的具体的能力,大家根据需要去进行一个安装就可以。 ok, 那 我们再回到设置里面剩下的几个,我们只是来做一个印象, 比如说像外观,你可以基于自己的系统去定义主题色,浅色或者是深色,当然这里有一个隐藏选项,它有一个宠物,看到了吗?这个就跟 cloud code 是 一样的,就是最近出了一个宠物,当你选择唤醒它的时候, 你看它的右下角就会出现这样的很可爱的一个宠物形象来陪伴你头顶。 it 主要是来管理分支的,像浏览器使用和电脑操控,主要针对的就是 browser use 和 computer use, 在 我们后面也会去讲到像以规章和使用情况,就是你本地的一个任务的一个管理和一个用量的展示,平时经常的去看就可以了。

hello, 大家好,我是阿亮,这期视频呢,教大家如何把 codex 接入国产模型,比如说接入 deepsea codex 和 cloud code 呢,不一样,它不支持修改配置文件来切换模型。最初呢,我也是想直接用其他的工具来接,比如说 c c x, 但是折腾了很长时间,发现问题比较多,也很复杂,所以呢,就自己动手来搞定的一个专门的工具, codex 杠 switch, 用这个切换 codex 的 模型就方便多了。接下来呢,就照着我整理的这份 codex 文档,一步一步带大家操作。 首先点击文档中的 codex 杠 switch, 跳转到下载页面,根据自己的电脑 选择安装包。下载后呢,双击打开,我们就以 deepsafe 为例,这里选择 deepsafe, 然后点击这里到 deepsafe 官网去申请 k, 这里有每个模型的申请 api k 的 链接好,点进去呢,就是开放平台,点击 api case, 创建 api k, 然后把拿到的 k 复制到这里就行了。然后点击蓝色按钮,这个时候呢,就切换成 deepsafe 模型了,现在呢,需要重启 codex, 记住这里一定要把 codex 关掉,重新启动, 可以看见这里的模型变成了 deepsafe, 输入一条消息试试,如果它有回复说明呢,就接入成功了。 点击红色按钮,也可以一键切回官方的 jpt 模型。注意切换后必须重启。 codex 这个小工具呢,目前支持主流的啊,国产模型也可以自定义模型,每次启动 codex 前呢,把这个工具启动了,就可以顺畅地用国产模型了。 这一期呢,我们主要是想要通过一个案例带大家整体走一遍流程,更熟悉这个扣带子的使用。很多人觉得呢,做一个案例或者做一个东西之前呢,要先想清楚做什么功能啊,有什么样的风格等等吧,就想了好久好久。其实我们根本没必要 给他最简单的提示词,让他呢先做一个东西出来,然后我们再挑毛病。好了,接下来我们直接开始 新建一个项目文件夹,直接命名为汉堡店,然后新开一个对话,添加新项目需求呢,就一句话,帮我做一个汉堡店的网页回车 codex, 自己理解,自己拆任务,自己给方案,它还可以自己的生图,因为它接入了目前最好的模型啊, gpt 杠一, mate 二,这个是最好的生图模型,我也没仔细看啊,先让它跑一半问出来再说。 哎,过了一会呢就出来了,但是我发现他的主页呢只有一张图片,这样感觉真的是太干了,餐厅也没有什么特色,我想每天都有一个的特色汉堡啊,以一周七天来循环,让他来修改 主视图,图片改为五张图片轮播,设置每天的特色套餐,每日的优惠套餐以一周为一个单位啊,一周为一个周期。每天的菜单呢,可以点击观看,并且每个套餐呢都有相应的配图。 顺便再说一下, codex 是 内置了当下最牛的生图模型,一面之杠二点零模型,比香蕉呢强了不少,改好了来看看效果啊, 这是汉堡店店内环境呢,是必须要有的,然后我输入加入醒目的店内环境图片,分别有,后厨的呃,制作区,冷藏区,前台用餐区,卫生区,冰激凌帐。每个区域呢都有至少两张图片,图片看起来是在同一家店。 好的,等会效果还不错。我们新开一个对话,打开计划模式输入,把这个项目改造成 next js 框架。如果你不知道 next js 是 什么意思,可以再新开一个对话,问他什么是 next js, 然后使用 codex 内置浏览器,我们点开批注按钮,这样的话,你想改哪里啊?直接就能在这里改。比如我想让这个汉堡的价格是零,直接点击这里,价格改为零, 想改哪里呢?都可以在这里直接进行修改。但如果你想让别人也可以打开这个网页,只需要打开 codex, 问他怎么让别人也能打开这个网页。这个也算是给大家留一个作业啊。总之一句话,遇到不会的或者不懂的就去问 codex, 把我们的思路一定要转变过来, 大家有兴趣呢,也可以去尝试着做一点自己的东西。 ai 时代,我们用 ai 工具呢,最主要的就是用来创作,然后提升自己的效率,让我们成为一个 maker。 好 了,这期视频呢就到这里,下一期我们再继续讲 codex, 大家点点关注哈,跟着阿亮学 ai。

哈喽,大家好,我是宇哥,又和大家见面了,今天这一期给大家讲一下靠戴斯如何接入国产模型,这一次手把手教大家搞定小白,一次也能成功。 ok, 咱们讲之前咱们先讲一下大概的原理,像国外那,像咱们接入国外模型, 很多时候是都只能选择官方模型,不能自由的选择一些便宜的模型。 一个是账单比较肉疼,再一个是网络也不稳定,有时候访问不到对应的模型,咱们的国产模型的优势就出来了,又快又便宜,这非常值得一试。给大家讲一下原理,其实 ai 工具、编程工具,它只认接口,它不认模型是谁, 咱们只要把国产模型包装成他人的接口,就可以实现这个通信了,这个 ai 工具也能实现使用咱们的国产模型,咱们的目标就是把我们的 ai, 把我们的国产模型包装成他人的 api 接口,还有接口格式不一样,我们就怎么着需要一个本地路由来翻译一下。 比如说我们用 codex 做编程工具,我们就需要一个中间件,比如 c c switch, 把它这个国产模型的接口翻译成 codex 能认的, 从而我们就能让 codex 接入到我们的国产模型。核心就三样东西,一个是模型名称,这种咱们一般是选 deepsea v 四 pro 或者 deepsea v 四 flash 这种, 还有 base u l。 base u l 是 什么?是模型请求的地址,你到这个地址,模型再给你反馈。还有一个就是 a p i k, 我 们叫密钥 k, 这个一般是从官网申请就行了。下面咱们说一下真实配置,给大家一步步演示一下。 首先我们回到这个软件界面,到时候我们点添加对应的工商就可以了,这里我有 tipsick 的 a p i, 我 们就直接选择,我就选择了 tipsick, 这里只需填一行参数 a p i k, 填好了直接保存就行了。还有它给大家预设了其他参数,包括 bash, 包括一些模型映设,这里有一个按钮,它是默认打开的,大家不要把它关闭,就是需要本地炉油映设这个按钮, 大家记得打开状态就行了,这样点签添加就基本完成了。还有一点特别注意的就是在设置里一定要把本地路由开启,这三个按钮都要开启,尤其是下边这个 call desk, 设置 call desk 路由按钮一定要开启才能生效。 还有一个按钮,回到软件回到界面上,我们也一定要点启动你的国内模型才能生效。 下面咱们就用实操给大家真实演示一下,看看有没有接通。这里我们就看到这里我们的第第四个 v 四就接入进来,他默认选择了第四个 v 四 flash, 这有两个模型, v 四 flash 和 v 四 pro, 咱们先试一下 v 四, v 四 flash 能不能正常通信, ok, 能正常通信,咱们再试试 pro, 咱问他今天几号 开着,慢一点,他直接查询了,这是属于他的思考范围,咱们还要注意点他一般咱们接入普通的 api k 以后,他他不能使用插件,但是咱们通过这种形式是可以使用插件的。 前两天给大家讲了一句话做视频,咱们看看那个插件能不能安上,叫 hyperframe, ok, 能搜到插件,也能点安装,点添加到 qs 就 行, ok, 插件能安装正常,能对话,咱们能对话,添加插件说明功能完整,大家去赶紧去试一试!关注宇哥,带你玩转 ai 时代!

小伙伴们又和大家见面了,相信大家一定都用上考勤了吧,还是那句话,一定要想办法用上考勤。 大家既然现在都用上考勤了,我这期给大家讲讲咱们安装好考勤以后一些基础设置,这些基础设置虽然有时候不是特别复杂,但是设置好了会让我们效率倍增 啊。今天咱们就开始从最简单的菜单开始,常规里头有两个,大概我们主要做两个设置工作模式,这里的你大家看一下这个名称应该都很清楚,适用编程,大家编码多一点的时候选择这种模式,比如说咱们日常办公写文案, 或者写弄一些办公软件多一点说我们用适用于日常工作这个模式,其他的咱们按默认选就行啊。 咱们看到外观,这里这里大家看一下外观,这里根据大家喜好来了啊,什么字体颜色啊,背景啊,这都根据实际状况来。但是这里它有一个特别有意思的功能啊,我给大家看一下 box 里头有一个宠物功能,这个功能挺有意思,大家可以选择自己喜欢的宠物进行跟他培养交互,同样也可以选择创建自己的宠物啊,根据自己喜好来 最新的一个功能,应用快照功能,这个功能我感觉特别好用啊,比如大家看见一个特别喜欢的文章,大家可以按左右的 command 键同时按一下,他就把这个 文章啊就直接截取出来了啊。今天我遇到一个特别实用的问题啊,实用的这个功能就是用这个应用快照功能,比如今天我发现一个软件出了故障,迅速我按一下这个按键给抛给这个 cadast, 他 马上就给我分析出问题迅速解决。 这个特别实用啊,大家遇到问题或者遇到好的这个文章的时候都可以用这个特别实用 啊。咱们看一下下面的配置啊。配置这里头我主要说两项啊,一个是批准策略,这里咱们默认就选这个 on request, 这是遇到关键问题的时候,他会询问我们的意见,我们看一下没问题可以批准。还有个沙盒配置,沙盒配置默认咱们选这个 work based write 就 行啊,他对沙盒空间里头有多些功能啊,遇到一些高危命令执行的时候,他也会询问我们, 咱们看一下个性化,这里头,这里头有两个风格啊,一个亲和,一个务实。 你希望他说的要简洁一点,简洁概念一点,就选务实派啊,希望他详细需要说的,希望他说的详细一点,说的有亲和力一点,可以选择亲和啊。 还有自定义指令,自定义指令这个是约束咱们的 agent, 约束咱们的 codex 不 允许他做什么操作,对他有约束力啊。 这里头我用的是卡帕西大神的他的一个开源项目,他现在这个项目大概有十五万颗星啊, 大家有需要的时候,我可以把我的这个 agent md, 我 可以分享给大家,大家可以用起来,因为把这个,把这个指令用上去啊,我们的 codex 它的效率啊,还是它的约束力,还有它这个呃做事的风格就就会提升很多啊, 这个有需要的我可以分享给大家。剩下的是啊,键盘快捷键这里大家可能不需要改啊,如果特别觉得哪个快捷键特别舒服,自己想改一下也行,但是这一般默认就行,但是我们得看熟悉这些快捷键的用法啊,到时候我们很快捷的调用一些功能啊。 咱们看一下这个连接功能,这个更简单了,这个功能特别实用啊,大家开启这个功能的时候,比如这几个按钮,咱们点开允许 发现控制此设备啊,这就是让我们用,通过我们的手机可以连接到 call 大 师,我们直接在床上就可以实现发送指令或编程, 还有让这让这台 mark 保持唤醒状态,这个也勾选上你的 mark 处于息屏或锁屏状态,我们依然能能用手机控制,这个大大提升我们的效率啊, 而且它在锁屏状态下,它是防止别人窥屏的,还保证我们的隐私。咱们看一下这个浏览器啊,浏览器,这里的浏览器勾选上,这里是让 call 大 师,他可以 控制我们内置浏览器,因为 call 大 师带了一个内置浏览器,它是一个无头浏览器,像我们执行一些自动化脚本的时候,在这里头执行 勾选上就行,这个勾选上还是有挺大用途的,现在电脑操控这个这几个按钮也要勾选上啊。首先第一个按钮,任意应用, 我们勾选这勾选上这个按钮以后,呃, codex 可以 控制我们电脑的任何一个应用,包括给我们调取一些数据,做一些数据分析,进行一些登录,都可以使用它非常方便,尤其是我们做开发的时候,比如开发了自己的小应用,可以让 codex 检查一些流程规则。 这个 google chrome 这个功能是在谷歌浏览器里配了一个额外的插件,它可以读取我们浏览器的当前状态, 比如,比如我们登录,登录到知乎啊,登录到微信啊,登录到我们的公众号,它可以进去看我们的一些数据,帮助我们进行分析啊,帮助我们进行一些选择题啊,这特别方便。 锁屏操作,这个顾名思义,大家都知道啊,就是锁屏状态下,这 call 大 师依然能操作我们电脑,比如我们执行一个长任务的时候,我们就可以用这种状态入党绘画。这里就更简单了,就是 我们可以查看我们已经入党的绘画啊,查看一些历史信息啊,包括一些我们以前入党的一些聊天记录啊这些,有时候我们查一些我们重要信息的时候,还是还是挺有用途的啊。 剩下的就是主要这几个功能啊,还是大家得多用 pods, 多用我们才能发现它的这个价值,提升我们的生产力。 好了,这期就录到这了,小伙伴们把这个 code 起来啊,用起来,有什么问题大家集中反馈吧,有需要我再录一期视频的大家就留言啊! ok, 关注宇哥,带你玩转 ai 时代,好,拜拜!

codex 虽然功能强大,但是使用 openai 官方的 token 渠道,性价比非常低,这里教大家如何将 codex 接入到国产性价比之王 deepsea k。 平时就把轻量化的任务交给 deepsea。 首先需要安装几个前置的工具, 第一个 node 点 js, 直接搜索官网,点进去,选择自己对应的版本下载即可。下好后一路下一步安装就行。 第二步安装 c c x 和 c c switch, 这俩因为要去 get 掌,这里我就把安装包放简介了,大家自行领取下好安装包后安装。先打开 c c x, 这个 ev 是 环境配置文件,可以用记事本的方式打开,这个密钥是一二三四五六记一下, 然后打开运行程序,把这个管理界面的连接复制到网页,打开, 输入刚才那个密钥,一二三四五六,可以把它切换成简体中文。然后我们先不管它,打开 deepseek 的 官网,点这个 a p i 开放平台,这里大家用自己的账号登录,然后点左边这个接口文档,把这个余额要地址复制一下,然后回到 c c x, 点上面的 codex, 再点添加渠道,在上面粘贴一下 y o r l 地址。接下来回到 d p c 点这里的 a p e k 点创建 a p e k 这个名称,随便填点创建 这个 a p i k, 大家可以自行保存一下,要记得不要暴露出去,不然别人用你的 api 用的就是你的钱。把它复制下来,粘贴到 c c x 这里, 然后点右上角的详细配置,把这个服务类型换成 open ai 下拉,把这个模块化非常键给打开,然后保存配置,接下来再打开 ccc 位置, 一路下一步安装即可, 安装完成后打开它渠道,选择 open ai 这个点右上角的添加,选择自定义配置, 下面供应商名称随便填一个 a p e k, 填一二三四五六。然后这个 api 请求地址,我们回到 c c x, 把这个 api 地址复制过去, 点这个获取模型列表, 就能看到接入的 deepseek 了。选择模型下拉,把这个百万上下文窗口打开,然后保存配置,并且用它。 接下来就可以进入 codex 了。国内直连肯定是有一点慢的,耐心等待一下, 我这里自动登录了,退出重新登录,登录时选这个,使用其他方式登录, 然后输入刚才配置的一二三四五六。可以看到模型这里已经是自定义了,也就是在 c c c 区里配好的 d p c k。 正常的话这里就是 g p t 五点五。当然如果要正常使用的话,肯定是要给 d p c 可充一点钱的,不然就会出现这种五零三报错。最后提一嘴, 如果你有条件的话,还是建议使用 g p t 原声的,肯定是要比我们接入 d p c k 好 用, d p c k 只是胜在更便宜而已。好了,以上是本期全部内容了,我们下期再见。

花三分钟配好这四条,你的 ai 直接上一个档次!大家好,我是宇哥,又和大家见面了 呃,自从上期给大家讲了 codex 基础配置,呃,顺便带了一嘴卡帕西那个约束指令词,后台就大量私信问我指令词。今天这一期,我就重点给大家讲一下这个指令词。话不多说,咱步入正题, 你有没有这种崩溃,就让 ai 改一行代码,他咔咔一顿操作,把你整个项目给充够了,别急着砸键盘啊,今天这四条,就把它彻底治好! 这套指令是卡帕西本人都在用的,上期我一提,评论区和私信都刷爆了。今天咱不光给给原文,还手把手教你把它装到自己的 codex 里。 ai 写代码有四个绝症,第一,不懂装懂,瞎猜需求。第二,过度设计,越写越多。第三,乱写代码殃及无辜。第四,最可气的他假装完成了,其实根本没验证。 而卡巴西就用这四条指令,就把他四个毛病全给治好了。这套指令的文件名就叫 a 帧, md 啊,咱们先看他写了啥 军规第一条,先想着清楚再写核心,就一句,不准瞎假设,不确定地方一定要停下来问,你有好几种理解的时候先摆出来, 绝对不许闷头自己猜着干。军规第二条,能简单绝不复杂,直接解决问题的最少代码不准加你没要的功能,五十行能搞定的,别给整出二百行。 第三条,外科手术式改动,让他改哪他就只改哪,绝对不许顺手去优化你别的代码,每一行改动都对得上你的需求。 第四条,先定目标,让他自己验证。比如你说修个 bug 要翻译成先写一个能复现这个 bug 的 测试,然后把它跑通,让 ai 自己验证,完了再跟你说。搞定了, 接下来三十秒,手把手教你把这道指令词装到自己的口袋子里,接下来大家跟我一起做啊,非常简单,首先咱们打开左下角的设置, 然后找到个性化,然后自定义指令,然后我们选择复制我们的指令, 在这里复制,然后回到 code s, 我 们点粘贴,然后最后我们记得要保存, ok, 我 们的指令开始生效。 那咱们把这个约束指令配置好了啊,以后咱们就记住这四条军规,第一先想清楚,第二保持简单,第三精准改动,第四目标验证。记住这四条,我们就能治好 ai 的 四个绝症。 完整 t 字词太长,这里放不下啊!评论区扣指令,到时候发给大家,关注宇哥带你玩转 ai 时代,下期咱们讲 codex 隐藏配置。

先给 colex 一个粗略的视频想法,它会把想法产生脚本分镜和视觉规范。这一步决定视频的结构,而不是急着渲染。 colex 会生成一整套生产资产 logo, d e, s, i g n script, storyboard 和 html。 编辑这些文件,让后续修改变得清晰可控。 在 hyperframes 里, h t m o。 教授视频源文件 fire start auto generation 和 try 控制时间轴动画则有可定位的 time 精确处理。生成后先运行 int volatile 和 inspect。 头戴 x, 根据检查结果修复布局对比度和轨道问题。最后再预览或渲染 pollux。 斜向 hyberframes, 让它动起来。 no way to shake coffee brew through the night disappear roll on roll on no brake lights shadows fade 先给 colex 一个冲。

codex 的 安装教程往上一搜一大把,想看基础安装的朋友可以直接往后滑。今天咱们重点来讲 codex 加加, 这是一款开源插件,安装之后能让 codex 焕然一新。首先软件不用登录下载,安装简单配置就能直接使用,像动画制作工具 hyperframe 也能在 codex 里直接调用, 它的安装方法特别简单。打开 github, 搜索 codex 加加,下载并安装,插件会自动识别已装好的 codex, 全部安装完成,配置好对应的 a p i 就 可以上手使用了。下面进入详细安装教学。第一步,打开浏览器搜索 codex, 进入微软商店下载并安装, 安装完成后就会弹出 codex 界面,这个时候不用管它,我们继续。第二步,打开 github, 搜索 codex 加加,找到对应仓库下载文件,双击进行安装。 第三步,安装完成后,打开 codex 加加管理工具,点击配置,添加供应商,写上对应的供应商名字,方便后期管理。接入模式,选择纯 api, 我们接入 deep seek 协议,选择 chat completion, 然后我们去到 deep seek 官网,选择创建 api key, 创建 api key 名字随便,然后复制 api key 粘贴到配置里,接着选择接口文档,选择 base 下划线 u r o 这个地址,复制粘贴到配置项,然后保存,然后起用这个 api 设置,我们就可以在右上角重启 code 了。 在启动 codex 的 过程中,可能会出现等待时间过久等问题,可以耐心等待,如果等待时间过长,可以重启 codex, 多尝试几次一般都会成功。 如果进入到画面跟我是一样看不清字的,可以跟我一样设置,这可能是系统版本原因导致的兼容性问题,不过没关系,调整一下就可以。 设置完成后我们就可以返回对话窗口和 corex 里的 deepsea 沟通了,同时也解锁了插件,大家可以按需使用各类插件。这期内容就到这里,我们再见。

大家好,欢迎来到玲姐说 ai 这期视频,跟大家分享一套本地 tts 声音克隆和长文本配音能力的构建方法。 通过这个能力啊,我把自己的声音封装成为了 codex 可以 调用的生产力模块,它不仅可以读短句,还可以流畅地读长文。可以用它来做播客,也可以用它来做视频的旁白, 而且它可以服务于我正在构建的整个内容工厂的生产系统。先给大家分享一下我用这个本地的 t t s 的 能力生产出来的播客和长文本。这个是克隆我的声音制作出来的一个书本介绍的播客, 不要问我够不够自律,先问我现在在哪个档位,我需要升档还是降档。接着书里还有第二个很重要的观点,脑力工作不能按流水线节奏来安排。 这里是这本书最适合今天职场和创作者的一点,也是很多人最容易忽略的一点。 工业时代喜欢稳定、匀速、连续,因为流水线生产的是数量,可是高质量脑力工作生产的是判断、想法、创造和解决方案。打开 ai 之前,就可以拿它当一张小流程卡。 传统工作的底层想象来自工厂,稳定、匀速、连续、可复制,这个逻辑适合生产标准零件,但不适合生产好想法,写作、研究、决策、创作、学习都不是流水线。 你不能要求大脑从早上九点到晚上六点像传送带一样匀速吐出,高质量判断,超高效。里有一个很实用的建议,这个是克隆我的声音所生产出来的我的桌面伙伴,桌面宠物的一个配音, 救命搬家可以,别把我甩飞了,等等等等,我要被你晃晕了。 这个是用我的声音来讲解王国维的人生三境界,这也让我想到我们每个人去追寻人生理想和热爱的过程。就像王国维说的人生三重境界,第一重是昨夜西风凋敕树, 独上高楼,望尽天涯路。这个时候我们表达自己的向往,找到自己的出发点,找到人生的风帆,也找到自己的坐标。第二重是衣带渐宽终不悔, 未衣消得人憔悴。在追寻理想和热爱的过程中,我们学会牺牲,学会付出,也学会接受现实。在这个过程中, 其实我们的人生也像一个商增的过程,这个过程也是人成长的过程。 这个时候每个人的心境可能都会发生一些变化,但是内心的热爱以及对理想的坚定是没有变的。第三重是众里寻他千百度, 那人却在灯火阑珊处。现在我用这套能力所生产出来的声音文件质量都还是比较高的,都是处于一个可用的状态。 一提到配音,大家可能想到了很多云端的 t t s 的 模型,确实云端的 t t s 的 模型也挺好用的,但是它背后有个问题,就是成本的问题。 而且如果有的人在进一步考虑,可能觉得隐私和稳定性也是一个痛点。很多普通的 t t s 虽然可以用,但是它不能够读长的声音文本,而且它的这个声音啊,和博主本人的声音也不一样。 这期视频啊,我就分享一下整个的 skill 的 封装过程和它的一些关键的点在哪里。我的这套 t t s 的 skill, 它本质上是一个本地配音的能力层, 大家拆解下来我刚刚讲的那些使用场景啊,实际上它有以下几个核心的能力要素,第一个它能够实现文本转语音。第二个,它能够实现声音的克隆,给它一段声音参考,它就能够复刻这个真人版的声音。第三个,它能做长文拨课 很多语音啊,比如说 macos 自带的语音系统,它的声音呢就比较的机械化,没有那种真人感,而且它说短句还可以,一旦说到长文啊,就是那种很机械的声音,必须能够说长文,它比较自然,也就带来了第四个点,它会合适的语音分段, 就像人去理解这些话,像我们平时说话这种自然段句一样,进行合适的语义分段,让听众能够很好的接收这个音频的信息。隐身到第五个能力板块,就是它生成完成之后,它可以进行自解, 局部不自然的地方,它能够进行局部重申,完成整个声音文件的渲染。 所以这个其实就是这套 t t s。 能力背后隐藏的能力模块。大家可以看到这张图,这张图就是这套 t t s。 底层的路线图, 这里呢就是它应用的场景,大家可以去增加场景,这个呢就是它的整套的 context t t s 的 skill, 它可以用于生成短文本,也可以用于生成长文本。 它关键上用的是说不依赖云端的 t t s。 的 api 接口,而是使用的这两个 m l x beach 和 fish s 二 pro, 一 套本地的云系统,再加上本地的声音克隆的目录,最后经过处理,生成本地的音频。 其实安装的过程很简单,就记住一条安装主线,本地工程,把文件数在空目录上面构建出来,再加上本地的环境, python 在构建安装我刚刚讲的那两个模型, m l x 和 fish s a pro。 真正难的是其中一些容易翻车的点。第一个容易翻车的点就是这个声音的克隆。怎么做声音克隆呢?并不是说随便丢一段音频过去 最好你的声音本身的质量要高,而且最好你的这个参考音频啊,嗯,时长不要太长, 建议十二秒左右的短参考,长参考只作为备份。而且你给到的这个 reference text, 也就是对应的这个足字稿,必须和音频是足字对应的。 你给到的这个参考音频是单人声,没有背景音乐,而且没有加混响的,是你想重点参考的这个文本,所以这个参考的音频,它是决定你的课容上限的。给你想重点参考的这个文本,所以这个参考的音频,它是决定你的课容上限的。给大家好,欢迎来到玲姐说 ai 这期节目啊,是玲姐说 ai 频道开播一周年的特别节目,我给大家讲讲两个桂林女孩的故事。第二个非常容易翻车的点就是长文断点, 其实这个是非常重要的点,一开始我觉得只要把每一段切得更长,声音会更连贯,但实际上我发现它容易读着读着就断了。 你在做这个 t t s 文档的时候啊,它的这个分段不是说越长越好,而是要按人的说话的气口来切,每段最好只要一个意思,短一点,稳一点。而且你可以和 ai 沟通说, 我希望它能够按照人的这种口播或者是表达的方式去切,而不是完全按照语义来切。所以在优化的时候,你就需要强调说这个 t t s。 长文本的构建,它需要基于口播的这个特点去优化, 而且是要生成羽翼的短句。并且还有个重要的点,就是让它生成完成之后去逐段地检查,它,自己去审核自己。这里其实就是有一个很重要的技巧, 这个点不仅是在做这个 t t s gears 的 时候会用到,就是我们日常的工作中,我们很多的内容不一定要人去审核,当然人是最后的那个阀门,那个闸门, 但是在给人审之前百分之八十的工作,你可以先让 ai 审,让 ai 自己审查到他百分之八十满意之后再交给人来审,这样子也在提升 ai 的 审查能力,而且是降低人的工作量的。 所以在这个能力构建过程中,就是包括我说的这个长文本的过程中,我是让这个 t t s。 生成完成之后去审核的,它自己审查一遍,检查一遍有不有这个切断的语义,这个不自然的地方,让它自我审查,然后把这个内容修复掉。 我们先来听一下断点修复前的生英文稿,是这样子的,这也让我想到我们每个人去追寻人生理想和热爱。第一重是 听到没有,那个第一从前面搭了一下,他实际上就是出现了一个断点,而且文稿出现了跳跃,我们再听一下修复后的声音文稿,这也让我想到我们每个人去追寻人生理想和热爱的过程。 就像王国维说的人生三重境界,第一重是昨夜西风凋敕树 独上高楼。你看在第一层前面那一节画,它是完整的,而且是没有一个单这样跳跃的,它就完全是顺滑的一个状态。最后大家听到的诊断就是修掉了头尾这种多余的静音,然后把羽翼的停顿加上, 再把它整合成一个整集连贯的一个长文本的音频。这些操作完成了之后呢,你就可以和 codex 说,把上面我从文本到最后音频生成的整个过程,帮我封装为一个我可以长期附用的 skill, 可以 取名叫 t t s 或者是别的名字, 这样这个能力就可以反复地使用。那这个 t t s 的 能力呢?比如说我就附用到了我之前给大家也做过视频讲过的 codex pad 它的语音包。当然我在用这个 t t s 能力制作我说的那个 codex 的 宠物的语音包的时候,也遇到了一个坑,就是 当时我是想用它来给我实时的播报项目进度,同时使用我自己的这个声音文档。但是这里的坑就是 我如果说这个桌面宠物每次任务都实时的调用和复刻我的声音,它会比较大的占用我的系统的内存,太卡了,因为它是实时调用渲染的,因为有个克隆的原因,所以我当时的做法就是 提前生成了一批基于我声音的固定的语音频,运行的时候只播放不生成。我讲宠物这个例子呢,实际上是在讲我们在运用这个 tts 的 本地的 skill 的 能力的时候,我们也要基于场景去进行合理的定制。 这期视频表面上我是在讲 tts, 但本质上我是在讲如何把自己的声音变成我们 ai 内容工厂中一个可调用的模块。 当我们用其他的生产能力在封装为这样可调的模块,也是类似的思路。大家如果说是我的老观众的话,会发现我最近的更新频率有一点点降低了。一方面呢,确实啊,线下的这个项目和培训的事务可能比较忙。 另外一方面呢,我花了比较多的时间在升级我的生产力的系统和模块。我认为一个好的 ai 博主应该把自己的整个内容生产的过程也是 ai 原生的,就是用 ai 原生的能力 来深层讲解 ai 相关主题的内容,我认为这是一个好的 ai 科技博主 应该要做的事情。所以短期内你看到可能我的更新频率降低了一些,但是从长期来看,你会看到我的内容的生产频率和更新频率未来会有更高程度的增长。当然,作为一个碳基生物,我会给我的频道赋予更多的生命力和活力, 不会让大家觉得这是一个纯粹的 ai 的 频道,它是 ai 原声,但是它是 ai 原声在博主的创意和生命力的下面 构建出来的一个基于 ai 主题任何相关大家觉得感兴趣的内容的这么一个频道。同时呢,我也在我的 codex 上面基于我整个 tts 的 构建的过程,把我的整个的内容抽取了出来,形成了一份这一套 tts 能力的总结和从零开始复刻的指南。这 一个指南我会放在我的同名公众号里面,大家可以去直接使用,把它 copy 下来,放在自己的 codex 里面激活它,能够快速地把这套能力复刻到你自己的电脑上面。 今天的内容就分享到这里,如果觉得还不错,记得关注我的频道,给我的视频点个赞。打开你的小铃铛,我们下期视频再见啦!拜拜!

我发现 codex 的 手机连接功能还挺好用的,直接点击这个手机按钮,然后用另一个手机扫它,这个码直接可以连上了,可以看到手机上面包含了这个电脑上全部的这个项目,电脑上有的项目手机上都有, 我随便打开一个对话,这个是我让他去网上帮我收集一些素材,可以看到和电脑上是一样的,然后这个文件也是可以打开的, 这个还挺方便的,你虽然不在电脑边上,但是你也可以直接查看他输出的一个成果,这个还挺方便的,都能看到具体的一个内容。然后我再打开另一个,然后这边是给了他一个口播稿,然后直接让他给我做一个视频, 这边看到他输出了一个视频,我看能不能看。哇,这视频也是可以看的,还挺方便的,这样做的视频这个效果也挺不错的,挺好用的,点赞。

好,今天这期视频呢,主要给大家讲一下我们安装好 codex 过后的一些基础设置,为了后续更好的帮助我们工作呢,有些基础设置我们是需要 提前去做的,那第一个就是在这里我们的常规,大家可以先去选择这些工作模式,如果你是用于编程的话,你可以选择第一种,如果你是用于日常工作的话,你可以选择第二种,这是工作模式的一个选择 好,后续的这些可以按照它默认的设置就可以。第二个就是外观,外观这里的话有一个比较好用的,就是因为现在 codex 它已经支持宠物了,大家也可以去养自己的宠物,创建自己的宠物都可以的, 这是第二个。第三个在配置这里啊,配置这里呢?用户配置这里大家可以去选一下,就是第一个批准策略就是 on request, 第二个就是杀和设置这里我们选择我们的工作区就是 workspace right 就 可以了,那这是用户配置的一个设置。 好。第三个个性化啊,个性化,这里就是他的一个回复的语气,呃,大家可以去进行一个选择,那我自己选的就是比较务实的,是简洁、专注和直接,如果你喜欢亲和的话,也可以自己去进行一个选择。好,那么这是我们的一个个性化, 后面这里就起用记忆这里大家记得勾选上,这里记得勾选上好了,那么这是这一个的还有就是浏览器啊,允许他去控制我们的这个内核浏览器,因为后续他可以去操作我们浏览器,去帮我们做一些数据分析啊,包括一些其他的一些操作, 下面就是一个电脑操控这里,呃,我们一般建议可以去共享上这个就是 computer use, 就是 呃, codex 直接可以用我们的电脑去做一些这个查看,那我经常用的就是我让这个 codex 去帮我 登录我的小红书的后台以及抖音的后台,去帮我做一些粉丝画像和我这个账号的一些数据的一个分析,从而给我输出一份分析报告,包括 有关浏览器的扩展应用,这是在电脑操作这一块的啊,那么最后一个就是,呃,可以查看自己的已归党对话 这一块呢,就是我们在安装好 codex 过后呢,建议大家首先要去做的一些基础设置。好,那我们这期的视频就讲到这里,大家可以点赞关注加收藏,后续我们也会讲更多关于 ai 进的一些应用。

我今天用 codex 加 remotion 这个插件跟风去做了一个视频,然后我的文案是之前小红书的一篇文案,呃,提示词没有过多的一些修饰,就是让它根据这个文案去生成五分钟的视频,呃,视频已经做出来了,大家先看一下, 没有统一模板,我行如果没有拿到这些真实内容,就只能靠语言习惯去补全答案。第一个坑是数据根本没位进去,我行查不到财务制度,就会捏造制度条款查, 然后我们其实能感受到他的整个动画效果其实没有那么的漂亮,但是这也是他的一个非常大的优点和特点。 其次呢,这个语音好像也非常的僵硬啊,倒着说哈,这个语音其实它是调用的 mac 里面的一个本地 tts, 然后大家知道苹果本来做这些都,嗯,现在就那个样子,所以确实效果也就那样。但是我想说的是,不管是这个动画还是苹果自带的这个语音,恰恰是在 remotion 这个工作环境里面,它是一个非常大的一个优势。为什么呢?比如说我刚才这个 视频做出来之后,我想去啊替换掉他的这个麦克自带的 tts, 然后我就非常简单的去和 codex 告诉他,我说这个声音听起来非常的下头好,然后我现在有一个啊纤维的模型想用,然后 api 的 啊密奥,我告诉了他,他就直接通过我这句话把刚刚看到的这个视频替换成了一个新的有配音的这个视频效果,大家来感受一下,差异非常大, 真正麻烦的是半级固化数据,比如用户上传的私有知识库、公司规章、经营总账,各种制度文件格式各异,没有统一模板模型,如果没有拿到这些真实内容,就只 好这个是新的视频配音,那么其实在这个视频和这个视频去做对比的话,这两个视频除了配音不一样之外,其他的动画其实都是一模一样的。但也这也是为什么我觉得非常非常棒的地方,因为大家不知道发现没有,不管是这个视频里面的 这种文呃,图案文字,还是说我们刚刚去啊生成的新的 t t s 去给他当配音,他把每一个视频里的要素都变成了一个组建,这个其实也是 motion 工作的底层, 它其实并不是像传统的纹身视频、图身视频的这种软件,也不是说用的这种啊,更传统的一些生成视频的方式, remotion, 它本质上生成视频的逻辑,它就是去调用 ts、 react 这种前端的组建进行拼接, 那么就意味着我对于某一个组建如果说不喜欢不满意的话,我是可以换掉它的。如果我们再往后面去学习,其实我们是可以发现, 比如说在这些时间点上面,它生成之后哈我就可以告诉他我在啊,几分几秒啊,或者说在某一个固定的位置,我想去插插入进去什么样的文字,然后插入什么样的 react 组件,然后想去插入什么样一些模板,甚至于把我预先设置好的 转场的图片呀,视频啊都放进去,而且我直接可以通过语言告诉我需要在哪个时间点去做什么,它其实整个运行逻辑 其实是有点像 skill, 就是 把它工程化、参数化啊,但是呢,就是它比 skill 更强的点是什么呢?就是你可以在一个自然语言交互的过程当中,基于一个现成的视频去告诉他一二三四五六七八九五要去改什么, 而不是每一次就要去写一个新的 skill, 你 直接可以用语言去进行主键的替换,所以这个我认为是 codex 加 remote 有 非常棒的一点,因为 他把这个视频的所有的要素都变成了主键,不管是你看到的文字、图片、视频、配音都可以替换掉,真的非常赞。

你安装的 code 叉是不是也这样?没有 open ai 的 账号就不能正常使用?本视频教你,没有国外的 open ai 账号也能正常使用 code 叉。这里我们打开电脑上自带的这个微软应用商店,然后在这里搜索 code 叉,搜索之后,这里的话我们选选择这一个图标的, 然后这里是已经安装好的,所以它显示打开没有安的话,我们点击获取,等它安装结束即可。安装结束之后呢,我们点击这里, 然后找到这个 code 叉,然后这个 code 叉它默认的话是使用呃 open a a 的 账号来进行登录,我们在国内没办法正常使用,所以的话我们先不要打开它,我们去到这个 来到这个 c c switch 的 啊界面之后呢,我们选择这里点击一下,然后等它来到这里之后,我们直接划到这个页面最底下, 这里我们根据自己的电脑系统的版本来进行下载即可。 windows 的 话我们就直接下载这一个,然后这里是因为已经下载过了,所以我就不点击下载了。然后还有我们也要如果是 mini max 的 大模型,大模型的话我们就选择下载,把这个也下载下来, 然后这里我也是已经下载,我们就点击这里下载就好。这里我已经下载好了,我们就不继续下载了。下载之后的话,我们就直接去这边打开吧这里然后这个是 c c switch 的 开源项目,我们直接双击运行它, 我们就直接点击下一步,然后这里是让我们去选择这个安装路径,这里的话我把它安装在 c 盘,安装在 d 盘吧, 我直接点击安装,点击下一步,然后这里直接点击安装,然后这里就等它安装结束,这里我们把这个勾选去掉,然后点击结束,结束之后这个 这个我们 mini max 的是使用 mini max 大 模型才才用到的,如果不是 mini max 大 模型的话,需要去选择其他的,可以自己去找相应的开源项目,这里我就直接把它解压, 这里剪下之后的话,我们直接在这里,然后打开这个,这里它有需要你安装的,然后我们本地的话是需要安装这个 node js, 这个的话可以看我上一期的视频去安装,然后这里的话我们就直接把这个命令复制一下, 然后我们点击这里,我们直接输入 cmd, 然后回车,在弹出这个页面里,我们直接复制粘贴一下,然后回车。好,它现在已经在安开始安装依赖了,然后我们这里就会多了一个文件夹, ok, 它显示已经安装,音量已经结束。好,我们现在就把它这个点给关闭掉,然后我们点击这个,我们点击运行这里,运行到这里的话我们就不用管,然后我们就打开我们的安装的那个 cs 微棋, 这个是我们安装 cs 微棋的这个图标,我们直接双击它, 然后这里你如果是第一次使用的话,那默认是这里,然后我们要选择这一个,这里我还是,虽然我已经重新安装了,但是因为之前我是安装过的,所以我这边已经是已经配置好的, 如果是第一次使用的话,我们是需要点击,我直接把这个删掉吧,这个删掉先启动下这个,把这个给删掉。 好,我们现在来重新配置一下,这里的话我们选择这里的 open a, 然后之后我们点击这里的加号,这里我们供应商这些我们就不用管,这里我们就随便填我这里我就填这个 mini max 吧,因为我自己用的是这个模型,然后这里的 api key 我 们也是随便填 这里的请求地址,请求地址的话我们就是把这个运行在这里这里给复制一下,然后把它粘贴到这里来, 这里的话我们模型的话我们选择这里都复制一下 往下滑,这里我们是一定要勾选上,勾选上之后我们就直接点击添加啊,我们现在这里已经添加,然后进这里的话,我们点击这个启动, ok, 已经切换了,那这里我们可以进行测试,这里测试应该是会报错的,因为这里我们还没有填这个东西,就我们还是去到这个 这里,这里面我们是需要把这个配置文件,这个我们先复制一份, 然后把这里给改掉啊,这里的话我们把后面这里给去掉, 我们点击四啊,这里我们一定是要这个点 e n v 的 这样子的格式,然后之后我们点击用我们的这个记事本打开,打开之后的话,这个是我要这里要填入你自己的 mini mag 那 个 api key, 然后每个人我们可以自己去获取一下就行了,那这里有因为 api key 比较私密,所以的话 我就不让大家看到了,把它删掉,然后我去把我的给粘贴过来复制一下 啊,然后这里我已经把这个秘钥给配进去了,配进去之后呢,我们这个界面还是要关闭重启一下, 就这个这个界面,我们直接把它给关闭掉,然后我们就点击这个双击一下,等它启动起来,点击运行,因为它现在已经启动起来了。启动起来之后呢,我们这里再点击一下这个测试, 因为他现在表表示已经正常能正常使用了。然后呢正常能正常使用之后,我们就可以把它给擦掉了。然后现在我们再打开我们的这个 color 叉,然后我现在问一下他,你的 他现在已经回复我了,然后其实他这个回复呢也是在这里会看到的。 然后最后界面我们是不能关闭的,不然关闭的话我们这个 qq 叉就不能正常使用了。我的这个 qq 叉默认的话是其实我们安装的时候它默认都是英文的,然后我们要如果要改变这个,呃四 plus, 我 们就选择这个 setting, 然后找到这里,就这里的我们直接找到往下滑这里我们把它改成中文就行了,这样子我们的 control 它就能正常的使用了。

让你志能游天的 ai 动起手来吧!把这个文件夹里的文件按照类别整理好,按顺序改成项目一。项目二,咦,每天早上九点,搜集前一天的 ai 行业资讯,发到群里看,总结这个文档里的内容,生成 ppt。 这期避开专业难懂的术语,让小白也能够流畅运用上扣带,让你的工作效率和创新全面提升。我们先认识它,再到如何使用安装,用六个按键一步步的掌握它。其实词和小技巧呢,我也总结到了,视频里出发 扣带斯和可劳扣的它们呢,是类似的,都是 ai 的 编程工具,只不过一个呢,是 oppo ai 家的,默认的是 gpt 模型的,但你也可以在里面去更换你自己的模型,但你也可以在里面去更换你自己的模型。 这两个阶段性地成为目前好的必然模式。但它们适合使用的场景呢,会有点不同。 ko 代斯,它呢,就适合我用来快速整理文档,处理一些。这种本地的任务界面,对于小白来说会比较友好一点,就很适合初学者或者是我们日常的办公场景。因为是 open ai 的 嘛,所以呢,我们也可以直接在里面调用 j p e m 叉二来生成图片,而 可牢扣的会比较适合追求高质量的创作用户,并且 c c 的 知名度会高一点,所以不论哪种语言,你都能找到关于它的类似教程。 之前还在说 c c 可以 用手机来控制 c c, 在 前几天也出了手机端,二者的功能差距又缩小了。 c c 的 小白使用教程呢,我们之前也聊过,有兴趣的可以去复习一下。那我们要使用 c c, 我 们只需要一个 g p 的 账号, 免费的呢,也是可以用的,只不过它的额度会少一点,会有三种不同的使用路径,就是使用哪种方法来开启你的扣袋子。 c r i 呢,会在你本地去开发操作,你的本地项目就比较适合开发者深度来使用,因为需要一些命令行的使用,所以会有一丢丢的小难度。那这个呢,就是把扣袋子装进你的代码编辑器里, 像 vivo studio code, 反重力这种的,而我们普通用户呢,直接选择这个就可以了,不用懂。命令行,适合大多数人来使用, ok, 我 们来进行安装,我们按照它的指引步骤来操作就好了。进来之后呢,我们可以看到它的整个页面跟我们常用的 ai 工具还是很像的。而左边的这个导航栏就是你的文件柜, 所有的功能入口都会在这里去显示,而中间的呢就是我们对话交流的地方,而右边这里就是你小助理给你交作业的地方,成果的展示区域。而左边的这个导航栏,每一个入口都是一个工作流。在这里重点的呢就是这两个 来快速对话,就是主打一个随问随答,碎片式的对话,就像你给他一个英文的演讲稿件,然后让他给我翻译出来,哎,还挺到位的。像这种只是问问问题,写写代码和 check gdp 呢,其实相差不大。而这个项目呢,它就更适合一些长线的 摸不准,需要高度上下分连贯的这种复杂任务。点击这里我们可以看到这里呢会有两个选项,这个呢是在你默认的路径下新建一个空白的文件夹, 而另一个就是说打开你电脑上的现有文件夹,在这个基础上再去操作。比如给他一个本地的文档,里面呢是一堆的发票图片,那我们在这个对话框的下面也可以看到,我现在是在这个文件夹里进行操作的,这就触碰了沙箱机制,只能操作本地选中的文件夹,不能操作系统其他的文件。那我们现在给他要求根据这几张发票, 然后给我按照金额重新命名一下文件。当然只有这些呢,还是不够的,我们还需要给他开放对应的权限,那我们可以点击这里可以看到这里有三个模式,分别是你只能在当前的文件夹下来修改或者执行, 如果需要联网或者说触碰这个文件夹以外的东西,需要来向我们申请,我们同意,他呢才能继续执行。而这个呢,恰恰相反,他可以自由的读取、写入,修改或者删除目标范围内的程序。 自主性呢会比较高一些,但也会有一定的风险。在我在这种简单的任务下呢,会选择这个模式,简而言之呢,就是 ai 会自主的帮你筛查这个有没有危险,像安装常规的工具这种明显安全的操作,它呢就会直接上手了, 不会再来询问你了。 ok, 他 也操作好了,我们来看一下,那整体呢,也是根据我的这个内容来命名的,还是不错的。那除了帮我们整理本地的文档,还可以在我们授权的情况下,在你的电脑上来执行安装的操作。比如最近爆火,但有点上手门槛了。 cloud code, 我 们在 d 盘新建一个文件夹, 然后回到这个 codex 里面,再把这个文件夹给它呼唤出来。那这步的意思呢,就是让 c c 在 这里面进行操作,那我直接给他说帮我安装一个 colocode, 那 我们稍等一下。好,他现在呢说已经安装好了,我们来启动一下。哦,是可以的了,当然也包括 node js, git 这种我们日常生活中经常用到的依赖。 好,现在你用 codex 整理了你本地的文件夹,大大缩短了你的时间,也把有点安装困难的软件安装到了你的电脑上。对于听到 ai 编程就望而却步的,棒的就不止一点点了。当然 ai 编程嘛,也不能把它的能力举现在这里来, 我们一起做一个芝士机械超玩盲盒,咱们就都是原始谷的动画了。那我们呢,现在在这里选择好它原始的位置,先点击这个加号,那最上面的这个呢,就是我们上传文件, ppt, excel 图片,我们也想让它们进入到这个转化里, 就在这里上传,和我们直接拖拽是一个效果。那中间这个计划模式,在这个模式下呢,他不会立刻来改动我们的文件,而是先帮我列出一个详细的计划,就比较适合复杂项目,或者是你还没有思路的情况。 那右边这里呢,是用来更换模型的,我觉得五点五还是比较好用的,这里呢我就不更换,还有对应的推理强度,也可以在这里去更改。那我现在告诉他我的一些具体要求, 如果你有了一定的构思之后,也可以一起告诉他,当然如果没有的话,直接给他说我们最后想要一个什么效果,他呢也会一步步的引导我们来做出最后的成品,好开始帮我们来构思整个架构了。 哎,他现在问我盲盒系列规模要按照什么来设计?规模怎么搭配?那我们把鼠标放到这个小符号的上面,也会有个更详尽的一个介绍。好,那我在这里选择第一个, 他现在呢还是用这种选择方式来一步步引导我们表达出我们想要的东西,那我们顺着他的想法来就好了。那都选好之后呢,他也给了我一个整体的框架,我大概看了一下还是不错的,那觉得 ok 了,我们就可以让他开始执行,当然我们有需要更改地方,我们直接在这里提出要求就好了,那我们现在同意执行。 ok, 他 现在也在运行中了,在这个思考的过程中呢,我突然想起来,我想让他滑动的时候有一个光效,那我直接在这里提出我的要求。 哎,他现在啊根本就没有办法发出去,而是在这个地方排着这个情况呢,他会在这个任务完成之后再来执行我们现在的这个任务,但是不行啊,我现在就让他考虑到这个要求,并且加进去,那我就点击这里的这个按钮,他呢就插队到了当前的这个任务中, 而路由思呢也会考虑到我们这个要求继续执行,这就是一个插队的小技巧了。好,他现在说呢是可以了,我们先不着急,我们把鼠标放到这个小圆圈上,我们就能观察到我们这个窗口一共用了百分之几。路由思在快满的时候呢,它也会自动的来进行压缩上下文,但因为上下文太多的话,路由思就会表现的不那么聪明了, 那我们就可以手动的来进行压缩,在这里我们打斜杠压缩就好了,他呢就会把上面的聊天记录进行精简,但更细节的东西呢,他也就会不再记录了。 ok, 我 们来看一下我们刚才生成的这小网站,这个例子动销交互界面 还是不错的,那如何实现多任务并行进行呢?那我在本地选择一个项目文件里面呢,有往期的图片还有视频,在这里输入我的要求,把里面按照类别给我分类。好, 那我们再开一个,我要这个把文件里的图片和视频根据内容说明,你再来一个吧,把视频分离出来,音频, ok, 你 看他们在这里努力的转圈圈,我们来看一下结果,这个类别是分为好的,这里是视频的,还有图片的。不得不说啊,他这个名字和内容还起的挺相符的,所以说这里呢,他的每次对话都是独立的,不会再与其他的工作内容产生深度的关联,但都会有权限查看当前的文件夹内容。 到这里我们日常使用是 ok 的 了。更进阶一点的呢,就是扣带斯的插件技能 m c p 这三个词就是小白最大的路虎了,其实一句话就能解释清楚, 插件呢,就是给扣带斯装了一个能力包,比如装了表格插件,它呢就会处理 excel。 而技能 skill 大家都很熟悉了,就是一套固定的工作流程,可以根据我自己的风格来写一篇技术教程。 m c p 就是 连接外部的通用通道,比如我要用扣带斯做一个这样的效果,通过自然语言创建动画视频的技能。包好,我先给他一个文件夹, 然后把要求现在都给他,如果你有想要的效果,那我们就点击这里上传,然后把参考一并发给他。 ok, 他 现在呢是开始工作了, 里面需要的什么依赖啊,组建都不需要,我们再去手动的去添加,他呢都会帮助我们去一步步的完成。好,他现在运行完毕了,我们打开这个呢,是 windows 默认的浏览器浏览一下, 你在这里可以随意的来调节这个动画了,因为在一开始的时候,我提示词中已经提到了提供可以配置的参数项,那我们调节一下。 ok, 我 们关掉背景,那想要这种透明的效果呢?参数的配置是这些,那我们最后给他宣传好就 ok 了。 个人建议,一开始呢,什么插件我们都不要慌,先用它内置能力,等你明确知道了我需要库代词,去安装某个工具能力的时候, 再去插件页寻找也是来得及的,大家有兴趣的我们可以单独出一期,详细聊一聊。说了这么多,其实你也发现了, ai 现在就不只是答疑解惑的工 具了,它呢挑出了一个被动执行的命令曲线,是可以理解你的意图,帮助你完成复杂任务的智能伙伴。而每次操作呢,也成为了我们学习、创新和突破的机会。好了,喜欢这种内容的朋友呢,我们下次见。

三分钟带你搞定 codex 客户端配置。如果你是第一次用 codex, 不知道从哪开始,这条照着做就行。 这期我们解决三个问题,配置文件在哪? p 怎么填?模型怎么选? codex 客户端可以读取项目、修改代码、运行命令。开始前准备三样东西, codex 客户端可用的 apikey, 一个本地项目文件夹。 注意 apikey 不要发给别人,也不要提交到公开仓库。接下来找到 codex 的 配置文件,一般是在用户目录下的 codex 配置目录里, 你要找的核心文件通常叫 config tomel, 如果没有,可以新建一个。这个文件的作用就是告诉 codex 用哪个模型连接哪个服务,默认怎么运行。第一项是模型,比如这里填写你要使用的模型名称,模型名要写准确。第二项是 a p i t, 更推荐放到环境变量里,不要直接写死在配置文件。 第三项是工作目录,新手建议先选一个测试项目,配置完成后,打开 codex 客户端,选择刚才的项目目录,先让他阅读项目结构,比如输入,请帮我阅读这个项目结构,并告诉我主要文件的作用。 如果他能正常读取文件,并解释说明基础连接和目录权限没问题。再是一个小修改,请帮我给 vtome 增加一个项目说明,如果能生成修改结果,说明文件编辑权限也正常。新手最常见的坑有三个 t 没生效,模型名称写错,没有打开项目跟目录。 所以排查问题时,先看这三项环境变量、模型名称、项目目录。到这里, codex 客户端的基础配置就完成了。下一期讲怎么让 codex 更安全地改代码,不怕改坏项目。

codex 现在可以完美接入国产模型了,而且插件等全功能都可以解锁。我现在接入的就是 deepsea, 速度快而且便宜。主要用到的两个开源项目,第一个是 c c switch, 原来用 cloud code 的 也是使用它接入其他模型, 最新版本支持了 codex 一 键接入国产版本型,非常方便。选择 codex 后,点击这里的加号添加供应商,然后可以直接选择 deepsea。 这里所有的配置已经预制好了,不需要更改。接下来就是在 deepsea a p i 官网复制自己的 a p i k 保存即可,然后在设置中找到路由,开启路由选项后,所有的配置就都搞定了。接下来重启 c c switch 和 codex, 让配置生效。看,我这里已经成功接入了 deepsea 项目,它可以解锁需要登录的插件等功 功能。就这个 codex 加加配置到自己的电脑之后就可以看到 codex 加加这个启动项以后就可以直接从这里启动,不要直接打开 codex。 现在插件等功能都解锁了,国产模型可以完整的使用 codex 所有功能。好了,关注我,了解更多爱干货,感谢大家观看!

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!