还不会用 codex 接入国产模型 d p c v 四?这期视频之雪手把手教你怎么在国内用上最近爆火的 ai 一 阵场 codex 无需 g p t, 国内用户直连,不仅不花一分钱教你安装 codex 配置性价比之王,国产模型 d p c v 四。更重要的是,我还教你如何直接解锁 codex 的 插件。核心功能 microsoft 的 computer use 和浏览器的自动化插件也是能用的,而我们只需要一个开源项目。而对于手里有 gpt 账号的同学,如果你的额度不够用了,你完全可以在后台把模型切换成 zip, 这样也可以完成我们的代码编辑和日常工作, 甚至还能手机远程操作, computer use 直接操作我的电脑发文件。重点是不用再心疼 toker 了。说实话,库黛斯已经帮我做了一个多月的 ppt, 以及整理短视频的素材和资料,这些重复又复杂的工作也确实给我减少了很多的日常工作量,所以我个人也真心希望大家能够了解和运用上它。 相比另一个最近很火的智能 t, 卡罗特的扣带 s 呢,会对新手来说比较友好一些,而且完全不用担心封号的问题。但它也不是完全没有门槛,很多人都卡在了使用前的第一步,还得开个 gpt 会员,每天二十刀,还得折腾半天,网络麻烦又不稳定。所以今天之雪呢,不仅教你安装,还要教你如何用最低成本省最多的设计, 把 dpc 为四给它接入到里面。我呢也给大家准备好了扣带 s 安装包和文字版教程。废话不多说,点赞、收藏、关注我们正式开始, 首先就需要我们先打开电脑,嗯,算了,不会还有不会的吧?开个玩笑,我们回归主题,我们先要打开 codex 官网下安装包,那打开这个页面之后呢,根据你的操作系统进行选择,我这里呢就用 windows 系统为例,那我们双击安装包, 那按照它的提示安装就可以了,而这个过程中呢,也基本上不需要我们再去配置什么。那安装完成之后, codex 的 窗口一般会自动打开,当 当它打开之后,我们先不要着急去登录,因为它有两种方式,第一种呢,扣贷,它是支持 g p t 账号登录的,适合已经订阅 pro 或者是 plus 付费计划的同学,它本身就自带扣贷的使用额度。而第二种呢,就是用 api king 登录的方式,什么意思呢? codex 呢,它是按照 a p i 实际用量计费,而通过 a p i 形式使用的话,全程是不需要账号和手机验证的,所以我们就可以通过这个方式来解决账号和验证的这两个问题。不过给大家解释一下, codex 呢,它是默认只支持 openai 的 a p i, 而 openai 之外的模型,像 deepsea, kimi, mini max 这些模型呢,是不能直接接入 codex 的, 就可以理解成它们的语言是不通的。 codex 这边只听懂粤语,而这个翻译官的作用就是把 其他模型的回答实时翻译成 codex, 能听懂能识别的格式。目前市面上比较火的接入模型工具呢,有 codex 加加 icord cc switch。 我 身边用 cc switch 接入国产模型会比较多一点,使用 cc switch 接入 codex 里面,它是没有问题的,但是没有办法直接解锁 codex 里的插件功能,综合考虑软件的配置难度,核对 codex 的 默契程度。 我这次呢就会使用 cosplay 加加,它的配置过程对于新手来说会比较友好一些,那主要也是因为它能解锁 cosplay 插件功能, cosplay 加加呢,它也是给它上一个开源软件,不过有一些朋友还不知道什么是给它它呢,就是各个地区的程序员来存放分享代码的地方, 很多的开源软件他们都把代码和包放在这里,我们现在看到的这个页面 releases 就 可以理解成这个软件的发布页面了,当每一次作者更新的新版本,它呢就会发布到这里,那我们往下滑,找到这个叫 s word 的 地方,这里呢就放着这个 codex 加加的版本安装包, 这里呢?我是 windows 系统,那我就找到对应的 e s e mac 系统的话就找到对应的 mac 点 d m j。 当我们完成之后,我们就双击这个文件,然后跟着导向提示 一步步的跟着它走。安装路径默认的是 c 盘,比较紧张的话,我们可以安装过程中把它的路径改到其他的盘。装好之后呢,我们的桌面上就会出现两个工具,一个叫 koether 加加,一个叫 koether 加加管理工具, 看到这两个呢就说明你的工具已经完成了。有它之后,我们就可以把三方的模型接入到 koether 里面,比如 deepsea, kimi, 甚至你本地的小模型都可以通过这个方式接入到 koether 里面去使用。 ok, 接入模型的工具我们现在是有了,现在呢还需要大模型的 api, 这里呢我接入是 deepstack, 如果你还没有现成的 api key, 那 我们就需要去对应了,创建一个,你又说了我没创过,我咋创? 我们打开 deepstack, 这里会有一个 api 的 开放平台,我们先登录一下,那完成之后,这里呢就会展示我们账户的一个余额,而 deepsea api 呢是按照用量计费的,所以我们的账户里呢需要有一点点的余额。我们在左边菜单里面找到 api 键这一项,然后我们点进去创建一个 api, 那 在这里我们随便起个名字就可以了。然后我们创建这个时候呢,我们的页面上就会显示出这么一串 s k 开头的密钥,这个就是我们要用到的 api 键了, 这里呢需要特别注意一下,这串密钥呢只会完整的显示一次,一旦你关掉这个窗口之后呢,我们就看不到了,当然弄丢了也没有关系,我们直接过来再创建一个就可以了。 自学小题型, a p i can 相当于你账户的密码,不要随便给别人哦。之后我们在左边打开接口的这个文档,然后再复制这一段的 u r i 地址,一会是我们要用的,这个时候就需要我们打开刚才的扣带子加加管理工具了,然后我们点击配置, 然后添加上供应商。那这里怎么去设置呢?我们只需要把你接入的大模型名称给它填进去,然后将这个地方的接入方式改为 a p i。 接入 配置模型呢,这里就填 deepsafe v 四 pro 更多选项,这里就填你需要的模型名称,那我这里就填 pro, 下方呢就是填刚才我们创建好的 api key 这个地方呢,我们就改成这个,这样我们的 deepsafe 就 已经配置好了,我们保存,然后在 code 加加管理工具这里呢,我们起用我们的 code, 当我们以后要用 deepsafe 这个模型的话,也需要在这个地方启动 code, 不要直接打开 code 这里呢,我打开的可能会有点慢,我们耐心等待一下 好进来了,然后点开这个模型的列表,如果我们模型配置的没有问题的话,我们就可以在这里看到我们已经接入好的模型了。那我选中这个 pro 模型,随便发一句话给他,只要扣带斯,他能够正常的回复。恭喜你,说明整个接入流程是已经跑通了。在整个配置过程中呢,我们没有登录任何的 open i 账号, 也没有去填写 gpt 的 定位信息,但是他现在还是可以正常的来回复我们。所以现在你的扣带斯走的就已经不是 gpt 的 模型了, 而是已经成功连接上了 deepsea v 四 pro 模型。而且刚才提到的不能用插件问题,我们现在在左侧插件的状态也是解锁的。我们不光能用第三方模型来跑扣代斯,我们还可以用扣代斯的插件能力。这里有个细节,我们接受国产模型的话,尽量不要开特别的网络环境,有可能会报错。 好,我们现在来测试一下扣代斯接入 deepsea 模型之后,它的效果又怎么样呢?很多同学说扣代斯接入国产模型之后,它变慢了也好多,那我现在让他给我写一个动态网页的前端 demo, 然后我把这些复杂要求发给他。哎,你是资深的 ui 前端工程师,基于巴拉巴拉巴拉适配哪里视觉模块交互还是比较详细的,然后我们发给他, ok, 他 现在是已经出来结果了,然后我们来瞧瞧你,瞧瞧这出来的效果。这个轮播图中的文案搭配也是很不错的,遇见你的梦中情猫, 而且我在提示词中完全没有提到我要什么文案,他是自主帮我规划设计的网页的整体布局。虽然这里呢有些图片还是有些不太对版,但是也是可以接受的吧,给他指令,让他直接去进行修改就好了,至少像这种前端项目,网页可是画的 demo, 他 完全可以轻松的去拿捏。 如果你有更详细的提示词和思路,那它做出来的效果也会更惊艳。而 deepsea v 四 pro 通过 koether 加加介入之后,其实它核心适配的还是文本模型,毕竟不是多模态。而下一步我们要测的让 koether 直接通过 a p i 去调用图片模型和视频模型,看看能不能像智能助手一样去自动调用不同的模型, 按照步骤把一套任务给它跑通。来测试一下 deep six v 四接入 colts 之后它的 a 振幅能力。简单来说呢,就是让 colts 去充当 ai 的 总指挥,你给他一个目标任务,让他自动去调用各种图片视频的 api 接口,去自己按照步骤把一套多模态的任务跑通。 比如第一步,我先让他调用纹身图模型去生成一张图片,再拿图片去进行编辑调用视频模型的整套流程。并且中间呢,还要自己去调节接口的调用,结果的提取任务的循环,包括最后他的报错处理,这样测试出来的效果才接近 a 政策的真实实力。好,我们直接来看看执行效果。比如这个任务 生成一个视频,一个红色玻璃球位于纯白桌面上,我要他逐渐变成蓝色的立方体,而在这个过程中呢,又需要他缓慢的去旋转。那第一步,就让他去调用纹身图模型,然后去生成一张原始的图片。那第二步,我要他拿着这张图片去传给图片编辑模型,然后进行二次的修改。 接下来呢,我就让它去自动调用视频模型,然后把最后修改成的图片生成视频。而在这个过程中呢,还要自己去处理接口,调用结果提取、暴躁处理和状态轮询。我们把完整的任务一次性的给到扣代斯, 我们可以看到它在这里已经开始按照我们的步骤调用接口了。第一步,它先调用了 c g m 五点零的图片模型,生成了这张原始图片,并且成功拿到了图片的 u r i。 那 第二步,它又按照步骤把这张图片继续传给图片的编辑模型, 生成了一个新的版本。 ok, 他 现在又调用了 cds 视频模型去创建了一个视频的生成任务,他还在这里自动轮询任务的状态,也就是隔一段时间自己自查一次,看看视频有没有生成完成。他现在呢,任务是已经完成了, 还把整个执行的过程都整理成了一份 macd 报告。放在这里。细心的同学应该也发现了,这里我调用的所有 a p i 接口都是国产的图片和视频模型,主要是为了让大家以后更方便去使用和调用 a p i 的 接口,那知许都这么贴心了,来个点赞收藏关注不过分吧?好,我们现在来看一下最终的效果怎么样,你瞅瞅也是不错的, 可以看到完全都是按照我们的要求去生成视频的。一个红色的玻璃球位于纯白的桌面上,哎,逐渐变成蓝色立方体,在这个过程中呢,又要缓慢的旋转,当然了,我只是做了一个演示,效果还是比较简单的,如果你有更详细的提示词和思路,它做出来的效果呢,肯定会更好。 这就说明 dbic v 四 pro 接入到扣带词里面,不仅能够完成各种任务,还具备了任务的编排能力,也就是我们常说的 a 整数能力。 你呢就可以理解成只给他下达一个任务,他呢就能够理解你的需求,调用工具,然后自我纠错,整理结果,直到最终把任务给你完成。整个过程呢,也不需要你一步步的去动手操作了,这也是扣代斯这一类 ai agent 和工具有价值的地方。最后呢,再补充一个很多人遇到的一个问题, 就如果我后面不想用 api 模式了,我想切回到原来的账号模式,该怎么恢复?方法呢?也很简单,打开扣代斯加加管理工具,进入到配置页面里面, 切换到默认中转模式,然后这里就 ok 了。当我们重新打开 cosine 之后呢,它就会恢复到原来的默认模式。这里就要注意一下,我们在使用 cosine 时候,就不要再用 cosine 加加来启动 cosine, 然后再重新开一下 cosine 了,这样呢,就可以继续使用原来的账号登录方式,如果后面你又想切回到 api 模式,也不用担心,我们可以重新打开 cosine, 加加管理工具 供应商,切回到 dbse 模式就可以了。而大家在使用的过程中呢,也要灵活去运用模型,因为每个模型都有它独特的特点,看个人需求就可以了。最后我要说一下,大家在使用文案的过程中,要把 ai 当成一个拐杖,去协助你走路,去做一些花费时间,花费精力这种重复性很高的工作, 而你却负责更清晰的逻辑,提出更高质量的 problems。 而扣代码和 dbse, 他 们就负责读懂你的想法。人机学同,这才是效率翻倍的有效密码。 好!以上就是这一期 cos 零成本使用的完整教程,如果你照着视频去做,如果中间出现了报错或者是一些问题,也可以把报错截图发到评论区,哪个问题出现的比较多,我呢也单独出一期帮大家解决这些常见问题的教程,那这期视频就到这里了,觉得有用的话记得点赞收藏、关注,下次见!
粉丝2.0万获赞9.8万

分享一个国内免费使用 codex 的 方法,我说的可不是只能用几天或者几周的短期薅羊毛方案,而是一个长期免费的稳定方案。本期视频是一个手把手的保姆级教程,我们把 codex 跟 hermes agent 的 模型替换成免费的 api, 零成本获得一线模型的 agent 体验, 足够覆盖日常任务。这次主要用到两个工具,一个是用于给 codex 换模型的开源软件 codex 加加,另外一个是大模型 api agnes。 agnes 是 全球权威榜单前十的 ai 模型公司, 开放了三款旗舰全模态模型的免费调用,分别覆盖了文本与 agent, 图片生成,还有视频生成三项核心能力。更棒的是这家头部模型公司的全模态模型可以长期免费使用。好,话不多说,我们直接开始。 我们来到 gitlab, 找到这个开源软件 codex 加加,这是一个可以给 codex 换模型的辅助工具。接下来我们来到 codex 加加管理控制台,在供应商配置这里,点击添加名称,填写 agnes 接入方式,选择纯 api 贝字 u r l 填写这一串。接下来是 api key, 我 们来到阿克尼斯的 api 平台,点击创建密钥,把创建的密钥复制一下,填写到 api key 这里。上游协议选择 chat 模型列表这里点击从上游获取,最后点击保存, 点击右上角的重启 codex。 然后我们进入到 codex 模型这里选择阿克尼斯二点零 flash, 打个招呼这里给到了回复就配置完成了。 arkness 二点零 flash 有 很不错的 agent 驱动能力,我准备用几个 skills 的 案例来实测一下。这里我想到一个需求,我们把 aknes 的 api 接入了 codex, 没有使用官网订阅,这样会有个小问题,就是不能使用 codex 内置的图像生成 skill。 所以 下一步我准备自制一个画图 skill 来代替内置的图像生成。 用好 agnes 的 a p i 覆盖全模态能力,提供图像生成模型 agnes image 二点一 flash 的 免费 a p i 调用。接下来我们就让 codex 先去官网学习一下怎么调用这个生图的 a p i。 在 之前的视频里面,我介绍过一个非常省 token 的 浏览器自动化方案, playrite c l i。 这里我新建了一个项目文件夹,然后进入文件夹右键,在终端打开, 依次执行这两个命令。配置好 playwrite c l i 还有对应的 skill。 这里有一点要注意,在 codex 里面使用 skill 还要做一个额外的配置,就是在项目文件夹里把存放 skill 的 文件夹的名字从点 cloud 修改成点 codex。 我们来到 codex, 点击进入项目工作,选择我们刚才创建的项目文件夹,输入斜线,拉起 playwrite c l i skill, 然后输入提示词,你用浏览器搜索,并且去官网学习一下 agnes image 二点一 flash 模型的调用文档,使用 hide 的 persistent 参数,这样我能看到你的学习过程。 ai 先读取了 playwrite c l i 技能来学习怎么驱动浏览器,然后打开了我电脑上的 chrome, 使用谷歌搜索到了 agnes 的 官网文档站,接下来他打开了文档站,定位到了模型的文档,说明 ai 学习并且总结了图像生成的调用方式。在这个例子里面可以看出 agnes 二点零 flash 有 着很不错的 agent 跟 skills 的 驱动能力,每一步都判断精准, 操作执行稳定,表现很不错。接下来我们来正式编辑 skill。 先斜线拉起 skill creator 这个编辑技能的技能,然后输入提示词,我要你编辑一个技能,这个技能可以调用二点一 flash 模型来生成图片。 apikey 可以 先硬编码,后续我会自己替换。 agnes 为我们编辑了 skill, 放到了项目目录下面,文件结构非常工整,他还不忘提醒我进入脚本第八行,替换 apikey。 我来到脚本里面,把站位符替换成了 agnes platform 申请的 api key。 我 说 api key 替换好了,你测一下。 a i 给我生成了一个云端金店,很有意思。我们再来看一个复杂一些的案例, 我想用 a i 给孩子批量生成故事绘本,这里输入提示词,开发一个 html 小 马过河的儿童绘本,然后输入斜线,找到我们刚才创建的 skill 来绘制插图,注意保持图片风格的一致性, 然后基于这些插图生成绘本。 agnes 先规划了插图跟段落划分,然后同时开启了多个生图 skill 来批量生成图片。很快完成了绘本编辑,交付了七张图片,还有一个 html 文件,我们打开看一下效果, 一个可爱清新的 h t 苗儿童绘本,这是我使用非常简单的提示词,一次就跑通的效果。 agnes 模型在编程跟 agent 能力上面已经具备了媲美一线模型的全模态实力,更棒的是完全免费,随便造随便玩。 hermes agent 是 前段时间爆火的龙虾 openclaw 的 上位替代,但不论是 hermes 还是 openclaw 都是 token 消耗大户。接下来我们就把 agnes 的 免费 api 接入 hermes, 再也不用担心偷篓的花费。这里我用的是 windows 上的 wsl, 作为 hermes agent 的 运行环境,在我之前的视频里,从零开始用国内网络跑通一切 ai agent, 里面有 wsl 部署 hermes agent 的 详细操作步骤。我们先打开 wsl, 输入 hermes agent 的 一句话命令,启动 hermes 配置模型。这一步是重点,我们选择 custom direct api, api 被字 u r l 填写 agnes 的 端点 api key 填写 agnes 官网申请的 key api 格式选择第二个 chat 模型选择四,也就是 agnes 二点零 flash。 后面的步骤一路点击回车就行了。然后我们输入命令, hermes 启动起来试一试。打个招呼,这里给到了回复就配置完成了。龙虾类 agent 最强的能力就是可以接入计时通信软件, 我们在 wsl 里面新开一个终端,然后输入命令来添加一个 i m 渠道,这里最简单易用的渠道就是微信,我们在 wechat 这一行点击回车,在浏览器里面打开链接,扫码完成配对,回到 hermes 都选择 y。 接下来我们可以在手机上测试一下了, 打个招呼,给到了回复就配置成功了,还可以问问他青岛的天气。 hermes 调用工具之前会先询问授权,这里我输入斜杠 approve 来同意,这样成功查找到了天气。使用 hermes 搭配 agnes 的 免费 api 就 可以覆盖大部分的 agent 工作场景, 关键是免费,你可以用它实现一切疯狂好玩的 agent 的 创意,完全不用担心偷看消耗好,感谢大家点赞支持,我们下期再见!

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

这条视频解决 codex 的 几个很实在的问题,上次发了 codex 新手教学之后呢,我整理了这几个问题,如果你也遇到了收藏视频,我们一个一个探讨。首先是不会下载,这也是问的最多的问题,直接卡在第一步,要么是找不到官网,要么是没有魔法,根本下不下来,好不容易下好了,还卡在微软商店装不了。 最他妈恶心的是很多人只会某度找 codex, 进的是别人山寨的盗版,稀里糊涂给人交钱吃大便,真恶心啊,有点心眼子全用到你国人兄弟身上了。 这样,我给你两个路子,确保你下的是正版。第一个是你有魔法 chat gpt, 官网直接弄,它会让你微软商店装,这个是绝对正版。第二个是有个开源项目,专门整理最新的镜像包, windows 和 mac os 都有,双击就能装不走商店下下来是一样的。 问题是这个开源项目它也需要魔法,为了方便大家呢,我已经把它的最新版安排到工具箱输入了,并且保持同步更新。第二个问题,语言改不了中文。这个问题绝对是困扰了大家很久,因为设置里面明明可以改,但是就是不生效。我把正确的方法告诉你,做不到你也别折腾了, 你改成中文之后,从任务栏彻底关闭 codex, 然后再进去就可以了。 它的原理是在启动的时候需要加载原配置,如果网络不通,他一定会默认回到英文。这个问题就是这样,不满足条件你也不用乱折腾了。第三个问题,手机号验证,上一条视频的评论区到处都是做这个生意的,我不清楚他们是怎么承诺的,但是我可以告诉你官方一手的消息。其实这个验证我记得在五月初就有, 只是在最近大规模轰炸了一次,最严重的时候很多充了一百刀两百刀套餐的朋友甚至都丢掉了账号,包括前几天直接封号的也很厉害,但是官方很快就改了,目前很多账号都已经不需要手机号验证了,你可以搁置几天再重新上下看看。目前不建议用某些接的平台,因为有可能会二次三次验证, 其实一劳永逸的方法这个不让讲的特别细,有机会的话我专门写教程文档放工具箱。我只能说验证这个事它本身都是很不稳定的,几乎一天一遍的政策,我不建议你给任何人交钱。

codex 大家应该都用上了吧,但是它的缺点就是额度太少了,完全不够用,而且它的头款实在是太贵了。那一种解决方式就是把咱们自己比较便宜的一些模型借进去,比如说 bitcoin, 咱们需要 c c 叉, c c switch 以及 bitcoin 的 api k。 首先我们在 bitcoin 点击 api 开放平台 api case, 创建 api k, 这个 k 一定要保存好。然后我们搜索 c c 叉, 点击这个,在下面找到适合自己的版本,我下载的是 windows 版本,然后搜索 cc switch, 点击下载,在这个界面一直往下翻,找到适合自己的版本,我仍然下载的是 windows 版本,然后安装 在 c c 叉文件夹下,我们新建一个 text 文件,命名为点 e n v, 把这些内容填进去。 k 就是 你设置的登录密码,我这里设置一二三四五六,然后重命名,把点 txt 删掉,运行 c c 叉,这个时候会弹出终端,复制这个 local host 地址,到浏览器打开点,点击 contacts, 选择添加渠道。在这里可以打开 delete 官网找到调用 api, 复制 c u r l, 把这一行改成 api k, 填写你自己的 delete 的 k, 选择详细配置。我们要选择 open ai chat 模式,继续往下翻,把这两个按钮打开,然后就可以了。现在我们在 c c switch 点击 codex 图标,再点击右上角的加号,供应商名称可以随便写。 api k 是 你在 c c x 的 点 e n v 文件里设置的登录密码,我的是一二三四五六 api 请求地址填写这个,点击获取模型列表,可以看到 deepsea 模型了,选择即可。然后我们点击测试模型,如果正常,说明已经配置好了, 我们重启 codex, 选择其他方式登录。这里的 k 也是你在点 e、 n、 v 文件里设置的登录密码,比如我的是一二三四五六,然后就可以了,现在 codex 里面的模型已经是 zip 了。

上个视频评论区有粉丝教我做一个详细的教程, ok, 安排用国产模型,而且要使用完整的 codex 功能,就要解决 api 代理和 codex 的 插件功能,这两个小工具就是解决这个问题的,他们都是的开源项目。 好了,安装 codex 加加,安装好以后会弹出一个命令行,不要紧张,按一回车就安装好了。接下来安装 echobird, 安装好了,打开它,在模型中心配置模型。以 deepsafe 为例,打开 deepsafe 官网,点右边的 api 开放平台,进去以后,先申请一个 api key 复制下来,再到接口文档里把 uio 和模型名记下来,转到 excel 这里配置好,这就全部搞定了。 启动的时候要注意一个问题,就是先打开 codex 加加,再用 excel 版的启动 codex, 不要用 codex 原声软件启动。这么详细的教程,快去点这里关注起来,下期不迷路!

codex 好 用,但 openai 的 api 太贵了,一个问题,几毛钱?今天旺财告诉你, deepseek v 四同样顶尖的编程能力,价格只要十分之一,而且能直接接近 codex, 不 需要改 codex 任何文件。一个本地中间键 memore codex 一个配置工具 cc switch 十分钟搞定, 全程 a p i p 只在本地跑,不经过任何第三方,安全又稳定。第一步, n p m 局装 miimo 二 codex 一 条命令。第二步, cc switch 添加自定义供应商,填 base url 和模型名。第三步, codex 选 deepseek, 开写 deepsea v 四 pro, 在 codex 里跟原版体验一样,工具调用,多轮对话写代码调试全支持。关键是你花 open ai 十分之一的价格拿到同级别的编程体验。 想接入的评论区打个教程,我出一期保姆级视频,手把手带你配置。关注旺财, ai 编程不踩坑。

之前呢,我们分享了一期 cloud code 接入 deepseek, 但其实没过多久啊, cloud 就 有过一次版本更新,新版本的模型名称就会出现一些问题, 那这一次就正好我们把桌面版 codex 和 cloud code 都通过 c c switch 来接入 deepseek, 我 们出 three two one。 我 这里啊,把前置环境和 c c switch 都准备好了,同时呢也写了文字版的安装教程。呃,大家可以参考一下,我就不展开了,我们直接开始。 那先说 codex 吧。首先呢,我们需要做一个 cc switch deep seek 的 通道,这个呢,我已经准备好了。呃,文字版里面大家可以自己找一下。首先我们打开这个文件夹,找到这个文件, 复制一下再黏贴。然后呢重命名,文件名是点 env, 注意啊,这个点不能忘记。然后呢,这个文件呢,我已经有了,所以呢我就不确认了,我把这个删掉。 我现在打开这个点 env 给大家看一下,这里面啊就是一条 apikey, 你 们打开的话就把自己的 apikey 写上去就可以了。然后呢,我们双击一下这个 start 点 back 的 文件, 出现这样子的界面,这就算成功了。那如果中间哪里有报错啊,就要重新回去验证一下自己在前面的环境这里有没有什么没有安装好或者遗漏的地方。 好,那我们接着打开安装好的 cc switch, 这个是 codex 的 界面啊,它是 gpt 的 图标。 进来我们看到这个,我们点击右上角的加号,可以看到的是添加供应商,呃,我们下滑,这里填供应商名称, deepseek v 四 pro。 备注呢,我们就随便写写一个 test 官网的链接,这里是可以不填的, api key 就 填自己的 deep seek 的 api key 就 可以。 这里注意啊, api 请求地址填的不是 deep seek 的 接口,因为前面我们已经做过 cc switch 的 转接了,所以填的是本地的地址, 然后下面到模型名称这里就填 deepseek v 四 pro, 然后我们拉到最下面,这里直接就是点添加, 然后它会自动回到上页。这里啊,已经多了一条 v 四 pro。 看一下啊,这里我们直接点一下它就可以切换到使用中了。现在我们来打开 codex 看一下 这里,它其实已经绕开登录环节了,原本打开呢是需要 gpt 的 账号了,现在呢,呃,都是需要验证手机号的。那我们现在通过 cc switch 就 可以直接接入 dbic, 跳过登录直接进到 codex 的 界面了。 这里我们根据他的提示啊,先初步一下,然后这个 set up 好 快速就完成。现在我们发消息来问他一下,你当前使用的是什么模型,有回复了啊,他这里回复呢,他是 deepsea 了。好,我们现在再来验证一下 这里呢啊,使用之前他会向你申请一下电脑的权限。没关系啊,我的 codex 工作区也在桌面上面,我们现在直接打开看一下。 好的,这里呢,他是已经在工作区里面建立文件夹了,速度啊,我觉得是很快的,根本没什么毛病。那其实到这里为止呢, codex 接入 dbic 就 完成了 啊,如果没有账号没法注册或者说登录需要验证的朋友们啊,我们就先把 dbic 可以 这样耍起来了。 然后接下来呢,我们直接再来试一下 cloud code, 这里同时也是一样的啊,我们首先先要打开 cc switch, 我 先把我刚才的配置都删掉, 注意啊,这里是 cloud 的 配置页,也同样啊,直接点击加号进来,直接就是选择 deepsea, 这里的供应商链接,官方名称都已经直接有了备注。我们也先随便写一个测试 a p r key, 这里也同样是写 deep seek 的 key 请求地址,这里也不需要动了。 好,接下来我们就到了模型这里,模型这里呢,我们都填 deep seek v 四,然后这个 e m 呢?呃,之前的视频也说过,其实就是百万上下文使用的意思,如果不加的话呢,不用做大项目的话也是够用的。 然后这里其实还是可以换一个 flash 模式的,也不用全部都是 pro, 然后随便找一个改一下啊,这几个模型名字等会都有用的,是一个对应的关系。然后这里我们就直接先添加, 回到这里就有这个选项了,我们这里就直接点起用。之后呢,我们再开通一下本地路由,在这个设置路由本地路由里面,本地路由打开 cloud 打开, 然后同样这个本地的服务器地址是要记一下,后面要用的。好,我们返回上一集测试一下,看到他是正常运行的。接下来呢,就是打开 qq 的 第一次 打开登录界面,不用登录啊,左上角 help 这里啊,点击这个 troubleshooting, 然后进到这个 enable develop mode, 然后点击 enable, 然后这里其实就是进入它的开发者模式, 然后重启,重启之后你会发现这里多了一个 develop 的 入口,然后我们选择 configure party info, 然后进来。进来之后,首先第一个 provider, 我 们这里直接就选 getaway, 然后 getaway 这里的 base url 就 写刚才我们 cc switch 这里出现复制下来的地址,这一个 key, 这里呢,当然还是 deep seek 的 key, 然后 bear 这里是不用动的。好,到模型 list 这里怎么填啊?这里就是填我们前面在 c c switch 里面配置过的对应模型,前面呢,加一个 cloud。 好, 这里两个模型够了,直接我们拉到最下面 apply locally。 好, 然后直接重启。 看啊,这里就是直接不用登录,我们就进到 cloud 的 界面了,然后 solo party 的 模式到 code 这里试一下。首先呢,我们随便设置一个工作区,然后测试一下,帮我建个文件夹。好,我们看一下它的这个速度还是很快的啊。 ok, 那 到这里呢, codex 和 cloud 都已经接入完成了。我最后补充一点啊, mac 系统呢,相对比较稳定,但是 windows 的 话呢,会经常会出现这样子的报错, 但这种报错啊,其实没有什么关系,通常都是安装有问题。呃,因为网络原因,组建安装可能会有丢失,最好呢是可以调整一下自己的网络环境,重新安装一下就 ok 了。 顶级的 a g 呢,配上我们的国产大模型,就再也不用为无法登录烦恼了。好,那这次的内容就到这里,希望对你有所帮助。我是阿月,我们下期再见。

如果你最近也给你的 codex 或者 clockwork 装 skills, 很 容易掉进一个坑,就是你被推荐了几十个甚至上百个 skills, 但是真正开工的时候还是不知道该选哪一个。所以说这一期呢,我也不做大而全的清单,也不讲复杂的安装, 我只按普通小白最容易遇到的六类任务去挑六个 skills。 新手先认识这些就够用的一些 skills, 它们能够分别帮你去解决任务,先问清楚想法,先变方案,知识库能调用,重复流程能沉淀网页结果能验证和各种文件都能够转化成 ai 好 读的这种材料。 ok, 大家好,我是 fred, 专注从普通小白的视角去分享怎么从零开始用 ai 和 web coding 提升自己的生活和工作效率。 那第一个 skill 就是 大家已经耳熟能详的东西啊,就是 using superpowers, 就 它的核心作用是能够让 ai 在 开始做事之前先停下来,把任务问清楚。 就很多时候很多人用 ai 的 痛点不是说 ai 不 会写,而是它太快开始写了,就是你一句话发给他,他可能马上能够给到结果,结果做完了之后才发现说你的目标边界格式和验收的方式都不对。 那这个 skill 所做的事情就是让 ai 先理解任务再计划,最后再验证。所以说它特别适合那种长任务,包括你的需求模糊的时候,以及你经常让 ai 做完又返工的这种场景,那这个 skill 那 就非常适合。 第二个是我非常常用的 skill, 就是 brainstorming, 就 它解决的就是想法,当你还没有想清楚的时候,可能就着急开做的这种问题, 很多人找 ai 去做东西,一上来就说,哎,帮我做一个网页,哎,帮我写一个方案。但其实当你的目标用户,你的内容重点,你的功能边界都没有定的时候,那这就体现了 brainstorming 的 价值, 它会让 ai 先跟你把想法聊清楚,再给两到三个不同的方案,并说明每个方案的一个取舍。比如说你要做一个内容栏目,一个页面,一个工具,一个产品的 demo, 它会先问清楚做给谁看,解决什么问题,哪些功能要不要做, 然后再把你的模糊的想法整理成可执行的这种设计。所以说它适合新项目开头,包括内容策划的开头或者功能设计的开头。 第三个也是我经常会用的一个 skills, 就是 obsidian skills, 就 如果你在用 obsidian, 或者你有大量的笔记资料网页的这种摘要,那这个我觉得就非常值得去收录啊, 就它不是简单地帮你去多存一些笔记,而是让 obsidian 里面的这种 markdown 的 文本,这种 bases 或者 canvas, 或者你的网页资料能够变成 ai 可以 重新组织的这种工作材料 就很多人的知识库最大的问题就是资料一直在往往往里面堆啊,然后真正写文章的时候,做研究的时候,包括你复盘项目的时候,就很难够重新再调动出来用。 所以说这个是会更适合内容创作者、研究型的岗位和那种顾问啊,或者长期的学习者,他的价值能够帮你把长期积累的变成一个可持续输入的一个资产。 第四个我相信是一个所有人都一定会用到一个 skills 啊,就是 skill creator, 它的作用就是帮你去生产你的 skills, 那 它解决的是你的一些重复流程的问题,比如说呢,你每周都会让 ai 写周报,那每次都要重新去讲格式、口吻,保留字段,或者一些审核的一些标准, 或者你反复让 ai 去帮你整理资料,改一些发布的文案,或者检查网页,那这些事情如果我每次都重新解释,去写一些 prompt, 写一些提示词,那本质上就是没有把这些 流程给沉淀下来。那 skill creator 的 价值就是帮你把每一次的对话变成一个可附用的 skills, 它适合做一些固定的格式,然后重复的流程,以及你希望以后能够把自己和团队都能够稳定使用的任务沉淀下来。 第五个呢,是 pay write, 其实它不是一个 skills 啊,就它更像是一个呃,浏览器自动化的能力 就是它可以让 ai 真正地去打开网页,去读取里面的页面的状态,点击按钮,包括说填写表单,截图,检查做网页或者落地页这种后台表单产品 demo 的 时候呢,这个非常非常有用啊,就因为很多时候 你只看代码是看不出来的,比如说按钮点不了,或者文字溢出,或者移动端变形,对吧?或者表单提交失败,这些都是要真正打开浏览器才知道。所以说 playwrite 的 价值就是让 ai 不 只是生成结果,还能帮你验收结果。 最后一个呢,就是 mock it down, 它的作用是能够把各种文件转成 ai 更好读的 mock down 的 这种文本,比如说把 pdf, 你 的 word, ppt, excel, 甚至网页 html, 一 些 csv 或者 jason 图片甚至音频, 都可以转成结构化的文本。为什么这个重要呢?就因为很多时候 ai 总结不准,其实并不是它模型弱啊,而是输入的这种文件结构太乱。比如说文件里面有表格,有分页,有图片,有格式, 那 ai 直接读就很容易漏掉一些重点。所以先用 markdown 这个 skills 把材料变干净,再去总结提取和改写,那结果通常就会变得稳定很多。 所以说呢,这六个 skills, 你 可以把它们理解成 using superpowers, 帮你先问清楚。 brainstorming 帮你用好知识库。 skill creator 能够帮你沉淀重复的流程, 而 playwrite 能够帮你去验证网证网页的结果,或者帮你去爬取一些网页的数据。而 markdown 能够帮你把文件变成 ai 好 读的这种材料。所以说你也不用一口气全装啊,也可以一开始呃,慢慢的一个一个去选,先知道它们分别能帮你做什么,后面可能遇到一些 对应的问题,然后再去用一些对应的 skills。 ok, 我是 fred, 后面我会持续帮你去猜普通人怎么把这些能力用进自己的真实的工作流。 ok, 评论交流你现在最想解决的一个 ai 问题,我会在评论区里面去回复,我们下期再见。

国内无痛使用抠袋子邪修即喂饭教程,不用 g p t 账号,不用国外银行卡,国内零门槛搞定!兄弟们,老张尽力了啊,改了四版,这个视频还是没发不出去, 咱们就用口播的方式给大家来完整的讲解一下国内究竟应该怎么用上抠袋子。首先第一步你需要先准备抠袋子的客户端,但是抠袋子的官网需要一定的条件,我们是访问不了的,所以说老张推荐使用 h 浏览器, 然后在里面就能拿到我们的扣袋子的客户端了。但是现在我们打开它是白屏界面,这是很正常的,因为它本身连接的还是 g b t 的 网络,所以接下来我们需要把它连接到我们国内的大模型 c c x, 它的作用其实很简单,就是做一步对应的桥接,然后呢,你再准备一个 deep seek 的 api key, 然后按照以上这些步骤啊,我们就可以直接接入了。希望老张的贴图可以给您有所帮助。

所以我现在的结论是啊, deep seek 接入 codex cloud 这种操作啊,其实完全没有必要。为什么这么说呢,因为我们明明有更适配的 agent, 完全不必舍近求远,不拜关子了啊这是。我最近呢,也正在用 work buddy 和 reason 这两个 agent 走,我一步一步展示给大家看一下,出发。 好,我们先说一下 workaday, 其实马哥家的这个 agent 卡其早就有了,只不过呢,我 qdax 用的比较早,且当时呢 workaday 才刚出,所以功能也不是特别完善。但最近啊,我发现啊,大厂已经不卷模型本身的性能了,有点开始在卷这个桌面的 agent 了,所以我最近啊,又重新试了一下。 马克家呢,目前一共是出了三款 a 阵,所谓呢,是上中下三路全军出击。非要说啊,目前感觉沃克里应该是功能比较完善的。 那虽然说 kodex 和 cloud 通过外部 api 来接入第三方模型是官方认可的行为,但这里面其实有一个很大的问题,就是通过第三方模型是官方认可的行为。但这里面其实有一个很大的问题,就是通过第三方的试一 a 阵还能算试一吗? 那我们的马哥啊,自然就不同了,他就不会去严格功能,他只会自称啊,我们有这个功能,然后为你收钱。 当然啊,产品好用,收钱无可厚非。收钱的呢,其实是 ai 的 模型本身,这其实跟 codex 和 cloud 的 性质是一样的。肯定啊,不存在骗你。 马哥这里啊,其实还是给用户贴钱的,因为每个月啊,大家都有免费的积分,积分呢可以调用模型,可用的模型也很清楚,混元啊, g l m 啊, mini max 啊, deepsafe 啊,非常齐全了,完全没毛病了啊。 然后呢,免费的积分用完了,如果你放心不下马哥啊,那他其实可以直接给你配置自定义模型的通道,我呢,就把我的 dbic 的 api key 又对接进去了,那 work buddy 呢,就等于是在用自己的 dbic 官方通道来扣费了,或者如果你有自己用惯的模型去对接,也是完全 ok 的。 好了,费用的事情说明白了,那功能的部分我们一个一个看过来。首先是这个主界面, a 镜产品啊,在 u i 上大家都有了默契,一眼看上去啊,都是一样的,所以使用起来没有什么障碍。 那乌克巴蒂呢,就很贴心,帮你放了很多快捷的按钮,这个代码开发日常办公设计创意,他同步在下面呢,也帮你预设了很多的 prompt, 这些 prompt 呢,也写的很规整, 这我觉得还是能帮你省去很多事的。有时候啊,浪费 token, 觉得 ai 回复不准确,大概率啊,就是你的 prompt 写的太模糊了, 导致啊,反反复复的和 ai 去兑现,反反复复增加新的条件,还把自己给气倒,又费时又费钱。然后呢,下面啊,就是这个助理,助理啊,其实就是 club, 他 对接了你的微信小程序, 我这里呢,已经对接好了,我随便在手机上面测试一下,帮我在桌面上建一个文件夹,文件夹的命名为 club。 嗯,没什么毛病啊,你如果需要他远程来帮你处理本地电脑上找一些东西的话,也完全是可以的。 再下面啊,就是这个专家了,我觉得啊,这里是很能体现我们本土产品做的整合业的能力的, 基本上就是这里各行各业的功能啊,都直接打包好了,应有尽有啊。这其实啊,是对使用起来的门槛是大大降低的,当然你还是可以建属于自己的插件的,也没有什么特殊的限制。我就拿文案的内容专家来试一下, 帮我写一条关于昨天苹果开发者大会的内容。好,他结果出来了啊,这格式呢,还是非常规范的,看起来还是像模像样的,写的很规整。挑毛病的话呢,可能就是口气上稍微有点太 ai 了。 呃,针对内容的话呢,你切换几个模型都去试一下,或者呢自己去装一个去 ai 花的插件啊,都可以。 但我还是认为啊,内容这个东西啊,是得自己主导, ai 呢,可能会给你一些灵感,但是最终呢,还是需要人工自己来审核一遍的,或者说你有自己的一些创作习惯,上传给模型去学习一下。这个延展啊,你就自己去研究一下吧, 我再让他做一个 ppt 试一下。还是昨天这个苹果开发者大会这个事,你帮我写一份 ppt 总结一下, 这次花的时间啊,是蛮久的。好,我们看一下他写出来呢,确实是很 ppt, 原声能力好像有点不如豆包吧。有可能是因为我用了奥特模型的关系啊,这个可能还要再调调一下, 不过呢,问题不大, ai 的 主要功能就是先打草稿吧,具体细节可以再修改,写作业有困难批作业,大家不都是专家吗?接下来呢就是技能 这里推荐的 skill 啊,里面都是一些马哥自家的,后面一页就是集合了一些也是热度比较高的 skill, 没什么好多说的,再继续啊,后面这个连接器也是一些比较实用的外部工具,当然飞书也是完全可以连接的。 我自己用的这个邮箱功能我觉得还不错,虽然海对面的 a 阵也能做链接功能,但扣带斯和 cloud 官方都是基于机妙的。那马哥的当然可以基于我们现在比较常用的一些邮箱了,我就简单做了一个定时看邮箱的任务,读取附件,回复邮件都是 ok 的。 不多说了, 自动化这里啊,就是自己创建的一些自动化任务,每天固定推送新闻啦,每周定时写周报啊,这些内容啊都会在这里进行展示。我这里呢,就是做的一个自动检查邮箱的任务, 最后再看一下它的全职设置的内容啊,系统授权记忆模型,这里就是我自己配置的 dbc, 你 可以配置一些别的,比如 mimo 什么的,毕竟 dbc 的 多模态现在还在内测 个性化呢,就是给他一些人设。这个其实我觉得也挺好的,让他不要罗里吧嗦回答我们啊,干脆一点,在下面一些就是常规的功能了 啊,那乌克巴里大致的功能呢,就都在这里的,其实我用下来觉得是没有什么问题的,起码日常的一些功能可以说已经覆盖了非程序员百分之九十的场景,而且外界模型也完全做的非常的 ok。 那如果你认为一个好的 agent 呢?一定要有好的代码逻辑,认为 workbody 还不够满足。那好,我们再来看一下另外一个热度很高的 agent reasons, 这个 agent 啊,就是专门为 deepseek 打造的编码助手,你一打开就提醒你输入 deepseek 的 api。 这很有意思啊,它能直接查到我的余额,以及啊,它这里会直接显示命中。 这我在社区上也看了一下,有很多玩家说如果跑相关任务连续跑时更容易命中缓存,那也就意味着他能更省头。肯 redmix 的 核心设计就是围绕这个机制来的,他会尽量只往后追加,不会去重排,不去频繁改前面的上下文。在同一个项目里啊,连续修改代码跑测试修 bug, 前面的系统提示啊,工具定义上下文也会反复复用。 因为我不是程序员,我就不多加评论了啊,不是程序员的话呢, web coding 的 时候啊,对模型的智力感会比较迟钝,除非啊,他一直不会打墙或者一直改的让我不满意。很难啊,在第一时间就感知到他能力的高低。 我简单跟他对话了一下,问他能不能重启我的电脑,他跟我说不行,他是在沙盒里,并且啊,他理解自己就只是一个编码助手。当然啊,现在的 agent 都不只是某一个功能的 reynix 啊,也是可以添加插件或者 skill 的, 只是他的 ui 设计啊,更偏向 coding。 并且啊,没人规定一定要讨论出谁是那个最好的 agent, 其实成年人完全可以都要。 其实啊, codex 和 gao code 的 确实是好产品,我自己呢,也一直在用,但如果啊,你要硬拿 d p c 去揭露他们,结果呢,就是功能被阉割,体验打折扣,花两份钱操一份心,何以为了。并且啊,如果自己没有办法直充原声的 d、 p、 c 或者 office, 那 说明你可能也用不上了。 那 work buddy 这边啊,马哥就把本土体验做的非常标杆了,什么邮箱啊,飞书啊,自动化啊,专家包啊,全部给你打包好,你换什么模型进去啊,他都能跑,门槛低,覆盖过非程序员一样玩得转 爽,再配合上 witex, 那 就什么样的项目用什么样的工具呢。所以说到底啊,没有最好的 a, 只有最适合你工作流的 a。 好, 本期视频就到这里,希望这期内容对你有所帮助。我是阿月,下期再见。

更便捷的管理,更好的视觉窗口,一键把国产模型接入 cloud code 和 codex 的 工具,带大家一起来看看。我们出发之前啊,已经给大家说了两期如何让 deepseek 来接入 cloud code 和 codex, 方法呢,就是通过 cc switch 来管理模型。 但是最近呢,还有一个项目在一套上面热度大涨,就是这个一键化管理工具 echobird, 重点是免费,而且也没有操作系统上的限制。我今天呢就用 windows 系统来给大家试一下。 安装完我们直接进到主页这里啊,可以看到一些资讯和介绍。 那我们直接点到模型这里,还是我们的老朋友 deepseek 跑到这里呢,直接就是让你要填模型 id 和 api 了。那我们来填上 deepseek v 四 pro 还有我自己的 t, 这里右上角点击测试一下,直接通过。然后下面这里啊还有一个应用管理,因为呢,我是已经安装过 cloud 和 code 来看看, 选中 cloud, 然后右边这里选择 deep seek 启动。注意看啊,这时候这里的图标已经显示模型是 deep seek v 四, 那我依旧测试一下,让它来建一个文件夹。 好的,没有问题,速度呢,也还挺快的,而且啊,几乎没有什么前置配置的准备工作,接入呢,也很丝滑。这个我也是第一次用啊 啊,我再打开 codex 试一下。同样的,这里要选择 deepseek, 然后启动 也是同样的,帮我建一个文件夹哦,这里要先 set up 一下, 但是呢,等了很久一直没响应,那我直接关掉重启一次, 然后模型选择这里啊,它显示的还是 gpt。 那 先不管,我们继续试啊。 好的,这回成功了,速度呢也还可以,我再问一下它是什么模型?这里呢,还是有点区别的,之前用 ct switch 的 时候呢,它很清楚的知道自己对接的是 bc, 但是 echobird 呢,就不是了,可能是通过中转之后还认为自己是 gpt。 那大家都知道 deepseek 目前还不支持多模态,我们直接发一张图给他看看,试一下。 ok 啊,没一点毛病,依旧眼瞎。但多模态呢,应该已经在内测了,我们再等等后续吧。啊,不过个人测下来啊,通过外部 api 来接入 codex 和 cloud 实图呢,都会有压缩的问题,我们可以再接一个 mini max 来试一下。 还是老样子,回到这里,添加 直接写模型名称和 apikey, 点一下测试也是没毛病,直接通过。好的,我们回到应用管理,在这边直接切换一下模型试试。 这里啊,我是故意没有退出的,看看直接发图片啊,会不会成功。 呃,看样子还是不太行,还是要新开一个对话来给他做测试。他现在看到的不是图片,但是他以为在看图片。先开一个对话吧,问一下你是什么模型?哎,他这里就直接回复他是 mini max 了,那我们再发这个图看一下。 好的,回复了,回复的也不知道是个什么东西,什么二零二五年的财务。这个申请人呢,我也不认识,一本正经就是纯片, ok, 不 过看图问题呢,也不是重点,因为通过外部 a p i 来接入呢,图片识别呢,确实会有些问题,经过中转之后啊,就会有一定程度的压缩。那如果真的想看图的话呢,可以再加个 vision m c p 的 工具,但肯定还是不如原声模型的能力的。 好了总结啊,就是这个工具,目前来看呢,确实是很实用,虽然可能也有不稳定的一些小 bug, 但强在方便快捷,都不用自己配置通道就可以实现一键管理和启动模型。还有被卡在不能使用这两个 a 镜头的朋友们啊,可以来试试。好,本期视频就到这里,我是阿月,我们下期再见。

分享一个国内不限期免费用 codex 的 方法,我说的不是好几天就没的那种,是真正能持续用下去的方案,文本、图片、视频都支持,关键是不花钱。本期是手把手的保姆级教程,跟着做基本不会踩坑。这是我用 codex 批量生成的国风壁纸, 嫦娥奔月主题五章风格统一。这是同一主题生成的动态视频。这次用到两个东西,第一个是 codex 加加开源工具,专门给 codex 换模型用,它不改 codex 任何文件,在后台起一个本地代理,把 codex 请求转发到你指定的模型, codex 这边感知不到。 第二个是阿克尼斯的 api 文本图片视频,三个模型现在可以免费调用,进来之后点左侧供应商配置,点添加供应商名称,填阿克尼斯接入模式,选纯 api 配置模型,填阿克尼斯二点零 flash 点更多选项,贝斯 u 二 l 填阿克尼斯的 api 地址, 结尾是有唯一的,建议直接复制粘贴,别手打。可以填你的阿格尼斯 a p i 可以 去开发者平台点 a p i 密钥,创建密钥,复制下来粘贴进去。上游协议这里要注意, 选 chat completion, 不要选 responses, a p i 选错了就跑不通,这是最容易踩的坑。填完点保存,配置好之后点左侧安装维护, 拉到底部,点启动 codex, 加加 codex, 自动打开。问他你是什么模型,他回答,我是阿格尼斯二点零 flash 说明接上了,接下来直接上案例,看看阿格尼斯跑起来效果怎么样。我想批量生成一组嫦娥奔月主题的国风壁纸, 同时生成一个 html 展示页面,内置的 html 阵技能用不了,因为换了阿格尼斯 a p i 之后,它还是掉 open n 的 图片不行,所以让 codex 自己去学阿格尼斯的图片, a p i。 帮我写一个专属的生图技能出来。新建一个项目文件夹, 在 codex 里打开,输入斜杠,拉起 browser 技能输入。你用浏览器搜索,去阿格尼斯学习一下图片生成 a p i 的 调用文档, 学完总结端点地址、请求格式和必填参数。 context, 自己打开了浏览器,搜到了阿格尼斯文档站,翻到图片模型的 api 页面,读完给出了总结,每一步都判断得挺准,操作稳,没有跑偏。阿格尼斯的 agent 能力用下来感觉还不错,学完直接让他把技能写出来。 输入斜杠,拉起 skill creator 输入。根据你刚才学的阿格尼斯图片, a p i。 帮我创建一个生图技能,支持传入主题关键词,批量生成图片保存到本地,同时生成 html 展示页面。 a p i k。 从环境变量读取技能文件写好了, 文件结构挺工整的,说明文档 api、 参考执行脚本都有。在 power 里把阿格尼斯 api key 写入环境变量,然后跟 codex 说环境变量设好了,你测一下主题,用嫦娥奔月生成五张。 codex 开始批量调用阿格尼斯图片 api, 五张壁纸陆续出来了, 打开 html 展示页,五张国风水墨风格的壁纸,风格挺统一的,一次跑通,壁纸有了,再进一步,把壁纸变成动态视频。和之前的套路一样,让柯黛斯创建一个视频生成技能,调用阿格尼斯的视频, a p i。 把刚才的壁纸作为手帧生成动态视频 技能写好直接跑用嫦娥奔月这张支持一千零八十 p, 这次生成的是七百二十 p, 带音频静态壁纸动起来了。 阿克尼斯的文本、图片、视频三个模型都用上了,不花钱也能跑起来。日常创作和开发场景基本都能覆盖 codex 加加加,阿克尼斯可以长期低成本使用 codex 文本图片视频能力基本都有,以前这套工作流费用不低,现在可以省一大笔。

这期视频不讲怎么花头肯玩 ai, 而是说说怎么赚头肯,这也是很多小伙伴更感兴趣的事情。目前有什么项目是普通人可以做的,很详细很具体,建议收藏慢慢看。开始之前,我们先看一句话,教你赚钱的都是想赚你钱的, 我认可,但我会再补一句,不但你的,我还要赚,他的,我全都要。带着这句话,我们开始今天的这期教学。大番茄, 这是我的推书号,不打码随便看,我每个月一百刀的 codex pro 订阅就是靠这个项目支撑的,它的本质是小说平台的推荐, 我们熟知的起点茄子、飞炉等等,其实都有官方的推广经费,他们会拿钱养一波外包的员工,让他们在各个自媒体平台宣传。而这就是项目的底层逻辑,平台要读者, 读者要看书,我们拿平台的钱找读者必还了。那具体是怎么运转的呢?首先平台会挑选他们认为的好书,给我们一个书单,我们挑里面的书给他们起别名。 比如我推了一本书,本名叫我以狐仙镇百鬼,我给他起了一个名字叫山野静悄悄。那么问题来了,为什么要起别名?这就是我们和平台的一个约定,如果不是这个特殊的名字,谁知道读者是不是我带来的, 平台没办法确定是不是我的单子。这样就简单了,一人一个专属的别名,谁带来的算谁的业绩,简单明了,起名也是有技巧的,后面我会详细说,理解了变现逻辑,我们直接讲具体玩法,由于平台限制,我尽可能在不违规的前提下说的尽量具体。 首先是授权,不是随便来个人都可以接任务的,相当于你要干活得先签劳务合同。这就要提到我每天都要玩的手游了,这个小豹子就是全世界最好玩的手游之一,堪比同谋顺里面超级多的平台任务。 拿茄子来说,顶部可以看到官方的选书库,授权需要四个必填信息,关键词就是这本书在平台的精准编号,书籍名称就是小说的原名, 作者可以不填,类型根据你要做的视频形式来选,提交之后等通过就算授权成功,这就是一次完整的授权过程,不需要一分钱的门槛。曾经有人靠这个信息差搞米,现在你学会了。 在推广类项目的生态中,关键词和回填是非常重要的两个概念,搞不清楚就分别没有,这是工钱,一定要上新。关键词就是别名,每个平台的要求不太一样,还是拿茄子举例,这是官方要求的规则,比如字数要求,取名攻略可以截图保存。 而回填是什么意思呢?你可以理解为工作打卡留痕,你发了一条视频,就要回到这个别名下面,回填视频的地址,证明你用这条视频做的任务。 这是回填的几个核心规则。第一,别名审核通过之后再回填,不仅仅是后台显示通过啊,一定要自己上平台看一下,你看我这个就没问题,官方给了高量放大,占据 c 位,第一个排面拉满, 只有真正生效了,你的流量才有用,不然就是空跑做慈善。第二,唯一性,要推哪本小说,视频就一定是这个小说的别名,不能挂羊头卖狗肉。第三,优先级,如果发了很多视频,没办法做到全部回填,优先填播放量最高的 四、有效期,这个分三种,分别是七天、二十八天和一百八十天。第一次申请别名通过之后,七天内务必要先回填一次,不然这个别名就直接失效。每次回填之后,有效期从视频发布的日期往后推,二十八天超过就要追加新的作品才能继续更新单子, 如果这期间别名没有产生收益,二十八天到了,这个名字也就失效了。最后是一百八十天,也就是六个月,一个名字只能用这么长时间,到期了就得申请新的。第五,回填时间, 每天晚上九点之前回填,不然当天的单子就刷不出来。第六,兜底措施,如果你填过的视频隐藏或者删除了,那就得及时追加新的,就是确保你每个别名下面至少有一个作品是有效的。最后就是回填规范了,不要把那个整个视频地址都填上,而是只填短的那个有效部分。 做视频的形式其实很多样,以口播和混剪为主。我这种口播类的其实是最简单的,基本上都是 ai 自己帮我剪的, 你可以在本地准备好你推的书的资料,比如给他做个封面或者录屏听书的播放界面当剪辑素材。其实我感觉推书主要还是靠小题和文案,由于我主要是靠它养 ai, 订阅也没有办法把更多的注意力和创造力放在上面, 所以基本上就是确定了一些爆款的选择题,不会花更多的时间研究,每次拍完了一批就交给 ai 自己剪,然后定时发布就行了。我这种呢,转化其实很低,属于满世界贩流量找人真正转化高的那种选择题和形式,如果你是有心人,可以多关注爆款的视频,有样学样就行了。 至于混剪的话就不用自己拍了,一般是配音加素材,画面工具箱收入了大概 e t b 左右的高清素材,包括一些解压的,第一视角游戏的,或者是国漫打斗的等等,如果有需要的话可以试试。 一般平台的预算分为三种,一个是要新用户,就像多多的那种砍一刀,这种最值钱了,目前应该是十个大洋。第二种是失火老用户,就是他以前用过,但是卸载了或者很久没打开了,这种是四点五个,最后就是日活,不管这个人是新的还是老的,只要他因为你来了,那就是九毛。 所以茄子这个平台他就是要人,并不是说让这个人充钱,只要你把他弄来就算你的业绩。然后单子是一天一出,一周一打,两三天落贷,节假日顺延到这基本上就讲的差不多了。那么我们再回到最初的问题,教你赚钱的人,你的钱和他的钱都要赚。 上面说的就是他,他是平台,是商家,是金主,是甲方,是老板。而你如果根据我的教学玩这款手游,你开单我也有分成, 相当于团队小主管差不多吧。而如果你报陪跑训练营,每天在课堂听全职的老师直播教学,按时交作业,问问题,和搭子互相交流一起搞,你的学费我也能吃到分成。所以说项目盘子稳的话,全都要也没问题, 这也是支持博主变现的一种方式,前提是真的在教,干货有用,能出结果,才能这么多年长期屹立不倒,一直活下去。这一点我看得明白,也问心无愧。 说到这了,也可以再提一句,工具箱是我的核心产品,从飞书文档到今天的网站,全部都是免费分享,所有人从我这拿东西没有花过一分钱, 有发红包的我一个都没收过,但我只靠发资料做盘子,商单的推广也快能提速期了。其实这也是和小说本质上一样的项目,新用户或者付费用户都是业绩,如果你感兴趣,可以持续关注我,后面我会出详细的视频教学,尽我所能教会你 视频做到这里,我也整理了一份详细的教学文档和五千字的思维导图,配合视频自己耐心学习,我不信你不行,小豹子,目前有几百万人在埋头搬砖,这是世界上最好玩的手游,别在那里唉声叹气的,彦祖,去洗把脸,打开手机,我们一起。

如果你最近开始用 ai 工具,一定会越来越常看见一个词,就是 getop, 就 别人给你发一个开源项目教程,让你去 getop 上面去下载 ai, 也经常让你看 readme, store issue。 很多时候很多人打开一开始就懵了,这不是程序员看代码的地方吗? 所以说这期我不会讲一些 getme, 也不会讲怎么写代码,我只想讲普通小白怎么用最简单方式去看懂 getop。 ok, 大家好,我是 fred, 专注从普通小白的视角分享怎么从零开始用 ai 和 web 口令提升自己的工作和生活的效率。 你会越来越常看到 github, 是 因为很多的 ai 工具插件,包括自动化脚本和开源的软件,都会把说明、下载、更新和问题反馈在这里。 对于普通小白而言,你可以把 github 理解为四件事,就是一个是找工具的入口啊,别人做好的工具 以及项目的说明书和使用前的这种判断的材料。所以说你要看的不是说哎这个项目代码写的有多厉害,而是这个东西有没有人维护,要不要账号,要不要权限,会不会碰到你自己的文件和数据。这样理解就比一个所谓的代码网站要好,理解非常多。 就很多人怕吉他,是因为他第一眼确实看起来很不友好,全英文的网站对吧?英文的文件名、按钮、标签、技术词就一下子全部堆在你面前。但是实际上你不用从代码开始看啊, 就更简单的方式,你把 github 当成一个工具的详情页,就像你看一个工具之前,你会先看它是干什么的,怎么用,别人有没有反馈,以及最近有没有更新, github 也是一样,所以说你不一定要会照这个工具, 但要会判断是它是不是你想要的,值不值,是,然后以及能不能让 ai 帮你先读懂。就如果用大白话来讲, github 就是 一个公开的一个项目主页,一个 github 的 仓库就是一个项目页面, 你要你先不用把它想成一堆代码,也不用着急去下载,而是把它当成一个工具和这一个项目的主页,它会告诉你这个项目叫什么,想解决什么问题,谁在维护,以及最近有没有更新, 所以说这一页只需要记记住这个理解就 ok 了。就仓库不是一个神秘的文件夹,它就是一个项目的页面, 而当你打开一个 excel 的 一个主页啊,其实就长这个样子,第一次打开这个项目,就你不用试图把所有的文件去读完啊,你就少这四个地方。第一个就是项目的名称 啊,然后一个一计划的简介,确认它到底在解决什么问题。第二,你可以看 readme 的 这个文件,它就是你的这个项目的使用的说明。 第三,你可以看它的 star, 就是 有多少人给他点赞啊, fork 就是 有多少人复制出来,以及最新的一些更新的时间,知道有没有人关注,以及最近是不是还在更新和改动。 然后第四个就是你可以看它的 issues, actions 和 release, 就是 看有没有问题的反馈,运行的记录和一些稳定的版本。就大家要注意的就是就 starts 很 高,只能说明它热度高,但不一定代表就它真的很安全,或者不一定代表它真的适合你, 然后呢?刚刚那一页解决的是看哪里?那我们这一页解决的就是要不要试的问题,你可以直接问三个问题,就是第一它到底有没有解决我的问题? 第二就这个项目到底有没有日常在更新一个二三年的项目,你可能完全不需要再去参考了。比如说第三,那就是我能不能先用一些测试的文件去小范围试一下, 如果前两个问题都解释不清楚,那就不用再花时间了。如果第三个问题也说不清,那就不要直接拿一些真实的文件,真实的账号或者一些重要的数据去跑, 这样你去看 guitar 的 时候就不是在去学一些技术的名堂,而是在做一个普通人的一个使用的一个判断, ok。 然后我觉得现在真正去降低 guitar 门槛的一个地方就是在于大家可以用 web coding, 因为你不用自己去硬读这种英英文的文档啊,你可以直接让 codex 去帮你把 guitar 翻译成你能够看得懂的一些话, 比如说你可以这样问,就是我不是程序员啊,就能帮我去 github 上面去找一些能够批量整理 pdf 表格的工具, 然后以及让它不要只给我链接,能够帮我去判断说它到底能做什么,怎么安装和使用它的 star 数,更新时间和依据,说明什么,然后会读取什么文件数据,有没有一些联网或者权限的风险,然后以及怎么去验证。 所以说这样子 ai 给到你的就不是一堆项目的链接,而是一个能不能用,怎么用,以及哪里需要小心的这样一个判断报告。 然后这里还有一个关键点就是你不要一开始就去搜很多的技术词,就很多小白会直接说,哎,帮我去找那种拍摄的爬虫,或者帮我去找一些什么项目,但实际上你完全不需要懂这些。更好的顺顺序是先说你想要批量整理 pdf 的 表格, 我要把视频转字幕,我要自动汇总一些公开的网页信息,然后让 ai 去找后选项目,然后让他去读懂 readme 和一些视例,然后再最终用一些测试的文件和脱敏的数据去跑一个小样,跑通之后再考虑自己要不要接入自己的工作流。 然后呢, github 也不只是可以放代码,就比如说之前我自己做了一个 store map 就是 门店信息的这种项目啊,就本质上就是把门店数据整理出来,再变成一个前端的看板。 那这种项目就可以在 github 上面去管理, pages 去发布页面, action 是 可以定期的更新, issue 是 去记录问题, release 去记录稳定的版本。所以说 github 也不是是程序员的一个代码仓库,它完全可以是我这样一个小白做这种清亮的项目的一个管理和发布的入口。 所以说最终总结一下,第一,把 gitap 当成一个项目的主页,不用先被这种代码啊去吓住。第二就是你可以看一些项目的名称, read me, 更新时间,然后再决定要不要试。 第三呢,就是你可以让 code 去帮你翻译成你能看懂的话,然后再用一些测试的文件和托米的数率数据去去验证。 最后呢,就是非常想强调一个点,就是免费开源就不等于它可以直接去运行,如果涉及到一些敏感的文件啊,账号啊,你的 api key 啊,或者一些权限啊,一定要让 codex 或者 cloud code 帮你解释清楚它会做什么,再决定要不要继续。 ok, 我是 fred, 后面我会持续用一些真实的案例告诉大家怎么把 ai 用到自己的工作流,我们下期再见。

我们今天来听一个广播剧啊,看一看这个开源的人生大模型好不好用。分手三个月后,林志祥第一次接到沈燕的电话。 姐姐你忘了你上次哭成什么样了。我没哭,我那是眼妆太贵卸不干净。 支架是我。我知道你号码,我还没来得及删。我在你家楼下,你那把备用钥匙我想还给你。放快递柜吧,密码发我就好。我还想把那句对不起当面说完。你要是下去我可就骂你了。那你先准备词吧, 我就下去。三分钟他挂了电话,嘴上说三分钟手就开始补口红听完了哈,有没有一点偶像剧那味啊, 所有的人生啊,都是一个开源的本地大模型跑出来的,不要钱,完全不需要你找配音演员,这项目可以用预设的音色,还可以克隆声音,你应该听出来了哈,沧桑一点的旁白 就是我的声音克隆出来的。还有哈,这个项目支持 a p i 的, 也就是说呢,你可以通过什么 call code 呀, code 啊这些一次性的批量的跑多个的任务。所以说什么广播剧啊,播客啊,有声书啥啥的,还不都是手拿把掐的呀,而且整个流程呢,不复杂, 还是和大象装冰箱是一样的。老规矩啊,教程呢,我会尽量的讲的详细,包教包会,所以要点好关注与收藏。那咱们就现在发车 这个项目叫做 voicebox, 是 这位叫做杰米派恩的大神开发的。这个呢,也 是一位六边形战士哈,你们可以去关注一下他,我觉得是目前开源的本地人声工具里面最值得看的一个,他既是一个桌面软件,打开就能用,背后呢又有本地 a p i, 也有 m c p, 所以 说呢, codex 啊, cloud code 啊这类的 agent 可以 直接去驱动他, 这个就很爽了,手动用呢,它就是一个配音软件,接上了 agent 呢,它就变成了一个本地的音频工厂,多角色多台词,理论上呢都可以拆开批量来生成,等不及了吧,那咱们先装软件, 打开它的官网,非常醒目的一个黄金麦克风,先点这个当 loft 按钮,我是 windows 哈,当然呢,就是下这个安装,没什么好说的哈,就是下一步,下一步的事 无脑往下走就行了,几十秒钟软件就搞定了。操作界面呢非常的简单,左侧呢就这么几个功能板块,这个像方块的东西啊,就是咱们的模型的功能,现在啊,你能看到里面所有的模型都是空的,因为我们还没有下载一会呢我 我们详细来讲模型,我们来到第一个生成功能,就是这个喇叭,这个时候还没有你的声音档案哈,咱们先创建一段,点击这个创建声音,这里呢你能看到有三种方式,最常见的就是录制,你需要先允许他访问你的麦克风,此外呢还有上传你已有的音频, 另外呢就还有系统音频,我就简单了呀,我录了那么多的视频哈,我随便呢截取了其中的一小段,这里呢选择上传。 上传成功之后啊,要把你的这段音频的准确内容用文字输入到这个文本框里面,右侧呢是填写声音名称,描述人物设定这一类的信息。这里呢一定要记得把语言设成 chinese。 输入好之后啊,点击下面这个创建档案就搞定了,在这个页面当中呢,你已经可以看到多出来了这个船长的音色卡片了,屏幕下方你还能看到一个输入对话框,这里呢,就是你今后生产声音的地方了。下面三个选项,第一个当然是选 chinese, 第二个呢就是我们已经下载好的音频模型。最后一个呀,项目预设了一些效果,类似于什么机器人呐,电台人声啊啥的这些呢,可以根据需要啊,你们自行去选择,自己试一下就知道了。这个按钮你可以注意一下,这个呢是可以通过大模型来帮你写题诗词的, 我们随便输入一段文字来试试看。你看到这个波浪在动哈,就是已经在生成声音了,大概啊,几十秒生成了这段九秒钟的音频。来听听看你的剑在我的喉咙上割下去吧,不用再犹豫了,曾经有一份真诚的感情放在我面前,我没有珍惜,事到如今,我追悔莫及。 感觉怎么样,跟我的音色你觉得有几分相似呢?弹幕来打个分吧。必须要说一下哈,我们克隆自己的声音当然没问题,但是千万啊,不要拿什么没有授权的声音去做一些商用,特别是什么明星啊,公众人物啊,这些工具是开源的哈,但是你胡乱搞是要承担责任的。 到这呢,我们已经可以生成音频了,这么多的模型应该怎么选呢?我们回到 github 的 项目主页哈,这张表呢是专门对七个模型做出的解释, 对应的呢就是咱们软件中的这一些模块,你可能发现怎么这里会多出来一些啊,其实就是其中的一些模型呢,它提供了不同的精度,或者说呢是体积。如果是主要做中文,又想模仿一个参考的声音 显卡,还有个什么八 g 十二 g, 那 你跟我一样,就先是千问三一点七 b, 如果你的性能稍微弱一点呢,就用零点六 b 的 千问模型呢,是主力模型。你如果要做长文章,比如说有声书,长故事,很长的口播,考虑 d a, d a 三 b 这个,这个呢比较重一点,对机器的要求呢,可能也会更高,但它呢, 长音频的一致性会比较好。那如果你的机器性能不太好,又想快速的出成果,这个 coco 就 非常的适合里面呢,它有一些预设的一些音色,你可以直接来选。如果是英文的环境清亮一点的,可以看一下这个 looks t t s。 多语言或者是强一点的表现感呢,可以看 chapter box。 好 了,前面呢只是开胃菜哈,接下来呢才是咱们的重头戏,我们来搭建项目的方式,完整的跑出一个广播剧,端好你的小板凳吧, 开篇的音频你是听了的哈,我只跑了一遍的,结果还不完美哈,语气啊,情绪啊,啥啥啥的,还是有瑕疵的,咱们今天讲的是方法学会了呢,你们 自己如果要把它当成生产力啊,今后慢慢来调就好了。按照老规矩啊,咱们还是先从项目文件夹开始,我新建了一个文件夹,首先还是让 context 把总共笔记建好,只要你看过我以前的视频呢,就应该知道应该怎么做哈,同时呢,还把剧本写好,剧本呢不是今天的重点, 有兴趣的话呢,留言区就可以多踢我文件夹里面呢,还有刚才我们用来生成音频的音频样本, 请出我们的老朋友 codex, 我 新建了一个对话,只干了几件基础工作,让 codex 定义好文件加路径,给他今天的 voicebox 项目的地址,让他去读取, 去学习,重点让他读总控笔记和剧本。提出接下来我们需要干什么。看来我的要求没有说的太清楚啊,他直接呢就开始克隆项目了, 我赶紧让他停下来,这个环节呢,先知道干嘛就行了,不要忙着获取项目。用 ctrl 加回车送出,重新引导了对话 告诉我呢,准备好了,不能着急啊,我们还得让 codex 确认几件事,我先把那七个大模型的表格部分让他先去看哪些是我们今天项目需要用到的,需要的呢才下载,再让他去确认我的音色是否能够正常的读取, 这样才知道一会能不能借鉴。使用很快啊,对于模型怎么准备,他给出了详细的建议。我这边呢就开始下载模型了,趁他下载的时候啊,我就继续的问 codex, 到底咱的环境是不是具备啊,你现在能不能调用他的 a p i。 同时呢,还问了他关于工作流的事情, 我们是要通过我们的笔记中的内容去驱动的,能不能做到好消息啊,他告诉我本地一七四九三的内容去驱动的,能不能做到好消息啊,他告诉我本地一七四九三的内容 工作流是可行的,你看看多省事啊,还是表扬了一下他。接着呢,我让他新建两个笔记,一个是接下来的工作流程,一个呢就是实际的深沉音频的提示词了,这里呢,还是要跟他多说几句啊,提示词呢,是给 大模型看的,不要留下过程性的表达。还有呢,提示词啊,自己你不要去瞎写,必须要参考项目的 readme。 他 干活呢,我又看看后台,咱们下载的模型, coco 已经下完了,其他的几个呢,也快了,再回来, cortex 把这一次的两个新笔记 也已经建好了,我们检查一下哈,比起上次升视频的那个简单多了。全区要求呢,写的很清楚,具体的每句话都用一个 text 的 文件块来放文字 顶规范。我把现在的模型下载情况,干脆啊截个图发给他看,问他呢,是不是可以开始生成音频来试试了。没问题哈,他说做一组低风险试音旁白呢,用 coco 试试水。 我看到他已经开始送出任务了,咱回到了 voice box 这边,在生成面板的右侧,你看到哈三个任务已经在自己在跑了。好,船长的旁白先出来。分手三个月后,林芝下第一次接到沈艳的电话,你要是下去我可就骂你了。 别接,你忘了你上次哭成什么样了?不错哈,跟刚才的调性几乎一样,不过呢,阿乔的声音就有点怪怪的了,看来这个小模型哈还是有问题。 不怕哈,我们的千问 custom voice 一 点七 p 已经下载好了,这次呢,咱们来换它试试。 callix 痛快的答复了,判定刚才的女生为不合格。然后说呢,把阿乔的用两个音色各试一条。好,跑完以后啊,我打开文件夹就是这个零零三和零零四这两条。 别接,你忘了你上次哭成什么样了?别接,你忘了你上次哭成什么样了?你要是下去我可就骂你了。别接,你忘了你上次哭成什么样了,你感觉呢?是不是零零三稍微要好一点?我让 callix 生成了完整版, 不一会儿呢,你看哈,所有的成果就都放到这里了,我们随便的编一编,就是你们开篇听到的广 广播剧了。当然,今天只是示范哈,像这种短的内容呢,你完全可以手搓就好,但以后你如果真要做那种几十分钟的很多角色的内容,这个项目型的方法就能起到大作用了, 会变成一个非常实用的生产线。回头看,流程其实并不复杂,剧本负责,内容负责,谁说话提示词呢?告诉模型说什么内容? voice box 呢,负责出声音, max 呢,负责把这一全部的东西串起来,而我们人类啊,则负责统领他们判断效果。这个呢,才是这一类工具真正有用的地方。 当然啊,现在不完美啊,明显呢,有些地方情绪不对,音色也有瑕疵。如果你有条件的话呢,可以请你的声音条件不错的朋友帮你来录一些彩样。这个当然,人家得愿意哈,光有人声呢,是不够的, bgm 和环境音效这些更加的重要, 不知道你有没有兴趣啊?好了,今天内容啊,希望能够帮到你。照例呢,所有的文档、笔记,剧本儿的格式全部都已经整理好了,期待早点听到你的有声书作品,让我们下期再见,拜拜。

最近把阿里云百店开源的 c r i 接入到了 color code 之后呢,我的 color code 的 能力直线拉满。现在呢,它可以直接生成声音、图片、视频,拥有了图文声像的权杖能力, 几乎所有的场景都可以在 code code 里面完成。有了百灵的 c y, 就 能自动串联所有的能力,把我的脑洞直接落地。比如这是 ai 生成的 ppt, 默认没什么图片,但这里感觉太空了。我只需要告诉 code code 在 空白位置配上合适的图片,它就可以理解 ppt 的 风格和内容, 来制作出和整个风格完全匹配的图片,并且放到合适的位置。我可以在克罗地里生成浑身肌肉的我,杀马特风格的我还能变胖或者变瘦。我可以让他克隆我的声音,然后生成口播内容。 大家好,欢迎来到今天的科技前沿。接下来我们一起看看 ai 圈又发生了哪些大事,也可以将我的声音变得更有磁性。小朋友, 今天阿亮给你讲一个关于小星星和萤火虫的故事。在很高很高的天空上,住着一颗小星星,他每天晚上都会亮晶晶的眨着眼睛,还可以说一口流利的英语。 i am really excited to talk with you today about the future of artificial intelligence to creative tools the possibilities are truly endless, we can build a brighter and more connected world for everyone。 还可以应用到电商场景。这是一张实物图, 我让 color code 生成多角度多场景的电商详情图,甚至一键切换。女童鞋,还有这儿,这是我亲手制作的儿童有声电子绘本。手牵手往前走,勇敢大步不回头。白白深吸一口气,紧紧抓住壮壮的手, 他们一起念着,手牵手往前走,一步一步走,过了小河,过了河,白白开心地笑了。接入方式呢,也非常的简单,在 github 上找到百炼杠 c n 这个开源项目, 然后把这行命令复制到你的 ai agent 里,让 ai 帮我们安装就可以。比如我用的是 cloud code 复制这行命令, 然后根据提示输入 a p i k, 再复制第二行命令,获取 a p i k, 粘贴到终端。 ok, 配置成功,你也可以接入到 codex, pharmacy agent, open cloud 里面,等等都可以的。我这里也整理了一份详细的文档, 文档里也有我做的用自己的声音制作口播内容的 scale, 生成电商详情图 scale, 生成带货视频 scale 和 ppt 配图的 scale 等等啊。接下来给大家演示一下如何使用百炼 c i。 其实呢就是一个 scale course, code 里输入斜杠百炼杠 c i, 然后输入我们要干的事, 比如让它给我生成一个儿童有声电子绘本,主题呢是关于哪吒和悟空之间的故事。要做类似的产品,如果没有百炼的 c i, 我们需要先在 code code 里把故事写好,然后呢,再用生成声音的工具去生成配音,再把故事呢复制到生图工具里面去生成图片其实非常的麻烦, 并且每一步可能会造成信息的丢失,导致最后生成的效果呢,没有那么的完美。而现在在 code code 里就能直接生成,可以看到它自动拆解,全流程生成原创故事,生成配套的插画 美业合成了配音。最后呢,输出 html 看下效果啊。踩着风火轮的小哪吒吹起一阵顺风,哎呀不好,山洞里跳出一个巨大的呼噜噜,泥怪,别怕,我们来帮你!只要团结合作,再大的困难也能变成最甜的果实。 整套绘本落地效果很出彩,三 d 的 卡通画风童趣十足啊!哪吒、悟空形象呢,非常贴合儿童的审美画面故事、文案、配音三者完美配套。这个就是一键生成的,虽然对故事理解的真的是非常的到位。现在如果想换一下声音,只需要和他说, 把声音换成阿亮讲故事的声音。哎,一分钟就换好了,再听一下啊,这是我自己的声音。云朵软绵绵,像个大蹦床,小悟空挥挥金箍棒,变出一座彩虹桥。哎呀不好,山洞里跳出一个巨大的呼噜噜,泥怪,别怕,我们来帮你! 小哪吒引来清凉的山泉水。只要团结合作,再大的困难也能变成最甜的果实。我把这个生成电子绘本的过程,就能一键生成绘本。 我把它开源到了我的 github 上,也可以快速制作电商带货的视频,单张商品实拍图,一键就能生成模特上升的实拍带货视频,正面穿搭、侧身展示,甚至连贯舞蹈动作呢,全都轻松拿捏。当然了,不止电商的实景,跨界创作也能玩转。 只要提供一个黑妹的形象,你就能得到一个热情洋溢且张力十足的脱口秀演员。不光呢可以用来内容创作,还可以连接企业内部的知识库,可以让 agent 充当客服,根据知识库中的内容自动回复客户的问题。也可以做成七成二十四小时在线的 hr 来回答员工的问题。海量 c i n 呢,是最近一段时间让我比较惊艳的产品经营的一个趋势,就是面向 agent 开发产品, 大厂呢,也在将自家的这些工具呢 c i n 化,让 agent 更好地调用,接入这些 c i n 呢或 skill, 可以 大大地提高 agent 的 能力,同时呢也能提升我们的效率。大家点点关注哈,跟着阿亮学 ai。