这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!
粉丝32.1万获赞107.9万

hermes agent 到底强在哪里?和 oppo cloud 又有什么区别?没有废话,从安装使用技巧对比测试,系统增长一次全部降为一百,走,我们出发! hermes agent 原声安装啊,仅支持 mac os 和 linux 系统,相对呢比较容易呃,这样一条指令就可以了。 但是呢, mac 啊,记得要先装 git 啊,都是高手,不多说了啊。所以呢,我们就直接用 windows 来演示 mac 呢,直接从 set up 这一步看是一样的,零基础零踩坑,手把手交换部署,一步不露。 windows 上啊,必须要用 wsl 的 子系统,意思啊,就是让你在 windows 系统多一个 linux 的 子系统。我们首先用 porsche 来执行这样一行指令, 那如果这一步提示报错呢?大概率是你电脑里的虚拟设置没开英特尔平台呢,虚拟设置一般是叫这个,然后 amd 平台的话呢,它里面的指令是这个, 打开虚拟化以后啊,再回 windows 继续安装就可以了。大家手里的虚拟化具体要怎么设置啊,可以咨询一下豆包,我就不浪费时间解释名词了。第二步,进入阿布图,这是 linux 的 系统环境,不用管它叫什么啊。呃,我们同样在 power 里面输入这样的指令, 第一次进入啊,它会让你创建用户名和密码。呃,这里给大家说明一下,它并不是说替代了 windows 系统啊,只是跑在 windows 里面的。 linux 的 环境也不会是双系统,就当成是一个应用就可以了,大家放心用。第三步,处理网络环境问题。呃,这是 windows 用户最容易卡住的地方, windows 本地的网络配置啊,当你正在使用魔法的时候, wsl 是 无法直接附用的,因为两者的网络环境呢,是相互独立的, 这时候呢,我们就可以输入这行指令来适配网络地址,如果输出你的网络地址是这个,那就执行网络配置,把你的网络地址替换到代码块中央就可以了。 第四步是安装依赖啊,赫曼斯安装前有一些必备的依赖啊,这也是推荐大家手动安装齐全,稳定性的话会高一点,可以直接输入以下这个指令完成安装。我这边呢是提前装过了,就不演示了,大家可以自取参考。 第五步啊,完成上面的步骤以后呢,就可以正式安装包我们直接输入这行指令 啊,如果过程中出现传输失败,报错中断,通常呢是由于你的网络不稳定导致的啊,别紧张,这个时候呢,我们按 ctrl 加 c, 中断当前的任务,执行这两行优化命令,切换一下网络,再重新用上面的指令继续安装即可。 第六步,创建虚拟环境并安装 home, 我 们直接输这个指令。 好,这里如果你们下载速度很慢的话,可以切换国内镜像员来提速啊,用这个指令就可以了。然后呢,我们重新安装命令即可。第七步,启动 hermes, 我们用这两个启动代码 ok, 那 到这个界面呢,就恭喜你配置成功了, purpose setup 会让你配置模型、服务商和接口凭证,比如说 mini, max, open two, norse 等,选择自己常用的就可以。 注意啊,在这里输入凭证时啊,界面呢是不会显示字体的啊,直接粘贴回车就可以了,后续的步骤啊,全部默认按回车,一键完成配置。好,现在我们来和他对话一次看看,收到回复就说明你的 hermes 已经成功部署上线了。 最后总结一下, windows 安装 hermes agent 真正的流程不是一行命令结束,而是先开虚拟化,再装 wsl, 再装 unboot, 再配置网络,再准备依赖。最后才是安装 hermes。 装 hermes 啊,前半场都是在调试系统环境和网络,后半场呢,才是部署工具本身。好,接下来让我们看一下 hermes agent 的 三个实用小技巧。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

ok, 重头戏来了,这一期主要给大家讲一下怎么使用 codex 和其他工程软件连接,然后完成一些工作。首先的话是 thirdworks, 我 们可以看一下它的工作流,可以看出 thirdworks 不 需要接 mcp 的, 它是会调用 thirdworks com 口,然后通过 vbs 脚本进行建模。也就是说我们只需要给它工程图或者描述我们自己的需求就行, 它自己也能打开 thirdworks, 但是我们自己打开的话会省很多启动时间。第二个的话去 matelab, 我 们看一下它的工作流, matelive 也不需要接 m c p, 我 们也只需要描述自己的需求就行。第三个的话就是 ency, ency 是 需要接 m c p 的, 但是我们可以让他自己接好,就是我们给他说一下,给 ency 接一下 m c p 就 行, 他就会自己接好。接好 m c p 之后,我们就可以通过脚本仿真求解了。当然以上这些操作,包括想要达到我在视频中展示的一键全自动生成,都是给他开放的完全访问权限不, 如果开放这个完全访权限也有一定的风险,大家可以根据自己的需求选择开不开。呃,当然也可以开这个默认权限或者是自动审查,这样的话他会在一些关键操作的时候征求你的同意,就很安全了。或者我们让他在指定文件夹工作,这样的话也很安全。

如果你最近也给你的 codex 或者 clockwork 装 skills, 很 容易掉进一个坑,就是你被推荐了几十个甚至上百个 skills, 但是真正开工的时候还是不知道该选哪一个。所以说这一期呢,我也不做大而全的清单,也不讲复杂的安装, 我只按普通小白最容易遇到的六类任务去挑六个 skills。 新手先认识这些就够用的一些 skills, 它们能够分别帮你去解决任务,先问清楚想法,先变方案,知识库能调用,重复流程能沉淀网页结果能验证和各种文件都能够转化成 ai 好 读的这种材料。 ok, 大家好,我是 fred, 专注从普通小白的视角去分享怎么从零开始用 ai 和 web coding 提升自己的生活和工作效率。 那第一个 skill 就是 大家已经耳熟能详的东西啊,就是 using superpowers, 就 它的核心作用是能够让 ai 在 开始做事之前先停下来,把任务问清楚。 就很多时候很多人用 ai 的 痛点不是说 ai 不 会写,而是它太快开始写了,就是你一句话发给他,他可能马上能够给到结果,结果做完了之后才发现说你的目标边界格式和验收的方式都不对。 那这个 skill 所做的事情就是让 ai 先理解任务再计划,最后再验证。所以说它特别适合那种长任务,包括你的需求模糊的时候,以及你经常让 ai 做完又返工的这种场景,那这个 skill 那 就非常适合。 第二个是我非常常用的 skill, 就是 brainstorming, 就 它解决的就是想法,当你还没有想清楚的时候,可能就着急开做的这种问题, 很多人找 ai 去做东西,一上来就说,哎,帮我做一个网页,哎,帮我写一个方案。但其实当你的目标用户,你的内容重点,你的功能边界都没有定的时候,那这就体现了 brainstorming 的 价值, 它会让 ai 先跟你把想法聊清楚,再给两到三个不同的方案,并说明每个方案的一个取舍。比如说你要做一个内容栏目,一个页面,一个工具,一个产品的 demo, 它会先问清楚做给谁看,解决什么问题,哪些功能要不要做, 然后再把你的模糊的想法整理成可执行的这种设计。所以说它适合新项目开头,包括内容策划的开头或者功能设计的开头。 第三个也是我经常会用的一个 skills, 就是 obsidian skills, 就 如果你在用 obsidian, 或者你有大量的笔记资料网页的这种摘要,那这个我觉得就非常值得去收录啊, 就它不是简单地帮你去多存一些笔记,而是让 obsidian 里面的这种 markdown 的 文本,这种 bases 或者 canvas, 或者你的网页资料能够变成 ai 可以 重新组织的这种工作材料 就很多人的知识库最大的问题就是资料一直在往往往里面堆啊,然后真正写文章的时候,做研究的时候,包括你复盘项目的时候,就很难够重新再调动出来用。 所以说这个是会更适合内容创作者、研究型的岗位和那种顾问啊,或者长期的学习者,他的价值能够帮你把长期积累的变成一个可持续输入的一个资产。 第四个我相信是一个所有人都一定会用到一个 skills 啊,就是 skill creator, 它的作用就是帮你去生产你的 skills, 那 它解决的是你的一些重复流程的问题,比如说呢,你每周都会让 ai 写周报,那每次都要重新去讲格式、口吻,保留字段,或者一些审核的一些标准, 或者你反复让 ai 去帮你整理资料,改一些发布的文案,或者检查网页,那这些事情如果我每次都重新解释,去写一些 prompt, 写一些提示词,那本质上就是没有把这些 流程给沉淀下来。那 skill creator 的 价值就是帮你把每一次的对话变成一个可附用的 skills, 它适合做一些固定的格式,然后重复的流程,以及你希望以后能够把自己和团队都能够稳定使用的任务沉淀下来。 第五个呢,是 pay write, 其实它不是一个 skills 啊,就它更像是一个呃,浏览器自动化的能力 就是它可以让 ai 真正地去打开网页,去读取里面的页面的状态,点击按钮,包括说填写表单,截图,检查做网页或者落地页这种后台表单产品 demo 的 时候呢,这个非常非常有用啊,就因为很多时候 你只看代码是看不出来的,比如说按钮点不了,或者文字溢出,或者移动端变形,对吧?或者表单提交失败,这些都是要真正打开浏览器才知道。所以说 playwrite 的 价值就是让 ai 不 只是生成结果,还能帮你验收结果。 最后一个呢,就是 mock it down, 它的作用是能够把各种文件转成 ai 更好读的 mock down 的 这种文本,比如说把 pdf, 你 的 word, ppt, excel, 甚至网页 html, 一 些 csv 或者 jason 图片甚至音频, 都可以转成结构化的文本。为什么这个重要呢?就因为很多时候 ai 总结不准,其实并不是它模型弱啊,而是输入的这种文件结构太乱。比如说文件里面有表格,有分页,有图片,有格式, 那 ai 直接读就很容易漏掉一些重点。所以先用 markdown 这个 skills 把材料变干净,再去总结提取和改写,那结果通常就会变得稳定很多。 所以说呢,这六个 skills, 你 可以把它们理解成 using superpowers, 帮你先问清楚。 brainstorming 帮你用好知识库。 skill creator 能够帮你沉淀重复的流程, 而 playwrite 能够帮你去验证网证网页的结果,或者帮你去爬取一些网页的数据。而 markdown 能够帮你把文件变成 ai 好 读的这种材料。所以说你也不用一口气全装啊,也可以一开始呃,慢慢的一个一个去选,先知道它们分别能帮你做什么,后面可能遇到一些 对应的问题,然后再去用一些对应的 skills。 ok, 我是 fred, 后面我会持续帮你去猜普通人怎么把这些能力用进自己的真实的工作流。 ok, 评论交流你现在最想解决的一个 ai 问题,我会在评论区里面去回复,我们下期再见。

前两天发的 cloud 指挥 codex 干活的视频火了,评论区两级分化,有人说这套架构确实提效明显,也有人说纯玩具卵用没有。 今天我们就一步步把这套写作系统搭起来,建议先点个赞,关注加收藏。我的态度很简单,没有调查就没有发言权,跑一遍再下结论。 好,先说清楚这套架构到底有什么好处呢?第一,在复杂编码场景下,极大降低 cloud token 消耗。 cloud 最贵,但我们不让他写一行代码,只让他当甲方领导,当项目经理,分析需求、拆分任务、验收结果,最费钱的代码实现全部交给别人来做。第二,实现监工效果。 cloud 充当甲方领导和项目经理,负责规划和验收。 codex 是 后端开发,负责服务端代码编辑和单元测试。 gemini 是 前端工程师, 担任代码审查和安全审计。第三, codex 和 gemini 成本几乎为零,量大管保。结论就是 cloud 出脑子, codex 和 gemini 出力气,钱花在刀刃上, 真正花钱的只有 cloud 做决策那一小部分。在开始之前,你需要确保三样东西都装好了,分别是 cloud code、 codex client 和 gemini client, 执行视频中的三个查看版本的命令,如果都有版本号输出,那环境就没问题,没装好的先暂停视频去装一下。 第四,也是很多人漏掉的一步,理解整个工具链的使用顺序。这三层是有先后关系的。第一层 cloud md 是 规则层, cloud 启动时自动读取,里面定义了协助、规范和角色分工。 第二层, superpowers 是 能力层,提供标准化的规划、审查、调试流程。第三层, c、 c、 b 是 通信层,让 cloud 能通过 ask、 pen、 ping 指挥 codex 和 gemini。 第五,在 cloud md 里写好协作规范。接下来看我本地的文件。首先定义了 cloud 是 架构师、项目经理, codex 是 后端开发, gemini 是 前端开发,这是最基础的角色分工,简单明了 降级机制,明确了异常情况下的接管规则。接着明确了协助方式,使用 superpowers 进行任务设计,通过 c c b 相关命令指派任务。 同时还定义了 linus 三问以及 get 代码提交规范等。这些规则 cloud 启动时会自动读取,不需要每次手动告诉他。你只要把规则写好, cloud 就 会严格按照规则来执行 好。接下来我们进入 cloud 执行视频中的命令,进行 superpowers 插件安装,执行视频中的两条 plugin 命令就可以出现, successfully 就 证明安装成功。 安装完成后, cloud 就 具备了标准化的规划、审查、调试能力,这些能力后面实战中会用到,非常关键。接着要安装终端附用器。 ccb 是 依靠终端附用实现多个模型之间的通信, linux 和 mac 用户安装 tmax 即可, windows 用户需要安装 winterm 或者使用 wsl。 本教程以 tmax 为例,安装方法很简单,一条命令就搞定,执行命令后,我们进入新的终端环境。第八,安装 ccb, 全称 cloud code bridge, 这是让三个 ai 互相通信的桥接器。注意, ccb 是 社区开源项目。特别感谢 bfi 幺二三作者的贡献,它不是官方内置功能。 ccb 依赖 python 三点一零以上版本,安装前先确认你的 python 版本没问题。 python 版本确认无误后,我们执行 git clone 下载 ccb 项目,下载完成后 cd 到项目目录, linux 和 mac 用户执行 install h install 命令, windows 用户用 powershell 执行安装脚本,安装过程中 c c b 会自动配置通信组建,并在 cloud md 里注册 ask、 pinned、 ping 这些命令,等安装脚本跑完就可以使用了。你可以看到终端输出了安装成功的提示信息,整个安装过程非常顺畅,基本不会遇到什么问题。 好总结一下安装步骤,第一步,编辑局域, cloud md 定义协助规则。第二步,安装 superpowers, 提供标准化工作流程。第三步,下载安装 ccb, 打通多模型通信。三步走完,整套系统就搭好了。接下来我们进入实战环节,执行 ccb、 codex、 gemini、 cloud 命令,启动协助系统。 第二部分, cloud 是 项目经理,只动嘴不动手, codex 和 gemini 是 干活的,成本几乎为零,这就是省钱的核心逻辑。 cloud 现在开始下发任务,我们用一个真实案例实现用户注册功能需求如视频所示, cloud 调用 superpowers 开始收集用户需求,制定开发计划,可以看到它在分析需求,确认技术栈,设计系统架构,整个过程完全自动化,不需要人工干预。我们简单看一下 cloud 生成的计划, 规划的非常清晰, gemini 和 codex 的 分工非常明确,甚至还详细列出了项目的文件、架构、接口文档、验收标准等内容,这就是 superpowers 规划能力的价值,省去了大量的沟通成本。 cloud 把规划好的后端任务通过 ccb 发送给了 codex, 你 看画面上, codex 收到命令后,立刻开始疯狂扣顶,速度非常快,文件在不断滚动, 可以看到 cloud 已经获取到 codex 正在执行任务的状态。与此同时,他又通过 ccb 给 gemini 下达了前端开发任务, 两个模型现在是并行工作的,互不干扰,效率拉满。 gemini 收到了任务。你看,任务里面明确列出了前端开发功能、验收清单、注意事项等内容。任务描述非常详细, 这就是 cloud 作为项目经理的价值,把需求拆得清清楚楚。两个打工人正在努力完成需求,我们稍等一下,看看他们的执行结果。 cloud 为了更精确地掌握开发进度,建立了三个 task, 用于跟踪前后端开发及代码审查任务。你看,它自动创建了任务列表,标注了负责人和当前状态,这就是项目经理该干的事情,实时监控进度,确保项目按计划推进。 这时候, cloud 发现 gemini 只是确认了任务,而并没有真正开始执行。随后, cloud 重新将任务委派给 gemini, 催他赶紧开工,你看这个监工效果是不是很到位。另一边, cloud 跟踪到 codex 已经完成了开发和测试工作。接着 cloud 去查看 gemini 的 执行进度,结果发现 gemini 还是只确认了任务,没有动手, 这已经触发了降级规则。于是 cloud 果断让 codex 接管前端开发。这也是这套架构的另一个特色,无需让用户去处理这种特殊情况, 只需要把任务交给 cloud, cloud 就 会根据 cloud md 里定义的降级规则自行安排处理,直到完成项目要求。整个过程完全自动化。 codex 此时正在飞速编写前端代码,一个人干两个人的活。这里我们跳过执行过程,直接看最终结果。 完美 codex 已经完成了前端开发工作,但是由于我们在掩饰中故意让 gemini 不 可用,所以 cloud 只能亲自开展代码审查工作。他调用了 superpowers 的 审查能力, cloud 完成了代码审查,出具了详细的 review 报告。接下来他开始创建 git 提交。我们来看一下 cloud 做的 review 报告, 报告内容非常清晰,详细总结了前后端代码的完成度、安全审查结果是否存在潜在漏洞,以及整个写作过程的总结和验收标准的达成情况,质量相当高。 好,我们来做一个总结, c c b 加 superpowers 这套架构的核心特点是灵活高效,节省 token, 合理分工。 cloud 只做最关键的决策和验收,所有编码工作全部委派出去, 降级机制保证了系统的容错能力,任何一个模型出问题都不会影响项目的正常推进。多 ai 写作的关键不是模型数量,而是统一输出和统一验收。建议先用 cloud 加 codex, 两个模型跑通一个完整流程,稳了再加 gemini。 下一期我们讲 crcd 与自动化,把今天搭的这套工作流接入,持续集成流水线。点赞关注不迷路,我们下期见!

你看啊,这张图不就全部帮你拆成 ppt 了吗? gpt 加酷 max 目前啊,是我认为最有效的 ai 工具组合了,不要总想着去订阅一堆工具,才能提高你的工作效率。欧本 ai 现在已经非常全能了, 做 ppt, 做插画,剪动画素材,做编程,还能养养电子宠物,基本上啊,还盖了你在工作中的大部分场景。那废话不多,先来看看做 ppt 到底有多简单。我们出发 ppt 这个东西啊,肯定是属于我们都市牛马的必备技能了。当我们需要做一个全新的 ppt 时,第一个难题就是要找个模板先参考一下,要不然啊,总感觉很难下手。好,那这个好解决啊,我们直接上手就用 ai 来搭建一个模板,一切问题啊,迎刃而解。 先到网上找一张自己觉得满意的风格图片,直接贴给扣带斯,让他根据图片的风格设计一个 ppt 模板,我们来看看他的分享, 深空星河、暖色地平线、山脉剪影、精细型典风格拆解啊,都很到位,要你自己来说啊,这话你可能还描述不出来,毕竟啊,现在 g p t 的 识图能力和作图能力已经是第一题对的了,绝大部分风格啊,都是手拿把枪。其实呢,现在也有很多 ai 工具啊,都可以做 ppt, 我 自己啊,也有试过一些,但是呢,总感觉差点意思。好的啊,这里啊,他已经完成了,我们来打开看一下怎么样, 这个风格啊,是不是比较简约?时间线啊,逻辑线啊,也都是比较清晰的,其中的任意元素如果有什么需要调整的,都可以手动来调。当然啊,如果通用的模板你还觉得不够用的话,我们就再给他升级一下难度, 把这个 ppt 模板改成更适合题案,而且适用于新品上市的投放计划。或者还有更简单粗暴的方法,直接跟他说出你的需求,要调研什么,达成什么目标。如果你没有思路的话,就跟他聊,聊出你想要的内容之后再让他生成 ppt, 一 气呵成。 好,我们来看一下成果,依旧是这个简洁的风格,注意看啊,投放计划的元素都有保留哦,包括人群、场景、节奏,必要的元素啊,全部都有了,怎么样?就这么两三句空话就搭出一个 ppt 模板,老板还满意吗? 那么接下来啊,我们来说一下做 ppt 的 第二大痛点,引用和借鉴。平时我们在做 ppt 的 时候啊,看到一个不错的内容,或者说啊,做的不错的模板,想引用借鉴一下的时候啊,却发现这是一个 jpg 或者 pdf 文件,没办法编辑,这个时候的心情啊,往往是崩溃的, 还我没事,现在我们来试着解决看看啊,先去网上找一个复杂的 ppt 样式,就拿这个图为例吧,我们使用一下这个 skill, 跟他说帮我拆成 ppt, 你看这不就搞定了吗?每个元素都是可以编辑的,这样是不是省事多了?当然啊,关于图片转 pdf 这件事啊,有很多工具都是可以办到的,并不算稀奇,但是呢,可能需要收费,或者就是要你看一段讨厌的广告。 那既然如此啊,还不如直接就用 codex, 因为叉 gpt 实在是太全能了。没想到除了编程能力以外,别的啊也是样样精通,不管任何需求,全部大白话跟他讲就可以了。 那总体来说啊,这个 ppt 功能就已经让你省心省力,提高工作效率了,基于提升生产力的消费投入都是智慧票价的。好,今天就分享到这里,大家还有什么想知道的评论区留言,我来帮大家试试。我是阿月,我们下期再见。

gbt 五点五被认为是目前最强大的模型,那对普通人来说,究竟能用它来做什么呢?所以我深度使用了几天,整理了四个超级实用的玩法。今天这条视频就来分享给大家,我们直接开始 第一个做产品调研。对产品经理来说,社交媒体上的用户反馈其实很重要,因为很多真实的吐槽往往不是出现在正式问卷里,而是出现在评论区 ready 的 这些地方。产品经理最怕闭门造车,但问题是这些反馈如果人工一条条捞回来, 分类总结起码一天起步。 gpd 五点五发布之后, cloud 官方发了一篇推文,解释了 cloud code 降至的原因,并做了改进说明。但官方的说法是一回事,用户买不买账是另回事。我特地把 cloud 这条推文下面的评论,以及 reddit 上一些用户的反馈都整理起来, 让 gpt 五点五帮忙判断用户到底在抱怨什么,下一步应该改进什么。可以看到 gpt 五点五的分析非常详细,它把内容分成了用户反馈、代表性评论、问题归因、信任评估、 行动清单这些大类,每个类别都给了对应的场景、应对方向和下一步动作。我们以前做这样一份表格,可能要花上两三天,或者是找第三方调研公司,但现在只要有足够的信息给到 gpt 五点五, 再结合 context 这个 open ai 自己出的 a 站的工具,相当于 gpt 五点五的手,它就可以帮你梳理的非常详细和系统化。第二个用法,做汇报 ppt。 以前我们用 ai 做 ppt 的 时候,主要看它排版好不好,审美够不够,但往往忽略了一个更重要的一点, ppt 真正发挥作用的地方不是好看,而是能不能推动决策。 毕竟 ppt 往往用在职场中一些非常重要的场合,比如转正报告啊、晋升答辩啊、年度总结。所以,仅仅美观是不够的,我们还需要一个聪明的大脑,帮你把背景、问题、方案、风险以及希望领导拍板的地方讲清楚。我 这次试着让 gpt 五点五模拟一个产品负责人的视角,做一个把 ai 客服系统延期三周的汇报。他直接生成了一个有审美、有内容,而且风格非常专业严谨的 ppt。 它不仅能够在你提供的信息技术上提炼出核心要点,而且所有内容,包括色块、字体、数据都可以进行二次编辑。 当然了哈,这个 ppt 肯定不能直接当做最终稿,但它提供了一个非常完整的框架,我们可以用它来梳理思路,然后再调整优化。第三个用法是制作动态科普。 现在 ai 的 概念越来越多,其中还有很多非常抽象的概念。有时候我们需要向朋友、同事或者非技术团队解释某个概念,口干舌燥说了一大堆,还是很抽象。所以用这种能看见、能操作的交互网页会更有帮助。我让 gpt 五点五制作了一个解释上下文窗口概念的网页, 他在左下角用一句话解释了上下文窗口的重点。 ai 不是 无限记忆,在一次对话里,他能记住内容是有限的,还形象的做了一个上下文占用比例的进度条。 我试着把指令文件、聊天记录这些拖进去演示,可以看到,当上下文占用量超载之后,原先的那些指令和文件就都被压缩,最后甚至被挤出去了,这比我们用抽象的文字去表达要直观的多。这个思路还可以延展 其他的 ai 概念,或者说是物理、数学概念,也可以让他做出来,比如让他讲清楚复利业变换或者背页式定义,这些都很方便学习。最后一个玩法是办公培训。以前企业要开展 ai 培训,通常是从外部找机构定老师, 老师需要根据企业的实际情况梳理课间,尤其是给行政、市场、销售、人事这些非技术部门做课间,然后再开展一到两天的封闭式内训, 这个过程既耗时又耗财。所以我就用 gpt 五点五做了一个通用的企业内训 skill。 当你输入需求,它可以自动生成一份系统且具体 可交付的企业 ai 内训包,里面有培训方案、培训课件、 ai 工具、应用表、学员练习册、培训测试题以及课后七天行动计划。 创建第一版 skill 大 概只用了十来分钟,让 codex 安装并测试之后,我发现两个问题,第一个是它生成的全部都是 markdown 文档,还需要转换格式。第二个是在整个培训方案中涉及到工具的部分,讲的比较泛,所以我把问题反馈给他,让他优化升级。 第二版改好之后,我就丢了一句,帮我生成一个 ai 办公室提效记录训练营的内训包,没给行业,没给员工画像,但它生成的文件清单是多样的,有 ppt、 excel、 word 和 markdown 内容。我们也来看一下。首先最核心的培训课间,他直接列了这样一个框架, 你可以按照这个框架填充具体内容,也可以再提供行业、企业背景信息,让 gpt 继续细化 ai 工具应用场景表,把市面上主流的文字、图像、视频模型都放进去了, 还匹配了适合的岗位任务场景提示词。在这个记录上,你再根据要培训的部门稍微二次加工一下,就能直接用了。实战比讲课更重要,所以在学员练习册中,他也把一些工作中的高频场景放了进来,比如整理会议基奥、分析常文档、改写邮件。 课后七天行动计划,按照学习难度和上路顺序做了一个任务表,第一天选择任务,第二天拆解任务,第三天写题词词,循序渐进。我觉得这个培训包有两个明显的优点,第一个是非常系统化, 你不用从零到一去想内训究竟要策划成什么样子,而是可以直接用这个框架来细化内容。第二个是延展空间很大,拿到这个初步方案之后,你可以再把脱敏之后的行业信息、企业资料以及员工现阶段的痛点、难点 丢给 gpt 五点五,让他去细化这个培训班,我认为他至少能省掉前期规划的工作量。那剩下的呢?就按企业实际的情况往里面填充具体内容。以上就是今天分享的四个深度玩法, gpt 五点五我觉得确实好用,能听懂话、会说人话、能干活。这四个玩法可能不像网络上一些演示那么炫酷,但根据我的经验呢,他们是比较能够结合实际工作去应用的方法。那今天的分享就到这里,下期再见。

面对全网热捧的 web coding 和 openclaw, 没编程经验的普通人到底能用 ai 编程做些什么?本期视频我会站在一个普通人的角度来聊聊这个问题,而且我还用 open ai 的 codex 做了一个试例,希望本期视频能帮大家打开一些思路。 我个人认为, ai 编程对普通人最有价值,也是最容易真正用起来的,就是提高工作效率。比如我平时会给游戏公司做广告素材提交出稿的时候,对我来说就是一个非常典型的重复劳动,单纯浪费时间。有这个时间我可以多写一个脚本,或者多做一个选择题。 刚开始我也想过在网上找现成工具,但很多这类工具都会压缩画质,完全达不到我的要求。我就想能不能直接用 ai 来帮我写一个批量加水印的工具呢?今天我主要使用的是 open ai 的 codex, codex 是 前段时间新推出的 ai 编程工具,目前 plus 会员和 pro 会员都可以免费使用。进入 excel 主页之后,点击这个 codex 就 会跳转到它的主页。我个人建议啊,最好把 codex 的 应用下载到本地,用起来更方便。打开应用之后,点击 add new project, 这时候就会弹出文件窗口,在电脑里找一个空间大的盘创建文件夹。比如我这儿新建了一个 test 一 之后, codex 写的代码文件都会保存在这里。因为我这个水印工具已经做好了,所以就直接带大家来看一下我前面是怎么一步一步把它做出来的。 一开始我只用大白话提了一个需求,我想做一个批量给图片增加水印的工具,水印位置可以设置,他思考后呢,给了一版初稿,我测试就发现了第一个 bug, 没办法选择本地文件,所有电脑里的图片不管什么格式都选不了。我又发现了第二个 bug, 选好原图和水印图之后呢,没有预览图, 这个是很重要的,因为没有预览图,我就不知道水印放的位置和效果怎么样,我直接就截图发给他。处理完之后,这个图片水印工具就可以用了。我们先来看一下成品,这里可以选择原图和水印图,选完之后,右边就会出现预览,这里可以调整水印的位置, 比如说什么右下角、左下角、中间等等,选项很多,这边呢还可以调整水印的大小,透明度也可以修改。而且 codex 还考虑到边距问题了,就是水印离图片边缘的距离也能调。最后再选择输出文件夹,点击开始批量处理,它就会直接把处理好的图片输出到你指定的位置。那如果我手动处理六张图,至少也得两三分钟吧, 现在有了这个工具,几秒钟就能搞定。有了这个图片水印工具之后,我就开始思考,在给游戏公司制作素材的时候,还有哪些步骤可以让 ai 编程帮我解决。 然后我就给 codex 补充了三个新的需求。第二个需求是批量处理图片尺寸和大小,因为很多广告平台对于图片尺寸和文件大小都有要求。第三个需求是把一张一比一的图片拆成九宫格,这种形式大家在平台上应该能经常看到。第四个需求是批量给视频增加水印, 连图片出稿都要加水印,那视频出稿肯定也是需要的。这三个新增的需求主要目的也都是为了帮我节省时间。我让 codex 把这四个需求整合成一个工具箱网页,首页要有四个按钮,点击就能跳转到对应功能。我测试后发现了一个共同的 bug, 四个工具都没有预览图, 而且都不能选择下载路径,我就截图反馈给他,他发现确实是同一个问题,然后就都修复了。我继续测试,发现视频水印工具还有一个问题,没有办法输出视频,接着反馈,接着修复,最后我就得到了一个完美符合我需求的工具箱网页,一起来看一下效果。首先可以看到首页有四个按钮,分别对应着我四个需求。这个页面排版其实挺好看的啊,整体是很简洁的风格,而且它还做了一些细节, 比如这个鼠标悬浮上去的时候,卡片会有轻微浮动的效果,这种小设计我觉得还是挺加分的。图片水印功能和刚才给大家演示的一样,就不重复演示了。接着看图片尺寸处理功能,我这里选了一张一比一的图和一张十六比九的图,页面里同样会有预览,还会告诉你输出规格和预估文件大小。选择输出文件夹之后,点击批量处理,它就会直接导出, 检查一下尺寸和文件大小都没有问题啊,非常不错。再来看九宫格功能,选一张一比一的图片之后,我们在预览区就能看到他已经把九宫格切好了,而且文件名也做了排序规则,方便后面发图的时候按顺序排版,这一点考虑的其实挺稀的,下载下来看一下 没有问题,每张图的尺寸和大小都符合要求,而且文件名都自带序号。最后来看一下视频水印功能,逻辑和图片水印差不多,也是选择原视频水印图,再调整水印参数。下载下来看一下。视频水印没问题,但视频没有声音,我在需求里是写了保留原视频音轨,我实际测下来,他目前还做不到完整保留音轨 判断,可能是浏览器本身对阴鬼捕获知识有限啊。不过作为出稿工具,我觉得问题不大,很多游戏推广内容的出稿重点是先让对方确认画面,所以这一点我个人是可以接受的。最后顺面对比一下 codex 和 jimmy 奈分别给我做的图片水印工具。在用 codex 之前,我也用 jimmy 奈写过同样的需求, jimmy 奈给的是原生的 html 代码,需要我自己把代码复制到文本文档里,再 另存为 html 文件功能。虽然没问题,但是从最终呈现来看,我觉得 codex 的 ui 确实更好,整体完成度更高。而且在制作的过程中,不需要我手动去处理代码,我只需要跟 codex 沟通就可以了。所以我觉得如果你没有编程基础,只是想解决一个自己真实存在的问题, codex 会更友好一些。而且最近 openai 更新了 g p t 五点四模型, codex 对 自然语言的理解能力更强了,大家真的都可以去试一试。 ai 编程对普通人来说,不一定是让你去做一个多么复杂的产品,也不一定是让你突然学会写代码,它更现实的意义可能是把你工作里的那些重复琐碎、浪费时间的环节想办法自动化,哪怕只是帮你省下半个小时, 长期来看价值都非常大。也许你做不出一个 app, 也未必要做一个什么很厉害的平台,但只要你能做出一个真正解决自己问题的小工具,那它就已经很有意义了。今天的视频就先到这里了,记得关注冲破新衣叉 ai 教学我是专业的,那我们下期再见。

我们都知道,我们在 gbt 可以 实现通过生成一张图片的各个元素来实现它的 psd 分 层, 但是呢,通过这样的生成方式生成的元素最多不超过十个,而且它的文字是不可编辑的。这时候大家不妨试一下用 codex 来完成这些操作。 codex 它不仅仅是一款为编程而服务的 agent, 那 同时也能帮我们实现很多工作的自动化。 而且就在本月月初, codex 它的每日安装量已经超过了 cloud code。 另外 codex 本身已经支持了 gpt emoji 二点零的图片生成, 所以今天我们就试一下在 codex 上来实现它对图片的 psd 分 层。我们上传一张和之前一样的图片, 为了方便呢,我们这里选完全访问权限,对于这样偏简单的,我们自然选择中就可以了。跟 gbt 客户端一样,我们只要输入好提示词,然后按发送键就可以让它执行。当然这个提示词我可能要求比较严格,写的比较多, 所以比较长一点。好的一共花了十六分钟,他就给我生成了一个 psd 文件。在整个过程,他其实就是对各个元素进行重新生成,并对其中的文字进行一个 ocr 识别。 在我们的 ps 中呢,我们可以看到它不仅把这些元素分开了,而且把各个文字都转化成了一种可编辑的状态。当然它字体做不到百分之一百还原,但好在它的字体是可以进行编辑和修改其中的具体内容, 而且字体外的图层它同样是分割好可移动的。我们再看一个马克杯的例子,同样是用这一套提示词,当然它这里中断了一次,因为它生成的跟原图差距过大,所以我让它继续生成好,这就是最终生成的 psd 文件。 你看到元素可以移动,文字可以编辑,没什么问题。我们在利用 emoji 是 二点零制作这样的图片。除了文字的问题之外,我们还会遇到一个问题,就是它的图片通常就是生成一 k 的 图, 如果我们想打印图片或者要更高分辨率的图片的话,如果它值出的一 k 图片完全没有办法满足我们。但是它用 api 能生成四 k 的 图片,但是呢,这个 api 一 是要额外收费,而且 它和我们要拆分的过程相背。所以我建议大家在编辑好图片之后,可以通过以下两个方式进行放大。第一种方法,我们可以通过 comfy 里的 c 的 vr 这个模型,把我们一 k 的 图片放大到四 k。 工作流也非常的简单,我这里大概花了一百二十秒, 大家也可以看一下它跟原图的对比,放大效果还行,没有改变太多原图的细节。 如果你完全不会使用 comui 的 话,你也可以用谷歌它的 nano pro, 我 们在这个 ai studio, 我 们可以选择这个 nano pro。 右边这里我们也简单设置一下。首先把画质调到四 k 温度的话,调成零到零点二之间比较好。最下面这个参数呢,我们也给他调成零点五。同时我们输入以下提示词,一分钟后我们也可以得到一张四 k 放大的图片了。 我们也可以看下对比效果,虽然变清晰了,但是比 s d vr 它的重绘幅度稍微大那么一些,但是整体的细节大多数没有改变,可以勉强接受吧。这就是整个在 codex 来实现 p s t。 分 层加上高清放大的 一些基本方法。当然你可以通过 codex 来实现一些更高难度,更精确的 p s t。 分 层和 自动化工作流。我这里只是抛砖引玉一下,你可以把梯子十优化的更好。总之,以后 codex 无论是在编程还是说像这种图像自动化处理流程,都会变成必不可少的工具。我们本期利用 codex 如何将 图片进行 psd 分 层以及 image 二点零图片放大的方法就介绍到这,有关于具体的提示词,还有空 v i 的 工作礼物会放在视频剪辑的下方。 好,如果你觉得本期视频对你有所帮助的话,欢迎帮我点一个赞,我们下期再见!

还在花大价钱烧 token 养龙虾吗?别急,谷歌新出的 jamma 四大模型,本地就能跑,让你实现 token 自由。这期本喵保姆级手把手教你装模型,再带上最近爆火能自我进化的 hermes agent, 一 次全搞定! 首先咱们打开百度,为了部署的更简单,咱们搜索欧拉玛这只羊驼,进入官网点击 download, 然后选择自己的系统版本,点击下载就行。接着可以直接双击运行安装,但是他会直接安装到 c 盘,为了保护我方 c 盘,所以可以使用这条命令安装到其他目录。 接着咱们再次打开百度搜索魔,搭进去之后点击模型库搜索摘码四, 这就是本期的主角了,它有着四种规格,二十六 b、 三十一 b e、 二 b e 四 b, 并且它们都支持多模态,甚至这俩小的还支持音频,纯纯的就是为本地打造的。而且这个二十六 b 的 还是 m o e 专家混合模型, 意思就是当你使用它时,并不是所有参数都参与计算,而是只激活专业对口的那几个,大大提升了效率。 接下来可以点击这个下载模型,里面就有下载的命令,现在打开命令行,输入这串命令就可以进行下载了,也可以添加 local dir 将它下载到指定目录。如果遇到没有 model scope 这个命令,那就通过 pip install model scope 进行安装就可以了,当然前提是本地需要派遣环境, 不过这里也可以点击这个模型文件,点击下载也行,需要全部下载,但是为了本地能节省更多的显存或内存,我建议咱们直接下载 g g f 格式,并且量化后的模型, 咱们重新搜索 jam 四,选择这个,进去到模型文件页面,选择下载单个文件就行。这里可以直接点击下载,也可以使用刚刚的命令。 不过这里需要根据自身情况选择适合自己的量化格式。这里我大概说下有哪些量化格式,宝宝们听完后自己选择就行。这里有 q 二、 q 三、 q 四、 q 八等等。 这里 q 四就是斯比特量化,数字越大,精度越高,回答的问题也会越好,但对应的模型文件和显存占用也越大,基本咱们选择 q 四就可以了, 如果电脑再差点还能再降。然后是 k, 这是现在的主流量化技术, s 是 体积更小,速度更快, m 则是质量更好。 然后是 i, 这个是极致量化,比 k 量化模型更小,而且也能保持良好的性能。这里的 s 依旧是 small 的 意思, m 依旧是中等压缩, xs 是 更大的压缩,但相对质量损失也比较明显, xs 要比 x x 好 点,而这个 n l 就是 你的首选。使用非限性重构,相同比特质量最优。这里就简单介绍。到这儿,咱们继续。现在下载好了,再次打开命令,行输入以下命令, 然后输入 olama create 命令,就可以把下载的模型加载到羊驼里了。这里的 model file 是 对应的参数,里面有卸载多少层到 gpu 中以及路径等等。 加载完后就可以运行了,咱们输入一个问题试试, 也可以打开我拉玛的界面进行提问, 是不是还挺聪明,竟然没上当?接着继续。我这里为了安全使用了 docker, 部署 hermes docker, 大家可以直接百度搜索下载 docker desktop 并安装就可以了。 但是使用 doc 会有一些局限性,比如无法操作对应的文件等等。如果不使用 doc, 也可以使用 wsl 安装一个物班图,直接输入以下命令即可。如果你使用 doc, 就 先打开 doc 服务,然后再次打开命令行,拉取一个最小的物班图镜像, 然后再用这条命令创建一个容器并挂载到本地的一个目录上。 然后再次打开百度搜索 get up, 进去后直接搜索 hermes, 然后它里面就有一键安装的命令,你打不开 get up 也没事,直接按照屏幕上的命令敲出来就行。 关键的来了,选择倒数第二个,然后填进这个地址,这是 docker 连接外面的地址端口,就是 olama 的 服务端口。如果没有使用 docker, 可以 直接替换成一二七点零点零点一就行。等待安装完成, 直接输入 hermes 就 可以使用了。不过因为我本地没有英伟达的 gpu, 所以 无法加速,我就通过 python 代码开放了一个接口,修改下参数让 hermes 调用。需要的宝宝可以评论区戳我。然后咱们看下如何连接本地, 输入这个地址和对应的端口以及 u r i 就 可以了。然后继续咱们再看下结果 是不是完美,这样就可以不用花钱买 token 啦。不过这里有些建议,如果你的电脑无法使用 gpu 加速,就不建议本地部署了,根本无法使用,吐字的速度以及理解的速度根本不行。 而且因为龙虾和 hermes 调用本地模型时会传输超长的提示词以及上下文,导致电脑烧炸了都得不到返回, 而且 hermes 好 像出问题了,知道的评论区见。最后说下你本地都用什么样的大模型,以及安装时遇到的奇葩问题评论区聊聊。这里是永不秃头的喵记花里用大白话拆懂科技,咱们下期见!

之前呢,我们分享了一期 cloud code 接入 deepseek, 但其实没过多久啊, cloud 就 有过一次版本更新,新版本的模型名称就会出现一些问题, 那这一次就正好我们把桌面版 codex 和 cloud code 都通过 c c switch 来接入 deepseek, 我 们出 three two one。 我 这里啊,把前置环境和 c c switch 都准备好了,同时呢也写了文字版的安装教程。呃,大家可以参考一下,我就不展开了,我们直接开始。 那先说 codex 吧。首先呢,我们需要做一个 cc switch deep seek 的 通道,这个呢,我已经准备好了。呃,文字版里面大家可以自己找一下。首先我们打开这个文件夹,找到这个文件, 复制一下再黏贴。然后呢重命名,文件名是点 env, 注意啊,这个点不能忘记。然后呢,这个文件呢,我已经有了,所以呢我就不确认了,我把这个删掉。 我现在打开这个点 env 给大家看一下,这里面啊就是一条 apikey, 你 们打开的话就把自己的 apikey 写上去就可以了。然后呢,我们双击一下这个 start 点 back 的 文件, 出现这样子的界面,这就算成功了。那如果中间哪里有报错啊,就要重新回去验证一下自己在前面的环境这里有没有什么没有安装好或者遗漏的地方。 好,那我们接着打开安装好的 cc switch, 这个是 codex 的 界面啊,它是 gpt 的 图标。 进来我们看到这个,我们点击右上角的加号,可以看到的是添加供应商,呃,我们下滑,这里填供应商名称, deepseek v 四 pro。 备注呢,我们就随便写写一个 test 官网的链接,这里是可以不填的, api key 就 填自己的 deep seek 的 api key 就 可以。 这里注意啊, api 请求地址填的不是 deep seek 的 接口,因为前面我们已经做过 cc switch 的 转接了,所以填的是本地的地址, 然后下面到模型名称这里就填 deepseek v 四 pro, 然后我们拉到最下面,这里直接就是点添加, 然后它会自动回到上页。这里啊,已经多了一条 v 四 pro。 看一下啊,这里我们直接点一下它就可以切换到使用中了。现在我们来打开 codex 看一下 这里,它其实已经绕开登录环节了,原本打开呢是需要 gpt 的 账号了,现在呢,呃,都是需要验证手机号的。那我们现在通过 cc switch 就 可以直接接入 dbic, 跳过登录直接进到 codex 的 界面了。 这里我们根据他的提示啊,先初步一下,然后这个 set up 好 快速就完成。现在我们发消息来问他一下,你当前使用的是什么模型,有回复了啊,他这里回复呢,他是 deepsea 了。好,我们现在再来验证一下 这里呢啊,使用之前他会向你申请一下电脑的权限。没关系啊,我的 codex 工作区也在桌面上面,我们现在直接打开看一下。 好的,这里呢,他是已经在工作区里面建立文件夹了,速度啊,我觉得是很快的,根本没什么毛病。那其实到这里为止呢, codex 接入 dbic 就 完成了 啊,如果没有账号没法注册或者说登录需要验证的朋友们啊,我们就先把 dbic 可以 这样耍起来了。 然后接下来呢,我们直接再来试一下 cloud code, 这里同时也是一样的啊,我们首先先要打开 cc switch, 我 先把我刚才的配置都删掉, 注意啊,这里是 cloud 的 配置页,也同样啊,直接点击加号进来,直接就是选择 deepsea, 这里的供应商链接,官方名称都已经直接有了备注。我们也先随便写一个测试 a p r key, 这里也同样是写 deep seek 的 key 请求地址,这里也不需要动了。 好,接下来我们就到了模型这里,模型这里呢,我们都填 deep seek v 四,然后这个 e m 呢?呃,之前的视频也说过,其实就是百万上下文使用的意思,如果不加的话呢,不用做大项目的话也是够用的。 然后这里其实还是可以换一个 flash 模式的,也不用全部都是 pro, 然后随便找一个改一下啊,这几个模型名字等会都有用的,是一个对应的关系。然后这里我们就直接先添加, 回到这里就有这个选项了,我们这里就直接点起用。之后呢,我们再开通一下本地路由,在这个设置路由本地路由里面,本地路由打开 cloud 打开, 然后同样这个本地的服务器地址是要记一下,后面要用的。好,我们返回上一集测试一下,看到他是正常运行的。接下来呢,就是打开 qq 的 第一次 打开登录界面,不用登录啊,左上角 help 这里啊,点击这个 troubleshooting, 然后进到这个 enable develop mode, 然后点击 enable, 然后这里其实就是进入它的开发者模式, 然后重启,重启之后你会发现这里多了一个 develop 的 入口,然后我们选择 configure party info, 然后进来。进来之后,首先第一个 provider, 我 们这里直接就选 getaway, 然后 getaway 这里的 base url 就 写刚才我们 cc switch 这里出现复制下来的地址,这一个 key, 这里呢,当然还是 deep seek 的 key, 然后 bear 这里是不用动的。好,到模型 list 这里怎么填啊?这里就是填我们前面在 c c switch 里面配置过的对应模型,前面呢,加一个 cloud。 好, 这里两个模型够了,直接我们拉到最下面 apply locally。 好, 然后直接重启。 看啊,这里就是直接不用登录,我们就进到 cloud 的 界面了,然后 solo party 的 模式到 code 这里试一下。首先呢,我们随便设置一个工作区,然后测试一下,帮我建个文件夹。好,我们看一下它的这个速度还是很快的啊。 ok, 那 到这里呢, codex 和 cloud 都已经接入完成了。我最后补充一点啊, mac 系统呢,相对比较稳定,但是 windows 的 话呢,会经常会出现这样子的报错, 但这种报错啊,其实没有什么关系,通常都是安装有问题。呃,因为网络原因,组建安装可能会有丢失,最好呢是可以调整一下自己的网络环境,重新安装一下就 ok 了。 顶级的 a g 呢,配上我们的国产大模型,就再也不用为无法登录烦恼了。好,那这次的内容就到这里,希望对你有所帮助。我是阿月,我们下期再见。

这是我用 codex 做的动态图标,这些也是像这样的效果,我们现在不需要 ae, 也不需要 p r, 用 codex 就 能实现。那今天我把这个教程分享给大家,用到的工具是 codex 和一个叫 hyperframes 的 插件,点击左边栏的插件,在这里搜 hyperframes, 然后你会看到这个插件的详细信息,点进去再点击,在对话中试用。这里大家记得先添加好项目文件夹,确定好模型,智能等级和速度,然后就可以把题词放进去。比如帮我做一个 codex 和 cloud code 的 功能对比的分析,视频时长十五秒, 尺寸是横版十六比九,视觉风格是苹果简约高级风,需要增加一些动态效果的展示。 这里写错了哈,因为我用的是 ai 语音工具,完全是口喷的,有些词语可能会识别错误,直接改一下就行, 然后点击发送,让他开始做。你看他先是查了一下官方资料,确保这两个工具的信息是最新的,然后他还会去看 hyperframes 的 要求是啥,确定下来视觉身份,然后再去写 html, 他会主动在我们看不到的地方用网页去搜索资料,那整个的思考过程跟我们人类是一样一样的。他还会单独创建一个文件夹,因为我这个目录里面啊,其实是有其他项目文件的,所以他知道不能碰到别的。我把左边的边栏隐藏掉,现在整个页面都是我们的视频制作过程 他很快就确定下来,主画面用冷白、石墨黑、微蓝和暖金做出高级感。我觉得如果大家有更具体的风格,也可以直接在刚才提示词里面告诉他,那整个过程他会自己产出内容,然后检查有没有问题,再自行更正。这些你都可以看到, 如果不想管,就让电脑开着,让扣贷自己干活。那做这样一个视频大概花了十来分钟,然后文件的位置,他参考了哪些资料,最后都会告诉我们。来,我们看一下它的效果。 大家注意看,这只是第一版哦,我觉得已经非常惊艳了,完全没有预先做任何模板,已经可以拿去用了。那不管是发布在社交媒体上,还是工作汇报,都很顶。 实际上呢,它不仅是可以做这种图表,还可以做产品介绍。比如这个辣条的产品视频,你丢给 codex 一个网页,让它做产品或者品牌的介绍,也可以做一个像 open ai 这样的业绩表,那放在 ppt 里面简直是开挂。 你甚至还能让它做这种 logo 散落的视频,或者是宋代山水风格的 ai 发展史, 你给他一段提示词,也不用特别复杂,让他开干就可以了。一般来说啊,十来分钟左右就能做出来,那如果对效果不满意,再沟通几轮, 那到这里大家可能会觉得,哎,这好像没有什么难度啊,很简单,每个人都可以做。那我再分享几招进阶的方法。 第一个呢,如果视频中涉及到图片类的素材,像 logo 啊,或者人像,建议自行上传。或者呢,可以先让 cloud code 整理出这些 logo, 然后再把这个文件夹打包到项目里,这样失误会更少。第二个是关于审美和风格,如果不指定风格,他做出来的大概率就会比较大众化, 像科技风很容易就做成那种已经用烂了的蓝紫色,所以最好是提前指定风格。那我这里也列了一些,大家可以直接拿去用。 最后是音乐和音效,可以让它生成简单的音效,但是背景音乐呢?大家可以用 solo 生成原创的背景音,或者直接在剪辑工具里面把音乐库的素材放进去,最后我再补录一个哈。很多时候我们做动效视频会需要信息的专业性和准确性。 那对于科研、生物科学、生命科学这些领域来说,我比较推荐 bell render 这个插件,它能够把这些领域的一些复杂概念进行可适化。那结合 paperframes 它们两个就能把一些科研领域专业绘色的信息用非常动态的形式表达出来。 比如说我让他做一个 an apple a day keeps the doctor away 这句谚语背后的一个科普回答, 他就会给到我这样一个视频,我们可以看一下效果。 那我们今天的分享就到这里,我们下期再见。

前两天我做过一期视频,用同样的 prompt, 同样的真实项目任务实测,对比了 cloud ops 四点六和 gpt 五点三 codex 那 期视频做完之后,评论区有人问 国产模型能不能也拉进来比一下,这次机会来了,这一期视频我要做两件事情,第一个,把上期那两道编程题原封不动的丢给 mini max m 二点五,看看它在同一张考卷上能拿多少分。 第二个的话,我有一个自己一直在用的自媒体 agent 的 项目,之前跑的是 mini max m 二点一,这一次直接升级到 mini max m 二点五,看看他在真实的一个生产电路里面升级到底带来了什么。看过我视频的人都知道哈,我做评测比较关注模型,他在一个真实任务里面的一个表现。 好,我们正式进入编程实测环节,我直接附用之前的两道题, prompt 一 字不改。第一道题的话,是把一个项目里面完整的一个认证用户体系 直接迁移到我有一个图片生成的一个 agent 的 项目里面去,同时再让它做一个落地页,需要考验它对于另外一个项目的一个代码理解能力,架构适配能力以及一些工程规范。 那第二个项目的话,我以本地有一个 skills agent, 之前是做的是终端 ui 的 一个部分,那这一次的话,我希望把它升级成外部 ui, 并且它要保留 string 工具调用流逝输出的一个完整链路,这个就考验它的一个全栈开发能力,以及它的 sse 流逝输出,还有 ui 方面的一些交互。 上期的成绩是 cloud op 四点六和 gpt 五点三勾代码各赢一局,那这一次我们把 mini max m 二点五加进来,看一看它的结果怎么样? 好,开始测试,两个一起弄,可以看到右边这个它识别到我们要做的是一个全单元 y, 它去加载的那个 front designer 这个 skill, 那左边这个项目的话,他发现他是需要去探索已有的项目,去找到那边是怎么做 get up 登录,怎么做谷歌邮箱登录的。先去探索嘛,先去开 saf 界面的探索, 可以看到他这边已经构建成功了,现在在进行一些后端跟前端的验证,整体这个过程测试下来的话,他会遇到一些变异问题,他也自己去修复了。待会等他测试完之后,我们来看一下他跟 cloud 四点六以及 gpt 五点三 codex 同样的代码,同样的提示词完成了一个效果怎么样? 那左边的话先让他一直跑,左边这个任务要重一些,可以看到这个地方他说项目已经启动了,然后他还专门创建了一个简单的启动脚本,来方便我后续去使用。之前我在测试 mini max m 二点一的时候, 有一些开发任务,前端后端写完之后,我需要手工让他去给我写一个 start 点 s h 的 脚本,这一次让你可以看到他在这个过程他自己去发现的这个行为,这一点点赞。现在他说已经完成了,我们现在开始去测试一下 这个就是他把那个终端 ui 变成了一个外部 ui 的 一个版本啊,可以看到左边他已经把我们已有的一些 skill 加载出来了,这个是没有问题的,下面我们来测试一下,给他一个任务,看他能不能去做到加载对应的 skill, 然后工具调用 simi 以及流逝输出都没有问题。好,我们开始 这个申请的过程,看起来没有问题,加载技能也还行,那看他执行命令 ok, 他 也调了对应的工具,只不过这里的这个图标他刚刚是有些问题的,这个状态是有些问题,有个小 bug。 那 整体的话,这一个过程其实已经把我们终端 u i 想要展示的东西已经展示出来,只不过有些小瑕疵。那之前那期视频的话, 也测了 cloud op 四点六跟 gpt 五点三 codex 嘛,左边是 cloud 的 模型,右边是 gpt, 当时我是把票投给了 gpt, 不 管它是从 ui 交互还是它整个功能交互上,明显 gpt 五点三 codex 要优要好一些。我们也可以来测试一下,直接给他一个链接吧,看他怎么怎么搞。 他也在申请,他也在加载技能,那明显能看到 gpt 五点三 codex, 他 做错做的要好一点,对不对? 好,下面我们开始去看他做的那个用户认证那个项目,那做用户认证迁移这个项目的话,其实比我们刚刚看到的任务其实要复杂一些,因为 他需要从另外一个项目去探索,找到想要的东西。其次他还得在这个项目里面去,在各种代码里面去找到他要在哪个地方去修改,前段是要修改哪些,后段是需要修改哪些,所以整体上他的复杂度要高一些。也可以看到他其实并没有一次性去完成这个任务,中间也报错了,我也跟他去沟通交流了, 那最终的话是跟他对话了三轮,他才把这个任务完成了。那这个任务在之前 op 四点六以及五点三 codex 测试的时候,他们是能一次性通过, 跑的时候没有问题,项目也能起起来。那 mini max m 二点五这边的话是有一些问题,我对话了三轮,然后把这个任务搞定了,我们来看一下他的一个表现。 好,我们先看左边,左边是之前 call 四点六写的落地页嘛, 光看 ui 其实没什么难度,因为这个项目主要是考察他去另外一个项目里面把后端代码找到,把对应的数据库找到,找到了之后再放到另外一个项目里面。所以说整体是需要看它的代码实现的功能,比如说这个 get up 登录可不可以,谷歌登录可不可以, 以及它的代码实现的怎么样,因为涉及到登录嘛,肯定安全性这些要考验。下面我们来看一下 mini max m 二点五它这个 ui 写的还可以的,比这两可能稍微会好一点, 那它的这一个谷歌登录跟 get up 登录的话也是 ok 的。 好,我们来试一下它这个谷歌登录 好,可以看到它,其实谷歌登录是 ok 的, 那我这个其实就是一个纹身图的一个 a 帧嘛,那它整体完成度啊,也还可以,但它不是一轮完成的,它中间有一些包的导入错误,还有些细节性的问题没有做的很到位。好,我们来一个整体的一个评分对比。 关于这个纹身图的 a 帧的项目的话, call 的 off 四点六表现优异一些,得分是八点二,那 gpt 五点三 codex 它因为漏了一些功能,所以说它评分要低一些,但是它的整个代码价格、工程规范是这三个模型里面完成的最好的。 那 mini max m 二点五这边它的得分就稍微要差一点,整个的功能完成度还 ok, ui 的 话会比它俩会好一点,但是它的代码架构跟工程规范会偏弱一些。好,下面我们开始做 agent 的 实测,把 mini max m 二点五放到 我已有的一个真实 agent 的 项目里面去,它是做自媒体视频拆解的,之前接的是 mini max m 二点一,这一次升级了, 我们重点看三件事情,第一个是速度,第二个是他的一个拆解深度,第三个的话是表达一个真实感。好,我们现在准备两个窗口,左边的话我准备用来测试 mini max m 二点一,右边的话我们测试 mini max m 二点五。 好,我这边找了一期我之前做 skill 原理讲解的视频,我们同时去点击看左边跟右边他的一个整体的一个速度以及拆解的深度,再看他的一个其他的表现。开始好,这边有点慢,但没关系,我们来看一下, 我们把这个展开,这个也展开,从这个可以看得到,它其实右边会稍微快一些哈,但是这个先不管,因为这个部分的话是跟 a 镜头没有关系,去做语音转,文字是本地的一些模型去转,等他把这些字幕内容提取到之后,我们再看他们的一个速度。 好,现在开始了,大家能明显感觉到吗? mini max m 二点五的是不是快的特别多? 这边已经做完了,这边就是还在,还在做, 那在速度这一块,他现在提升真的非常的明显,特别快,那他最终输出这个结果,我们要怎么去做评测呢?到底是左边的好还是右边的好? 我不能以我主观的去选择哦,右边好,左边好。所以说我找了两个模型去做评测,我们把任务给到它以及它的产出字幕内容全部给到两个模型,第一个是恰当的 gpt, 第二个是谷歌的界面,来去看这两个模型到底哪一个分析的这一个深度, 以及他的一个真实感更强,最终得出的结果。我们来讲一下,那整体的一个结果的话是 m 二点五肯定是提升的蛮多的,第一个是速度变快了,第二个是他拆解的更稀了,第三个的话是他的一个真实感更强了。好,下面我们来做一个总结。 一句话的话就是当前我们这个任务的评测的话,在编程这一块 codex 要领先一些,那 off 四点六要辞职, mini max m 二点五的话更适合做一些速度优先以及你追求性价比的快速落地的一个场景。好,这就是这期视频的全部内容了,熬了一个通宵做的,如果觉得这期视频做的不错了,记得给我一箭三连,大家拜拜。拜拜。

上个视频评论区有粉丝教我做一个详细的教程, ok, 安排用国产模型,而且要使用完整的 codex 功能,就要解决 api 代理和 codex 的 插件功能,这两个小工具就是解决这个问题的,他们都是的开源项目。 好了,安装 codex 加加,安装好以后会弹出一个命令行,不要紧张,按一回车就安装好了。接下来安装 echobird, 安装好了,打开它,在模型中心配置模型。以 deepsafe 为例,打开 deepsafe 官网,点右边的 api 开放平台,进去以后,先申请一个 api key 复制下来,再到接口文档里把 uio 和模型名记下来,转到 excel 这里配置好,这就全部搞定了。 启动的时候要注意一个问题,就是先打开 codex 加加,再用 excel 版的启动 codex, 不要用 codex 原声软件启动。这么详细的教程,快去点这里关注起来,下期不迷路!

朋友们,今天我们主要来讲解一下,当你已经写完一篇刊刊论文或者毕业论文的方法结果以及结论,而对于整体的背景以及小棕树却无从下手。 接下来我将使用拆了 gpt 五点四以及 codex 对 整体的步骤进行一个完整的讲解。 首先我们要把我们目前已经写好的方法、结果和结论整合成一个完整的 word 文档。这里我选择了上传一篇我已经发表的 其他论文,将其讨论以及背景部分都全部的删除,仅留下了方法、结果一、结论。这时候我们要打开柴的 gpt 五点四的深度研究功能, 输入我们第一个指令。第一个指令主要是利用深度思考,深度研究去对我们目前的方法、结果、结论进行一个整体的分析总结,然后搜寻大量的相关文献,对前期的引言以及相关工作以及小综述进行一个初步的量化。 最后在完成相应的工作之后,深度研究会反馈我们一个 pdf 以及 word 文档。这时候我们把相关的引言部分单独摘出来,复制到我们的论文当中, 再将我们的论文作为第二个附件。这时候我们要采取第二个指令,调动 china gpt 五点四 thinking 大 模型。 这一步的步骤主要是通过五点四 thinking 对 我们整体前期完成的一个引言,一个初步的评判工作,并且要系统解锁我们的真实文献,并且尽可能地下载可获得的 pdf 全书。 这时候我们可以对前期深度研究所给的相应的小综述进行一定的判断。然后在我们第二步的指令当中一定要补全我们的研究方向,例如到底是电力电子电力系统还是相关的控制等等, 补足我们的论文主题以及我们相应的目标刊刊,如果合适的话,我们也可以在这里上传几篇,我们觉得比较满意,可以仿照 参考他的格式以及整体的背景写的格式的论文作为参考。这时候我们需要对我们已经写好的前期的 word 文档进行进一步的修改,补足相应的文献。随后我们要将我们的所有的文献都下载下来, 这时候可以进行第三步。第三步就是我们相应的先找文献,但不马上重写, 有可能前两步他给的文献质量并不是很高,这时候我们就可以先不写正文,先只对我们的研究论文引言以及相关的工作部分所需要的文献检查进行一个整体的筛选以及下载工作。最后可以进一步的提炼我们所需要的参考文献。 这时候我们就已经完成了使用拆的 gpt 的 主要步骤,但是经过我大量的书写,发现其实拆的 gpt 五点四 thinking, 它给的相应的参考文献以及写的小宗数可能会存在文献错乱,就例如它 就例如我们会发现我们看这篇文档像这样的相应的句子,它会引用长达多篇甚至数十篇文献, 但我们经过仔细的发现,其实它这时候引用的文献与我们的实际内容并不相符。这时候我们就需要使用 codex 进行进一步的文献的修改以及追踪。 这时候我们需要在 codex 当中先新建一个任务,然后在任务文件夹当中把我们所有的参考文献按着一二三四五六七八的顺序按着 引用的顺序标好,然后这时候我们再次使用柴德 gpt 五点四去给 codex 写相应的指令, 这时候我们主要的作用是让 codex 去阅读我们文件夹当中的参考文献,然后一一相应地去侦查它给 在我们 word 当中它给的参考文献的顺序以及内容是否正确,然后再让我们的 codex 去一步步的替代。 这时候我们会使用我们的第四个指令,这个指令主要的作用是先让 先要把这个指令给拆了 gpt 五点四,然后同时之后让拆了 gpt 五点四,输出可以直接复制给 codex 的 相应指令,这时候我们使用 codex 直接改我们的相应的论文,让它直接替代我们的 已经标错的参考文献,并最后让它标出来。同时最后这一步 codex 也会 输出相应的表格,就如同我们所示,他会其实会对我们每一个参考文献进行非常详细的总结。这一步在前期的文献调研工作的时候也可以尝试使用,我们会发现他对我们每一篇参考文献都 针对于方法和结论都对了非常详细的改革,并且对可信度都有了一个非常 客观的评价,同时它也会对于我们哪一条要真正的使用修改也会进行标注, 最后它会反馈我们一个新的文档,这时候我们发现对比两者不同的部分,新的使用 codex 修改之后的 word 文档,其参考文献与真实的文献内容可以对应, 这时候我们的小棕树就可以采用并进行最后的润色修改并使用发表。

codex 大家应该都用上了吧,但是它的缺点就是额度太少了,完全不够用,而且它的头款实在是太贵了。那一种解决方式就是把咱们自己比较便宜的一些模型借进去,比如说 bitcoin, 咱们需要 c c 叉, c c switch 以及 bitcoin 的 api k。 首先我们在 bitcoin 点击 api 开放平台 api case, 创建 api k, 这个 k 一定要保存好。然后我们搜索 c c 叉, 点击这个,在下面找到适合自己的版本,我下载的是 windows 版本,然后搜索 cc switch, 点击下载,在这个界面一直往下翻,找到适合自己的版本,我仍然下载的是 windows 版本,然后安装 在 c c 叉文件夹下,我们新建一个 text 文件,命名为点 e n v, 把这些内容填进去。 k 就是 你设置的登录密码,我这里设置一二三四五六,然后重命名,把点 txt 删掉,运行 c c 叉,这个时候会弹出终端,复制这个 local host 地址,到浏览器打开点,点击 contacts, 选择添加渠道。在这里可以打开 delete 官网找到调用 api, 复制 c u r l, 把这一行改成 api k, 填写你自己的 delete 的 k, 选择详细配置。我们要选择 open ai chat 模式,继续往下翻,把这两个按钮打开,然后就可以了。现在我们在 c c switch 点击 codex 图标,再点击右上角的加号,供应商名称可以随便写。 api k 是 你在 c c x 的 点 e n v 文件里设置的登录密码,我的是一二三四五六 api 请求地址填写这个,点击获取模型列表,可以看到 deepsea 模型了,选择即可。然后我们点击测试模型,如果正常,说明已经配置好了, 我们重启 codex, 选择其他方式登录。这里的 k 也是你在点 e、 n、 v 文件里设置的登录密码,比如我的是一二三四五六,然后就可以了,现在 codex 里面的模型已经是 zip 了。

现在每个人都可以拥有一家属于自己的科技公司,因为当你用上了叉 g p d 以后,你就拥有了这个世界上最有学问的老师。而当你有了这个老师以后,这位老师还会贴心的为你双手奉上财富的大门。这扇门叫做 cortex, 也可以叫它 ai 之王,你只需要点击鼠标推开这扇门,不需要再去别的地方找。而当你拥有了 cortex 以后,你自己一个人就是一家科技公司, 但这个时候你会发现,整个公司好像没有一个好员工。所以聪明的你为了让这家科技公司不再是一个空壳,你去到人力市场 招免费的员工,也就是上 github 上配 agent, 整点四给我工作流。一旦你理解了他各个的职责范围,他们将无所不能,更加会不分昼夜的替你干活。你只需要下一个命令,给他配上 goal, 也就是持久目标化工作流, 就是这个月才毕业的 codecl, 零点幺二八点零。他不需要你打一鞭子走一步,他们也不需要吃饭,最多你给他买一瓶两块钱的矿泉水啊,犒劳他出汗了,跑累了,因为你给他多花一分钱都是在浪费, 然后他就能给你做出这些以前需要花费几十万搭建的网站,或者这种单条视频涨粉百万的解说视频。 遗憾的是,百分之九十九的人被卡在了网络上。可问题是,我不能说别人,也不能说没有一个人敢全网公开说这个事情,但是我可以很明确的告诉你们,这个卡点解决起来,只需要去一趟厕所撒泡尿的时间就可以得到解决。所以现实就是 只有那百分之一的人活该他挣钱。所以我还是那句话啊,有些人能用豆包就已经很不错了,能用上考勤或者考勤这种 兴趣编程类 ai 工具,更是超过了百分之九十九的人,每一个人他都是人中龙凤。而这一类金字塔梯的人,有认知的人,早就把项目落地,把 ai 跟硬件结合起来。就好比我手里的这个小东西啊, logo 我 就不给大家看了,免得你们说我打广告。然后你只需要坐等, 等哪位大佬看中了你的项目,苦苦抱金币的大佬找你签合同,然后你这后半辈子也不用愁了。但是我相信啊,我发完这条视频,依然会有很多人无动于衷,因为有些人,他就算是眼睛是睁开的,他的大脑也是一片漆黑。