姐妹你要把握住,现在在谈论和使用 codex cloud code 的 男人,你自己也可以去研究,去沉浸式的体验,去想方设法的让这些 ai 软件帮你完成任何的事情。现在在用他们的男人啊,那绝对是眼界也好,格局也好,执行力也好,远超一些普通人的普通人还在谈论喝酒吃饭打麻将的时候, 他们已经在用他们的时间精力在做跟新时代连接的事情了,所以他们的思维是非常超前的,做事也 肯定高效。更重要的是就是面对新时代新事物的探索欲,这点很重要,因为人只有拥有了探索欲才会进步,他们骨子里一定藏着极强的进取心和认知高度。所以这样的男人我们要关注一下好不好,宝贝们。
粉丝2.0万获赞111.9万

如果你还没用上最新的 openid codex, 一定要去用啊,真的太牛逼了啊!大家如果看过之前这个豆包手机啊,你跟他指令,然后他操作你手机那些视频的话,那你今天就想象一下这个流程直接被翻译到电脑上了 啊,这抠代码。现在你跟他说一个东西,他可以直接打开你电脑的应用程序,你就能看他的这个光标在移动,然后直接就在你的应用程序里面进行操作了,非常非常牛逼啊。这个从日常的一些打开邮件,处理邮件,然后他可以扮演一个角色,然后他跟你的同事对话, 呃,再到打开什么这个剪视频的软件,他能直接操作你的电脑来完成。我不再是像之前别的 ai 一 阵他都是打开一个啊这个 服务器,然后在里面去操作很多东西他不知道,现在就直接在你的本地端操作了。而且他比这个 cloud 做的更牛逼的地方在于, cloud 可能更多还是停留在一个工程的感觉上啊,他不能打开你的应用程序去做啊,但是这个 codex 你 是能看着他直接光标在移动的,这个感觉是非常爽的啊,要记着这个体验是要比这个小龙虾好很多的,而且他在关键的需要确认隐私地方,他会停止住, 如果他觉得这个任务可能侵犯到你的本地隐私,他直接就告诉你,对不起,这个事我做不了,可能有些啊影响到你的隐私数据了,所以这块呢,还是可以安全放心的去使用的啊。自从他们这个 code red 啊就是红色警报之后啊,这个升级迭代速度是非常的快啊,不再像曾经一样被人嘲笑说 cloud 和我 jimmy 都做的比他好了。这场事情已经啊, 我相信未来几个月还有大动作啊,之前图像模型升级之后啊,三个月以后这面呢就有大动作了。 gbt 我 觉得也是一样的,非常期待下 gbt 六 啊。我觉得他们最近的这个更新已经越来越让我看到 agi 时刻的接近了。我是志远,如果这期视频对你有所帮助的话,记得点关点赞分享给你,觉得会有收获的朋友们,下期视频见。

codex 到底是什么?它到底能干嘛?到底什么样的人才会用到它?不是程序员到底能不能用?不会写代码到底能不能用?本来呢,昨天我想出一个基础教程,结果没发出去,现在呢,我就简单口述一下。 首先我要说一下,不一定非得要用 codex, 我 说 codex 就是 指 codex 这一类工具,其实还有很多种工具,比如说像最近开源界比较火的 open code, 像字节出品的 tree, 还有像 carson 等等等等都可以。我只是拿 codex 举个例子,那 codex 到底是什么呢? codex 一 句话总结就是它是 gpt 的 亲兄弟, gpt 呢,就是用来聊天的,而 codex 呢,就是用来干活的。它能干什么活呢?现在能干的活非常多,如果你现在还花大量的时间去做 ppt, 你 现在就可以把这些任务丢给它。现在 ai 做 ppt 能力已经非常强了,我之前做过一次测评, ai 现在直出的 ppt, 简单修改一下,基本上就能够汇报,它还可以帮你做视频,其实我的很多视频都是 koex 或者是 cloud code 帮我做的。 koex 现在能帮我省掉很多剪辑工作,比如说你的电脑驱动坏了,你不知道怎么修,你现在就可以让 koex 帮你修一下,你还可以让 koex 做一个个性化的简报, 如果你真的有想法,你还可以做一个网站,做一个 app。 我 上面说的都是 koex 能力的冰山一角。那 koex 适合什么样的人群? 会写代码?到底能不能用 codex? 很多人以为啊, codex 这类软件就是一个非常专业的软件,这可能是最大的误解之一,你可以问一下你周边程序员的朋友,看看他们现在还写不写代码。今天刚刚刷到谷歌帝麦的研究员姚顺宇的播客, 他说现在大部分项目都不用写代码了,全部都在用 ai coding。 更主要的是像 codex 这类工具,它的使用难度绝对不会比豆包高,当年我学 cad 画图还学了好几个月,才能勉勉强强上手。 而现在的 ai coding 软件,基本上几天的时间就能够学会,最重要的是它不是一个很枯燥的软件。很多人开始 ai coding 之后,它现在连游戏都不玩了, 每天都在等着额度恢复,因为它很容易让你有一个 builder 的 感觉。 codex 其实它的能力跟它的竞争对手 cloud code 还是有一定距离的。 cloud 它更像是一个谋士,在你不知道干什么的时候,它会帮你出主意,而当你确定了想要干什么的时候,并且做好这些规划的时候, codex 就 会派上用场了。它更像是一个总经理,它会帮你认真的完成这些工作,所以两者要结合起来用。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

哈喽,大家好,我是七帅,你有没有过这种感觉?只是听说过这个扣带很厉害,但是他到底怎么厉害,怎么用还是不清楚,特别是第一次打开这个扣带的时候,不是感觉好强,而是只看到这么一个对话框, 左边也有一堆入口,中间是聊天框,右边也会突然间弹出来一些。呃,网页,图片,代码,还有设置里面其实也很离谱,什么样信息都有。今天我这个视频,我不讲技术,我按照一个普通人的使用路线,帮你把勾带四这个 app 彻底的讲明白。 首先说一下,我是一个做了十几年的交互设计师,也不是程序员,但是我用 ai 编程,至今为止已经上架了三个 app store 已经上线了, 所以今天这个教程也是完完全全从一个非程序员的视角来讲的,希望你能听懂。首先第一个就是抠代码到底是什么?先说最基础的抠代码 app 到底什么?很多人以为呢,它就是一个拆的包面板,其实不是的, 拆的 gpd 是 什么呢?你问一句,他答一句,他本质上是一个聊天的工具,但是呢,抠代码是不一样,他是装在你电脑里面的一个 ai 工作台,什么意思呢?他做的事情远远不止于聊天, 它能读取你电脑上的文件,能帮你搜索网页,操作浏览器,还能生成图片、文档, ppt, 网页代码等等, 还能通过 mcp 连接我们的邮箱, github, 还有 notion 这些第三方工具,它甚至还能自动化的去完成一些任务,定时的帮我们干活。所以说你记住一个区别就够了,就是拆的 gpt, 它更适用于回答问题, 扣袋子,更适用于帮我们干活,一个是嘴,一个是手,两个东西我们不要搞混。在继续往下讲之前,有两个东西很多人一直没有分清,我这里也梳理一下。第一个是普通的拆的 gpt, 它就是一个网页版或者手机版的聊天框, 问问题,写文案,生成图片,日常够用。是第二个抠袋子 app, 本地版,这就是装在我电脑上,这个它最大区别是它能直接读取你电脑上的文件,能操作电脑上的东西, 怎么选?如果说你是日常聊天,我推荐你就用这个网页版的这个拆的 gpt, 如果说你要处理本地的文件,那我推荐你就用抠袋子,这个 app 就 这么简单。 好,现在我们是已经打开了这个 call 大 师 app, 第一眼看起来有点懵,但是我们记住三个结构,左边是导航栏,那所有的入口都在这里。比如说新对话、搜索插件自动化全在项目左边,中间是对话的区域,也就是一个对话框, 我们和 call 大 师真正交流的地方就在这个地方,我们输入自己的需求,他在这里开始工作。 右边这个位置是结果区,也是 codex 交作业的地方,我们的网页预览图片、文档、代码变化全都在这个地方展示。这就是 codex 和普通聊天框最大的区别,它不光有问答,还有一些工作现场,我们可以看到它的实时进度和交付的结果, 你问他做事情,他不光告诉你怎么做,还会直接做出来,在右边展示给我们看。左边导航呢,有一关键的入口,快速过一遍就是新对话,点击完以后就是一个全新的聊天窗口, 清空之前的上下文,从头来搜索,去搜我们之前聊过的什么,在这里面去找历史对话和历史任务插件,这个呢很重要,后面我会单独讲,它是我们 codex 很 重要的一项能力 自动化是让扣代斯定时或者延后自动执行任务,比如说我们每天早上让他去帮我整理项目的状态,每周检查一次代码的仓库,定期的形成的日报和周报。这里面有个项目就是扣代斯最核心的功能之一,就是让扣代斯针对我指定的文件夹开展工作, 读文件,改文件,跑命的都在这里。我自己创建的 pm, 这文件夹里面在我电脑的本地放着的普通对话,就是一个很简单的普通对话,不绑定任何项目的纯聊天的模式,我们查概念,写文案,梳理思路,日常用这个就够了。 下面呢我们接着讲这个插件啊。呃,插件这个东西呢,说白了就是给扣带子装能力包,你想让它读 gmail 呢?我们可以装插件是吧?你想让它操作浏览器呢,也可以这个装插件, 比如说你想让他操作你的电脑呢,也可以装插件,就像我现在所点击的这个 computer user, 这个你装了它以后呢,你的 code text 就 直接可以在本地去操控你的电脑了。这里面呢有几个词可能我们经常看到,我这次呢也是一一次性讲清楚,就插件就是能力包,装了它 code text 就 多了一项技能, 还有连接器,这还有这个浏览器的使用浏览器,这个就是你装上这个以后呢,你的 sim 就 直接可以操控你的浏览器了,你像我电脑装的是 chrome 浏览器,我让他去帮我做任务的时候,做事情的时候呢,我就让他直接去采用这个插件,这个其实直接去操控的浏览器了, m c p 呢,是一种让外部工具接入 codex 通道,这里跟插件的意义差不多。我这里举一个例子,你看我现在电脑上装的这个 node 插件,我让 codex 呢帮我和 notion 通过 m c p 进行连接上我每次和 codex 聊天结束完以后的结果,这文档我需要统一 去保存到我的 note 里面,按照以前呢,我需要去在口袋怎么去复制,复制完以后再去粘贴到我的 note 上,但是现在呢,我通过 m c p 就 可以自动把这过程给打通了,自动化的给它运转下去。我俩是讨论出来的结果, 通过 m c p 自动去在我的 note 上去创建一个配置的链接,然后自动去保存过去。这个过程呢,其实就大大提高了我的效率。接下来呢,我们讲一下这个设置页,设置页东西很多,小白只需要关注四个地方就行了哈。第一个是工作模式, 我平时相对来讲,我更希望我有编程的思维,所以说我适用于编程的这个选项,如果说我们不是程序员,那我推荐大家用这个偏于适用于日常工作的这个选项。这样的扣代词可能会少说一些工程的黑话,普通人看的更舒服一些。第二个是权限, 权限越大,扣代词能做的事情就越多,但风险越大哈,刚开始的时候不用开最大,等你熟练以后再逐步开放,说实话,等你熟练以后就发现权限给够了,呃,扣代词用起来反而更丝滑,操心更少。 你像我现在天天是在用扣代词,所以说呢,我给他的权限是可以读取我电脑上所有文件的权限的。 第三个是发送方式还是看个人的一些使用习惯吧。如果说你平时呢喜欢用 command 加回车去发送内容的话,那我推荐你把这个给打开, 不然你写长需求的时候就是会突然间按一个 enter 就 把这个内容给发送出去了。所以说这个还是相对来讲,为了误触,我推荐有这个使用习惯的可以打开。你像我平时的 就不太喜欢 enter 折行,所以说我就这个呢,我就没有打开。给大家一一些建议,我们不要把自己的密码还有一些 api 的 k 或者是自己的身份证号喂给这个酷 max, 像其他的设置页什么配置环境工作数小白呢?像我们普通人就保持默认就行了,一个都不用动。下面呢,我们来看一下我今天实操的一个 项目,我想做一个 agent, 这个 agent 呢,主要是一个 v i 子查手册,这个 v i 子查手册是基于 defi 做的,上面这些你看的是有错别字的,因为我通过语音输入录入的,然后这个时候呢,我去把我对应的这个链接还有 pdf 手册发给了他,然后让他去 defi 里面去搭我们这个 agent, 这一看到他已经处理了十二分钟十一秒,然后呢,把这个基础的他给做好了,但是做好以后呢,其实他是没有自动帮我去创建的,他只是把那个内容给我做出来,还需要我手动去导入,这个时候呢,我不想自己动,我就想让他帮我做好, 所以说呢,接下来呢,我就让他去操控我的电脑,然后接着去做,做完以后我就发现这里边是有问题的,这个问题以后发现这个视觉变量是空的,把这个问题呢截图发给他,让他去帮我解决。然后呢,我再看下模型,这个你看这个模型的是不是还是有问题的, 所以说呢,我就让他再让我正常修复,他从二十三分钟把我这个问题给彻底解决掉了。那至此呢,我这个应用相当于是我都没有动,我只是给他下命令,就把我这个 agent 呢在抵犯给我做好了。假如说我们做的内容是比较复杂的,我也推荐这里呢,大家是用 plan 模式 在这里输命令,建立创建 plan 就 行了,使用这个计划的模式,这样的话,你做复杂的任务的时候呢, codex 呢,会输以思路,然后确认没问题了,让他去干活,这样呢,也避免浪费自己的 token 嘛,然后一顿操作猛如虎,最后的结果根本是不想要的。 最后呢,给大家说一个点,就是 codex 权限的确认是是最容易踩坑的地方, codex 工作的时候可能会弹出来问你权限, 这个时候呢,将没看到确认就无脑的点看清楚他在请求什么,你比方说他是在请求文件的访问啊,他要读取或者更改某个文件夹,看清楚思路是不是我们所允许的范围,还有中单的命令,他要在你的电脑上跑命令,不懂的向他解释一下, 避免付款,删除发布等这类操作呢,让它浏览器自动去做,这时候呢,也需要我们手工去介入一下,还有电脑操控,这个最强呢,但是也需要谨慎,如果说你看不懂他的请求什么,会直接问他这个权限具体让你做什么,有什么风险? 我是小白,应该允许吗?酷代帮我们去解释这个权限,这个设计我觉得还挺贴心的,最牛的是电脑操控, 我觉得这个是酷代斯最牛的功能,它能让酷代斯直接去操控你电脑上的应用,打开某个 app, 点击按钮,处理一些可实施任务, 或者是帮我们在软件里面完成一套流程。今天上午呢,我也是让酷代斯帮我去做了这么一个 agent, 我 把这个刚才也给大家展示了一下, 当你用完这一刻,我觉得扣袋子很强,但是呢,这个功能也需要我们去谨慎,因为他可能会触碰到我们的邮箱,浏览器,还有付费,还有公司里面的工具,私人的资料等等。第一次用呢,你只让他操作无风险的 app 就 可以。这里呢也特别给大家强调一下,就是不要让他去操作我们的微信或者是一些设备账号, 因为避免后期再出现一些风控的问题。好,最后呢,给大家推荐一个上手的路线,按照这个顺序来,很稳。第一步呢是打开 app, 先熟悉左边的导航,知道每个按钮是干什么的。然后第二步呢,去新建一个普通对话,问一个简单的问题感受一下。 第三步是打开设置页,只看不改,先熟悉每一个设置是管什么的。第四步呢,建一个干净的演示项目, 先别用我们自己的私人文件。第五步,让库黛斯读取项目,生成一个简单的 markdown 文档。第六步,看右边的结果区,理解它到底最后产出了什么,就像我这个例子,它最后产出的是,呃,四个 markdown 文档。第七步呢,我们慢慢的去尝试一些插件和自动化,特别是 慢慢的去尝试一些 m c p 的 能力,当你学会 m c p 的 能力以后,你的效率会大大的提高。最后总结一句话就是扣代斯他不是一个简单的聊天框,他是装在我们电脑中的一个 ai 工作台,他能帮我们做事情。也不是简单的回答问题, 小白上手的关键是先从低风险的任务开始,逐步放开权限。别急,慢慢来嘛。我呢是一个工作十年的任务,开始逐步放开权限。别急,慢慢来嘛。我呢是一个用 ai 编程做了二十多个产品的设计师。 如果说你也想学 ai 编程,或者想看我用 ai 做出什么样的产品,可以 follow 我 一下,后面的我会慢慢的更新。

我去,这 codex 简直有点太强了,我不是下了一个录屏软件吗?叫 cat, 他 一直闪退,我也搞不清什么原因,我把他删了重装都没用。然后呢,我就直接跟 codex 说, 我桌面上有一个软件一直闪退,帮我检查一下,我甚至都没说是哪个软件啊,他直接帮我检查出来了,然后帮我把那个问题也给定位到了,并且告诉我怎么处理好的,我跟他说就这样处理,然后他就直接吭哧吭哧干吭哧吭哧干, 没经过几轮对话,你可以看下就这么一点上下文窗口,然后他直接帮我检查解决好了,太牛逼了,真的太牛逼了,他还帮我把这个软件更新到最新版本,虽然我知道扣代码他有这样的能力,但是真的当我们使用的时候还是会很惊叹啊,太夸张了。

一定要,一定要,一定要想方设法用上 codex, 如果你还没有听过 codex 或者克拉 code, 那 么恭喜你,这段视频你有可能会改变你的财富。 什么是 codex? 官方定义是一个编程证书,但它不仅仅是编程啊,黄仁勋就是英伟达的老总啊,世界首富,他已经让他的所有的员工都用上了 codex 或者克拉 code。 现在你听到的所有的什么英伟达的事实翻了多少倍啊?然后纳斯达克翻了多少倍啊?股市暴涨都是因为克拉克或者库克拉斯,它是代表着当前最先进的生产力。 codex 应该是对咱们普通人是门槛最低,成本最低,来使用世界上最顶级的大模型和智能体克拉克的对于普通人来说,还搞不定一些注册和网络问题,动不动就封号啊,也比较贵。那 codex 本身是不存在这种问题的,如果你不知道怎么使用,那么你第一步就只要注册下载, 然后搞定网络问题。你直接问他啊,你对我有什么作用?然后你把你的所有的工作,所有的生活告诉他,问他能帮助你。譬如说如果你是个股民,你就告诉他,我是个股民,我平时炒什么股? 我炒 a 股,然后你能帮助我什么?直接问啊,然后他一步一步的引导你。就是说如果你是工作,你每天的工作是什么?比如说你去打开邮箱啊,下载邮件, 处理数据,上传等等,把你的流程详细的描述给他,你直接问他,我这种工作你能帮我做什么?你能帮我优化什么样的流程,提供什么样的效率,做什么的工具就可以了。 如果你是在校学生或是二十来岁,那么克莱斯可能成为你改变人生的一个工具。就如同你在食堂打菜,突然开了一个新的窗口,那你要做的就是马上切过去,直接去排到队伍的最前面。

大家身边如果有一些真正在谈论和使用 codex, cloud code 这样的人,珍惜他,去和他们交流,去和他们做朋友,你进步的概率是更高的。他们普遍都是认知高、执行力强、信息整合能力强、探索欲旺盛的一群人。 就你想想,一个人去主动的拥抱、关注、学习最前沿的这些领域,并且能够真正的去实践他。首先一个他们一定是眼光好,认知高的。再一个进取心强, 执行能力强,持续学习的这种精神好,就你和家人待在一块,你的信息密度,你的思维方式都会整体被拉在网上。

大家好,欢迎回来,本期视频将给大家分享两个事情,第一个就是我们会去参加二零二六年的上海人工智能大会,那我们这里主要做了一款医学影像的一个鉴别工具,那主要是在做照影机渗漏和脑出血的一个鉴别诊断。 那第二个就是,呃,让大家通过那个 codex, 然后接入到我们的这个微信啊,那这是两个事情, 之前给大家分享过,通过我们的这个智能体系统,它其实已经可以啊,点击发布渠道,然后个人微信号在这里进行扫码登录了,就是已经可以让微信接入到智能体系统了。那今天这视频先给大家分享,就是如何接入到 cortex, 那接入到 codex, 这里引用的是一个开源项目,叫 codexbridge, 那 我们只需要怎么做呢?只需要把这一个链接啊,然后发给我们的 codex 啊,让他看一看这个项目,然后告诉他我需要对接个人微信。那这个时候我们发给我们的 codex 啊,这个时候它就会自动地去啊,处理这一个项目里面的内容,然后给出一张二维码,然后你扫码,然后进行登录就好。 那这是啊,他的一个事情,那第二个事情我们这个就可以暂时放在这就不管他。那第二个事情就是我们这一次参加上海的这个啊,人工智能大会,大家也可以啊,在网上搜啊,就是二零二六 啊,上海人工智能大会如何报名啊?这里是有具体的事情的,那我们可以点进去看一下, 应该啊,应该就是这个,然后他有具体的一个啊,参展的一些著名报啊,报名注册的一些信息,大家可以来玩一玩啊,具体的时间应该是在七月三号到七月六号啊, 然后大家可以安排一下自己的行程,然后去看一下目前大家在做哪些事情,特别是在人工智能领域。 ok, 那 我们给大家分享的就是我们现在在做的一个项目,就是使用 context 还有 cloud code 啊这两个东西。在啊分享的,我把这个 app 先打开来 啊,这是啊,这里正在跑的一个深度学习的一个东西,然后我这边是怎么用的呢?就是,呃,用 cloud code, 然后跑了一遍,然后再让 codex 在 这里做了一些任务, 然后他提出了他的问题,提出了 cloud 的 问题,然后反过来用 context 做一次验证,那 context 有 问题呢?就正好问 cloud 啊它里面的这些一些事情,然后这两个两边的模型是不一样的,这边用的模型是 open ai 的 五点五,那边用的是 office 四点七,就是 cloud 的 一个模型。 那好,我们看一下啊这个项目吧,比如这是一张头颅 ct, 然后这是张,呃,我们在医学里面就是临床里面的一张图像,它是急性缺血性促中的一个患者,然后做了一个介入治疗,介入治疗之后,这里可以看到一些高信号的一个表针, 那我们是不知道这个时候它到底是脑出血还是照相机渗漏的,就是人眼是很难去分辨的。当然有一些临床啊特征,比如它的一个走形,一个分布,然后它的一个 ct 值 啊,和我们的一个脑出血,可以做到一定的鉴别,但是并不能很好的做出一个分辨,因为它的灰度啊,我们肉眼很难去啊,做一眼望过去就能解决这个问题。所以说 这里就借助啊深度学习以及一些传统主学的一些方法,然后去做一个鉴别啊,它的意义在于什么呢?就是我们急性缺血性促充,我们都知道啊, time is brain, 就是 说 六个小时,对吧?那那个时候可能你这个溶栓啊,这些东西都很重要,你把啊这个栓子给它溶通了,那你的血管再通,那你的瘀后就是还可以的, 那如果是没有通的,那一般会去做桥接的一个曲酸,就是做一个血管啊,要么放支架,要么球囊扩张这些操作,然后就把那个血管再做一个开通,那开通之后它也能够去改善啊,术后的 这一身是在呃文献或者说已经是在全球广泛开展的一个医疗技术。但是问题就在于,嗯,我们这一个呃东西做完了之后啊,就是他会出现这一个呃表征啊,这个东西他不太好去区分他到底是脑出血,还是说我们做介入的那个造影剂, 那这就会影响到我们下一步啊,是否要给抗血小板药,就如果你是脑梗,那我给抗血小板药,就算你通了,我也要给抗血小板药,因为我要防止你再次发生脑梗, 然后出现啊院内的二次附中,这是一个事情,这也是有文献啊去支持的,那反过来就是如果这个地方是已经有出血转化了, 那如果我们再给啊抗血小板的药物,那某种程度上就会加重他的一个出血风险,那这个时候并不是说啊去防止他的一个啊再次脑梗,这个时候反而要防止他啊再次出现一个啊出血转化,或者说脑出血 啊,这个时候的危害会比啊在臂的那个危害要大,所以说这个时候就会直接影响到临床的一个治疗。那我们曲酸结束了之后啊,其实这个时候会去常规频扫一个 ct, 那 扫完 ct 之后就是大概一个这样的一个 ct 图, 那我们没有办法去区分的时候,其实在临床上就不太好操作啊,我们就不知道这个时候到底是说我们去用抗血小板,还是说我们不用然后观察 啊?这个时候临床上一般啊,如果是没有这一个高信号的,那我们就认为他是啊在通了没有出血,那这个时候一般会给那些替罗非班这些操作啊,因为替罗非班断续期比较短,他很快就可以代谢完,就是如果他出现那个出血的东西,他也可以立马停,这就是为什么 啊,会很多临床上会用一些啊替洛非班来去解决这个问题。那还有一个就是做完了手术之后,一般就是术后四十八小时,他都会再复查一个 ct, 那 如果是脑出血呢?其实啊,他就啊 这个高信号它会一直会在那,如果不是脑出血,它只是一个简单的造影剂渗漏,那这个地方它就会被我们的脑组织正常的进行一个吸收代谢啊,因为我们脑脊液有一个循环嘛,那这个地方很快就会被吸收代谢完, 那这里就看不到这个高信号,所以说,呃,我们的金标准是有的,只能说是内金标准啊。当然 有一些比较高端的医院,它里面有一些像双能 ct 的 一个操作,双人 ct 它可以去很好的解决这个问题,它可以看出啊,到这到底是血红蛋白,还是说啊它就是一些造影剂。但是问题就在于双能 ct 在 全球的一个普及程度还是非常低的 啊,在我们国内非常好的三甲医院啊,也是只有头部的那几家,它可能会配备双能 ct, 而且做双能 ct 它的那个成本也是更高一些的, 所以说某种程度上来讲,不管从设备还是从普及程度来看啊,这都是一个很长要走的路。那现在我们已经有 ai 有 深度学习这一个框架了, 那我们现在可以借助 ai, 可以 借助各种啊深度学习算法或者说 transform 的 架构,然后去训练一个模型出来,就是以后可以方便临床医生,就我上传一张啊影像的图片,它就能很快的帮我们识别出来啊,这个到底是造影剂深入还是脑出血, 那识别出来的作用就很直观啊,就可以指导临床医生,你是否是要给抗血药板药,还是说你要控制血压,防止烫脑出血 啊?这是啊完全不同的治疗的两个方向,这也会直接影响到患者的一个预后,所以说它的临床价值以及从啊临床的转化,或者说 ai 到应用的一个转化来讲,逻辑是非常啊通的。 但是问题就在于啊,需要一些非常高质量的数据,然后去完善这个工作,所以说我们也和一些医疗机构做了一些合作,然后拿到了相关的一些影像数据啊,这也是我们这一次参加这个大会要做的一个应用展示。 好,这是第一个事情啊,我们回来啊,回来看一下,这是这边正在对接这个 codex, 然后要对接微信嘛,然后让他完成这个工作。那好,我们看了刚才的那个数据,其实我这里有非常多的一个数据在这 就是每一张图里面比,比如这个,这个就是我们肉眼其实能发现啊,这个其实大概率就是一个脑出血嘛,他的不管是从形状上还是那些,这个是比较好判断的,那刚才那个其实不太好判断,对吧? 啊?其实大家也可以看出来,其实肉眼也有一些啊,区别,他到底是脑出血还是脑梗塞,但是难就难在于有时候不好判断的时候,你不知道怎么去做啊,这个时候会影响到患者的一个预后,所以说我们想通过一些算法,然后去优化这个啊识别的工具啊。 好,这是啊一个事情,当然啊,大家感兴趣的话可以来参加一下这个二零二六的上海人工智能大会啊,这里没有广告,这里没有广告。 ok, 好的,那后面后续的一个进展也会给大家做一个汇报,那这是 codex, 我 们待会儿可以看一下,它待会儿做完之后就是一个,呃,一个二维码,你扫二维码就可以对接上你的 codex, 然后你就可以在你的微信里面跟 codex 进行沟通啊, 大家可以看到整个啊 codex 跟 chatg p 不 一样的地方啊,就在于它是一个 agent, 它是一个编程 agent, 当时当然它的功能远不止是一个编程的功能,它有非常强大的一个能力啊。 呃,除此之外啊,上次给大家分享的就是这一个内容,我们用的那个框架,用了开源的那个 moai 的 一个架构,它背后是英伟达的显卡做一个训练, 当然里面的具体的一些算法啊,大家可以也不需要掌握那么详细啊。右边这一个中间这个图给大家讲一下吧,它就是一个啊 ct 值,那我们 ct 值它这里分了几个,比如我们这个啊,绿色这一块啊,我们就认为它是脑窗, 然后啊中值这里有个密度啊,就是这外面这一圈嘛,就是我们的颅骨,那它的信号是比较高的,它会大于三百 啊,所以说这边的数据就是其实是我们不在意的研究对象,我们研究对象就是脑窗嘛,所以说通过这个其实是做了一层筛选的,就是有时候他们勾画的不好,或者说他们把这个颅骨勾画进去了,那这个时候其实会影响到数据的质量, 所以说在这个层面上来讲,通过这一个呃 flag 的 一个东西,然后看能不能剔除掉这些啊,比较质量差的数据啊。当然这个其实很取决于就是临床医生对于这一个疾病的一个判断嘛,就是你的勾画啊, 但这个其实比较简单,你因为你只要有那个高信号,你就直接画就好了,所以说基本数据质量上来看,没有太大的一个问题。 好了,现在这里已经配置完成了,我们来看一下,他已经把个人微信接到了 context 主链路,然后下面是他具体写的一些东西啊,我们可以大致看一下,然后这里是他接入的方法, 我们主要是第一个是打开这个 power shell 啊,我们可以右键这个 win 的 开始,我是 win 十一,那如果你是那个以前的那些系统,你可能要啊输入一下啊, win 加 r, 进入 cmd 吧。 win 加 r, 然后输入 cmd, 然后按回车点确认 啊,你可能需要这么进入,进入到这一个界面来啊,你是 win 十一之前的一个小伙伴,这么进入,那如果你是 win 十一的话,你就直接右键,然后管理员然后进来就可以了。 ok, 那 我们进到这里来之后呢,我们需要啊输入这些命令啊,就直接复制这一个啊东西,然后填入进来, 然后他会告诉我,他生成了一张二维码,然后我们可以打开这一个二维码,这个是二维码的链接,上面是张图片的啊,二维码图片,我们只需要打开这一个链接啊, 输入进来,然后这里有一个二维码,我们通过微信扫一下这个二维码,就可以完成一个对接。好,那我们好再回来,回来我们看一下啊, 那我们现在还需要做一个,就是把这个启动桥做一个链接,那大家可以看一下这个命令啊,这里是指定你的那个操作的项目目录,那如果你不知道你的项目目录的话,你就输前面的 啊,如果你知道的话,你就把这个路径改成你的那个啊,本地的那个项目文件的路径就可以了,那我们把这一个就输这个吧, 然后输入进来,按回车啊,这个时候它就会自动的进行启动啊,启动这个微信的这个桥,这个时候我们把这个终端就放在这里,就不要动了啊,这个时候我们就可以控制 ctrl x, 然后去完成一些任务了。那我先来微信里面发一些信息,比如你好, 那当然这里应该也会有相关的回复啊,这里发了一个你好,那他就会自动的啊,然后回回答你,那微信这边也收到了这一个,就是你好,我在需要帮你查资料、写东西还是改代码,一起处理一些文件啊?这是他在我微信上发的这个信息, 然后还有一些,比如其他的一些命令,比如杠六反斜杠杠六,他就会开一个新的聊天, 然后啊,我的手机里面是说它已经创建了新的 bridge 绘画,那我们可以在这里输一个,比如说你好, 然后 context 就 给了我相关的回复,那这里如果你没有看到啊它的回复的话怎么办呢?就是你可能需要退出一下你的 context, 重新打开这里就会有这条记录了,那我们可以啊,应该啊,这是之前的对接微信啊,这是刚才的那个吧, 改代码还是处理别的事情,对吧?应该是之前的,我们把这两个先归档一下, 确认确认好我们退出啊,这里就是刚才我发这个,你好嘛,就是出来了,就是他在 context 里面也会有去对对应的这个记录啊,所以说你通过微信然后发语音也是可以的。 请问比如我长按一下,长按一下这个录音,请问今天是星期几? 然后把这个录音结果直接发给 context 也可以啊,你直接发语音就行了,不需要,就是转成文字,它是支持语音自动识别,然后去处理你的内容的, 那比如他这里已经回复我了,他是二零二六年五月十二号, ok, 没有问题。那你的 context 就 跟微信做了一个对接嘛?那他同样的所有的信息都会在你的 context 电脑上有一个显示,你也可以使用 context 去控制你的电脑,去啊写一些东西, 所以说这就是呃, context 接入微信的一个全部教程。好的,这就是本期视频,我想分享给大家的全部内容,谢谢大家。

如果你身边有朋友每天都在用扣币还有克拉扣的话,一定要去珍惜这种朋友,并且要想尽一切办法去靠近他们啊,跟他们去做兄弟,多跟他们请教,因为这种人是你们二六年最好的风水,他们现在张口闭口就不是说几千几万的了,动不动就是数千万过亿的开支, 而且在说到这种天文数字的时候,他们眼里是泛着光的,因为他们是真的有一个超能力啊。这种超能力是什么呢?就是当他脑海里面有一个真实的想法,有一个产品,有一个项目,他可以只需要花个短短的三五天,并且他一个人 就能把这件事情做成,而且还能把它落地,并且变成商业化。那么这种人呢?他们通常就会干这三件事情了。我今天就毫无保留的分享给大家,一定要点赞收藏。呃,第一步就是 先成为一个超级个体,每一个人都能啊,因为现在是 ai 时代了,过去呢,我们就是把自己的一个专业能力是吧? 呃,会先把它做成一个产品,然后卖给谁呢?不是卖给我们的客户,而是卖给我们的老板,当然这种方式他的风险很低嘛,也就是打工嘛,你当你把产品做出来了之后,那么你就能在这个公司一直卖,你就能一直待着,老板就一直给你发工资 啊,就算你产品做不出来也没关系是吧?你大不了你就卖一个,两个月,三个月,那试用期到了就到下一家继续卖呗。但是现在不一样了,兄弟们, 因为现在 colddesk 牢扣真的可以强大到你一个人啊,可以从有想法,然后到做产品,做运营,最后到商业化产生收益,一整条链路全部帮你搞定了, 而你从此以后你也不再是帮老板打工的牛马。你可以尝试着去自己主宰自己的人生, 前者是靠出卖自己的时间去换取劳动报酬嘛,但是后者就是出卖自己的偷啃,如果说换你的话,你会怎么选?现在偷啃这么便宜对吧?那么他们真正重要的第二步就开始了,他们会去搭建自己的知识库啊。最近有个很火的词,不知道你们有没有听过,叫做第二大脑, 当然也是离不开 a i。 我 这里插一句,有时候你不用用 codex, 你 甚至你都不知道自己的能力天花板原来有这么高。所以说从现在开始啊,把你最值钱的所有知识, 把它打包起来,丢给 ai, 变成一套系统。这里我推荐大家用一个工具啊,叫做 obsidian, 你 用上它之后,你会发现自己原来真的能跟一个产品一样, 你只有把自己当做产品,你才知道怎么把自己拿出来卖,对吧?你会慢慢的发现啊,你自身的长尾价值其实能持续很长的一段时间,而且他越打磨越好用,你的粉丝也会不断的去记住你,你自己就是一个品牌,一个细分领域赛道的代言词。 但是前提是啊,你每天都要疯狂的输入你这种输入方式,你可以通过 ai 帮你输入也行啊,通过自己的阅读去输入也行。当你输入的越来越多的时候,那么你的系统给你创造的价值就会像滚雪球效应一样,越来越丰盛, 到那个时候啊,你就再也不会在乎寒冬到底冷不冷了,你自己已经转码了。所以说前面的关键两步,如果说你都已经验证并且跑起来成功了的话,那么恭喜你啊,命运的齿轮就开始转动起来了。 到了第三步就是你可以完全不用依赖工作,你就能过上相对来说比较体面的生活。准确的说啊,也许你可能一周只需要工作四个小时, 因为你过去的不断输入还有输出啊,他们就会像一行行代码一样啊,正在不断不断的给你创造惊喜。而且你会发现啊,你现在使用 ai 的 能力,你已经比百分之九十九的人都还要强, 很多时候真的不需要你自己亲自工作了,你就像古代将军一样。我说的比较夸张啊,吹下牛啊啊,你只需要像一个将军一样,尽管的发号施令看结果就行了,等着你的 ai 团队给你回来打胜仗。 那么从现在开始,你应该知道了吧,你身边正在使用 codex cloud code 的 这群朋友,他们到底有多值钱了吧?

很多人说微信不好搜索,但如果把微信接近 codex, 它就不是聊天软件了,而是一个可以被 ai 查询的本地资料库。这段录屏里,我没有演示命令行,我只是直接楞 codex, 帮我看看微信里哪些内容适合拿来做展示。 它会自动调用微信 c、 l i 读取本集微信里的绘画公众号、群聊和私聊记录。第一步,他先帮我做素材盘点, 他发现最适合展示的不是普通私聊,而是三类内容, ai 群聊、公众号文章,以及我自己的公众号发布记录。这一步很重要, 以前我得自己翻微信,现在 codex 会先判断哪里信息密度最高。接着他开始整理公众号,你可以看到他把枢纽 a i、 g、 c 和宝玉 a i 里的文章按时间列出来。 这时候微信就变成了一个内容档案库,我可以让他复盘自己写过什么,也可以让他从别人的公众号里提炼选择题, 比如 agent、 skill、 codex、 mcp 这些关键词,直接变成一个选择题池。然后是群聊。群聊最麻烦,因为信息碎、噪音多,还特别容易刷过去。 但交给 codex, 它可以直接按主题总结。比如今天 agi 群里聊了模型额度、 ai 产品上线备案、自媒体内容方向、国内外市场选择。 这些内容如果人工翻,要看很久,但 codex 可以 把它压缩成几条可用结论。后面我还切回微信原窗口验证。你能看到 codex 总结的内容确实来自真实聊天记录。所以,微信 cli 的 价值不是偷看聊天记录。 他真正厉害的地方是把微信这个信息箍倒,接近了 ai agent 的 工作流,你在 codex 里说人话,他去本地微信里搜索,总结导出, 对自媒体来说,这就是选题池。对个人来说,这是记忆解锁。对做产品的人来说,这里面藏着真实需求,这才是我觉得他值得掩饰的原因。

写代码遇到报错还得手动复制一堆日制给 ai 看吗? codex 新功能, appshots 上按两下 command 键,当前窗口直接附加到对话里,而且不是截图,是直接获取窗口里所有文本内容, 甚至包括屏幕装不下的部分,相当于把你的工作界面实时共享给了 ai。 你 觉得这个功能最能帮你解决什么痛点?评论区聊聊,关注我,带你打破更多信息差!

这是一条 codex 技术求助的一个视频,五月十四号官方有一个最新版本的更新,然后新版本上有一个手机可以控制电脑的那个图形化 app 的 功能,然后呢,我这边用的是 mac 的 图形化的 codex 界面,但是我用的第三方的 api 接口,这我实话说我就为了省钱啊,确实也帮我省了不少钱, 所以可能是因为我没有买他的会员,所以他没有给我开放这方面功能啊,就你们有没有这个彦祖或者是逸飞啊,你们买了那个会员的啊,你们有没有 扣代斯手机控制的这个功能,然后有没有用过?对,可以跟我分享一下,因为我在犹豫啊,是不是我需要我再专门花一笔钱去测试这个东西,因为我现在的解决办法是之前有个小姐姐 啊,给我的建议用那个向日葵同手机操控电脑啊,也能也好使啊,也好使,只不过呢,手机上面操作还是有一点点别扭点,各种画面的操作啊,拖拉出来都是不是特别方便的。 对,他如果有一个手机版的话,就有一些我手机上的素材就可以直接传了啊,就不用再倒腾好几次啊,这块的,有没有这个有经验的兄弟对吧?已经开始玩的啊,跟我们分享一下。

最近 cloud code 还有 codex 这些 ai 都很火,然后今天我也是心血来潮,就是在啊科研之余,然后也想做一些好玩的东西。 具体来说就是今天做了一个就是让 ai 能够读取我们跟啊跨区之间的一个聊天记录,以及然后我们去投喂给他的一些信息,让他来判断就是对方对你的这样的一种好感,好感情况 以及后续啊,他也可以给你提供一些建议,就是你后续要怎么做啊?当然这个东西其实没什么用, 因为因为正常,正常来说就是大家都知道,就是对方,就是对方对我们是个什么情况,就是其实大家都知道,就相当于呃让我们能够从自身视角、朋友视角等其他这些视角以外 啊,还有了一个就是 ai 的 视角,告诉我们就是对方到底是要怎么样的情况好。总体来说是一个比较简单的,第一步就是让需要让 ai 去能够呃读取微信聊天记录 啊,然后第二步就是我们需要跟其他的项目一样,就是有这样一个点 m d 文件,这个点 m d 文件就是为给 ai 的, 就是让他了解我们的一些 啊,在其他项目中就是一些类似于标准啊,准则啊,就是 ai 必须严格执行这些标准啊。在这里呢就是我们相当于说啊是给 vr 的 一些 你跟啊你想要了解那个人的你们现在一些基本情况啊,这些基本情况就是大家可以自行的呃发挥想象,我这里主要就是让 ai 给我们生成了一个, 然后自己还补充了一些,比如说类似星座啊, mbti 啊什么之类的,然后包括在后续过后续分析的时候,你也可以让 ai 去结合星座、 mbti 这些情况去做一个具体的分析。 然后完了之后啊,在我们第一步这边就是让 ai 去啊读起微信聊天记录,这里 ai 啊一开始是让我们让我们去把微信聊天记录给他, 但这样很麻烦,所以我们后来就是让 ai 去自动读取聊天记录,然后具体就不用不用,不用我们做什么,你只需要跟 ai 说好了, ai 说就行,就是让他啊自动去读取聊天记录,然后让他自己去想办法,然后完了之后, 吧啦吧啦吧啦。 好,呃,这边我们就可以看到 ai 已经是把我的所有联系人的聊天记录都已经读取到了,呃,然后相当于,嗯, 你你在他给我们提供的这样一个列表中,你找到你需要去了解的啊,你想要好了解的那个人的那微信名,然后你告诉他微信名之后,他就可以获取到你们这些聊天记录啊,当然这可可能会存在一定的隐私情况,但我觉得对我来说是其实还好 啊,然后这个人就是也是一个比较要好的朋友,在啊玩之前就是啊,在做这个之前就是也跟他说了,然后完了之后, 嗯,我们就可以看到就是 ai 已经在读取我们的一些聊天信息了。聊天记录 然后到这里相当于就是,呃,已经全部读完,然后全部读完之后,我们就可以看一下就是 ai 的 对我们的这样的一个情况。 好啊,第一部分就是对一些你们的一个聊天记录的一个解读哈, 就比如说你们的,你们的聊天记录到底是怎么样的呀?然后怎么样的一个情况啊? 以及你们的一些消息回复比例啊?然后他还给我们梳理了一些时间线,但这些时间线就是啊,就 ai 就是 一点,就 ai 的 梳理的时间线就是完全只有机械思维。比如说这里很多情况其实本上就是一个啊,朋友之间的一个开玩笑, 然后对这边的一个 ai 来说,他就会觉得这是一个非常重要的一个事情。 然后其他的就是类似于他的一些综合情况,巴拉巴拉巴拉完了之后就是他也有一些什么你后续的具体行动方案,他给你的建议什么之类的, 然后啊,主要来说就是差不多就这样一个情况,好,希望对大家,希望大家有帮助,当然也是让大家能够图一乐,看一看。

昨晚 codex 来了一波大更新,这次是真挺猛的。首先说一下这个最实用的新功能, app shells, 以前那个 ai 描述问题要截图,要复制代码,最后还要手动解释半天。现在直接在 mac 上按住左右两个 command 键,当前窗口就直接传给 codex 了。这次不只是截图,是截图加文本一起打包进来, 重点在于它不只是读,你屏幕上的 vx 里只显示了五十行代码,没有问题。 codex 读的是完整的上下文,不是你肉眼看到的那一个页面。 整个生态也很丰富,比如说 figma 终端浏览器 notion 等等全部都支持,相当于把你的工作界面整个共享给了 codex, 效率直接拉满。第二个更新是 remote computer use, 手机上就能操控 mac 的 codex 任务,哪怕你的 mac 锁屏了都没有问题。 幻想一下未来的办公,电脑后台多个 a 程序在一起跑,你出门旅行没有带电脑,躺在床上也能指挥 mac 跑脚本发版本是不是方便多了?第三个是构模式正式上线扣代码了,现在 app id 插件 c l i 全线可用,你只需要给它个目标,它就可以自己保长线任务, 中间随时可以暂停或者改方向。我个人的小建议是,配合 plan, 请把方向锁定,加上 set, 随时开个临时对话窗口确认思路,再用 go 模式跑长线任务的时候会稳很多。最后是浏览器内置高级注视模式,可以直接在页面上标注修改甚至编辑元素, 比如说这个字太小,这个颜色不太对之类的视频的。最后我再补充一个细节,现在扣带才支持团队共享插件 team 版本的用户可以批量给其他成员分发插件包、技能、 m c p、 服务器等一起推,省去一个个配置的麻烦了。

所有已经开始用 cloud 或者 codex 开始编程的老板,我现在呢只嘱咐你们一件事情,就是一定要注意身体, 真的,我知道你们跑通了这个 cloud, 跑通了 codex 之后,你们会非常的兴奋,因为以前你想都不敢想的事情,现在居然可以让他在几分钟之内就实现了。以前你会被你的员工气得要死的那种任务,然后现在他可以丝滑的直接给你一个完美的结果, 但是呢,还是要注意身体,我之前咨询的很多找我咨询的老板,然后跟我反馈说,天天编程搓代码搓到六点,早上六点啊,然后呢九点又去上班,我觉得这样可能会,这个 可能会你还没有干,你还没有完成你自己的大业,自己身体先垮了,不能这样啊,铁子们啊。而且很多时候我们要把心态放的平稳一点,像有一些像可乐或者 call 贷斯可能也执行的不是很好的一些任务, 然后你也没必要非得去跟他较劲,整晚整晚的较劲,因为现在的这些东西更新的这么快, 你要知道可能你较劲很长时间的事情,你就算放下他,你出去玩几天,你回来之后你会发现他的更新已经把这个问题给解决了,真的,我之前很多次碰到这样的事情, 然后另外一件事情,你要知道这个可乐现在咱们用的这个四点七版本已经是他的,这个他前面还有三个未发布的版本,那三个版本都已经开发好了,只不过他没有发布 明白铁子们,所以你知道现在这个四点七已经用的让你这么爽了,那你能想象后面那三个版本发布之后你会用的用起来有多爽? 咱们现在已经跑在时代之前了啊,所以我们要对自己有信心。好吧?不要这个,不要太贪,不要太贪功,然后这个注意身体,谢谢。

好,大家好,我是小刘。呃,今天我们一起来聊一下在 codex 中上下文管理的一些技巧,那这里呢,我会讲我平时在使用 codex 当中,我是怎样进行上下文管理的。那我们先说一下背景, 什么上下文管理呢?就是我们知道我们在一次对话的过程当中,它的绘画窗口是有限的,可以看到这里是共二百五十八 k, 那 已经使用了三十二 k, 当这个上下文满的时候呢,扣代码,它会自动的压缩这个背景,这样呢我们的这个整个上下文会失真。什么是压缩背景呢?比如说猫和老鼠四个字,那就是我们绘画的主要内容,他会把它压缩一下变成猫老鼠,你看是不是压缩了,对不对? 但这样就会产生一个通病,就是产生 ai 幻觉,那也就是我们的功能开发会越用越不好用,你会发现你跟他说一个点,他就是不明白,然后呢会导致我们很崩溃。 那我们来看一下这个网友是怎么解决的,然后我再讲我自己的方案,他的方案就非常的简洁易懂,就我们都知道每一次对话呢,它会产生一个绘画的 id, 那 我们这次绘画它是存储到我们本地内存当中或者数据当中,这时候我们可以选择复制这绘画 id, 那 这个绘画 id 呢?本身上是一堆的这种字母,就我们扣带子可以根据这个字母找到我们当前上下我们所有对话, 他拿到绘画呢,可能是压缩库的,可能是不准确的,所以呢他就遇到了这个情况,他就把他哎复制到一个新的窗口当中,比如说新对话,这时候你看跟他说对吧?请你帮我进行这个功能继续开发是不是?那这个时候是不是就拿到了我们的青山崖纹?这个也可以,只是说开发的时候,那他需要去浪费更多的图层,因为他需要加载数据库,加一个内存,对吧? 好,首先我先说一下我的方案,就是这里呢,我会回顾一个上下文的文档,进行定期的总结。举个例子,比如说像这个绘画呢,他都满了,那我就跟他说,请你帮我根据当前这一次的绘画呢进行总结出一个 markdown 文件,这个 markdown 文件呢是包含了这一次的一些所有的关键信息,那你可以看我思路这样的,请你帮助我, 请你总结当前项目的关键决策已经完成的部分和代办事项,便于我下次听话加的一定要加这句话,如果说你不加这句话,他给你的可能就是一个总结性的文档,如果说你加这句话的话,他会按照 call 代词能够处理的绘画格式给你一个哎,一个合理的 bug 档,所以就相当于固定的一个格式给他。那如果说,哎,我这时候跟他说这句话对不对? 尽量用五点五模型,用最好的模型实现的效果可能是最好的。然后你比如说用五点五超高你发送一下,那这时候呢,他就会根据你当前的这个项目进行总结一个 bug 大 文件,那收下一次开启的时候呢,你就可以把这个 bug 大 文件哎给他 就是丢进去,然后这个时候呢,他就可以直接的进行上一次上下文的复用,而且呢失真不会失的很严重,那最起码会比直接使用 codex 压缩的方式会好一点,那这是我的第一种方法。第二个呢,就是使用这 codex 内置的压缩功能呢,这个我刚刚说过了,对吧?我们 正常来说 codex 也会进行自动压缩,但是它会进行四帧,但是进阶技巧就是我们可以直接让 codex 呢,每次都生成这个 prompt, 就是 给它设定一个这个啊, ajax, ajax, markdown, 这种,对吧?让它自动生成,而不是让我们手动去指定它。 那这里呢,再分享一下我自己的这个 codex 技巧,因为有小伙伴他会问我说,你视频当中平时使用 codex, 那 我先说我怎么使用呢?首先我不会把一个项目 丢到一个上下绘画里面,一个上下文绘画里面我会把它拆成多个小的功能,在每一个小的功能对应一个绘画,这样呢,我这个绘画可以赞成很大,并且呢它总结出一个 markdown 文件,再把这个 markdown 文件丢给一个新的绘画,这样呢,我们就基于这个功能在进行优化,不会去影响整个的大局。啊,能懂我意思吧? 那第三种就是我们可以使用外部的持久化工具,那这个外部持久化工具有很多,比如像我们之前说的 context 上来说,就是把原先我们的 markdown 给它缔造了外部的这种 社区部里面去,你可以这么去理解,然后通过一些更好的方式去把它读取到这个 collect。 那 每一个开源项目都有自己的方式,大家可以自行研究,因为篇幅有限,所以我这里呢就讲这几种,好吧。 然后呢?呃,这种方式呢?其实我还是建议大家使用 bit 进行管理起来,因为当我们用 bit 进行管理起来之后,我们整个上下文呢,能够更加有链路的去回溯,就是每一个版本都有对应的回溯, 我们能够很清晰的看到,对吧?这是我们整个流程,你可以看到通过这样的方式,那就是像上下文的这个管理,好吧,这呢是。呃,好了,那以上就是本期视频的全部了呢,我是小刘,我们下期再见。

比起 opencloudex 可能才更适合普通人使用,能操作电脑做文档、表格、 ppt, 还能生成图片,执行自动化任务,逐渐从编程 agent 走向桌面 ai 助手。那今天这个视频我就给大家带来 codex 保姆级教程。先到 codex 的 下载页点击下载 macos, 下载好后打开安装包, 直接把文件拖进去就可以了。打开 codex, 它的界面很像网页版的 ai 聊天界面,主要可以分为三块,右边这里就是和 ai 对 话的地方。左上角的四个功能,第一个就是开启一个新的 ai 对 话搜索,可以通过标题来找到之前的对话内容, 剩下的插件和自动化功能我会在后面详细讲解。左下角这里是两种和 ai 写作的方式,一种是项目方式,一种是对话方式。 项目方式更适合去做一些长期积累的任务,比如沉淀知识库、做工作流、写代码。有两种方式使用项目,一个是创建新项目,默认会在文稿目录下创建一个项目文件夹,也可以使用你现有的文件夹作为项目, 所有后续的 a 阵子操作都会默认在项目文件夹下进行。第二种对话方式,就像我们平常使用网页版 ai, 可以 临时去做一些任务,比如偶尔查一查信息什么的, 那我们这里就可以新建一个项目,我们也可以在三个点这里给项目改名,在聊天框左下角就可以看到他已经进入了刚才新建的项目文件夹。下聊天框这里的加号, 我们就可以上传图片或者文件给 ai 这里我们还可以开启计划模式,这个模式是不让 ai 直接改动文件,而是先生成一份计划,我们看完没有问题以后才会执行。 权限,这里 codex 有 三种权限,第一种默认权限,就是只能访问项目文件夹下的文件,如果涉及到其他文件或者网络访问,就会弹出审核框让我们去批准。第二种是自动审查,就是 codex 会自动放行低风险操作,高风险操作才会需要人工审核。 最后一种就是给 codex 所有的电脑权限,很方便使用。右边这里我们可以选择模型的推理强度,复杂人物可以选择更高的推理强度。 模型这里我们可以切换多个叉 t b t 模型最后的速度就是可以加快模型的输出速度,不过会消耗更多的 token。 这里直接让 ai 写一个单 html 的 个人播客网站,但我们可能有新的想法,想要加进去就可以直接进行引导, 比如我这里补充整体色彩风格要用孟菲斯风格,还可以继续补充,要用一个板块式,个人作品展示用滑动式般的呈现。我们直接点击这里的引导, codex 就 会在下次执行工具调用后 插入我们新的要求,很适合补充提示词或者纠正方向,不用中断对话,让他帮我们再写一个手工艺的电商网站。使用 react, 那可以看到两个任务就并行执行了,属于转圈的状态, codex 当前步骤完成后就会显示为一个小蓝点。 看完基本使用,我们来看一看一些好用的特性。先来看一下插件功能,插件就是用来帮助 codex 操作各种工具的, 比如 computer use 和 browser use 就是 让 codex 操作你的电脑和它的内置浏览器,下面这两个就可以操作表格和 ppt, 那 往下翻我们还可以看到操作邮箱 canvas 设计软件的,我们点开一个就可以看到。这个插件其实由外部服务调用和技能组成, 那有的插件本身也是一个技能,后面也会给大家演示怎么使用插件。技能这里大家应该就不陌生了,技能就是工作流程的一个分装,如果有不懂的朋友可以看一下我之前讲 agent skill 的 视频, 如果你是以现有文件夹的方式创建项目的,也会把里面的技能同步过来。接下来我们就来看一下 computer use 这个插件, 它是利用 macos 的 屏幕录制和无障碍辅助数,让 codex 既能看到画面,又能精准点击。 这里我让他打开扫雷通关简单模式,这个半透明小光标就是 codex 操作所使用的,不会占用你的鼠标。一开始他尝试标记地雷的时候,发现标记失败了,很有意思的是,他换了一种玩法, 直接打开安全格,然后就是一路门店,推理出所有可能的安全位,直接通关。我就在想,如果以后模型的推理速度和输出速度再快一点,那我们干游戏就只需要用 ai 就 可以了。 下面我们看一下办公三件套和作图插件,这里我让他调研一下英伟达显卡的发布和价格信息,并让他制作成 word 文档, 然后配图。这里他很快先把配图制作出来了,整个过程一共用了十六分钟,第一次用的时候他会自动安装相关运行环境,制作完成后,他还会截图进行复查,发现可以打磨的地方还会进行二次修改。我们打开文档来看一下 发布信息和价格表都出来了,而且还贴心的配了图,最后还有产品线解读和购买建议。然后我让他在这个基础上把价格表整理成 excel, 同样的他在处理过程也会不断修正错误,花了五分钟时间做好。 来看一下表格,所有信息都正确写进来了,唯一有个瑕疵是溢价,这一栏应该是百分比,它这里用的是小数,不过这些都可以通过细化提示词去解决。下面继续让它根据文档做 ppt 分 格,参考苹果信息层级不超过三层。 他做完第一版以后,又对我的信息层级这个要求进行复查。我们来看一下 ppt 整体布局还是很舒服的,满足了我对信息层级的要求,没有堆满字,而且风格也是沿用了英伟达的配色。最后我们来说一下自动化功能, 它就相当于一个定时任务。右上角这里我们可以新建任务模板里有一些关于代码的任务模板。下面这里你可以选择在哪个项目文件夹下进行, 并且设定定时时间,有每小时、每天、每个工作日或者每周。也可以自定义规则,我们可以直接粘贴这个规则,让 ai 帮我们改成任意时间,比如这里就让它改成每周二和每周四的十三点执行。那 那我们在这里也可以让它执行已有的工作流程,比如这里,我之前是用 cloud code 做的,在 cloud 点 md 里已经写好了完整的自动拉取推文的流程,那直接让 codex 执行就可以了,很顺利地帮我完成了定时任务。那以上就是全部教程了,如果对你有帮助的话,记得一键三连。

推荐所有刚刚 codex 的 朋友啊,都去跑下这个任务,告诉 codex 你 是谁,你的工作是什么?职业是什么?你在工作当中有哪些非常烦的点?有哪些重复性的工作?你最不舒坦的流程是哪些?最后让 codex 帮你梳理一份它可以帮助你去完成的十项任务清单。 跑完这个任务了之后,你会非常清楚 codex 究竟能帮你在工作当中完成哪些事情和任务,推荐你去跑它。