有朋友问我说你会用 a h 量化策略,是不是意味着你可以在这个市场上扛赚了?那我的答案是肯定是不是的,我过去一年呢,实现过二十多个经典的量化策略,我可以很负责任的告诉大家,没有任何一个固定规则的策略,在任何市场环境下,对任何标的是稳定盈利的。 那既然这件事情没有,没有办法让我们时间躺赚,我们为什么还要去做它呢?我认为用 ai 编程斜量化策略可以让我们对这个市场形成三方面的一个降维打击,从而缩短我们的试错周期,也间接的降低了我们的试错成本。那第一方面呢,就是 打破了物理极限,全市场有五千四百多只股票,我们如果每天去用人工复盘和筛选,我们要花半天甚至一天都不一定能看的完。 那如果用 ai 编程,就拿我自己来说吧,我的脚本其实每天只需要在班后运行十五分钟,我就可以筛选出当天的异动板块跟异动标的。第二个方面呢,就是粉碎我们的认知幻觉。 我们有没有这样的感受,就是在网上或者听某个大 v 说了某个站法,我们去试验过后发现其实长期下来是亏的, 那这个问题到底在哪呢?其实我们如果有了 ai 编程之后呢,我们就可以把我们这个想法或者是这个方法进行一个快速的实现,回测过去十年的数据,然后呢可以查看每一笔交易的这个盈和亏,以及它的问题在哪里,那至于说这个策略的坑在哪里,一目了然 把。以前你可能需要两到三年的一个试错的时间,从而缩短到可能你需要一个周末就可以搞定。第三个方面呢,就是反人性的纪律问题, 其实我们很多人亏,亏钱的最本质原因倒不是说呃,我们选错了标的,而是说我们在该止损的时候没有止损,然后该进场的时候没有第一时间进场,或者是我们的仓位管理不是很固定。那 以上所有的原因综合起来,它其实是一个相当随机的过程,那这样一个随机的一个过程就会导致我们的账户其实是 长期下来是亏损的。那其实交易是一个在数学上呢,是一个很严谨的一个正期望的一个概率问题。那我们要做到一个正向的一个期望,我们就必须借助 ai 编程告诉我们在什么时候买,在什么时候卖,让我们的交易达到一致性,从而实现 知行合一的一个状态。那其实这三个方面的降维打击呢?我总结下来其实就是 ai 编程实现量化策略的 对我们整个交易的一个八个作用,我梳理了一下,大家可以看一下,那后面的视后面视频呢内容当中我会把这八个作用一用 ai 编程的案例来分享给大家。
粉丝346获赞526

我用酷币做了一个非常好玩的选股神器啊,没想到他做出来的效果这么好啊,等一下给大家演示一下,这是整个软件的界面,假如我们要找什么股票在这里六零一他就会出来了,对吧? 嗯,然后双击一下,他就这里就会有贴现图啊,那些饼图啊之类的,这里是有五千多只可以选的哈, 我给大家介绍一下我这个软件的一个逻辑啊,非常感谢一个二十多年古灵的一个粉丝啊,给我提了很多意见。 ok, 选股,这里就是我选好的股票,按照我的条件选好了的股票呢,我可以放到选股池这里,那这里呢是实时更新的选股池这里 就是符合我条件的股票,他会全部放到这里来,一旦这里的股票不符合我的条件呢,他又会把它移走,所以选股池这里留下的所有的股票都是符合我最新条件的 股票。我这里设置了一个经验选股,因为每个人买股票他可能都不一样的经验思维,所以每个人都会不一样,这个属于自定义的了。这里呢,我也会放到一些我需要监测的股票,放在这里,重点关注的会放到这里来, 实时去跟进他的一些信息啊,这里可以新建的啊,新建把规则定好了就可以新建 事件。这里呢,就是我还没有想好要放什么东西,可能就是放一些新闻呢,就是你想要看这只股票啊,他有什么新闻呢?可能会放这些东西。这个问答呢,就是说我们有什么疑问呢,就可以在这里去问他啊, ai 会给出一些答案,然后设置这里呢,我是用了 dipstick 的 api kit, 然后数据提供方呢,是用 a, k, c, r 的, 所以整个软件的逻辑就是这样子的,如果大家有更好的一些建议呢啊,也欢迎大家提出来啊,我看一下是怎么样去把它加上去啊, 后面呢,我可能会增加一个短信通知,假如啊,我们在这里的一些股票,它有一些符合你可以购入的条件,才会发信息给你。 现在的 ai 真的 是太强大了,像 codex 这样子的工具呢,以后呢,肯定是会越来越多的,像以前我们要做一个这样子的一个软件的话,你没个几万块钱估计就搞不定,或者是说你的程序员要写好久,那现在很简单啊,只需要一句话就能搞定了。那像这种 ai 工具呢,它适用范围是非常广的, 像很多电商行业啊,你要做数据分析啊,你要靠人力去堆的那些工作啊,其实都可以让 ai 做,因为 ai 最擅长就是数据分析,做报表啊,做什么各种各样的分析,不管你是公司的运营啊,或者要做财务的数据分析啊, 或者是你业务部门呢,要做一些调查报告啊,各种各样的东西,其实都可以用 ai 来去解决,一句话非常简单。

大家好,上期视频我简单介绍了一个用 codex 开发的 btc 均值回归策略,评论区有网友和大佬提了一些问题,所以今天我用 codex 做了一次复盘和二次审查。先回答一个大家比较关心的问题。我这边使用的是 gpt 五点 five, 高推理强度, 并且会让多个 agent 分 工协助。审查时我先参考了一些比较权威的量化资料和代码审查思路,然后让 codex 结合这些标准,对策略代码回测逻辑和模拟盘执行逻辑重新检查了一遍。 今天主要修的是模拟盘执行层。第一个问题是 ter mat, 我 一开始以为 ter mat 是 live 运行后才暴露出来的新情况,重新审查历史回测代码后发现回测里本身就有 ter mat 机制,一米最多持仓六十根 k 线, 五米最多持仓十二根 k 线,如果期间没有触发止盈或止损,就按最后一根 k 线的收盘价出场。第二个问题是止盈止损的执行方式。策略在开仓时就会固定止盈止损点位,相当于在本地账本里放了一组虚拟 bracket o 的。 后续每次扫描 balance 十盘 k 线, 只要 high 或 low 触达止盈止损就按对应的虚拟挂单价格结算。第三个问题是多周期仓位隔离。之前一米和五米策略都在同一个脚本里运行,本地可以区分不同 sleeve。 但以后如果接真实交易所,同一个 symbol, 同一个方向的仓位可能会在交易所里合并。 今天我把脚本拆成了一米和五米两个独立入口,后面可以分别接不同账户或者不同交易所。这次主要修了这些内容,一、开仓时记录 virtual t p price 和 virtual l price。 二、 t p s l 处驾驶记录 trigger virtual order。 三、 ta mod 沿用回测逻辑,一米是六十根,五米是十二根。四、默认改成本地账本模拟,不再默认使用 balance testnet。 五、 新增一米和五米两个独立运行脚本。六、健康监控和 trading view 导出,支持读取拆分后的账本。七、 如果以后启用 testnet, 必须确认订单真正 field 后才写入本地状态。目前这个策略还在模拟盘验证阶段。 今天这次调整主要是为了让模拟盘执行逻辑和历史回测逻辑保持一致,让后续一百比样本更干净。 leave 执行和回测是否一致也非常关键。

codex 虽然功能强大,但是使用 openai 官方的 token 渠道,性价比非常低,这里教大家如何将 codex 接入到国产性价比之王 deepsea k。 平时就把轻量化的任务交给 deepsea。 首先需要安装几个前置的工具, 第一个 node 点 js, 直接搜索官网,点进去,选择自己对应的版本下载即可。下好后一路下一步安装就行。 第二步安装 c c x 和 c c switch, 这俩因为要去 get 掌,这里我就把安装包放简介了,大家自行领取下好安装包后安装。先打开 c c x, 这个 ev 是 环境配置文件,可以用记事本的方式打开,这个密钥是一二三四五六记一下, 然后打开运行程序,把这个管理界面的连接复制到网页,打开, 输入刚才那个密钥,一二三四五六,可以把它切换成简体中文。然后我们先不管它,打开 deepseek 的 官网,点这个 a p i 开放平台,这里大家用自己的账号登录,然后点左边这个接口文档,把这个余额要地址复制一下,然后回到 c c x, 点上面的 codex, 再点添加渠道,在上面粘贴一下 y o r l 地址。接下来回到 d p c 点这里的 a p e k 点创建 a p e k 这个名称,随便填点创建 这个 a p i k, 大家可以自行保存一下,要记得不要暴露出去,不然别人用你的 api 用的就是你的钱。把它复制下来,粘贴到 c c x 这里, 然后点右上角的详细配置,把这个服务类型换成 open ai 下拉,把这个模块化非常键给打开,然后保存配置,接下来再打开 ccc 位置, 一路下一步安装即可, 安装完成后打开它渠道,选择 open ai 这个点右上角的添加,选择自定义配置, 下面供应商名称随便填一个 a p e k, 填一二三四五六。然后这个 api 请求地址,我们回到 c c x, 把这个 api 地址复制过去, 点这个获取模型列表, 就能看到接入的 deepseek 了。选择模型下拉,把这个百万上下文窗口打开,然后保存配置,并且用它。 接下来就可以进入 codex 了。国内直连肯定是有一点慢的,耐心等待一下, 我这里自动登录了,退出重新登录,登录时选这个,使用其他方式登录, 然后输入刚才配置的一二三四五六。可以看到模型这里已经是自定义了,也就是在 c c c 区里配好的 d p c k。 正常的话这里就是 g p t 五点五。当然如果要正常使用的话,肯定是要给 d p c 可充一点钱的,不然就会出现这种五零三报错。最后提一嘴, 如果你有条件的话,还是建议使用 g p t 原声的,肯定是要比我们接入 d p c k 好 用, d p c k 只是胜在更便宜而已。好了,以上是本期全部内容了,我们下期再见。

大家好,现在看到的是我用 codex 辅助开发的一套 btc u sdt 低周期量化策略。这个策略目前分为两个周期, 一分钟和五分钟,一共四个模型,分别对应一米做多、一米做空、五米做多、五米做空。做多和做空是分开训练,分开管理的 模型使用的是 x g b o o s t, 也就是 x g b。 策略的核心逻辑不是预测 b t c 大 方向,而是在价格触碰布林带边缘之后,判断他有没有机会先回到 birken, 在 判断回本之后能不能多吃一小段利润。现在屏幕上看到的是开发完成后的 o o s 回测和后选池表现,但满和逻辑我已经反复检查过,也让 codex 配合多 agent 做过审查,目前没有发现明显的未来函数问题。 同时我也做了样本外验证和 e t h i。 不 验证,用来降低过你和风险,但我不会说过你和已经被完全排除。量化里没有这种绝对结论,现在它只能说明 这个框架不是纯粹的回测幻觉,值得介入模拟盘验证阶段。目前策略已经接入 balance 石盘公共 k 线作为信号源,模拟盘只负责镜像下单,也就是说 限号来自真实市场行情,但下单还在 demo testnet 环境里跑。当前每笔仓位是零点零零一 btc, 按现在 btc 价格大概是八零 u 民意价值模拟盘杠杆是五倍,所以每条策略单笔大约是十几,已有保证金级别的小仓位测试。截至现在, 策略已经跑了三十笔已结算交易,其中十笔是净盈利,但整体表现只能说一般,因为 time mat 比例偏高,盈利单的收益暂时覆盖不了亏损单。这里的 time mat 指的是进场之后既没有打到止盈,也没有打到止损, 持仓达到最大时间后强制退出。这个问题也是 live 阶段暴露出来的。我后面会重点研究六十根 k 线的持仓上限是否合理,比如缩短到三十分钟会不会减少这种磨损亏损。所以这不是一个稳赚策略, 也不是回测神话,它现在只是一个从研究阶段进入模拟盘印证阶段的量化系统。接下来我会继续收集到一百笔交易样本,重点观察 tamad 净盈利因子 profit factor 个子策略表现以及模型是否出现衰减。我觉得量化最难的不是写出一个策略,而是在真实环境里验证它有没有衰减,以及你能不能再结果不够好看的时候仍然保持纪律。

之前的策略感觉不怎么好,于是加入 ai 自动调优,接入 deepseek, 因为便宜, 让他读取一段时间的每天选股的数据,根据后续的股价表现来自动生成策略调优报告, 可以人工修改,也可以让它自动修改。再选股一段时间,看看后续效果吧。至于前端,先凑合用着吧,最后再优化前端 token 有 点消耗不起了。 anti gravity code 还是好用的,虽然 cloud code 强,但是没敢充值。

高乐股份走势符合预期,昨天跟今天的涨幅都符合选股策略的预判,按照设计逻辑,未来还有三天,不知道是否会按照 ai 判断的趋势发展。金瑞矿业,昨天策略选的股,今天早盘上涨三点三二个百分点,到了午后收盘变成跌了零点六五个百分点, 有点高开低走,期待他明天的表现。今日选股策略选了一只高分股,明天大概率会一字板,那我们的测试就没有意义,放上来就是看一下明天他会不会开板,如果开板我们就继续测试。 这只天创时尚也是今天选股策略的推荐,比统一股份要次一级,但是依然很强,所有的数据都是为了验证 ai 选股的能力, 不构成投资参考,我尽量每天都更新实验的情况,如果实验到好的策略,我会邀请朋友们一起实验,兄弟们给我点点关注,点点推荐,说不定我们就做成了呢,一起享受 ai 给我们带来的快乐,朋友们明天见!

大家好,上期视频我主要在修复 tab 问题,目前 tab 调整后的版本还在模拟盘利继续跑,从初步表现看, 确实比上一版好一些。我这两天在解决整个项目的混乱问题,主线策略 shada 版本 tab 复盘,每日任务 codex 交接,全部散在聊天记录、代码截图和脑子里,所以我开始用 abcdian 搭一个项目共同大脑, 它是用来管理我的量化开发流程,每天记录策略运行情况,晚上让 codex 总结,再把问题实验复盘和下一步任务沉淀下来。现在这个版本还很初级,但已经能解决一个问题。 我每天打开电脑后知道今天只该盯哪一个问题。目前 emlong 它 max 六十,已经收集到一百笔左右,主要问题还是它 mate 过短,新版本是对照实验,现在数据依旧不好看,主要是样本还不够。

ai 第一次自己可以赚到钱?你没听错, codex 自己赚了十六点八八美刀,但你看懂这个事情的底层逻辑了吗?今天跟大家分享一个通过 codex 赚米的方法,这是一个最小的模型,看看它是如何实现的,以及背后的逻辑。我给大家拆开来。 首先呢,我们要清晰 codex 是 怎么做到的。其次呢,我们要知道人为操作的部分到底有多少。今天的主人公呢,是一个执行力非常强的 chris, 他 在五月十号左右呢,给 codex 下了一条指令,具体原文没有公开,但核心意思就是帮我在 github 上赚五美元。 codex 收到指令后,自己定位到一个开源安全的审计赏金平台,找到可以参与的项目,读完代码,写出修改方案,提交了 pr。 最关键的一步来了,项目维护者在 pr 下面提出了意见, codex 自己回复,自己修改,重新提交,最终 pr 被合并验证。流程走完几天之后, chris 拿到了账户里的十六点八八刀,从接单到交付到收款,全程必还。 chris 的 帖子发出的当天,浏览量就破了百万。但我今天跟你聊的不是 ai 能赚钱了这个结论,这个事谁都能看出来。我想跟你聊的是三个更容易被你忽视的细节。 第一个呢,就是 chris 的 原话里提到,在我没有要求的情况下, codex 对 我的付款信息进行了保密。 chris 没有给他下达保护隐私的指令,他是自己判断出付款信息不能随便透露,然后主动做了脱敏。 第二个细节呢,就是 chris 说 codex 同时跑了十到十五个安全审计的项目,十六点八八刀只是第一个亮绿灯到账的,后面还有好几个 p d。 第三个细节更值得我们去琢磨。 chris 在 这次实践里几乎没有任何的干预,按他的说法,总共消耗了约两千两百万个 token。 按 api 的 定价折算,成本确实不低,但重点的是,他不是在操作扣代斯,他是在观察扣代斯。从操作者到观察者这个身份的转换,才是最值得深思的那个信号。这三个细节的背后,藏着三个更值得追问的问题, 来跟着我一起思考。第一个问题,为什么是安全审计?为什么不写小说,不做设计,不做剪辑视频? 因为软件安全审计有一个别的领域没有的特征,代码在线协助,在线结果可测试,可验证,付款走平台, ai 能进入的边界刚好闭合。 这不是巧合,是软件任务天然配合,是软件任务天然适配 ai 代理。第二个问题就是,十六点八八刀够覆盖成本吗? chris 用的二十美元的 plus 订阅套餐,跑了约两千两百万个 talk, 如果按照 api 单独计费来算,这项目大概率是亏损的。但 chris 自己也承认,重点不是盈利,而是跑通了信号。所以别看贴子就去做发财梦, 这目前还不是一个能复制的商业模式。第三个问题也是最关键的问题, chris 做了什么? 他没有写一行代码,没有给任何的技术指导,但他只做了一件事情,就是给了一个清晰的目标,把帮我赚钱的这个模糊的愿望,翻译成了去 github 去找赏金任务这个可执行的指令。 那么从操作者到目标设定者,这才是 codex 变现的第一堂课。但在这里我也要提醒一句,目前 chris 没有公开完整的操作日制,我们并不能看到中途到底有没有人工的确认。 所以要说 ai 只靠一句话自动赚钱,还是有些言过其实。所以呢,我对这件事情的判断有三句话给到大家。第一句话, 这不是 ai 替你赚钱的故事,这是一个任务,市场正在对 ai 开放接口的故事。安全审计只是一个开始, 代码审查、自动化测试、文档翻译这些边界清晰结果可检测的软件任务都逐步会向 ai 开放。第二句就是 chris 做对的那件事,把模糊目标翻译成可执行的指令,这才是这个时代最被低估的一个能力。 第三句话,也是最重要的一句话,告诉大家,别去复制 chris 的 实验,你应该复制的是他提问题的方式。最后,如果你也有一个 codex, 你 最想让他帮你完成什么样的任务, 不是帮我赚钱,这种是具体的,边界清晰的结果,可验证的那种。把答案写在评论区,我帮你判断这个任务的现在成熟度。老曹在大连帮你盯着最前沿的信号。我觉得今天给大家分享的事很有时代意义, 现在总是有人在恐惧变化,我们不制造焦虑,不再去想 ai 浪潮发展如此之快,我们是否会被淘汰的问题,而我觉得我们只有在拥抱变化,顺势而为的时候,才能得到更好的结果。

好的朋友们,今天是零基础用 codex 写一个选股神器走好的,操作起来也是很简单,我打开 codex, 然后跟他说我的诉求也就是我会给你一些选股的条件,我让他把当下符合条件的股票选出来给我。 今天我的第一个思路就是用符合海龟交易的法则来选出二十只股票,然后海龟交易法则是有一些有一些基础策略的,比如说他是有一个双金线的金仓,还有放量突破 啊, rsi 的 超卖反弹,以及一些基本面的筛选。 pe 和 pp 啊, pe 和 pp 我 看了,到最后评权重的时候,他也会把这两个单独拿出来,他就是自定义组合, 然后很多的数据来源,他是找那些免费的,无需注册的,覆盖了沪深的全市场。然后接下来就是他开始在这边工作,我只要去旁边 看我的鱼就行了。最后的成品就是他给我选了二十只股票,因为他在后面的时候,我又给他重新提了诉求,我让他直接选出人工智能和新能源相关的每个行业选了十只股票。 然后我看了一下,今天的他选的所有股票都是涨,都是涨,但也可能他是因为涨了,所以才选的这二十只股票吧。好,具体的我们明天再看。 然后最后的话,我让他明天继续跟踪这选出来的这二十只股票。接下来每天的北京时间下午三点半之后,都要跟踪今天选出来的这些股票的走势,然后让他根据这些走势做优化选股的方法,让他继续自我优化,自我学习啊。自我优化的话,他又重新 加了一个什么 skill, 然后我看到他这边有一个综合评分,我一看一看没看懂他是怎么来的,或者说他的规则是什么,到最后他就把这个评分规则也给我弄掉了。他是 p e 乘以百分之二十,加上 pb 乘以百分之十五,加上动量乘以百分之三十,加上活跃乘以百分之二十,加上市值乘以百分之十五。好的朋友们,小学生已经用 ai 写了一个选股神器代码。不用写,选股交给 ai 验证交给我,明天见。

周一 coldx 选的金瑞矿业,周一跟周五两日涨停,周二周三基本没有涨跌幅,周四早盘高开八个点,午后收盘下跌了两个点,这个跟整个大盘趋势下跌有关。 金瑞矿业入选理由是碳酸钾、硫磺涨价加国家电投入主等相关利好消息。按照实验规则,下周一停止测试这只股票, 该股票测验浮盈十八点五三个百分点。丰龙股份是周四尾盘 codyx 选出来的,周五早盘下跌五个点后,随后强势拉升涨停。 这是一只波动很大的股,从高位七十一路杀跌至五十四幅,均,随后开始微型反弹。 codex 的 策略抓一进二,按照测试规则,这只股会测试到周四午后收盘,我们一起继续期待它的表现吧!周五 codex 策略选出来的这只大连热电,典型的游资操纵路径,急速拉升出货砸盘,低位回补,再次拉升, 策略判断他目前有再次拉升的可能性,看看他周一的表现吧。再次重申一下,本数据是测试数据,不能当做投资参考,只是跟大家分享 ai 的 选股能力,是否真的可以值得相信。兄弟们给我点点关注,点点推荐, 后面我也会分享一些让 ai 写策略的一些小经验小技巧。最近实在是太忙了,每天部署不完的 ai 策略,兄弟们我们周一见!

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

很多人刚学 codex, 第一关就卡在了 tokken。 这个 tokken 不是 虚拟币,也不是投资产品,你可以把它理解成你和 ai 沟通时消耗的文字流量。你发给 codex 的 需求越长,它读取的文件越多,回答的越详细,消耗的 tokken 就 越多。 所以会用 codex 的 人,不是一上来就把所有东西都丢给他,而是先把需求说清楚,你要改什么,目标是什么,不要动什么,最后怎么验收,这样 codex 才能少走弯路,也帮你少浪费额度。我整理了一份 codex 的 新手资料,需要私信我。

今天做一个可实践的 codex 报价分析助手。采购追风舞的不是报价少,是报价格势乱,口径不一致。 这一期,我们让 codex 打一套能跑的报价分析流程。 你只需要准备三类文件,需求表、供应商报价单、评分规则, 把任务猜清楚,让 q、 d、 x 度数报价统一口径计算总成本, 跑完之后制痛生成报价,对比最低总成本和推荐供应商。 所以采购不能只看最溢价,要把交期、质量、付款和风险放进评分。 先捉弄离线版,把一个小场景跑通,再接 e、 r p 和共享版。

前两篇我们讲了两件事,第一, ai 软件和 ai agent 不是 一回事。第二, ai agent 的 商业模式也不太一样,它卖的不是一个工具,而更像一个数字员工。但讲到这里,很多人可能还是一头雾水,这东西到底能帮我干什么? 所以这一篇我不讲太多概念,直接讲我自己怎么用,尤其是 codex 这类桌面端, agent 真正进入工作流之后,它到底是怎么给我打工的? 先说研究,我们是投资机构,研究肯定是第一场景。现在很多人也在用 ai 做研究,比如用 alpha engine、 万德或者各种研报总结工具。这个方向当然是对的,但很多人的用法其实还停留在高级搜索框。比如问他为什么今天股票跌了, 这个公司业绩为什么好?出口数据怎么样?估值贵不贵?这个股票还能不能涨?这些问题都没错,但它本质上还是你在提问,他在回答方向关键词,下一步问题还是你一个人在想。 到了 a 阵的阶段,思路要换一下,你不要把它当工具,要把它当人。如果你下面有一个研究团队,你不会每天只问研究员一句,你觉得变压器怎么样,然后等他回一句话。真实的研究不是这么做的, 真实的研究是围绕一个主题反复讨论,互相质疑,不断挑刺。所以我现在会给 agent 设计技能,比如做宏观研究,我先把自己对未来一个月一个季度的分子端和分母端判断讲给他,然后我不让他马上给结论,而是先让他反过来问我问题,问我为什么这么看。 我回答完之后,再让他去研究数据库和报告库里找两类东西,一类是支持我观点的材料,告诉我是不是太乐观或者太悲观, 这个过程至少要来回三轮。最后不是拼一个看起来很完整的答案,而是形成一个目标,很清楚逻辑,能站住的判断。这就是 agent 和普通 ai 软件的区别。普通 ai 软件帮你解锁, agent 开始参与思考, 它不只是回答是什么,它会帮你一起判断哪里可能对,哪里可能错,以及错在什么地方。再说催化和鱼情,我还会让 agent 定期做鱼情和催化剂检测。每天市场里都有很多新东西, 有些在言报里,有些在公司公告里,有些在社交媒体上,还有一些可能藏在海外新闻或者会议日程里。人当然也能搜,但问题是人搜这件事太耗精力,而且很容易漏。 所以我会让 agent 们每天帮我扫一遍,把可能影响行业和各股的催化汇总出来。更重要的是,它不是指列新闻,而是要判断这个东西有没有交易意义。 比如某个行业大会要开了,那就不只是记录某某大会召开,我会让他回去看去年、前年类似会议前后,相关股票有没有明显波动,催化兑现之前市场有没有抢跑,兑现之后有没有回落。这件事如果靠人一点点查,当然也能做,但很烦。 agent 的 价值就在这里,他不怕烦。 择时这块 agent 更有用。我们做价值,择时,价值是研究,择时是交易纪律。过去择时很大一部分还是靠人。你有自己的体系,有进攻和防守规则,有风控框架,但只要最后执行的是人,就一定会被情绪影响,跌的时候会想越低越买,涨的时候又会拿不住。 明明规则在那里,但人心是肉长的,很容易感情用事。有了 agent 之后,我做的一件事就是把原来的择时体系尽量固化成算法。这套算法要经得起历史数据回测, 它不是拍脑袋说今天买明天卖,而是要能看过去几年、十几年,看看逐月表现怎么样。主生浪能不能吃到大部分肉,主爹浪能不能躲过大部分回撤?如果一套规则经不起回测,那它就只是感觉。 如果他经得起回测,再交给机器监督执行,意义就不一样了。人负责理解产业判断、景气度、判断基本面方向。 agent 负责把责时信号、仓位规则、买卖纪律变成可以付现的流程,这才是我比较喜欢的分工。探机生物负责理解世界数字,员工负责执行纪律。 内容生产也是一个典型场景。我的投资人有时候会担心我做自媒体会不会耗费太多精力,但我现在反而觉得这件事不用太担心, 因为我真正耗精力的地方还是研究本身。而研究过程中产生的底稿、会议纪要、研报、理解、行业判断,本来就已经是一套很丰富的内容库。过去的问题是,如果你想把这些研究底稿变成公众号、文章、短视频、音频播课,可能需要一个 五到十人的小团队,有人整理素材,有人改稿,有人做音频,有人剪视频,有人负责发布和规档。现在有了 agent 这条练路就可以被训练出来。从研究底稿到公众号草稿, 从公众号草稿到口播稿,从口播稿到音频,从音频到数字人视频,最后再检查字幕,检查错别字,更新项目状态。这些事情单看都不难,但串起来很长,很容易乱。 agent 最适合干这种活,因为它不是只帮你完成一个动作,而是帮你维护一条流程。普通 ai 软件给你一个结果, agent 帮你把一个系统越养越好。 可以操作电脑的 agent 真的 能够替代人工吗?我这段时间感受最深的一点是,在 mac 上用 codex 操作浏览器,成功率已经很高了。这意味着什么?意味着只要是你坐在电脑前能做的事情,它理论上都可以慢慢学会。 打开网页,下载文件、整理文档、改代码、生成视频、检查字幕、做表格、做 ppt, 甚至帮你维护一个项目池和文章池。这件事非常关键, 因为可以操作电脑的 agent, 真的 能够替代人工。很多办公室工作,本质上不是一个特别玄妙的创造过程,而是打开软件,读取资料,判断下一步,生成文件,检查结果,再把结果交付出去。过去这些动作必须由人坐在电脑前一步一步做, 现在如果 agent 能稳定操作电脑,他就开始有机会替代这一部分人类工作。 ai 的 数字吞吐量太夸张了,一本书,一堆文档,一大段历史记录,他几秒钟就能扫完。 只要记忆和技能设计的好,他就能不断复盘过去怎么做成功的,怎么做失败的,然后把成功率慢慢提上来。这也是为什么我现在越来越觉得通用人工智能的雏形已经能看到了。 不是说他今天就什么都会,而是你已经能看到一种工作方式,人提出目标, agent 拆任务,查资料,操作电脑,生成文件,检查结果,沉淀经验,然后下一次做得更好。这个方向很清楚, agent 是 需要培养和教育的。但也别听到这里就觉得 agent 是 买回来就能直接替你干活的魔法。不是, agent 是 需要培养和教育的。 他一开始还很笨,会理解错,会漏步骤,会把已经说清楚的规则忘掉。你让他保存文章,他可能保存了正文,但忘了更新状态。 你让他不要入库,他可能没意识到这是一条长期规则。你让他按某个格式输出,他这次对了,下次又飘了。所以你要不断教他,错一次,改一次,流程乱一次,固化一次。发现一个重复问题就写进技能文件,发现一个容易漏的环节,就变成固定检查项。 这个过程很像带团队。一开始你单打独斗,觉得自己很累,后来终于开始带团队了,才发现最累的是带一群新人。你要讲规则,定计划,检查结果,处理问题。更麻烦的是,他们干活太快了,十几件事同时往你这里汇报,你反而更忙。 agent 就是 这种感觉,它速度很快,但质量不稳定,你必须不停反馈,训练它,纠正它,让它一点点理解你的偏好。所以我说, agent 的 价值不是买来的,是养出来的。 你买到的是一个基础能力很强的模型。真正属于你的 agent 是 在一次次项目、一次次返工、一次次流程沉淀里长出来的,一旦跑通,后面就很快 类归类。但一旦某个场景跑通,体验会完全不一样。比如写作项目,他知道要分草稿、文字定稿、音频定稿、视频定稿,发到非书运营小组。 他知道只有我说入库才算入库。他知道文章要有编号,文章一,文章二要能对应。他知道进度表,要把每个阶段列清楚。这些小规则看起来不大,但组合起来,他就开始像一个真正的助理。 再比如做 ppt, 你 直接让一个大模型做 ppt, 他 可能该改的不改,不该改的瞎改,改完也不一定好看。但如果你带一个 agent, 连续做五个、十个 ppt, 把你的偏好、模板、检查标准都沉淀下来,后面你给他一份文字材料,他就更容易做出符合你口味的东西。减肥也一样, 我现在也会用健身教练 agent, 每天吃了什么,运动了什么,他帮我估算热量缺口,提醒我是不是运动过量。这个东西不一定多高级,但他随时在,而且他会记得你的习惯。 这就是 agent 的 用处。他不是只能服务投资经理,也不是只能服务程序员,做电商、做内容,做律师、做医生。只要你的工作里有大量电脑操作,资料整理、流程判断就都能用。哪怕是家庭助理帮你查资料、做计划比较、方案整理、代办,也完全可以变成一个技能。最后说一句, 上面这些就是 agent 每天在帮我做的事情,我相信未来他能帮我做的事情会越来越多。而且随着他一次一次犯错,我一次一次纠正错误,再把这些错误写进长期记忆,继续优化他的技能和流程,他能做的事情也会越来越好,质量也会越来越高。 这件事不止会发生在我身上,未来越来越多的人都会慢慢学会使用 agent, 它会逐渐替代一部分人工工作,替代一部分原来必须由人来完成的电脑工作。这个趋势我觉得是不可逆的。 ai agent 对 于我们来说就是二零零九年的微信,那时候很多人可能还没意识到微信会变成后面十几年最重要的基础设施之一。但回头看,它不仅改变了沟通,也改变了支付、商业内容和组织方式。 agent 也一样。而且我觉得未来它在我们工作中的重要性可能会比微信还要重要,因为微信本质上还是一个工具,但 agent 不 一样,它是我们的数字员工。

上周五 c u d x 尾盘选股策略推荐的大连热电已经连续两个交易日上涨了百分之十二,今天盘中一度摸到涨停板,但是收盘只上涨了百分之六点八五,继续期待他明天的表现吧。 而昨天策略选出的这只塍电国际今天走势相对平稳,今日收盘上涨了百分之五点七三,走在预期之内。 今天 c u d x 给出了这只金木股份,还是要看他明天的表现。在决定要不要纳入测试股票池。申明一下,所有票均为虚拟盘测试,只为测试 ai 选股能力,所有数据均不可以当成投资参考。 兄弟们给我点点关注,点点推荐,让我更有动力给兄弟们分享 ai 选股策略,谢谢兄弟们,明天见!

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

hello, 今天一分钟时候用 codex 帮我们开发电商 skill, 让 ai 自动我们干活来看效果,操作非常简单,只需要在多框输入,让 ai 帮我们开发一个本地可运行的拆帧 skill, 去批量提取视频,然后开始执行。那么整个 skill 的 开发其实非常简单,不管是用 codex 还是其他模型都可以,核心不在于 工具,而是清除进开发 skill 的 目的。我们来看一下执行的结果,这里显示只用了三分三十六秒就开发了一个 视频 skill, 那 现在我们可以直接上传视频来测试一下拆帧的效果。在执行完后,在这里打开输出的文件夹目录, 可以看到基础的视频拆帧功能已经实现了。接着后续我们就可以对这个 skill 继续调优,比如如果需要对视频拆解的更细致一些,又或者对视频拆解有自己的方法论,都可以告诉 ai, 让 skill 根据我们的需求来执行。我们来看一下第二版的执行结果, 可以看到对比第一版拆解的更细致了,但是不同的业务场景拆帧的逻辑完全不同,有的拆帧是为了参考框架后期实拍,有的是为了后续让 ai 生成需求。不同 skill 的 执行流程也不一样,那么我们就需要根据自己的需求来完善这个 skill。 如果我的需求是让 ai 后续生成分镜,那么我就可以让 ai 继续根据拆帧的画面进行拼接生成。总的来说,我们需要从结果反推,我们要实现什么样的效果,中间刷哪些流程 和 skill 只是作为整个工作流的加速器,用来提高我们的内容存储效率。最终通过几轮简单的对话, ai 就 帮我们开发出了一个可以直接落地使用的 skill。 最后我们就可以直接让 codas 把开发好的 skill 打包成压缩文件,同时生成一份详细的使用文档,不管是自己长期使 使用还是分享给团队都非常方便。有需要这一个 skill 的 可以分享,大家也可以根据自己的需求来调哟。操作也很简单,只需要把压缩包解压到对应的 skill 文件目录下,在执行的时候打开项目文件,在段落发送这一段指令,就可以 截掉这一个 skill 来执行。当我们学会开发一个简单的 skill, 后续如果需要其他的功能也可以尝试自己开发,基本的思路就讲好赖上本期内容,觉得有用的话不用点赞关注,咱们下期见,拜拜!

这条视频讲 codex a subagent, 小 白也能听懂的版本。它不是一个新软件,也不是神秘功能,而是 codex 处理复杂任务的一种用法, 你会看到它什么时候该用,什么时候别用,以及怎么用它。 review 一个真实项目,先给 subagent 下一个最朴素的定义。一个复杂任务,你可以让 codex 拆成几块,分别交给几个子代理并行处理。 每个子代理跑在自己的 agent thread 里,最后只把结论交回主线成汇总。官方术语听起来会正式一点。 sub agent workflow 指同时跑多个并行代理在汇总。 sub agent 是 被派出去做某件事的代理, agent, thread 则是每个代理自己的线程,你可以在 cli 里查看和切换。 sub agent 主要解决两件事,第一, context 被污染,读文件跑命令看报错,猜原因,全塞进主线城,后面判断就容易乱。 第二,该病型的事被串行,做安全测试风格可维护性本来可以同时看,却被一个代理从头查到尾。判断要不要开 sub agent。 可以 先问一个问题,任务能不能拆成几块?互不依赖的小事, 能拆就适合试,拆不开就别硬上。任务很小,子任务紧咬在一起,写入范围重叠,或者你自己都还没想清楚怎么拆,这些情况开了反而添乱。不适合的情况也要记住,任务本身很小,没必要开多个代理。 几个子任务互相咬的很紧,并行也不省时间。最危险的是多个代理同时改同一篇文件,这时候省下来的时间很可能被冲突和反攻吃掉。 真正适合练手的场景大多是 rate heavy, 比如大型代码库探索 pr, 多维 review 几个 bug 方向, b 型排查,长文档和长日制分块分析。官方也建议新手起步时先选探索测试、 treeash 和总结这类任务。 codex 默认不会主动开 sub agent, 你 要在 prompt 里讲清楚。常见说法包括 spawn two agents, delegate this work in parallel use one agent per point。 中文直接说启动三个 sub agent, 分 别检查安全测试和可维护性也可以。如果拿来 review pr, 可以 直接用这个模板,一个 sub agent 检查潜在 bug, 一个检查测试覆盖,一个检查代码质量和可维护性, 最后要求主线程等三个都完成后再输出高风险、中风险可选优化,以及建议优先修什么。 这个模板真正值钱的不是文字本身,而是里面的控制点。每个子代理的职责不重叠,避免大家都泛泛 review 一 遍,明确等全部完成再汇总,可以避免主代理拿着半成品就下结论。最后加一句,优先修什么,可以把排序工作也交给主县城。 接下来用 ship ready 这个小项目做例子,它是一个 s s landing page audit 的 mvp, 后端 api 在 s r c app 点 js, 审计规则和 rewrite 在 s r c audit 点 js, 存储是 s r c store 点 js, 前端是 publ i c 斜杠 app 点 js。 代码量不大,正好适合演示怎么稳妥的开 sub agent。 在这个项目里,最稳的开法不是让三个 agent 一 起改代码,而是启动三个 read only sub agent runtime risk agent 看运行风险 q a coverage agent 看测试缺口, architecture agent 看模块边界, 所有子弹里都不要改文件,等全部完成后,主线程再决定要不要修。三个结论里, round time risk agent 最有价值。他发现 handle request 里 in sync 路由没有 await, 外层 try catch 接不住 a sync handler 抛出的错。 这种 bug 在 happy pass 测试里不容易暴露,但线上可能表现成请求挂住或者 unhandle rejection qa coverage agent 的 结论也很实用。 他没有泛泛说测试不够,而是列出 invalid json 未付费 share 过早 follow up。 若 brief 绕过 rewrite 这些副路径, 这些用力不一定都要立刻补,但摆在面前,主县城就能快速挑出最该锁住的状态流。 architecture agent 的 结论最容易让人冲动, 他说 src app 点 js 可以 拆成 page extract checks brief 和 rewrite 几块 判断没错,但这次目标是写测试加修 bug, 不是 重构 auditing, 所以 这部分建议最后先记下来,不立刻动。三个 sub agent 的 优先级其实不一样, round time risks 想让你先修服务端 qa coverage 想让你先补测试, architecture 想让你先理边界。主县城不能给三票打平均分,而是要挑确定性高、改动小、能被测试所注的事情先做,最后真正落地的改动其实很克制, 异步路由统一加 await, 让外层错误处理生效。 rewrite 必须 brief ready 才能解锁, follow up 增加还没提交 brief 和非法字段校验。 read json 加 body size 限制 invalid json 返回四百,最后补 note test 回归测试。 这个案例最有意思的一课是两个代理的结论拼在了一起, round time risk agent 告诉你哪里坏了。 q a coverage agent 告诉你怎么用副路径测试把它锁住, 这就是 sub agent 真正的价值,不是替主线城做决定,而是把几个方向的结论同时端上桌。跑起来之后也要会管理 agent thread codex c l i 里可以用 slash agent 查看和切换线程,如果某个子任务偏离方向,可以让 codex 停掉那个负责性能分析的 sub agent 跑完的线程,也可以让它关闭已经完成的 agent threads。 给新手的练手顺序,不建议一上来就五个 agent 一 起改权。项目先并行阅读,让多个 sub agent 各自理解不同模块,再并行 review, 把 bug 安全测试,可维护性分头看。 第三步是单写,多审一个代理或主线成改代码,其他子代理做 review, 最后才是小范围并行修改。 下一次让 codex review pr, 你 可以直接从这个短 prompt 开始。请使用三个 sub agent 并行检查,当前 pr, 一个看 bug, 一个,看测试一个看可维护性, 等全部完成后,按风险等级汇总给我。就这几句话,已经够你完成第一次 sub agent 练习。 最后记住, sub agent 不是 替主线城做决定,他真正干的活是把几个方向的判断同时端到桌面上,让主线城更快做取舍。新手先从 rate heavy 的 探索和 review 开始,等你能清楚拆分任务,再尝试让多个代理并行改代码。