大模型厂商怎么突然开始不务正业了?据他 thinkinketlog 报道,马斯克旗下全平台桌面代码工具 grok build 测试细节最近意外出现在 grok 网页端。报道称, grok build 主打智能体自主编程工作流,既能通过本地 c r i 执行任务,也能通过网页界面远程操作,直接对标 cloud code 和 openai code 拓拓。这一动向为啥看着有点似曾相识?今年二月, openai 正式推出 codex 桌面应用 sam 奥特曼称它是内部最受喜爱的产品。 四月中旬, ansorepic 彻底重构了 cloud code 的 桌面体验。同一天,谷歌也推出了 gemini 的 micro s 原生客户端。现在四大玩家几乎在同一时间窗口压住同一个方向桌面端。问题来了,既然网页版都能用,为啥非要做桌面客户端?过去模型厂商可以安心卖 api、 卖订阅、卖推理能力, 但 opencloud、 harmas 们的火爆带动了第三方 agent 工具生态的爆发,把一个危险的未来摆在他们面前。用户每天打开的可能不再是叉 g p t cloud、 gemini 或者 grog, 而 是前台的 agent 的 产品。真正掌握用户任务、上下文、工作流、习惯、插件生态和商业关系的,也会变成这些 agent 工具。大模型厂商可不想只当后台发动机,他们开始亲自下厂做自己的工作系统。 i s o p 的 路数最接近 code code 的 桌面端大改版后,过去要在浏览器和编辑器之间来回切换的操作,现在在同一个窗口里就能完成。 i s o p 还把 co work 推向桌面端,让不写代码的人也能用 agent 直接处理文件管理任务。也就是说, i s o p 想服务的已经不只是程序员,而是整个知识工作者群体。 openai 的 codex 也在扩张。四月中旬, codex 推出了 for almost everything 更新,能让 agent 直接操控你的 mac, 还上线了内置浏览器和图像生成功能。 codex 不 想只写代码了,它想变成通用 agent。 jimmy 的 mac 客户端更像是一次迟到的补课。首发功能虽然比较基础,但谷歌的目标很清楚, 先站住桌面入口。 crock build 目前虽然只是测试曝光,但方向最直接。谷奇、 r、 x、 a i 在 coding agent 市场的空白,四家大模型玩家已经摸透了未来竞争的重点不一定是拼谁的模型参数更强, 而是谁能让用户在自己的工具里完成高频工作流,谁更有机会成为 a 阵时代的平台公司。当年微软用 windows 建立了 pc 时代的平台,谷 歌用安卓域建立了移动时代的平台。现在 ai 公司的打法越来越像当年的操作系统战争,只不过这一次战场搬到了你的电脑桌面上,你愿意让 ai 直接住进你的电脑里吗?评论区聊聊。
粉丝24.6万获赞327.2万

商业没有秘密,只有你还没看透的底层逻辑。今天我们要聊聊马斯克再掏六百亿美金收购 koser。 六百亿美金,这是什么概念?整个腾讯市值的三分之一,用来买一家成立还不到四年,只有几百人的小公司。但这不是最震撼的部分。 最震撼的是,就在同一时间, openai 和 entropic 这两家 koser 最大的模型供应商,正在亲手打造跟 koser 直接竞争的产品。 科 sir 每天卖的是别人家的刀,帮自己的敌人磨刀。马斯克为什么在这个节点非抢不可?听我把这盘棋拆开说, 先讲清楚这场仗打的是什么。二零二五年,全球 ai 编程工具市场规模已经达到七十三点七亿美金,到二零三二年,预计将突破三百亿美金,年复合率百分之二十七。这还只是工具本身的钱,更大的钱在后面。未来程序员写的代码里,百分之四十六已经是 ai 生成的。 分析师预测到二零二八年,百分之九十的企业软件工程师将使用 ai 编程助手。这意味着什么? 谁控制了程序员的工具,谁就控制了全球软件的生产方式。这不是一门生意,这是一个基础设施级别的权力。目前这个战场形成了一个三强格局,老大微软的 github copilot, 市场份额百分之四十二,用户超过两千万,进入了百分之九十的世界五百强企业。 微软 ceo 纳德拉亲口说, copilot 创造的商业价值已经超过了当年微软以一十五亿美金收购 getop 的 全部价值。背靠微软生态,从 vs code 无缝嵌入,这就是渠道的力量。黑马 cursor, 四个 mit 毕业生,二零二二年创业,从零到年收入二十亿美金,只花了不到三年,超过一半的世界五百强公司都在用。可思,可思,赢在哪里?它不是插件,它是把整个编辑器重新设计了。 ai 不是 锦上添花, ai 就是 股价, 程序员一旦用过,很难回头。搅局者 on topic cloud code 二零二五年底, cloud code 成为专业工程师群体中使用最多的 ai 编程工具,不靠界面,不靠编辑器, 直接在命令行里接管整个工程,是另一个维度的打法。三家打架,战局激烈。但你注意到没有,这张名单上没有马斯克的 x a i。 马斯克不是没有 ai。 二零二六年二月,他刚把 space x 和 x a i 合并, 对外宣称估值一点二五万亿美金。它有 gurk, 有 memphis 的 colossus 超级算力集群,号称全球最大之一,但它没有入口。在 ai 编程这个赛道,竞争对手 open ai 有 codex and tarpaulike, 有 cloud code, 而 x ai 在 这一领域几乎毫无存在感。这对马斯克来说是生死攸关的问题。为什么?因为它马上要 ipo 了。 spacex 已于二零二六年四月一日秘密向 i c c 提交了上市申请,目标估值一点七五万亿美金,计划募资七百五十亿,将成为历史上规模最大的 ipo。 投资者会问,你的 ai 战略是什么? 你说我有火箭,有卫星,在二零二六年,这不够的。科 sir 拥有二十亿美金的年化营收,以及超过一半世界五百强的企业客户。这正是 x c i 目前缺失的一个经过验证的高速增长的软件业务收购科 sir, 就是在 ipo 前往估值里塞一块最值钱的拼图。这里有个细节很多人没注意,马斯克这次不是直接说我要买, 而是设计了一个两档结构,要么今年以六百亿美金完成收购,要么支付一百亿美金共同开发费用。正常的并购违约金通常是交易金额的百分之二到百分之四,这一次的分手费接近百分之十七。这意味着两件事,第一, koser 谈判团队非常强硬, 他们要的不是被吃掉,而是要最大的主动权。第二,马斯克愿意付这个价格,说明对他来说,失去科室的代价比六百亿更贵。更深的逻辑是,科室的 composer 模型跑在 x y 的 colossus will 级群上, 两者的算力与产品正在深度绑定,一旦分开,双方的损失都是灾难性的。这不是一次收购,这是一场相互锁定的战略婚姻。 但马斯克的算盘还不止于此。马斯克曾公开表示,他的目标是每年从轨道上部署一百几瓦的 ai 算力。 starlink 已经覆盖全球, starship 的 目标是把计算成本打到地面数据中心的百分之七十五以下。 想象一下这个未来太空中的算力,地面上的程序员入口全部由一家公司掌控,这才是马斯克真正想建的东西。一个从基础设施到生产工具,从轨道到桌面的 ai 垂直帝国。 carson 是 这个帝国里最后一块缺失的地基。马斯克的每一次出手看起来像是烧钱,但背后都有一条完整的权力逻辑。收购推特是为了掌控信息入口, 合并 xai 是 为了打通 ai 生产能力,拿下 carson 是 为了控制 ai 时代最大的生产者群体。程序员六百亿买的不是一个产品,买的是一个时代的控制权,你觉得这笔买卖值吗?欢迎评论区说出你的判断。我是科技捕手君,带你换个维度看世界, oh my god。

太炸裂了!一周前,二月五日,两家全球最顶级的公司同一天甩出王炸模型 openai 的 gpt 五点三 codex 发布,还有就是 cloud code 的 开发商,那么他直接发布了他的 cc 四点六模型,而 codex 五点三的版本直接颠覆了所有人的认知。我们来看看它的文档里面是怎么写的。它是这样说的, gpt 五点三 codex 是 我们首个在自身创建过程中发挥了关键作用的模型, codex 的 团队,也就是人类利用其早期版本,也就是它的 gpt 五点二 codex, 它来调试其自身的训练过程,管理自身的部署,并诊断测试结果与评估。 我们团队对 codex 能够进行如此大幅度的加速其自身的开发进程感到非常的震惊。再读一遍, ai 参与了它自身的构建,这不是对未来某一天可能发生的事情的预测,这是 openai 现在就告诉你,我们发布的这个 ai 是 由 ai 自身参与并创建的, 也就是说用智能体本身去改进智能体,他已经非常非常的聪明了。所以这个消息大家不要去糊弄。此刻我最期待的不是春节联欢晚会,而是那个时候我们 deepstack 发布的新一代的大模型,加油!

一定要,一定要,一定要想方设法用上 codex, 如果你还没有听过 codex 或者克拉 code, 那 么恭喜你,这段视频你有可能会改变你的财富。 什么是 codex? 官方定义是一个编程证书,但它不仅仅是编程啊,黄仁勋就是英伟达的老总啊,世界首富,他已经让他的所有的员工都用上了 codex 或者克拉 code。 现在你听到的所有的什么英伟达的事实翻了多少倍啊?然后纳斯达克翻了多少倍啊?股市暴涨都是因为克拉克或者库克拉斯,它是代表着当前最先进的生产力。 codex 应该是对咱们普通人是门槛最低,成本最低,来使用世界上最顶级的大模型和智能体克拉克的对于普通人来说,还搞不定一些注册和网络问题,动不动就封号啊,也比较贵。那 codex 本身是不存在这种问题的,如果你不知道怎么使用,那么你第一步就只要注册下载, 然后搞定网络问题。你直接问他啊,你对我有什么作用?然后你把你的所有的工作,所有的生活告诉他,问他能帮助你。譬如说如果你是个股民,你就告诉他,我是个股民,我平时炒什么股? 我炒 a 股,然后你能帮助我什么?直接问啊,然后他一步一步的引导你。就是说如果你是工作,你每天的工作是什么?比如说你去打开邮箱啊,下载邮件, 处理数据,上传等等,把你的流程详细的描述给他,你直接问他,我这种工作你能帮我做什么?你能帮我优化什么样的流程,提供什么样的效率,做什么的工具就可以了。 如果你是在校学生或是二十来岁,那么克莱斯可能成为你改变人生的一个工具。就如同你在食堂打菜,突然开了一个新的窗口,那你要做的就是马上切过去,直接去排到队伍的最前面。

当身价过万亿的美国企业家代表团在人民大会堂前合照,小 x 是 唯一能趴在爸爸背上的特邀嘉宾。马斯克对小 x 的 宠爱人尽皆知,以至于很多人都以为小 x 是 他最小的,甚至是唯一的孩子。但其实马斯克有十四个孩子,小 x 也不是最小的,只是父亲对他的偏爱格外显眼。马斯克对于 x 这个字母充满热爱,创立的第一家支付公司叫 x 点 com, 顶级航天巨头叫 spacex, 风靡全球的特斯拉车型叫 model x, 人工智能公司叫 x ai。 而最爱的这个孩子出生以后,他毕生热爱的字母也就成为了这个孩子的名字。甚至 x 出生的第二年,马斯克豪掷四百四十亿美元收购推特,将整个平台改名为 x。 两岁这年,闻名世界的蓝色小鸟变成了黑叉,从小就跟着爸爸出 席各种民立场,闯入爸爸的采访镜头,爸爸不会让他出去,而是一把将他揽进怀中。 you're getting you have the general vibe yeah the orange face act it quietly just do whatever you want。 总统就职典礼上,老爸在前面演讲, x 就 在后面跑来跑去蹦蹦跳跳,父亲回忆的永远是宠爱的笑容。白宫这种顶级的正式场合,对他来 说也是可以随意玩耍的地方。美国总统会向所有人介绍,这位就是 x, 抱着他坐上私人飞机,而他只需要蹦蹦跳跳的跟在父亲伯伯身后。比起站在巨人身上看世界,站在老爸肩上看世界更轻松,因为家里的产业是电车龙头特斯拉和商业航天看世界更轻松,因为家里的产业天上飞的地下跑的,都是自家, 不及上万亿的身价,普通人想达到这种财富,每周中三次五百万彩票要中两千年,我要是给他绑了落手五百万可以吗?马福特自己从他小天才手表里划吧。

codex 到底是什么?它到底能干嘛?到底什么样的人才会用到它?不是程序员到底能不能用?不会写代码到底能不能用?本来呢,昨天我想出一个基础教程,结果没发出去,现在呢,我就简单口述一下。 首先我要说一下,不一定非得要用 codex, 我 说 codex 就是 指 codex 这一类工具,其实还有很多种工具,比如说像最近开源界比较火的 open code, 像字节出品的 tree, 还有像 carson 等等等等都可以。我只是拿 codex 举个例子,那 codex 到底是什么呢? codex 一 句话总结就是它是 gpt 的 亲兄弟, gpt 呢,就是用来聊天的,而 codex 呢,就是用来干活的。它能干什么活呢?现在能干的活非常多,如果你现在还花大量的时间去做 ppt, 你 现在就可以把这些任务丢给它。现在 ai 做 ppt 能力已经非常强了,我之前做过一次测评, ai 现在直出的 ppt, 简单修改一下,基本上就能够汇报,它还可以帮你做视频,其实我的很多视频都是 koex 或者是 cloud code 帮我做的。 koex 现在能帮我省掉很多剪辑工作,比如说你的电脑驱动坏了,你不知道怎么修,你现在就可以让 koex 帮你修一下,你还可以让 koex 做一个个性化的简报, 如果你真的有想法,你还可以做一个网站,做一个 app。 我 上面说的都是 koex 能力的冰山一角。那 koex 适合什么样的人群? 会写代码?到底能不能用 codex? 很多人以为啊, codex 这类软件就是一个非常专业的软件,这可能是最大的误解之一,你可以问一下你周边程序员的朋友,看看他们现在还写不写代码。今天刚刚刷到谷歌帝麦的研究员姚顺宇的播客, 他说现在大部分项目都不用写代码了,全部都在用 ai coding。 更主要的是像 codex 这类工具,它的使用难度绝对不会比豆包高,当年我学 cad 画图还学了好几个月,才能勉勉强强上手。 而现在的 ai coding 软件,基本上几天的时间就能够学会,最重要的是它不是一个很枯燥的软件。很多人开始 ai coding 之后,它现在连游戏都不玩了, 每天都在等着额度恢复,因为它很容易让你有一个 builder 的 感觉。 codex 其实它的能力跟它的竞争对手 cloud code 还是有一定距离的。 cloud 它更像是一个谋士,在你不知道干什么的时候,它会帮你出主意,而当你确定了想要干什么的时候,并且做好这些规划的时候, codex 就 会派上用场了。它更像是一个总经理,它会帮你认真的完成这些工作,所以两者要结合起来用。

一定要,一定要,一定要想尽一切办法用上 codex, 至少我不允许我的粉丝还没有用上 codex 或者 cloud code。 如果你跟你周围的朋友从来没有谈论过 codex、 cloud code 或者 java, 那 恭喜你,你刷到这条视频可能就是你改变命运的机会。 那有人问 codex 到底是什么东西呢?官方给他的定义就是 gbd 下面的一个编程助手。但是如果你真的这么理解,那你太小看他了。 华人勋现在让因为他所有的员工都要使用 codex, 这可是全球市值最高公司,老板都要让他员工使用它,那为什么呢?因为他就是未来财富的密码。你最近看了这么多新闻,什么纳斯达克又来创新高了,恒大股市又涨疯了,存 储芯片又缺货了,这么多乱七八糟的新闻,其实都在讲述同样一个故事,而这个故事的源头呢,就是因为这几个东西。 卡罗拉的扣的对于大部分人来说门槛还是有点高的。 g m 来体验呢,我感觉还不是特别友好。而如果你两个月前问我扣贷,我可能还会犹豫,但是这两个月以来,它几乎每天都在更新, 甚至有段时间天天都在更新,到现在扣贷能力真的是很爆了,它就是目前最适合普通人上手的 ai 工具了。如果你现在是大学生或者二十多岁,那你太幸运了, 你刚刚进入社会,就迎来了一个弯道超车的机会,它就像是你在食堂打饭排队的时候,突然在旁边开了一个新的窗口,这个时候你最应该做的就是赶快跑到新窗口去打饭。

codex 是 openai 推出的 ai 编程伙伴,可以帮助我们开发功能、修复 bug、 重构代码、做代码审核等。 openai 官方也提到, codex 可以 处理从功能开发到代码 review, 发布相关的工程任务。 但对孩子说,我们不用一上来就讲那么复杂,我们可以把它想象成一个把想法变成作品的 ai 助手。比如说我想做一个数学错题的讲解器,我不会直接说 帮我写代码,这样太空了,我会说,请帮我做一个适合三年级小学生使用的数学错题讲解网页功能包括,学生可以输入一道数学错题 e i 页面,提示学生先分析题目条件, 在引导学生写出题解之后,再举一反三。应用风格要可爱清楚,适合孩子,这就叫任务拆解。这我也给大家进行干货总结。给 codex 写提示词有一个万能的公式,角色加目标加用户,加功能,加风格加输出形 式。比如说角色是,你是一个 ai 编程助手,目标是帮我做一个教学错题分布讲解, 生成类似体,风格是卡通,也要简洁,适合孩子。初初就是做成网页。在 ai 时代,孩子真正要学的不是复制答案,而是把自己的想法讲清楚,因为你讲的越清楚, ai 做出来的作品就越接近你想要的样子。

什么是 codex? codex 到底有什么作用?然后它跟普通的大模型的区别到底在哪里? 普通大模型呢?是你问他答,然后 codex 呢?是你说任务直接动手改你电脑里的文件,具体呢,大家可以参考这张图片。 我通常呢是在 vs code 里面去使用 codex, 因为 vs code 的是一个常用的 id, 也就是说我们一般程序员他要写代码管理文件运行项目的一个集成的开发环境,你可以把它理解成它不是一个单纯的聊天窗口,而是一个可以打开你本地项目文件夹的工作台。 我的一个设置也供大家参考。分享两个比较实用的一个案例。场景一呢是批量处理文件,自动填写表格,比如说现在你有个本地的这个发票图片 啊,你如果用普通大模型呢,你需要去一张张上传,然后处理完呢?你还要一个个下载回来,在这个 codex 里面呢,你可以在对话框里复制这个文件夹的地址,然后告诉他,你说根据这些发票按金额重新帮我去命名这个文件,过一会呢,他就批量帮你全部改好了,然后呢还保存在你这个本地文件夹里。 然后如果说你要根据发票的信息去填写完一些表格,比如说入库单啊,或者是其他的一些表格,你可以再继续告诉他,帮你根据这个发票的信息呃去填写相关的表格,然后呢直接写在本地, 然后再过一会他就把所有的表格全部为你更新好,比如说这个字段错了,你可以或者说文件名的格式错了,你可以直接告诉他,他会再一次帮你去生成相应的文件,然后你不用去下载,他会直接保存或者是 replace 掉你文件夹中错误的一些文件,所以我觉得这个是非常的方便。 然后第二个场景呢,我们知道就是非技术背景的小伙伴,比如说过去你要去做一个网站,你要去跟工程师去进行一个交流 啊,然后呢你要写需求画图,然后形成 p r d 啊等等。但现在呢,就我觉得你可以直接再一次复制这个装着资料的文件夹地址,然后呢告诉这个 codex, 根据这些资料,我需要去做一个网站 demo, 请你为我生成一份 p r d, 然后呢它会直接去帮你整理材料,写出 html 格式的一个 demo, 然后呢生成相关的 p r d, 然后呢你对照着这个 html 呢,根据你的反馈呢,它可以接着修改, 这样呢比如说页面层级有不清楚的,你可以让他进行重构,然后呢他可以直接帮你生成修改或优化完的一个文件,这样你去交给工程师呢,就相对来说会非常的清晰。 ok, 当然今天只是抛砖引玉,如果这个话题小伙伴们感兴趣,也可以在评论区告诉我,希望今天的分享对大家有一点点启发,我们下期再见,拜拜!

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

马斯克入局 ai 编程 grock build 正面硬钢 clock 二零二六年五月初,马斯克旗下 x ai 完成战略整合,更名为 space x ai, 正式进军 ai 编程工具赛道。 一款名为 grock build 的 桌面级编程应用意外曝光,主打全平台兼容和 agent 智能体自主编程,直接对标 andropic 的 cloud code 和 open ai 的 codex 桌面版。 与此同时, dixit、 二 e 这类终端编程工具也在快速崛起,它们能直接读取项目文件、执行命令、调试代码,真正融入开发者的工作流。 目前,主流 ai 编程工具的月费在十到二十美元,重度用户甚至超过一百美元。马斯克的入局很可能会打破这个价格体系。 ai 编程工具的竞争已经从问答式辅助升级为终端内工程执行的全面战争。

今天是二零二六年五月十五号,然后最近这个 ai 圈又发生了一些比较大的事情,比如说这个 open ai 的 codex 要登录手机了, 还有就是这个,呃,多个领域都有一些新的动态,那我们今天就来聊一聊这些变化。对,今天咱们就来一起聊一聊 ai 编程怎么就迎来新变化了?人才和交互方式又有哪些新鲜事? 还有 ai 视频和各种应用融合带来的好处。我们先来聊第一个部分,就是 openai codex 登录手机,这其实是一个蛮让人期待的事情啊,那这个 codex 到底是一个什么东西呢?它和我们之前用的一些 ai 编程的工具到底有什么本质的区别? 其实简单讲的话, codex 它就是一个能够理解自然语言和代码的一个 ai 模型,然后它是 open ai 做的,它厉害的地方就在于你可以直接跟它说你要它干什么,它就可以帮你自动生成,或者是说帮你修改代码, 它就像是一个非常智能的编程的副驾,听起来已经不是一个辅助的工具了,感觉更像是一个真正可以参与到开发流程里的一个伙伴。对,没错没错,那这个 codex 呢?它其实今年的这个大的升级就是它变成了一个全站的 ai 助手,就它不光可以写代码,它还可以帮你做重构, 它还可以帮你追踪这个任务,它还可以帮你去跟啊这个本地的环境和远程的环境都可以无缝的协助,所以它是真正的让这个 ai 从一个 辅助的角色变成了一个主力的队员。那这个 codex 登录了手机之后,大家最关心的就是它的使用场景到底有哪些?就是你现在可以通过手机去远程的操控这个 ai 帮你干活,你比如说你可以在手机上面直接让它去修复一个 b u g, 或者说让它去跑一个测试,然后你可以随时看到这个进度。 你也可以在比如说这个 ai 遇到了一个高风险的操作,他会主动的停下来等你,你可以通过手机去批准或者拒绝这个操作啊,所以说手机端就变成了一个实时的监控和决策的一个控制台。对,而且他还支持语音的指令,然后多设备的无缝的协助 你,不管是全站开发,还是说你是一个团队的负责人,你甚至是一个非技术的人员,你都可以通过这个手机端去随时随地的掌控这个项目的进展 和这个管理,这个 ai 的 任务就非常的高效。我觉得手机端要跑这个 codex 的 话,最大的技术难题是什么?其实这个手机端的 codex 它是一个非常轻量级的一个设计,就它的大部分的运算还是在你的桌面或者是云端的,所以它这个就只需要你这个设备之间能够 安全的通讯就可以了。那这个就是他们做了一个自研的一个安全的转发层,就是所有的你的这个敏感信息都是加密的,然后也不会落地到你的手机上。哦,原来是把这个安全做到了极致,对,而且他这个手机端和桌面端是可以 非常低延迟的去同步这个上下文的,所以你在手机端用的时候也几乎跟在桌面端用的是一样的快,然后它还支持断线重连大模型的这个长上下文的压缩,以及它可以自动的帮你恢复这个任务, 所以就是整个的体验就非常的流畅和省心。然后咱们来进入第二个大的板块啊,咱们来聊一聊 ai 领域最近在人才和组织上面的一些比较大的变动。嗯啊,这个想先问一个比较热的问题啊,就是 spacex 和 xci 合并之后,为什么会出现这么大规模的人才流失? 最核心的原因其实就是因为合并之后这个团队的目标就从原来的想要去突破通用 ai 的 这个方向,变成了一个要完全服务于航天项目的这样一个方向。那 这个就跟很多科学家和工程师他们本来的理想是背道而驰的。哦,原来是理想和方向产生的分歧。对,然后再加上马斯克的这种极端的高强度的管理,每周要工作八十到一百二十小时, 不断的有这种绩效的排名,不断的有这种重组和清洗,让大家本来就很紧绷的神经彻底的崩溃。再加上一些关键的人,他本身健康也出了问题, 再加上一些人,他看到这个公司上市无望,他就套现走人了,等等等等吧,就是这些原因交织在一起,才造成了这么大规模的人才出走。那你说这么多核心成员都离开了,那对于这个 spacex ai 来讲,他具体会面临哪些比较棘手的问题?呃,最直接的就是 grog 这个模型,它的开发进度严重的受损,对,就是它的那些核心的团队都已经散了,然后它在这个大模型的这个技术上面跟 openai 和 mate 它们的差距也越来越大,看来短期想要翻身是很难了。对,没错,而且就是大量的人才都流向了 matte, 流向了 afropic, 流向了这个新成立的一些 ai 公司,然后 spacex ai 自己本身连基本的预训练都已经难以维持,再加上它的这个管理混乱和士气低落,也让它很难再去吸引新的人才,所以 他想要在短期内恢复元气几乎是不可能的事情。哎,那最近中国在这个 ai 的 人机交互上面有哪些让人眼前一亮的新的进展?那国内其实现在已经有很多的这个团队在做这个多模态的融合的交互,就比如说让你可以用语音加上手势,加上眼神 一起和这个 ai 进行交流,然后甚至可以在非常嘈杂的环境当中也能够精准的识别你的指令,感觉比传统的这种操作方式要自然很多。对,而且就是现在已经有这种像深度 seeker 这种大模型,它已经可以做到在 智能家居啊,自动驾驶啊这种场景下面去做这种自适应的交互,然后再加上国家的这个基金的加持,以及产业界的合作, 中国在这个多模态和这个行业的融合上面的探索已经走在世界前列了。我们现在要聊的是这个 ai 视频和这个应用的融合嘛? 那这个领域最近最火的事情莫过于这个 runway 和这个 google 它们的这个激烈的竞争,那这两家公司到底他们的技术路线和他们的这个产品布局有什么不一样呢? 呃, runway 它其实一直以来都是专注在视频生成这个领域的。对,它是从 gen two 开始就支持这个文本到视频的一个直接的生成,然后现在已经到了 gen four five 了,它的这个分数是在这个权威的榜单上面是非常领先的, 它的这个核心的能力就是能够去处理非常复杂的这个运动的逻辑和物理的细节。对,它也在这个图片到视频这个以及这个运动的控制这方面有一些独有的功能。而且它是最早把这个 ai 视频做成一个 大家都能够用的一个 s 平台的,所以说它就是一直聚焦在这个视频的这个技术本身。对,那相对而言呢, google 它的这个布局就更加的多样化, 它除了这个本身的这个 ai 视频的生成,比如像它的这个 lucia 这个模型,它其实是可以通过一个统一的架构去做时空的建模,然后同时它也可以支持这个非常灵活的视频的编辑。 那同时呢,它又把这个 ai 视频的能力和它的这个云,和它的这个企业级的服务去做了一个深度的捆绑, 这样的话就可以让它的这个产品能够去覆盖更多的场景和更多的行业。那现在这个市面上各种这个 ai 视频的生成的方案这么多,那对于不同的用户群体, 大家到底该怎么去选择适合自己的平台呢?如果你是一个个人的内容创作者,或者说你是一个小团队,那你可能最适合的就是去使用这种云端的 a p i, 比如说像 runway, 或者是说像 google 的 这个 vivo 这种,你不需要去关心任何的技术细节,你只要去注册一个账号,然后就可以去在线生成你想要的这种视频,那你可能按秒去付费,或者说你去订阅它就可以了啊,非常的灵活,也没有什么前期的投入。那如果说我是一个企业,我有更高的要求呢? 那如果你是一个企业,有特殊的需求,或者说你有大量的这种视频要生成,那可能本地化的部署,或者说私有化的部署会更适合你。那这个时候你可能就需要去跟金管道啊,或者是说跟苏尔兔这种 公司去合作,那你可以去定制你的方案。那当然如果你是一个技术非常强的团队,你也可以去使用一些 开源的项目,比如说像 s v d, 或者是说像 kog、 video x 这种,你去做一些深度的定制。哎,那这个东西,最近这个 ai 视频生成这个领域特别火嘛?那这个东西到底会在未来产生哪些让人想不到的新的应用场景? 现在已经有很多的迹象表明,就是这种 ai 视频的模型,其实它可以被看成是一个虚拟的世界的模拟器,就它不光是能够生成一些视频画面,它其实是能够去理解这个世界的一些基本的规律,所以它其实是可以用来做一些 电影的自动创作,或者说做一些游戏的剧情的实时生成,甚至可以用来帮助机器人去学习一些新的技能,所以它远不止是一个用来娱乐的工具。对,没错没错。 然后包括现在还有一些,比如说是个性化的视频教学,或者说这种智能的视频客服就已经开始有一些这样的应用出来了, 包括国内的这些厂商,其实在一些评测里面的表现也已经非常亮眼了,就是大家的竞争也会越来越激烈。未来这个无论是海外还是国内的这个生态的发展,我觉得都是非常值得期待的。哎呀,今天聊的真的是太爽了,感觉好像每一个话题背后都藏着下一个 ai 的 风口。 对,真的是这个行业变化太快了。对,所以大家一定要保持关注。对,说不定明天又有什么让人惊掉下巴的新的突破。好了,那么这期节目咱们就到这里啊,然后感谢大家的收听,咱们下期再见。

codex 就是 我们普通人现在能接触到的门槛最低,世界最顶级的大模型了。没有质疑,可能你会说 cloud 不 强吗?强,但是对普通人来说真的很难用上,动不动就封号啊,这个那个的。但 jimmy 呢?又差点意思。 codex 完全没有这些问题,它的稳定性要强于 cloud, 它的 g u i 又强于 jimmy。 那 codex 是 什么?官方的解释就是一个编程的工具。但是我跟你说,如果你就只把它当成一个写代码的东西,那你就太小看它了。 如果你是做自媒体的,让他把你搭建个内容库,把你过去写过的爆款的文案呢?按照类型,结构,情绪全都拆解规档。如果你是做生意的,让他帮你写个销售页面,分析你的用户是谁, 把内部乱成一锅粥的这些流程梳理清楚,以前都要花钱请人来干的,但现在你一个人就能搞定。 黄仁勋就是英伟达的老板,他让所有员工都用上了 codex, 为什么?因为他看到了一件我们大多数人都没看到的事情,就是 codex 它不只是一个工具,它是下一代工作方式。我认为每个时代都有每个时代的信息差和红利, codex 就是 现在这个时代的信息差,它能实现让 ai 真正成为你的杠杆,放大你的生产力,真的。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

一定要想尽一切办法去用一下这个世界上最强的 ai, codex, 现在的 ai 之王,因为只要你用过 codex, 你 就会立刻意识到 ai 已经是可以彻底颠覆整个人类所有社会结构的一个超级生产力工具。 为什么你之前用的其他 ai 你 感觉很一般?因为其他的 ai, 每个 ai 只能做一点点的事,比如说用豆包,你能回答问题,或者写点文案,做点方案。你比如说你要做视频,你可能要去找极梦。再比如说做音乐,你可能要去找 solno, 你 做数字人,还得去找剪映。 过去很多人会觉得 ai 世界就是很麻烦,要学很多很多的 ai, 而且 ai 没有办法自己去操作抖音,没有办法自己去操作视频号,没有办法自己去操作各种各样的销售操作系统,没有办法操作各种各样的财务软件。所以你会觉得 ai 并没有真正的变成生产力工具,它只是让你的生活变得方便了一点点。但如果你用过 codex, 你 就 会发现, codex 作为 ai 之王,它可以同时控制天下所有的 ai, 也就说你不需要去学习任何新的 ai, 实际上最好的做图 ai, 最好的做视频 ai, 你 不需要学习,不需要了解,你跟 codex 说你去控制它,帮我生成视频, codex 会自己下载,自己控制,你不需要学习, codex 做的比你还要好,而 而且 codex 可以 直接操作你的浏览器,可以直接操作你的电脑,比如你现在想养一只小龙虾,你不会养龙虾是吧?你直接跟 codex 说,帮我下载一个龙虾,并且帮我养好它,帮我管好它,你就会发现 codex 把小龙虾下载好了,并且熏的跟狗一样乖。而且 codex 可以 直接操作你们公司的财务软件,销售软件,所有的各种各样的软件系统, 或者可以帮你操作天猫后台,淘宝后台,各种各样的抖音短视频后台。也就说过去你需要用运营或者自己亲自去操作的所有的动作,全部都可以用 codex 无缝衔接。所以你知道我们公司现在的工作模式是什么吗?打开 codex, 然后拿嘴巴对它许愿。就比如我们公司,我们的 codex 可以 直接读取我们销售的 c r m 系统,看到现在有多少个客户正在跟进中,并且读取到每个客户的具体信息, 并且同时他能够控制我们的飞书和企业微信,读到我们的销售聊天记录,看到那些未成交的客户跟我们的销售到底沟通软件,然后定向的为我们的客户生成演示视频。就 比如说你是一个做美业的老板,然后你在跟我们的销售在聊天的过程中,我们的 codex 可以 直接读取到你和我们的销售的聊天记录,并且根据你的疑虑,根据你的疑惑,为你定向生成一个网站,或者生成一个智能体,甚至为你生成一个你们公司以后有了 ai 之后应该怎么去工作的一个完整的视频, 直接自动的发给你,然后我们的销售什么都不需要做,双手离开地面,离开键盘,离开鼠标,等着口袋 x, 把整个的方案生成完,把整个智能体做出来,甚至把整个说明视频做好,然后他只需要发给客户,然后约一个电话说,王总,你看一下这个系统牛不牛逼,是不是你想要的?如果是的话,咱们什么时候签个合同? 所以如果你是个老板,必须下载口袋 x, 并且让你所有员工全部下载口袋 x。 我 写了一本书,专门教企业如何运用口袋 x, 运用到销售、流量、管理等各个环节。需要领取的话,评论区留言 ai 之王陈厂长。

先给大家把概念讲透,一定要牢牢记住 codex, 要是你到现在还没有听说过 codex, 我 就必须跟你说,这条视频大概率能够改选你的财富轨迹。有很多人会问,到底什么是 codex? 官方给的定位是编程的智能助手,但它的价值远远不止写代码这么简单,因为他的创始人黄仁勋这里两天来到了北京。大家都知道,他作为全球的顶尖富豪,早就要求公司的所有员工必须标配使用 codex。 你最近看到的英伟达市值暴涨,纳斯达克指数一路走高,资本市场全面的拉升,其背后推手就是 codex 这类顶尖的智能大模型,它代表着当下全球最顶尖的全新生产力。 codex 更是咱们普通人门槛最低,零高成本, 而且能直接用上的顶尖大模型智能体的绝佳工具。反观其他同类平台,普通人 上手很难,注册流程繁琐,网络限制多,还容易莫名其妙的封号,使用成本还高。但 codex 完全没有这些痛点,省心又好用,很多人不会用,其实特别简单,第一步,注册下载,配置好基础网络。 直接开口问他,你能为我带来什么样的价值,把你的日常工作生活现状全部告诉他,让他为你赋能。你是炒股的股民,直接跟他说,我专注 a 股投资,告诉我你能帮我做什么分析,给我什么样的策略参考, 他会一步步带着你去玩转。你是职场的上班族,你每日工作流程如实说,收发邮件、整理数据、下载上传流程复盘,全部描述清楚,直接问他能不能帮我简化工作, 优化流程,提升效率,定制使用工具,他全部都能帮你搞定。如果你还是在校的大学生,或者二十出头想要逆袭翻盘的年轻人,那 codex 绝对是你逆天改变的绝佳机遇。 就像食堂突然新开了一个专属风口窗口,聪明人要做的就是立刻抢占先机,直接站在风口最前排。

一定要想方设法的用上 codex, 如果你还没有听说过 codex 或者 codex, 那 恭喜你,今天我这段视频可能会改变你的财富。那什么是 codex 呢?官方定义它就是一个编程助手,但它不仅仅是一个编程。 黄荣新你们知道吧?就是英伟达那个老总,全世界的首富,已经让他所有的员工都开始用上 codex 和 codex 了。你现在听到的什么?英伟达翻了多少倍?纳斯克暴涨, ai 爆发,其实本质上都是因为这些东西代表了当前最先进的生产力。而我今天为什么一定要聊这个东西呢?因为我越来越发现, 普通人真正拉开差距的已经不是什么,努力的是工具,是生产力,尤其是像我们这种普通人。以前你想要创个业对吧?你要去学技术,学运营,学剪辑,写代码,才能把一件事情真正的做起来。但现在很多事情已经变了。 库尔德斯是现在目前对于普通人来说门槛最低的,成本最低的,他去使用的是世界上最顶级的大模型和智能体。那可乐的可乐呢?对于普通人来说还不一定能搞得定他的注册和网络问题,而且他动不动就封号,并且他非常贵, 所以扩展对于普通人来说就会简单很多。如果说你不知道怎么去使用它,那第一步非常简单,就去注册,下载,搞定网络,然后直接的就问他一句话,你对我有什么作用?接下来把你所有的工作,所有的生活都告诉他,然后问他,你到底能帮助我做什么? 比如说你是一个股民,你就告诉他我是一个股民,我平时炒 a 股,你现在能帮助我什么?然后他就会直接一步一步的去引导你。再比如你现在在工作,你是一个普普通通的上班族,你每天都要打开邮箱,下载邮件,处理数据,包括上传文件, 你就把你整个完整的工作流程告诉他,这种工作你能帮我做什么?你能帮我优化什么样的工作流程,你能帮我提高什么样的工作效率,你能帮助我做出什么样的工具,就这么简单。其实很多人最大的问题不是 ai 有 多难,而是压根就没有真正的开始使用 ai, 包括我现在看到很多的普通人还停留在 ai 会不会取缔我这个阶段,但真正聪明的人已经开始用 ai 放大自己了。如果说你现在是学校的学生或者二十来岁,那 codex 这个东西真的可能会成为你改变你人生的一个工具。就像你现在在食堂打饭一样,突然新开了一个窗口, 那你现在要做的不是在原地的犹豫,而是马上的切过去,排在队伍的最前面。因为很多时候给普通人最大的机会就是新一沙刚开始出现的时候,我是在做艺人公司 ai 创业的老周,有任何的问题都可以跟我聊聊。

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

真正意义上的技术贫权时代终于来了。我没有危言耸听,我也没有夸大事实,这个是我在一对一服务十多个中小企业老板得出来的经验。这些小老板们有做电商的,有做金融投行的,有做 hr 的, 有做实体家居的,还有来自于资质付费的。 这些老板们有想法,有思考,有目标,我只需要稍微的点拨一下,我只用稍微带着他们发散一些思维,就非常的 surprise。 所以 你能想象一个一行代码都不懂的电商小老板们 安装完 cadence 智能体,然后使用 gpt 五点五模型之后,他能够调用亚马逊公开的 mcp 的 接口来去调取他想要获取的内部的数据。 你能想象一行代码都不懂的小老板,借助这个 call 大 师智能体,在非书里面搭建 home 士多智能体,然后调用 gpt 五点五的这个模型,让他自己手下的员工,让他自己手下的操盘手能够生图,能够写文案,能够做爆款, 这是我这几天实实在在接触到的实际的案例。我觉得这真是一个好时代,也是一个坏时代。好时代不懂代码的人也能够借助这种超级通用的智能体能够完成他的目标,他的任务。坏时代可能就是真正意义上的赚钱难度确实加大了。