最近大火的 call 电视,好多小伙伴都应该刷到了吧,但是呢,不少人还是摸不透它到底是啥,能帮我们做些啥。今天呢,我就想拿我们熟悉的 cds 和豆包来对比的讲, 让大家彻底的搞懂这款 ai 工具啊。先说说 call 电视啊,它不是一个只干一件事的小工具,而是一个全能的一个桌面 ai 助手,能装各种各样的插件,做 ppt、 修图、写文案、做视频, 甚至直接操控电脑里的各类软件都没问题。不同的工具之间呢,还能配合的一起用,能力呢特别的全面。那他和 c d s 有 没有不一样呢? c d s 大家都应该比较了解,他主打就是做视频,一门心思就是专攻视频生成,功能比较单一。换个通俗说法说, call d s 完全可以调用 c d s 来帮忙做视频,相当于把视频能力 纳入到自己的功能体系里面去。再说一下我们国内常用的豆包,他和 callens 也有明显区别,豆包呢,我们用着非常的顺手,中文体验感特别强。他做视频的能力啊,其实也是一拖一 cds 来实现的,日常的办公工作内容都够用,但它的扩展性啊,是远不如 callens 的, 基本上 就只能用自己自家的功能和工具,没法像 callens 一 样随意的外界各类的极三方软件插件,还有控制电脑。 简单总结一下啊, cds 就 专注做视频的一个专项工具,豆包呢就适合我们国内日常使用的一个综合助手。而 call dance 是 真正做到了全场景可自由拓展的一个全能智能体,大家可以根据自己的需求来挑选了啊。
粉丝3870获赞2.6万

最近我一直跟大家在分享 codex 或者 coco 的 时候,评论区最常见的问题就是,它跟豆包到底有什么区别啊?是不是豆包也能携带吗? codex 也能聊天?那不都是一样的吗?甚至有人会问,我已经有豆包, kimi、 deep sick 呢?还要不要再学这些看起来更复杂的工具? 哎,我觉得这个问题特别典型啊,就是因为大家其实把这两类东西混在一起比呢,你拿豆包跟 codex 去比,有点像问一个能够帮你马上去做出 ppt, 写报告来做图片的,一个万能的一个 app, 和一个能够帮你用你的电脑去读理项目,改理文件,跑检查的一个 ai 的 实习生,到底谁会更厉害?我觉得他们不是一个赛道啊! ok, 大家好,我是 fred, 这期我们就用最简单的方式去讲清楚,想豆包啊, codex code 到底它的差异在哪里?而 kimi 和 deepseek 又应该放在什么样的位置? 很多人我们觉得一比较 ai 工具,就会问它到底能不能写文案啊?比如说它到底能不能做 ppt? 哎,能不能抠图,能不能写代码? 这个问题也不是错的啊,但很容易把所有的工具都混在一起,因为现在大部分的 ai 工具都有会把这种功能做得越来越全,对吧?真正的区别不是说功能的这种清单 啊,一张,呃,而是他的工作的位置。如果你想要一份的内容,一张图,一个 ppt 啊,那你就是在这种平台里面去要结果。如果你想要处理自己电脑里面的项目、文件、脚本、网页测试和工作流,那就不是普通的这种聊天的 chatbox 啊,或者是这种网页端的 agent 能够完全覆盖的场景呢? 我把诶,第一类就是类似豆包啊, kimi 啊,包括 deepseek 放在一类啊,我叫它就万能的这种入口的这种 app, 它最大的优势就是低门槛, 哎,打开这种网页啊或者 app 就 能用,比如说豆包适合快速去做搜索啊,图片的视频啊, ppt 啊,日常内容啊。而 kimi 适合一些长文档资料这种密集型的一些研究,还有一些 a 帧的工具 啊,一些 a 阶的任务。而 deepstack 更适合去做一些深度的推理啊,文本的沟通,当然也可以作为 api 或者底层模型来去做一些口令。那这类产品最适合普通人上手,是因为它已经把复杂的能力封装成了按钮界面和模板 啊。然后第二类的话就是 codex, 那 和 callcode, 我 更愿意把它叫做一个 ai 的 十一生,就它厉害的地方不是说多一个聊天框或者怎么样,而是它可以这进入你真实的一个环境, 比如说它能够读你本地的项目文件,理解你已经写过的规则,帮你改脚本,改网页啊,改文档,然后再跑一次检查,确认这次改动没有问题。在网上 它还能把你重复做的流程沉淀成 skills, 变成你自己长期的工作流。所以说它的门槛会高一点,你要理解文件权限啊,以及验证,但它的上限也明显高非常非常多啊。 呃,我现在比如说打开两个文件给大家去演示,比如说这是 codex, 我 某可能一百个 csv 啊。然后我可以在这个文件夹里面,大家可以看到我的文件夹里面,比如说,哎,看不到啊,不好意思啊,我这文件夹里面就有一百个 csv, 我 让他去帮我做,把这一百个 csv 做成一个深度数据洞察,生成一个 html 分 析给我,那你们就可以看到 他就已经啊单独把整一个内容啊,一百个文件去做了深度的分析啊,包括时间节奏 啊,月份啊,热力图,白区域的表现,渠道的结构,销量排名啊,增长风险机会点等等等等。你可以理解他把一一百个 c s v 啊,都做了深度的数据的洞察和处理,然后生成了一个看板给你啊, 即使它是一千个和一万个,它也能够完完全全去处理,这就是 codex 或者 coco 这种类似,你可以把它当成实习生也好,或者怎么样也好,它能够处理的一个工作。而对于比如说豆包而言啊,我觉得有个最明显的差异,就比如说我举例子,我这里传文件哈,对吧? 啊?然后我这里比如选但凡超过五十个啊,你就可以看到,比如说豆包这里面只能理解五十个文件,所以它会本身会有一些呃文件的限限制。 然后同时我这里面有创的上传了五十个 csv 啊,统一让它生成 html 给我。那这个时候呢,它其实豆包给的一些结果我觉得也还是蛮不错的啊,比如它能够生成一些 csv 的 这种啊, 一一些分析的报告啊,一些指标什么的,但是它确实这一次没有成功的给我输出一个 html 报告,理论上它是可以输出的啊。同时呢,我们也可以再去看一下,比如说像豆包还有什么样别的功能,比如它可以生成 ppt 啊, 图像生成,当然它也一些哦,有一些扣点的东西,它底层是火山引擎的编代码啊,模型,然后一些解析啊,写作啊,但后面还有生成音乐翻译,视频生成,深度研究, ai 播客记录,会议啊, ai 表格等等等等等等。 所以说你可以明显看到像豆包这种 app, 它把很多我们普通人常用的一些 呃内容啊,都封装到它的网页里面。而 kimi 啊和 deepsea 都是类似的,所以说我们一张图来讲清楚这两者的区别。第一个就是看它的使用门槛 啊,豆包、 deep, deepsea, kimi 明显很更低,打开就能用,而 codas、 cloud code 还需要去配置权限,配置网络,那就门使用门槛会高一些。 第二个是工作环境,而豆包 kimi d p c 更多是在平台自己的网页或者 a p p 里面去使用,而 codex cloud code 更多是在你的项目终端和电脑里面。而呃,前者的这个典型的产物,就比如说大家常用的刚刚给大家演示的 ppt 啊,回答啊,图片啊,视频啊,报告等等。 后者呢,更多是去改一些脚本啊,改一些文件输出网页以及整个的工作流。当然前者他也都能生成,所以说他的上限会更高一些啊,前者的优势就是快啊,适合普通人,后者就是上线能更高,真正的去接触接触我们真实的一个工作流。 然后它的风险呢,可能在于说它的产品边界,比如说刚刚只能传五十个文件,对吧?而 codex 或者 cloud code 呢,它的风险我觉得可能现在主要还是在于说网络的一个问题。 ok, 所以 说听完今天 fred 整个的一个分享,我相信大家对于 cloud code 或 codex 与豆包 kimi 或者 deepsix 这样的一些网页或工具 的区别有一些明显的认知。当然我也不代表说呃像豆包 kimi 和 d p c, 它做不到 codex 或 call code 这个底层模型,它能实现的功能 包括说像豆包的呃模型,包括 kimi 的 呃模型,包括 d p c v 四 pro, 现在也都能够做很多 coding 的 呃工作啊,所以说会越来越接近,但是明显现在还是会有区别,以及它们的用途和使用场景也会有区别。 ok, 我是 fred, 呃,我们下期会持续吧。呃呃,适合大家的一些工作流啊。用 ai 来看怎么去介入,我们下期再见。

codex 到底是什么?它到底能干嘛?到底什么样的人才会用到它?不是程序员到底能不能用?不会写代码到底能不能用?本来呢,昨天我想出一个基础教程,结果没发出去,现在呢,我就简单口述一下。 首先我要说一下,不一定非得要用 codex, 我 说 codex 就是 指 codex 这一类工具,其实还有很多种工具,比如说像最近开源界比较火的 open code, 像字节出品的 tree, 还有像 carson 等等等等都可以。我只是拿 codex 举个例子,那 codex 到底是什么呢? codex 一 句话总结就是它是 gpt 的 亲兄弟, gpt 呢,就是用来聊天的,而 codex 呢,就是用来干活的。它能干什么活呢?现在能干的活非常多,如果你现在还花大量的时间去做 ppt, 你 现在就可以把这些任务丢给它。现在 ai 做 ppt 能力已经非常强了,我之前做过一次测评, ai 现在直出的 ppt, 简单修改一下,基本上就能够汇报,它还可以帮你做视频,其实我的很多视频都是 koex 或者是 cloud code 帮我做的。 koex 现在能帮我省掉很多剪辑工作,比如说你的电脑驱动坏了,你不知道怎么修,你现在就可以让 koex 帮你修一下,你还可以让 koex 做一个个性化的简报, 如果你真的有想法,你还可以做一个网站,做一个 app。 我 上面说的都是 koex 能力的冰山一角。那 koex 适合什么样的人群? 会写代码?到底能不能用 codex? 很多人以为啊, codex 这类软件就是一个非常专业的软件,这可能是最大的误解之一,你可以问一下你周边程序员的朋友,看看他们现在还写不写代码。今天刚刚刷到谷歌帝麦的研究员姚顺宇的播客, 他说现在大部分项目都不用写代码了,全部都在用 ai coding。 更主要的是像 codex 这类工具,它的使用难度绝对不会比豆包高,当年我学 cad 画图还学了好几个月,才能勉勉强强上手。 而现在的 ai coding 软件,基本上几天的时间就能够学会,最重要的是它不是一个很枯燥的软件。很多人开始 ai coding 之后,它现在连游戏都不玩了, 每天都在等着额度恢复,因为它很容易让你有一个 builder 的 感觉。 codex 其实它的能力跟它的竞争对手 cloud code 还是有一定距离的。 cloud 它更像是一个谋士,在你不知道干什么的时候,它会帮你出主意,而当你确定了想要干什么的时候,并且做好这些规划的时候, codex 就 会派上用场了。它更像是一个总经理,它会帮你认真的完成这些工作,所以两者要结合起来用。

哈喽,大家中午好,今天给大家介绍一下 codex 跟龙虾有什么区别。然后其实本质上它们是类似的一个产品,因为它们底层都是大模型加 mcp 服务,还有就是我们这类似这种数字员工的模式去构建的。然后呢,它的区别在哪呢?第一我总结一下 就是 codex 呢,它使用起来更方便。那第一是安装龙虾要安装的很多环境呢,然后呢,这个 openai codex 都把它集成好了, 这是第一点。第二就是它的这个操作界面使用起来比较简单啊,对吧?龙虾的操作界面是给技术人员用的,很麻烦,但是这个 codex 就是 像豆包一样,我们对话式的。 第二呢,它其实在很多插件的集成啊,智能化的工作流都给你集成好了,你直接开箱即用,用熟了就可以。 然后呢,包括获取电脑的权限,他也直接给弄好了。第三个点呢,就是说他内置的模型 gbt 五点四,五点五能力是很强的, 然后呢,对吧,他出错的概率很少,我这几天测的几个场景效果还是不错的,无论是让他处理邮箱去帮我下载对应的 youtube, 抖音的视频这些都可以。 但是呢,他有没有缺点呢?他也一样有缺点,因为他的技术价格跟龙虾是一样的,非常依赖授权。那对很多电脑,特别是 mac 没开放的这个权限呢,他也他也实现不了,但是对浏览器的应用呢,他操作是很简单的,这块实现效果是不错的 啊。然后呢,它同时也有一些缺点呢,第一呢,就是 gbt 的 这个 toc 呢,还是比较贵的,因为老外是美刀嘛。第二个缺点就是它的这个自定义模型起来比较麻烦,它目前内置的都是 gbt 的 模型,你如果用其他的模型 toc 更便宜的就比较麻烦。 第三点呢,就是他设置国外的产品,那国外我们都知道,我们去用的话,无论是网络啊、账号啊这些都有一些门槛,所以在他同时也有些缺点,但是这并不足以覆盖他的光环啊。如果大家对这块有兴趣的,我们可以随时交流。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

好的朋友们大家好,今天我想讲一个可能有一部分人已经非常了解和清楚的事,但是有一部分却还不太清楚,可能他有听说,但是他还没有完全理解的一个事,那么就是豆包和 cloud code 以及 codex 之间到底有什么区别? 那么一句话去定义豆包,他是只是会回答,但是 cloud code 和 codex 是 变成会进入你的电脑环境去干活。 我为什么会想到去说这个东西?是因为我在推特刷到这么一条推文,说克拉蔻这么可怕的东西竟然只有几百万人高频使用,几十亿人置身事外,想想觉得荒诞,但我觉得他可能说的有点夸张了,而且我对他的一个说法也不是完全的认同,但是确实也指出了一个现象,我们可能每天强调 和习以为常的克拉蔻的 codex, 但是现在还是有绝大部分的人他们没有去接触,他们只是还停留在用豆包的这个环节上,可能说他们有听过这些概念,但是他们其实没有切实的感受到到底可以干嘛,或者说可以做什么。首先第一个开始,绝大部分人第一次接触 ai 的 时候都是通过豆包和他对话 以及聊天,慢慢的是通过他去搜索,或者说让他帮你写一段内容。 ok, 这是一个普通的入口,那么 cloud code 和 codex 它的区别在什么呢?它是一个生产入口, cloud code 和 codex 它们通常是 从你电脑本地的一个文件夹,一个目录,或者说一个项目,一个仓库开始,最关键的差异是在一个执行的动作上面, 豆包它只能告诉你怎么做,它只能给你输出文字跟给你输出图片,给你输出一个内容去让你去做。但是 cloud code 和 sql 它是能代替你去执行,去做这一个切实的动作。当然这些的动作是指的电脑上面的一个动作,比如粘贴、复制、真删、查改豆包,它是一个 chat ai, 什么叫切的?就是你问他答,而 cloud code 它是一个工作的 agent, 叫 work agent, 它是通过你给他授权它来做,前者是给你一个答案,但后者它是可以进入你的电脑环境,替你完成一系列的动作, 看文件,改文件,运行命令,然后再把结果返回给你。所以总的来说,豆包和 cloud codex 它们不是同一类的一个入口,豆包主要解决的是问答、搜索 以及内容生成。但 codex 和 clock code 则是一个执行型的入口,他们可以打开你电脑的项目,打开你电脑的文件夹文件,他可以读写你的文件,运行电脑里的命令,把变化真实的留在你电脑的文件夹里面,文件里面,代码里面。接下来是这两类产品的一个边界, 像豆包这种聊天助手,它是以对话为中心,用户给问题模型给你一个答案,然后你再把答案粘贴复制到你想用的地方。而像 codex, 查询 code 这类的 agent, 则是可以自己进入文件夹,自己去网络搜索,去网上下载,去执行命令, 调用工具,然后生产出一个可以验收的结果,相当于它是把整个电路都可以打通的去执行。而豆包这一类的聊天 ai, 它们就不能去操作和读写你的本地的文件 以及电脑的命令。那么接下来就是为什么这类 ai agent 他 们可以做到这些?听起来很神奇,但本质并不复杂, 他就是通过让大模型去调用一个个的工具去执行,比如说看文件,通过命令行去看你的文件夹有哪些目录,然后他再去打开文件,再去搜索关键词,再像人一样翻资料去理解一个文档。第二个就是他在你的电脑里面,他可以去执行这些命令,而这些命令其实就是你每一次用鼠标在电脑上点击 右键,左键上下左右粘贴复制,它们的背后其实就是电脑的命令在运行,而这一类的 agent 相当于可以直接去运行这些命令,来达到你同样的粘贴复制 这一类的操作。所以这就很好理解为什么 agent 可以 这么强。当他执行完这些动作之后,他还可以像人一样去看这个最终执行的一个结果, 比如说看这个文本是否满足要求,看这个截图,看这个代码运行之后的输出,失败了,他还可以再去修正,直到你能够验收一个完整的成果。所以说到这里,其实已经大概了解了这一类 ai agent, 它像是会操作电脑的一个助手,你说目标让他去读文件, 读完之后去执行动作,执行完再检查,最后你来验收,这个就是它和普通的聊天 ai 最大的一个区别。所以有些事豆包可以给你建议,但是很难帮助你直接完成。比如说批量改两百个文件名,搜 索并下载网页的资料,然后生成一个可运行的网页,这些东西都更适合交给 cloud code 和 codex。 那 么我介绍了 agent 这么强大的能力之后,其实真正最后是要取决于你到底需不需要它。 如果你的需求只是一段话,那么豆包这一类 ai 其实已经够用,但是如果你希望 ai 可以 帮助你落进文件系统、网页、脚本仓库,去融入到你日常工作的一个工作流当中,那么你其实就应该考虑去学习使用 cloud code 和 codex 这一类 ai agent。 好 的,现在如果好的看到这里,那么 代表你其实对这个 ai agent 是 感兴趣的,且你认为你也有需求去使用它,那么我就接下来建议你可以 第一次去尝试用 agent 帮你做一些很简单的任务,比如说帮你整理电脑的文件夹,最重要的是你自己要去感受这个 ai agent 帮你干活的这么一个过程。那么好的到最后一句话总结,豆包它解决问, 但 cloud code codex 它是解决做普通用户真正接下来要学的不只是怎么去提问,而是怎么把你的需求变成一个可执行、可验证的一个小任务,再交给 ai 去帮你完成。而且其实最终我刚才展示的 ppt 其实就是我用 codex 帮我做的,我只是提供我需要的素材以及一个做 ppt 的 skill, 然后把我的要求告诉他,他就直接帮我做出来了。其实这个例子你就可以很清晰地体会到这种 ai agent 他 们可以做些什么,他们的能力。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

你是不是也分不清 check gpt、 gpt 五点五、豆包、 codex、 飞书 agent 这些东西?那今天呢,一条视频给大家讲清楚。视频有点长,建议先赞后看。 其实呢,对于这些产品,我们不用死记它们的产品名,我们只需要分清三层,大模型、 ai 产品 agent。 那 先说大模型,大模型就是 ai 的 底层大脑,比如 gpt 五点五点五、 cloud gemini 二点五 这些呢,是偏语言和多模态能力的,那像 imagis 二点零、 c jim, 还有 nano banana 是 图像模型,那像 cadence 二点零、 sora 等则是视频模型。 你会发现大模型经常有二点零、二点五、五点五这种版本号,因为模型本身一直在升级, 他可能更会推理,更会写代码,更会看图,或者生成视频更真实。但普通人通常不会直接使用大模型。我们真正打开来用的是第二层 ai 产品, 比如切记 ppt、 豆包、 jimmy、 app、 kimi、 小 云雀都可以理解成 ai 产品, 他们背后可能接了不同的大模型,但你看到的是一个 app、 网页、聊天框或者创作工具。 它的特点是你给他一个需求,他马上给你一个结果,像一个很聪明的及时助手。但如果任务变长变复杂,比如需要持续跟进一个项目,每天要检查客户的信息,或者是要把长篇小说拆分成分镜,然后再生成短句, 又或者要读完整个项目代码,并且修好 bug, 那 这个时候就不是一次问答能够解决的了。这个时候需要第三层 agent 智能体。 那 agent 和普通 ai 产品最大的区别不是他更会聊天,而是他更能做事,他能理解目标,拆步骤,记住上下文,调用工具,并且把一个任务持续往前推进。 所以普通的 ai 产品像一个及时的助手,那 agent 更像一个执行助理或者是数字员工。 举个例子,你对宪宪 p t 说,帮我规划一个杭州三日游,他会给你一份攻略。但你对 agent 说,帮我规划杭州三日游,查机票、酒店、天气,把预算整理成表格,那他呢?可能会自己查资料,交信息,整理表格。 在你授权之后,他甚至可以帮你订机票,订酒店。那再比如编程,你问 qq 这个网站应该怎么做,他会告诉你思路。但当你把这个任务交给 codex 或者 cloud code 的 时候,告诉他帮我把这个网站做出来,顺带修复移动端的适配, 那他呢?就会去读文件,改代码,运行命令,看报错,再修复 bug。 所以 像 codex、 cloud code 这种,它不只是一个编程工具,它更准确地说是编程 agent。 国内也有很多 agent, 比如说 code、 飞书、小确短句 agent, 那 海外有 open cloud、 爱马仕 codex、 cloud code minus。 当然你要注意的是,很多产品它不是只能放在一个格子里的,比如说嵌 gpt, 它是一个 ai 产品,但里面也可以有 a agent 的 功能。那飞书是个办公产品,但飞书 ai 里面可以有办公的 agent。 小 云雀是一个内容创作产产品,但它也可以有短剧的 agent。 codex 的 场景是编程,但它的本质还是 agent。 判断一个东西是不是 agent, 不是 只看名字,而是要看他能不能做长线的任务。如果他只是回答,改写、总结,生成一张图,那更像一个 ai 产品。但是如果他能带着上下文,拆步骤,调用工具,持续的推进任务,那他就是 agent。 那最后给大家总结一下,大模型呢,就是最底层的大脑,比如说 g p t 五点五, cloud jimmy kimmy k 二点五, cds 二点零。那 ai 产品呢?是普通人使用 ai 的 入口,比如说切克 p t 豆包 啊, gemna 的 app 等等。那 agent 呢?是能执行长线任务的 ai 系统,比如说 code 飞速 alley open cloud, 还有爱马仕 codex cloud code。 所以 以后啊,你不要再问哪个 ai 最强了,更好的问题是,我现在需要一个及时助手,还是需要一个长期推进任务的 agent? 如果只是写文案,问问问题,生成图片,用 ai 产品就够了。但是呢,如果你要他持续跟进项目操作工具,处理流程,完成复杂的任务,那你真正需要的是 agent。 我是 优娜,关注我,带你了解更多 ai 知识!

你们一定一定一定要想办法去用上 codex 跟 cloud code, 我 觉得这个真的是普通人能够用最小的一个成本去接触到目前全球最前沿的一个 ai agent, 就是 大家现在是不是还停留在说,哎,我们大模型有一些啊, cloud 啊,或者说 gbt 啊这些,或者说可能有的同学还在用豆包啊, deepsafe 啊这些大模型阶段,那实际上目前最前沿的一些 ai 落地,你会发现它的 ai agent 跟大模型又相差的非常的大,就是你们没有踏出这一步,你们完全就没有感受到啊。 呃,为什么我觉得说 codex 是 我们普通人最低成本去用上最前沿的东西,反而不是 cloud code, 主要的原因的话是 cloud code, 其实如果你要用上,你会去遇到各种封号啊,用 ip 啊这种形式,对吧?对于你的一个使用的门槛会还是相对比较高的,但是 codex 它不一样,为什么我解释非常解释的 简单的跟大家讲这个事呢?就是它的量大管饱,什么叫量大?就是 token 啊,它的量大,然后呢它又便宜,它不像 codex 一 样,比如说你啊,一个月你去买一个 plus 或者二 max 的, 你用八百多块钱一个月,对吧?你 gpt, 你 不用 gpt, 你 目前你可以在一些公开的一些地方,你可能大概一百八,对吧?你可以买到,你可以用的非常的舒 服。一旦你去下载了一些 code, 一个 codex, 你 会发现你的整体工作流程会完全不一样啊。我们拿产品经理举例, ai 产品经理, ai 运营或者 ai 卷方案举例,呃,拿最基础的一个流程就是调研,对吧?你调研也好,或者说你去做啊,设计,写日常的文档也好,实际上你很大的工作都在写,对吧?那你写你, 你写,你不管用 ai 智能写也好,或者说大模型写也好,都可以,但是 ai 智能它可以去搜搜索你本地所有的一些能力,对吧?你的一些文档沉淀去给它,通过通过充足的上下文,你去给它写出更好的一个文档,同时的话也可以去调用一些 他自己,去调用一些你自己以及沉淀的一些 skill, 对 吧?你去自己只要你能够把一个流程给 s o p 给沉淀下来了,后续沉淀成 skill 之后,你无后续,你只要无限的跟他说,哎,你帮我调用这个 skill 啊,那可能是比如说给你画一个图,写一个 p r d 啊这些,你只要说这句话,它就无限的非常轻松的给你产出符合你要求的这么一个文档出来。 所以说对于你整体的工作的提效是大家没有办法想象中的那么高效的。我已经要求我们公司的人或者说我自己的学员,你们必须要不就用 kol 的 kol, 要不就用 kol css, 你 们必须使用你。 如果说 ai 时代你没有去用这种最前沿的一些 ai 的 agent, 实际上你会发现,哎,你的认知还是在自己的一亩三分地里面啊,那 我没有要营造一些任何的焦虑,我真的希望大家能够用上这些 ai 政策,然后去改变自己的整体的工作方式,因为我们目前我们公司的工作方式就已经变成了 ai, 想 ai 做,对吧?人每天做的什么?跟 ai 对 话, ai 去人去审核,剩下的所有事情都是 ai 做,那你一想你的工作效率提升的会极度的快啊。所以说,哎,我们 这个是真的是我觉得最低成本最快的去提升我自己的一个工作效率也好,或者说我的认知 ai 认知也好,去提升我的 ai science 也好啊,这个产品就叫做 codex, 大家可以去他的官网去下载,非常简单,没有任何的门槛啊。

一定要想尽办法去了解一下现在这个世界上最强的 ai codas, 现在的 ai 之王,因为你只要用过 codas, 你 就会立刻意识到 ai 已经可以彻底颠覆整个人类社会,它是一个超级生产力工具。为什么你之前用的其他 ai, 你 感觉非常的一般?因为 其他的每一个 ai, 他 只会做一点点事,比如说豆包,他只能回答你一点问题和写一点文案,做一点方案。就比如说以前要做视频,你可能要去找奇梦,再比如说你要做音乐,你要去找 solo, 你 要去做数字,你要去找剪映。所以过 过去很多人会觉得 ai 世界会非常的麻烦,要学很多很多的 ai。 而且 ai 没有办法自己去操作抖音,没有办法去操作视频号,没有办法去操作各式各类的销售操作系统,没有办法去操作各种财务的软件。所以呢,你会觉得说 ai 它没有真正 变成一个生产力工具,它只是把生活变得方便了一点点。但是如果你用了 codex, 你 会发现 codex 作为 ai 之王,它可以同时操作天下所有的 ai, 实际上最会做图的 ai, 最好做视频的 ai, 你 根本就不需要去了解,你只需要跟 codex 说,帮我控制一下,去升个图, 帮我控制一下,去生成一个视频, cody 会自己下载,并且自己控制,你不需要学习, cody 做的比你还要好,而且 cody 可以 直接的操作你的浏览器,直接控制你的电脑, 比如说你现在想要养一只龙虾,你不会养龙虾对吧?你可以直接跟 cody 说,帮我下载一个龙虾,并且帮我养好它,帮我管好它,你会发现 cody 把小龙虾下载好了,并且跟狗一样乖的帮你训练着,而且 cody 可以 直接帮你操作你们公司的财务软件, 销售软件,所有各式各样的软件系统,而且它还能帮你干嘛?操作天猫后台,淘宝后台,各式各类的抖音视频后台,也可以把你过去的,不需要运营的,把你亲自去操作的一些事情, 全部都可以用 code 无缝衔接啊。所以你们知道我们公司每一天的工作模式什么吗?打开 code, 然后嘴巴对着它许愿 我们的 codex, 它可以直接的读取我们的销售 c i m 系统,看到我们现在有多少客户正在跟进当中,并且同时能控制我们的飞书和企业微信,读到我们的销售聊天记录,看到哪一些未成交的客户跟我们的销售沟通到了哪一步,然后它会控制着我们的剪 辑软件,或者自己可以控制一个编程软件,然后定向给我们的客户深层演示视频。就比如说你现在是一个美业的老板, 然后你在跟我们的销售在聊天的过程中,我们的 codex 呢,可以直接读取你和我们的销售的记录, 并且根据你的需求点,直接帮你定向的生成一个网站,或者可以生成一个智能体,甚至为你们生成一个你们公司以后有了 ai 之后该怎么去工作的一个完整视频,可以直接自动的发给你,然后我们的销售根本什么都不用做,他可以双手离开键盘,离开鼠标, 等待着 codex 把整个的方案完完整整的做完,然后再把整个智能体做出来,甚至可以把整个说明视频给它做好了,然后它只需要发给客户,然后一个电话就打过去。王总,你看一下这个系统牛不牛, 是不是你想要的?如果是的话,咱们什么时候签个合同?如果你是个老板,必须现在此刻下载 codex, 并且让你们的所有员工全部去安装 codex。 我写了一整个完整的安装流程以及安装的体系,专门来教你们这些企业如何运用 codex 运行到销售、流量管理各个环节,如果需要领取的话,评论区扣 codex。

豆包千问, chat gdp 相信你都不陌生,那么 coser、 cold body tree 这些呢? 再接下来, cloud code code、 dex 这些你有没有听过?我相信这些 ai 工具频繁地出现在你的社交媒体上,但它们到底是什么关系呢?今天我用五分钟讲清楚的 ai 工具有三种形态, 第一种,豆包元宝 chat g p 这种 chat 类产品,打开对话框跟 ai 说话,我相信百分之九十九的人也是从这里去使用 ai 的。 它的特征就是只能聊天,没有记忆,没有本地文件读取能力,更像是一个大号的智能搜索引擎。第二种, g u i 智能体 tree, codebody codex 桌面版都属于这类, 使用很简单,打开一个文件夹, ai 就 在里面跟你一起去工作,他能读取你电脑上的文件,也可以直接改你的工作区。这类产品现在已经不是程序员专属了,所以推荐其他的岗位同学也可以上手体验一下。 第三种, c l i cloud code codex kimi c l i 大 模型跑在命令行里,这种形式看起来比较奇特, 用起来有些门槛,但真熟练了,比前两者都强大。为什么?模型虽然都是一样的,但外面那一套调度循环工具调用、上下文管理、记忆管理等等,都是为了匹配模型做的一系列工作。 这也是现在很火的一个设计范式, harness engineer, 而 cli 就是 把 harness 做到了极致。接下来演示一下。 cli, 我 放一份 prd 文档在这个文件夹下,目标是做一个网页版的番茄钟,加任务清单。 我在这里说一句,根据这个需求,文档做一个 mvp 出来,剩下的他自己去读 prd 识别功能模块,然后写代码,最终完成目标,这就是 cli 进的 好。我们把整体的布局梳理一下,首先是国外的预参加 open ai、 astropic、 google, 以下是它们的这些产品。 其次是国内的字节,阿里、腾讯、小米,以及这几年陆续成立的大魔性公司 deepsea、 月之暗面、智普、 mini max 还有 coser, 大家可以截图保存一下这些关系和名字,方便以后查看。最后总结一下, chat 有 chat 的 方便, c l i 有 c l i 的 强大,关键是看你的需求。如果你想让 ai 深度参与到工作中,我的建议是从 g u i 开始入手, 随便找一款工具,酷狗吧里吹都可以。打开一个文件夹,让 ai 在 你的工作区里跟你一起干活, 不要光看不练,选一个工具去用,让大模型真正进入到你的工作流,这才是深入体验 ai 的 正确方式。

最近是不是你也被一波普通人一定一定要用着 codex 的 视频疯狂洗脑?我跟你讲,我现在一刷到这种视频呢,我这个血压就上来了。 上个月喊的是一定一定要用上 openclaw, 这个月风口一转改成 codex 了,都感叹的多好多好多强多强,好像不用是他这辈子你就废了一样。我这又好气好笑。 好笑的什么?好笑的是这帮天天喊 codex 牛逼的博主。我赌一包辣条啊,一大半连 plus 都没充过,就算真的充了,我猜你拿这玩意干啥?写文案?对,你没听错,就是屠龙刀,到手拿去干嘛?切黄瓜。 那我问一句,你光喊用上用上,你倒是说说怎么用上?我给大伙数一数,一个普通人想要真正用上得过几关?第一关环境啊,大家很多都懂的。第二关注册,第三关是海外手机号验证, 你加八六的这个人压根不认。第四个,每月二十刀的充值,光这个怎么把钱充进去就能劝退一片人?四道鬼门关关都可以把普通人挡在门外,这些你怎么一字不提呢? 更扎心的来,你不拿它写个文案嘛,整个图文嘛。那我告诉你, deepsea v 四 pro 这边 api 刚永久降价了,百分之七十五 性价比性能直接拉满。日常文那点活他干的又快又好,说白了普通人那点需求啊,人家是价格对着 g p t, 五点五就是降维打击。这个你为什么又不说呢? 我算看明白了啊,一帮自己每个月一百万 tucker 都消耗不满的所谓博主,天天就知道吹,就知道蹭流量,就知道一定一定干货时一点都没有焦虑,给你直接拉满,这个我觉得有点恶心啊, 我不是说扣袋子不好啊,但是他很强,这个我是承认的。我气的什么呢?把工具的门槛给你藏起来,普通人不需要的功能给你吹上天,然后收割你的关注。今天这条我不说一定一定要用什么,我说一句,谁只会喊必须用,却不告诉你怎么用,值不值,适不适合你, 你直接划走,别让他赚这点流量啊。下一条我跟大家讲讲普通的人到底该不该花这个钱,花了钱能不能回本?咱说人话,聊聊干货。

为什么我觉得 codex 它像二零零三年的淘宝?最近大家都在讨论 codex, 有 人说它是更强的 excel gpt, 也有人说它会取代程序员,也有人说它只不过是一个工具罢了。 但在我看来,很多人都看错了方向。 codex 真正最重要的地方,不是它比传统的 ai 更聪明,而是它换了一种工作方式。 大多数人都在比较 ai 的 智商。过去几年, ai 圈最火的问题永远是谁更聪明,谁推理更强,谁的参数更丰富,谁的考试分数更高。 于是我们习惯了用一种标准去衡量所有的 ai, 仿佛 ai 的 未来就是不断的提升智力。但当我开始真正的使用 codex 后,我发现一个有趣的现象,它最让我震撼的地方并不是它的智商,而是它的执行力。 传统的 ai, 它们解决的是知道过去的 ai、 豆包、 deepstack, 它们都属于一种同一种模式, 你提问,他们回答你执行整个流程,就是人给 ai, ai 再给人人去执行。 那比如你说帮我做一个登录系统,传统 ai, 他 会给你技术方案、代码示意、代码示意、 实现思路、注意事项。这些问题的答案都很有价值。但是问题在于,最终干活的人,他还是你,创建项目的是你,安装依赖的是你,修 bug 的 人还是你。 所以 ai, 它提供的是一个认知价值,它帮助你知道你该怎么做。 但是 codex, 它解决的是做到 codex 思路完全不同,它不,它不只是告诉你怎么做,它开始尝试替你完成工作, 它会阅读你的项目代码,然后理解你的文件结构,然后修改代码,创建文件运行、测试、修复 bug, 它最终交交付给你的不再是一段建议, 更是一个结果。这就这也就意味着 ai 的 角色发生了一个翻天覆地的变化。过去的 ai 呢,它更像一个顾问, 那 codex 呢?它更像一个员工。过去的 ai 负责思考, codex 开始执行,这是一个看似微小,实则极其重要的转变, ai 的 竞争正在发生变化。很多人都觉得未来 ai 竞争会变成谁更聪明,谁聪明谁就厉害。 但是我觉得未来的 ai 竞争,它可能是谁能把事情做完。因为在今天,在这个时代,因为 ai, 因为互联网知识变得不再昂贵,知识也不需要付费,只要你动动手指就能获取。所以在现今现实世界, 大多数问题他并不缺少答案,他是缺少执行健身的方法。人人都知道创业的方法,网络上到处都是,写代码的,教程更是数不胜数, 那么真正稀缺的呢?在今天从来不是知识,而是行动。很多人,很多人,他知道方法是什么,但他从来不去做。过去的 ai 呢?他就负责给你一个答案,做不做是你的事。下一代 ai, 从 codex 开始,他们给你的是一个成果,他们帮你做 从搜索引擎到今天的 agent。 如果你回头看互联网的发展,你会发现一个特别有趣的规律,第一阶段,搜索引擎时代,谷歌、百度, 它们解决的是给你信息。第二阶段,聊天机器人阶段, chat、 gpt、 cloud 等那些产品,它们解决的是给你答案。第三阶段, agent 时代, codex 这样的产品,他们解决的是给你结果、信息、答案、结果。你看起来他们就是只差了一步,但他们实际上是完全不同的 价值阶层。为什么 codex 让我想起了二零零三年的淘宝,很多人就喜欢问 codex, 它会不会成为下一个淘宝? 我不知道,也没有人能给你一个精准的答案,但它确实让我想起了二零零三年的淘宝,因为当年的淘宝是被严重低估的,很多人就觉得 淘宝不就是一个卖货网站吗?那很今天很多人都在说,你扣代码不就是一个写代码的工具吗?我有豆包,我有 deepcheck, 我 有 check gpt, 它们写的比你好。但是 历史告诉我们,真正改变世界的东西,他在早期往往会被解释为上一代事物的升级版。所以淘宝他后后来改变的不只是购物方式, 他改变了整个商业基础设施。同样, codex 他 未来改变的也可能不仅仅是编程,他真正要影响的就是人与 ai 与工作的关系。 所以真正的机会在哪里?二零二三年最大的机会不是淘宝本身,而是围绕淘宝长出来的一整个生态,店主、供应链、代运营、摄影、培训、物流支付,无数的新职业。因为淘宝诞生, 今天也是如此。未来最大的机会也许不在不在扣贷本身,而是在于如何管理 ai, 如何协助 ai 替你完成你的工作,如何构建 ai 原生业务,如何利用 agent 创造新的生产方式,如何利用 ai 帮你的事业完成商业闭环,帮你挣到你的 第一桶金。所以很多人,他们看 codex, 他 们只是看到了工具,但是少数人,他们在 codex 身上看到了一个新的时代, 所以我不确定 ky 三是不是下一个淘宝,因为它确实让我产生了一种久违的感觉,这是一种站在新时代入口处的感觉,就感觉新时代的钥匙现在已经在我的手里面,只要我打开它,只要我敢去尝试它,只要我去拥抱它, 他就会反过来反哺我,给予我想要的。所以过去的 ai, 它是在帮人们思考未来的 ai, 它就是已经开始帮人们工作了,就从今天的 codax 开始, 过去我们追求的是更聪明的回答,未来,我们更需要的是更可靠的交付,你能不能帮我完成我的工作,你能不能帮我跑通我的商业闭环,帮我赚到钱,这才是我们更关心的。所以在我看来, codex 的 意义,他从来不是在于他有多聪明, 而是在于他敢让 ai 第一次真正的下场去帮你干第一次活,而这 他就是 ai 时代真正的风水岭。最后我想说的是诺基亚,诺基亚发展的道路上,淘汰诺基亚的从来不是更好的诺基亚, 而是 iphone 四 s。 所以 打败传统 ai 的 也不是一个更聪明的 ai, 而是真正能帮人赚到钱,能把事情做完的 ai。

codex 是 openai 推出的 ai 编程伙伴,可以帮助我们开发功能、修复 bug、 重构代码、做代码审核等。 openai 官方也提到, codex 可以 处理从功能开发到代码 review, 发布相关的工程任务。 但对孩子说,我们不用一上来就讲那么复杂,我们可以把它想象成一个把想法变成作品的 ai 助手。比如说我想做一个数学错题的讲解器,我不会直接说 帮我写代码,这样太空了,我会说,请帮我做一个适合三年级小学生使用的数学错题讲解网页功能包括,学生可以输入一道数学错题 e i 页面,提示学生先分析题目条件, 在引导学生写出题解之后,再举一反三。应用风格要可爱清楚,适合孩子,这就叫任务拆解。这我也给大家进行干货总结。给 codex 写提示词有一个万能的公式,角色加目标加用户,加功能,加风格加输出形 式。比如说角色是,你是一个 ai 编程助手,目标是帮我做一个教学错题分布讲解, 生成类似体,风格是卡通,也要简洁,适合孩子。初初就是做成网页。在 ai 时代,孩子真正要学的不是复制答案,而是把自己的想法讲清楚,因为你讲的越清楚, ai 做出来的作品就越接近你想要的样子。

那么你能介绍一下你这个上瘾的这个过程吗?还有怎么接触到这个的?一开始没想玩这些东西,其实就是 我最早其实就是玩玩 ai 生图啊,什么视频这些,那后来他们就有个群嘛,群里他们就开始玩那些什么 web 口令啊,是吧,我当时也就抱着试试看的这种新态度来尝试一下。 嗯,一开始也没有玩儿 codex 的, 玩的是那些别的像那什么抖包啊这种傻了吧唧的。哈,那后来他们就说,哎,有有一个东西叫 codex, 这个玩意特别牛, 那后来我就抱着试一试的一个心态吧,就感受了。那没想到就就就怎么上瘾了, 那为什么最后会发展到这么严重呢?嗯,一开始其实也没想怎么玩,就没想到会发展到这个程度。我一开始就是想做一些小网页啊,什么一些小游戏,自己玩一玩,后来 我就发现他们群里的人开始玩那些更高级的,就是说做那种什么自己做软件啊,做那种画布啊,开发这些东西, 这样的话我也想尝试一下,想玩一玩嘛,然后就发现这个 token 就 不够用了,然后就开始充值嘛,啊,一开始是 plus 会员,那后来呢? plus 也不够,那么就有重了炮的会员, 那么在你被发现前的那一刻,你已经发展到什么程度了?呃,发现之前,嗯,发现之前我已经注册了四个 pro 的 会员了。 四个?那节目最后你有没有对观众朋友们想说的?呃,想劝解的一些, 我想说的就是大家一定要警惕那些引诱你去玩 web coding 的 这些人,他们这些人真的是挺坏的。对啊,他们引诱大家去烧这么多的 token 啊,去做一些很好玩的东西出来。 看起来很好玩是吧,但是实际上烧的都是你的人, tucker 都是你的金钱还有你的精力。嗯,大家一定要远离,不要像我这样啊,对了,那个访谈能帮我打个码吗?啊,谢谢啊。

一定要用 codex 目前最强的 ai, 之前我们用豆包写文案,集梦,做视频,剪映,去剪片子,一个 ai 只能干一件事, 光去学都觉得很累了,而且呢,它只会帮你生成东西,不会帮你发出去,所以我们总觉得 ai 没有变成真正的生产力,对吧?但 codex 不 一样, 你只要用嘴告诉他想要什么,他就会去操控世界上最好的 ai, 帮你干活。只要说我想要做一条视频, 他会用最会写脚本的 ai 写,最会剪视频的 ai 剪,我们不用去管他操作的谁,等结果就行了。他呢,还能直接操控你的浏览器, 帮忙发,帮忙管。原来呢,公众号、文章写稿呢,还有视频号,选择题,要用三四个工具折腾一下午,现在一句话, codex 全部串起来了, 喝杯水的功夫就把活干完了。而且呢, codex 还可以帮我们去整理数据,哪个视频为什么爆,为什么没有爆? 他都会自己分析完给我一份报告。以前呢,我觉得自己是在用 ai, 其实是在给 ai 打工,一个 ai 工具 伺候一遍,现在反过来,一个, codex 可以 把所有的 ai 变成我的打工人,我自己一个人就可以干一个团队活,靠的就是这个。我呢,这里有一份 codex 实操手册,如果你也想让 codex 帮你干活,评论区告诉我。

一定要想尽办法去用一下这个世界上最强的 ai。 扣代斯,现在的 ai 之王,因为只要你用过扣代斯,你就会立刻意识到, ai 已经是可以颠覆整个人类所有社会结构的一个超级生产力工具。为什么你之前用的其他 ai 感觉一般呢?因为啊, 其他的 ai 只能做一点点的事,比如说你用豆包,他只能回答你问题,给你写点文案,做点方案。比如说你要做视频,可能呢,你要去找吉梦。 再比如说你要做音乐,你可能要去找 solo, 你 要做数字人,你还要去找剪映。所以在过去,很多人觉得啊, ai 世界就是很麻烦的,要学很多很多的 ai。 而且 ai 没有办法自己去操作抖音,也没有办法自己去操作视频号, 没有办法自己去操作各式各样的销售系统,没有办法去操作各式各样的财务软件。 所以你会觉得 ai 并没有真正的变成生产力工具,它只能让你的生活变得方便了一点点。但如果你用过蔻黛斯,你就会发现,蔻黛斯作为 ai 之王,它可以同时控制天下所有的 ai。 实际上最好的做图 ai, 最好的做视频的 ai, 你 不需要学习,你不需要了解, 你跟蔻黛斯说,你去控制它给我升图,你去控制它帮我生成视频,蔻黛斯就会自己下载,自己控制, 你不需要学习。扣袋子做的比你还要好,而且扣袋子可以直接操作你的浏览器,可以直接操作你的电脑,比如说你现在想养一只小龙虾,你不会养小龙虾是吧?你直接跟扣袋子说,帮我去下载一个小龙虾,并且帮我把它养好, 帮我把它管理好,你就会发现扣袋子把小龙虾下载好了,并且的确跟狗一样乖。而且扣袋子可以直接操作你公司的财务软件,销售软件,所有各种各样的软件系统,或者可以帮你去操作天猫的后台,淘宝的后台,各式各样的抖音短视频后台, 也就是说过去你需要运营或者自己去操作的,现在呢,所有的动作都可以让扣袋子,然后拿嘴巴对插件许愿。 我们的扣袋子可以直接读取我们销售的 c l m 系统,看到现在有多少客户正在跟进中,并且读取到每个客户的具体信息。它还能同时控制我们的飞书和企业微信,读到我们销售的聊天记录, 看到那些未成交的客户跟我们的销售到底聊到哪一步了,然后他能自己控制剪辑软件,或者自己控制编程软件,定向的为我们的客户生成演示视频。就比如说你是一个做美业的老板,然后呢,你现在正在跟我们的销售聊天, 我们的 codex 可以 直接读取到你和我们销售的聊天记录,并且根据你的疑虑为你生成定向的一个网站,或者生成一个智能体,甚至为你生成一个你们公司以后有了 ai 之后该怎么去工作的一个完整的视频,它可以直接自动地发给你,然后我们的销售什么都不用做, 双手离开地面,离开键盘,离开鼠标,等着扣袋子,把整个的方案完成,把整个的智能体做出来,甚至把整个的说明视频做好。我们的销售只需要发给客户,然后约一个电话。王总,你看一下这个系统牛不牛逼,是不是你想要的?如果是的话,咱们什么时候签个合同?所以如果你是个老板,你 必须要下载扣贷子,并且让你所有的员工全部下载扣贷子。我写了一整个安装流程以及安装体系,专门为了教你们这些企业如何运用扣贷子,运用到你们的销售、流量、管理等整个环节当中。需要领取的话评论区扣扣贷子。

如果你是一个新手小白 codex、 cloud code、 zcode 到底应该选择哪一个?判断的标准一定不是哪一个工具更加的好用,而是哪一个工具能够快速的让我们上手使用。本质上这三个工具都在做同一类事情,就是把 ai 接入到我们真实的工作当中, 它不光能像豆包一样去聊天,还能够看懂项目,帮我们修改内容,真正的帮我们接入到工作当中并跑起来。 所以真正要比较的不是说哪一个工具听起来更加的高级,而是哪一个能够让我们新手更加快速的上手使用。先说 codex, codex 很好用,它有客户端,但是对于我们国内用户来说, 真正麻烦的不是说那些功能如何使用,而是账号支付、网络环境这些问题,我们很多人还没有开始用,就已经先被第一步网络环境给卡住了。再说 cloud code, 它也很强,但是它对国内用户依然不友好, 首先他的客户端界面不支持我们国内的首要验证,所以说只能在终端里面去运行。但是当中端这两个字出来以后,就把大部分的新手小白给劝退了, 我们还没有让 ai 真正的进入到我们的工作,就先被这些前置环境条件给挡在了门外。这也是为什么我建议所有国内的新手用户 一定要去使用 zcode, 它的好处不是说一定就比 codex 或者 cloud code 更强,而是它能够快速地让我们上手使用, 十分钟之内就可以实现下载安装,并且呢支持接入到我们国内各大厂商的大模型,能够真正地在半个小时之内就实现把我们的 真实工作给跑起来。当你真的能够让它帮我们去打开一个项目文件夹,修改一行代码,写一个 word 文档或者是 excel 表格的时候,我相信你一定会打开一个新世界的大门。当你熟练运用 zcode 以后,再去研究 codex 或者是 code code, 上手就会变得非常非常的容易。所以我的建议很简单,如果说你账号、支付、网络环境这些都没有问题,那 codex、 code code 一定是你的首选。 但是如果说我是一个新手小白,只是想快速的体验一下如何让 ai 真正的介入到我的工作当中, 那么 zq 的 一定是首选,完全不需要你考虑任何狗屁的网络环境。半个小时之内就可以快速的让你上手体验 zq 的 不是终点,而是一个快速开始的入口。下期我会带你看 zq 的 界面,包括设置里如何去切入大模型。 作为新手呢?我们也先别急着追求全部的自动化,先去弄清楚三件事, ai 能够看到什么,你要他做什么,结果怎么去检验。先把这三件事情搞清楚,后面才能真正的让 ai 接入我们的工作。 如果你不只是想知道用哪些工具,而是想知道自己的工作流程,能不能接入 ai, 也可以来我每天晚上的直播间,我会现场拆解真实的工作流,判断哪些适合 ai, 哪些交给我们人工来拍板,我先帮你找到第一步。