粉丝101.8万获赞759.2万

就在刚刚, codex 的 电脑操作功能终于官方登录 windows 了,你看,我现在调用这个 computer use 电脑操控的功能,让他给我的微信发一个文件。你看整个屏幕有一个蓝色的渐变框,然后显示 codex 正在使用你的电脑。他已经打开了我的微信,选中了文件传输助手, 把我需要的那个文件发送给我了,整个流程都是他自己完成的。还有一个更有意思的,我让他直接在画图软件中给我画一个皮卡丘啊,你看,他正在操控我的鼠标,按照他的指令快速的会制整个速度。很快啊,我这里并没有加速,全程都是他自己在画,我感觉画的还挺好的,至少比我画的好。 之前在 windows 电脑上, codex 只能在浏览器中实现自主操控,但现在整个电脑都是它的了,比如微信、 word 文档,各种软件,甚至还可以在电脑上帮你玩游戏。因为本质上你和电脑的交互无非就是鼠标和键盘, 现在它也可以用鼠标键盘了,所以你能操控的它都能操控。具体怎么使用呢?通常来说,如果你的 codex 更新了,今天第一次打开它,就会有一个弹窗出来, 你直接把 computer use 开启就可以了。如果没有弹窗呢?在设置中找到电脑操控这里,我们把任意应用这里打开,你在对话中调用 computer use codex 就 可以操控你的电脑了。但注意,我在 win 十的电脑上似乎运行不了,只有在 win 十一的电脑上才可以。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!

国内用户如何使用 codex? 这个视频我将教大家不需要解决网络问题的情况下完美使用 codex 软件, 避免使用 codex 时提示输入手机验证。我们需要准备两个软件和一个网站,那两个软件呢?分别是 codex 和 cc switch, 一个网站就是我们要选择接入哪个模型,或者是我们使用的 api 中转站。首先我们可以到 codex 官网来下载,我们可以直接打开这个网址,国内用户是不需要上网环境就可以打开的, 打开后我们可以直接下载,如果你是 windows 电脑,这里会出现 windows 的 版本, 我们直接点击下载就可以。第二步,我们打开这个 cc switch 的 github 仓库,我们可以直接输入这个网址来打开,在这里我们选择下载它的对应版本,点击后我们向下滑动, 在这里我们可以找到不同的客户端,我的电脑是 mac, 所以 我选择 mac 版本,点击后直接会下载 这里你如果没有配置好上网环境的话,下载这个客户端会比较慢,那我在这里已经帮大家下载好了,并且已经上传到了云盘,如果需要的话,你可以在评论区留言,下载好后我们正常安装就可以。 现在我们打开 codex, 现在我们可以看到它,让我们选择登录,这时如果你没有上网环境的话是无法使用的, 那现在我们就用到了第二个软件 cc switch, 我 们正常安装 cc switch 后,我们选择打开它。 打开这个 cc switch 后,我们看最上方的这一栏,我们选择 codex, 在 首次配置时默认是只有最上方的这一个官方 api 的, 下面这三个都是我自己配置的,那如何配置自己的模型或者 api 呢?我们点击这个加号, 在这里我们可以选择不同的供应商,也可以自己填写供应商的名称。那我这里以这个 ai go code 的 这个 api 网站为例,点击后我们看到这里的参数,它已经帮我们设置好了, 我们现在只需要填写一个 api k, 那 我们可以打开它的官网,在这里我们点击登录或者注册,如果首次使用的话, 它是需要充值额度的,充值好后我们可以点这个 api k, 然后在这里我们可以看到这个 codex 有 不同的两个分组,我们可以选择这个速度更快一些的,或者性价比更高一些的。 我们点击这个创建,可以给这个密钥起一个名称,然后点击创建,这时它会生成一个密钥,我们选择复制,然后把这个密钥粘贴到 cc switch 中, 我们选择添加,添加好后我们在这里点击起用,这时我们再将 codex 重启一下, 这时我们就可以看到他现在可以正常使用了。这里我全程都是使用正常的上网环境,我们来测试一下,帮我生成一张,欢迎大家点赞收藏。评论的图片要求十六比九的比例, 它现在已经按我的要求可以正常对话,并且可以生成图片了,而且调用的还是最新的 emoji 二模型, 并且全程不需要登录,不需要其他的上网环境。我们接入第三方 api 的 话,也是用多少花多少。这个方法主要是针对那些没有上网环境的同学, 如果你在安装过程中出现了任何问题,都可以在评论区留言,我会给大家逐一回复, 下个视频我将教大家如何具体使用这个 codex, 它和 cloud code 有 什么区别?我们下个视频见,欢迎大家点赞收藏评论。

真的,你的电脑只需要一个考勤就行了,可以让他二十四小时帮你干活,你想体验 code code 的, 你直接告诉他,他直接帮你安装中文版本的,并且配置好 deepsea 微四的一个模型, 如果终端用不习惯也没事,我直接让他帮我安装桌面端的版本,并且啊,会员也是帮我成功开通,像我这种一个代码都看不懂的,现在也能做网站呢。 你别说,这个画布做出来还挺就挺好用的,什么帮我把硬盘合区,做每日资讯,做 ppt 我 真的都全用它,真的太强太好用了,因为这个电脑它控制的话,它这个鼠标是和你和你的鼠标它不会冲突的,它在后面默默的干, 你来可以开两个,三个一起来跑。所以呢,我就直接上了一个 pro, 让三台电脑二十四小时直接帮我干。

让库德斯呢控制我的电脑,全程呢?让他自己给我做设计,我们看看效果会怎么样?这里话呢,我是先让库德斯干嘛呢?就是参考我这个产品, 这里话丢了一个,那个就是手机, vivo 手机产品,然后呢给了他两组参考,对吧?每个文件夹里面呢生成五张图,对应五张图啊,一共十张图,我给他什么参考呢?哎。一个什么呢?一个是呃,这种什么雪地啊?嗯,之类的。这种雪地啊,一个参考。 那另外一个怎么参考呢?另外一个是花卉的参考,就是完全让他按照着参考来。按参考来干嘛呢?就是让他是根据这个参考呢去提供那个就相当于给大家群群版,然后呢给大家个产品卖点,试一下创意呢?他自己想,然后呢?吭哧吭哧吭哧,然后自己想了,对吧? 然后自己控制我电脑,再然后呢?哎,他就能去开始打开我的这个串起屁。那第一个的话呢?什么呢?他是丢了两张这个参考图,那跟这个产品呢?哎,申请一个是雪地的吧,对吧?不要放其他 logo 什么的,但是,哎,这第一张雪地的效果还可以啊。 第二个呢就是这个,呃,延时的。第三个呢是在冰块里面的。第四个的话呢就是应该是他模仿的脚印,你看变成手机印了,印在里面,我们这样看, 还有是这衣服呢,这个是我没想到的衣服,这个都不知道他怎么跟这个长相结合在一起啊?饱满可以,对吧? 那好,再后面的话呢,就是那个啊,就是花卉的,就是因为我给两组嘛,另外组花卉的,他就是跟花期结合的,一个两个,对吧?这两个很重复嘛?这个人家说不要太重复了,因为这个是像是万里生长一样的, 这个应该跟那个时间去好像有点关系啊,然后这些花卉的 啊,还有这个,这个对吧?那我又让他干什么事呢?又让他那个挂这里,自己去打开我的编辑室,然后自己的话呢?就参考那个,呃,创意图啊,吭哧吭哧,再生成个海报 题词是他自己写的,然后自己那个我让他不要重复哈,创意不要重复,对吧?啊?这一张的话每张都是他自己写的题词,然后自己那个生成海报,生成完了再接着下一张,对,就就这样挂了,挂了一个晚上哈, 没有好创业的时候呢,你就可以让它扩展自己呢去做,对吧?那这前提干嘛呢?就是你在要在设置里面哈,打开什么?打开你的电脑控制电脑控制这个打开来,然后呢把这个安装一下就可以了,点个授权他可以控制电脑了。

今天凌晨, openai 正式发布了它的 computer use, 你 可以通过 codex 去操作你电脑当中的任何的 app。 这期视频带你从三个案例去看看这个产品到底体验怎么样,以及如果你想使用的话可以怎么去安装。 我们先讲一个我觉得对我自己帮助最大的一个使用场景,我最近做了一个项目,是关于 ai 人物知识图谱的,我把各国家各公司的一些重要的 ai 人物放到了一张图当中 啊,通过这个图来表示它们之间的关系,让我可以快速的学习。那我这个时候就可以让 computer use 帮我去看看我这个产品设计有哪些可以在体验上优化的地方。它就可以直接的去阅读我的这个网页,重点去看它的信息架构、流畅度 和体验上面有哪些可以改进的地方。你可以看到它已经开始操作了,它会根据它的理解 去做一些体验测试,比如说他这里刚刚发现了搜索和筛选的联动是有效的,他还会再根据他的理解做一些更多的探索。这里需要强调的一点就是 右边的这个卡片的所有的操作其实都是 codex 进行操作的,我完全没有介入。大概思考了有五分钟左右,他最终给到了我五条建议。他给我的五条建议是按优先级高低去排的,那第一条是告诉我建议把首页先聚焦再展开, 不要一下摊开数据比较杂乱。第二条建议是告诉我要给图谱去加选中泰,让点击有明确的反馈,以及告诉我需要有些兜底的文案等等。我觉得这些建议都是有道理的,言之有物的, 虽然之前其实通过 agent browser 其他的插件也可以去完成这个工作,但我觉得现在 computer use 的 优势是它会比较的格式化,你是能够直接看到它有操作哪些部分,还有没有操作哪些部分是很直观的。 我们再看一个案例,我平常有使用推特去跟踪一些 ai 的 公司最新新闻的一个习惯,我这次让他去帮我去看一下最近二十四小时内这些公司有发哪些最新的推文,整理好发给我。 它一开始是操作错了的,它是用这个 agent browser, 就 我之前装的这个 scale 去完成,不是用的这个 computer use 去完成的,所以我在这里打断它了,也是同样请求我的授权。也可以看到右边这里又出现了它的这个标志性的一个光标,帮我打开了推特, 然后成功找到了我的 ai 机构的列表,是顺着这个时间线往下翻,按照我的要求 把二十四小时的帖子全都抓出来,他也是可以用这个光标去滑动的,每翻一页他会判断是不是还在二十四小时以内。大概翻了五分钟左右,就把所有的这些帖子根据不同的机构给我整理出来了。 看一个帮忙发微信那个场景,我是收到了一个微信,是我在撸猫的一个照片,我让他帮我回复一下,他是先请求我授权他使用这个微信,然后根据这个照片帮我理定了一个很不错的一个回复,我批准同意之后, 他就开始去操作发布,可以看到右边这里出现了一个 codex 的 小的光标,顺利代替我发布。 肯定有人好奇 computer use 费不费 talk, 那 我们这里是把三个案例的呃消耗都统计在这里了。 我们是 cortex plus 的 会员,使用的是 gpt 五点四 high 的 模式,可以看到这三个案例消耗的 talk 量分别是五小时用量的百分之三、百分之十三和百分之十六,也就是说五小时用量大概也只够你跑 五六个省略 ai 图谱这样子的一个项目的量。同时他花费的时间也统计在这里了,大家可以去看一下。特别是像发送微信这样的任务,他花一分钟二十秒,这样的时间肯定是不可用的,因为还不如我自己去发呢。 computer use 的 安装方式也很简单,打开 context, 这在这里选择插件,然后筛选到 open ai button, 然后找到这个 computer use, 添加到 context, 点击安装就已经安装好了。 最后简单讲一下这 computer use 的 一个实现的原理,那 computer use 其实本质上是一个桌面的自动化层, 它不是跟其他的产品一样是直接通过 api 去操作,而是分三步先感知当前的窗口,它可以通过截图来看到当前窗口有哪些东西,通过这个元素去判断哪些东西能操作,最后去执行原子化的动作。 所以他的操作跟你去操作其实是一模一样的,所以他会有一些风险,比如说所有你看到的这些信息,他有可能都会被截图交给模型,以及你如果已经登录了一个账号之后这个账号,那可能会被 误操作,以及有些敏感信息还是需要注意的。虽然其实 computer use 目前肯定还是有各种各样的问题,比如说它的耗时是比较长的, 它有的时候的操作也不是很稳定,就像它在操作我微信的时候,是没办法直接在微信框内输入,是要通过调用剪贴板去复制粘贴的, 那有时候他可能也不能稳定的去被正确的调用等等,这些都是他目前存在的问题。但是我觉得这个方向是对的,因为他其实打开了一种新的人和电脑的交互方式, 也许未来真的有一天,呃,我们再也不用鼠标和键盘去操作电脑了,所有的机器跟我们都是自然语言的交互了。那这天的到来一定是会非常的有意思的。我是离谱关注我,获取更多一手的 ai 的 实践和思考,我们下期见。

哎呦,又见面了,朋友们,今天我们来聊一下用 ai 来控制你整个电脑这件事情的最新进展。因为啊,这个 cloud code 和 codex 呢,在最近这一两个月时间,相距推出了他们各自的解决方案,我实际使用下来呢,效果很不错, 之前爆火的龙虾 oppo pro 能够操作我们整个电脑对吧?但说实话,用过的人都知道这个东西吧,稳定性不是很好, 而现在呢,情况完全不一样了,这两家提出的方案的稳定性比龙虾强太多了。但是呢,这两家本身他们的解决方案呢,也有很多的不同,他们的优势劣势非常明显, 所以本期视频我们来做一个全方位的对比,同时我会简单的跟你说一下,哎,这两个方案如何安装,还有一些技术的原理,到最后你就会知道,哎,你该选哪个呢?作为你日常使用的工具,更重要的是,我会教你如何来同时的使用这两个完全不同的方案。 来吧,这里是乾坤下一站,一个用通俗易懂的方式来讲解如何用 ai 来提效的频道。点好关注,赞,我们开始。 好,我们先直接演示一下用 cloud code 和 codex 来操作你电脑的效果。 意思的是啊,这两家做的方案的名字呢,都叫做 computer use, 而且呢,你都可以在你自己电脑终端和他们各自的桌面客户端来用。接下来的操作呢,我们呢,主要在终端里面来操作。 好,我们先在这个终端打开 cloud code, 你 看我让 cloud code 打开我自己电脑上的日历,然后呢,在周六创建一个全天世界,标题就是周六出去玩, 我们输入指令,此时你看我的电脑在这个上面,对吧?然后呢,指令发出去之后,好,你看他打开了我的日历,然后呢,你看啊,我的鼠标自动的被移到了,这个下周六看到了吗?他自动的就被移过去了,他抢了我的鼠标, 然后呢,他自己呢?点击设置周六出去玩,你看他现在在输入周六出去玩。 好,你看这边,周六出去玩已经建好了,没有问题吧?好,我们现在来到 codex 这边啊, 同样的任务呢,我们现在在下周日,哎,我们创建一个全天的事件,叫做周日出去玩。你看这个指令发出去之后呢?你看,哎,他也打开了我的日历,然后你注意看,我自己这边有一个自己的鼠标,对吧? 但是呢,他那边有一个白色的小鼠标,你看到没有?我自己的鼠标和他的白色小鼠标呢,这两个是不冲突的,你看我自己鼠标呢,想干嘛干嘛,他那边呢自己在操作,这两个完全不冲突, 然后你看他各种点来点去,最后你看啊,这个周日出去玩,他也弄好了,好演示呢,我们就先看到这里,看起来都很丝滑,但是他们的差别很大,具体怎么安装呢?你看我这个视频的图吧,接下来我要做一个深度的对比, 不过在我聊这个具体的对比之前啊,我想先花一点时间来通俗的讲一下这两个工具它们各自实现的核心原理是什么,这样你后面听我说对比的时候,你才能够真正的理解。哎,它们为什么呢?会有这些差别? cloud code 的 方式呢?你可以想象成就是一个人,他坐在你电脑的前面,他看不到底层代码,他就只能看屏幕,怎么看呢?截屏 具体的流程是这样子的啊,你看这边他是怎么一步步操作的,他就是先打开了一个应用,对吧?然后呢,哎,先截个图,截完图之后呢,哎,他会发给模型去分析这个屏幕上有什么,我要点哪个按钮,在哪个坐标,各种分析。分析完之后呢,他就会操作鼠标或去点击, 点击完之后呢,他再截个图,确定结果对不对。截完图之后,哎,再分析,分析完之后再点击,就这样截图分析,采取行动,一直这样循环下去 好。而 codex 这边呢,就完全不一样了,它是利用了苹果电脑自带的一套系统,叫做无障碍数 a s tree。 这个东西呢,本来是苹果公司给盲人那些视障用户做的,就是让屏幕阅读器呢,哎,知道现在界面上有哪些元素, 然后呢,这个屏幕阅读器呢,就会把这些信息啊,给读给那些试驾用户。而 codex 的 工程团队发现这套系统 ai 也能用, 所以你看啊,这个 codex 的 操作过程是怎么样子的?他一开始呢,先获取了桌面应用的结构化数据,就是每个按钮呢,叫什么,在什么位置,什么状态都一清二楚。他分析完之后呢,他就会直接告诉系统,哎,我要点这个按钮,然后呢,系统呢,就会帮他去做手机。 当然了,他也有这个截屏降级的功能,就是 a x 区读不到的时候呢,他就会退回这个截屏的模式,但是那个只是备选方案,主力还是使用这个无障碍数好。原理就这么简单,一个呢靠看,一个呢靠读。 那么紧接着我就来说一下这两种不同的解决方案,在实际使用中会有哪些差距? 第一个最直观的区别啊, cloud code 会抢你的鼠标,而 codex 不 会, 为什么呢?就是因为这个 cloud code, 它就是很真实的来操作你的鼠标,来做这个点击啊等一些的行为。而 codex 呢,是直接向系统发指令,它甚至不需要把这个目标窗口放在前台。所以呢,你在前台正常的操作电脑,它呢在后台呢帮你干活,两个之间呢互不影响。 哎,这就让我想到了当时的 madison 团队呢,最早呢,哎,他们想做一个 ai 浏览器,然后他们也遇到了同样的问题,他们觉得 ai 在 用你的浏览器的时候呢,你自己呢,就用不了了,所以他们最后选择把一切操作都放在一个独立的虚拟机里面。 而现在呢,这个 cloud code 的 computer use 目前呢,就有这个问题,它抢你电脑的使用权,除非你专门留一个时间,比如说晚上睡觉的时候呢,哎,你让它慢慢的跑, ok, 我 们再来说说它们其他的区别啊。简单来说,因为 cloud code, 它每走一步呢,都要走完这个一整套的视觉分析的流程。 而 codex 呢,直接读取了这个系统结构化的文本数据,它跳过了整个视觉处理的环节。这就直接导致了下面这个后果,就是 clockcode 相比于 codex, 第一它速度更慢,第二它价格更贵。你想啊,它每一步都要截屏去分析图片,对吧?而图片呢,会占据大量的 token, 所以 同样的任务, codex 的 token 的 消耗量呢,大约只有 clock code 的 四分之一, 第三,它精准度会更差,因为 cloud code 靠截屏算坐标来点击,对吧?而在一些高分辨率的屏幕上,它的按钮呢,是很小的,就是你差几个像素又有可能会点歪了。 而 codex 通过这个无障碍数,它就是指哪打哪,基本不会出错。更重要的是, cloud code 它不能同时的去处理多个任务,因为你想啊, cloud code 要截屏吗?而且你只有一个真实的鼠标,对吧? 而 codex 呢,是可以同时开好几个任务的,它们每个呢都有自己的虚拟的光标,各干各的,互不影响。 听到这里,你是不是觉得,哎,这个 cloud code 拉完了,直接用 codex 得了。但是我跟你说不是的,它有自己的独特优势,有些地方比 codex 好, 而且长期来说,我反而更看好 cloud code 的 方案。 cloud code 碾压 codex 的 地方就是通用性,因为它是靠截屏来理解你电脑界面的,对吧?所以不管你是什么系统,你是 mac, 你 是 windows, 你 甚至是远程的桌面,只要有屏幕能截图欸,它就能操作。 而 codex 的 computer use 呢,目前呢,只支持 macos, 因为它非常的依赖这个 macos 那 个无障碍数系统,所以现在 windows 用户呢,还用不了。而且呢,你如果在欧洲,因为这个隐私合规的问题, codex 的 整个 computer use 的 功能呢,都被直接封掉了。 更重要的是,这个局限性还不只是平台,因为即使是你在 macos 里面呢,也不是所有的应用都有完整的无障碍数的信息, 比如说一些游戏的界面,一些飞格玛画布里面的元素,还有一些奇奇怪怪的应用,它们在这个无障碍数里面就是一片空白。 这个时候, codex 呢,确实有降级的机制,他会退回到这个屏幕截图加点击这个方案,但是问题是,这个降级的模式的精确度和效率就差很多了。 而截屏识别这件事情呢,恰恰是 cloud code 的 主场,它整个框架都是围绕着这个视觉理解来设计的,所以说在这些非标准的界面应用里面, cloud code 反而更加的靠谱。说到这里呢,让我想到了这个自动驾驶领域的两套方案, 就是说特斯拉呢,坚持用纯视觉,就是摄像头,看到什么呢,它就根据什么来开,这就很像我们真人开车对吧? 而另一派呢,是用激光雷达,就是他们靠发射光束去扫描周围环境的三维结构。你有没有发现, cloud code 的 截屏识别本质上就是纯视觉的方案,它就是在模拟真人用电脑的方式。 我们人类操作桌面的时候,不就是眼睛看到什么地方就点什么地方吗?而 codex 呢,更像是激光雷达,它不看画面,而是读取底层的结构化数据。 你想想,从这个第一性原理的角度, cloud code 的 方式呢,更加的接近于通用智能的本质。理论上,只要它的模型越来越强,推理越来越快,它的上限是没有天花板的。而 codex 呢,就只能在一些标准化的情境中使用,但凡有一些额外的场景, codex 就 不行了。 所以说,从长期的潜力上来看,我更看好 cloud code 的 这条路。但是目前来说,这套操作电脑的解决方案呢,我更愿意用 codex, 可是呢,我一直是 cloud code 的 忠实粉丝,它整体的 agent 的 能力呢,我用起来更舒服。 那问题来了,有没有一种方案可以让 cloud code 作为总指挥来自动地使用 codex 的 computer use 的 能力呢?有, 答案,就是让 cloud code 去调用 codex 的 命令行。简单来说, codex 有 一个无交互模式,就是你不需要打开和 codex 的 交互页面,你直接的终端输入命令就行了。然后呢, codex 呢,就可以在后台来自己默默地执行任务, 而输入命令这件事情呢,我们可以让 cloud code 来做,对吧?比如说,你看这里啊,我现在在 cloud code 这边,我跟 cloud code 说,让它运行这个命令,其实就是让 codeys 用 computer use 来打开我的计算器,然后呢输入一加一,然后呢把结果告诉我, 我直接输入,你看它会发生什么啊?哎,你看它这边有一个白色的小光标,自己在操作我的计算器, 过一段时间,你看我左边终端里面啊,克拉克说,哎,这个 codex 完成了任务,它通过这个 computer use 打开了计算器,然后呢点击一加一,然后呢,结果是二,怎么样?是不是很丝滑? 而这个命令里面有很多的参数对吧?具体每一个是什么意思,有什么坑要注意。还有它的官方文档的链接呢,我都整理在我的视频的图文版里面了,你去看就行了。 我再多说一句,如果说呢,你要想在 codex 里面要用 cloud code 的 computer use 的 能力,可不可以呢?也可以,因为 cloud code 呢,它也有一个无交互模式,这个呢,你自己去探索一下。 看完上面的对比呢,到底用哪种方案,我相信你心里已经有数了,我在这个视频图文版里面呢,做了一个详细的快速查找表,你可以按照你的设备和需求直接对号入座。好了,今天就说到这里,我们下期见。

你安装的 code 叉是不是也这样?没有 open ai 的 账号就不能正常使用?本视频教你,没有国外的 open ai 账号也能正常使用 code 叉。这里我们打开电脑上自带的这个微软应用商店,然后在这里搜索 code 叉,搜索之后,这里的话我们选选择这一个图标的, 然后这里是已经安装好的,所以它显示打开没有安的话,我们点击获取,等它安装结束即可。安装结束之后呢,我们点击这里, 然后找到这个 code 叉,然后这个 code 叉它默认的话是使用呃 open a a 的 账号来进行登录,我们在国内没办法正常使用,所以的话我们先不要打开它,我们去到这个 来到这个 c c switch 的 啊界面之后呢,我们选择这里点击一下,然后等它来到这里之后,我们直接划到这个页面最底下, 这里我们根据自己的电脑系统的版本来进行下载即可。 windows 的 话我们就直接下载这一个,然后这里是因为已经下载过了,所以我就不点击下载了。然后还有我们也要如果是 mini max 的 大模型,大模型的话我们就选择下载,把这个也下载下来, 然后这里我也是已经下载,我们就点击这里下载就好。这里我已经下载好了,我们就不继续下载了。下载之后的话,我们就直接去这边打开吧这里然后这个是 c c switch 的 开源项目,我们直接双击运行它, 我们就直接点击下一步,然后这里是让我们去选择这个安装路径,这里的话我把它安装在 c 盘,安装在 d 盘吧, 我直接点击安装,点击下一步,然后这里直接点击安装,然后这里就等它安装结束,这里我们把这个勾选去掉,然后点击结束,结束之后这个 这个我们 mini max 的是使用 mini max 大 模型才才用到的,如果不是 mini max 大 模型的话,需要去选择其他的,可以自己去找相应的开源项目,这里我就直接把它解压, 这里剪下之后的话,我们直接在这里,然后打开这个,这里它有需要你安装的,然后我们本地的话是需要安装这个 node js, 这个的话可以看我上一期的视频去安装,然后这里的话我们就直接把这个命令复制一下, 然后我们点击这里,我们直接输入 cmd, 然后回车,在弹出这个页面里,我们直接复制粘贴一下,然后回车。好,它现在已经在安开始安装依赖了,然后我们这里就会多了一个文件夹, ok, 它显示已经安装,音量已经结束。好,我们现在就把它这个点给关闭掉,然后我们点击这个,我们点击运行这里,运行到这里的话我们就不用管,然后我们就打开我们的安装的那个 cs 微棋, 这个是我们安装 cs 微棋的这个图标,我们直接双击它, 然后这里你如果是第一次使用的话,那默认是这里,然后我们要选择这一个,这里我还是,虽然我已经重新安装了,但是因为之前我是安装过的,所以我这边已经是已经配置好的, 如果是第一次使用的话,我们是需要点击,我直接把这个删掉吧,这个删掉先启动下这个,把这个给删掉。 好,我们现在来重新配置一下,这里的话我们选择这里的 open a, 然后之后我们点击这里的加号,这里我们供应商这些我们就不用管,这里我们就随便填我这里我就填这个 mini max 吧,因为我自己用的是这个模型,然后这里的 api key 我 们也是随便填 这里的请求地址,请求地址的话我们就是把这个运行在这里这里给复制一下,然后把它粘贴到这里来, 这里的话我们模型的话我们选择这里都复制一下 往下滑,这里我们是一定要勾选上,勾选上之后我们就直接点击添加啊,我们现在这里已经添加,然后进这里的话,我们点击这个启动, ok, 已经切换了,那这里我们可以进行测试,这里测试应该是会报错的,因为这里我们还没有填这个东西,就我们还是去到这个 这里,这里面我们是需要把这个配置文件,这个我们先复制一份, 然后把这里给改掉啊,这里的话我们把后面这里给去掉, 我们点击四啊,这里我们一定是要这个点 e n v 的 这样子的格式,然后之后我们点击用我们的这个记事本打开,打开之后的话,这个是我要这里要填入你自己的 mini mag 那 个 api key, 然后每个人我们可以自己去获取一下就行了,那这里有因为 api key 比较私密,所以的话 我就不让大家看到了,把它删掉,然后我去把我的给粘贴过来复制一下 啊,然后这里我已经把这个秘钥给配进去了,配进去之后呢,我们这个界面还是要关闭重启一下, 就这个这个界面,我们直接把它给关闭掉,然后我们就点击这个双击一下,等它启动起来,点击运行,因为它现在已经启动起来了。启动起来之后呢,我们这里再点击一下这个测试, 因为他现在表表示已经正常能正常使用了。然后呢正常能正常使用之后,我们就可以把它给擦掉了。然后现在我们再打开我们的这个 color 叉,然后我现在问一下他,你的 他现在已经回复我了,然后其实他这个回复呢也是在这里会看到的。 然后最后界面我们是不能关闭的,不然关闭的话我们这个 qq 叉就不能正常使用了。我的这个 qq 叉默认的话是其实我们安装的时候它默认都是英文的,然后我们要如果要改变这个,呃四 plus, 我 们就选择这个 setting, 然后找到这里,就这里的我们直接找到往下滑这里我们把它改成中文就行了,这样子我们的 control 它就能正常的使用了。

codex 最近更新了新功能,它现在可以直接操控你的 chrome 浏览器了。对比 computer use, 它不会抢你的鼠标,因为它是在后台运行的。配置只要四步。第一步,先更新 codex, 点击设置,点击电脑操控,安装着 chrome 插件, 好点击打开,添加扩展程序,这样就配置好了。在用的时候记得要输入杠 prom, 再加上你的问题,他就在后台帮你操作你的浏览器工作了,同时还能开好几个标签页并行地去跑任务。我让他帮我整理一下我的 note 库,他目前已经在开始工作了。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

这是一条 codex 技术求助的一个视频,五月十四号官方有一个最新版本的更新,然后新版本上有一个手机可以控制电脑的那个图形化 app 的 功能,然后呢,我这边用的是 mac 的 图形化的 codex 界面,但是我用的第三方的 api 接口,这我实话说我就为了省钱啊,确实也帮我省了不少钱, 所以可能是因为我没有买他的会员,所以他没有给我开放这方面功能啊,就你们有没有这个彦祖或者是逸飞啊,你们买了那个会员的啊,你们有没有 扣代斯手机控制的这个功能,然后有没有用过?对,可以跟我分享一下,因为我在犹豫啊,是不是我需要我再专门花一笔钱去测试这个东西,因为我现在的解决办法是之前有个小姐姐 啊,给我的建议用那个向日葵同手机操控电脑啊,也能也好使啊,也好使,只不过呢,手机上面操作还是有一点点别扭点,各种画面的操作啊,拖拉出来都是不是特别方便的。 对,他如果有一个手机版的话,就有一些我手机上的素材就可以直接传了啊,就不用再倒腾好几次啊,这块的,有没有这个有经验的兄弟对吧?已经开始玩的啊,跟我们分享一下。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

程序员注意,现在手机也支持 codex 了,但重点不是让你在手机上写代码,真正重要的是,你可以随时随地控制电脑上的 codex。 以前 codex 跑到一半问你要不要继续,要不要执行命令,你人不在任务就停住。 现在你在手机上就能看进度,批操作、改方向。过去的 ai 编程工作流有一个很大的问题,人必须跟着 agent 的 节奏走。 他问你要不要继续,你不在,他停,他问方案选 a 还是 b, 你 不回,他停,他要执行测试或者高风险命令,你没批准,他还是停, 这不是能力问题,是协助半径太短。 agent 很 强,但他被锁在电脑前。 openai, 把 codex 放进 chat gpt 手机 app, 但重点不是在手机上跑代码, 真正干活的还是你的 mac、 mac mini、 devbox 或者远程开发机。手机只负责看批改方向,文件、凭证、权限都还留在原来的机器上。这件事真正改变的是 agent 工作方式。 以前你在陪 agent 跑,现在是 agent 跟着你的节奏跑。你在地铁上可以看他跑到哪一步,你在开会时可以审一眼 diff, 你 在吃饭时可以批准他继续测试。你在路上发现方向错了,可以直接打一行字让他改。 你看官方信息里真正关键的表述,在 chat gpt 移动应用中开始新工作,查看输出结果,控制执行进度并批准后续步骤。 这句话的重点不是移动端,而是控制执行进度和批准后续步骤。也就是说,手机端承担的是 agent 工作流理的控制面,而不是代码运行面。具体怎么用?第一步,电脑上先跑 codex, 目前主要支持 macos、 windows, 还要等。 第二步,手机更新 chat gpt app, ios 和安卓都已经有 preview。 第三步,在 chat gpt 里打开 codex, 你 就能看到正在跑的任务线程。 第四步,在手机上看 beef, 看测试结果,回复新指令,批准高风险操作,甚至新建任务,继续跑。 这次更新不是让程序员在手机上写完整项目,他更像是给你的 ai 程序员加了一个随身遥控器,你不用把文件凭证、开发环境搬到手机上,你只需要在他需要判断、批准和纠篇的时候能立刻出现。 所以这次更新不是 codex 多了个手机版,而是你的 ai 程序员终于有了一个随身遥控器。对程序员来说,这比手机写代码重要得多。因为真正的效率提升不是你在哪里敲字,而是 agent 卡住的时候,你能不能立刻让他继续往前跑。

codex 的 windows 版也支持电脑操控这个插件了,具体怎么用,效果到底怎么样?这期我直接用真实任务测试给你看,我会让 codex 丝滑的操控电脑,打开软件做 word, 最后把文件发到我的微信。 第一步,先进入 codex 设置,找到电脑操控,打开这个权限。这里要注意,它不是指控制浏览器,而是可以连接 windows 上的真实应用 权限。打开以后,回到 codex, 我 直接给他发布任务,把 opencloud 的 安装流程整理出来,生成文本和流程图,再发送到微信。文件传输助手你看这里, codex 开始连接 windows 应用, 他不是单纯回复一段文字,而是在后台生成文件,检查内容,准备发送。接着我又加了一个更真实的任务,让他做一份 openclaw 和 hermes agent 的 对比 word, 然后同样发到微信。 这里有个细节很关键,他发现系统里没有 liboffice, 没有硬说自己渲染成功,而是换成检查 docx 结构,确认文档内容和表格都能正常读取。 这就不是会点鼠标这么简单了,它已经开始像一个真正的 agent 一 样,遇到问题会换验证方式。 然后它打开微信,搜索文件传输助手,进入文件选择窗口,选择刚刚生成的 word 安装文本和流程图,最后点击发送。你看结果 word 文件已经发到微信了,安装流程文本和流程图也一起发出去了。 所以这次测试下来,我最明显的感受是, codex 不 只是更会聊天了,而是开始能跨应用做事了。

在你使用 qqcode 或者 codex 的 时候,如果你想省钱,那么有一件最关键的事就是你要把 session 控制的尽量短,能用单轮绘画的就不要用多轮绘画,能用较短的多轮绘画完成的任务就不要用较长的多轮绘画。 因为多轮绘画的运行机制是,你每发送一个多轮的请求,它是会把之前所有的轮次的请求和在一起打包发给模型的,这样它才能够保持住自己的 context。 也就是说,如果这个多轮绘画现在是第三轮,你在发第三轮的请求的时候,实际你消耗的头肯是第一轮加第二轮加第三轮,所以这个绘画变得越长,你的成本会是平方级上升的 啊。所以如果你想省钱,你就记得要尽量的用短 session, 要尽量的用单轮会花。当然,如果你有一个傻老板或者傻投资人,他特别喜欢看你每周消耗 token 这个指标的话,那你就把所有的一周的东西都合在一个场的 session 里面,这样你就可以非常轻松的完成这个任务。

最近用 ai 编程工具 codex 进行嵌入式开发,发现还挺好用的。这里我的项目是需要将一个电机的 stm 三二整套代码转化成嵌入式 linux 的 qt 代码,并且生成 qt 程序,运行在 linux 开发板上,实现屏幕操作、电机和交互的功能。 这里 linux 开发板使用的是 iimx 九三开发板,电机是带驱动板的四二部进电机,暂时使用数字电源供电。通讯接口是 r s 四八五接口。开发板上有两路,我先只用一路搭建好的硬件,演示效果大概就是这样。 这里还有一个十点一寸的 m p 屏幕 q t 界面,程序会在这里显示。 我们在 vsco 的 软件中打开 stm 三二代码,打开 codex 对 话框。我之前就配置好 codex 了,这里直接使用。我们只需要把项目需求细节告诉 codex。 这里我的提示词是现在这份是正点原子 p d 四二 s 一 部进电机 f o c 闭环驱动器在 stm 三二单片机的 r s 四八五通信综合原码。参考此原码帮我生成 qt 综合应用程序。 qt 版本是六点五, 要有虚拟键盘功能来实现参数调整。最终我只需要执行 mac 翻译后生成程序。我将会把程序放在 imx 九三开发板上运行用的屏幕是十点一寸八百乘一二八零分辨率的竖屏,开发板对应的 rs 四八五接口是 david ttylpc。 然后 codex 就 会根据我们的提示词进行自动编码,我们等待编码完成就行,整个过程十五分钟左右。视频这里剪辑快进 ai, 第一步是读取我们提供的原码,第二步是生成我们需要的原码, 看下 ai 写的代码风格还是挺标准的,比主包写的好太多了。第三步是编写翻译文件,我在输入提示词的时候说明了翻译需求。 第四步是原码自检和校准,现在我们将 ai 原码拷贝到乌班图系统, 只能交叉翻译器 执行 make 指令进行翻译。 翻译成功生成开发版可执行的二进制文件。 将可执行文件拷贝到开发版上, 关闭开发版原有的桌面显示, 赋予可执行文件权限。 执行程序。 程序界面效果展示、 电机运转效果测试、 电机正转、 电机反转、 电机转速调整、 电机控制配置界面有输入键盘,可以进行参数自定义。电机状态界面, 电机运行时,在这里可以看到电机状态参数、 电机参数面板回零设置界面、电机预制界面。整个程序还是挺全面的,就分享到这里吧,后续有好玩的项目再分享。

哈喽,大家好,我是李二,今天是二零二六年五月二十七日,今天呢跟大家去汇报两件事情。第一件事情呢,就是我今天把 comix 装好了,然后在我自己的那个 mac 电脑上面是目前配置还行,然后我今晚回家之后在家里面 配我这个,就我自己的主机,就是 win 的 系统的时候,我会发现两边确实不太好去共通,因为我一个是 win 系统,一个是 mac 系统,它本身两边的灰度可能也不太一样, 那更带更多的是本地的这个文件,那也许在 chat g p 上面肯定是没问题,但是如果是调用本地的话,两边可能在数据上面就没有办法去做同步。然后关于这个呢,我考虑了之后,就是我后续应该 会先以我的 mac 电脑去为主,因为本身它更适用于这个软件。然后另外一个,因为我除了下班回家之外,其他的时间其实是在高强度使用我的办公本,那因此呢,我后续应该会侧重于使用那个, 然后我今天晚上回来之后就在家里面去看关于怎么去用这个东西,有哪些比较好的一些,不管是 skills 技能也好啊,或者是对应的一些内容。其实我看了半天之后,我还是会想到今天晚上那个学弟跟我讲的就是 其实可以给他一个规则,就是相当于一个大的 point, 就是 告诉他你的角色是什么样子,我给他限定他的各种规则,然后我去看了一下 小红书上面,然后包括 b 站上面,我去搜了一下,其实也有呃,陆陆续续不同角色的人呢,就是给出来他们自己的这样的一个 a j 的 markdown。 然后我这几天呢,应该会优先考虑把这个事情给整一下,就是 我到底想让他在我的某几个文档当中,他以什么样的一个角色,他以什么样的一个身份,然后用什么样的一种规则或者规律去跟我进行交流,然后他要去帮我去记住或者说分析出来哪些东西, 然后并且把哪些板块的内容要帮我去保存到本地。这个确实是我会在这段时间着重去制定的一个板块,因为本身我使用它是更想让它来去打磨我自己, 然后把它变成我自己的一个,怎么说呢?变成另外的一个我吧,然后是一个数据化的,所以我在这种程度上呢,我会选择更多的是更倾向于 一些关于人性或者说他自己的本身的回答,然后包括他所不能干的事情,以及他能干的事情,以及他需要向我去寻得授权或者是暴露出来的东西,包括我自己没有意识到的我自身的问题,他要去直接帮我指出,我大概是这样想的。 然后另外一个呢,另外一件事情就是我刚才看了一下,今天已经五月二十七号了 啊,然后这周应该还有两天时间就要结束了,就本月明天呢是大 a 的 正常的这个黑暗星期四, 我看了一下本月白玩相当于白玩,而且因为本月的白玩会导致我似乎我整体的这个收益相当于今年到现在都相当于是白玩,我完完全全的。我今天看了一下我的美股,有些持仓已经收益高的可能已经有百分之四十了, 然后但是因为我每股持仓的比例没有那么高,每股可能目前投进去可能是不到三成,然后我的大 a 占比是比较高的,所以就导致两边疯狂对冲,帮我冲完了,基本上 其实就相当于就是白干,所以我会考虑再看明天或者后天整体的一个盘的情况吧, 如果有能够去赚的小赚或者这些的,我会优先考虑先把它给清了出来,把资金留出来。我因为我感觉可能在六月份市场上可能会迎来一次比较大的 调整,这次调整的可能是资金的高切高切低也有可能是对应的主线的转换那而且大家都知道六月份其实对应的不管是长新的上市也好, 就是它的 ipo 也好,还是我们现在大家看到外盘已经今天晚上我看外盘这个 spacex 就是 商业航天也已经开始动了,然后包括前两天美光这个暴涨,涨百分之二十, 然后今天晚上我看它目前是跌的,那也许到下个月的时候,它会切到什么样的板块上去呢?谁知道呢?也许会切创新药, 也许会切到商业航天,谁也不知道,但是我选择的是我先要把我的仓位给控制出来,那以便于我在六月份去调整好,让自己有比较充足的子弹, 当然因为我有很大的一部分的仓位是在红利里面,所以呢,这个本身它也是一个可以灵活去变动的资金。那以上呢,就是今天的视频日记,大家拜拜。