粉丝2.6万获赞10.2万

大家好,我是郑一环,今天我们来看一下 codex 的 插件功能插件,它本质上就是一个工作流扩展工具, 它能够让 codex 连接外部工具和服务,从而大幅扩展 codex 的 能力。今天我们要讲的 codex 插件是 kanva, 就是 那个非常强大的在线设计平台。现在我们很多人都在用 ai 来生成图片, 但用 ai 生成的图片大多会遇到一个问题,那就是你真的没有办法生成一个百分之百满意的图片,可能是图片上的文字错了,排版错了, 这些你都是无法单独修改的,只能重新再生成一张。但是有了 java 插件,我们就可以直接编辑图片里面的文字图形元素, 就能够真正做到所见即所得。所以有时候我们就可以通过 image 二点零加 camera 这种组合去生成我们想要的图片。我们来看一个视例,首先我们需要在 codex 上找一线插件, 就是左上角这个按钮,你点进去,你在这里面就能看到各种各样的插件。因为现在我们要用 come on, 所以 我们现在就找一下 come on, 就 在这里。首先你点击这个,然后进行安装插件安装完之后,通常来讲是需要你登录授权一下的, 所以你也需要有一个 come on 账号,然后你给他完成登录授权就可以。 下面我们来生成一个图片,并且用开码来修改一个图片,在这个像不像我们新开一个聊天窗口,现在的话我们有一个电文拍的照片,这个是原图,我们让他给我们生成一个海报图, 把这个图片上传,然后我们让 codex 帮我们生成一张图片,生成电商海报图。 codex 现在已经把图片生成了,我们先来看一下效果怎么样,如果你觉得这个图片有需要修改的地方,这个时候我们就可以通过看码来进行操作,我们来演示一下, 首先我们要艾特看码, 然后跟他说把上面的图片变成可编辑模式,这里我们点击允许就可以。现在 codex 已经把 come 的 链接发给我们了,一个是查看的链接,另外一个是编辑图片的链接,现在我们就进入了 come 的 界面, 进去之后我们就会发现开满已经把这张图片进行了拆分,他会把文字了、图形了等等各个方面给我们拍成了可编辑的状态。 例如这个地方我们可以让我来调整它的大小,同时的话这块文字我们也能来自己进行修改,例如我们可以修改里面的文字 这个地方,同时下面的这些文字我们也可以单独对他来进行修改啊,来移动里面的每一个元素来进行修改图片你也可以再添加一些文字或其他元素, 就是简单来说的话,就现在这个图片就完全变成了可编辑的模式,每一部分都可以轻松进行编辑。同时呢,有些细心的小伙伴也发现了,进来之后有些字体好像跟原来不一样了,因为他现在字体这现在已经感觉有点乱码的意思了。 这是因为他把图片转成可编辑功能的时候,他会尽力把文字、图形、背景各个元素 拆成可编辑的图层,但是呢,他并不是百分之百完美的,你进入到 come 之后,可以手动进行微调,等图片修改成自己满意的状态之后,你点击校 啊,再点击登录的就能把这张图片下载。以上就是 ai 生图加 come 修图的一个大致流程,在使用之前呢,还有几点需要提前知道的。首先呢,就是说如果 come 找不到字体,他会替换一个相近的字体。 还有就是对于比较复杂的设计来说,他的分层效果可能不是很完美。另外一个问题,他会导致画质下降,就是你会发现有些元素他变模糊了, 但整体上来说,开发的功能还是非常强大的,我会持续输出 ai 实操干货啊,希望大家给个关注。

codex 加飞书 c i 简直就是王炸组合,如果你的工作场景里面经常要用到飞书,那我真心建议你一定要把飞书接入 codex, 因为我自己本身就是在做自媒体和内容电商,所以我对竞品内容分析有非常大的需求, 但是市面上很多软件和系统都非常的难用,以及我在用 codex 之前,我自己也搭过一个,只不过是用扣子去搭的一个工作流, 非常的困难,拖拖拽拽搞了我非常久的时间,但这一次用 codex 加飞速 c l i 一个小时不到就帮我全部搞定了,给大家看一下,从提需求到他帮我规划只用了两分钟,然后到确定他帮我搭建这一个系统,只用了二十三分钟。 这个是我让 codex 直接用飞速 c l i 搭建好的一个表格,这个程序它是已经写好了,只要我复制小红书链接,它就可以自动帮我拆解标题,还有正文,还有 视频口播的这个脚本。我觉得视频口播的脚本是对我来说最重要的一个部分。 ok, 那 我们现在复制一个链接,让它试试跑着看, 它现在已经自动在跑了,然后已经在处理中,大家可以看一下。好,它不到两分钟就帮我已经拆解出来了, 对,我们来看一下啊,还是非常非常牛逼的。那其实在我搭建完这一个表格之后,它帮我拆解完视频口播脚本这一部分,其实我没有用到任何的 token, 只是一开始让 codex 帮我开发的时候需要消耗一定的 token, 等后面我再用这一套脚本去跑的时候,已经完全不需要任何的 token, 它花费的额度基本上为零。我在扣子上面搭建这样的一个工作流,还需要我付一定的额度。但其实 codex 已经在这一个文件里面写好了,这个脚本 我在跑的时候就完全不需要消耗额度。但是如果要让 ai 基于这一个口播脚本去分析改写的话,就需要接入一定的 token。 如果你感兴趣的话,我下期也会分享我是怎么用豆包或者是 deep sync 接入到这一个程序当中,让它帮我搭建后面的分析和改写。 所以说大家一定要去接触一下 codex 和飞书 c l i。 如果你也对 ai 加电商, ai 加业务落地感兴趣的话,后续呢,我也会持续更新我的一些实际案例,欢迎大家一起交流。

好,今天分享一下。用 codex c o i 接入国产大模型 deep seek, 做了一个接入代理, 主要就是两个接口不一样,一个是 open ai, 它用的是 response api, 然后 deep seek 主要用的是通用的 chat completion api, 所以 主要就是做了这个 bridge。 之前其实已经有很多类似的 bridge 代理了, 比如说 c c switch 或者 codex 加八。但是在一些平台上看到有人说其实可以自己搭,这样主控性更高, 也更不容易信息泄露,然后就尝试自己搭了一个,搭的话其实自己没写代码,直接在网页上问 ai, 让他帮我写,基本上尝试了三四轮就跑通了, 然后看一下运行效果,好直接运行代码文件就在这里, 代理已经启动了。现在主要有两个模型接入进来,一个是小米的,一个是 deep seek, 这个是 deep seek v 四 flash, 我 们来测试一下,比如说今天已经请求了十次试一下, 他直接回答了,用的是 deep seek, 好, 再试一下其他的。 这个是小米大模型,我想问一下, 然后他就直接回答了,之前他不会这样,老是回答会乱说,有时候会说自己是 gpt, 有 时候会说自己是 anthropic 的 模型,直接改一下代码就行, 配置都在代码里,直接在 prompt 里告诉他,你自己如实回答就行,不要冒充其他模型,然后他就会如实告诉你了, 还可以给它加一个搜索引擎,感觉这种大模型更像是一种毛坯房,需要自己加一些其他的功能,感觉更好玩一点。 比如说加了一个搜索引擎,每天都有免费额度可以用, 这个是后台,后台会帮你去搜索,然后有五条结果返回来,这边还会有一个 token 的 用量显示,这些功能都可以自己加。 不过这个统计就不一定准了,你看结果都出来了, 看一下它是不是真的调用成功了。因为刚刚用 deepseek 问了一次,刚才显示是十次,再刷新一下还没出来,再等一会儿, 这边还有日制功能,都是可以自己加的,需要自己加一些其他的功能,加完之后就更好用了。 现在来看一下调用记录,之前是十次,现在变成了十一次,证明 deepsea v 四确实被调用了。

我发现 codex 的 手机连接功能还挺好用的,直接点击这个手机按钮,然后用另一个手机扫它,这个码直接可以连上了,可以看到手机上面包含了这个电脑上全部的这个项目,电脑上有的项目手机上都有, 我随便打开一个对话,这个是我让他去网上帮我收集一些素材,可以看到和电脑上是一样的,然后这个文件也是可以打开的, 这个还挺方便的,你虽然不在电脑边上,但是你也可以直接查看他输出的一个成果,这个还挺方便的,都能看到具体的一个内容。然后我再打开另一个,然后这边是给了他一个口播稿,然后直接让他给我做一个视频, 这边看到他输出了一个视频,我看能不能看。哇,这视频也是可以看的,还挺方便的,这样做的视频这个效果也挺不错的,挺好用的,点赞。

呃,现在就是使用这个 codex 连接这个 solidworks 做一个做一个测试啊,这个时候呢用的那 codex 是 用的是完全访问权限,这个时候要慎重一点。 然后呢这个是一个提示词,左边是 solidworks 的 一个界面。 呃,这个地方的话稍微快进一下。 ok, 这就是它。呃,这里面有一个插件功能, computer use, 相当于 ctrl x 直接控制电脑进行操作。呃,这是它的一个初步的一个建议啊,这是它的一个目标。 呃,这两个相当于是通过酷逮 x 控制 serverworks, 这个是一个接入吧,这个不,不用太管它,这个说明。哎,窗口那个识别到了,窗口识别到了,这个零件也没有什么问题,这个它的一个大概的一个执行计划。然后现在的话呢,就是采用我之前的一个 serverworks 自动化的一个方式进行建模, 这是他的一个准备的一个建模的一个思路。 ok, 这一环的话再给他快进一下, 这个是他写的一个脚本,还有一个大概的一个建模规划。 ok, 现在开始自动化建模了。哦,两个门框,然后它上面的话有一个材料 应该还在继续建模啊,大概就是这样,这个模型目前是比较简单,后续的话可以做的复杂一点, 反正操作特点就是自动吧。 ok, 这是它生成的一些文件。

哈喽,大家好,我是欧哥,做毕业设计的同学应该都懂流程图、架构图、持续图等,手动去画的话一个比一个让人头大, 不会用专业绘图软件,画一个流程图就要折腾大半天,鼠标拖来拖去排了半天,看着还是很乱。以前我们让 ai 画流程图,通常会用模拟的或者直接生成一张图片,但这两个方案都有一个问题,模拟的虽然快,但复杂一点的流程图布局和样式很容易失控。 ai 生成图片看起来可能不错,但后期基本没法编辑。所以这次我们换一种方式,一个更高效的方法, code 加 mcp 加作点 i o, 你 只需要输入一段文字描述,他就能直接帮你控制作点 i o, 自动生成排版整齐、结构完整的流程图。这里面有三个角色, 第一个是 codex, 他 负责理解我们的需求,比如业务流程接口、逻辑代码结构,然后把它拆成清晰的节点和关系。第二个是 next 的 ai 捉点 i o m c p, 它相当于中间的连接器,让 codex 可以 调用捉点 i o 的 能力,而不是只输出一段文本。 第三个是抓点 i o, 他 负责真正把流程图画出来,并且支持我们后续手动编辑,调整布局、修改样式,最后导出成文档或图片。 有很多同学问我 m c p 怎么安装,其实直接和扣带斯说要安装什么 m c p, 他 就会自动帮你全网搜索并安装。 像我这里的提示词下载在 get 上,名叫 next ai 桌 i o 的 m c p。 我 还询问了他能否通过 m c p 控制网页版的桌 i o。 他 接下来也给我解答了,不需要把桌点 i o 桌面软件下载到电脑,下载后我们可以在设置里查看是否安装了 m c p, 点开后我们可以看到桌面是已经安装并打开的状态,那我们就可以进行下一步了。接下来我们做一个实战题目, 这个是某高校的实验报告,我们试试能否解决它,我们来解决实验一里面有三个小问,第一个小问是画流程图,第二个小问是画流程图对应的控制流图,复制粘贴完后在下面说明,通过 m c p 控制 在我打开的浏览器页面版进行。问题一的流程图画作可以添加附加条件,复合条件分解 y 等于七跟 y 等于二十一,分开之后它会自动打开浏览器绘画,我们可以看一下生成的效果,可以看到生成的还不错,不过有些线条需要我们微调一下, 接下来我们复制问题二也是相近的方法,深层控制流图 c f g 之后我们看看效果,可以看到效果也还行,就是排线太直,我个人喜欢弯一点的线条更美观,可以去设置改一下线条,让直的变弯。 好到这里我们就完成了一次完整的演示, 从一段自然语言需求开始,到 callix 理解流程结构,再通过奈斯 ai 捉点 i o m c p 连接捉点 i o, 最后生成一张可以继续编辑调整和导出的流程图。 这套流程最重要的点不是 ai 画了一张图,而是它生成的是一个可编辑、可维护、可交付的图标资产。 所以我觉得限阶段 ai 做流程图比较高效的方式,不是只让他生成模妹的,也不是让他直接生成一张图片,而是让 ai 参与前面的结构梳理和初稿生成,再把最终结果交给作点 i o 这样的专业工具来编辑和交付。 如果你平时需要写技术文档,做项目汇报,整理业务流程,这个组合会非常适合你。这期就到这里,下一期我可以继续演示怎么用这套方法画系统架构图、永盗图或者代码调用链路图。

哎,哈喽,大家好,今天主要讲的这个实操是关于 codex 如何接入啊,短视频去进行自动化的一些短视频流程以及结果。 那我为什么要录这个?因为后台私信会比较多。那我上一段视频演示了一段这个短视频的一些效果啊,通过 codex 自动制作这种短视频,并且给你去命名啊什么的。 嗯,然后这种短视频其实做起来也也非常简单啊,也非常简单, 可以看到就是这些画面或者是镜头都非常高级啊,非常高级。那它有两种方式,第一种呢,就是我们用极梦的这个 cds 二点零的 c l i。 呃,我们只需要打开极梦,打开极梦,在左下角找到 c l i 配配置工具, 然后把这场指令复制,并且发给你的这个 codex, 然后你的 codex 会让你去扫码登录你的极梦账号,它就可以去使用,帮你去操作你的这个极梦了。 呃,然后,呃,最重要的是什么呢?最重要是一个,呃一个教程,因为极梦它本身官方是有很强大的这个这个 cds 二零的这个教程文档的, 你要把那个教程文档也要也要发给你的这个 codex, 这是接入这个极梦 c l i 的 方式,这是其中一个。 然后另一种方式是打开这个火山引擎,那两种方式的区别在于,呃,极梦的 c l i 它适用于我的数量不是很多,并且我能接受排队的,能接受它价格够便宜的, 那火山引擎就是说我最多可以高并发啊,最多可以并发十条火山引擎,其实它有这个 cds 二零的一个呃,对外的一个一个一个售卖的 方案包,那我们只需要在下面购买它对应的这个算力 token 就 可以了。购买之后呢?啊,我们会有后台的一些这种订单,后台这种订单,然后我们在这个呃管理平台,然后在这个在线推里, 嗯,去找到这个 cds 二零,找到这个视觉模型里面 cds 二零,然后在这个地方, 在在这个地方 api 接入这块儿,点击 api 接入,然后我们随便选一个 key, 然后快速接入测试,把这些把这个 key 和快速接入测试里面的这个呃调用方式啊,调用方式复制一下,把 api、 key 跟调用方式都发给你的 codex, 它就可以接入了。然后你就不需要去打开呃极梦或者是在其他地方去去做这个视频生成了啊,直接让它去去生成,然后 codex 本身有非常强大的呃 gpt 一 枚二的这个这个升图能力, 生图能力,有这个生图能力,其实他可以去做模特上身,再把模特上身图再生成这个视频 啊,再帮你做脚本规划,对吧?然后再帮你做粗剪,再帮你发到你的平台上,这些全链路其实都可以,大概就是一套这样的思路啊。

上一期我介绍了 codex, 很多朋友反馈说安装都搞不定,的确, codex、 cloud 这类国外 agent 对 国内不是很友好。那么为了解决大家的问题,我今天给大家带来了一款国内的 codex 平替产品,那就是腾讯的 workbody, 微信连接国内模型中文面板,简直就是专为国内用户打造的一款 ai agent。 安装很简单,直接搜索 workbody, 进入到官网下载就可以了,登录也很简单,扫码就搞定,非常友好。 进来之后看到这个界面跟 codex 长得非常相似,左侧是任务栏,中间是主要聊天的界面。我们先来看看工作模式,总共分了三个选项, craft 是 直接干活模式, plan 是 规划模式,不会修改你的文件。 ask 是 纯粹的聊天模式,一般来说,如果只是简单问问题,那就 ask。 如果要做一些复杂的工作,建议先开 plan 的, 等它完成了再开 craft, 让它干活。另外这里是模型 workbody, 它内置了一堆国产大模型,不会选的建议直接选性价比最高的 deep sick v 四 pro 的 价格便宜。综合能力最强 技能和连接器对应就是 skill 和 mcp 了。这里先不展开权限,这里分默认权限和安全访问权限,看你的文件,一般选择默认就行。 那我们来看看 workbody 最具特色的专家,点进去你会发现里面藏了一百多个垂直专家,内容创作、电商运营、数据分析,基本囊括了大部分工作和行业,还有专家团。你发一个任务,一群 ai 自动分工,产品经理、架构师、工程师一起上, 跑完把结果交交到你手上,你就坐着发布指令就行了。旁边的技能市场打包了很多一键可用的技能包,不用像之前一样自己下载和部署,真的很贴心。而连接器则是放了很多常用的应用 在页面里面,可以一键接入和调用。例如 qq 邮箱,以后让 ai 帮你发邮件,收邮件、整理邮件,一句话的事,我们跑一个例子看一下。我新建一个任务,默认选择日常办公。我把我这个视频的口播稿发给他,调用 hyperframe skill 来帮我做一个动态的视频。 好的,等待几分钟,他已经把这个视频搞完了,我们看一下 还可以吧。看这里,我相信你的 workbody 已经可以开始用起来了。 ai 诊真正的价值从来不是什么前沿技术,而是它能不能把你每天的琐碎的重复的任务完成。 workbody 现在干这些已经足够了, 而且是实实在在的你能用上的那种。如果你在使用 wordbody 上遇到什么困难,你可以评论区告诉我。另外,下期我也会重点给大家分享一下 wordbody 里面的专家模式,让大家工作效率直接提升。我是米咖学长,下期再见!

最近 codex 真的 很火,但是很多人对它的印象还停留在 web coding ai 帮你写代码。其实我自己用下来反而觉得 codex 真正厉害的地方不只是会写代码,而是它能调用各种工具,比如说 m c p, c l i 来帮助你完成各种复杂的工作。 今天给大家分享一个我最近琢磨出的新玩法,利用 codex 加飞出 c l i, 直接绘出一张可以编辑的技术路线图。 这次我不是让 codex 直接生成一张图片,而是先上传我的研究材料,让 codex 去解析理解我的研究思路,之后再去调用飞书 c l i, 把这套绘图逻辑直接划进飞书画板里面。接下来我拆解一下我是如何做的。首先呢,我准备了两份材料,一个是我的研究文档啊,在这还有一个是参考图片, 然后我输入这段题日词,请参考图片的布局、配色和风格,以及解析我的文章内容。要用飞书的画板功能帮我制作一个风格接近的技术路线图。 然后请注意啊,制作的这个技术路线图的整体布局要合理,每个模块之间的内容一定是和谐的,我们点击这个发送,稍等一小会就可以了。 ok, 可以 看到啊,整张技术路线图现在已经制作完成了,我们点开来看一下。 比如这张图里面最上面先把 t x 杠 l d m 的 研究目标讲清楚了,它主要解决的是水电、地下厂房、低照度强噪声下看不清看不准的问题。 中间也不是简单的几个模块,而是按照模型表真层、训练建模层以及推理复原层来区分的。左边是极低照度、噪声放大、纹理淹没和识别有限, 那右侧呢?是纹理恢复、噪声抑制、纹理清晰、缺陷可变。核心的训练层拆成了两个部分,首先是第一阶段监督鲜艳的学习, 以及第二阶段纹理增强潜在扩散。下面还把实验评价单独拎出来了,包括数据验证、指标提升和笑容结论。而且这些文字和图形元素都是可以编辑的,想怎么编就怎么编,怎么编都有面啊,而且字体、字号、颜色什么都可以调整啊, 他根据自己的需要来,当然其他风格的图片也都可以会制啊,微调一下提示词,替换一下参考图片就可以了。以前是我先想逻辑再动手画图,现在是 agent 帮我做逻辑结构化,再直接调用飞书画板生成可编辑的图。

这是用客户在接上 dixit 用插件跑出来的 ppt 动画,还能调用 cpu 在 use 直接操作我的电脑。更炸裂的是手机远程操作还能给我发文件,重点是不用再心疼 tok 了。前两期视频很多人反馈,接上国产模型之后,插件用不了, computer use 也跑不起来。 上期我把这条链路和远程连接的方案补上。 c c switch 负责接入模型和远程操作,扣带夹夹负责开启插件能力,接下来直接进操作。已经装过 c c switch 的 朋友也要留意一下,要先把之前的配置清理干净,不然配置会有冲突。先删除所有的配置,重新添加一下这个 open air 的 方案, 启动一下,让它还原成默认的状态,然后重新走一下添加模型的流程。打开 cc switch, 切到 code 这一栏,点击右上角的加号,找到 d c, 选好之后默认的信息都会帮你填好,只需要填上你的 a p i 信息就可以。再检查一下这两项有没有打开有 保存配置。回到首页,把左上角这个开关打开,如果发现没有的,可以点击设置,然后选择这里,再把这三个都勾上就可以了。重启下 c c switch 和 code, 进来之后一般都是 api 模式模型,这里可能是空白的。别急,这个是 bug, 但 不影响正常使用,调用的还是 d c 的 模型,等你登录之后就可以正常的去选择模型了。到了这一步, c c switch 已经是搞定了, 其他的模型也是这一个流程,这时候你会发现插件点进去之后里面是空白的,或者只显示几个。别慌,先把 codex 关掉,然后打开 codex 加加,注意不是打开原来的 codex, 来到插件这里,点击这里再选择一下就行了。到了这一步,插件就能接上了。手机远程连接的开启流程也非常简单, 用手机打开 gbt 的 app, 记得先更新一下版本,点击左上角这个,选择扣带,然后登录验证就好。连接好之后就能同步到扣带桌面端的绘画记录了, 同样也是可以切换模型和调用插件的,这样子既能够远程操作,又能使用插件了。这里有几个坑是需要注意一下的,我目前只测试了部分的插件,可能不是所有的插件都能兼容。 其次,远程操作是需要登录账号的。还有之前做的视频收到了不少的反馈,例如聊天记录不见了,每次都要重连五次才能开始跑,各种五零二、五零三的报错我也进行了整理,今天就到这了,我是木马陪你潜完 a 的 赛博达子,咱们下期见,拜拜!

你想没想过 codex 下命令,直接在非书画板上同步图式包制一次出,可编辑,可修改。下面呢,就是这个图式的解析。这个动线可以说非常丝滑,一条命令搞定,包括不限于你的文章配图、 ppt 页面、技术路线图、格式化汇报思路等等。 实现方式很简单,你把飞书的 c l i 接入 codex, 让它直接调用飞书的云文档和飞书的画板能力。当然了,我这里用的是 codex 嘛,其他的 agent 像 cloud code 呀, open cloud 都是可以的。然后呢,你在这儿把这个 c l i 配置好,很简单,在 codex 里面下这个命令就可以了。 ok, 之后就可以自由调用非书的云文档和画板。在这儿把这个 skill 配置进去,它是一个非书绘图更流畅的 skill, 你 不用输元代码,你直接把这个 skill 的 github 命令放进去,让它直接帮你安装就 ok。 接着一句话说出需求,比如帮我生成一个肠道菌群失衡等等等等这样的一个硬化进展的生物通路图, 并附带一份解释文档,要求生成在非书云文档里面,画板为可编辑的 svg 结构。关键的是我们生成的这个非书画板,它是 svg 结构,也 就是说里边儿的这个点,文字、颜色、线条都可以改了。你就不用先让它生成这个页面,然后你再用我上次说的那个 skill, 什么 image editable to ppt 那 个 skill, 再转成这个可编辑的,这样的话就直接一次搞定 它,整体出来的这个质量已经非常高了。下面就是这个图式的解析嘛,你在这个基础上调细节,调内容,都是 ok 的。 如果你没有这个 magic, 然后无法调用这些 agent, 非书里边还有一个非常直接的智能体 i 里,它就更适用于做像研究进展梳理呀、讨论整理呀,或者说这个意见汇总等等这样的一个文字可识万的内容。 比如说你把你相关材料都发给他,然后直接跟他说一句,帮我用一个文档和画板梳理这项研究的核心逻辑,他就可以自动在非书云文档里面把这些信息浓缩成一张高信息密度,然后还可以继续编辑的意图留汇报, 你看这个是对应的内容。非书最好用的一点不就是可以多人写作修改吗?这个就特别适合你做项目或者说需要多人合作的这样的一个科研场景,用起来真的效率欻欻的。直接在里边改这个思路,大家去试试图是再不是问题。

codex 如何联通 solidworks 完成自动化三维建模?底层原理并不是使用 codex 的 computer user 功能直接在软件里面操作画模型, 而是 codex 根据建模需求生成 python 脚本,再通过拍 win 三十二调用 solidworks 官方默认的 com 接口连接本机的 solidworks 应用对象。 连接成功之后,脚本就可以像人工操作一样控制 solidworks 新建零件,选择显示基准面,进入草图绘制和调用功能模块,生成各种可编辑的三维实体模型。所以你只需要告诉 codex 通过 solidworks 的 com 口给我生成对应的三维模型即可,无需额外的配置。 在这个案例中,高考加油是通过草图文字 api 创建的,下面的齿轮则是由 python 数学公式生成键开线词括点,再把这些点交给 set rox 化成封闭的草图,最后拉生成实体。你学会了吗?

发现好多人还不知道怎么在 codex 中直接呃让 blender 替我们自动化的建模,对吧?那其实,嗯,我觉得是挺简单的,我们只需要准备一个 blender 五点一的版本就可以了,然后之后我们直接都交给 codex。 嗯,话不多说,我们现在来演示。那其实第一步你就是需要呃,你就告诉他帮我连接上 blender 五点一的 mcp 接口, 目的呢是确保你能直接在 blank 中进行建模啊,那么它就会自动检查一下。完事之后呢,就是前期第一步你需要再点开这个计划模式,因为计划模式它才才会出来这个窗口,就是它提醒我们啊,就是它要这样操作,然后你来检查一下,如果对的话就实施计划就可以,其实我们到这就什么都不用点就可以。 之后实施完了之后呢,嗯,它自己就安装好了,然后你就是按照它的提醒,然后退出重启 codex 就 可以了。安装之后呢,我就打开,打开之后呢,默认是这样的,你摁 n 键,然后调出右侧面板,可以看到有一个 blender 的 mcp, 对 吧?嗯,那这块的意思就是你要不要连接你如果一点,那么 codex 它就可以帮你。嗯,在 blender 中自动化建模了。 那这块呢,我其实自己也试了一两个案例啊,其实还行吧,你要说能用吗?肯定能用,但是效果一般般,比如第一个这个我就告诉他,我说柏兰德你帮我做三个模型,风力发电机,光伏板,还有储物箱,那么他生出来的,呃,其实是这样的, 它的好处就是它每一个这个元素它都可以可拆分的,包括光伏什么的,然后渲染模式下呢?其实看还凑合啊,对吧?但是你要说特别惊喜,那肯定跟人现在比还是差一些。嗯,你如果想改一下它的一个背景,对吧? 就需要我们进行调试。再一个就是它也可以生成一些这个卡通的一个 ip 形象,但是生成呢,反正也是,首先我是给他一个三十图 接着生出来,可能是这样,哈哈,就差点意思,这个胳膊腿都有点像青蛙,对吧?接着呢,我让他我说你这个跟我三十图对比一下能怎么样?你要继续优化一下,目前我的看出来是这个正视图的这个形态不对,侧视图看着这个脸很长,而你生成的脸很短,然后尾巴也不像这个鳄鱼尾巴, 那我也给他圈了一下。至于这个素材是我网上直接这个网上找到。最后呢,咱也可以看一下他的一个效果,他这块其实灯光什么的也帮我们安装好了,但是你要说好看吗?还需要自己在精细化处理,但是如果再叠加几个版本我就不知道怎么样了,肯定会越来越好,期待。

openai 发布了一个开源的 ai 编程代理,用 rust 写的, github 上九万星,能直接帮你写代码、审代码、修 bug。 这东西到底有多强?今天我们深度拆解 codex。 codex 是 openai 的 编程代理,不是一个工具,而是一个全平台生态。它有五个入口,网页版 chat、 gpt、 点 com、 斜杠 codex、 桌面应用、 cli 命令行 id 插件,还有云端任务系统。 c l i 是 用 rest 写的,开源协议 apache 二点零, github 上七千四百多次,提交一万三千多个。 fork 社区非常活跃,它不只是一个聊天框,而是一个真正能操作文件、系统、运行、命令管理 git 的 代理。 codex 用的是什么模型?目前有四个模型可选, gpt 五点五是最强的,处理同样的任务,用的头看比 gpt 五点四少很多。 gpt 五点四是上一代主力, gpt 五点四 mini 是 轻量版,速度快,价格低,适合简单任务。 还有一个 gpt 五点三, codex spark 是 研究预览版,只对 pro 用户开放,跑在专用低延迟硬件上。 codex 的 架构有什么特别之处?最大的亮点是操作系统级沙箱。 macos 用 seat belt, linux 用 landlock 加 set up, windows 用原声沙箱。三种权限模式只读工作区,写入完全访问。 这意味着 codex 执行代码的时候是被关在沙箱里的,不会乱动你的系统文件。通信协议方面, c l i 支持四种传输方式, still 用 jasonel web socket, 安全 web socket, 还有 unix socket 认证方式,支持 capability token 和 j w t 签名 token。 这套架构让它可以连接本地环境,也可以连接远程服务器。 c l i 有 哪些核心命令? 最常用的有这几个, codex 直接启动交互界面。 codex exec 是 非交互模式,适合脚本和 c i 集成。 codex apply 把云端任务的 diff 应用到本地。 codex resume 继续上一次对话 codex fork, 从当前对话分叉出新县城。 codex review 做代码审查, codex doctor 生成诊断报告。 还有一些实验性功能。 codex mcp 管理 mcp 服务器连接 codex plugin 安装和管理插件 codex sandbox 在 沙箱里运行命令 codex mcp server, 把 codex 自己当做 mcp 服务器暴露出去使用。 codex 有 什么关键参数?需要知道 几个最重要的, dash model 切换模型 dash sandbox 设置沙箱模式, dash ask for approval 控制什么时候需要你确认?三个选项, untrusted 是 每次都问 unrequest 的,是只在需要时问。 never 是 全自动。 dash search 开启联网搜索。 dash o s s 用本地开源模型通过奥尔玛连接。还有一个很实用的 dash image 参数,可以直接把截图或者设计图丢给 codex, 它会根据图片来写代码,这在做前端开发的时候特别有用。你画个 ui 草图,它直接生成对应的 html 和 css。 在交互界面里有什么技巧?几个斜杠命令必须记住 slash plan 或者 shift tab 切换计划模式适合复杂任务,先规划再执行。 slash review 做代码审查 slash in it 生成 agents md 配置文件 slash compact 压缩长对话上下文,防止 token 超线。 slash model 切换模型 slash fork 分 叉对话 一个高级技巧是让 codex 面试你,当你的需求比较模糊的时候,跟他说 interview me, 他 会反问你一系列问题来澄清需求,然后再动手。这比你绞尽脑汁写一个完美 prompt 要高效得多。 agents md 是 什么 agent? m d 是 codex 的 配置文件,类似于 detinery 的 概念,但是给 ai 代理看的。你可以在里面写规则,比如不要记录 p i i 数据,所有 api 路由必须有认证中间键测试必须用 ptest。 它有三层结构,全局配置,放在用户目录的 codex 目录下是你的个人偏好。仓库跟目录的 agents md 是 团队共享的规范。子目录下的 agents md 是 局部规则,越靠近文件的规则,优先级越高。 codex 的 代码审查功能怎么样?这是 codex 最有价值的功能之一。在 github p 二里直接 mention at codex review, 他 会先发一个眼睛 emoji, 表示收到了,然后提交审查结果。 他只标记 p 零和 p 一 级别的问题,也就是高优先级的风险,不会给你一堆无关紧要的 warning。 更强大的是,你可以在 agents md 里写审查规则,比如不要记录 p i i 验证认证中间件覆盖所有路由,这些规则会按目录层级自动应用到最相关的文件。你还可以一次性指定审查重点,比如 at codex review for security regressions。 使用 codex 有 什么最佳实践? openai 官方推荐的 prompt 结构有四个要素,第一是目标,你要改什么或者建什么。 第二是上下文,哪些文件文档错误,信息相关。第三是约束架构,要求安全标准,代码规范。第四是完成标准测试,通过行为变化, bug 不 再出现。 推理级别也很重要。 low 适合简单任务,速度快。 medium 和 high 适合复杂改动和调试 extra, high 适合长链路的代理任务,级别越高越慢,但思考越深入。 新手容易犯什么错误?最常见的八个错误,第一,把持久化规则写在 prompt 里,应该写在 agents md 里。第二,没告诉 codex 怎么跑测试和构建。第三,复杂任务不做规划直接动手。 第四,一开始就给完全权限。第五,在同一组文件上开多个现成,应该用 gitwalkree 隔离。 第六,自动化之前没先手动验证流程。第七,一步一步盯着它看,而不是并行运行。第八,一个项目只开一个县城,导致上下文膨胀。正确做法是每个工作单元一个县城。跟 github 的 集成有多深? 非常深。除了 p 二审查,你还可以在 p 二评论里直接让 codex 修 bug, 说 at codex fixed p e issue, 它会自动开一个云端任务来修复,然后提交 p 二。你甚至可以说 at codex fixed c i failures, 它会分析失败原因并修复。 还有一个 debug action 可以 用在 c i c d 流水线里,配合 api key, 你 可以实现完全自动化的代码审查和修复流程,每次 push 自动触发 codex 扫描,发现问题自动创建 issue 或者 pr。 价格方面呢,五个档位,免费版可以体验基础功能,勾版八美元一个月,适合清量任务。 plus 版二十美元,解锁云端功能和最新模型, pro 版一百美元起,速率限制提高五到二十倍,还能用 code spark api key 按用量付费。没有云端功能, 速率限制是按五小时窗口计算的。 plus 用户用 gpt 五点五美,五小时十五到八十条消息, gpt 五点四, mini 是 六十到三百五十条。云端任务和代码审查共享。这个额度如果你经常用 pro 版的五倍或二十倍限制会宽裕很多。 跟 cloud code cursor, github code 派了比呢?先说 cloud code, antropic 出的也是 c l i 编程代理。 cloud code 的 优势在推理质量。 cloud 的 代码理解能力公认很强, 但 codex 的 生态更完整,有云端任务。 github 深度集成桌面应用 cloud code 主要是 c l i。 curser 是 id 为核心的,内置 ai 对 话和代码补全,体验最流畅,但它是闭源的商业产品。 codex 有 id 插件,但核心 c l i 是 开源的。如果你喜欢在终端工作, codex 更合适。如果你喜欢 id 一 体化体验, cursor 更好。 github co pilot 是 最早普及的 ai 编程工具,深度集成在 github 里,但 co pilot 更偏向代码捕权和聊天。 codex 是 真正的代理,能自主执行多部任务,操作文件、系统管理 git。 从能力维度看, codex 最强, co pilot 最轻。 安全方面有什么保障?三层安全机制,第一层是操作系统及杀箱,代码执行被隔离。第二层是审批策略,你可以设置什么时候需要人工确认。第三层是 codex security 安全插件,可以做深度安全扫描,在合并前检查代码变更。 企业版还有 codex security cloud, 如 commit 扫描连接的 github 仓库,构建仓库特定上下文,在隔离环境里验证发现,减少误报。这个功能对大团队来说很有价值。总结一下, codex 的 核心竞争力是什么? 五个字,全站自动化。它不是一个聊天工具,而是一个能真正操作你的开发环境的代理开源。 rust c o i 操作系统集沙箱 github 深度集成云端任务系统、多模型支持自动化和技能系统。这些加在一起,构成了目前最完整的 ai 编程代理生态。 我是一个科技爱好者,一直努力为大家制作更精美、更有深度的科技视频。如果你对这些内容感兴趣,请点赞并关注我,咱们一起学习进步,探索科技的无限可能。感谢分析!投资有风险,入市需谨慎,感谢收看,下期再见!

大家好,今天呢,我给大家演示一下,就是怎么样用 codex 做一个个人版的主页,因为今天本来我以为 codex, 因为昨天的事情嘛,啊,本来我以为今天那个 codex 它又要犯病, 嗯,后来的话,今天我又重启了一下嘛,重启了一下之后,呃,他中间也有那个断,就是网络连接中断,但是就重新连接嘛,但是呢,因为他总共有五次嘛,五次机会,所以说,嗯, 反正中间有的是断两次,有的呢是断三次,不过最后都接上了,反正给大家看一下。我今天用 qx 去做了一个个人版的主页,因为我之前用那个可乐扣的已经做过一版了,这一版的话呢,我之前用可乐扣的做的一版是,嗯,实验工程师的,这一版呢,我就准备又做一个质量工程师了。看扣带子, 我之前用那个那个可乐扣的,呃,是在那个 github 上面,我已经去那上面把那个网页给他部署了啊,就是说大家可以在那上面完整的搜索搜索到我。然后现在这个 codex 呢,我今天 因为前段时间酷这个是已经把这个大致的一个网页整体的框架都打好了,所以说我就新建了一个项目啊,这个项目的话呢,就是主页个人主页的项目这个项目,然后现在的话就是 让他改一下,就是把这个界面,因为之前都是中文版的,中英文切换的那种, 所以说我就跟他说了啊,现现在需要你把网页的界面加上英文版的,可以来回切换什么什么的,然后改成名字,然后里面还有照片,整体风格是偏什么什么样的,然后他就开始去检查了,查一下我现有的一些项目之类的东西啊, 然后我这个用的是一个,嗯,计划模式, 对,先用的是计划模式,给大家看一下他,首先因为我有这个东西嘛,所以说我要把这个改过来, 改一看,他有一个计划,就是说这个东西这个地方应该怎么改怎么改 啊,然后我就让他实施计划,让他就开始了,先把我缘分缘分键备份,然后创建一个新的版本,看中间有很多重新连接,重新连接,那都是这个原因,我也不知道为啥 啊,这个三次的,但是最后都跑通了啊,然后给大家看一下,又重新连接, 不过当时给大家看一下,当时我看这个网页里面啥都没有 看,问他你怎么什么东西都没有,是个空的?然后后来又该检查了,什么什么什么重新携带嘛?重新弄,重新搞啊,最后修复好了, 刚我就说了好了,现在呢?你需要把这个网页上传到网络上,让别人也能看到我的网站。然后他就开始他给了三个方向啊,一个 github, 还有一个是握手,还有一个是 netflix 啊, netflix, 呃, livi, livi。 然后我就感觉这个因为之前用的用 那个跟他有仓库,他比较麻烦,然后现在的话用这个他的是拖在部署的,就是说他不需要别的东西,他只需要把你的这个文件给他保存好,然后就直接把他拖在了这个上面就行了, 然后他就帮我弄了啊,用这个免费部署最简单嘛。然后我就打断他了,我就说那就用第一个方法 行,然后他就把这个东西创建了,创建之后然后浏览器打开浏览器防止这个,当然我这些浏览这些呃网站可能都是需要呃需要别的网络的,大家都知道啊,然后他就生成了一个恶东西, 哈哈。然后这个网站当时出来了,但是打不开,因为我中间他有一段时间就是说我已经把这个网这这些文件都拖拽到那上面去了,但是呢 这个当时他让我改名,我因为我没有改名,所以说,嗯,他就他就读不读不了,你看他的这个只识别啊 excel 的 这个文件,就把那个名字给改过来了,改过来之后,然后重新拖在了里面去。啊, 然后这个有这件事情呢啊,我也就是说,呃,让这个克拉斯下次记住,如果说出来这些任务之后啊,一定要把这些任务的些注意事项也给它标上去,否则的话就比较浪费时间嘛。这样 看这个自定义域名,自定义域名的话就是它可能是需要买,因为我不想花钱,所以说还是直接用它默认的这个域名就行了。嗯, 然后我现在有两个个人主页了,一个个人主页是 call 字库的,帮我做的,就这两个主页,两个主页的那个侧重点也不一样,一个是实验,一个是质量的。 好了,这今天这就是今天咱们的一些目标,给大家看一下这个它那个网站是什么样的,什么样子的啊? 来看一下,就是说它你可以把那格式,它会自动把你的文件 就是里面的一些呃需要的一些文件全部都给他放在一个文件里面,文件夹里面,然后这个文件夹就可以直接呃拖拽到这个里面,这个文件夹里面 当我我这些东西已经拖拽了,所以说我就不,我就不用弄,看他就点一下,就这个这个文件直接拖拽到里面就可以了。 然后后面的话就是说他会让你去修改一下你的那个名字吗?项目名字,然后把那个名字给改成你自己的名字啊,就我把那个名字改成我的那个名字,后来的话他后面生成出来的啊,就是咱们自己的名字 这样的,这样的话就比较好认嘛,方便方便记这样的啊,所以说这就是今天整个的视频, 希望大家,嗯,使用起来会,我感觉是比较方便的啊,尤其是如果说到后来,嗯,咱们求职或者干嘛的啊,比如说有一些外企, 是吧?他有可能是需要你有一个什么作作品集,你就可以把这个网页给上上去,或者说有项目集,你可以把这个东西给他放上去就行了。 然后其他的,嗯,反正大家多去尝试,多去试试这个东西。因为现在的话,毕竟大家都知道后来的时候特别火,他已经代替了 前段时间前几个月的那个龙虾了,之前养龙虾乐了,龙虾乐现在的话基本上都讲靠电视了,所以说大家把一定要把这个工具给它使用进来,使用上啊,行吧,今天呢就到这了。

大家好,我是一名电子心创业的博士生,我今天我想分享的是一种 context 连接 console 的 一种方式,我已经将该方法已经分装成 scale 上传到 github 上, 链接我已经放在了简介,以下是我置备该 skill 的 方法, github 上面的方法不能使用的话,你可以按照这该视频的流程一步一步往下操作,制作专属于你自己的 skill。 首先我问了 context, 你 控控制 console 有 哪几种方式? 首先我问了 c 老师,你能控制 console 的 方案有几种? c 老师这 contact 老师他说有,他有这样几种七种方式。 嗯,在我们这个视频中呢,我们我采用的是 console service 和 m p h service 这种方式来控制,因为这方法可以看到 context 实时修改 console 的 模型,这种对我们这种小白的 会比较友好一些,如果用 m p h 这些方式,我们不能看到它实时修改该模型的任意参数。 现在我我就跟 contacts 老师说,我想用 console service 和 m p h service 的 方式进行控制,进行它就会给我进行推理, 这里写了哦,幺零三八是我这个电脑的端口,如果你们的端口不一样,你们要进行相应的修改, 现在他已经把他这个呃启动 service, 然后打开 g u i 就是 应用端,然后导入模型,这个脚本已做好了, 你就跟我就跟腾特来说,我就要走这样个流程,请你帮我置应相应的脚本, 发现它已经把它的脚本已经做完了,现在就需要让它 打开客户端,然后我要进行手动的连接这个 console service, 然后它再进行是我监看它,让它监听一下是否它已经连到了该 console 的 模型, 现在弹开这就这个窗口就是它监听的一个窗口。我们一般打开这个脚本之后,这个窗口是不能打开的,然后它也现在打开了它的这个 g u i 界面, 我打开了这一个空白模型,然后你通过这个 console 的 survival 进行连接,可以看到这里的服务器是 local host 和端口是二零三八。在另外一边的话, 它这个的用户名和密码如果你不知道的话,你可以让 context 帮你去询问以及进行相应的修改就可以了。 它确实已经其实已经连接成功了,但是我问它的是它连接了吗?它就一直一直连接,连接就很 有时候还是挺笨的,所以你可以直接问一下这个,呃,你是否连接了,然后再引导他对话就好了,你可以看出他已经弹出确认成功,当前状态 m p h survive 以及今天到了 local host 这个二零三八这个端口。 这时候其实我们就可以在这个词模型上进行相应修改,或者是康告诉 context 我 们怎么需要什么样的模型,让他帮我们构建,让他帮我们如何构建也可以。 现在我们将该脚本混成一个 scale 进行一个技能,当我们下次使用该 方法的时候,就不用再像前面一样一步步慢慢来,就变成一个自动化流程的方式,这样子我们可以每个人都拥有一个专属于自己的 scale。 现在我们看我们我们的 scale 已经分装完毕,现在我们开始就是,嗯, 这个 scale 已经分装完毕,我们现在要现在要跟 console 断开链接,这样子这个端口才可以关闭,要不然下,要不然下次再使用的时候这个端口发现会发生拥挤,你就不能再用这个端口了。 我们看现在看一下我们做制作的这个 scale 是 否是可以的。 这是我们 scale 的 这个名字 open console projector, 他已经打开了这个 m p h 的 servo, 但是他这个,嗯, ctrl 的 这个 g u i 界面一直没有打开,可能就需要我们自己手动点,手动打开 下面已经连接成功,你可以看他,他直接说我们已经连接成功了。这个 scale 的 流程其实还是比较慢的,我本来还是想让他自己打开这个坑 ctrl g u i 的 这个应用客户端,但是它非常的笨。

codex 的 windows 版本更新了,最近呢更新了一个功能,可以超过我们的电脑了,那么这里给大家呢演示一遍,我们在前面加入 at 选择这个插件的电脑,可以给我的 qq 好 友发一些去爬泰山要注意的事项吗?具体的我们看一下它会去做什么, 发送之后它就会帮我们打开我们的 qq, 自动发这些注意的事项给对方。当然这之前会让我们先确认一下这功能的目的,主要是它可以操控我们的电脑,不仅仅只是 qq, 包括我们的微信以及我们的浏览器等等都可以帮我们干活。 比如说我们在家里面需要拿到电脑版的一个文件,我们就可以用我们的 codex 的 移动版手机端,让他把我们的文件发给我们,他现在已经在操控我们的电脑,当全框变成蓝色的时候, 他就是操控我们的电脑,这些呢就是他发给对方的一些注意事项,总共十二点,有出发前的路线选择,还有穿衣以及护膝、背包填气等等, 这些十二个点都是他总结的一个点,非常的 ok。 蓝色的消失的代表他这一步已经做完了,那接下来需要我们确认你看到没有,他为了是保证我们的信息要核对一遍,以防你比如说有一些隐私或者说密码不想发给对方,我们就说好的可以, 他就会帮我们做这一步,我们可以在手机上操作也行,我们可以看一下啊,你看他非常的智能,已经给你发出去了,我们往回看一下,你看他说已经确认发布出去了,可以点这个设置,以及这里有个设置 点操控电脑,把任意允许操控电脑给打开,如果你有谷歌浏览器也可以打开,那这样就可以帮我们干活了。这仅仅只是第一步,未来的一个升级肯定是更强大和更全面的。 windows 版本我们已经安装好了,如果有不懂安装的朋友可以点个关注,我们后期呢?可以交流。