给大家看一下我们这个浏览器的效果,看到没?他直接去在网站里面去操作了就然后刚刚他是直接去在里面搜,你看他现在贼快,上面 ui 一 直在变,看到没?我去 codex 刚刚出了一个可以控制浏览器的插件,我现在刚安装,我给大家看一下是如何安装的。首先你一定要呃搜 codex, 然后一定要搜这个呃, open i 提供的,然后呢把它添加到 chrome 上面, 对,添加完之后呢,这里面就它就在这里面,我们把它这个勾选一下,然后这个 codex 它提示它没有这个连接,我们点击这个小齿轮让它连接一下,然后这个桌面端的 codex 一定要去升级到最新版本,然后点击这个安装,然后点击安装, 然后我让 codex 去帮我搜索论文。啊,一开始呢,他是,呃先去尝试用浏览器搜,但是他没有成功,然后他就开始用这个搜索指令了。呃,我说你不要用搜索技能,你直接用我浏览器搜好了,他第二次就直接开始用浏览器了,我给大家看一下我们这个浏览器的效果, 看到没?他直接去在网站里面去操作了就然后刚刚他是直接去在里面搜索,你看他现在贼快,上面 u i o 一 直在变了,看到没? 所以说呢,就是说他的好处,就是说他把所有东西呢他都会整理好,然后我们就不需要我们去手动去搜了。还有一点,就假如说你是在学校里面,你有一些对一些论文库的一些访问权限,那你可以把这个权限授权给他,对吧?然后他这个搜索范围就更广了。 ok, 谢谢大家。 最终结果大家看一眼他把优先读啊,哪些方向都列出来了,然后我们也可以让他把具体内容去总结,也都没问题的。
粉丝3276获赞5.2万

今天我们会完成桌面板打开之后的第一次设置,那么我们就开始吧。第一次打开 codex 桌面板,我们要先把界面分成三块来看,左侧是项目和一些插件的入口,中间就是我们的一个对话框了,最下面有一个设置面 板管理。对,那么我们新手进来要先处理几件事情,第一个工作模式,第二个选举指令,第三个批准策略,第四个沙盒,第五个插件入口。 ok, 那 我们先进到设置里面看, 在设置里面左侧有十二个分类,包括常规、外观配置等等。第一次使用我们重点来看这几个,我们先点开常规,常规的第一项就是一个工作模作,开发项目的时候,我们一般选择适用于编程, 你选择了这个模式,那么 codex 会更愿意指示文件命令验证方式。如果你平时是以日常工作居多,比如说是以文字创意等等,那你可以选择用日常工作。在下面的权限区域,我们要来看一个重点是完全访问权限,这里记得是关闭的状态,如果这个开关打开之后, codex 可以 直接编辑更大范围的本机文件,运行网络命令,它的风险会明显变高,所以作为新手阶段而言,我们默认把它关闭掉就可以了。这里的速度可以选择是标准还是快速, codex 会基于跟你的一个整体对话,给到你一个相应的建议,当然如果用快速的话,它的套餐用量也是会增加的,那么我们平时用标准就可以。 那接下去我们来看第二个重点是个性化的,这个选项里面有两个,一个是个性,主要是选择 codex 回复的默认语气, 我这里选择的是务实,希望它能够简洁、专注和直接。第二个我们要去关注的是自定义的指令,这里的自定义指令要知道它是局工作规则,所有的项目都会读到它。所以新手我建议你们只要写八行内容就可以,这八行内容我会放在评论区,当然我自己的会 更完整更长一些。我的结构大概是包括使用范围与优先级通用的一个工作流,安全与合规,通用代码规则,验证与测试提交的规范,常见的项目命令工具,然后输出的一个文本规则。还有一些个人偏好,对, 我觉得大家一开始就用前面的这个八行就足够了,后面当你越用越多。你可以跟 codex 去总结你们经常碰到的一些问题,或者是你自己觉得 codex 经常会犯的一些错误,你把它整理成对应的规则放进去就可以了好吗?它有一个记忆的选项,目前是实验阶段,大家可以把起用记忆这个给开启就可以, ok。 第三个重点是配置,我们来看一下配置的页面配置我们来关注两个内容,第一个是批准策略,第二个是杀核设置。批准策略一般我们都会默认的是 on request, 它的意思就是说当 codex 遇到高风险动作的时候,就会停下来让你确认。当然这里如果说你是用 never, 那 就相当于一次执行到底了,不需要你的任何的批准,所以我建议新手都是用 on request 吧。沙盒设置这里它的默认是 workspace right, 它主要在当前项目里改文件,允许网络访问,这里就是默认开启,你可以把这里的批准策略理解成为它是一个确认按钮,哪些时候需要你来确认?把沙盒设置理解成为 codex 的 活动范围, 你给它框定了一个能够编辑文件和改文件的一个范围,它就只能在这个范围里去进行一个行动。我们再来看一个大家比较容易忽略的一个点,或者是比较容易混淆的一个点, 就是在桌面面板的左侧有一个插件,这里的插件它其实包含了 skill, mcp 和 connect。 skill 是 工作流,是我们的一个技能文件,它里面包括一些代码审查、做表格、生成 ppt 等等。同时像 mcp 就是 codex, code 等等。 connect 呢,是第三方账号的一个连接, 比如说像这 eraser, git, a lotion 都会有,所以这里的插件其实它就是一个能力包的一个合集,像 m, c, p, skill, connect 这些都是它里面的具体的能力,大家根据需要去进行一个安装就可以。 ok, 那 我们再回到设置里面剩下的几个,我们只是来做一个印象, 比如说像外观,你可以基于自己的系统去定义主题色,浅色或者是深色,当然这里有一个隐藏选项,它有一个宠物,看到了吗?这个就跟 cloud code 是 一样的,就是最近出了一个宠物,当你选择唤醒它的时候, 你看它的右下角就会出现这样的很可爱的一个宠物形象来陪伴你头顶。 it 主要是来管理分支的,像浏览器使用和电脑操控,主要针对的就是 browser use 和 computer use, 在 我们后面也会去讲到像以规章和使用情况,就是你本地的一个任务的一个管理和一个用量的展示,平时经常的去看就可以了。

真的,你的电脑只需要一个考勤就行了,可以让他二十四小时帮你干活,你想体验 code code 的, 你直接告诉他,他直接帮你安装中文版本的,并且配置好 deepsea 微四的一个模型, 如果终端用不习惯也没事,我直接让他帮我安装桌面端的版本,并且啊,会员也是帮我成功开通,像我这种一个代码都看不懂的,现在也能做网站呢。 你别说,这个画布做出来还挺就挺好用的,什么帮我把硬盘合区,做每日资讯,做 ppt 我 真的都全用它,真的太强太好用了,因为这个电脑它控制的话,它这个鼠标是和你和你的鼠标它不会冲突的,它在后面默默的干, 你来可以开两个,三个一起来跑。所以呢,我就直接上了一个 pro, 让三台电脑二十四小时直接帮我干。

hello, 大家好,今天给大家讲解一下我是如何使用 codex 来驱动 objects 来完成一系列由 ai 驱动的 ce 仿真的。首先我们去 openai 的 官网去下载 codex 这个 agent 桌面单软件。 codex 是 由 openai 推出的一个以编程为主的桌面单应用程序,我们下载完成之后,安装了之后,你可以登录你的账号,这边 codex 它是免费账号,也是有一定的使用额度的, 但是这个额度不多,建议大家还是充一个 plus 会员。下载完成之后,你可以在这边新开一个对话,然后把我这个 呃 qs mcp 的 链接粘到这个对话里面,让它安装一下这个 mcp 插件。这边安装完成之后,我们可以在设置这边看到这边有个 mcp 服务器, 然后这边的话有一个 opcode server, 这个服务器安装完成之后,你的 codex 就 能够和 opcodex 完成一个联通了。至于这个仿真的界面,它是我们完成的另一个项目, 你可以在 task two cae 这个网站下面把链接复制一下,然后交给 codex 让它安装一下。 安装完成之后,我们就可以使用 codex 联合 opcode 来完成一系列仿真了,但在这个过程中,你肯定要把你的 opcode 啊,我们打开 opcode 之后,我们可以在这边的中端窗口下输入 mcp, 然后下划线,然后 looper, 然后过号点击回车,然后这边的话 appux 就 已经开启了一个 m c p。 我 们在 codex 里面,然后我这边新开一个窗口,我们这边的话问他你是否可以和 appux 联通, 他这边是思考了二十四秒之后返回的信息是可以当天可以和 appx 连通了,如果你测试到这一步的话,那说明你已经成功的打通了 codex 和和 opuse, 然后你就可以使用一系列的提示词来对它进行一个仿真。比方说我这边做的一个仿真,仿真专家做一个仿真学分析,要尽可能的贴近真实工况, 不要简化去做。如果是比方说这种动理学仿真的,你就让他要尽可能的贴近真实功放设定播放的帧率也要高,让仿真动画看起来更流畅。我需要在这个 codex 浏览器里面看到最后的仿真的结果。 在这边有一个界面,这边是模型树,我目前是只做了这个项目的,打开预览的一个模型树,后边的话,这个我可能会再完善一下,把这边的零件材料装配,然后分析部都能够去操作和二次编辑, 目前能够你编辑的在这个可编辑窗口,比方说可以编辑一下模型的一些尺寸,比方说我们把这个模型的尺寸圆孔半径改为二十四,在这边点击重新计算,然后这边的话它就在驱动 appui 完成一个重新的计算。 你也可以改,比方说板长板宽,然后其他的一些弹性模量或者是材料属性可以看到它这边就完成了一个模型的重新计算,然后重新进行了一个就是模态分析。我们先在这里讲一下这个 codex 驱动 ios 进行一个由 ai 驱动的 ce 仿真的流程是怎么样的。首先我们在这里的对话框里发一下你的想要仿真的一个提示词,你可以完全照抄这个,当然你想改一下也是可以的, 然后把提示发给这个 codex 之后, codex 就 会去写一系列的脚本,比方说这个模型建立的脚本也是由 codex 的 python 码完成的,当然一些比方说这个像简单的一些模型,它是可以去建立的,当像这个 洗刀模型它就建立的效果不是很好了。这个洗刀模型是由我在 soodeworks 里面去建立的一个模型,把它转化为 str 格式之后,告诉了 codex 在 哪里, 他就可以把他建立的模型和我提供给他的模型进行一个装配。呃,包括后面的像材料定义装配这个分析布载合了的定义,边界条件的定义,以到我们的网格化划分,都是由 codex 来完成的。 到后面的一些结果的后处理也是由 codex 来完成。 codex 完成之后,它会把一系列的脚本发给发送给我们的 opqs, 来完成最后的一些结果的分析,然后到仿真的一些模型的一些计算,它会发送给我们来完成一系列的仿真计算到结果的后处理, 然后完成之后它会创建一个网址,就是这样一个网址,然后我们点击一下就可以在浏览器里面去 看到 oq 所有的仿真结果。目前的一些仿真的话,其实它只能够进行一些简单的动力学或者是心理学仿真心理学效果目前是最好的,动力学的话,其实效果没有那么好, 大家可以当做一个参考。然后我这边再补充一点,就是如何把这个 mcp 给停掉,因为这个 mcp 运行的话,你的 oq 界面是不能进行任何一个点击操作的,就是它是一个主色运行的状态, 然后大家如果想停掉这个 mcp, 呃,然后在 app 里面查看结果的话,可以点击这边的 stop 按钮,然后就可以停掉这个 mcp 服务了,然后就去进行其他的一些操作。 你如果你有问题的话,可以在这个 github 上去提问,或者说你有好的想法可以在这边跟我说一下,我看一下能不能来实现一下。这就是本期的视频内容,大家如果有什么疑问可以向我提问,谢谢大家。

今天这条视频给大家展示的不是一个普通的软件界面,而是一种全新的做事方式。 你现在看到桌面上这些 app 不是 买来的通用模板,也不是外包团队慢慢堆出来的标准产品,而是通过 codex 按照公司自己的业务流程、岗位需求和使用习惯,定制出来的专属工具。 以前一家公司想做自己的 app, 往往要先找产品经理,再找设计师,前端后端测试周期长,沟通成本高, 而且改一次需求就要重新排期。现在不一样了,有了 codex, 你 只需要把自己的想法讲清楚,把业务流程说明白, 把页面风格和功能要求说具体, codex 就 可以直接参与整个落地过程。你在视频里看到的就是这个过程的真实展示。 从需求沟通开始,到界面调整,到功能细化,再到桌面封装和成品交付,整个流程都可以通过和 codex 的 对话一步步完成。它不是只会写几行代码,而是能真正理解你的目标, 帮你把一个模糊想法快速变成可以打开、可以操作、可以直接给团队使用的 app。 更重要的是, codex 做的不是千篇一律的工具,而是只适合你们公司的工具。 论你是做供应链管理、内容运营、素材处理、视频去水印,还是爆款脚本拆解、业务流程整理、部门协助系统, codex 都能围绕你们自己的工作方式,做出真正贴合团队的应用。 这也意味着,公司不需要再被通用软件反向限制流程,而是可以让工具主动适配团队,你们怎么工作, a p p 就 怎么设计,你们需要什么功能,系统就围绕什么功能去搭建, 以后想升级、想改版、想增加模块儿,也都可以继续让 codex 直接迭代。还有一件事我想特别告诉大家,你现在看到的这条演示视频,本身也是由 codex 参与完成的, 包括内容结构讲解、逻辑、字幕表达,甚至视频剪辑节奏,都是 codex 自己完成和整理出来的。 也就是说, codex 不 只是能帮你开发 app, 它还能帮你把 app 讲明白,展示好,传播出去。所以,如果你今天想做的不只是一个页面,而是一套真正属于自己公司的数字化工具, 如果你想要的不只是能看,而是能立刻投入使用。如果你希望从想法、开发、封装到展示都有人一路帮你完成,那么 codex 就是 那个能陪你把公司专属 a p p 真正做出来的伙伴。

好了,大家好,这段时间 codex 相信很多小伙伴已经上手,开始用了一个非常好用的 openai 的 桌面端的一个 agent 工具。那么今天我想推荐一个 codex 里面的一个很强很厉害的一个做视频的插件叫 hyperframes, 它可以帮你按照网页的形式去做成一个视频,相当于用写前端的代码去做一个视频。首先我们知道 ai 在 写前端代码这块已经是非常厉害的,所以说这个插件就可以帮你 让你的 ai 像写代码一样去做视频。好的,那么我们就直接来试一试这个插件到底有多厉害。使用是在这边点击这个插件下面找到这个 hyperframes, 安装之后我们直接右上角点在对话中使用。这里我把 cloud 的 一个官网给他,我说一句,请根据这个网站做一个产品的宣传视频。好的,我们这里让他开始执行。好的,可以看到他跑了一段时间,他去官网去拉取了一些他需要用到的素材, 他接着在执行。好的,现在他已经生成好了,他已经跟我们说宣传视频已经生成好,在这里只需要点开就可以去预览。 并且他除了宣传片以外,他还使用了官方的素材,产品的文案,他还有动画的分镜,他还给这个宣传片加了旁白的阴鬼。让我们来一起看一下 the ai for problem solvers breakdown complex work together research write analyze data and code with expert level collaboration bring code to your desktop browser tools and team code by anthropic think bigger work clearer。 可以 看到整个效果还是非常好的,除了可能画面中有个别的小细节, 有一些排版上的问题,整个的效果你敢相信是我只用了一句话,没有经过任何修改它就出来的一个结果。随着 ai 进一步的发展,一开始的文字、 图片、视频以及到现在的全自动的生成视频以及剪辑, ai 的 发展只会越来越快,而且这个工具对于很多想要制作一些宣传视频、科普视频的人来说非常的有帮助。

你以为 codex 还只是个写代码工具? openai 这次直接把它升级成了能真正替你做事的全能型助手。以前的 ai 只能告诉你步骤,现在的 codex 已经跳出编辑器,能直接调用你的整个操作系统。 它靠多模态视觉和 o s 级控制看懂屏幕、操作鼠标键盘。你只要说整理本周会议纪要并发邮件给团队,它就会自动打开邮件提取记录,写好摘要并点击发送。 这就是 openai 对 cloud code 的 正面回击,也意味着 ai 正式从单点工具走向系统级基础设施。所以,别再把 ai 当成打字机了,给他一台电脑,他就是你真正能干活的数字分身。

最近一篇来自 capsei 的 l l m knowledge base 的 一篇文章非常的火,它是这么说的,我们要把原始资料当做原代码,把 l l m 也就是大模型当做一个编辑器,把这个编辑器编辑出来的知识库 wiki 当做一个可以持续更新的知识产品, 这个知识产品可以赋能于我们的内容输出以及项目的跟进。这让我意识到,我们缺的并不是输入, 也不是更多的资料,而是一个能够把资料变成认知,再把认知变成输出的系统。这个系统解决了我们资料太散,附用太难的问题。这期不是单纯的软件教程,我不想只讲 obsidian code 是 怎么用的, 我想讲的是一个普通学生怎么用 codex 和 obsidian。 把每天看到的文章、笔记、网页、书籍以及簿刻变成可以附用的知识库,让它参与到我们的日常决策之中。 如果你之前看过我的内容,会发现我一开始并不是专门讲工具的。我之前更像讲认知、商业分析、 ai 时代方向的长视频,比如马斯克基点时代,还有泡泡玛特为什么爆。 但是在做完这些内容之后,我发现一个问题,我不是没有学习,也不是没有思考,而是这些思考很容易散掉。 昨天看的一个观点很有启发,今天的这个案例很有奇发,明天看处理的这段话也很有启发。 但是真正要写脚本做选择题的时候知识很少,想法也很少,每次都要整理这些观点,想用的时候找不到,过几天就忘了。这些问题经常存在。 这时候我再一看 capacity 的 l l m knowledge basic, 突然觉得它刚好能解决我做内容时遇到的问题, 所以我开始用 obsidian 和 quadas 来搭这一个系统。 obsidian 是 我的长期记忆,它负责沉淀我的原资料、方法、模型以及概念等等等等。 而 codec 作为我的外脑和协作者,他帮我把我的输入整理、拆解、提炼、整合我的想法以及补充可以输出的方向。 所以这期表面上是在讲 codec 和 obsidian, 本质上是在讲我怎么把学习、思考、自媒体、个人网站和长期项目放进同一个工作流。 现在我的核心工作流是输入 content、 整理、 obsidian 沉淀内容输出和项目推进。如果用 capacity 的 说法,它可以拆分为三个动作,第一是 english, 第二是 crease, 第三是 ling ing。 就是 我们要把原始资料摄入出来,把它结构化变成可以解锁、可以链接的输入。 而 cv 的 话就是当我要做选择题,做脚本判断项目的时候,我们可以基于我们自己的数据库来进行一个输出。这和随便问 ai 是 不一样的,因为它可以调用自己的资料,自己的判断以及自己的项目记录。 比如说这就是我的一个 queries, 我 想让 query 来帮我给一个下一步的计划,它就可以调用我自己的一个数据库来进行一个问答。 第三是 link, 它会定期检查我们的知识库有没有更新,有没有重复锻炼、混乱以及过时的内容。 以前我认为知识库只是一个高级的笔记软件,但是后来我发现如果单单的存储 opc 点,最后也会成为另一个收藏家。所以我给我自己的原则是,整理的目标不是让目录变得漂亮,而是让笔记更加容易附用链接和推进项目。 现在我的 o c 点知识库大体分为四块,第一块是原资料,第二块是概念,第三块是方法与模型,第四块是项目 原资料、放书、视频、文章、博客这些输入概念。回答它是什么?比如情绪价值、复利该几点方法与模型。回答怎么做? 比如内容制作流程、项目管理、反制期检查项目,就是回答下一步做什么,比如自媒体、个人网站以及本月的计划视频。 这四块连起来后,我就不只有一堆笔记,我有的是一个从输入到输出的系统, 比如说马斯克经典预言这一本书。以前我可能只会记几个观点, 比如说算力、基点、人员数据编辑效应,但是我现在会让它进入流程 code 会帮我生成这本书的简陋概括、核心观点、具体观点的整理,还有重要概念、专业名词, 比如说 ai 基点、算力、提问能力、第一性原理、化学科学习。然后它会结合我的 obsidian 知识库,给出一个可转化的输出, 然后保存我们的原始资料,最后链接到我们的项目当中。 这样一条资料就不仅仅是一条资料,而是一个可以反反复复调用的一个知识节点。泡泡玛特也是一样,从表面上来看,它是潮玩盲盒以及 ip 的 运营。 能拆开来看,它链接的是情绪价值、精神消费、用户的自我投射,以及品牌的叙式。 如果我要做内容,他可以变成为什么年轻人愿意为情绪价值而买单。 如果我要反思自媒体,他也会提示我,内容不只是信息,更要提供某种情绪价值。这就是知识库真正有用的地方。他不是把东西存起来,而是将一个内容在不同的情景中被重复使用。 那么 code 具体帮我干什么呢?第一是降低整理的成本, 判断资料的类型、命名、分类、规范,根据主笔记的结构来整理,拆概念、补双链、 归党校验,最后更新这个 skill。 这里面每一步都不难,但是加起来就非常的耗精力,我把规则告诉 codas, 它就能按照我的结构来帮我处理。 第二是反问我自己,当我向他寻求建议的时候,他不会无脑的说加油,而是先看我的目标,再看这个事情的需求,再看变现,看资源,看沉淀,最后给出最小的下一步。 当我落实到今天本周就可以做的内容,让我可以把我的时间放在真正高质量的输入之中。 以前我是项目驱动,看到什么就学什么。现在我更像是项目驱动,先有了长期目标,再让输入服务于这个方向。 所以说这个知识库最后不是为了记笔记,它会链接到我的自媒体、 个人网站以及 ai 工具,还有未来的一些长期的项目。比如说我做完一个视频,不是发完就结束,它可以进入 o c 点,变成项目的复盘,选择题,来源、脚本结构、发布效果、评论反馈以及下一次的改。 如果这个选择题还值得做,他就可以变成长视频、短视频、文章,甚至个人网站上的案例,这样内容就不再是一次性的消耗品,他会慢慢沉淀为我的资产。 所以总结一下,对于我来说, copy 加 excel 主要解决五个问题,第一是让输入不再闪掉。第二让思考可以被反复调用。第三让项目有明确的下一步。第四,让我的内容生产不再完全依靠灵感。 第五让学习表达、自媒体、网站以及未来慢慢连成一张网。 当然,这个系统很早期他不完美,但是已经改变了我的行动方式。以前的我总是想,最近有什么热点我可以追。 现在的我,先看知识库里面真正的问题,我最近关心什么?哪些材料已经积累到可以输出?哪些观点是我反复思考过,而不是临时看热点追热点听出来的? 这会让内容更像是我的系统里面长出来的,而不是临时拼出来的。 如果你也有这种感觉,收藏了很多东西,但是真正要用的时候找不到,看过很多内容,最后只剩一个模糊印象。每次想做输出,但写脚本都像从零开始。 那么你可能缺的不是更多的资料,而是一套自己的知识流转系统。如果你也想搭个人知识库,我们先问四个问题, 你真正关心的主题是什么?你的资料最后要服务于什么?你可不可以把每条输入拆成概念、方法或者案例?第四,你到底可不可以每周产出一个东西? 因为知识库最重要的不是他存了多少,而是他让你更清醒,更能行动,更能输出。 对于我来说,我不是在搭一个笔记软件,我是在搭一个长期能让我复利的一个系统。不要只收藏,只感动,只计划, 要把知识变成行动,把行动变成作品,把作品沉淀到长期的资产。我也还在不断探索着 obsidian products 和 ai 工作流的用法。 如果你也对个人知识库爱,关注实践内容的输出,以及怎么样 ai 提升自己学习和赚钱的能力感兴趣,欢迎私聊我,进我的微信群,让我们一起讨论,一起进步。 在群里我会持续分享时间、过程、工具用法、踩坑记录、选择题思考以及项目的复盘。我们不再是聊概念,和自己一起把爱用起来,把想法变成作品,让他真正赋能于我们的实际生活之中。 感谢你对这期视频的观看,如果呼声高,我下期将会逐步逐步带大家用 obsidian 和 quadas 来搭建属于你的个人知识库。感谢你的观看,我们下期再见!

大家好,今天来分享一期谷歌 antigrati 零基础教程,我会从十四个点分别介绍 antigrati, 结合案例一步步带大家更加了解 antigrati。 第一部分, antigrati 介绍如果你以前听说过 cuda、 cloud code code, 或者听说过一些 ai 编程,但是不知道这些工具怎么用,这期视频就是给你准备的, 我会从最基础的地方开始,一步步带你看懂 antiquity 是 什么,怎么安装界面,怎么看,怎么让它帮我们写代码,检查网页、连接外部工具,以及怎么用 scare 来帮我们固定工作流程。 简单说, antiquity 不是 一个普通的代码编辑器,它更像是一个可以管理 ai 员工的工作台,不是只让 ai 回答问题,而是可以给他一个任务,让他自己规划,自己写代码,自己打开浏览器检查,最后把结果交给你确认。这就是这期视频要讲清楚的东西。 如果你第一次接触 integrity, 看完这期视频,你至少会三个问题,第一, integrity 能做什么?第二,普通人应该从哪里开始?第三, m c p、 scares、 ross。 这些东西听起来很专业,到底是什么意思?视频制作不易,欢迎大家三连。 第二部分, antiquity 是 什么?你可以把它理解成一个 ai 版的代码编辑器,但是这个说法还不够准确。传统代码编辑器,比如 vs code, 主要是用来写代码,打开文件,自己运行,自己检查。 后来出现了 ai 编辑器,比如 coder, 它可以在你写代码的时候帮你补全,帮你解释代码,帮你修改某一段代码。再后来出现了 cloud code、 cortex 这类工具, 它们不止补全代码,而是可以帮你执行一个任务,比如修 bug、 写测试、生成网页。而 antgrity 更进一步,它的重点是 ai 帮你写几行代码,而 ai agent 帮你完成一个任务。 这里的 agent 我 们可以理解成一个智能体,你不用把它想得太玄乎,其实它就像是一个会自己干活的 ai 助手, 告诉他帮我做一个登录页面的开发,他不会只回答你一段代码,他会先理解你的需求,然后按照当前文件夹有什么文件,再列出任务清单,写实施计划,修改文件,运行项目, 打开浏览器检查页面,最后告诉你他做了什么。普通 ai 更像是在回答你的问题, integrity 更像是在替你执行任务。 所以我们可以用一句话总结, antiquity 是 谷歌推出的以 ai agent 为中心的开发工具,它可以让 ai 在 编辑器、终端、浏览器之间工作,帮你完成比较复杂的软件任务。如果你不会编程, 你可以把它理解成一个能够帮你做网站、看项目、改代码、写文档、查问题的 ai 工作台。第三个, ontgrity 和其他 ide 的 区别很多朋友问,那我经常听说 cuda、 cloud code code dex、 ontgrity 和它们有什么区别? 其实 ai 编码编辑器基本能力已经拉平, m c p、 scare 多 agent 等这些 ai 代码编辑器都能够实现。但是 ontgrity 强调的是 agent first, 还有免费的模型可用,内置的有最新的 gmail 模型, cloud 模型。所以我们重点分享 integrity。 integrity 的 特点是什么?它最特别的地方就是 agent manager, 专门管理 ai agent 任务界面,你可以把它理解成一个任务控制台。以前你可能打开一个聊天框和 ai 来回聊天, 但在 antiquity 里面,你可以同时打开多个任务,比如 agent 帮你做网页, agent 帮你测试,一个 agent 帮你怎么研究部署,你就像一个项目经理一样,在这个界面可以管理它们。所以 antiquity 的 核心不是一个聊天框,而是多个 agent 任务管理, 这就是它和很多 ai 编程工具不一样的地方,当然工具没有好坏。 integrity 更强调 agent 的 自动执行,浏览器验证、任务管理和工作过程可见。第四部分, integrity 安装、登录和出手话设置。大家直接在浏览器里面搜索谷歌 integrity, 进入官网, 进入官网之后点击 download, 支持 mac windows linux, 如果你是 mac, 下载完的软件,拖进 application 就 可以。如果你是 windows, 双击直接安装,跟普通软件一致。第一次打开 antiquity 的 时候,它会让你做几个出手话设置。 第一个设置是否导入你以前编辑器里面的配置,比如 vscode 浏览器。如果你是新手,我建议你不用纠结,直接点击默认配置就可以。第二个设置,选择主题,浅色深色,这个完全看个人习惯。 第三个设置比较重要,是 a 件的工作模式,也就是你希望 ai 有 多大的自主选择权。有些模式比较保守, ai 做关键决策之前会询问你的意见。有些模式比较自动, ai 可以 自主执行更多命令。 如果你是第一次用,我建议你选择 review drive development。 最后一步,需要登录我们的谷歌账号,我们点击登录 选择自己的账号, 登录完之后,我们就进入了主界面。第五个, antiquity 主界面结构介绍如果你用过 vs code, 大家可能会觉得很熟悉,左侧是文件列表,中间是代码编辑区域,右边是 a 帧的区域。我们可以在这个 a 帧的区域下侧 选择模型,它内置的有 gimini 最新模型和 cloudsonitops 相关模型,自己手动可以切换。如果你只想修改一个文件,或者问一段代码什么意思,可以让 ai 修改这个小功能, 我们直接拖进输入框跟它沟通就可以。或者通过 app file 命令,然后选择自己的文件跟它沟通就可以,它会帮你完成相应代码的调整。还有一个比较重要的功能叫做 agent manager, 这才是 antigue 最有特色的地方。 agent manager 可以 理解成 ai 任务管理台,你可以在这里创建任务,查看正在运行的 agent, 看它完成了哪一些步骤,查看它当前的计划截图和总结。这个界面通常会看到以下几种东西,第一个 workspace, workspace 就是 工作区,也可以理解成一个项目文件夹,比如要做一个网站,就新建一个网站项目目录文件, ai 在 这个项目里面生成文件,修改代码,都会放到当前工作区。第二个 conversation, conversation 就是 一次对话,也可以理解成一次任务, 比如帮我做一个个人主页,就是一次 conversation。 第三个 browser, browser 就是 浏览器 integrity 的 agent, 可以 打开浏览器看网页,点击按钮、截图、检查页面都没问题。第四个 terminal, terminal 就是 终端,很多项目需要运行命令,比如安装依赖 启动网站、运行测试 agent 都可以在终端里面执行这些操作。所以 integrity 的 界面可以理解成 edit 是 你和代码一起工作的地方。 agent 的 manager 是 ai agent 干活的地方, browser 是 ai 检查网页效果的地方, tome 是 ai 执行命令的地方, workspace 是 存放所有文件的地方。第六个, agent 是 怎么工作的?接下来我们看一下 integrity 最核心的流程, agent 是 怎么工作的?我们不要把它当成一个聊天机器人,它更像是一个会按步骤的工作助理,给他一个任务,比如帮我做一个个人簿客,它通常不会乱写代码。第一步,它会先理解需求, 它会判断你到底要什么页面,需要哪些模块,用什么技术来实现。第二步,它会扫描当前项目,也就是当前文件夹。 workspace 是 空项目,还是已有的 rack vue 这样的项目。第三步,它会生成一个 implementation plan, 也就是实现计划。它会告诉你准备修改哪些文件,为什么这么改。如果我们对它实现的计划我们不太满意,我们可以直接添加评论,它会按照我们的计划修改。第四步,它会生成一个 tasklist, 也就是任务清单,比如创建项目目录结构,创建簿刻的列表,还有文章详情,导航,启动本地服务,打开浏览器检测修复,发现问题会创建一个 task list。 第五步,才是真正它修改代码的地方。 第六步,它会运行命令,比如安装依赖启动项目,跑测试,它会打开浏览器进行验证。这一步非常重要, 因为很多 ai 工具只会写代码,但不知道页面长什么样。 integrity 可以 自己打开页面看效果,截图,发现问题自己修改。最后一步,它会生成一个完成总结, 它会告诉你我做了什么,改了哪些文件,怎么验证,都有相应的截图。所以 integrity 的 完整流程不是你问我答,而是你给任务它规划、 执行,验证、总结,然后你 review, 这就是 agent 工作流。第七个,我们讲一下 advise, 我 们刚才提到了 task, list, implementation, plan, workflow, 这些东西都是 integrity 里面叫做 atiface。 atiface 这个词听起来有点专业,你可以把它理解成 ai 干活过程中留下来的工作材料。比如一个真实员工完成任务,不应该说一句我做完了,他最好告诉你我计划怎么做,我实际做了什么,我遇到什么问题, 我怎么检查结果,还有哪一些风险? adfast 就是 这些东西。常见的 adfast 包括任务清单、实现、计划、修改、总结、浏览器截图、页面录屏、测试结果、知识记录。为什么这个东西重要?因为 ai 最大的问题就是黑箱, 他改了很多文件,你不知道为什么这么改,他说已经完成了修改,你不知道有没有真正检测,他说没问题,你不知道有没有跑过测试。 有了 atfast, 你 就可以检查它的过程,你可以查看它的计划是否合理,查看截图是否符合预期,可以查看它有没有启动项目,有没有报错。所以 anti grati 的 思路是, ai 不 止交付结果, 还交付了整个过程,对普通用户非常重要,因为你不一定能看懂每行代码,但是你能看懂它的任务清单, 截图和总结。第八个,浏览器能力,让 agent 自己检查页面。接下来我们介绍一个特别实用的功能,浏览器能力。普通 ai 写完网页的时候经常有一个问题,他觉得自己写好了,但你打开一看,页面很丑, 按钮重叠,可能文字超出屏幕,手机端完全断掉。为什么?因为他是在生成代码,不一定真实看个页面。 antigrity 的 浏览器能力就是为了解决这个问题,它可以帮你打开本地网页,运行在 logos 的 三千,也可以自己打开这个网址。我们给他一个网站,帮我测试一下。个人簿客点击发送, 它可以滚动页面,可以点击页面按钮,可以输入内容,可以查看控制台报错, 也可以截图。如果发现问题,还可以回滚代码继续修改。所以以后你让他做网页提示词,里面一定要加一句, 完成后启动本地服务,打开浏览器检查并提供截图。这句话非常重要,因为他会强迫 agent 不 只写代码,还要检查结果。第九个, mcp。 mcp 全称是模型上下文协议 model context prote, 这就是 ai, 可以 调用外部工具,你只需要知道 m c p 是 让 ai 连接外部工具的接口。没有 m c p 的 时候, integrity 主要是看你本地项目的文件 运行终端,打开浏览器。但现实工作里,我们需要连接其他工具。我们一起来看一下 integrity 如何安装 m c p。 我 们来到右侧的 a 镜的区域,点击三个点, 选择 m c p server。 大家可以看到这里有很多 m c p 服务,比如数据库相关的, github 相关的,比如数据库相关的,我们的 agent 就 可以通过这个 m c p server 去连接我们的 my circle。 github 相关的,我们的 agent 可以 安装 m c p 服务来连接我们的 github。 本地,我们来演示一个设计稿相关的 fig 码,我们可以在这里搜索, 因为我这里安装了,如果没有安装是 install, 首次点开,我们直接点击安装,这样我们的 m c p 服务就能安装。在本地,这里安装的是 figma 的 m c p, 也就是我们的 agent 可以 去读我们 agent 中的设计稿,我们一起来看一下。我们返回 agent, 我们来到设计稿,我这里有一个设计稿,我们选中 copy link to selection, 给他一条指令,帮我读取设计稿,然后点击发送。这些外部工具怎么连接到 ai? 这个时候就需要 mcp, 你 可以把 mcp 想象成一个插头, 数据库有数据库的插头, figma 有 figma 的 插头。 antgrity, 通过这些插头就能让 agent 使用对应的工具。所以 mcp 解决的问题是,什么? agent 能连接什么?我们这里配置了 figma mcp, agent 就 可以读取设计稿, 然后帮我们还原页面。我们刚才看到了,在 figma 中,我这里有一个设计稿, antgrity 安装了 figma, mcp 给他了 figma 的 设计稿的地址, 它已经帮我分析出来了,这是一个电商设计首页,这个页面的核心板块,它都已经帮我分析出来了,背景色、主色调它都能分析出来, 说明我们的 agent 通过了这个 m c p 连接到了我们 figma 这个外部工具。但是这里一定要注意安全, m c p 一 旦连接外部工具, 也就意味着 agent 有 更多的实操能力,它这里可以来读取我的设计稿。一句话总结, mcp 是 integrity 连接外部世界的一种新方式,也是所有的 ai 工具都是通过 mcp 来连接外部服务,让 agent 具有更强大的能力。第十个 scares, 让 agent 学会固定工作方法。 刚讲完 mcp, 我 们再来讲讲 scares。 scares 也很重要,而且和 mcp 很 容易混淆。我们先用一句话区分 mcp 解决的是 ai 能连接什么工具。我们刚才使用 mcp 连接我们的设计稿,它能够读取我们的设计稿。 scares 解决的是 ai 遇到某类问题该怎么做,比如让 ai 做代码审查。我们来演示一下,大家可以打开这个网站,这个网站有常见的 scares antiquity 的 常见 scares, 我 们一起来看一下,这里说选择你的工具,我们这里使用的是 antiquity, 我 们复制这个命令,来到我们的 antiquity, 打开终端,输入这个命令回车,这样就可以把我们这一个工具包里面常见的 scares 都安装上。我们稍等一下, 安装完了,我们来看一下有哪一些 scares。 我 们通过 nps scares list 就 可以查看, 我们刚才安装的这个插件里面有很多 scares。 我 们来找一个代码审查的 scares, 我 们就拿这个 code review scares 来举例,我们复制一下它的名字,来到 agent 的 区域,给他一条指令, 使用这个 scares 帮我检查当前类的代码,我们发送给他,我们稍等一会儿,如果没有 scares, 它会没有规范的检查代码, 然后说代码不错,但是如果我们给他一个 scar, 这个 scar 里面写清楚,先看代码的改动,再找 bug 有 没有风险,有没有缺陷测试,最后再看严重的输出问题。下次 ai 做代码审查的时候,就会按照我这个 scar 的 这个流程 来检查。你可以把 scar 理解成 ai 的 工作说明书,告诉 ai 遇到这个问题,按照哪一些步骤来执行,需要注意哪些问题,最后的输出格式是什么?这就是 scar。 比如说常见的有很多开源的 scar, 我 们也可以自定义 scar, 比如说写文章,写小红书,代码审查,写测试,数据分析,都有很多很多 scar。 如果要区分 mcp 和 scar, 可以 这样记, mcp 像是工具箱,负责连接工具。 scar 是 说明书,告诉 ai 怎么干活。 我们看一下刚才我们用的这个 scar 来分析这个页面,它已经执行完了核心审查中发现架构与 seo 瓶颈,版权、年份印编码, 是不是它分析出来了,有这么多缺陷?这就是我们用的这个 code review scasse。 在 后面我们会通过一个具体的案例来进行演示,这里使用的是一个 scasse。 第十一个 rules workflows, 我 们一起来看一下。 除了 m c p, scarce 还有两个概念值得讲一下,一个是 loose, 一个是一个是 workflows。 loose 就是 规则,我们看一下在哪里配置 loose, 我 们打开 a 键的区域,点击更多, 我们选择第一个,这里有一个 loose, 我 这里已经配置了两个。看一下,这里有一个是前局的 global, 还有一个是 workspace, 我 们来打开看一下, 我这个例子很简单,它的要求就是回答用简体中文, 它是一个前局的,所以看到 agent 的 回答的时候, 他回答的时候是不是把我们的这个回答变成了中文?这就是我们配置的一个规则。我们常见的在这个 list 里面,我们可以配置配置的有,比如说默认中文回答这个项目使用的语言,不要使用哪一些库, 所有的按钮都要和设计系统里面的组建一致,修改代码后必须要运行测试,这一些都是长期规则,也可以结合自己的项目来设置自己的规则。这个规则可以针对的是当前的 workspace, 也可以是前局的, 这是 loose workflows, 是 工作流,是一致的,它也是有前局的,跟 workspace。 我 们看一下,我这里配置了一个前局的 workspace f two p, 它的描述是根据设计稿还原页面,这个是我们等一下要做一个项目案例演示的, 我们看一下,它里面写的很简单,第一个深度拉取数据,通过 m c p。 第二步样式对齐,跟设计稿的样式要对齐。第三步才是结构化编码。第四步是动态注入, 就是扫描设计稿上的一些组建。第五步是视觉检查,定义了 workfloor, 它其实就是一个工作流。接下来我们 来演示案例的时候,他会按照我们定义的一二三四五步这个工作流来完成我们代码的一个实现。比如说我们一个发布的流程,先跑测试,再更新版本号,再写 log, 再打 tag, 再部署,这就是一个完整的一个流程。 我这里定义的这个流程就是我们会根据 fake 码上的一个设计页面,然后来生成代码,它规范的一个流程。 这几个概念跟大家再总结一下, roles 就是 要遵守的规则, skills 就是 需要用到的方法包 ai 使用的说明书。 work flows 就是 一套固定的工作流程, mcp 是 连接外部的工具的接口。第十二个权限和安全,我们来看一下 a 境的权限, a 境它能做什么?第一个,运行命令,打开浏览器,获取和编辑代码,还有使用工具, 比如说配置 m c p 可以 使用外部工具。 a g 的 能力很强,但权限有限,我们只能让他在明确的边界内工作。第二个权限最小原则,明确边界,我们尽量只给他当前项目的工作目录。第二个代码需要有一个版本管理, 他可以读写删代码,所以我们需要一个代码的版本管理,防止他误删。 第三个,不要给予最高的权限使用,普通用户运行不需要 root 管理员权限,避免系统级风险。第四个,高风险操作必须需要有一个确认, 我们可以配置规则,比如说删除文件,部署项目,修改数据库,系统配置,这些都需要经过人工确认才能执行操作。 敏感信息我们绝对不能交给 agent, 比如说密码,密钥,生产环境的权限,还有敏感的配置,我们这一些信息千万不能交给 agent。 最后我们总结一下,给 agent 最小的权限只能在当前项目目录中工作, 所有的代码变更都需要通过 get 管理,不要使用管理员权限,避免系统风险。 高风险,必须高风险,操作必须经过人工确认,防止误操作,敏感信息不共享, 保护密码,生产环境更安全。定期审查 a 件的操作日记,及时发现异常。第十三个完整案例演示,我们通过一个具体的案例 来把我们刚才所分享的一些 mcp, scare, workflow, rules、 figma, 我 们结合起来,把这些知识点结合起来,生成一个完整的案例。我们这一次要实现的一个功能是 figma 中的一个设计稿,也是 ai 生成的,我们打开看一下, 就是当前页面一个电商的首页,我们再来看一下 ai 生成完的页面是什么样子,这是 ai 生成的页面,我们的 integrity 需要读取我们的设计稿,我们这里用到了一个 mcp 服务是 figma, mcp 这里安装就可以。第二步,我们讲一下 rules 和 workflows, workflows 里面我们配置了返回用简体中文,刚才前面已经讲过。第三个 workflows workflows, 这是我自定义的一个工作流,然后定义了五步, 这个五步里面插入了一个东西,插入了一个 scare, 看一下。最后一步,使用 webos code review 这个 scare 做代码分析, 它会按照我们的这个工作流来给我们生成代码。这里讲到了 rose 和 workflows mcp, 我 们看一下它是怎么实现的,怎么来还原我们这个设计稿的,我就给他了一个指令, f two p 是 我们刚才定义的工作流,然后给他了我本地 figma 的 一个设计稿地址,这是通过 mcp 生成的,然后它会给我们生成一个计划, 我们计划怎么看呢?我们只需要点击 atfast implementation, 它给我们写了一个计划,需要我们确认的有三点。 刚才我们定义了 workflows, 第一个环境准备、结构转换、样式迁移、动态注入、交互、实现格式化检查和代码审查。这个代码审查我们是不是用到了一个 scare, 然后他会按照他自己制定的这个计划来实现,他会给自己列一个 tasklist, 最后 tasklist 他 都完成了之后,他会生成一个 walkthrough, 就是 一个结果结果报告,他生成的结果报告里面有截图还原效果图, 还有帧机演示图,这是一个视频,对不对?最后还用到了我们定,我们给他定义的这个 scale 写了一个代码规范审查的一个合规报告,比如说代码逻辑完整性、 t s 严谨度,还有交互性审查,它都做了一个检查,这样它是不是把我们的 m c p, scare rules, workflow 这些都结合起来, 生成了我们这个代码,这个代码的这个代码运行起来就是这样的。第十四个总结一下,到这里我们把 antiquity 零基础内容完整的走了一遍,我们讲了它是什么,和其他 ide 有 什么区别,怎么安装 主界面怎么看, agent 是 什么? at first 是 什么?浏览器怎么用, m c p scale workflows 是 什么?以及最后我们生成了一个完整的实操案例。 如果用一句话总结 antiquity antiquity 它不是 ai 在 旁边给你提建议,而是让 ai 进入编辑器终端浏览器,帮你真正完成任务。 它代表一种新的工作方式,以前我们在 id 里写代码,现在我们在 id 里管理 agent, 未来的软件开发很可能会像这样人负责目标判断、验收, ai 负责执行检查和总结。 好的,这期视频就分享到这里,希望你有所收获,如果你觉得有帮助,别忘记三连,我们下期见。

最近发现使用 codex 帮你读书非常的方便,它可以帮你非常好的提炼一本书里面非常核心的信息,生成逻辑关系非常清晰的笔记,甚至是一些脑图。在我桌面上有一本书是介绍 ai agent 的, 它非常的新,目前没有中一本。那我希望比较快的掌握这本书里面核心的东西,就可以使用 codex。 我 就跟他说一下,我桌面上有一本书,我想让他帮我总结一下这本书里面的信息,生成 abc, 并且生成 xmind, 你 直接发送给他,他会读取本地桌面的文件。 现在他开始去搜索这本书了,你会看到他调用了一些命令行来读出文件。这个东西叫抛血,就跟 linux, linux 系统里面的命令行差不多,是 dos 命令行的现代版, 但它就已经生成好了,你会看到它生成了一份 markdown 文本,一份 canvas, 然后还有一份 xmind。 我 们打开 upstart, 这就是它所生成的一个 canvas, 它会整理不同章节之间的一个逻辑关系,然后还会告诉你推荐的阅读顺序是什么。那如果你想要让逻辑更加清晰一点,也可以打开 xmind, 它也生成了这个文件, 然后他会总结一下不同章节主要介绍的是什么。然后你把它放大,他会有非常详细的一些总结,你觉得这样非常好用,因为尤其是你想要主要去浏览一下这本书,他主要介绍是哪些内容,他值不值得去深入的去阅读,就非常的方便。

现在 web coding 很 火,所以我也想来分享一下 web coding 的 经验。我使用的工具是 codex 跟 vs code, 这几个月我用了这两个工具,开发了不少的项目, 对我来说它们两个组合可以做任何事情。那么话不多说,立马打开网页搜索 vs code, 并且进行下载安装。安装完之后打开桌面上的 vs code, 然后我们来安装几个主要的插件, 点击这个图标进入插件库。第一个要安装的是切换语言的插件,在输入框中输入 language, 然后安装, 安装完成之后按下键盘的 ctrl shift 加 p, 这样就可以选择中文了。接下来就是安装 codex, 这个插件安装完之后,你需要按照它的步骤进行账号的登录,我暂时就不赘述了。 准备好这些插件之后,就可以打开一个文件夹,或者新建一个文件夹进行 ai 编程。如果你打开的是一个空的文件夹,那么先在这个文件夹下面创建一个新的文件,并且选中这个文件,这个时候右上角就会出现欧风 ai 的 logo, 点开它,那么 ai 的 对话框就会弹出来,可以简单的看一下这里的权限选择跟模型,然后选择自己需要的选项。 如果你是一个没有开发经验的人,在进行 ai 编程之前,我们需要知道自己项目的大致描述,比如说我现在要制作一个个人的介绍网站,那么我只要告诉 ai, 帮我做一个个人的介绍网站即可。 现在我已经在输入框中输入了我的需求,并且目前的权限是完全访问模式, 这个时候你可以输入一个空格,再输入一个斜杠,选择计划模式,或者直接点击左下角的加号,把计划模式点开,然后回车发送消息。 因为开了计划模式,过一阵子之后, ai 会根据你的项目询问你几个问题,你只要根据你的情况进行选择就可以了。接着 ai 会根据你的回答制定出计划,你可以选择执行计划,或者说再提出你的需求。 当你选择实施计划之后, ai 就 会开始编程,中间也有可能会出现问题,你只要按照他的提示来就可以了。 完成之后,如果你不知道如何运行项目,你可以看他给你留下的文档,或者说你可以直接问他。 现在我来查看一下 ai 给我做的个人网页,总体看下来还是挺不错的。后面如果你需要更改任何的内容,你都可以告诉 ai, 比如说我在这里让他帮我把名字修改一下, 也是直接发送命令,然后等他完成即可。如果你是新手,那么就慢慢来,不要着急,有问题就跟 ai 沟通,或者也可以在评论区告诉我。

最近 codex 更新频繁啊,而且能力越来越强,并且比起 cloud 来说呢, gpt 的 额度更高,而且功能更全,现在还有 emoji 能自动抠上手呢,也比较简单, 而且 becloud 更加的安全啊,不会出现这种限速封号的这些问题。本期视频带来一个 codex 桌面端的完整教程,主要分为呢下面这几个章节,然后从您会教你,从您开始搭建一个简单的项目,并且最终部署上线。 长视频录制不易,希望大家多多支持好不多废话,我们马上开始。好,那安装呢,也是直接来到它的官网啊,在官网的话把这个包下来直接装就可以了,这也是比较简单的。 好,那装完之后呢,我们直接把这个 app 打开啊,打开之后呢,直接用这个使用器的 gpt 继续啊,就是用 gpt 账号登一下,点完之后它会跳转到这个登录页面,我们直接 把这个是就是登一下你的 gpt 账号就可以了。好,进来之后呢,他会有这个会问一下你是做什么工作啊?想,这个其实随便选就可以了啊, 这边的话你可以随便选几个,他会其实会自动自动的去帮你装一些 skill, 当然这个也是无所谓的,后面可以自己装,直接点继续,当然你也可以跳过啊,这其实无所谓,那这个话是一个新功能,就是一个它导入, 你可能有一些其他的一些的,像我们之前装的 cloud code 啊,他会识别到,识别的话他可以导入,但我们这边的话是从零开始的话,我们这边的话是演示一个空的啊,给大家做演示,直接跳过。好,那进来之后呢这些啊可以点这个,当然这是 mac, 可以 点允许啊 啊,进来之后呢,他是一个比较简单的一个画面啊,啊,那他也是自动适配是中文的,然后左边的话有是任务栏啊,你可以点一下这个新建一个绘画。新建一个绘画,我们这边的话是从零开始,我们就搞一个空项目啊, 啊,搞一个空项目来做演,给大家做演示啊,这边的话是给大家做一个新的一个空项目啊,左边这边的话你会看到他弹出来一个项目,然后我们在这新项目中开始一个对话。那在新项目里边开始对话的话呢?我们就让他,呃,这边的话会有一个权限 啊,你可以点过来之后呢,他会有默认权限,还有自动审查完全访问权限,完全访问权限他会告诉你说分线比较高,这边的话我们就选这个自动审查,他会呃,会提前要使用自动审核。好,我们用这个, 这会比较方便一点。好,接下来的话我们就开始干我们的这个新项目,我们做一个这个汽车洗护店的一个网页啊。好,这边的话你可以选择你的模型的智能程度啊,这边的话选 g p t 五点五啊,速度话选标准,当然话你选那个另外一个一点五倍速额度会用的快啊,快一点。 好,那这样的话直接开始我们就直接开始演示啊,让他先给我们做一个网页。好,直接开始。好,你在干这个项目的时候,其实你可以在左边这边继续开始这个一个新的绘画,你开始一个新绘画之后,他不会打断原有的绘画,你比如说你可以问他一些简单问题啊。 ok, 那 然后他会告诉你,你现在是一个 codex, 它是 codex 嘛?然后再搞一个什么项目,然后左边这边的话,你的这个另外一个你在做网页的这个还在跑啊,这个任务的话还在跑,那跟那边的话其实是不冲突的。 但除了在这个项目里边开始对话,你也可以开始一个就是单独的绘画,这跟就跟刚才我们新建的项目就没有任何关系的啊。比如说你说南京今天天气怎么样,你可以问一问他啊,这样的话你也可以把智能程度调的调低一点,因为这天气比较简单的问题啊。 好,那这样的话你可以看到左边两个圈的话,在这边转的话,其实两个任务在一起走啊。好,这边的话也是很快告诉你今天天气怎么样。好,这边的话就是你也可以看到我们原有的这个项目呢,这个任务还在继续跑。 好,那随着时间的推进啊,他也会呃,有一些什么等待批准之类东西跳出来啊。像这样的,那你这时候点元雪,点雪的话他会加载一个页面的渲染,那当然的话他任务还会继续跑。好,我们也可以看一看他现在渲染的这个样子。 好,这边的话其实可以用一个批注模式,批注模式我们一会再讲,你可以把它放大来看一看他现在做的一些东西啊。好,那整个做完之后呢,我们也可以大概的看一看他做了一些什么东西啊? 那当然呢,他做完之后呢,我们也发现啊,这个汽车的名字,这个养护店的名字,我们给他改一下,比如说我们可以继续跟他聊,比如说把这个名字啊,改成热心网友的这个洗护中心啊,然后呢他就会继续修改啊,把这个名字给他改掉。 好,那这样的话我们再继续演示一下这个批注模式,批注模式是一个比较常用的修改功能,像你在这个 web coding 的 时候啊,你在这个前台有一些这个啊想需要的一些修改,像,比如说这些,我们给大家演示一个,比如说这里 啊,我们让他用这个 ai 的 深图功能,像做一个 logo 啊,像因为这个 codex 最近的这个 image two 功能非常的强大,在 codex 里面也可以直接的用。好,我们之间给他,给他一个标注,让他用这个深图功能来给我们做一个,做一个 logo。 好,那下面的话我们再看一看这个门店地址啊。 ok, 这个门店地址他其实是一呃,也是比较假的一个门店地址啊,那我们给他呃,搞一个真实一点的,比如说我们就搞一个,让他开到小米小米旁边啊。 啊,小米的汽车卖的比较火。好,我们直接给他改个地址,让他开到我们这个小米小米旁边啊。好,然后呢我们就直接回车,那他就会把这两个任务呢给他下发下去,我们刚才做两个标注啊,让他去跑啊,让他来做修改。好,那你看 啊,出现了一张图片,对吧?开始这个做这个身图啊,做一些 logo 啥的嘛。好,然后我们的地址啊,也已经改好了,可以看到啊,他把这个地址改到小米旁边了。好,没问题啊,我们把店就开到小米旁边,做小米的生意。 好,那下面的话我们再做一些其他标注,比如说这里边的话,我们可以给他加一个啊,地址的这个图片啊,我们去这个网上截一张图给他啊,我们把这个图发给他,然后告诉他我们的地址在哪里,再加一个标标注啊,把这个图片我们标注一下这个图片我们不要这个图片,然后把我们的地图给他放进去 啊,告诉他这个我们店在什么地方。嗯,好,那他的话也会很快就开始做啊,这边的话还有一个重要东西,你会细心的观众会发现我们在这个聊着聊着这个这个圈呢,他一直在涨,这就是一个上下文的压缩信息啊, 上下文要做信息的话,他,呃,你如果太多,多了之后啊,他会可能会感觉到有些笨,那这个时候我们就给他这个项目加一下背景信息,这样的话你开一个新窗口,你重新给他开始聊天,他会一下子就知道这个项目的一些呃,基础的信息。 好,那这样的话我们给他加一个背景信息,那这个背景信息生成之后啊,也可以看一下啊,保留了我们这个热心网友的一个 logo 啊之类的啊,一些项目金属信息。好好,接下来给大家演示这个计划模式啊。计划模式就是说你,呃做项目的时候,就是他会先 来啊,给你列出一些计划,给你做一些学问,然后他不是先执行的,就先练计划,练完计划之后,然后再开始执行。而这边的话,我们把这个项目改成 next g s 这框架 啊,改成 next g s 框架的方面,我们的部署好这边的话他也会。哎,你看头先问你对吧?那我们看问你这个项目怎么改 啊?这边的话有一些是就是推荐啊,有一些什么的你就按照你自己的想法来改就可以了。当然有些东西我我其实不是搞 next, 我 有一些东西我也不懂啊,这边的话有一些他会有这个感叹号之类的,你可以把鼠标放上去看,这是什么意思啊?好的,我们给他反馈了之后呢,他就开始列这个完整计划啊, 那这边啊,他还就问你用 ts 还是用什么啊?但你也可以直呃也方,你要是觉得方便可以直接选他的这个推荐也是可以的啊。那这计划模式呢,就是 这样的一个交互的方式会比较多,他会不断的问你,然后呢他会先给出一个完整计划,你看现在的话就是他给出一个完整计划,我们也可以看看这个计划他会做一些什么样的一个事情 啊?迁移计划啊,给出了一些啊这个变化之类的。那还会问你,我们是实施此计划吗?那我们直接就开始实施啊。这里的话又有一个新的啊,就是它在这个执行的时候,我发现这个 n p m mini 啊,执行的比较久, 这个时候你其实可以直接在这个呃下面提示他,你说啊 n p m 迷你执行太久了,或许可以换一些别的方法。这边的话会有一个引导,引导的意思就是我直接把这个告诉他,打断他现在在做的一些事。呃,不能说打断啊,这里其实不会打断,就是引导他一下,就相当于说,嗯,你在开车的时候, 旁边副驾驶告诉,哎,你走错了,往右转,就相当于这个意思啊,我们引导他一下这个 m p m 要做一些优化,你看他很快就发现 m p m 这边执行的可能有问题啊,很快的就搞定了 啊,这边的话都搞定了之后呢,我告诉他之后,我们再给大家讲一下这个 git, git 的 话就相当于说我们把它部署完成一个 git 工程,然后 啊让它排除掉一些不需要的文件。那接下来的话我们就会讲一个并行开发的一个过程,就相当于用一个 git 的 walk tree, 就 相当于你比如说手上有两个需求,他们彼此之间也。呃,你要并行开发,就一起一起干这两个需求啊。 那一起干这两个需求的话呢?这给大家演示一个。呃,就是我们先把它提交到 github 上, github 上就是你把代码拖完上去啊,拖完上去之后呢,就是然后我们接下来会给大家演示我们怎么用这个 worktree 来。 呃,开发这个不同的需求,那这边的话它会自动提示,你说我们要安装这个插件,那我们就按照它提示走就可以了。 好,这些认证也都是比较简单的,说白就下一步,下一步,下一步就可以了啊。好,这里的话他会告诉你要搞一个仓库,那我们也是来给他搞一个仓库, 也是一样,我们搞一个新的仓库,然后把这个仓库呢发给他就可以了。好,我们把仓库发给他,那这样,这样的话他把代码自动提交上去。 ok, 提交完之后呢,我们在这个仓库里边就可以看到他把这些代码呢都提上来了, 要是没有什么问题啊,就给大家演示啊,我们如何并行开发两个需求,这边的话我们有两个东西要改,第一个话就是这个上面的一些图片都是用的奔驰的车啊,我们开小米方面,我给他换一些小米车 啊。第二个的话我们再开发一个别的需求,就比如说就是,呃,就是刚才的那个流程,我们不是洗车流程吗?给他配一些图片上去啊, 这样的两个需求,那这样两个需求呢?给他并行开发并行开发他,你看我们建两分支出来,对吧?你看建两个,这个好,我们呢把我们两个需求发给他同时发过去。 ok, 没问题啊,先把第一个发过去这边的话,第二个 第一个话就是把我们的奔驰车换成小米啊。第二个话就是,呃,给我这个标准化施工流程配图啊, 我们两个流程一起干啊,这样的话好处就是你可以有不同量各种各样的需求,你可以让他分开干,分开干完之后,然后我们干完之后再统一的河道主干里面,你看这没问题,我们这打开之后可以看一下 啊,你看车车的图片都换了,你看换成小米了,小米车也是比较帅。那另一个的话我们也打开看一下,你看配图了,对吧?这个标准化的施工流程,你看他也配图了,好,也没问题。 ok, 那 我们再告诉他,我们把这个 分支代码再核到核回主干,回主干之后呢,我们再把这个主干代码再可以告诉他,我们说把主干代码再跑起来,你看主干代码就是合并的刚才两个需求, 对吧?一个是这个车的图片换掉了,然后还有一个就是这个,呃,这个标准化施工流程也都改好了。 ok, 这最后呢,我们再给大家演示一下怎么把这个项目给它,给它布起来,就是给它发部署,发布发布出去,那这边的话也可以点这个 ctrl 里面一个插件,这个 letify 这个是一个免费的 啊,也是部署起来会比较快啊,也是一样啊,进来之后呢就点一点认证之类的啊,给他授一下权,授完之后呢就是直接告诉他,我们直接告诉他,我们我们要把这个项目部署去啊。好,我们在这个项目里面告诉他,我们说啊,我们把这个项目部署起来啊。 好,这里话也是 letify, letify 你 们的这个 framework, 我 们这边的话告诉他,我们要用这个插件啊, 用这个插件的话,然后就是把项目部署到了,它就反紧接着呢,它会就会告诉你或它会把这个项目布上去,布上去之后它会给你一个公网地址,这是一个公网地址, 公网地址的话你直接访问。好,你项目已经布完了啊,到这的话就基本掌握了 codex 的 基础操作啊,并且也了解了一些 webcody 的 一些基础技巧啊。那这个的话就是本期所有的分享,喜欢的小伙伴点赞关注,我们下期再见。

今天是我们 codex 的 第一讲 codex, 它到底解决什么问题呢?其实 codex 最值得讲的地方就是它把 ai 写代码拆成了四种工作方式, c l i、 ide、 桌面 app 和 cloud。 你 可以在终端里面慢慢改,也可以把它 交给 cloud, 在 云端上慢慢跑。那接下来我就带大家一起来看一下这四种形态。好,我们先来看 c l i, c l i 适合及时的迭代,然后来读代码、改文件、跑测试、解释、报错,你坐在旁边验收它,一步一步来推进 c l i, 你 可以在终端里面直接去输入 codex, ok, 当你看到 openai codex 以及它的 model 显示的时候,就代表你已经进入到 c l i 里面了。接下去你就可以直接跟它去进行一个交流,比如说我现在可以切换对目前最高的,它就指到 g p d 五点四, codex 的 桌面板目前已经支持 windows 和 mac, 这里你看到的就是 codex 的 一个桌面版的一个页面,它就比较适合多任务并行。你看我在一个界面里面,这里就打开了深图的,然后打开了很多做课件的,对吧?以前还有一些做项目的,它是完全都可以并行的,包括这里会展示一个自动化的一个入口,就我配置了一个日报和 ai 日报的一个素材沉淀, 还有一些插件。啊,这个我们在后面再去细聊。那接下去我们来看它的第三种形态,是 ide, ide 的 话,你可以在 vs code 或者是 codex 里面都能够看到它的一个 codex 的 面板。我现在点击 codex, 在 codex 里面,我们在左侧面板的上方点击这个下滑箭头,看到这个 codex 就 可以进入了, 那这里恰巧是我用的比较少的地方,像 ide 呢,它比较适合你,左侧就是派发任务,右侧来看代码,比较适合已经习惯在编辑器里面工作的朋友。 好,那最后我们来看一个云端的入口,可以打开你的浏览器啊,上面就会有啊, g p t 点 com code 在 这里呢。云端的入口呢,比较适合后台的任务,你可以把你的仓库和任务交给他,他会在一个隔离环境里面跑,最终给到你一个可 review 的 一个结果,这里你就会可以选择你的一个 github 的 一个远程仓库了。今天这一节呢,我们主要来认识一下 codex 的 四种工作方式。 ok 啊,今天我们就先分享到这里,拜拜。

卧槽,兄弟们,我发现了一个做 a p p 的 一个携修方案,现在我们知道叉 g d p 的 一个 image 二,它的升图能力是非常强大了。 codex 又是编程能力非常强的一个模型,自 codex 桌面应用,它内置了 image 二的能力。这个时候如果你要做一个 a p p, 你 可以让这个 codex 去驱动 image 二去升图,把整个 a p p 的 页面都生成出来, 然后用 codex 去理解每一张图片,让 codex 去还原每个图片,这样做出来的 a p p, 它比那个其他的比如说 figma 做出来的更有质感。这个方案我上个星期已经开始在用了, 最近刚合适看到有人把这个方案也做成了一个 skill。 目前我测试了一下,除了费多一点 token 之外,其实没有什么坏处。我最近用这套流程做了一个小程序的整体换肤,整体下来 token 消耗量我觉得 并不是特别多,比预期当中的要少很多,还没有那种什么 openstep 加 superpower 那 种加起来的消耗多。 我也不太明白这个 codex 是 不是对这个图片传输,还有就是返回做了一些算法,反正感觉上它消耗并不是很多。而且如果你把这一套流程设计成一个自己的 skills, 你 甚至可以让它 还原出了图片之后再截图,截图之后再和原图去做对比,反复的对比,对比到它自己满意为止。这个方案实在是太牛逼了。

哈喽,大家好,最近 codex 更新了桌面宠物的这个功能,这个形象的话我们也可以自己去自定义,在它的官方的这个里面也默认设置了几种预设的,我们也可以自己去选择这个自定义的方法的话也非常的简单,我们在这个插件的 skill 里面去搜索 ipad, ipad 然后安装,安装完之后的话我们就可以直接去斜杠,然后去搜索,然后去调用这个 square。 完了之后你发送给他的话,他就会去询问你,你想生成一只什么样的宠物,然后叫什么名字,我这边是给他发了一个参考图,让他去叫名字叫音乐,然后他就开始去生成, 然后生成过程中也是全自动的,包括这些图片素材等等,让他会先去生成一张问你这个形象图满不满意,满意的话他就会继续去生成。后面的过程中他会生成这种各种状态的,比如说是等待的,然后奔跑的等等,然后甚至是这种失败的状态的动作都会一一去生成。 当然如果这个过程中有不满意的,你也可以直接去对话和他去修改,比如说让他这边去把这个跳跃的动作换成了跳舞的等等,大家可以自己去和他对话 哦。可以完成之后的话,我们就可以在这个外观的最下面宠物里面去选择,就会这边就会出现你自定义的一个宠物,这边去选择就可以了。 ok, 完成之后的话我们这边就可以去让他去调用传斜杠,之后这边有个唤醒就可以了。然后另外的话他可以去直接置顶在我们桌面的顶层任何的地方, 当我们去运行这个 codex 的 时候,它就会有不同的相应的状态,这样即使我们关闭这个桌面,我们也能看到这个不同的状态,甚至去直接在这个窗口里面去给它恢复都可以。

家人们, open ai codex mac 版突然大更新,现在 ai 不 仅能写代码,还能自己控制你的 mac 电脑在后台点击打字操作 app, 简直太震撼了!以前 ai 代理只能在自己沙箱里干活, 碰到真实桌面 app 就 抓瞎你得手动切换,效率低,还容易冲突,是不是特别影响体验?但四月十六日, openai 推送的 codex for almost everything 更新, 新增了 background computer use 功能。 codex 现在有自己的光标,能看到屏幕,点击打字操作任何 mac 桌面 app, 而且支持多个 agent 并行工作,完全不干扰你正常使用。 还新增了内置浏览器、图像深沉和记忆功能,简直不要太强大。打个比方,以前 ai 就 像一个只能在自己房间写作业的学生,现在他能直接走进你的电脑桌面,像助理一样帮你改 fake 带前端, 而你继续干自己的事,互不打扰。这让编程 agent 真正从写代码工具进化成能操作电脑的数字员工。未来测试自动化、复杂工作流会变得无比简单, ai 编程能力又上了一个大台阶。这个更新已经在 codex mac ip 上线, chatcapplus pro 用户就能用。关注我,继续带你看 openai 最新硬核进展,你最想让 codex 帮你自动操作什么 app? 评论告诉我!

上一期关于如何从零到一安装 cloud code 获得了差不多十万人的观看啊,但是有很多人还在问像 cloud code 的 桌面端如何配置呢,哎,正好前段时间啊, cloud code 的 桌面端也能够接第三方模型呢,所以说今天我就给大家带来这个教程。 ok, 大家好,我是 fred, 专注从普通小白的视角分享怎么从零开始用 ai 和 web coding 提升自己的生活和工作效率。 我们第一步的话可能还是去打开整个 cloud code 的 这个官网啊,然后这里可以去下载 cloud 的 这个呃桌面端的应用,安装好了之后,我们就会进入到整个 cloud 的 这个界面, 然后到这里面的话就有一个很重要的点,就在于说不要直接登录啊,这里面直接去点这个 help, 然后点这个 troubleshooting, 然后这里面去点这个 enable developer mode, 也就是打开开发者模式, 点击这个 enable 之后呢,它就会重启啊,重启这个桌面端,重启桌面端之后,大家就可以看到这里面多了一个音呃 developer 这个按钮,也就是这个开发者的按钮,然后我们打开这个 configure third party influence 啊,点进去之后呢,我们就可以看到这里面,哎,其实我已经点好了,首先大家需要选择就是这个 gateway, 然后这里面需要关注的点就是一个是 url, 就是 它的整个的链接,一个是 api key, 这两个怎么去获取呢? 首先从 url 上面来讲,我们可以打开 deepsea 这个官网,我们这里可以看到像这个呃 deepsea 的 sorpy 的 url, 就是 这个这个网站,所以说我们只需要把这个网站呃复制进去就 ok 了, 然后 api key 怎么去获取呢?然后同理我们去点击这里 api key 进去之后,这里面可以去创建 api key, 呃,然后比如说 friend three 啊,然后点击创建之后,它就会自己默认复制出来这个 api key 呢,但有一个点非常非常非常关键的点啊,就是说大家一定要关注,就是你如果复制了这个 api key 之后, 那么后面的话就是,呃点击关闭之后,后面这里就没有办法再复制了,所以说我们就只只需要把这个复制进来,这个 api key 复制进来,然后往下的话有三个非常两个很关键的点,一个就是我先可以给大家擦掉, 就这里面去添加这个模型,这个模型怎么去获取呢?也同样道理,点开这里可以看到这个模型的名称,也就是 deepsea v 四 flash 和 v 四 pro。 ok, 我 们就把这个模型复制进来,有个很关键点就在你你需要去打开这个 e m 的 上下文 啊,也就是一百万 token 的 上下文啊,这个会让你整个使用体验会更好。第二个就是 deepsea v 四 pro, 对 吧?然后我们把它复制进来,然后同理也是,呃,打开这个 em 上下文,完事之后呢,就只需要点击这个 apply locally, 就是 本地应用,它就会重启了。 ok, 重启进来就大家就能够看到一个非常非常熟悉的界面,就是也就是用 clock code 的 界面啊,我们可以问一下,好吧,你是什么模型对吧? ok, 久违的这个闪光啊,虽然说它写的还是 cloud, 但实际上它就是 deepsea 的 flash 啊,包括 em 的 啊,这个上下文和 pro 的 模型。 所以说总结下来的话,我们今天这个事情啊,所以首先首先要退出这个登录啊,就刚刚没有演示,但如果你本身有登录,那你可以退出登录。第二个,点击这个开发模式第四,然后看到这个 devilper, 然后才算成功。下面去关注一下整个的一个配置啊, gateway, ur l, api, key 和你选择的 model 以及 em 的 上下文。 然后整体完成之后呢,整个 color code 就 能够配置好的。 ok, 我是 fred。 后面我会持续用真实的案例告诉大家怎么把 ai 用进自己的工作流,欢迎大家关注我们,下期再见。