今天呢是我们介绍 一些实际的烧油啊, 就这个这个的这个能接触点 二零二零年, 那今天呢,我们就从这个智能体的意义给大家简单介绍一下, 具备自主感知、目标推理、行为决策的自主调用 与自主决策能力,能够主动感知和分析依据已设置的内程目标自主规划系统,虚拟我们的监控工具调用及控制自这样的操作行为,无惧的干扰和干扰 就是自己 啊,你只能说说 一 二, 可以自己发邮件啊,可以回复客户消息,还有对这些基本的服务内容,对吧?下一个呢就是说你到你的手机的那个自媒体, 比如说这个曲目短视频,感觉你将会用到的很多的很多的什么呢?那你现在用的最多的就是用你最熟悉的一个角色,你也不可以做中间的分割这种方式,对这些 jk 这个没有比他是简单的,前面呢就可以做一些简单的程序,对吧?我随你说的这个方式呢都比较很简单的程序,没有必要这样的,也没有必 要这样的,一个有可能 接 下来 是世界的商业,商 业的一个瑰宝, 我们 这个是一个逻辑性的问题,本质是谁会用这个工具呢?这是学会建立自己的自制的能力, 呃,经济上的需求就叫生存能力,所以这段时间时间不能像你所说的灵活使用,也不是说我看的灵活多了,我们只能用一个,多了就是变了,这多了 就像 看一下, 加油。 i think i'll be able to do that。 大家可以去看一下。
粉丝13获赞38

很多人说 codex 比 tree 好 用,我同时使用 try 和 codex 做了公司项目的官网,大家看看效果表现如何?提前说明一下。我使用的是 try 国际版,这个网站是使用 q 二 e 从零开始做的, 提示词大致就是让它模仿 vivo 或者小米的官网风格,白色主色调加高流白加卡片式布局加平滑滚动加响应式,同时兼容市面大多数手机、平板和电脑浏览,还指定了一些技术站。目前展示的首页和产品中心也是初二完成的, 当然我是让他帮我做了一些微调之后的效果。当前展示的乐企,他用页面和行业方案页面都是我让 codex 参考网页现有风格生成的 ui 布局。 我个人认为 codex 生成出来的效果是比 try 要好一点,但也没有特别大的差距,毕竟 try 中也能使用 gpt 四点五模型。不知各位有什么不同的看法?

别无脑吹科四了,工具选型必须匹配技术战,前端后端即刻最佳,组合完全不同,前端或全站 vs code 加 cloud vs code 插件生态无敌。前端首选无缝切换,可拉的上下文,极大处理复杂的 dom 结构, css 的 样式,可拉的逻辑推理能力是天花板 java 或 go。 后端翠加 colex 配 ai 不是 翠 c n, 通过配置能达到阶梯原则的体验习惯优先。 colex 在 代码谱上延迟极低,更适合后端逻辑的填空题, 专业的人用专业的 id。 最后分享一个,即刻首选 open code 加 colex, open code 开源清亮,命令行为什么不选可拉的?因为它反滑,直接拉黑。没有最好的工具,只有最匹配的组合,你的工具链选对了吗?

codex 和 cloud code 用不了,有没有平替的?有的,当然有。今天就讲三款 ai 编程工具,新手也能玩,门槛也不太高来。第一个 open code, 这个是一个开源的 ai 编程工具,然后我们直接可以用它的终端命令行,但是新手小白不建议用终端, 你看终端打开之后,它就是这种黑框的,很容易劝退的。新手小白就用它的桌面端就可以,包括支持什么苹果系统啊, windows, linux 都可以, 所以说当你安装完成之后,它就是变成这样的。然后它的主要特点呢,就是集合了市面上几乎所有的模型,我自己用的是 dbic 为四,当然你也可以用, 比如说 openai 的 模型, osarpic 的 模型,肩带的模型等等等等,还有些 dbic 的 模型都可以的,几乎所有的它都支持,它的模型选择量还是比较多的, 那整体用下来的话呢,也是比较简单,比较容易上手。第二个 tree solo, 它是自结开发的,它的特点的话就既支持桌面端,也支持你的移动端,就是手机和电脑 同步进行打开,之后呢,就是这样的一种形态,它呢也可以接到基本上主流的国产的模型 tree 呢,其实也能连接很多插件,通过 m、 c, p, 你 像我们常见的印象笔记,呃,然后 f c 点笔记等等等 excel 其实都能够连接起来, 目前的话,他这个插件市场上做的还是可以的,对于新手来说呢,其实还是比较友好的。第三个酷的是阿里出的, 现在的话他也能够下载客户端了,客户端打开之后就是这样的,而且他的模型选择呢,也基本上支持主流的这些国产模型,如果你问我更推荐哪个?如果你想选择更多的模型,那你就选择 oppo code。 如果你要选择更简单上手一点,那我推荐你试一。

字节跳动旗下的翠和翠 solo 到底有什么区别?我把我的一些思考,我的一些观点分享给大家。首先呢,我如果推荐的话啊,我还是推荐大家去用翠,但是呢更多的人 其实他更喜欢去用吹 solo, 为什么呢?我对吹的一个定位是什么?或者对他的一个评价是什么?就是精准,特别精准,能够做到指哪打哪。而吹 solo 呢, 他就会非常简单,看起来也特别友好,对吧?我们很多的不是有计算机基础人,看到了这个软件之后,觉得他也 非常的友好友善,能够自然语言去交互,所以呢,我给他的定位是能迎合大多数人。 那么 tree, 他 一开始在做这个软件的时候,他是和国外的这个 cloud code, 还有 cursor, 还有 windows opera 和这些是去做对标的。那么这个 tree solo 也是才出来有一两周啊,它是和国外的这个 codex 也是一个智能体,和它是去对标的。下面呢是我对 tree 和 tree solo 它列出来的一个 呃,一个区别。我先说一下啊,说完了之后呢,我们再去看着实际的这个软件去呃理解一下它的一个 一个区别啊。然后呢,大家把两个软件试完了之后,你再根据你的使用场景,你确定一下你到底想用哪个软件?大家可能长期关注我的频道,我的视频的都会知道,我所给大家去 分享的视频都是我经过长期使用之后自己的一些心得体会。我不会去给你教软件怎么下, 但是呢,我会给你教用这些软件之后,我们去注意哪些事情。比如说 tree 啊,我觉得他最好的就是指哪达的,他可以把你的这个文件夹项目下面的文件能精准的添加过去,作为参考,去帮你生成内容。 那么这个 tree solo 呢?他的好处是什么?就是有一个,哎对话框,你在这里直接给他提需求就行了。但是提需求的时候,有的时候你会发现,我就举一个例子,场景啊, 你想让他参考某一篇文章,或者你之前的五篇文章,帮你生成一篇文章的时候,你就非常难,你怎么去给他说?说的模糊吧,他找不到说的细吧,你得打很多的字,而我在翠这个软件里面,我一键右键添加就解决了, ok, 我 们现在来现场看一下,我们就以刚才我举的那个例子为例,我打开这个翠, 打开吹这个软件之后,你比如说我写的公众号的文章,对吧?我写的这这几个文章,我可以把一二三四五篇文章一选,选完了之后我直接右键让它添加过去,就可以 直接右键添加过来,就合理答案呢。这里面的这个话,我还不想把它给浪费掉,浪费掉就浪费掉,没关系啊,我把它一选,然后点添加的对话,大家注意, 我的五篇文章就添加到这了,这个时候我就可以在这里去给他提要求,哎,基于这五篇文章帮我完成一个什么样的事情,就非常的精准,甚至完成之后呢?保存在哪里?继续保存在这个文件夹里面,哎,我再一添加,保存在这个 文件夹,就是这样一个操作,你也可以把文件夹右键,哎,我先把它前面的这些东西一删,我把文件夹这边的内容, 比如说微信公众号啊,思维冷静这边的内容,我右键添加过去,我说请根据这个文件夹下面的内容,要给我做一些什么,去归归纳分析,总结他的一些特点,再帮我生成一个新的文章, 对吧?你再提要求,这也是可以的,就是这种的,我添加文件夹去引用,我添加文件去引用,我觉得这个对我们 很多场景下来,我想让 ai 参考我的哪些内容,去帮我生成一个新的内容,这些场景非常非常的实用和好用。 我平时日常在工作当中,我就是用 tree 去打开我的主办公的文件夹,让他去帮我做的。而这个操作呢,我们现在把 tree solo 打开,你会看 tree solo 左侧,我也确实是打开了它的文件夹,但是打开文件夹之后,你会发现,这里面 你是看不到,对吧?你只能看到任务,你是看不到他里面对应的文件的,哎,我点开看一下啊,看,是不是因为我,我没有,我没有点,对,哎,你看这边右边,你是看不到他的文件的,对吧?所以你只能看到他的任务,所以给家的给大家的建议是什么呢?如果说你是一些 不需要去做精准的参考,对吧?你我就是自然语言去跟他沟通,其实这个退缩了呢,他就像一个高级版的豆包是一样的,但是他现在的玩法呢,比豆包更灵活, 因为他能编程,因为他能自己去训练技能,而豆官呢,只能他有啥你用啥。但是呢,我们再反过头来再看这个翠,我觉得他的区别是什么?就是能够精准的添加,精准的去引用,精准的去也能训练技能。大家可以看啊,这上面也有训练的技能,也可以去训练技能,也可以去训练技能,所以, 嗯,这两个软件看大家怎么去选。如果说呃我个人的推荐的话,我还是建议大家就从稍微比较原始的这种脆 脆的这个软件去入手去做,做完了之后你打开你的文件夹,你能够清晰的看到啊,右边我的这个内容,对吧?我生成这个内容是什么? 还能够特别方便的,我把这一小一两行内容选中添加的对话让他再帮你修改,非常非常的方便,真的就像我给他的总结,非常精准,指哪打哪。但是吹 solo 呢, 那就是凭感情了啊,凭感觉了,你去自然语言去跟他去交流,交流完了之后呢,他不一定能够识别操作的那么精准啊。所以说如果说我们对有的一些事情就是,哎,我用这个呃自然语言我去跟他沟通, 至于要到底要一个什么样的想法,我也不太知道,就让他自己去那么跑的话也可以啊。当然这里面还有一个区别是啥呢?当你用会 solo 这样的智能体工具在做的时候,他基本上能够做到你 输个任务他全部帮你完成,但是在脆这块呢,很多情况下,你还要在右边去给他点一下 yes, 同意等等这些。当然我也理解这样的操作他可能会显得更更安全,更保险一些。 这个呢,就是今天给大家带来的脆和脆 solo 他的一个区别,也不知道这么讲大家能不能够理解,还是那样,对吧?实践出真知, 没有调研就没有发言权,你没有用过两个软件,你也没有发言权,我们也不要去问豆瓣问 deepsea ai 给你说的东西,现在呢?它不如你自己实践完之后得出来那个结论更精准。 ok, 如果你对 ai 在 教育教学场景或者在行政办公场景等等的一些比较感兴趣的话,也欢迎关注我的频道, 相信我的频道的内容,我觉得他是带着我的实践的思考的,我觉得是有些深度的,希望也能够给各位小伙伴带来一些启发。欢迎关注我的频道,我们下期再见。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

同样的效果图, codex 和 tree 生成效果的对比, 这个是 codex 的 效果, 这个是吹的效果。

学会这个工作流以后就可以摆脱 ppt 了。众所周知,做 ppt 非常麻烦,需要手动编排素材和文字。 ai 做的 ppt 也很呆板。 ppt 由静态元素组成,播放时不够灵动,传言事实完全没吸引力。我们打开思路,用 html 作为演讲稿,用浏览器播放动态的 ppt。 先配环境,用 n p m。 安装 open skills, 进入一个空的目录。 open skills 是 一个 ai 技能包管理工具,我们用它安装两个技能, h t m l。 ppt 教你的 ai 如何做出网页 ppt 花絮底塞,让页面更美观。同步技能让你的 ai 看到。 接着进入你的 ai 工具,应用这两个技能,然后告诉 ai 你 的 ppt 需要有哪些内容,回车,你的 ai 就 会帮你生成这份 ppt。 这是我让 ai 做的三题主题 ppt, 可以 看到页面切换非常丝滑,页面有可交互的组建以及演示动画。 对比传统 ppt, html 更加灵动,你可以自由嵌入粒子、动画、卡片等动态组建以及按钮鼠标追踪等可交互 ui。 并且 html 是 网页开发语言, ai 在 这方面受到过大量训练。做 h t m l。 自然比做 ppt 更得心应手。总结, html 代替传统 ppt 是 ai 时代下更高效的演示方案。

全球 ai 编程工具排行 number five co pilot 原生的编程助手核心竞争力在于生态整合与开发,全流程深度绑定,团队治理体系最为成熟。对企业和团队而言,它是 一个可以放心铺开、无需折腾的标准化工具,在平稳中创造持续的价值。 number four try 榜单中黑马气质最浓的产品, viewer 与 solo 模式,直击从需求到成品的核心诉求,擅长快速原型验证与丛林搭建。虽然生态沉淀尚不及前三款,但迭代速度与产品创新力使其成为不可忽视的强劲挑战者。 number three cursor ai 原生 ide 的 领军产品,将补全 agent、 诊断等能力有机整合,在 ide 内构建完整开发闭环,同时支持自由切换底层模型。它的价值不在于单模型能力的峰值, 而在于将 ai 无缝融入 ide 体验的综合实力。 number two codex openai 推出的全能型编程 agent, 能力分布均衡,从信息检测到最终交付,链条流畅,在复杂长任务中维持高水准输出。作为几乎没有明显短板的通用型 agent, codex 是 最稳妥的选择。 number one cloud code 终端原生的架构级编程 agent, 复杂重构与疑难问题定位能力突出,最接近高级工程师的思维方式,配合 em token 长上下文,足以应对最庞大的代码仓库,代表了当前 agent 型编程助手的最高水准。

为了更好的体验 ai, 为了更好的学习 ai, 我 原来有一台高配的电脑,你们可以看一下 win 十一,然后它的 cpu 是 幺四六零零 k f, 那 个显卡是四零七零 s。 但是你们很多人建议我去录一台 mac, 然后我就买了一台 mac, 这台 mac 是 m 四 pro 二十四 g 内存的。但是很多人又跟我说丐版的 m 五就够用了啊?没关系,反正买都买回来了。接下来的话,我会记录自己学习 ai 的 一个过程,比如说, 呃,扣扣的 x, 然后可的扣的啊,包括一些国内的一些可以平替的啊, t r a e 字节跳动的啊,然后包括一些图声视频、纹身视频也好,我基本上因为我自己本身就是做 电商,做自媒体这一块的,我看一下他这一块能不能帮我提效啊?能不能帮我做标准化的东西啊?就是流程化的东西。好吧,那这条视频到这里。

cloud code 和 codex, 正常人学会学这个,别看最近到处都在炒作这两产品,真去学这些就掉坑里了。我们团队在这里也走了一些弯路,就介绍一下我们团队的配置。首先是 tree, 不 用折腾的 ai 编程工具,不需要任何预算,我自己就用它来处理一些日常的小任务。 第二个呢,还是 coz, coz 也推出了网页版的 ai 编程模式,写好 skill 之后,可以托管在 coz 平台上直接调用,特别适合小白。第三个是 workbody, 它是一个包装的非常干净的像小龙虾一样的产品,它对于一线运营人员友好度非常非常的高,随手就可以编一个 skill。 至于 opencloud、 cloud code 和 codex 这些产品,如果你的技术背景一般,先不要跟风,那么安装复杂,配置复杂,使用复杂,充值也很复杂。对于大多数人来说,前期准备就花光了你的耐心让 ai 变成生产力,最关键的是选一个能马上让你把事情做起来的,先做起来再说。关注我十四天,零基础学会 bug 扣顶第三天!

如今 ai 编程工具爆发式增长, cloud code codex、 deep seek、 tray、 cursor、 copilot gemini, 各种工具模型眼花缭乱,不知道怎么选?今天带你一口气理清楚这些 ai 工具。目前使用 ai 编辑代码有这四种场景,第一种,网页对话, 这是每个人最初接触 ai 编程的方式,打开浏览器接代码,问问题,得到答案,不需要安装任何东西。由于浏览器的限制, ai 无法直接获取本地文件,需要我们手动复制粘贴代码。 几乎所有的大模型公司都有网页版,大家常用的网页 ai 有 掐着 gpt、 deep seek、 豆包和 kimi。 第二种,在 ide 上安装 ai 工具插件, 比如在 vs code 上安装 git copilot gemini code assist, 这种还是以自己写代码为主, ai 工具感知上下文,自动补全,甚至现在也已经发展出 agent 能力,不再是你问一句,他答一句,而是你给一个任务,他自己规划后续步骤,比如自己读项目文件, 自己写测试代码,自己执行终端命令,自己安装依赖软件,自己根据报错进行修复。第三种, ai 专用 ide, 也就是为 ai 定制优化的集成开发环境,比如基于 vs code 的 深度改造的 koser, 字节跳动开发的 tree。 相比于插件 ai 工具的 a 阵的能力,专用 ide 能够更底层地看到你的整个工程,比如你最近打开哪些文件、光标位置等底层能力,其他的代码补全、闭环能力也进行了更底层的优化, ai 方面的使用会更流畅, id 一 内部都内置有模型,也可以自定义添加其他模型。第四种,终端工具,目前比较流行的是 cloud code c i i, open ai codex c l i d c k t u i 等,它比前面的所有场景都更激进,丢弃编辑界面带来的额外开销, 追求最极致的 agent 处理能力。你平时最常用哪种 ai 编程方式?欢迎在评论区分享补充。

换工具不换脑?那最近有人在评论区问我到底是 context 还是用 cloud code? 那 我以前也会特别纠结这一类的问题,那哪个工具更新了?我就想试一下哪个模型变强了,我就怕自己错过别人说的某个工具效率高,那我就开始怀疑自己是不是又落后了? 那我现在想明白了一件事情,很多人问的其实不是工具的问题,你问 context 可不可以, cloud code 到底行不行?那这些问题都属于同一个类问题,是属于你的手, 那我现在是把自己的工作分成三块,一个叫做硬盘,一个叫做大脑,第三个叫做手, 那 oc 点是我的硬盘,那它存的是我的判断,我踩过的坑,我做过的项目,我写过的稿子,拆解过的问题, 那 cloud code 或者是其他的大模型,那它们是属于大脑的一个层面,它负责的是理解、推理,深层,帮我把这些内容重新组织出来。 呃, cloud code 或者是 context, 这些属于工具,当然最近会有生成更多的工具,那它们是属于手,手是负责执行的,帮你写代码,帮你改文件,帮你生成内容,帮你跑跑任务, 所以你会发现手是可以换的。那今天我用 cloud code, 明天我就可以用 colex, 只要我的硬盘在,我的判断在,我的上下文还在,我换一个工具其实并不会从零开始,那我今天就演示一下,这个是 cloud code, 我 们之前的对话,那我用 context 重新帮我整理梳理的相关的内容,他还帮我 增加了缩影,帮我做,帮我做同步的一个更新,那这样子对于我来说其实是很直接的一个调用, 那这也是为什么我觉得真正复利的不是工具,工具本身它没有复利。那你今天花两周学会了一个工具,过了几个月又会有新的工具出来,那这两周你沉淀下来的工作方法、判断标准、踩坑记录,这些是你可以直接带走的。 所以我从 cloud code 里面切换到 context, 其实上手是非常快的。那当然我们未来会有其他的各种的软件,那你需要的就是在你的电脑中去配置相关的信息,而不是说未来有其他的工具来。你又是从零开始, 所以我并不会一直在问哪个工具最强,我会先问我的硬盘里面有没有东西,如果你的 o c 点里面什么都没有,其实差距并不会很大,因为它基本上都是从零开始。但是如果你的 硬盘里面已经保存了你的判断,你的经验,你的上下文,那工具换来换去也只是换一个手,真正不变的是你的审美, 你的系统。所以我的建议其实也是花两分钟,每天你把和 ai 沟通的事情把它记录下来,那不用写得很漂亮,几句话,做了什么,干了什么事情,那你有一 个积累的记录的这样的一个过程,其实就慢慢能够让 ai 能够去读懂你到底是什么样的一个风格。那两个月之后你积累的这些品味和收藏和风格,那在你将来的 ai 使用中,他就会用得上。这我觉得才是一个工作流应该要有的一个 状态。那所以无论是工具怎么操作,核心还是你的审美和你的大脑,你的硬盘是存在哪里?那今天最后一个问题就是你自己是在怎么用这些 ai 工作流?可以评论区说一下,那喜欢点赞关注。

今天 codex 发新版本了啊,就是这个版本有几个功能更新特别好用,我挨个挨个的给大家演示一下。第一个就是它可以自动截图了,比如我们在抠屏的时候,这是一个页面里面有些 bug 要修改,以前可能我们需要手动截图,然后把图片传上去,现在很 简单,两个 cmd 键啊,还是在 mac 电脑上面看,没有就直接截图,我们看一下自动截图,而且它不仅仅是截图啊,不仅仅是你看到的东西。看这个查看文本,还可以把这个页面背后的参数,组建的属性尺寸, 就这个页面背后的信息都可以给你捕捉下来。基于这个你再让它去修改一个什么 bug, 它的理解能力就会非常强,就除了页面展现的问题之外,背后的逻辑都可以给你读出来。基于这个再给你去修改好。这个是截图的功能,两个 command 键一起按自动截图, 然后直接发送你的需求。第二个很好用功能呢,就是前端编辑功能,正好最近六叔用他在写一个封面生成器,直接点击这个前端的页面,在他自带的浏览器里面做一个预览啊。比如这个页面我要修改一些布局文字或者一些排版,以前是靠对话跟他说清楚,现在直接选中好点评论,选择 直接在上面改,看到没有,改完之后,所见即所得,直接在上面生效,我们再来改这个按钮,把这个颜色我们改成一个绿色,选中,你看直接生效,然后在这个对话框里面就可以看到刚刚的一些改动,然后你主动输入,完成这些改动发送啊,最终他就会很精准的按照你的方式做一个修改,包括你的评论,你的批注, 你的团队成员都能够看到,也起到一个协助的功能。用这种方式去修改一些页面,那些 bug 是 不是纯靠口喷,要方便多的多好。这第二个功能所见即所得的 去修改你的网页的任何的问题。格式化的方式。第三个优化的功能啊,大家还记得之前它升级了一个什么版本?移动版本,你可以通过手机端去连接到电脑端,那有个问题,当你的电脑,比如说我的 mac 电脑,我锁屏了啊,这个时候我在外面我就连不上了。 为了解决大家这个问题呢,我们点击设置,这里有个电脑操控,把这个点开,输入你的电脑密码之后,你的 mac 锁屏的状态下,你也可以远程通过你的客户端去连接你的 codex。 我 觉得这个是非常好用的。最后一个功能啊,也非常好用,点这个加号,追求目标,选中适合这种连续性的、复杂性的任务,让它去跑。 比如帮我写一个用户注册的功能,并完成用力测试,在这个功能完成之前,用力测试完成之前,它是不会停的,它会一直的帮你去执行,哪怕一个小时,两个小时,中间你可以随时打开去查看它的一个进度,而且你还可以在这个过程当中不断的去加入你新的指令。如果你的任务比较长,需要多轮的迭代啊,步骤比较多, 耗时也比较长,建议大家可以开启这个购物模式,就是追求目标的模式。好了,以上这几个功能大家赶紧试一试,我持续丰富,你来体验过,拜了个拜。

哈喽,大家好,我是七帅,你有没有过这种感觉?只是听说过这个扣带很厉害,但是他到底怎么厉害,怎么用还是不清楚,特别是第一次打开这个扣带的时候,不是感觉好强,而是只看到这么一个对话框, 左边也有一堆入口,中间是聊天框,右边也会突然间弹出来一些。呃,网页,图片,代码,还有设置里面其实也很离谱,什么样信息都有。今天我这个视频,我不讲技术,我按照一个普通人的使用路线,帮你把勾带四这个 app 彻底的讲明白。 首先说一下,我是一个做了十几年的交互设计师,也不是程序员,但是我用 ai 编程,至今为止已经上架了三个 app store 已经上线了, 所以今天这个教程也是完完全全从一个非程序员的视角来讲的,希望你能听懂。首先第一个就是抠代码到底是什么?先说最基础的抠代码 app 到底什么?很多人以为呢,它就是一个拆的包面板,其实不是的, 拆的 gpd 是 什么呢?你问一句,他答一句,他本质上是一个聊天的工具,但是呢,抠代码是不一样,他是装在你电脑里面的一个 ai 工作台,什么意思呢?他做的事情远远不止于聊天, 它能读取你电脑上的文件,能帮你搜索网页,操作浏览器,还能生成图片、文档, ppt, 网页代码等等, 还能通过 mcp 连接我们的邮箱, github, 还有 notion 这些第三方工具,它甚至还能自动化的去完成一些任务,定时的帮我们干活。所以说你记住一个区别就够了,就是拆的 gpt, 它更适用于回答问题, 扣袋子,更适用于帮我们干活,一个是嘴,一个是手,两个东西我们不要搞混。在继续往下讲之前,有两个东西很多人一直没有分清,我这里也梳理一下。第一个是普通的拆的 gpt, 它就是一个网页版或者手机版的聊天框, 问问题,写文案,生成图片,日常够用。是第二个抠袋子 app, 本地版,这就是装在我电脑上,这个它最大区别是它能直接读取你电脑上的文件,能操作电脑上的东西, 怎么选?如果说你是日常聊天,我推荐你就用这个网页版的这个拆的 gpt, 如果说你要处理本地的文件,那我推荐你就用抠袋子,这个 app 就 这么简单。 好,现在我们是已经打开了这个 call 大 师 app, 第一眼看起来有点懵,但是我们记住三个结构,左边是导航栏,那所有的入口都在这里。比如说新对话、搜索插件自动化全在项目左边,中间是对话的区域,也就是一个对话框, 我们和 call 大 师真正交流的地方就在这个地方,我们输入自己的需求,他在这里开始工作。 右边这个位置是结果区,也是 codex 交作业的地方,我们的网页预览图片、文档、代码变化全都在这个地方展示。这就是 codex 和普通聊天框最大的区别,它不光有问答,还有一些工作现场,我们可以看到它的实时进度和交付的结果, 你问他做事情,他不光告诉你怎么做,还会直接做出来,在右边展示给我们看。左边导航呢,有一关键的入口,快速过一遍就是新对话,点击完以后就是一个全新的聊天窗口, 清空之前的上下文,从头来搜索,去搜我们之前聊过的什么,在这里面去找历史对话和历史任务插件,这个呢很重要,后面我会单独讲,它是我们 codex 很 重要的一项能力 自动化是让扣代斯定时或者延后自动执行任务,比如说我们每天早上让他去帮我整理项目的状态,每周检查一次代码的仓库,定期的形成的日报和周报。这里面有个项目就是扣代斯最核心的功能之一,就是让扣代斯针对我指定的文件夹开展工作, 读文件,改文件,跑命的都在这里。我自己创建的 pm, 这文件夹里面在我电脑的本地放着的普通对话,就是一个很简单的普通对话,不绑定任何项目的纯聊天的模式,我们查概念,写文案,梳理思路,日常用这个就够了。 下面呢我们接着讲这个插件啊。呃,插件这个东西呢,说白了就是给扣带子装能力包,你想让它读 gmail 呢?我们可以装插件是吧?你想让它操作浏览器呢,也可以这个装插件, 比如说你想让他操作你的电脑呢,也可以装插件,就像我现在所点击的这个 computer user, 这个你装了它以后呢,你的 code text 就 直接可以在本地去操控你的电脑了。这里面呢有几个词可能我们经常看到,我这次呢也是一一次性讲清楚,就插件就是能力包,装了它 code text 就 多了一项技能, 还有连接器,这还有这个浏览器的使用浏览器,这个就是你装上这个以后呢,你的 sim 就 直接可以操控你的浏览器了,你像我电脑装的是 chrome 浏览器,我让他去帮我做任务的时候,做事情的时候呢,我就让他直接去采用这个插件,这个其实直接去操控的浏览器了, m c p 呢,是一种让外部工具接入 codex 通道,这里跟插件的意义差不多。我这里举一个例子,你看我现在电脑上装的这个 node 插件,我让 codex 呢帮我和 notion 通过 m c p 进行连接上我每次和 codex 聊天结束完以后的结果,这文档我需要统一 去保存到我的 note 里面,按照以前呢,我需要去在口袋怎么去复制,复制完以后再去粘贴到我的 note 上,但是现在呢,我通过 m c p 就 可以自动把这过程给打通了,自动化的给它运转下去。我俩是讨论出来的结果, 通过 m c p 自动去在我的 note 上去创建一个配置的链接,然后自动去保存过去。这个过程呢,其实就大大提高了我的效率。接下来呢,我们讲一下这个设置页,设置页东西很多,小白只需要关注四个地方就行了哈。第一个是工作模式, 我平时相对来讲,我更希望我有编程的思维,所以说我适用于编程的这个选项,如果说我们不是程序员,那我推荐大家用这个偏于适用于日常工作的这个选项。这样的扣代词可能会少说一些工程的黑话,普通人看的更舒服一些。第二个是权限, 权限越大,扣代词能做的事情就越多,但风险越大哈,刚开始的时候不用开最大,等你熟练以后再逐步开放,说实话,等你熟练以后就发现权限给够了,呃,扣代词用起来反而更丝滑,操心更少。 你像我现在天天是在用扣代词,所以说呢,我给他的权限是可以读取我电脑上所有文件的权限的。 第三个是发送方式还是看个人的一些使用习惯吧。如果说你平时呢喜欢用 command 加回车去发送内容的话,那我推荐你把这个给打开, 不然你写长需求的时候就是会突然间按一个 enter 就 把这个内容给发送出去了。所以说这个还是相对来讲,为了误触,我推荐有这个使用习惯的可以打开。你像我平时的 就不太喜欢 enter 折行,所以说我就这个呢,我就没有打开。给大家一一些建议,我们不要把自己的密码还有一些 api 的 k 或者是自己的身份证号喂给这个酷 max, 像其他的设置页什么配置环境工作数小白呢?像我们普通人就保持默认就行了,一个都不用动。下面呢,我们来看一下我今天实操的一个 项目,我想做一个 agent, 这个 agent 呢,主要是一个 v i 子查手册,这个 v i 子查手册是基于 defi 做的,上面这些你看的是有错别字的,因为我通过语音输入录入的,然后这个时候呢,我去把我对应的这个链接还有 pdf 手册发给了他,然后让他去 defi 里面去搭我们这个 agent, 这一看到他已经处理了十二分钟十一秒,然后呢,把这个基础的他给做好了,但是做好以后呢,其实他是没有自动帮我去创建的,他只是把那个内容给我做出来,还需要我手动去导入,这个时候呢,我不想自己动,我就想让他帮我做好, 所以说呢,接下来呢,我就让他去操控我的电脑,然后接着去做,做完以后我就发现这里边是有问题的,这个问题以后发现这个视觉变量是空的,把这个问题呢截图发给他,让他去帮我解决。然后呢,我再看下模型,这个你看这个模型的是不是还是有问题的, 所以说呢,我就让他再让我正常修复,他从二十三分钟把我这个问题给彻底解决掉了。那至此呢,我这个应用相当于是我都没有动,我只是给他下命令,就把我这个 agent 呢在抵犯给我做好了。假如说我们做的内容是比较复杂的,我也推荐这里呢,大家是用 plan 模式 在这里输命令,建立创建 plan 就 行了,使用这个计划的模式,这样的话,你做复杂的任务的时候呢, codex 呢,会输以思路,然后确认没问题了,让他去干活,这样呢,也避免浪费自己的 token 嘛,然后一顿操作猛如虎,最后的结果根本是不想要的。 最后呢,给大家说一个点,就是 codex 权限的确认是是最容易踩坑的地方, codex 工作的时候可能会弹出来问你权限, 这个时候呢,将没看到确认就无脑的点看清楚他在请求什么,你比方说他是在请求文件的访问啊,他要读取或者更改某个文件夹,看清楚思路是不是我们所允许的范围,还有中单的命令,他要在你的电脑上跑命令,不懂的向他解释一下, 避免付款,删除发布等这类操作呢,让它浏览器自动去做,这时候呢,也需要我们手工去介入一下,还有电脑操控,这个最强呢,但是也需要谨慎,如果说你看不懂他的请求什么,会直接问他这个权限具体让你做什么,有什么风险? 我是小白,应该允许吗?酷代帮我们去解释这个权限,这个设计我觉得还挺贴心的,最牛的是电脑操控, 我觉得这个是酷代斯最牛的功能,它能让酷代斯直接去操控你电脑上的应用,打开某个 app, 点击按钮,处理一些可实施任务, 或者是帮我们在软件里面完成一套流程。今天上午呢,我也是让酷代斯帮我去做了这么一个 agent, 我 把这个刚才也给大家展示了一下, 当你用完这一刻,我觉得扣袋子很强,但是呢,这个功能也需要我们去谨慎,因为他可能会触碰到我们的邮箱,浏览器,还有付费,还有公司里面的工具,私人的资料等等。第一次用呢,你只让他操作无风险的 app 就 可以。这里呢也特别给大家强调一下,就是不要让他去操作我们的微信或者是一些设备账号, 因为避免后期再出现一些风控的问题。好,最后呢,给大家推荐一个上手的路线,按照这个顺序来,很稳。第一步呢是打开 app, 先熟悉左边的导航,知道每个按钮是干什么的。然后第二步呢,去新建一个普通对话,问一个简单的问题感受一下。 第三步是打开设置页,只看不改,先熟悉每一个设置是管什么的。第四步呢,建一个干净的演示项目, 先别用我们自己的私人文件。第五步,让库黛斯读取项目,生成一个简单的 markdown 文档。第六步,看右边的结果区,理解它到底最后产出了什么,就像我这个例子,它最后产出的是,呃,四个 markdown 文档。第七步呢,我们慢慢的去尝试一些插件和自动化,特别是 慢慢的去尝试一些 m c p 的 能力,当你学会 m c p 的 能力以后,你的效率会大大的提高。最后总结一句话就是扣代斯他不是一个简单的聊天框,他是装在我们电脑中的一个 ai 工作台,他能帮我们做事情。也不是简单的回答问题, 小白上手的关键是先从低风险的任务开始,逐步放开权限。别急,慢慢来嘛。我呢是一个工作十年的任务,开始逐步放开权限。别急,慢慢来嘛。我呢是一个用 ai 编程做了二十多个产品的设计师。 如果说你也想学 ai 编程,或者想看我用 ai 做出什么样的产品,可以 follow 我 一下,后面的我会慢慢的更新。

openai 这次把 codex 更新成了一个能操作整台电脑的 ai, 它不只是会写代码,现在还能自己打开网页、点按钮、改界面,甚至你睡觉的时候,它都能接着往下看。这里是 coo 科技日记,带你看懂 ai。 今天我们来了解 codex 最新更新内容。 我花了一上午把 codex 新版过了一遍,发现这次更新最值得你知道的有三件事。第一, codex 已经不是单纯的写代码工具了,以前你理解它可能就是一个帮你补代码、改 bug、 写函数的助手。但现在, open ai 想把它做成的是一个能在电脑上直接执行任务的 ai。 比如它能打开网页、看页面、点界面、做批注,还能配合文档、图片、浏览器这些东西一起工作。 说白了,他开始从帮你写代码,往帮你把一整段事情做完那个方向走了。第二,他开始更像一个能接着上次继续干活的人。以前很多 ai 的 问题是什么?今天你跟他说了一堆,明天再回来,他像重开了一样。但这次 codex 新增了 memory 和自动化能力, 他能记住你之前聊过的内容,还能把没做完的任务继续跑下去。这就意味着他不再只是你问一句,他答一句,而更像是你交代一件事,他能自己往下推进。第三,他真正的变化 是功能变多了,而是身份变了。 openai 现在已经不想让你把 codex 只当成一个代码聊天框,他们更像是在把它做成一个能在电脑上持续干活的数字同事。这也是为什么这次更新不只是程序员会关注,做前端、做产品、做自动化、做文档流程的人 其实都能感受到变化。当然,这里也有一个很现实的问题,它更能干活了,但你用的越多,成本上的也越快。现在 qdax 很多计划已经开始按 token 计费, openai 自己给出的口径大概是每个开发者每月一百到两百美元。所以它不是那种无脑更强就立刻全换的工 具,而是一个值得你先试再决定要不要重度接入的东西。这里我直接帮你做个判断,这段建议你截图保存。如果你是做前端网页 ui 调整的, 这次很值得关注,因为它能看页面,点按钮改界面。如果你是做脚本自动化流程,串联长期任务的 memory 和自动化能力,值得你花一周试一下。如果你平时只是拿 ai 补几行业务代码, 改改小 bug, 但这次不用太着急,先观望也没问题。如果你只是个人,偶尔用一下,更建议先等等,看看价格稳定性和生态再说。所以这次 codex 最值得注意的不是他又多会写一点代码,而是 openai 正在把他从工具往能干活的人那个方向推。 以前大家比的是哪个 ai 更聪明,现在慢慢变成了哪个 ai, 你 敢真的把任务交给他?如果现在让你把一段真实工作交给 ai, 你 会先选 codex 还是 color code? 评论区告诉我。