你用 cloud code 写代码,是不是经常觉得他在瞎摸?问一个价格问题,他先 grab 一 圈,再 read 十几个文件, to come, 刷刷的烧,最后给你个半吊子答案。我之前也是这么用的, 直到我装了 code graph 才知道什么叫开卷考试。这个项目现在 github 上快三万五千星了。一句话说清楚,他给你的 ai 编程助手装了一个代码大脑,他干了件什么事呢? 用 tree sitter 把你整个项目解析一遍,生成一个本地的 sql lite 知识图谱,函数调用,关系类继承, import 链路全给你串起来。然后 cloud code 再也不用 grab 了, 他直接问,图谱这个函数谁在调?一次调用秒回效果有多猛?官方测了七个真实项目,从 vs code 到 dango 到 topo, 平均下来成本降百分之二十五,工具调用减少百分之六十二,速度快百分之二十三。举个例子, vs code 那 个项目一万多文件,没装 code graph 的 时候, cloud code 答一道架构题,要读九个文件,跑十一次, graph 花两分十三秒烧八毛三。装了之后呢? 零文件读取四次,工具调用一分三十七秒搞定,五毛五工具调用直接砍掉百分之八十。最爽的是,它支持的 ai 工具特别多, cloud code, cursor code, xli, gemini, 一 共八个主流工具,装一次全搞定,语言也覆盖的很全, typescript、 python, go rest, java, swift code 二十多种,你项目里用啥,它就解析啥,不用手动配,而且它真的零配置。你装完之后往项目里跑一句 co graph in iti 就 完事了,它自动忽略 node 下划线、 modules, d i s t 这些目录。之所以你的业务代码还有一个细节我觉得特别贴心。 你改了代码,它会自动感知文件,监听器用的是系统原声事件两秒防抖之后自动同步缩影,你不用手动跑任何命令,百分之一百本地运行数据不离开你的机器,不需要 api key, 不 需要联网 sqlite 数据库就在你项目的 code graph 目录里安装也特别简单。 有 note 的 话,直接 npx at kobe mary code 就 行,没有 note 也无所谓,一行 curl 命令搞定。它自带运行时,我自己用下来最大的感受是以前 cloud code 探索代码库像在黑暗里摸路, 装了 code graph 之后,它就像开了导航,该去哪调,谁改了会影响什么一清二楚。所以如果你每天都在用 ai 写代码,这个工具真的值得装,省下来的钱和时间很快就回本了。 github 搜 kobe mac harry 斜杠 code graph, 三万五千星的那个就是,去看看吧。
粉丝10获赞147

hello, 大家好,我是肖少,今天给大家分享一下 codex 怎么接入 deepsafe v 四 pro 的 模型,我看网上都是分享 cloud code 怎么接入 deepsafe 的, 几乎没有分享 codex 怎么接入 deepsafe, 今天我来分享一下。我们打开 deepsafe 的 文档,在接入 a 帧的工具这个地方,我们先看它这个啊, cloud code 库里头 我们一直放到最后是没有 codex 的, 这也就是为什么网上大部分都是分享怎么接入 codex, 因为接入 codex 有 官方文档, codex 接入 deepstack 的 话,我们需要用到两个小工具,一个是 c switch, 一个是 c c x。 这边先给大家安装一下 c x, 找到一个就是自己合适的目录,创建一个 c x 的 目录,我用的是 mac 啊,然后这边是给大家准备的工具,有 mac 的 一个 windows, 然后就把这个 c x 啊放到这个 c x 的 目录里边,然后以及这边有个疑问, 给大家打开看一下,这个英文的是一个配置文件,对,这边是我配置的一个本地的 k 啊,一二三四五六,大家直接用我这个就行,这个是一个本地的 k 啊,好的,我们进到 c c x 的 这个目录,通过中单 最大化,我们给 c c x 加下权限, 然后点杠运行它。好的,这个 local host 是 一个本地的页面,我们在浏览器打开 这时候你第一次进,它会让你输一个密码,这密码的话就是这个地方, 我写的是一二三四五六这个地方啊,你也可以直接用,也可以改一下。对,这边你输入密码之后,然后我们选到这个 codex 啊,我这边是加了一个啊,我教大家怎么加,在这个地方点击添加渠道,大家一进来可能是英文啊,这地方可以选中文。 好,这边点添加渠道,然后这边就输入你的这个 dbc 平台,我们找一下啊, 我们复制一下 d p c 的 这个 base u r, 然后粘到这个地方,下面它还需要一个 api k, 然后在这个地方我们创建一个自己的 api k, 然后给它粘上去就可以了,给它粘到这里,然后详细配置这个地方我们选 open ichat, 这里规范非常建化,这个地方给它打开, ok, 点击创建就可以了。我不创建啊,因为我已经创建过了,下面我们打开 cc switch, 然后我们在这个地方点击添加 这个地方 api k, 就 写我们刚才的一二三四五六啊,就写你自己的那个密码,我这边设的是一二三四五六,然后 api 的 请求地址来我们找一下,是这个 local host 三千杠 v, 然后这边我们获取一下模型列表, ok, 可以 看到获取到两个模型, 一个是 deepsea 微斯的 flash, 一个是微斯的 pro, 我 们直接选微斯的 pro 就 可以了啊,往下滑一点,把这个一照,上下文窗口点上,然后点添加即可,我这边就不添加了,我已经添加过了,添加上之后,然后这边点起用, 这就可以关闭了。当我们配置完成之后,这个时候你重启你的 codex, 这时我们进来的话,它就是使用 deepsea 大 模型,来我们给它对话一下。你好, 来我们看一下啊,这边可以看到模型使用的是 deepsea v 四 pro, 没有问题啊,这样 codex 就 可以直接使用 deepsea 的 v 四 pro 模型了啊,你也赶紧去试一下吧,记得回来交作业。好的,下面给大家说下第二个问题,这个地方的名字怎么改? 然后打开它的这个配置文件啊,它的配置文件是在这个 user 目录下的这个 codex。 哦,它是一个隐藏目录啊,这个要打开,进来之后找到它的这个 configure html, 然后我们打开 好,默认的话是 custom, 然后我这边是给它改了三个地方,一个这个地方使用的地方 改成 d p c, 一个是这个 name, 这个你们可以改成自己任意喜欢的单词,改完之后重启一下你的这个 codex。 下面第三个,我说一下它这个对话怎么给它删掉,我们右键之后发现它没有删除,只能归档, 然后归档之后它就可以删了。然后我们怎么删呢?在这个地方还是这个 directx 这个目录下面找到这个目录,然后进来就可以看到,这个是我刚归档的日常对话,这个地方我先不删,给大家验证一下。归档完之后它会在这个地方 已归档的对话。对,你可以取消微档啊,我们不取消微档啊,我们直接给它删掉 删除。哎,我们这个时候再进来验证一下。 嗯,暂无给他聊天。好的,这就是本期视频的全部内容,我们下期视频再见。

如果你是一个新手小白 codex、 cloud code、 zcode 到底应该选择哪一个?判断的标准一定不是哪一个工具更加的好用,而是哪一个工具能够快速的让我们上手使用。本质上这三个工具都在做同一类事情,就是把 ai 接入到我们真实的工作当中, 它不光能像豆包一样去聊天,还能够看懂项目,帮我们修改内容,真正的帮我们接入到工作当中并跑起来。 所以真正要比较的不是说哪一个工具听起来更加的高级,而是哪一个能够让我们新手更加快速的上手使用。先说 codex, codex 很好用,它有客户端,但是对于我们国内用户来说, 真正麻烦的不是说那些功能如何使用,而是账号支付、网络环境这些问题,我们很多人还没有开始用,就已经先被第一步网络环境给卡住了。再说 cloud code, 它也很强,但是它对国内用户依然不友好, 首先他的客户端界面不支持我们国内的首要验证,所以说只能在终端里面去运行。但是当中端这两个字出来以后,就把大部分的新手小白给劝退了, 我们还没有让 ai 真正的进入到我们的工作,就先被这些前置环境条件给挡在了门外。这也是为什么我建议所有国内的新手用户 一定要去使用 zcode, 它的好处不是说一定就比 codex 或者 cloud code 更强,而是它能够快速地让我们上手使用, 十分钟之内就可以实现下载安装,并且呢支持接入到我们国内各大厂商的大模型,能够真正地在半个小时之内就实现把我们的 真实工作给跑起来。当你真的能够让它帮我们去打开一个项目文件夹,修改一行代码,写一个 word 文档或者是 excel 表格的时候,我相信你一定会打开一个新世界的大门。当你熟练运用 zcode 以后,再去研究 codex 或者是 code code, 上手就会变得非常非常的容易。所以我的建议很简单,如果说你账号、支付、网络环境这些都没有问题,那 codex、 code code 一定是你的首选。 但是如果说我是一个新手小白,只是想快速的体验一下如何让 ai 真正的介入到我的工作当中, 那么 zq 的 一定是首选,完全不需要你考虑任何狗屁的网络环境。半个小时之内就可以快速的让你上手体验 zq 的 不是终点,而是一个快速开始的入口。下期我会带你看 zq 的 界面,包括设置里如何去切入大模型。 作为新手呢?我们也先别急着追求全部的自动化,先去弄清楚三件事, ai 能够看到什么,你要他做什么,结果怎么去检验。先把这三件事情搞清楚,后面才能真正的让 ai 接入我们的工作。 如果你不只是想知道用哪些工具,而是想知道自己的工作流程,能不能接入 ai, 也可以来我每天晚上的直播间,我会现场拆解真实的工作流,判断哪些适合 ai, 哪些交给我们人工来拍板,我先帮你找到第一步。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

hello, 下班了,今天跟大家分享一下我日常是怎么用 codebody 的, 那么我前两天也说过,就是 codebody 是 腾讯的一个 ai 工作台,那这两天也相距推出了像 workbody 这样的产品,那么我也分享一下每一天我都是在怎么进行我的工作。 首先呢就是 workbody 或者是 codebody, 我 们常用的哈,其实它就是一个 ai agent 工具,但是呢它是一个在你电脑里面住着的一个助手,那你可以给他指定一个文件夹,那这个文件夹就是他工作的一个目录, 这个文件夹就是跟你电脑的文件夹一样的,所以你登录上这个 word body 之后呢,实际上你就可以给他指定一个文件夹,比如说这个项目的名字就是这个文件夹的名字,然后呢你就可以开始工作了。怎么工作呢?就是用自然语言去跟他聊天, 比如说举个例子,我要写一篇文章,我要写一篇调研报告,然后这个时候呢就会涉及到他的一个搜索功能, 它怎么能够搜索呢?当然原装的它可以有一些 m c p, 那 么这个 m c p 呢,又是一个新概念了,叫 model context protocol, 就是 相当于你用了一个标准的协议去对接到网络上的一些资源,相当于你 把本地跟网上的信息联系起来。我最近常用的叫 super s e r p e r 这个 m c p, 它是可以用谷歌的搜索,那这个非常重要,因为你用了这样的搜索,你就可以提高信源的质量,这是第一个。 然后我日常的工作状态是什么样子呢?就是首先我上班的时候会跟 ai 说今日规划,然后 ai 就 跟我说, ok, 启动这个 daily focus 的 skill, 这个是我提前预定好的一个 skill, 那 啥叫 skill 呢? skill 就是 技能包的意思,那么怎么做一个技能包呢?就是你可以跟 ai 说啊,我要做一个让我聚焦每天工作优先级的一个 skill 啊技能包,那你要帮我去做一下,但是我现在还不是特别清楚这个过程是怎么样的,然后你来问我一些问题,这样我可以告诉你我的需求,然后就可以开始启动这个 skill 的 制作。 ok, 等到 ai 写代码写,写了好多东西以后啊,然后把这个文档 skill 的 文档写好之后,你就可以开始每日工作规划了。然后大概能做到的呢,就是让你每天先把脑子里想的所有东西都倒出来,然后它就根据你的优先级进行排序。 那当然这个优先级可能就会涉及到记忆系统,那这个记忆系统可能又是另外一件事情,那这个稍后再跟大家说,然后你就可以开始根据你的优先级排好今天的任务,然后你看看是不是要这样规划。 相当于我有一个秘书就每天都帮我在做任务规划,然后每天我完成工作的时候,我跟他说总结一下今天的情况,就帮我生成了一个 今天工作规划和完成任务的一个文档,我今天的文档就是应该是三月十号吧,对,这就是我今天的一天的工作回顾。 有的时候呢,我会用另外一个 skill 叫深度研究,对我这个深度研究就跟他讲的就是他可能去网上搜很多信息,帮我搜一些报告回来,然后帮我去做一些系统化的梳理,这个过程中呢,你可以参与,也可以不参与, 你不参与呢就等着他给你报告之后你再审查就可以了。如果你参与呢,就是过程中你其实是可以看到他每一项任务,他在怎么 怎么执行,搜了哪些文献,做了哪些总结,这个过程你是全程可以看到的。这个时候你跟他说 你现在搜的这个方向不太对,你要去搜一些英文的文章,最新的论文等等,你会可以跟它去调整它的搜索的方向,然后搜回来你就可以去再做新一轮的调整和校对和审查,这是一个协同 工作的一个过程。当然这个深度研究也是一个我提前定义好的 skill, 那 这个 skill 里面除了搜索之外,除了总结文章之外,我还给他提供了一些建议。比如说你搜完之后,你首先要批判一下 你搜的这些内容,你要从不同的角度来去看一下他是不是合适。那比如说你从一个严谨的逻辑学家的角度,从一个演化经济学家角度,从一个创新专家的角度,从啊一个历史学家角度,都分别给我一些建议, 对这个文章进行一个评论,然后你再去重新校对和输出一轮,看看有没有事实错误,看看有没有严格的这种逻辑问题。然后这个时候你再把成果输出成一个文档给我, 那因为 codebody 和 wordbody 就是 都在你本地电脑中工作,它是可以把一些文件的内容写到你电脑中去的,就变成了一个 markdown 文档,那这个时候你就可以基于它的产出再继续工作,继续干活。 所以我每天上班的状态就是打开 codebody, 然后跟它对话,然后现在的对话呢,之前还是打字,现在完全不用打字了,都是在说话。 然后我接入的是微信输入法的语音功能,就是在微信下面有一个开关,你可以设置一个快捷键,然后按住那个快捷键,你现在在输入,他就可以变成文字。那这个好处呢,就是说话比打字是快很多的,然后你在他说完以后,基本上就是通过嘴指挥电脑干活。 然后我们现在日常上班就出现一种很有意思的状态,就是我跟我的同事,大家两个人都在非常小的在在在说话,指挥电脑,所以这个也是一个常用的能力。当然我还有一个最常用的就是这个会议就要转写, 或者是录音的转写,然后这个呢,我之前呢都是在网上用腾讯会议来去做文字的转录,后来呢,我发现可以本地装一个模型,在本地就完成这个会议内容的转写,这样呢其实它更可控一些,而且就都完全存在本地, 相对来说更私密一些,所以就又下载了一个模型,每次有新的语音进来之后,我就跟 coldbody 说,你帮我进行一个转写,当然这个转写也是一个 skill, 就是 他提前提前跟他说好的,每次遇到这种情况,你该怎么处理,用什么脚本,他已经都固定好了,规划好了 好,这是几个常用的给我的能力。另外还有像我刚才说的记忆系统,这个之前我也有一期视频专门跟大家讲过,就是怎么搭建你的记忆系统,其实并不复杂,然后很多朋友说想看看具体是怎么搭建的,但实际上就是你跟 ai 对 话,你就跟他说我要搭建一个记忆系统,你的目标是什么?你就是想把 你的日常的偏好,就使用 ai 的 偏好,或者是日常跟它对话的记录,以及它提炼出来你的核心特征, 到底你希望他记住你的是什么,你就跟他说就好了,他就可以帮你写一个记忆框架。然后这个时候呢,你再跟他说,你要去网上帮我找一找有没有其他非常好的记忆系统的推荐,他就会给你一些推荐,然后你就说那参照这个来写一下吧, 对,就完成了。那这个记忆系统的好处就是每次我打开的时候,他都会优先的去调一下我的记忆系统中,最近我在帮我排一些优先级,所以整个的工作流程现在 就对我这么一个屁人来说非常的灵活好用。对,因为今天的 workbody 的 上线呢,就是非常的火爆哈,然后包括我们今天上午的云服务器都挂了,用户量太大了, 所以就是也是跟大家分享这些这些这些小的方法,就核心其实就是把它作为一个你电脑中的一个工作助手,让他帮你去 读文章,写文章,修改文章,跟他去讨论,做一些思维的互动。然后整个这个过程中,其实第一个阶段还是人在环中,它跟 openclop 不 太一样,就是还是希望你要参与到整个工作流程中, 当日后等你的工作流打磨的熟练之后,可以用一系列的 skills 把这些工作流串起来,这样的时候你就再把这个自主性更多地给到 ai。 对,所以其实我们跟 workbody 的 团队合作非常的密切,然后之前也一路看着他们的这个产品成长起来,我们给他提了很多建议,包括我这个带货哈,就经常给他,他们家这个产品啊带货我们也一路打磨,就觉得还是非常好用的,目前的一个状态,所以大家不妨去下载一个 workbody 去试一试。 刚才我讲到的很多 skills 听起来很复杂,但是你只要跟 ai 说你帮我做一个什么什么什么 skill, 它就可以帮你完成, 所以其实一点都不难,然后动起来和真正用起来是最难的一件事情。然后过两天我们继续在研究院和腾讯的官网上会有直播,大家说周四晚上,到时候大家可以看一看,拜拜。

如果你常听别人提 cloud code 有 多牛,想体验,却被它复杂的安装、繁多的命令行以及纯极客的操作界面劝退,那你今天来着了。我在 github 上发现了这款宝藏工具,开源免费。它上线一个月,星标就将近十 k, 热度极高。先看下效果, 第一,全图形界面做到了豆包的易用性,能接入几乎所有的主流模型,甚至可以接本地部署模型。第二,可以接入微信、飞书等 i m 工具,让你用手机就能随时操纵 cloud code。 别人都在手机里养小龙虾,你可以在手机里养一只东海龙网。 第三,还支持 computer use, 全球顶尖模型公司都在研发的功能,能模拟人来操作电脑,完成任务。这个工具将 cloud code 的 安装和使用门槛几乎降到了零。 它是基于 cloud code 的 原码来进行的应用开发,保留了原汁原味的内核架构,在用户体验和功能延展方面做了很大提升。用过番茄花园 windows 的 人都能明白,我们国人开发者是多么的懂用户。 这段时间我用下来,我觉得作为一个 cloud code 的 老用户,我是回不去之前的方式了,就像是开习惯了自动挡的人不愿意再换回手动挡一样,以前要写命令改配置的操作,现在点点鼠标就可以了。如果你想体验 cloud code, 我 觉得这是一个非常容易上手的方式。点关注我,持续分享 ai 提效的工具和方法。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

我不是程序员出身,连代码都不会看的那种,但是现在我店里面的上新全部都是交给我用 ai 写的一套东西在自动跑, 这是我自己的一个手机壳,淘宝店铺,我给你看看它能做到什么程度。这里有十六条待处理的商品信息,其实自动上架是整个上线流程最后的环节,所有东西准备好了再来咨询。 有人会说会被反爬程序识别,但整个的原理其实和一些 l p a 的 自动化工具是一样的,所有都是通过浏览器来操作。 具体看一下这里的详细对比,我用这个程序还未被触发过,当然你一天干个几百上千条链接还是有可能被监测的。 整个过程是非常丝滑的,就是完全模拟人工的鼠标轨迹在跑,点击提交,打开信息,这就完成了一条链接的上线。 批量处理图片,以前是通过 ps 进行一张一张的导出, 然后现在是通过程序可以把全部的图片一次性导出来,它的图片全部都分门别类存在这里了,每一张图片都有清晰的命名,这是为了方便后续的上架处理。 这些都是程序通过调用 chat gbt 的 image 二点零的模型生成的场景图和效果图, 然后会自动进行处理,处理成一比一的主图,还有三比四的主图,直接自动化生成每一个产品链接的横幅可以放在详情页上面。 我不是技术出身,这是我一点点摸出来的, 这个账号会一直记录我踩过的坑,我试出来的东西我会原原本本的发出来,要是你也在做电商,可以跟着看看。

让你志能游天的 ai 动起手来吧!把这个文件夹里的文件按照类别整理好,按顺序改成项目一。项目二,咦,每天早上九点,搜集前一天的 ai 行业资讯,发到群里看,总结这个文档里的内容,生成 ppt。 这期避开专业难懂的术语,让小白也能够流畅运用上扣带,让你的工作效率和创新全面提升。我们先认识它,再到如何使用安装,用六个按键一步步的掌握它。其实词和小技巧呢,我也总结到了,视频里出发 扣带斯和可劳扣的它们呢,是类似的,都是 ai 的 编程工具,只不过一个呢,是 oppo ai 家的,默认的是 gpt 模型的,但你也可以在里面去更换你自己的模型,但你也可以在里面去更换你自己的模型。 这两个阶段性地成为目前好的必然模式。但它们适合使用的场景呢,会有点不同。 ko 代斯,它呢,就适合我用来快速整理文档,处理一些。这种本地的任务界面,对于小白来说会比较友好一点,就很适合初学者或者是我们日常的办公场景。因为是 open ai 的 嘛,所以呢,我们也可以直接在里面调用 j p e m 叉二来生成图片,而 可牢扣的会比较适合追求高质量的创作用户,并且 c c 的 知名度会高一点,所以不论哪种语言,你都能找到关于它的类似教程。 之前还在说 c c 可以 用手机来控制 c c, 在 前几天也出了手机端,二者的功能差距又缩小了。 c c 的 小白使用教程呢,我们之前也聊过,有兴趣的可以去复习一下。那我们要使用 c c, 我 们只需要一个 g p 的 账号, 免费的呢,也是可以用的,只不过它的额度会少一点,会有三种不同的使用路径,就是使用哪种方法来开启你的扣袋子。 c r i 呢,会在你本地去开发操作,你的本地项目就比较适合开发者深度来使用,因为需要一些命令行的使用,所以会有一丢丢的小难度。那这个呢,就是把扣袋子装进你的代码编辑器里, 像 vivo studio code, 反重力这种的,而我们普通用户呢,直接选择这个就可以了,不用懂。命令行,适合大多数人来使用, ok, 我 们来进行安装,我们按照它的指引步骤来操作就好了。进来之后呢,我们可以看到它的整个页面跟我们常用的 ai 工具还是很像的。而左边的这个导航栏就是你的文件柜, 所有的功能入口都会在这里去显示,而中间的呢就是我们对话交流的地方,而右边这里就是你小助理给你交作业的地方,成果的展示区域。而左边的这个导航栏,每一个入口都是一个工作流。在这里重点的呢就是这两个 来快速对话,就是主打一个随问随答,碎片式的对话,就像你给他一个英文的演讲稿件,然后让他给我翻译出来,哎,还挺到位的。像这种只是问问问题,写写代码和 check gdp 呢,其实相差不大。而这个项目呢,它就更适合一些长线的 摸不准,需要高度上下分连贯的这种复杂任务。点击这里我们可以看到这里呢会有两个选项,这个呢是在你默认的路径下新建一个空白的文件夹, 而另一个就是说打开你电脑上的现有文件夹,在这个基础上再去操作。比如给他一个本地的文档,里面呢是一堆的发票图片,那我们在这个对话框的下面也可以看到,我现在是在这个文件夹里进行操作的,这就触碰了沙箱机制,只能操作本地选中的文件夹,不能操作系统其他的文件。那我们现在给他要求根据这几张发票, 然后给我按照金额重新命名一下文件。当然只有这些呢,还是不够的,我们还需要给他开放对应的权限,那我们可以点击这里可以看到这里有三个模式,分别是你只能在当前的文件夹下来修改或者执行, 如果需要联网或者说触碰这个文件夹以外的东西,需要来向我们申请,我们同意,他呢才能继续执行。而这个呢,恰恰相反,他可以自由的读取、写入,修改或者删除目标范围内的程序。 自主性呢会比较高一些,但也会有一定的风险。在我在这种简单的任务下呢,会选择这个模式,简而言之呢,就是 ai 会自主的帮你筛查这个有没有危险,像安装常规的工具这种明显安全的操作,它呢就会直接上手了, 不会再来询问你了。 ok, 他 也操作好了,我们来看一下,那整体呢,也是根据我的这个内容来命名的,还是不错的。那除了帮我们整理本地的文档,还可以在我们授权的情况下,在你的电脑上来执行安装的操作。比如最近爆火,但有点上手门槛了。 cloud code, 我 们在 d 盘新建一个文件夹, 然后回到这个 codex 里面,再把这个文件夹给它呼唤出来。那这步的意思呢,就是让 c c 在 这里面进行操作,那我直接给他说帮我安装一个 colocode, 那 我们稍等一下。好,他现在呢说已经安装好了,我们来启动一下。哦,是可以的了,当然也包括 node js, git 这种我们日常生活中经常用到的依赖。 好,现在你用 codex 整理了你本地的文件夹,大大缩短了你的时间,也把有点安装困难的软件安装到了你的电脑上。对于听到 ai 编程就望而却步的,棒的就不止一点点了。当然 ai 编程嘛,也不能把它的能力举现在这里来, 我们一起做一个芝士机械超玩盲盒,咱们就都是原始谷的动画了。那我们呢,现在在这里选择好它原始的位置,先点击这个加号,那最上面的这个呢,就是我们上传文件, ppt, excel 图片,我们也想让它们进入到这个转化里, 就在这里上传,和我们直接拖拽是一个效果。那中间这个计划模式,在这个模式下呢,他不会立刻来改动我们的文件,而是先帮我列出一个详细的计划,就比较适合复杂项目,或者是你还没有思路的情况。 那右边这里呢,是用来更换模型的,我觉得五点五还是比较好用的,这里呢我就不更换,还有对应的推理强度,也可以在这里去更改。那我现在告诉他我的一些具体要求, 如果你有了一定的构思之后,也可以一起告诉他,当然如果没有的话,直接给他说我们最后想要一个什么效果,他呢也会一步步的引导我们来做出最后的成品,好开始帮我们来构思整个架构了。 哎,他现在问我盲盒系列规模要按照什么来设计?规模怎么搭配?那我们把鼠标放到这个小符号的上面,也会有个更详尽的一个介绍。好,那我在这里选择第一个, 他现在呢还是用这种选择方式来一步步引导我们表达出我们想要的东西,那我们顺着他的想法来就好了。那都选好之后呢,他也给了我一个整体的框架,我大概看了一下还是不错的,那觉得 ok 了,我们就可以让他开始执行,当然我们有需要更改地方,我们直接在这里提出要求就好了,那我们现在同意执行。 ok, 他 现在也在运行中了,在这个思考的过程中呢,我突然想起来,我想让他滑动的时候有一个光效,那我直接在这里提出我的要求。 哎,他现在啊根本就没有办法发出去,而是在这个地方排着这个情况呢,他会在这个任务完成之后再来执行我们现在的这个任务,但是不行啊,我现在就让他考虑到这个要求,并且加进去,那我就点击这里的这个按钮,他呢就插队到了当前的这个任务中, 而路由思呢也会考虑到我们这个要求继续执行,这就是一个插队的小技巧了。好,他现在说呢是可以了,我们先不着急,我们把鼠标放到这个小圆圈上,我们就能观察到我们这个窗口一共用了百分之几。路由思在快满的时候呢,它也会自动的来进行压缩上下文,但因为上下文太多的话,路由思就会表现的不那么聪明了, 那我们就可以手动的来进行压缩,在这里我们打斜杠压缩就好了,他呢就会把上面的聊天记录进行精简,但更细节的东西呢,他也就会不再记录了。 ok, 我 们来看一下我们刚才生成的这小网站,这个例子动销交互界面 还是不错的,那如何实现多任务并行进行呢?那我在本地选择一个项目文件里面呢,有往期的图片还有视频,在这里输入我的要求,把里面按照类别给我分类。好, 那我们再开一个,我要这个把文件里的图片和视频根据内容说明,你再来一个吧,把视频分离出来,音频, ok, 你 看他们在这里努力的转圈圈,我们来看一下结果,这个类别是分为好的,这里是视频的,还有图片的。不得不说啊,他这个名字和内容还起的挺相符的,所以说这里呢,他的每次对话都是独立的,不会再与其他的工作内容产生深度的关联,但都会有权限查看当前的文件夹内容。 到这里我们日常使用是 ok 的 了。更进阶一点的呢,就是扣带斯的插件技能 m c p 这三个词就是小白最大的路虎了,其实一句话就能解释清楚, 插件呢,就是给扣带斯装了一个能力包,比如装了表格插件,它呢就会处理 excel。 而技能 skill 大家都很熟悉了,就是一套固定的工作流程,可以根据我自己的风格来写一篇技术教程。 m c p 就是 连接外部的通用通道,比如我要用扣带斯做一个这样的效果,通过自然语言创建动画视频的技能。包好,我先给他一个文件夹, 然后把要求现在都给他,如果你有想要的效果,那我们就点击这里上传,然后把参考一并发给他。 ok, 他 现在呢是开始工作了, 里面需要的什么依赖啊,组建都不需要,我们再去手动的去添加,他呢都会帮助我们去一步步的完成。好,他现在运行完毕了,我们打开这个呢,是 windows 默认的浏览器浏览一下, 你在这里可以随意的来调节这个动画了,因为在一开始的时候,我提示词中已经提到了提供可以配置的参数项,那我们调节一下。 ok, 我 们关掉背景,那想要这种透明的效果呢?参数的配置是这些,那我们最后给他宣传好就 ok 了。 个人建议,一开始呢,什么插件我们都不要慌,先用它内置能力,等你明确知道了我需要库代词,去安装某个工具能力的时候, 再去插件页寻找也是来得及的,大家有兴趣的我们可以单独出一期,详细聊一聊。说了这么多,其实你也发现了, ai 现在就不只是答疑解惑的工 具了,它呢挑出了一个被动执行的命令曲线,是可以理解你的意图,帮助你完成复杂任务的智能伙伴。而每次操作呢,也成为了我们学习、创新和突破的机会。好了,喜欢这种内容的朋友呢,我们下次见。

哈喽朋友们,我是阿水,今天给大家介绍一下,我用 codex 微博抠定了一个可以代替我干活的小插件,从设计稿的生成再到切图交付, u i 设计师必看的这一期,如何一分钟看完别人一整天的活,那这个插件呢?纹身图和图身图 目前都是支持的,首先是在这里可以选择纹身图,那这里呢,我们输入简单的提示层描述就可以,然后要做移动端的话,直接选择九比十六,那或者需要根据自己的需求我们自定义尺寸也是 ok 的, 那图片数量呢?这个就没有啥要求了,好了之后呢,我们就直接点击生成设计稿按钮, 这个速度大概是在一分钟左右就可以完成,好了之后呢,我们就可以选择要切图的图片,点击切图按钮,然后用鼠标直接框选就可以。鼠标拖动的方法切图可以说是非常的方便,我们只需要在页面上点击鼠标 画一个句型就可以选中切图,无论是大一点的 icon 还是按钮,以及我们在底部的这种 tab, 还有页面上的这种小箭头主标题也可以用这个方法来切出来。当然如果我们想要把 icon 的 背景给它变成透明的,我们只需要点击透明的按钮 就可以了,正好的一点就是针对单个的按钮可以自己自定义设置。那切图好了之后呢,我们就可以导进 figma 里面,可以看到刚才切好的图片,它已经单独帮我们进行了图片分层,而且有一个特别好的点是 我们把单独的 icon 切出来之后,它原图的背景上面的 icon 就 会没有,就会消失,并且呢,它填充的颜色也和我们的背景特别的相似,几乎看不出来有颜色填充的痕迹。那其实到这一步呢,完全可以是一个可交付的一个状态了, 因为我们的图已经切好了,只需要交付给开发就 ok 了。那除了纹身图,其实图生图的方法也是一样的,必要是我们手动设计的环节,全程都是由 ai 去工作,而且呢,大家可以看到切完图之后,它的原始背景上面,你当前切图的这个 icon, 其实它已经从背景上面消失了,并且呢,它用了一个色块填充,而且呢,它填充的这个色块也是很好的,而且呢,对于透明的这一点,它做的也非常的好,就是呢,它把你的 icon 主体给你留下了,但是背景呢,它真的是透明了,这个真的是特别的方便。我做这个插件呢,其实 初心是因为我没有飞格玛的教育版,也没有飞格玛的会员,那所以呢,我没有办法去使用 m c p。 然后呢,这个插件就诞生了,这个也是一种 没有会员,没有教育版的一种解决方案。那如果大家对这个插件有什么要求或者建议更好的功能点,那大家可以在评论区和我讨论,而且想拥有这个插件的也可以直接在评论区找我来拿,我是阿水,大家记得点赞关注评论哟,我们下期再见,拜拜。

大家好,这个视频我们一起来看看这三个 code agent 工具的安装,分别是 open code、 cloud code 和 code x, 我 们主要讲解基础的安装配置,国产大模型幻化的配置和注意事项。 他们三个的安装其实都比较简单,然后使用国产大模型可能会复杂一些。然后顺序的话也是我刚才说到的顺序,最简单的是 open code, 直接就可以用,接着是 cloud code 配置大模型稍微复杂一点。最后是 cloud code, 它的配置相对复杂一些,我们耐心的往下看 前面三步安装的桌面版,然后同时保证能够跟这个 ai 工具去对话。 呃,这三个 code a 阵特它是相对最近的呼声都比较大的一些,一个 a 阵的工具哈。呃,最初它们的设计初衷都是用于限定场景,但是现在的话也是扩展的比较好的哈。然后我们一个来看, 最开始是 open code 的, 它的桌面版的话去下载就行了哈。嗯,我这个是以 windows 为例来做的一个说明,你像你自己的话,桌面版的话选择对应的版本就可以了, 因为我们现在的话,可能大部分人使用 c l i 命令的那个习惯可能不是那么够哈,就是桌面版的感觉可能会好一点,需要一个过渡。然后我是以这个版本为例来去做一个说明, 这三个工具我都是演示的是那个桌面版哈。然后终端的话一般也都是自带的,大家可以根据需求去做。 oppo 的 它的终端使用的体验据说是好于桌面版。然后另外两个的话都是 桌面版,其实也都做的非常好哈。 open code 的 话,这样去下载合适的版本就是默认安装,没有什么问题哈,安装下一步,下一步就能够搞定哈,然后他打开的话大概是这个样子,这个是 open code 的。 呃,这是我刚才测试的一个情况哈,就是给他打了个招呼之后,然后他会去回答我们 这下面配大模型,然后这个他自己自带的有几个模型哈,因为他是开源的社区做的比较好,开源的就这些的话,他自带的一些模型,然后这个是我配的模型,配的话你配不配都行,然后我这个是配上,大家看看就行。配置的话后面有涉及到 cloud code 和 code x 的 配置,它们的配置情况都差不多,到时候讲到配置的时候,大家可以关注一下。然后如果有想用它提供的免费之外的模型的话,可以根据后面我们提到的那种方法去配就可以。这个是 open code, 它非常简单哈,我们去下载安装就行了, 就是下一步,下一步默认就可以。接着是 cloud code, 它的桌面版的安装的话,我们去对应的地址去找 这个版本下载安装,基本上你是默认下载就行了。这个下载安装的话可能对网络环境会有一定的要求,后续的话我也会把相关的安装包给到大家的 桌面端安装,就是这样一个方式去安装就行了。然后他这些这几个工具其实核心都不是安装核心,更多的是配置,你不那么擅长的话,可能他就有一点点麻烦。 然后 cloud code 包括后面的呃, code x 都是通过 cc switch 去配置大模型会比较好一些。 呃,那这个 cc switch 的 话,它的这个安装是这样哈,我们打开了之后你往下拉哈, 以 windows 为例的话,选择的是这个,然后下载之后的话,安装也是下一步,下一步去安装就行。然后安装完了之后,我们打开打开的话,先是通过这个设置这个地方,接着就到了这样一系列的一个配置哈,然后在通用这的话把这个默认语言做一个调整, 这些的话也是看它显示显示深色的,浅色的,你自己去配置就 ok。 然后这个主题显示的话,它这个指的是 cloud code 的, 它的那个 c l i 短,然后这个是 desk top, 就是 cloud code 的 桌面短,这个是 code x, 然后专门来 open code, open cloud, 然后后面子这些都有哈,你根据你的需要去配就行。 像 openclawhermes, 你 配置过之后的话会知道它不用这些东西去管理也是 ok 的 哈。呃,我是没用这些管理。然后就是今天讲到的三个安装的,用的是 cc switch, 像这些的话默认就行。基础配置完了之后的话,在路由这路由这的话是要保证给他都打开,他都打开的一个状态,像这些起用的话也是都都要打开的,就说不要看我的这个截图,这这些东西都要打开,你在打开的状态下的话,他才真的去链接到我们配的那些大模型。 c c switch 大 概基础的安装是这些,那安装完了之后我们就到了接入 cloud code, 它的那个大模型就是我们自己去用这些不是通用型的 ai 工具,而是一些你自己安装自定义的那些 ai 工具,你总是要去为 token 的 费用去支付的, 建议新手使用的哈,在探索期你的任务的话可能,嗯,说实话就是更多的是探索,没有那么重要的,就说一些工作非他不可,建议用这两个,性价比相对高一点。 tipsy, 大家都知道最近调整了价格,有了一个长期的折扣, 就是很便宜了哈,就是按量付费的话,我们用这个,然后买套餐的话,用这个 minx 这个套餐也很便宜了哈,就是二十九块钱一个月的月度套餐。这个的话就是不熟悉怎么去获取 k 配置 k 的 话可以看看这。嗯, deepsea 的 话,进到他的那个官网平台之后, 到这个 api k 这,然后充值,充值完了之后的话,你就可以去创建你的 api k, 创建完了之后把它复制下来哈,它这个复制的话,它有一点点不太好的地方,就说它复制完了之后, 你给他那个复制页面,给他关了之后,你以后就看不了完整了哈,所以复制完了之后的话,你找一个地方粘贴下来,这个是 deepsea 这儿,然后 mini max 用这个链接就 ok 的 哈,然后往下翻,找到那个阅读套餐,我建议新手你用这个最便宜的就行了,可以的话进到了这个, 通过这个账户管理,然后进到这个 tiktok 这,然后这个地方就是你的 key, 然后这个地方复制的话,就是后续再复制的话,你是能看见完整的复制的,它不像 deepsea 那 样,你复制一次可能后面你看不见完整的。接着就是到了配置这个大模型, 我这个圈出来的不对哈,就不要看,我们不是到了 cloud 吗?然后这个 cloud 这的话添加供应商,呃,我们以 deepsea 为例哈,然后这选 deepsea, 接着到供应商详细的这个页面,然后这个页面的话,像这些是 b 填项哈。嗯, 供应商标识要有一个名字,你以后方便你找他。然后这个 api 端点的话,默认的其实就对,但是有些情况下,如果你是 呃 openai 它的那个体系下面的话,就是比如我们后面用到的 codex 的 话,你以它的那个为准。这个的话像因为我们视力是 deepsea, 然后在 deepsea 它的那个网站上能够找到它这个端点信息,要怎么填,然后去找去填就可以了。 apikey 的 话是我们刚才获取到的那个 key, 填上之后的话点这个添加,然后保存一下就行了。这个的配置哈,它就配好了,就是这个相对来说它也还比较简单吧,就是只有毕竟只有一步配置。然后熟悉下这个过程吧,我们先是安装它的那个桌面端,然后是 cc switch, 这个的话后面用那个 code x 也是需要用的哈。通用的配置的话就是打开路由添加大模型。 cloud 接入大模型的话,就是需要你有自己付费的那个 token 的 那个 key, 拿了这个 key 之后的话,再到这儿去真的来配置这个大模型,然后看一下大概配好了是什么样。是 cloud code, 哈,这是刚才发起了一个绘画,做了一个自我介绍,我们能看出来哈,在这儿我选的是 deepcode, 哈,这是刚才发起了一个自我介绍,我们能看出来哈,在这儿我选的是 deepcode 哈, 这个再补一下吧,补一下,像在这个地方 cc switch 这个配置的那个 cloud code 名字填上,然后官网链接填上。这个的话要根据我们刚才说到的,就是 deepseek 它的那个官网上面在接口文档这儿,像那个 openai 的是写这个, 包括的是 azoric 公司的产品嘛,然后他写的是这个哈,我们根据他这个填就行了,就是在这的话,这个地方地址填好了,然后这个 k 填好了, 这个是默认他就有了。在这个地方的话像这个填上,这个填上,然后这个 k 是 填上,然后这个需要注意一下,要改一下到下面这哈,这的话你可以把模型加出来, 加出来的话这两个因为这个 v 四它是最多支持了一兆的上下轮,然后我们把这两个都勾上就保存就可以了, 像这的话就是可以自己去切,我们用的是 flash 还是 pro, 这个安装大概就是这样哈,安装很简单,然后配置的话稍微有一点点复杂,但是你理解了这个逻辑之后的话也还是蛮简单的。 它这个的话没有严格的限定住我们一定要用 cloud code, 它本身就是 azure take 它自己的大模型,我们不需要用那个哈,我们不用那个也能实现。 然后后面 code x 的 话就怎么说,它限定的更严格一些,然后我们处理的方法也会更复杂一些。 我们来看这个 codex 也是去下载安装对应的版本就可以了。这些下载安装的话可能都对网络环境有一定的要求,如果你自己下载搞不定的话,也可以直接用我这提供的安装包哈,没有问题的。 然后它这个更复杂一些哈,它的大模型的配置的话,需要我们在 cc switch 这样的一个配置去完成哈, 然后这个配置的话有一点注意一下,像我们如果你装了很多 a 阵的工具的话,应该都知道哈,就是说有一个 note 十八加的一个版本的,那个 note 是 你必须要安装的,就说这个 code x bridge, 它的使用场景也是这个 note 十八加的一个版本, 这个我在这里面没有详细的说哈,你自己去安装就行,这个它怎么去配置呢?下载这个项目它有这样的一个文件在,就是你解压之后的话,有这样一个文件,这两个是没有的哈,就说它有这样一个文件,在我们把这个文件创建一个副本,创建好了之后,用记事本打开, 然后把那个点 e n v 文件,也就是刚才我们创建副本的那个文件,然后把这个 key 给它换掉, 然后把这个文件也换个名字哈,就是创建的副本记事本打开,换成你自己那个 key, 然后把名字改成这样, 然后下面有一个启动点 cmd 文件,是我们通过先创建一个 txt 文件,再把这样一行命令给它粘进去,然后文件保存,按照这样的写法去修改 这个文件他是整个包括扩展名是他完整的名字哈,这个过程可能还是有点复杂吧,因为找这些东西,然后包括去改的话,我这样写的话,你可能不是很清楚啊,不太清楚的话直接用我这个给的就行。 下载之后,然后点开这个点烟味文件,然后把这个 key 换成你自己的,因为那个地方我留的空哈,就是说他并不是一个真的能用的 key, 这个可以换成你自己就可以了, 像这个 codex bridge 这样一个配置也就配置好了。接下来我们就要在 cc switch 上面再做一个相关的一个配置,在这儿找到 codex 点加号就是添加供应商,就是自定义配置一个供应商就行,然后这个名字的话你取一个你自己能区分的名字, 然后官网地址的话写这个哈,这个是怎么来的?是这个刚才忘了说了,强调一下这个我们前面不是创建了这样一个启动点 c m d 文件吗?在这,然后我们双击启动它,它弹出来的界面是这样的,然后这个页面的话不要关哈,给它最小化,不要关,然后它这不是有这样一个地址吗? 然后把这个地址复制到 cc switch 里头,就是这哈,然后刚才不是添加供应商吗?这些做的一个配置,然后这个 api k 怎么填?还是前面的这个点 e n v 文件?就是前面我们创建的副本,然后副本改了那个 点 e n v 文件,这从上往下的话就是大概十几行的一个位置,有这样一个 k 哈,其实跟前面那个是一样的,只不过我们找的是不同的 k, 就是 这个哈, 在一个文件里面,这个的话是你要改的这个 key, 然后这个的话是他本身转接的时候用的那个 key, 不 用太去理解他是什么意思,找到你复制的那个点音 v 文件,然后把这个 key 找出来就行了,在这该怎么填?给他填上,我 看的情况的话是他这个 key 的 话应该是不会变,就说你以你自己的为准,如果跟我这个填上就行,填完了之后的话,在这把这个模型打开, 就是这一个小箭头,我先刷出来,选一个你用的模型就行了, vs flash 就 可以了,然后把它点添加,它也就配置好了哈,就是这个过程的话 有这么好几部 cc switch, 然后是那个酷狗 x bridge, 就是 越来越复杂的嘛,就是有这些配置,大概启动之后是这个样子, 这个地方能看见它的那个智能,你要怎么选?然后这个模型你该怎么选?但是这个模型选的话,说实话也是个假的嘛,因为我们真正用的模型的话,是我们给他配的 deepsea, 这样就能绘画了哈,然后大概的话基础配置安装,然后到配上大模型使用这个就好了。 那往后的话我们大概看看 cloud code, 我 这个是中文的, 中文呢,其实你直接安装的话它是英文的,然后我们要做一个汉化的处理,找到这样一个项目下载到你本地,然后解压,解压了之后的话,双击这个文件,你的 cloud code 应该还需要再重新启动一下,它的这个汉化处理应该才会生效。 用汉化处理之后的话,它就是中文嘛,然后我们这里方的设置,从这儿点开这个文件,然后在这儿设置,在一般的设置里面,你是可以去对它的这些基础的信息去做一个配置的,亮的、暗的,还是跟随系统看你需求你去设置就行。 这个是中文配置和基础的外观配置, cloud code 它的,然后 code x 的 大差不差都一样哈,就是这儿点开设置六, 然后 setting, 找这个通用这些东西语言呀,然后像这些用什么样的,他们的就是这些等等等等的一些配置,根据你的需求,你的习惯去配就行了。 然后 open code 的 配置也是类似的哈,也是在这个文件这,然后找到这个 setting 进来之后做相关的配置就行了,你再用起来的话就相对已经很油耗了哈。就是它是中文显示大魔仙,也配上了 接触使用,就说能开始用了,就现在是到了这个度,大概的总结一下吧, 它们的初衷都是 coding。 最近的话,那个 cloud code 它的装面板其实还蛮火的。 code x 最近也挺火的,就说越来越多的人把它们用到了非 coding 的 一个场景哈。 嗯,我觉得可探索的点还是蛮多的,也可以一起去探索一下,然后注意一下他们没有 ktv 的 机制哈,所以他们无法连飞出微信这些终端。这三个的话, 前面安装的那个顺序我也是按照这个顺序来讲的。 open code 可 out code 的 x 使用限制是越来越多,像 open code 的, 它是开圆的,不限定大模型, 并且还有免费的额度,实在是在后面搞不定的话, open code 多用用我觉得也蛮好的。然后 cloud code 用 cc switch 做国内的大模型就可以了哈。嗯,最佳的使用是 cloud 的 自己的大模型,但是我们现在都知道了,费用相对较高,获取渠道又十分有限,那没办法, 但是现在用 deepsea 也好,然后用 mini max 也好,那些套餐用起来真的还蛮香的,这样用也都行哈,没有必要就是非得用那样极致的那些东西啊,因为我们现在的让 ai 做的其实都是重复性的工作,就是那些大模型的话, cloud 也好,然后 gpt 也好,它们是精英的模型,你没有必要让一个精英去完成哪里的工作,其实大概也就是这么个道理哈,就是不是太建议大家就非得去想尽办法去找那些大模型,因为现在真的国内的那些真的用起来真的蛮像的。 接着就是 codex 前面说了它配起来更麻烦一些,然后国内大模型,然后用 gpt 自己的模型会比较好一些哈,费用比较高,不是太建议大家非得去弄 整个安装和配置,就到这哈,就是整个过程的话,大概你知道是怎么回事之后,我觉得还是蛮顺利的吧。 那就希望大家真的能够用起来这些很好的工具,然后解决你工作也好,生活也好,学习也好中间的问题吧。呃,我们这个视频就到这里,我们下个视频见。

hello, 大家好,我是肖少,今天给大家分享一下 codex 怎么接入 deepsafe v 四 pro 的 模型,我看网上都是分享 cloud code 怎么接入 deepsafe 的, 几乎没有分享 codex 怎么接入 deepsafe, 今天我来分享一下。我们打开 deepsafe 的 文档,在接入 a 帧的工具这个地方,我们先看它这个啊, cloud code 库里头 我们一直放到最后是没有 codex 的, 这也就是为什么网上大部分都是分享怎么接入 codex, 因为接入 codex 有 官方文档, codex 接入 deepstack 的 话,我们需要用到两个小工具,一个是 c switch, 一个是 c c x。 这边先给大家安装一下 c x, 找到一个就是自己合适的目录,创建一个 c x 的 目录,我用的是 mac 啊,然后这边是给大家准备的工具,有 mac 的 一个 windows, 然后就把这个 c x 放到这个 c x 的 目录里边,然后以及这边有个疑问, 给大家打开看一下,这个英文的是一个配置文件,对,这边是我配置的一个本地的 k 啊,一二三四五六,大家直接用我这个就行,这个是一个本地的 k 啊,好的,我们进到 c c x 的 这个目录,通过中单 最大化,我们给 c c x 加下权限, 然后点杠运行它。好的,这个 local host 是 一个本地的页面,我们在浏览器打开 这时候你第一次进,它会让你输一个密码,这密码的话就是这个地方, 我写的是一二三四五六这个地方啊,你也可以直接用,也可以改一下。对,这边你输入密码之后,然后我们选到这个 codex 啊,我这边是加了一个啊,我教大家怎么加,在这个地方点击添加渠道,大家一进来可能是英文啊,这地方可以选中文。 好,这边点添加渠道,然后这边就输入你的这个 dbc 平台,我们找一下啊, 我们复制一下 d p c 的 这个 base u r, 然后粘到这个地方,下面它还需要一个 api k, 然后在这个地方我们创建一个自己的 api k, 然后给它粘上去就可以了,给它粘到这里,然后详细配置这个地方我们选 open ichat, 这里规范非常建化,这个地方给它打开, ok, 点击创建就可以了。我不创建啊,因为我已经创建过了,下面我们打开 cc switch, 然后我们在这个地方点击添加 这个地方 api k, 就 写我们刚才的一二三四五六啊,就写你自己的那个密码,我这边设的是一二三四五六,然后 api 的 请求地址来我们找一下,是这个 local host 三千杠 v, 然后这边我们获取一下模型列表, ok, 可以 看到获取到两个模型, 一个是 deepsea 微斯的 flash, 一个是微斯的 pro, 我 们直接选微斯的 pro 就 可以了啊,往下滑一点,把这个一照,上下文窗口点上,然后点添加即可,我这边就不添加了,我已经添加过了,添加上之后,然后这边点起用, 这就可以关闭了。当我们配置完成之后,这个时候你重启你的 codex, 这时我们进来的话,它就是使用 deepsea 大 模型,来我们给它对话一下。你好, 来我们看一下啊,这边可以看到模型使用的是 deepsea v 四 pro, 没有问题啊,这样 codex 就 可以直接使用 deepsea 的 v 四 pro 模型了啊,你也赶紧去试一下吧,记得回来交作业。好的,下面给大家说一下第二个问题,这个地方的名字怎么改? 然后打开它的这个配置文件啊,它的配置文件是在这个 user 目录下的这个 codex。 哦,它是一个隐藏目录啊,这个要打开,进来之后找到它的这个 configure html, 然后我们打开 好,默认的话是 custom, 然后我这边是给它改了三个地方,一个这个地方使用的地方 改成 d p c, 一个是这个 name, 这个你们可以改成自己任意喜欢的单词,改完之后重启一下你的这个 codex。 下面第三个,我说一下它这个对话怎么给它删掉,我们右键之后发现它没有删除,只能归档, 然后归档之后它就可以删了。然后我们怎么删呢?在这个地方还是这个 directx 这个目录下面找到这个目录,然后进来就可以看到这个是我刚归档的日常对话,这个地方我先不删,给大家验证一下。归档完之后它会在这个地方 已归档的对话。对,你可以取消微档啊,我们不取消微档啊,我们直接给它删掉 删除。哎,我们这个时候再进来验证一下。 嗯,暂无给他聊天。好的,这就是本期视频的全部内容,我们下期视频再见。

大家好,欢迎来到 cloud code 零基础教程。很多人第一次听到 ai 编程,都会下意识觉得这肯定是程序员的东西,我又不会写代码。但这集我想告诉你, ai 编程真正改变的不是代码本身,而是普通人第一次有机会把自己的想法直接变成软件。所以今天我们先不装软件,也不敲代码,先彻底搞懂一个问题, ai 编程到底是什么?因为只有理解了这件事,你才知道它为什么会改变。未来几年, 我先用一个特别容易理解的比喻想象一下,你是老板,你脑子里突然有个想法,我想做一个记账 app, 或者我想做一个代办清单网站。 问题是你不会写代码。以前这件事基本到此为止,你只能花几个月学编程,或者花钱找程序员,又或者干脆放弃。但现在不一样了,因为你多了一个 ai 程序员, 他不会摸鱼,不会下班,不会嫌需求改太多,你只需要告诉他,帮我做一个记账小程序。剩下的事情, call code 会自己分析需求,创建文件,写代码,运行测试,修复错误, 整个过程可能只需要几分钟。所以你会发现, ai 编程本质上不是你学会写代码,而是你开始学会指挥 ai 写代码。 说概念可能还是有点抽象,所以我们直接看演示,目标很简单,一句话,生成一个网页,现在开始计时。这是 cloud code 的 终端界面,你现在不用理解它是什么,只需要知道,这里就是你和 ai 对 话的地方。 我输入 code, 回车,连接成功,然后输入一句中文需求,帮我做一个代办清单网页。 就这一句,你看 cloud 开始工作了,分析需求,创建 html 文件,添加 css 样式,编写 javascript 功能,自动生成页面结构,整个过程几乎不需要人为操作。 好,现在完成了,不到一分钟,一个真正可以运行的代办清单网页就已经做好了。而刚才我们没有写一行代码。 很多人看到这里会有一个问题,那爱编程和传统编程有什么本质区别?我给你做个最直观的对比。第一,学习成本。传统编程你需要学语法、学框架、学环境配置,可能几个月甚至几年才刚刚入门,恋爱编程今天就能开始, 因为你不再需要先学会怎么写代码,而是先学会怎么表达需求。第二,开发速度。传统开发一个功能可能需要几天几周, ai 编程呢? 很多小工具几分钟就能做出来,以前做软件像手工制造,现在更像即时生成。 第三,你的角色。传统编程里,你是工人,每一行代码都得自己写。而 ai 编程时代,你更像导演,你负责描述、判断、调整方向, ai 负责执行。第四,犯错成本。以前代码报错你可能得查半小时, 现在你只需要说这里报错了,帮我修一下。 cloud 会自己定位问题,修改代码,重新运行。所以你会发现, ai 编程真正降低的不是技术难度,而是把创造软件这件事,第一次变成了普通人也能参与的事情。 接下来这个问题很重要,到底哪些人最适合 cloud code? 答案可能比你想象的更广。产品经理,以前有想法,只能排期等开发,现在你可以自己先做出原型 设计师,以前作品只有静态图,现在你能直接做出带交互的真实页面,创业者一个人也能快速验证产品想法,这在以前几乎不可想象。学生课程、项目、毕业设计、个人作品集都能快速做出能运行的版本。 数据分析、办公人群、重复复制粘贴、写 excel 脚本、整理文件。这些机械工作, ai 都能帮你自动化内容创作者,你甚至可以把自己的内容变成真正的网站和工具。 所以现在你应该能理解, ai 编程并不是 ai 替代。程序员真正的变化是普通人第一次拥有了创造软件的能力,这才是他最可怕也最激动人心的地方。好,最后留个问题,如果给你一个 ai 程序员,你最想让他帮你做什么?评论区告诉我。

兄弟们,今天聊 cloud code 里一个看起来很普通,但其实很关键的东西, workflow。 workflow 这个词太容易被低估了, 听起来像公司会议里常见的那种词,什么拉其流程沉淀、方法论形成闭环。可在 cloud code 的 里,它不是 ppt 里的箭头,也不是一句你先这样再那样的提示词,它更像一个 do agent 调度台。 以前我们让 clock code 做复杂任务,通常会这样说,先帮我看代码,再检查安全风险,再看看测试够不够,最后给我修复建议。 听起来很清楚,但问题是,这仍然是在跟模型商量。模型今天可能认真拆成五步,明天可能两步就糊完。 你以为自己给的是流程模型,听到的可能是自由发挥。 workflow 的 价值就是把自由发挥写成代码。 它会明确规定第一阶段做什么,第二阶段做什么,哪些 agent 可以 并行跑,每个 agent 必须输出什么格式,最后由谁汇总,怎么去种,怎么判断优先级。这件事的本质变化很大。 普通 prompt 是 一次性沟通, workflow 是 可附用的工程资产。今天它可以省这个仓库,明天换个仓库继续省。今天做 pr review, 明天做安全审计。 如果流程设计的好,别人还能直接拿走复用。你不再只是拥有一个神奇提示词,而是拥有一条可以反复运行的生产线。它和 cloud code 理应有的能力也不冲突。 surveillance 更像临时谣人,适合眼前有个问题,叫一个 agent 看日制,再叫另一个 agent 看模块。 它灵活,启动快,但也灵识。今天这么拆,明天可能换一种拆法,不适合沉淀稳定流程。 agent teams 更像多人协助工作台,多个角色可以一起工作,人类可以观察调度接管, 它适合交互式协助,也适合长期复杂任务。但如果你要的是一条可以重复执行的流水线,它仍然偏人工调度。 skills 则像能力包,它告诉模型什么时候用某个专业方法,参考哪些文件,遵守哪些限制,调用哪些工具。 skills 解决的是会不会做, workflow 解决的是按什么顺序做,谁来做,怎么交付。一个像菜谱和工具箱,一个像后厨的出餐流程。 所以 workflow 最适合的场景不是随便问一句问题,而是那些你会反复做,而且每次都希望质量稳定的任务。比如大代码库分片审查, 你可以让一个 agent 专门看正确性,一个看安全,一个看性能,一个看测试覆盖, 最后让 agregator 汇总去中,按风险排序。再比如 pr 多角色 review, 让不同 agent 同时检查行为变化、安全风险测试缺口和 api 兼容性,最后输出 blocking 和 non blocking findings。 再比如生成批评修复流水线,第一个 agent 负责写出稿,第二个 agent 按标准挑问题, 第三个 agent 只修被指出的问题,最后再做一次验收,这样内容生产就不再是一把缩,而更像一个小型审稿。流程还有深度研究, 不同 agent 分 别看官方文档、论文、社区讨论和代码实现,最后有 synthesizer 生成结论。这个过程如果只靠一句自然语言提示,很容易漏步骤,写成 workflow 才有机会稳定复跑。 怎么起用?设置环境变量 cloud 口打 work flows, 等于一进入后输入 ultra work, 看到彩色就配置成功了, 但这东西也不能闭眼充,尤其是现在这种实验能力,更应该先深层脚本人工看一遍,再小范围运行人工负荷。每个 agent 都要求结构化输出,最终产物也必须检查, 不要把一个还没验证过的隐藏实验能力直接接近生产线。我觉得 workflow 真正重要的地方不是又能多叫几个 a 阵,而是他把 a 阵编排变成了代码, 复杂任务可以复跑,优秀流程可以共享,多 a 阵切磋从临场发挥变成脚本化结构化 可观察的工程流程。未来高手之间拼的可能不再只是我的 prompt 多神,而是流程怎么拆, agent 怎么分工, steamer 怎么设计,聚合器怎么判断,优先级产物怎么复合,这才是从会用 ai 慢慢走向会管理 a i。

今天这条视频给大家亲自演示一下,几分钟之内通过 ai 从零开始构建出一个非常精美的网站,大家有兴趣的话可以在底下留言。 来,我们今天来表演一下,怎么不看任何一行代码,直接通过完整的自然语言快速的开发一个非常美观,非常有设计感的网站。 首先呢,我们打开我们的呃电脑上的命令行,来,这里呢是一个干净的 windows 的 命令行,我用的是 cloud code, 如果你是用 code 代码的话,也可以啊,我们来正式的打开 cloud code。 好,那现在呢,我们还没有工程,我们可以让 cloudcode 帮我们创建一个工程,创建一个前端工程,名称叫做 website, 咱们就用这个。 好,我们等待一下用什么创建呢?我们使用 wit 加 react 加 type script, 当然这些基础名词你不一定能听得懂,对吧?但是它推荐的第一个肯定是最好的,那即使,即使这里面四个,你随便选一个 都可以搞定,这个事情啊,没有那么讲究。 ok, 我 们还是选第一个,只选第一个就行了。正常来讲呢,如果说确实你想呃从里面选择一个好的,你可以问问他给让 cloudcode 给你推荐,他认为好的,你就可以直接接受。 我们要相信 cloudcode 或者 codex 啊,他的真实的能力比绝大多数十年以上的专业的开发者还要厉害,所以他推荐的我们不用太怀疑。 好,这个时候呢,他在帮我们初步化工程啊,初步化工程的时候呢,有的时候可能会有一定的网络问题啊,我正常来讲呢,我会告诉他在下载依赖的时候呢,我们使用一下我们的网络代理, 我本地准备了,准备了网络代理,你可以直接使用七零七八端口 来,我们中断一下,让他接受我最后输入的这个指令。好,这个时候他知道了我用了代理,对吧?用代理之后呢,下载东西安装环境会快很多, 现在开发大多数的软件啊,已经完全不是程序员的专属了,除非一些特别特别复杂的,有基础深度的,但是实际上市面上百分之九十以上的软件,它其实没有那么多复杂的要求,如果说很复杂,我们还不如把它拆解成一个一个简单的个体来独自开发,对吧?所以 往后来讲呢,绝大多数的人都可以完全抛开代码,直接就想就能够开发出你想要的应用。 我们看到这里的 talk 呢,在不断的变化,说明整个工程呢是在正常的进展的。好,接入 tailwind css 了,我们不管它写的是什么玩意儿,我自己也不看的,我只看结果。 所以其实绝大多数的普通人呢,我们只需要知道一些基础的概念就可以了,比如说创建工程是吧?比如说在网络不好的时候,要主动的去使用网络代理,你看整个工程好像已经构建好了,对不对?但是我们还看不见他怎么办?启动前端工程, 直接跟他交流,什么也不用管,我们耐心的等待一下。 开发服务呢,正在后台启动啊,一切都非常的顺利。正常来讲,我们使用 cloud code 的 时候啊,需要安装什么东西,我们都只需要这么直接的告诉他就可以了,需要启动什么服务都全部直接告诉他,我们自己不用动手啊,他告诉我呢,是在这个地址启动了,对吧?我们来鼠标点击一下, 哎,打开了一个什么也没有的网站,对不对?好,我们点击一下,它还可以动是吧?那接下来呢,我们往里面填充一些功能 哦,那么假设啊,我们要开发一个呃跟物流相关的主页,好吧,内容呢,我们就让他随便设计,但是我希望它美观一点。我们第一步来 帮我设计一个物流公司的主页,内容你可以自己填充 好。这个时候呢,我们应该想想,呃,我们肯定是希望我们的网页啊更现代,更美观,整洁大方,对吧?那以前呢,我们可能要专门去请设计师帮我们好好的设计一下,这样才有美感,对不对?但是现在啊,我们要学会一个很厉害很有用的技能啊,叫做 操,说的好听一点,叫做站在巨人的肩膀上,对不对?我们哪有时间去请设计师来帮我们做这个,我自己也没有学过美术, 所以怎么样来做出一个美观的东西呢?来,在这里呢,有一个呃,在国外非常流行的建站工具叫做 freer, 我 自己非常喜欢用它,它可以手动地搭建很多非常美观的网站。当然在 ai 时代搭建网站也是一个比较低巧的 事情,我们现在可以用 ai 直接帮我们纯定制了,你搭建出来的还不如我定制出来的那么的自由灵活。但是呢, framework 呢,它里面啊有很多非常美观的有设计师参与的模板,来,我们随便选一个模板,这是我随便选的。我点 preview 啊,预览一下对吧?这是它搭建出来的一个模板,我想要这么的这么样的一个风格。 ok, 我 把这个地址直接给他, 好参照这个网址来设计我的主页。 ok, 我 们看一看啊,是什么样的一个效果? 它会使用 front design 的 一个技能啊,去设计,对吧?这些东西呢,我们,呃可以先不用管它,如果说你后面对这块感兴趣呢,可以呃私信或者留言,我们可以告诉你更完整的,更强大的去构建应用的方式。当然,我们不看任何一行代码, 它还帮我自动启动了一个浏览器,去查看我提供的网站,对不对?这些呢,都是我为它配置的一些 skill。 这些 skill 呢,非常的好用啊,它都可以让我们更轻松地去开发出自己想要的网站。 好,它还在查看网站中,我们可以稍微等待一下。正常来讲呢,我们大概在十几分钟,从零开始,十几分钟就能够搞定一个网站,是不是非常的快速便捷。 当然一个网站你想要成功的上线呢,可能还是需要花其他的一些功夫的,但是有了 ai 的 辅助之后啊,你可以不用懂任何的什么服务器相关的知识,我们纯粹的通过与 ai 沟通也能够搞定。从开发到上线,让其他人都可以使用你的网站达到这么一个程度。 那我们再耐心的等待它一下,可以看到我已经有足够的参考了,对吧?那这个时候呢,开始设计了, 大家英文好的呢,可以轻松的看懂这些内容,对吧?如果说你英文不好的话怎么办呢?你跟他说说,尽量的,我们通过中文来进行交流,这样他就不会写那么多的英文了,当然代码这一块是不能用中文的,不过没关系,代码这一块我们不用看懂,对不对? 好,我们可以看到啊,我们的任务完成了,一共花了多久呢?十分钟,加上我们刚才准备环境创建工程的时间,大概在个三分钟左右,对吧?一共就十三分钟,我们看看效果怎么样,是不是一次性搞定的? 好,我找不到刚才的网站啊,在这里啊,刚才网站在这里,是这个地址,如果说你找不到地址呢,你可以直接问他访问地址是什么,对吧?他肯定会告诉你的, 来访问地址呢是五一七四,我点一下, ok, 这就是我们自己的网站了,是英文的,是不是 英文?没关系啊,我们直接告诉他,让他帮我们换成中文的就可以了。那你觉得这个网站的设计感怎么样?是不是还可以,对不对?想改哪里直接让他来改。注意啊,这是我们自己的网站啊,不是不是这个官方的这个网站, 所以我们会发现啊,现在开发网站,特别是落地页一类的,是不是非常非常简单啊?如果说你想加后端功能呢,其实也很简单,只要你需要,只要你掌握一定的这个技巧。 而且啊,我们这个网站啊,它还是移动端适应的,自动移动端适应的,我们可以看看,在这里呢,它其实帮我自动打开了一个移动端的视觉效果,对吧?如果说你在手机上访问呢,它是这样的, 以前我们开发的时候啊,我们自己作为这个专业的开发者开发的时候呢,还要专门去做移动端的适配,那现在你看 pc 端,移动端一次性搞定,总计花费时间不到十五分钟, 是不是很厉害?如果你对这块感兴趣的话呢,可以留言或者私信我们,可以让每一个没有任何技术背景的人都能够轻轻松松的开发出软件,不管是我们现在看到的落地页,还是你觉得很厉害,功能很丰富的智能体验,不需要看任何一行代码都可以轻松的搞定。

搭一个让 ai 自动生成这样视频的 skill 真的 很容易,咱们先来看一下效果。承认吧,你的二十多岁不过是个拿着身份证的未成年,别再拿三十而立 pua 自己了。社会学专门为这种尴尬期造了个词,奥德赛时期,他借用河马史诗里英雄漂泊归乡的故事,只待从青春期结束到真正扛起社会毒打的这段漫长过渡。 这条视频呢,我没有加背景音乐,只是让它实现了 tds 配音,然后根据我的文案去生成分镜的提示词, 用提示词去生成对应的图片,再用对应的图片去生成视频,它只是经历了这样一个三步的 api 的 调用,就可以批量的产出这样的视频。然后加入了一些基础的功能,比方说关键词的提取,这是它自动识别的, 在关键词动画效果出来的时候,配上一个对应的音效。在这里我先说一下 ai 生成视频目前成本还是比较高的,它主要有两种方式,一种是调用 api, 而电有 a p i 的 话,现在最强的模型,那就是字节旗下的 cds 二点零。如果你的电脑配置足够高,比方说有一个九零系的显卡,那你就可以考虑本地生成,如果是这种风格的话,本地模型也是可以出的。咱们来看一下它的流程。第一步呢,就是来 读取你的文案,你可以把文案放在你电脑里边,用 txt 保存就可以,你可以保存一份文案,或者十份一百份 都可以,他都可以批量的帮你去完成。然后我这里有五个预选的风格,刚才的这种画面,这种卡通风格的画面是一种,你可以去选其他的,你喜欢的,包括现实感的都可以。如果你有对标账号,想参考他的风格,截一张图发给你的 ai, 让 ai 反推风格提示。 然后第二步就是把咱们的文案用 tps 配音,配音的方式模型有很多,有 api, 有 本地,这个就你们自己去选择就行。 第三步就是让 ai 根据你的音频产生的准确的时间轴去把它分分镜,然后生成提示词。生成画面的这里有一个重点, 因为你要和你的画面做时长的匹配,所以这里你要用 tts 返回的准确的时间处,你不能靠文字让 ai 去大概分,这样的话就可能对不上。第四步就是根据你刚才的分镜生成参考图。现在 ai 生成图片和视频的质量已 已经是非常的高了,所以这两步你就是根据你的提示词去调用返回的结果,如果不满意,你再调整风格类型的提示词就可以了。 其中最长的一步就是图声视频,除了耗时最长,也是它的费用最高。前边的所有的这一套流程, 一条视频跑下来可能就是几毛钱或者一块钱,但是徒生视频的这个环节,一个一分钟的视频,如果调用 cds 二点零的话,可能就是十块钱,二十块钱,甚至更高,所以这里一定要注意根据你们自己的需求,你们能承受的一个范围。我这里测试用的是 cds 一 点零, 一点零,我让他帮我估算了一个费用,一分钟的视频大概是十多块钱,这里只是做了一个测试,你也可以选择便宜一些的模型,或者考虑本地去跑,最后一步就比较简单了,就是按咱们的要求,根据一句话,然后匹配对应的画面,导入到剪映的草稿, 然后加一些转场的特效,加一些音效,包括背景音乐都可以让他直接全部加入进来。现在有很多认知类的视频都可以用这种方式去批量生成。 有很多小伙伴关注的 ai 生成短剧的 skill, 其实也是这样的一个流程,只不过你里边会把你的文案划分成剧情,然后让他去拆分分镜的提示词, 最后也是生成图片,图片再去生成视频。最后一个拼接流程都是一样的,只不过中间的步骤需要按你的需求去调整,有时间的话我会出一期专门的教程。最近更新的比较少,因为一直在调试各种视频的,有直播切片带货的, 还有一些帮小伙伴们定制在他们电脑上去远程调试的。大家有想做的视频不知道怎么去搭建的,可以评论区告诉我。

最近这个 cloud code 不是 很火吗?我就想着 cloud code 能不能画一个 cad 的 平面图,但是呢,我就成外行,什么都不懂,然后我就想着,哎,那我用豆包,我让豆包来画,我就给豆包一个指令,我说帮我画一个三室一厅的平面设计图, 并且需要带数据,然后他就给我指令,我就把指令发给了 clod, 扣的发给他之后,没想到他几分钟就做出来了,可能是因为我不懂啊,看不出来又缺点,他肯定也有缺点,不过这个可是他几分钟的产品,这个简直是一箭出头,不知道这以后对那些画 cad 的 有什么影响。不得不说现在 ai 的 能力太强大了,有没有这方面的大佬看一下画的怎么样?