用了 tuna code 之后,我真的回不去了,只需要简单一句话,生成网站,拷写代码,收集数据。你只需打字,现在就一句话,帮我生成一个咖啡网页,可以看到它在进行需求拆解分析,进行自动设计,代码编辑,生成 架构搭建完成,自动审批。不到十分钟,生成的网页非常详细,设计很完善,全程自动,无需人管, 直接交付结果。整理上万条数据也只需要几分钟,五十条内容文案, 轻松做自媒体,还能预测试卷,帮助孩子提前适应考试。只要一句话,繁琐的资料也能教给他。整理一个 tuna cold 就是 一个团队。
粉丝19获赞73

现在 ai 有 多恐怖?来看帮我做一个奶茶店的线上点单页面,什么什么什么,我只需要给他一句话的交代,他就开始做了。 看一个程序员一天才能完成的工作量,这个几分钟就搞定了。就咱们平时用 ai, 不是 答非所问,就是需要你一句一句的喂指令,折腾半天,最后加班到半夜的还是你自己。但是直到我今天发现了春的口,我才知道,真正能帮你干活的 ai, 完全不需要你自己。废话, 这个完全不用我教他先做什么后做什么,只需要下打口令,他就会自动拆解任务,思考分析,然后生成内容,五分钟不到。比如我让他帮我做一个向全世界推广安阳文旅的中英双语网站,他自己分析完了以后,我只需要授权批准, 他就会做出来了。然后我们把它切换成中文版。字都安阳三千年古都。 因为网慢啊,可能图片加载的有点慢,来太行大峡谷切换成中文。 就问你们高校不高校,厉不厉害?我认为他很牛的地方不是只会干一件事,不管你是做策划、搞运营、做设计、自媒体博主,还是自己创业,甚至你是想搞副业的上班族,只要有需要执行的地方,输入你想让他完成的工作,他全部都能帮你干。 最核心的点是可以把人从执行层面的工作中给解放出来,让我们专注的去思考决策的事,这个不是偷懒,而是生产力的升级。 所以说到这呢,大家不要有 ai 焦虑, ai 永远不会取代人,但是会取代基础的工作,进而延伸出更有创造力的工作。 未来的 ai 一定不是陪你聊天,而是帮你落地干活。只要你提前用起来,你就比别人少走半年弯路。如果你也想试一下 qq 评论区扣试试,我来教你怎么用!

小白用 ai 写爆款小说,只需三个步骤,把我们的需求提供给他。先让他搜寻一下当前热榜。可以看到 tuna code 已经开始思考了,进行拆解需求,分析问题。他根据需求开始寻找网站排行榜 进度汇报。当他收集足够的资料,就会在大屏中开始展示,这些排行榜就是他收集到的。可以看到他将所有内容分析并提出建议。简单的想法跟他一说,完成自动检测 完成文件直接出现在文档中,方便进行修改以及剪索。大纲很详细,小白也能轻松当作者。 turn a code 写给每一个想用 ai 做点事的人。

一个人做项目,最缺的往往不是灵感,而是有人能把下一步接住你。有目标,但要拆需求、定方案、写文件、改代码、跑验证、整理结果, 每一步都要自己切换状态。 toon 扣的定位,就是把这些分散的工作看成一条更清晰的写作链路。他可以像产品经理一样梳理需求,像工程协作者一样理解项目,修改文件,也要像质检助手一样配合工具检查结果。所以, toon 扣不是简单多回答几句话, 而是让 ai 开始承担任务推进中的不同角色。当创意执行和检查被放到同一条流程里,一个人也可以更高效地完成一件复杂的事。 tono co 让 ai 不 只是工具。

ai 最该站的位置不是聊天框,是任务入口。复杂任务一进来,先别急着生成,先看它是什么,是找信息做判断还是直接执行。因为真正好用的 ai, 不是 把所有内容一股脑吐出来,而是先把任务分流到合适的流程。 tomorrow 想做的就是让 ai 先识别,找路径,再分配,最后开始动手。这样你拿到的就不是一堆看似聪明的回答,而是更清晰的执行方案以及结果。 ai 的 价值不是在最后替你说答案,而是在最前面帮你把十分队做完。

to the code 更像一个懂现场的搭子。先看文件关系,先看任务脉络,先看这块代码为什么现在长这样,再决定怎么下手。 对我来说,这才是 ai 编程真正该走的方向,不是替你抢活,而是让你在复杂项目里少踩坑,少返工,少把局部修改变成局事故。如果你也在做长链路,开发,这类工具的意义不是更快,而是更稳。

大家中午好,我想了想,我还是要跟大家录一下,因为最近 codex 跟 anthropic 的 cloud code 真的 太火了,昨天晚上 openai 也发布了 codex, 现在已经可以直接支持谷歌的 chrome 以及 windows, 就是 chrome 在 macos 和 windows 情况下,呃,可以直接调用 codex 的。 我快速录一个视频,教一下大家怎么把这个功能激活。首先呢, 我们要打开最新版本的 codex, 如果不是最新版本的,可以在这里去检查 update, 就是 要确保更新到最新版本的 codex。 更新完之后,打开这个插件 plug ins, 打开这个插件, plug ins, chrome 的 这个选项就会出现了,点击这个 chrome 点击吧,因为刚才我已经点击了啊,可以直接点打开, 打开它会直接跳到你默认浏览器的这个 codex 的 激活界面啊,如果你默认的是 chrome, 就 会正常蹦到这个 chrome 的 界面 crom 蹦到之后直接点击艾特 crom 就 ok 了啊,因为我认为接下来会很精彩的。其实 cloud 大家能看到我的 cloud 已经支持了,就当我点开这个 cloud 的 时候, cloud 的 无论他调用自己大模型也好,还是还是 cloud code 也好,他可以直接操纵我的 crom。 那 现在呢,就是我把 code 也加入到 crom 之后, open up code 也可以直接调用我的 crom 吧。因为今天我想录这个视频的原因就是我认为接下来整个电商的搜索逻辑都会因为世界头部的几个大模型公司会带来天翻地覆的变化。 比如我现在自己日常的使用已经不用去打字了,我调用的是 tapis 会比较多,所以现在目前,哦,现在才五月份,我觉得其实 ai 的 风向已经调了好几次了。比如年初的 open code 火了一阵子, openclaw 就是 龙虾。 那其实我认为到现在为止了, open opencloud 的 风风口或者说营销热度已经完全消退了。那接下来就是 webcoding。 那 目前最主流的就是 codex 和 android 的 cloud code。 就是 cloud 的 code 啊。好吧,今天就跟大家快速录一下。我估计可能很多伙伴不知道怎么在 codex 里面去添加 chrome, 在 chrome 里面去激活 codex。 好 吧,那今天先这样,拜拜。

本期分享 codex 零基础上手使用教程,覆盖了办公、编程、自动化等使用分享,让我们每个人可以轻松上手使用。开始之前我们先来了解一下 codex 与 cloud code 相比,它的优点有哪些,第一个就是有更多的额度, 第二个就是不会轻易地限制账号,封账号。第三个就是 ai 升图能力,目前是排名靠前的。第四个就是客户端安装更容易,容易上手。第五个就是不订阅也可以去使用体验,因为它有免费的额度,这是关于 codex 的 一些优势。 第一件事情就是要修改语言,在这里部分伙伴会因为网络原因下载的版本默认的会是英文界面,所以需要修改,如果是打开直接就是中文,可以跳过这个步骤,然后设置语言,是在左下角设置这里,然后选择 设置,然后在默认的常规选项里面,这里有一个语言,在语言这里我们选择中文,这时候就可以切换为中文界面。 下面我们来介绍一下它的功能,我们先从左侧说起,第一个就是新建对话,这里就是创建一个新的对话窗口,在这里我们就可以把它想象成 相当于我们换了一个朋友聊天,然后打开了新的绘画。然后第二个就是搜索功能,在这里就是可以搜索历史对话,这里我们就可以比喻为搜索和朋友的聊天记录。然后第三个插件,这里就是让 codex 更强大,赋予 codex 拓展功能,拥有操作其他软件的能力, 在这个插件这里,它还有技能。这就是我们前面分享了好多次的 skills, 如果大家还不了解,可以看一下之前分享的内容,然后第四个就是自动化, 在这里就是定时任务执行,可以直接去新建自动化功能。下一个就是项目,这里就是我们所有的创建的项目和打开的项目都会显示在左侧,然后下一个就是对话, 当我们在对话窗口没有选择任何项目的时候,我们选择不使用项目,这时候的对话内容就会在 对话栏目下面去显示,这就和我们网页对话使用是一样的,适合做的事情就是一些日常任务,比如搜索资料,写内容等等。分享到这里肯定会有好多小伙伴有疑问,就是上面的项目什么时候用,以及使用的场景是什么?在这里我来分享一下。 这里就是我们需要 ai 生成文件的时候,比如我们写代码,生成 markdown 文档,生成 ppt, 生成 word 文档等等,就是涉及到文件生成的,我们就可以选择创建项目,这样的优势就是生成的内容都会保存到当前项目文件夹,容易编辑和管理。 在这里我就是使用大白话来分享的,就是更容易理解一些,可能还是有些模糊,下面我直接实操,大家来看一下。 在这里我直接新建一个项目,然后在项目这里我们指过来就会有一个添加项目的图标,然后我们选择这里,他有两个选项,一个是新建空白项目,第二个是使用现有文件, 第一个就是我们直接新建,第二个就是如果我们打开某个项目的时候,就选择使用现有文件夹, 在这里我们是新建空白项目,然后我们选择新建之后,可以看一下它,这里就新建了一个项目文件夹。创建之后我们可以去修改项目的名称,我们只到项目名称这里,然后选择三个点,在这里有一个重命名项目,我们在这里 我们命名一下,比如命名为 demo, 然后保存,然后我们看一下对话窗口这里它自动选择的就是这个 demo 项目,在这里我们给它提示词,就是一句话,介绍 ai 生成 txt 文文本档, 然后我们直接发送。现在我们的模式是选中项目文件的,到时候它生成文件的时候,就是生成在当前项目文件夹下面。 好,这时候任务完成了,就显示已生成文本文档。 ai 介绍点 txt, 在 这里我们打开项目文件夹,我们来看一下,然后我们通过项目文件这里三个点,然后在资源管理区中打开, 现在就有了 ai 介绍点 txt 文本文档,这就是 ai 生成的文件内容。如果我们不选择任何项目, 我们选择不使用项目,然后我们再和他对话一句话,介绍一下你自己,然后我们直接发送,可以看一下左侧,他就在对话列表下面,没有在项目文件夹里面,这就是项目和对话的一个区别,经过实操演示,我相信大家已经了解了。 然后如何选择,就是涉及到文件生成,比如文文本档写代码,我们就要创建一个项目,如果只是单纯的和 ai 对 话查资料,我们就不用去创建项目文件夹,直接对话就可以。 下面我再分享一个个人感觉比较好用的功能,就是多任务处理,在这里我还是使用生成个人主页的任务来举例,因为这个应用场景每个人都可以用到,我们先选择我们刚刚创建的这个 demo 项目,然后我们把提示词 粘贴过来,在这里我们就是让它生成一个个人主页,使用 html 加 css, 然后还有就是一些风格指定,还有一些按钮的效果,还有页面布局等等,在这里我们就直接发送 在当前的任务进行中,比如我们突然有一个想法,我们可以使用这个技巧,我们想规定腋角的颜色,比如腋角使用灰色,然后我们直接发送,可以看一下它现在这个提示词就是在排队的状态,如果我们想让它立即执行,在这里我们直接选择这个引导, 可以看一下他这里提示就是提交但不中断模型运行,然后我们直接选择,这时候像我们给他的这个任务,他就直接插队插进来了,就不用等上面的任务执行完毕之后,再执行第二个排队任务, 这是关于这个使用小技巧,可以看一下第一个它会直接在当前工作区生成一个可独立打开的静态文件,然后它这里就有一个已引导对话,它就提示收到页脚,我会做成浅灰色背景,如果我们不点引导的情况下, 它就会等第一个任务执行完成之后,然后再执行页脚使用灰色,好,现在就生成完成了,然后我们打开看一下生成的效果,这就是我们生成的个人主页,这里我们直接自己去修改就可以。 下面我再来演示一下多任务,比如我们在当前项目文件夹下面,我们再有一次对话,就是什么是 ai 一 百字介绍,生成一个 txt 文文本档,然后我们 直接发送,这时候我们就可以在另外一个项目文件夹下面,我们直接选择开始新对话,然后我们再给他一个任务, 如何学习 ai 一 百字介绍生成文档,这时候就是同时进行任务,这就是多任务同时运行,当运行完成之后,他这里就会有一个蓝色的小点,然后我们再返回到项目文件夹,这时候任务就完成了,这就是多任务的应用, 然后下面我们再一起来看一下,就是创建技能,就是创建 skills, 我 们来到插件这里右上角的创建,然后选择 创建技能,在这里它就会显示一个 skill creator, 这就是创建 skills 的 一个技能,然后我们把提示词复制粘贴过来,在这里我们还是封装一个 ai 提示词,让它去制作一个 skills, 然后我们粘贴过来之后,下面给他的就是帮我创建一个写作技能,直接发送 好了,这时候提示我们创建成功了,它也给我们显示出来了这个创建的路径,在这里我们新建对话,使用我们自己创建的 scale, 让它帮我们去生成一篇文章,在这里我们输入斜杠,然后我们选择 技能,然后找到我们刚刚创建的,可以看一下这个是个人,然后我们选择,然后我们再给它提示词,就是什么是 ai 帮我写一篇 seo 文章,然后我们直接发送,像现在这个状态,它就是调用了我们创建的 skill, 这时候用我们创建的 scale 就 写好文章了,在这里我们只关注一个地方,就是我们提示词里面让它包含问答模块,这时候它也是包含的,它严格遵守我们的要求,这就是我们创建技能和使用技能的所有流程。 然后下一个我们再看一下插件的使用,在这里我再新建一个对话,我们使用插件就需要使用 at 符号去指定, 比如我们还是给他一个提示词,就是如何学习 ai 使用,然后艾特符号,然后我们选择 document 插件,这里就是这个 word 文档的一个插件,然后帮我生成 word 文档直接发送, 这时候就用插件创建好了文档,现在我们打开看一下它生成的一个效果,生成的效果还是非常棒的,它不是那些简简单单的文字,它是给我们排版好的,效果还是非常棒的,这就是 codex word 文档的生成插件的使用。 然后下面我们再来看它的另一个功能,就是自动化,在这里我们来到自动化这里,通过右上角,然后新建自动化功能,然后我们输入 就是每天学习一个 ai 术语提示词,这里就是每天上午八点给我推送生成一个学习文档,比如 token 是 什么, ai 是 什么? webcoding 是 什么,就是每天八点让它帮我们生成一个学习文档,然后我们再选择一下项目,我们选择 demo, 然后每天八点在这里就是选择模型,我们就选择默认的, 然后下一个就是推理的设置,这里我们也保持默认,然后我们直接创建就可以,这时候就创建成功了,然后我们选择这个自动化任务,就可以看到它的一个运行状态,还有一些详情信息, 这就是关于这个自动化任务创建,也是非常简单的,都是可直观的操作。好到这里就是我们 codex 安装到使用的所有操作,我们本次分享的都是一些基础的使用,我们可以先上手使用,然后其他的再边使用边研究就可以。 在这里还有一个拓展分享,就是如果你使用 codex 是 一些日常的任务,大家可以到设置这里面,然后常规选项这里工作模式就选择 适用于日常工作的模式,像这样它的模型是同样强大的,就是技术细节更少一些。好了,这就是我们本期的所有内容,欢迎留下你的想法,我们下期再见。

hello, 大家好,下班了。呃,今天背景不是公司,是因为,呃,在公司的时候当然车来了,没有来得及录,然后最近一直在高新路的使用 codex, 想要说我们用 codex 尽可能的提高我们开发效率,一个人顶五个人,六个人,十个人,牛马。 呃,然后最近 q 代像现了一个新的功能,叫做 go 模, go 模式 g o a l 目标。然后首先需要你的 c o i q 代 c o i 得在零点一二八版本级以上才可以使用它,并且要在 config 点 t o m l 文件里面把 go 改成 true 才可以使用这项新功能,那这个功能还在实验阶段。然后我理解它特别像是一个升级版的 sub agent, 就是 我们之前。 呃,如果你有完,为了完成某一个目标,你需要开多个 a 阵去执行不同的任务模块,多个任务可以最终为这一个目标服务的话,我们会使用 sub a 阵的模式,但我一直感觉 sub a 阵的模式其实不是很好用。 然后我今天刚好又有一个新的需求,就比较适合,感觉比较适合使用 sub a 阵去进行,但是之前一直是 sub a 阵的效果不是很好,刚好上线了一个 go 模式,所以呢,我打算使用它。 然后我的这个任务背景是这样的,我为了实现一个目标是可以把我的 app 去的它的它的这个,呃, apk 发版去做一个自动流水线 pipeline 以及呢?呃,我的后端可以去管理。呃, 我发版的版本号,这样的话我的 app 是 可以知道我需不需要去 做本地的 apk 更新,然后去请求这个版本号做一个比较,就这个需求,然后 所以它基本上分为三个模块,第一个是 app 端要去做兼容,你得去能够自动的识别,我目前的版本是低于还是说最新的啊?然后呢去给出下载链接,然后去自己去更新下载更新,这是第一个 app 端,然后第二个呢是 后端,后端得去新增一些接口。那肯定是要啊更新我的 a p k 版本记录,然后呢去检查是否需要更新,以及我的后台界面,还需要去做一个发版记录的展示。 另外就是需要在我的云端仓库,我使用的是 git, 然后 git 有 一个 git go 功能,这个功能可以自动地去根据你啊你的,你可以在项目仓库里面去的 web flow 目录下写一个 webmail 文件,这个 webmail 文件里面就声明了你的 pipeline 是 怎么样子的, 然后基本上就是这这这三大块儿后端 app 端还有我的 pipeline 流水线的建立。然后这三个任务,我让抠带写了三份 prompt, 然后一次性发给一个 go 的 上下文,然后去执行,然后大概执行了七八分钟之后, 效果还是很好的,然后基本上就达到一个可用的状态,所以,呃,我觉得这个 go 模式大家可以多多用起来,虽然现在还是一个 experiment 的 状态。对,那今天就录到这里,拜拜。

同学们,大家平常用 q 五写代码是不是会经常遇到以下这些问题?写代码全程没有代码提示,代码只能靠手敲,导致代码越写越乱,排版格式乱七八糟,找到个排错更是难上加难。除此 q 五的大家其实都知道,它的原声编辑功能老旧简陋,代码编辑体验感极差,很容易拖慢我们的开发进度。 那 vs code 作为一款轻量化开源,免费拓展性极强的代码编辑器,凭借着界面清爽简洁、兼容性强、插件生态丰富的优势,现在已经成为了我们铁路式开发工程师的首选代码编写平台。 那今天这期视频我们就来好好聊一聊, vs code 到底能为我们汽车单片机开发带来哪些实实在在的提升。其中最大一个好处就是你不用抛弃原来的 q 工程,也不用新建项目,不用改配置,可以直接在你的 vs code 的 里面进行 stm 三二的单片机代码开发,其中自带的代码自动不全、 函数一键跳转以及我们的同文件自动定位, 我们就可以不用像在 q 五里面那样纯靠手敲代码,到处翻文件找函数,写代码的效率直接拉满。 我们之前在用 q 五进行单面机兼容式开发的过程当中,很容易出现我们的代码缩进不统一、排版风格混乱以及我们的空格符号等各种各样的问题。那在我们的 vs code 的 过程当中,我们可以直接保存代码, 就能够一键的整理我们的代码格式,或者说我们在打分号的过程当中,也可以帮我们整理我们的代码格式,就能让我们的整个工程代码风格统一、结构清晰,可读性大幅提升。

你敢信吗? cloudcoat 的 启动速度比这个工具慢了整整二百四十五倍! jcoat 手帧只要十四毫秒,而 cloudcoat 要三点四秒, openai codex 也要八百八十三毫秒, cursor 将近两秒。 jcoat 的 渲染帧率超过一千 fps, 你 看不到任何闪烁。 它是一个用 rest 丛林打造的 coding agent, 性能碾压所有主流竞品,内存差距更离谱, j code 单绘画只占二十八兆, cloud code 要三百八十七兆,差了将近十四倍。当你开十个绘画并行工作, j code 总共才二百六十一兆, cloud code 要吃掉二点三 g。 open code 更夸张,直接干到三点二 g。 j code 每多开一个绘画,只增加不到十兆内存,限性增长完全可控。这是最让我兴奋的功能。 swarm 多 agent 协助你同时开多个 agent, 在 同一个仓库工作,它们会自动发现彼此 agent。 a, 编辑了一个文件 agent b, 马上收到通知,自动检查有没有冲突。每个 agent 还能自己 spawn 新的队友并行干活,一个变三个 消息,支持私聊、广播、仓库内群聊三种方式,团队管理全自动。传统 ai agent 每次开心绘画就像失忆了一样,什么都要重新说。 j code 不 一样,它有完整的语义记忆系统, 每轮对话自动生成向量嵌入,通过鱼弦相似度自动匹配相关记忆。你不用主动去调什么记忆工具,它自己就想起来了。而且它会自动提取、存储、整合记忆,还有 m b n mode 在 后台自动帮你整理,这才是真正像人类的记忆方式,这个概念太疯狂了。 j code 的 agent 可以 进入自我开发模式,直接修改自己的原代码,编辑编辑测试重载,二进置全部自动完成,不需要写插件,不需要做扩展能力,完全没有上线 改完之后自动重载,所有活跃绘画无缝切换。开发者建议用最前沿的模型来做这件事,因为 j code 的 代码库可不简单。 j code 是 rust 丛林打造的,不是套壳,它自研了 mermaid 渲染库,比 python 版快了一千八百倍。 还有自研终端 handterm 实现原声滚动, agent graph 会返回文件结构信息, agent 不 用读整个文件就知道里面有什么。最实用的是跨 agent 绘画恢复, cloud code 崩了,直接在 j code 里 resume 继续。 三十多个 ai provider 全支持,包括 deep seek, ala ma brock 等等,还有内置的浏览器自动化, firefox agent bridge 一 型命令就能用。 j code 现在有超过一千二百克 star, 每天还在快速增长。 mit 开源协议完全免费,支持 linux, macos 和 windows 全平台, 快二百四十五倍轻十四倍,渲染超一千帧,这就是 rest 丛林打造的优势。关注我,下期继续带你发现 deephop 上的宝藏项目!

你花了三天学 playrite 写的自动化脚本,网站改个按钮就全废了。现在有个五百九十二行代码的神器,能让 ai 自己写代码,自己补功能,自己操作浏览器,六天狂揽五千一百星, 现在已经破七千两百星了。过去一年,大模型 agent 的 能力边界一直在扩展,从会聊天、写代码到能直接操作真实软件, 其中最火的方向就是浏览器自动化。谁不想让 a i t 自己刷网页、填表单、找资料呢?但真正试过的人都知道这件事有多坑。 用 c l n m 光配环境就能耗掉一个下午。用 puppeteer p i 一 层套一层,写个简单的搜索就要嵌套十层回调, 好不容易把脚本跑通了,网站改个 ui, 所有选择器全废,又得从头再来。这些传统工具,本质上都是预先写死流程,只要有一点超出预设,就直接卡死。 而今天要讲的 browser harness, 彻底推犯了这个逻辑,它的核心理念只有一个,去框架化,给 ai 最大的自由。传统的浏览器自动化框架,就像给你一个带说明书的遥控车, 你只能按它给的按钮操作,想拐个急弯倒个车,说明书上没写它就做不到。而 browser harness 根本不做框架,它只做一根线, 通过 website 直接连上 chrome 的 底层协议 c d p。 什么是 c d p? 就是 你按 f 十二打开开发者工具看到的那些元素,审查网络请求控制台功能,底层全靠它通信 playwright、 puppet tier 这些工具本质上都是在 c d p 上面包了一层厚厚的 api, 这层包装方便了人类写代码,却把 ai 给绑死了。比如 playwrite 的 click 函数只暴露了三个参数,但 c d p 原生的鼠标点击事件有十四个参数, 模拟拓债、中间状态处理触摸屏事件发送特定按键组合这些传统工具做不到的事。 c d p 原生就支持。 browser harness 的 做法很简单,把这层包装全砍掉,一个 c d p 函数,直接调用任意 c d p 方法, chrome 支持什么, ai 就 能用什么,不用等框架更新。说到这里,你觉得这种去框架化的思路会不会成为未来 ai agent 的 主流方向?把你的判断打在评论区, 这还不是最厉害的, browser harness 最初圈的是它的自愈机制项目作者 gregor 在 hacker news 上分享过一个真实案例,他在测试的时候忘了写文件上传的函数,结果 agent 执行到上传步骤的时候没有报错退出,而是先读取了 helpers py 里现有的代码,理解了函数的写法,然后自己在文件里加了一个三行的 upload, 发有函数,接着继续完成了文件上传。 gregor 是 事后看 git diff 才发现这件事的,这才是真正的智能。以前的工具缺个功能就直接罢工等人来修。现在的 agent 缺什么功能,自己写什么功能。它不是在调用现成的工具,而是在任务执行的过程中,实时扩展自己的工具箱, 而且它还会自己学习。项目里有两套技能文件,一套是通用交互技巧,比如怎么处理弹窗、 shadow, dm, 全用 macdun 写成文档, ai 遇到问题的时候会自己读这些文档,然后组合 c d p 调用解决问题。另一套是站点特定技能,覆盖了 github、 linkin、 amazon 等五十多个热门网站。 更牛的是,这些站点技能根本不是人工写的。 ai 在 访问一个新网站的时候,会自己摸索操作方法,成功之后就把关键步骤记下来,纯纯 domain skills 文件,下次再进同一个网站,就能直接照着用。 也就是说,这个工具会越用越聪明。那你敢不敢把自己的浏览器完全交给这样一个能自己写代码的 ai? 敢的扣一,不敢的扣二。 当然,它也不是完美的。首先是安全性问题,它连接的是你真实的 chrome 浏览器,能看到你所有的浏览记录,能操作你所有的登录态。 虽然官方说遇到登录页面会停下来问用户,但这只是最基础的防护。如果 ai 写了一段恶意代码,或者不小心点了什么危险的按钮,后果不堪设想。 其次是可能性, ai 自己写的代码虽然能跑,但质量不一定高,可能这次能用,下次网站改个结构就又坏了。而传统框架写的脚本虽然死板,但至少经过了大量测试,行为可预测。还有规模化的问题,一个人用的时候,字与纸很好用, 但如果一百个 agent 同时跑, helpers、 p y 被并发编辑怎么办?深层的 domain skills 质量参差不齐,怎么统一管理?这些问题目前都还没有好的答案,但这些都不重要。 browser harness 真正的价值是它做了一个成功的思想实验。框架越薄, agent 才越强。 过去我们总觉得要给 ai 提供越完善的工具,越详细的指令,它才能做得越好。但 browser harness 告诉我们,恰恰相反,你给他的限制越少,他能发挥的空间就越大。 你不用替他写好每一步流程,不用替他封装好每一个功能,只要给他足够的自由度,他就能自己学会解决问题。这才是未来 agent 真正的方向, 不是让 ai 成为执行人类指令的工具,而是让它成为能独立探索、自我进化的助手。如果你也对这个项目感兴趣,可以去 github 搜一下 browser harness, 一 行命令就能安装,配合 cloud code 粘贴一段提示词就能用。 官方还提供了免费的云端浏览器额度,不需要绑卡就能先跑起来试试。觉得今天的内容对你有帮助的话,别忘了点赞关注,我会持续分享最前沿的 ai 黑科技和实用工具。

大家好,今天我们来讲一下 codex c l i 里面一个新的功能, go 目标,它是你可以理解为给 codex 设置一个长期任务目标,然后让它围绕这个目标持续工作。 它有一点像之前 cloud code 里面的那个 rough loop 这么一个概念,它在你给定的目标情况下,它会去自己计划,然后编码,然后测试评估,直到完成你的目标,或者是它的 api token 耗尽。 需要怎么样起用它?有一个有,有两个条件,第一个就是你需要升级你的 codex 的 c l i 的 版本,要到 v 一 幺二八之后的一个版本。第二个,因为它目前还是个实验性的功能,所以需要你手动去激活这个功能。你可以选择直接在 codex 里面告诉它,就啊 enable ghost, 或者你自己去手动配置一下你的配置文件。在那个 codex 的 config 里面, 我们可以简单看一下,在这个里面是有,你可以直接在这儿加这么一行,在 features 下面加个 ghost 等于 true, 当然你不要,你可能需要重启一下它才能会真正的生效。它支持哪些功能呢?譬如说我们 go, 它会直接 go 告诉你当前的一个状态, 比如说我说重构当前代码,确保测试所有通过,然后它会有一个显示当前时间,用了多长时间以及 token 使用量。同时你也可以 pause, 你 可以 resume, 让它继续做,就又重新变成激活的状态了。 对,同样你也可以直接地把它清除掉,对,它就会变成 clear 的, 相当于它有这么一些命令的选择。对 go 它最佳使用的一些实践,我觉得也可以简单地讲一下,因为在我们之前的 ai 编程当中,经常会说,你帮我改一下某函数, ai 改完之后,你会说继续,然后它又再继续,最后你说跑测试,它才会。跑测试相当于 啊,一步一步,需要你的一个指导才能去做这个工作。但 go 的 思路不太一样,它不是告诉你下一步做什么,而是告诉它最终要达成什么。 譬如说刚才我们提到的重新写所有的测试,确保向后兼容。这样子说,你说整个把认证系统从 j w t 迁移到 off, 这也是一个比较大的工程,它要对上下位有很好的理解,那它可以进行,会需要运行时间比较长一点点。 那和普通的 prompt 最大的区别是什么?普通 prompt 像是一般都是一次性的输入,而 go 是 一个持久化的目标状态。 比如说,如果你只是在 prompt 里面输入帮我重构认证模块,那 codex 会在当前这一轮里面尽量去完成任任务,但是这一轮结束之后,这个任务就不一定还会作为持续目标被系统记住。但是如果你输入 go snapgo 重重构认证模块,保证保持现有 a p i 兼容并补齐测试,那么这个目标就会变成当前现成的一个状态。系统会知道现在有一个激活的一个一激活的目标, 然后它会记录这个目标是什么,以及是否是它的状态,是否完成,以及是否有预算的限制,消耗了多少资源等等。 它有一个状态的一个持续化的一个东西,所以它就不只是当前这一轮对话,而是有一个长期的目标持续行动。 对,怎么它是为什么能够实现这种感觉?它的背后的原理就是它会把系统,会把当前的目标绑定到当前的县城上,就这样就能够记录的目标内容状态是否完成。没有这一层的,那那么它就是一个普通命令。对, 另外一点需要说明的就是在使用的时候应该注意点什么。第一个就是目标要写得具体一点,不要只写优化项目,这个太宽放,更好的写法可能就是优化某某模块的什么测测试覆盖率啊,覆盖关键的一个路径,确保所有错误都通过, 就相当于这是比较具体。第二个要点就是要写清楚成功的标准。譬如说你要举个例子说,确保所有单元测试都通过,确保不改变现有的 a p i, 确保向后兼容,确保新增的测试覆盖核心场景。 所以 codex 就是 它的 codex 这个 go 的 这个更新,它就是让你从原先的你问一句,他答一句的这种编程助手,变成一个围绕一个目标持续工作的自我编程代理,所以它就有一个状态可以持续的循环, 所以还是挺不错的一个功能。现在在 twitter 或者是在海外的开发工程师当中,这个已经引起了很大的一个关注,有人甚至让它编程了五十多个小时一个功能,所以说。

如果你常听别人提 cloud code 有 多牛,想体验,却被它复杂的安装、繁多的命令行以及纯极客的操作界面劝退,那你今天来着了。我在 github 上发现了这款宝藏工具,开源免费。它上线一个月,星标就将近十 k, 热度极高。先看下效果, 第一,全图形界面做到了豆包的易用性,能接入几乎所有的主流模型,甚至可以接本地部署模型。第二,可以接入微信、飞书等 i m 工具,让你用手机就能随时操纵 cloud code。 别人都在手机里养小龙虾,你可以在手机里养一只东海龙网。 第三,还支持 computer use, 全球顶尖模型公司都在研发的功能,能模拟人来操作电脑,完成任务。这个工具将 cloud code 的 安装和使用门槛几乎降到了零。 它是基于 cloud code 的 原码来进行的应用开发,保留了原汁原味的内核架构,在用户体验和功能延展方面做了很大提升。用过番茄花园 windows 的 人都能明白,我们国人开发者是多么的懂用户。 这段时间我用下来,我觉得作为一个 cloud code 的 老用户,我是回不去之前的方式了,就像是开习惯了自动挡的人不愿意再换回手动挡一样,以前要写命令改配置的操作,现在点点鼠标就可以了。如果你想体验 cloud code, 我 觉得这是一个非常容易上手的方式。点关注我,持续分享 ai 提效的工具和方法。

还在只会用 cloud code 简单写代码改 bug? 其实它生态圈里有超多热门必装神级 skill, 百分之九十新手都不知道白白浪费大半功能。 今天盘点五个圈内爆火高手人手必备的 cloud code 热门技能,全部给官方技能原名,直接搜就能装!第一个, doc reader, 全能文档阅读解析技能,可以直接本地提取 pdf word 解析参考资料,看文档读技术资料直接开挂。 第二个, coldrefactor, 全剧代码重构专属技能,专治老旧烂代码,逻辑臃肿,风格混乱,一键统一编码规范精简,融于逻辑,优化签到结构,只整理格式,补改原有业务功能,老项目瞬间变整洁。 第三个, get smart commit get 智能规范提交技能,再也不用手写。 get 备注,只会写 fix bug, 自动识别你代码改动内容,生成大厂风格,标准化提交文案,分类清晰,规范专业,不用自己动脑写注置。第四个, api, docs generator 接口,文档一键生成技能, 写完后端接口,不用手动写文档,自动扫描项目所有路由和参数,一键生成完整 api 文档参数说明调用视力直接能用,省掉大把写文档时间。第五个, dependency audit, 依赖安全检测技能,自动扫描项目所有第三方依赖检测版本老旧漏洞风险版本冲突,自动给出升级建议和修复方案, 提前避开线上隐患和兼容爆错大坑。以上这五个都是目前 cloud code 的 生态热度最高,实用性最强的热门技能, 直接在技能商店搜名字就能安装覆盖文档重构 get 提交接口文档依赖安全全场景,新手不用瞎找插件,就装这五个,直接把你的 ai 开发效率拉满一个档次,收藏起来,慢慢挨个解锁!关注我,带你吃透更多 cloud code 高阶技能!

如果你还在手动写测试脚本,那真的太浪费时间了。用 playrite 的 录制功能,也就是 codegen, 你 只需要像平时一样点击页面,它就能自动帮你生成代码,支持 python、 javascript、 java、 c、 shop 等多种语言。而且它会智能推荐最稳定的元素定位方式, 比如 get by run get by text。 脚本不容易因为界面改动而失效。怎么开启录制?最简单的是用 vs code 的 playwrite 扩展,点击 root new 按钮,浏览器和记录面板就会自动打开,你一边操作代码一边生成。或者你也可以用代码 输入 npx playwrite codegen, 加上网址,同样会弹出浏览器和记录窗口。录制过程中,你还可以随时切换语言, 选择浏览器、添加断言,甚至模拟手机设备。比如 iphone 十三,录制完成后,一键复制代码就能直接用了。 更厉害的是,你可以先手动登录一次,把登录状态保存下来,以后录制就不需要重复登录了。总之, trent 的 录制功能不仅能帮你快速生成测试脚本,还是学习如何写渐状自动化代码的好帮手。

只需要四步,就能够让你的 cloud code 直接调用 codex, 实现 ai 生态最强的一套组合。这套组合可能是普通人能够把想法变成真实落地项目的最优解。 为什么这么说呢?现在 ai 写代码本质上就很离谱,一个模型自己规划,自己生成,自己修,最后再自己说一句,我写的挺好,这像什么?像一个学生自己出卷,自己答题,最后自己在批卷, 这个事听着就不对。 ai 编程最大的问题从来不是不会写,而是太敢写。很多代码表面看起来没问没毛病,能跑也能翻译,甚至功能也是通的,但一上生产,坑就开始疯狂往外冒。 所以这套组合真正的价值就体现出来了。我从两个维度给大家分解一下。第一个维度, code 负责干。 这是一种非常自然的分工复杂,项目里最贵的部分往往不是把代码敲出来, 而是怎么拆任务,怎么定价购,怎么判断方向,以及怎么选择实现方式。这些事交给可洛的这种强模型非常合理, 但后面的执行 codex 完全可以接过去,这样一来,整个工作流会变得更顺,也更省。说白了就是贵的模型干贵的活,便宜的模型干重体力活。第二个维度, codex 最狠的不是执行,而是审查。 这个点我必须要单独拎出来说。就是 codex 有 一个我特别喜欢的思路,叫 underwear review, 翻译成人话就是别对这段代码太客气,默认他有坑,带着敌意去审。因为大模型写代码最大的幻觉之一就是他很容易对自己太宽容。 一到自查这一步,很多时候他就开始放水,而对抗性审查的意思是,我不信你,我先默认你写答了。 那这套组合到底适合哪些人?第一种,重度使用 cloud code 的 用户。第二种,对成本特别敏感的人。第三种,已经开始做真实项目的人。 以上就是我对 c c 和 callex 的 个人感受,希望这期视频对大家有所帮助,感谢观看,下期见。

你现在用卡扣啊,是不是还停留在一问一答的阶段?那如果是的话,你可能只用了他百分之十的能力,但如果你用了这四个项目啊,你将挖掘他剩余的潜力, 那这四个项目核心都是在做一件事,让卡扣变得更强,更自动,更省事。我们按照从功能最强大到最适合新手的顺序来介绍。首先介绍第一个项目, every single, 那 十六万九千新是这个四个里面最火的,那名字很直白,就是跟卡扣有关的一切全都给你打包好了。 那它到底有什么?我给你拆开来说。三个最核心的东西。那第一个是 agents, 你 可以理解成,是啊,你雇了一只 ai 小 队,有专门审查代码的,有专门修 bug 的, 还有专门做安全检查的,还有专门写文档的。那也不用自己说帮我检查代码安全性, 只需要输入一个命令,一个专门做安全的 ai 就 会被召唤出来了。第二个叫钩子 hooks, 那 举个例子啊,你每次改完代码的时候,它自动的帮你做一次质量检查,你准备提交的时候,它自动帮你跑一遍测试,发现问题会直接拦住你。那这些全部静默在后台运行啊,你感觉不到它存在,但它一直在帮你兜底。 第三个是技能包 skills, 你 可以理解成是一个技能的工具箱,代码审查呀,安全检测啊,自动测试啊,写文档啊,各种专业场景都有,现成的方案直接拿来用不用自己从零开始配置了。 第二个叫 superpowers, 十七万星,听着这个名字啊,就很霸气,给你的 ai 加 buff。 它和第一个项目最大的不同是啊,它不是功能的堆砌,而是一套完整的工作流程,它会交可扣的。在你开始写代码之前啊,先做什么?那整个流程是这样的, 你说我想做一个登录功能,它不会直接就开始帮你写代码。第一步,它会反过来问你问题,帮你把整个需求想清楚。第二步,设计方案给你确认。第三步,拆解成一个个小任务,每个任务都有明确的执行步骤和验证方法。第四步,派出子代理,一个个任务自动去执行,自己做,自己审,自己继续。 它的核心理念就是啊,先想清楚再动手。这也是很多人用 cloud code 翻车的一个很重要的原因,上来就让 ai 写,结果越写越烂。第三个叫 oh my cloud code, 三万一千新。那这个是今天最有意思的一个,它解决了一个问题是既然一个 ai 太慢,那就用一群 ai。 你 可以这样理解,以前你让卡尔扣子做一件事啊,是一个卡尔在那里一步一步的做。那这个项目啊,可以让你同时派出三个、五个甚至更多的代理,分工合作,并行干活。 它最核心啊,就是团队模式,你说一个目标,它自动规划、分工、执行、验证,形成一整个完整的流水线。它还一个叫 autopilot 的 模式,你说一句话它就自动的跑完,从规划到写代码到测试,一条龙服务。 还有一个我特别喜欢的功能啊,任务做完了,它会自动发消息给你,直接推送到客户端软件,你不用盯着屏幕去等。最后一个叫 cloud how to, 那 有接近三万星,虽然 star 数量是这四个项目里面最少的,但我特别想给不是程序员背景的朋友推荐它。那前三个项目都是增强的工具啊, 而这个项目是一份学习的地图,他把卡扣的所有的功能按照从入门到高级分成了十个模块,从斜杠、命令啊,记忆啊,技能啊,子弹里啊,钩子啊,插件啊,每一个模块都有可实时的流程图,有可以直接粘贴复制的模板。 这个项目的作者说啊,只要你按照这个路径去学习,一个周末就能快速上手。而且你还可以直接在可靠 code 里面直接运行一个自测的命令,他会给你出题,然后帮你找出自己的知识盲区,然后给你一个个性化的学习计划。这对于非技术背景想要学 web 控店的朋友来说啊,是目前我见过的非常友好的入门路径呢。 好了,今天总结一下这四个项目啊,如果你是 cloud code 的 重度用户,追求极致的效率,那用 everything cloud code。 如果你经常遇到 ai 写着写着就跑偏,那就用 superpowers 来规范整工作流,那如果你想让多个 ai 变形干活啊,解放双手,那就用 oh my cloud code。 那 如果你是刚入门,想系统地学习 cloud code, 那 就用 cloud how to 去做学习的地图。那最后问一下啊,这四个项目里面,你最想先是哪一个,可以在评论区分享,我下次可以专门出一期来演示。