粉丝1278获赞3164

我上一个视频说编程的下一步不是辅助编程,而是可托管执行单元。比较有意思的是,视频发出去没几天,这条线突然变得非常明显, codex、 cloud code 以及 agent 都相继上了一个名叫 go 的 功能,用来跑长任务。它们功能上的差异,我给你汇总了一张表格, 不过我发现阿里最近发布的 code 一 零才是把长任务的省略与介入做到了一个新的高度。总体感觉非常适合安排 a 证的团队干活,而且交互体验做得非常好,这可能是目前最好的国产 ai id。 一。 我对扩展一零进行了长时间的实践,两天消耗了一个 pro 账号所有的积分。下面会有四个测试。我使用的是 glm 五点一模型或扩展 auto 模式,每个任务少则二十分钟,多则四十分钟,都有完整从零到一的记录,交互不错, agent 也能力很强。用上扩展一点零的这套 agent harness, 让国产的这些模型也表现出了不俗的效果。 一个 quest 左侧栏是一个任务单元,可并行。 下面我标注了他的整体页面,左蓝导航管理,中蓝绘画流,右蓝产物区,左边能看到任务列表,中间能看他怎么推进,右边能看到知识记忆产物。 第一件我让他做的是 readme 最佳实践研究,因为如果你要做开源项目,要做产品,要把自己的工具发布出去, readme 怎么写,官网怎么写,第一评怎么让人信任,都是需要考虑的。 我们前面是使用 export 专家团队模式来完成这个任务,并且起用了 spec, 这相当于一个任务计划书, agent 会组织团队成员按照这个计划书来做这个长任务。点击 spec 运行,你会看到多个子 agent 的 创建并开始运行, 而且右边有可缩化的画布卡片。在专家全景图可以看到每个子 agent 的 状态。专家团总共有四个成员,有三个调研员,一个全站工程师。三个调研员的角色很有考究, 一个是分析 github 高薪瑞米进行对标采样,一个是搜索行业文章及指南收集,另外一个更厉害,直接去找社交平台经验帖,都是实打实的实践。这三个人组合起来,对同一维度的研究会更加深入且有价值。最后一人负责整合输出 右边子 agent 的 画布,每个上下文都相当于一个聊天窗口,可以实时看到它们的滚动。另外,你还可以切换不同的仕图,可以看到文件最终成果。这些都可以帮助我们审查整个任务执行的中间过程以及产物。 值得注意的是,左侧栏的 quest 可以 同时并行多个任务。 最终的研究报告怎么样呢?我可以很负责任的告诉你,它比任何模型的 deep research 都好得多。如果你不相信的话,可以仔细看一下这个文档, 这与大语言模型直接生成或使用一些搜索引擎生成有明显的区别。当然,能做出这样一份研究报告也并非仅靠这个 quarter agent harness, 这完全是我们最开始提示词中有一份我自己过往做各种主题研究的 md 文档, 那其实是我的一个 skills 里面抽出来的,所以我做这个 readme 研究也完全是我有这个需求。这个文档可以替我省下许多时间。 酷的,还有知识引擎,这玩意如果真的能持续积累,会很适合长线工作。打开 knowledge 面板,自动生成的知识架构规范技术栈,你知道的,写代码是长线工作,做产品是长线工作,做内容也是长线工作。 redmi 任务总共耗费了三四十分钟,后面我们还有三个任务,由于时间原因不再一一演示,因为我把这些任务包含文字和视频,从零到一的写在了一篇文章里,感兴趣的可以去看看。好了,既然看到这了,这里觉得有帮助的话,随手点赞支持一下。想继续看到更多有价值的 ai 实践更新,可以给我个关注,感谢你。看到最后, 对于这个主题有想法的,欢迎评论区交流。

这是我发给可乐的一个 cd 截图,让它生成,按图片生成 cad 开,然后它自动在用,看一下它最后生成是什么啊? 看它。嗯,上次被猪头屠夫堵在电梯里顺爆的,这个丑必须爆。来吧,今天就跟猪头屠夫秘诀高下。呵呵呵,怎么的你?上次你看他自己画了,画好了, 然后我们对比一下截图,这样他只是字体的方面,他是乱码的, 但是我可以要求他把字体修正回来啊。你看尺寸,二零九四二零九四六百,都是一样的牛逼吧。

u z 这里变为了零杠三百钢铁侠 windows 端如何去使用?从头带着大家来一步一步的操作一下。首先我们下载官方最新版本的扣,我们电脑上这个扣的版本是零点二点二,三是比较旧的版本,先来更新一下扣的,安装的时候一定要安装在 c 盘, 使用默认路径去安装,其他的字盘不可以。安装好以后打开扣的看一下版本号,目前版本号是零点一、四点二,然后看一下 id 里面的账号,已经登录了一个 uzi, 这里是一个 free 的 状态, 积分是零杠零。好,我们先将它关掉,接着打开下载好的文件,只有一个 exe 文件,右键管理员身份运行, 注意啊,一定要右键管理员身份运行,否则一些操作可能会被拦截。软件打开以后就是桌面上看到的这个界面路径,这里看一下这个扣的的路径,是我们刚才安装的最新版本的 扣的点 exe 文件。然后我们的操作有两种方式,如果是基于自己去注册,那么就使用绿巨人启动,如果想使用现成的账号来快速切换, 就使用这个红色的呼叫钢铁侠按钮,这是两个按钮的区别,使用两个按钮之前 再强调一下,注意看那个 ip, 当前的 ip 是 这个,我们在切换账号之前一定要想办法将那个 ip 改变掉,不会换的话自己可以百度,百度去问问豆包如何更换公网 ip 方法有很多, 大概有三种方式,手机热点魔法光猫重启查询自己公网 ip 的 网站,可以通过 ip 幺三八点 com 在这里进行查询,不要访问其他的,比如 ip 点 s b ping 零零那种网站,一定要使用这个幺三八的网站,它的查询是最准确的,可以看到这个 ip 是 跟我们的 软件上的 ip 是 对应,确保自己拿到的是一个新的 ip。 以后点击呼叫钢铁侠,好,我们点击它有这个提示,不要紧,是因为我们刚才就已经换了一个 ip 了,直接点击试,需要等待一段时间,让程序自动跑完。 好,跑完以后有一个提示,注意看一下这个弹窗里面的提示的文字,然后我们看一下这个扣的的界面,变成了初使的界面, 这个时候我们选择一个风格,一路 continue, 注意这里不要点 second, 要点跳过点 second 又会登录全新的账号,这里一定要点击跳过,因为这个账号已经切换进来了,可以看到右下角变为了 pro trail 是一个 pro 的 状态。 u z 这里变为了零杠三百,点击人头,点击 coder sighting, 也可以看到账号的信息,有一个绿光,点击 harp 和 bot, 可以 看到 coder 的 版本号是最新版本,使用的时候 可能会遇到一些问题。 uzi 这里没出现三百积分,没出现 pro 有 几种情况,网络延迟,网络还没有过来,所以没有收到这个三百积分。还有一种情况,公网 ip 没有更换,或者公网 ip 比较脏,已经被别人使用过了, 是这种情况。那么如果遇到这种情况的话,我们只需要更换好自己的公网 ip, 再次重启 code, 重启以后点击 uzi 这里 再次观察他的积分变化,注意一定要点一下 u 地址去观察。然后我们可以打开自己原来的项目, 历史的项目,打开原来的项目以后,里面的记忆还会保留,不会丢失。如果想使用绿巨人启动按钮自己去注册的话,可以访问泊客地址,加运点赛道到用户名这里来升级天数。艾瑞曼 w 可以 通过给视频三连, 通过我们的博客地址查查密点上栏找到钢铁侠这篇文章,在里面自助下载,或者点击右上角免费获取。

最近有粉丝朋友问我,能不能把我电脑的用户名改成中文的,你就右键此电脑打开管理,在计算机管理页面中展开本地用户合组,选择用户,然后在右边选择你的用户名,双击打开, 你在全民这一栏的输入框里输入你的中文用户名,输入完成后点击应用和确定,现在你锁屏看看是不是改过来了。

刚才我又用我的 v 一 百的显卡在我的主机上装了一个千万三的一个编程的大模型,我又装了一个 openclock, 调用我本地这个大模型,让他给我编程。 刚才已经成功了,我输了一个 hello, 然后他会回复了。现在我让他编一个代码,看看他可以编不看看他的速度。我让他给我编一个网页版的乌兹尔奇的游戏, 我现在点发送按钮,点过之后他正在思考,看看他的速度怎么样, 看看它的显存占用。现在 g p u 的 温度还挺低,才三十多度了,因为我换了一个专用的涡轮风扇, 它 gpu 占用,现在占用了三十二 g。 呃,我 gpu 最大才是三十二 g, 应该占满了。这个模型是这种的千万三 q 的 三十 b 的。 看它生成的速度,感觉比线上的云端的那种也差不多,稍微慢了一点点吧, 等一会看他生成之后能不能用,这样以后我就不依赖云端大模型。我编程序的时候我就说一句话,把网线拔了,他也可以把我生成一个程序。 我的本地的大模型的速度感觉比线上的他们那个慢了有一倍吧,你看他出文字的速度, 我用 deepsea 这样的也经常用,感觉比这个应该快一倍那个样子。 但是我可以用龙虾,用 open klo 代理,也不借助于网络,在本地就可以跑。它已经完全生好了一个网页。 我运行一下这个无字器,看它编的怎么样, 看有没有复制的按钮,有复制的按钮,我把它复制走, 把它装到这。我已经复制到这里了,重新复制一下, 把代码复制到这里,保存一下 五子棋 html 保存好,这是刚才给我生成的,我看看管用不。 生成了一个五字棋棋盘出来了,怎么玩呢?点个开始。哎, 怎么回事,根本都没有棋子。是哦,往上放,放到这。哦哦,我知道怎么玩了,但是另一家另一个玩家呢? 哦,我放到这,放到这。哦哦,一直这样啊,我一个人白籽和黑籽都能点呐。 啊,这样。 嗯 哦,一个黑方点一次白方点一次 白方获胜。好,可以玩。看到吧,我用本地的千万三编程的专用大模型,用我的显卡做的程序。还可以吧, 我还安装的有 open claw, 让 open claw 替我工作。可以,我不用 open claw 也行,在呃命令窗口调用这个大模型也可以,用 open claw, 龙虾的话,它能够全自动地替我处理。

哈喽,大家好,这期,嗯,我是高老板,我这期给大家做一个这个啊,非游戏相关的,就是跟跟游戏相关,但是非游戏这个技巧相关的一些技巧。 首先是啊,我们可以选择怎么样去把我们的视野变得更大啊?大家可以看一下。哎, 我现在这个视野是不是变大很多啊?变大很多,我们可以看一下啊,刚才这个我刚才只能看到这个位置啊,比方说像这个大概是这块石头的区域,然后但是我设置成为这个一九二零乘以八百这种情况的时候,他的这个区域竟然变大了,大家发现了没有?发现有,有没有发现他的区别? 有没有发现他的区别?我再给大家演示一次。哎,大家是不是发现左右的这个画幅变大,左右的画幅变大啊?这个是怎么做的呢?嗯,首先我给大家看一 下这个分辨率,嗯,分辨率是,呃,英伟达的显卡是选择这个英伟达控制面板,然后 amd 有类似的操作,这个 amd 因为我没有 a 卡,所以大家去这个去做的时候需要自己去尝试啊,自己去尝试 就是我现在可以把这个,呃,显示器里面可以新建一个分辨率,新建一个分辨率,我们把这个,哎,现在为什么不可以自定义了?先取消一下这个啊?是的,我们现在是我们原来本机是一九二零乘以一零八零的分辨率,然后我点自定义, 我点完自定义之后,这个我创建一个新的这个,呃分辨率,这个分辨率就是比方说,呃呃,怎么创建这个,呃,这个分辨率呢?就是首先横向的水平像素不要动,水平像素不要动,然后你把竖向的扫描线原来就是 它自动默认你这个最大的是一九二零乘以八零,你把它改成八百,你把它改成八百,然后或者改成更小一点,七百啊,当然七百的话可能这个竖向的这个显示就会更小一点,这个不太适合我们啊。七百,然后我们一般就是会改成八百,从一零八零改成八百,这样去减少二百的这个, 然后你点一下测试,如果能正常展示,就是这个呃页面不会出现混乱的话,然后然后你就你就把这个工具他就保存在这里了啊,保存这保存在这里,当然大家如果想展示的更多,可以考虑二,就是直接拉长横向的画幅,二五六零乘以一零八零, 但是这样的话会导致你这个呃页面内部的显示有一点小,就是字看的会非常小啊,所以还是建议这个用一九二零乘以八百,或者一九二零乘以七百啊这种分辨率,然后点一下确定啊,点一下确定,确定完了之后,他就会在这出现一个自定义,然后这个时候再呃应用一次,应用一次,应用一次登录一下这阿尔比恩, 然后再退出来,你这个二比零就会记录下你当前的一个特殊的分辨率,就是一九二零乘以八百 啊,我是这样做的,就是呃,这样使我们整个画幅会变得非常大,但是字体却能看清,比方说我们的聊天框看到没有,聊天框看的很清楚,但是我刚才给大家说了,你可以把这个横向直接改横向,不要改纵向的,这个就是纵向保留一零八零,横向改成二五六零,但是他整个这个画幅会把这个字压的很小,看不太清啊。 这个这是页面上的一些小设置,然后我们还可以把这个,呃,我们整个界面上的这个尺寸缩小, 尺寸缩小,这样的话,呃,就是除了会看的这里稍微小一点以外,其他也没有什么特别的问题啊。这样的话其实这个对角上我们是可以这个对角上的,这两个区域是可以更早的发现红区的红名的啊,发现红区的红名的,这是第一个小技巧, 第二个小技巧是我现在是在点鼠标走路,对不对?我可以不点鼠标走路,就是按一下我的键盘, 然后我现在是没有点鼠标的录音是能听出来,我现在是没有点任何鼠标的,我现在只在移动鼠标。移动鼠标,那比方说我们在运货或者是在跑路的过程当中,然后我们就可以通过这个方法来 来,就是让这个游戏在自动走路,然后我们可以输入东西啊,写一些字,输入东西是没有任何问题的,他不会打断我们的走路,我们现在的手手在键盘上,他在输,哎,一个东西啊,然后他是不会打断键盘的。这个东西是怎么设置的呢?这个东西是这么设置的,给大家展示一下 啊。鼠标设置大家可以看到它有一个路径啊,只是温时的电脑是这么设置的,其他的会其他的版本的电脑可以根据自己的不同电脑去 啊做改变啊,试试控制面板,然后这个从所有的控制面板里面啊,这个这个啊,我直接给展示好了,我具体,哎,把它给改成大图标啊,是手包吗?是手包来着吧。啊?坏了,忘了是什么,哎,我看到了一个资源,先把资源拆掉,先把资源拆掉 打开哈。呃,控制面板,所有控制面板选项,然后轻松使用设置中心,然后设置鼠标键,设置鼠标键,然后启用鼠标键啊,把启用鼠标键配上,然后大家可以把这个,呃,所有的配置跟我这边的显示的配置成一样的 啊,配置成一样的,然后点确定点应用点确定啊,确定完了之后,我们就可以看到在我们的这里会有一个鼠标键的一个提示提示框,那这个鼠标键具体怎么用呢?鼠标键 这么用,我们在走路的时候进入某一张地图之后,我们先点一点,随便点一点,然后姐就说这个这个键是启动的状态,然后我们去看一下自己的小键盘,可以看自己小键盘,然后我们在这个小键盘上点一下那个,呃,这个数字键盘的启动之后, 他就启动了,他就启动了,大家看到了没有?我现在没有按任何东西,然后但是他是会朝我鼠标指引的方向继续走的,那他在继续走的过程当中,我们就可以去打字,可以打字啊,对,这是第二个小技巧,这是第二个小技巧, 然后还有一个小技巧想教给大家的是我们的游戏设置里面有一个社交功能,有一个社交功能,对于萌新来说,对于萌新来说,这个,呃,大家可以看到这边一直是在刷各种各样的消息, 然后蓝字啊,这个白字呀,这个消息发的速度非常非常的快,这个东西对于萌新来说其实是没有用的,因为他们一直在更新 hce 的信息,然后这些信息,呃,对于萌新来说没有丁点作用。没有丁点作用,那我们该怎么来配置我们的聊天版呢? 嗯,是这样子的,首先我在这个设设置里面去看社交,把社交里面的乱七八糟的都先关掉。那我们需要什么东西啊?我们需要什么东西?首先一客户端的语言,因为,呃,有很多人在组队, 有很多人在组队,他会去往客户端语言去发,比方说我们是汉语言,然后大家就会往汉语里面发,不管是繁体还是这个简体,呃,都会发到同一个这个客户端语言里面去啊,就当前是中文啊,当前是中文。然后呢?这个帮助其实可以开,但我觉得没有必要开,因为他上面帮助有的时候打出来 英文呢,看了也没有什么用。当然你也可以开掉了,然后我这边是关掉的,然后再就是开地区,在公会,然后把寻找队伍这个语言给去掉,寻找队伍,寻找队伍,然后阵营的话,如果大家打,那就开,不打就就是不打。平时不打也可以不开啊,平时不打,不开私信肯定要开 啊,说话也肯定要开,然后动作可以取消动作可以取消,系统要开,然后击杀玩家的。这个要开。为什么要开?击杀玩家?因为如果你在红区,谁击杀了谁是会爆在这个里面的啊,是会爆在这个里面的。然后呢,这样设置好了之后,大家就会发现自己左边的这些话少了很多,然后只剩下了我们所需要的语言所需要的, 就比方说白城公会有人收人吗?然后我们就去看,或者是向上面有一些人喊啊,紫城 t 五蓝洞挂旗四档一弹,然后我们是弹,我们就可以去喊这个队伍去找这个队伍,当然有看皇城的啊,皇城有没有人一起要玩的啊?要 请他入会,好吧,那就不管他了,然后我们就是通过根据这上面的小队,这样就会可以呃,这个这个消息就可以更快的去找到这些小队 啊,更快的找到这些小队去参加活动那,呃,有的人他比方说我是紫城的,他说四等一不需要挂旗的话,也就说我们现在目前我们工会是在皇城,那我们就直接从城市里面飞过去,去其他所需要的那套装备啊,一般如果像我的话,我会喊啊,皇城带萌新, 皇城在萌新啊,需要什么?这个,呃,这个起 ip 一千,一千, ip 一千,需求 dps, 奶妈 奶妈奶妈。然后然后或者是这个啊,不要进站啊,不要进站,进进进站,不要进站啊,进站啊,一般是会这么喊,然后要不要挂旗?挂旗自 挂旗子,然后手速刷,对,速刷。对啊,一般会把这些信息都给放进去啊,把这些信息放进去,大家也可以就是通过筛选掉那些不重要的信息,那我们就可以看到啊,有人如果是皇城要拜的话,然后,呃,可能不是我们工会的,然后那你也可以一起 加进去参加,毕竟可以刷一定经验,也可以刷一定的这个啊,声望吧。然后这个这个就是一些比较基础的,这个非对游戏有效,但是对你的日常的一些操作非常有效的小技巧。好,那么今天就分享到这里,这是三个可 比较呃,对萌新比较友好的小技巧啊,当然还有第四个小技巧,突然想起来了,我们可以就怎么看自己当前的卡顿呢?然后你去打一个撇,然后打聘,看到了没有,你的聘值就出来了,你现在的延迟是二百一十八,二百一十八,你的聘值是在浮动的, 打什么呢?打在任意的平台里面打撇,然后聘值的聘, pi n g, 打聘就可以显示你的聘职。好,我在这个可能游戏录出来这个显示不一定不一定清晰,我把这个分辨率调回来,把分辨率调回来,然后给大家演示一下啊,哎呀,这个 这个为什么这么显示呢?全屏吧,全屏,边框窗口全屏。好的啊,撇, pi 皮皮 i n g 啊,输入皮皮 i n g, 就可以显示我当前的这个聘职,当前的聘职调大一点, pi n g 啊,一回车,大家看到了没有?聘职在这里显示,那你如果聘职一千多啊,也就是说别人,别人在,你看到这个人,假设就是这个怪的位置,你看到这个人在这个怪的位置,你在追他,那他实际上是疫苗以前的位置,那他实际的真正位置 在这些位置啊。假设都是往这个方向跑的话,所以这个聘职也是很重要的,因为我们在国内都是需要用这种加速器啊,当不了低聘战士,所以没有办法,这也是一个比较有用的小技巧。好,那么这就是 r 别人常用的四个小技巧。

你是不是也有一堆做过的 o a e r p 项目堆在本地?想附用找不着文档想展示还得重新不说,试试九五 coder 的 新 skill 小 龙虾 open 可否下载到本地一键解析你的历史? o a 项目代码结构、数据库表 业务模块全自动提取,然后导入九五 color 平台,自动生成需求文档和库表设计文档,还能在线预览系统所有项目统一管理,客户想看案例直接发链接。这就是九五 color 加小龙虾 skill 本地解析一键归档。

弟兄姐妹们,今天在 vibe coding 氛围编程界出来了一个大新闻,就是豆包输入法终于出了 mac 版本。我为什么这么兴奋?是因为过去的一到两年,我们所有人都知道程序员的工作方式发生了翻天覆地的变化。 如果你去硅谷的话,你会发现大部分程序员,他们的工作方式就用一个词来概括,就是 whispering, 就是 轻声地对电脑说话,这就是氛围编程的第一步说话。 当卡帕西把 web coding 这个词发明出来之后,他把 web 放在了第一个。那当你有感觉想要去创造一件事情的时候,你觉得你是打字方便还是说话方便?当然是说话对不对?那英文输入法就很方便,因为你直接讲英文,那电脑很快就能够识别你说的是什么。如, 如果你说了一些错误,那么 ai 的 英文输入法还能帮你改正,但是中文就没有那么容易了。那过去相当长一段时间内,咱们国内的氛围编程者还在不停的打字跟可可打字,让他去做氛围编程,一直都少了那么一点点酷炫的感觉。那我为什么这么兴奋?是因为豆包输入法 非常非常的强大。你在手机端用过豆包输入法的人都知道我在说什么,但是 ai 编程有需求的人,或者是喜欢 web 定的人,他们大部分使用的场景还是在电脑上。那电脑过去一段时间内,我一直用的是微信输入法,微信输入法是有语音功能的,但是一直都差那么一点意思, 要不就是因为你滴滴的把微信打开,微信就非常占内存,要不就是当你说错了一些事情的时候,你就会把它不会,把 web 定 和用语音编程这件事情的体验感拉升好多个层次,但是目前只有 mac 版本可以使用,所以这也是为什么我非常的兴奋,就是所有 符合我刚才说的那种很即刻的 vipcoder, 此时此刻豆包输入法安装起来,我觉得从此咱们跟硅谷的差距真的就是越来越小了,所以赶紧去试试吧。

曾经我对 cloud code 的 终端爱不释手,但现在我只能说一句, codex 真香啊,真香! 大家好,我是布鲁。随着 codex 近期频繁的更新,我自己的工作站也已经全面的切换过来了。今天就来分享一下我自己的完整使用经验,怎么用 codex 打造一套不打断心流的生产力闭环。 本期视频我把它分成了七个章节,每一张都是我自己实际在用的技巧,希望能对你有所帮助。那我们话不多说,直接开始 第一张,先来介绍一下我的工作站是怎么布局的。左上方是 codex 的 对话框,下方是 terminal 终端。 你可能会问,已经有 codex 的, 为什么还要开一个 terminal 跑 c c? 因为我发现对于一些需要探索、需要设计的任务, c c 的 表现要更出色一些。所以我的习惯是用 c c 来做方案设计,配合 planning with files 这个 skill, 把设计思路直接落成文件, 然后再让 codex 读这份计划,接手后续的具体实施。这样一来, cloud code 负责想, codex 负责做,两者可以各司其职。 右上方这个区域我用来做任务完成后的查看和审阅,比如代码的 review, 文件的浏览,还有浏览器都在这里。虽然现在浏览器还不支持多标签页,但对于日常的任务来说完全够用。这边我就分享一个实际的案例, 我让 c c 参考了最近很火的这篇卡巴西提出的知识库的文章,让他借鉴里面的思路,出一份设计稿和完整的实施计划。目的呢是做一套前端的页面,方便我日常的维护文档使用。 接着 c c 就 会调用 planning with file 这个技能啊,将所有的计划落成文档,然后我就会回到 colex 这边,让 colex 去阅读当前项目内的这份计划文件,然后基于这份计划文件让他进行开发。开发完结果之后,我会在这边 内置的浏览器里面去进行结果的 review, 包括代码的一个审查,整个过程从设计到开发再到 review, 全都在这一个工作站里面完成,不需要切换任何的窗口,这就是我前面所说的,心流不会被打破。 第二章,批注功能。这个功能是我觉得 codex 真正强大的原因之一,也是最能体现沉浸式开发的地方。 以前我们改代码的方式是找到文件定位到哪一行,描述问题,让 ai 修改,整个过程中你的注意力是在代码上的,但现在 codex 的 批注功能让这件事情变了,你可以直接在文件上进行批注,告诉他哪里怎么改,需要怎么改。 更厉害的是,现在这个批注功能不止限于代码文件,你可以直接在前端页面上进行批注,看到哪个按钮位置不对,哪块布局不满意,直接在页面上标出来, codex 就 能理解你的意图,并帮你进行调整。这件事的意义在于,正好对应了 webcodd 的 核心理念, 开发者的重心不在于怎么写,而在于写出来的东西对不对。批注功能把这个理念落地了。 第三章,上下文管理 codex 项目里可以同时开多个县城,每个县城对应一个任务,互相独立,不干扰。对比 cloud code 需要开多个对话窗口, codex 把所有县城都收在了一个项目下,管理起来会清晰很多, 然后是项目的记忆核心就是 a 键的点 md, 这个文件你可以类比为 cloud md, 把项目的背景、开发规范都写进去, ai 每次进来都会读取,不用反复的交代。 还有一点, codex 的 上下文管理非常省心,它会自动帮你压缩上下文,它也没有提供像 cloud code 中 compact 的 那样的命令,这种事情让 ai 自己处理就好了,你专注于任务本身就行。 第四张,自动化这块是我觉得 codex 比其他 agent 做得更好的地方,几个原因,第一,用起来非常的方便,直接在 gui 里面新建自动化任务,还内置了很多模板可以选择, 大到项目管理技术、眼镜,小到个人的生活习惯,都可以交给它来定期的处理。第二,自动化可以调用 codex 自身的能力,比如插件、 skill、 mcp、 浏览器操作、电脑操作等全都能用进来,这就是为什么我说 codex 在 逐步形成自己的生态。 第三,我们可以根据不同的场景来灵活的选择模型和推理强度,简单的任务用轻量模型,复杂的任务上强推理,这样的话头肯可以用的更加的合理。第四,稳定性,我实测下来, codex 相较于其他的 agent, 定时任务的准确性已经能达到生产级别,相当的靠谱。 第五张插件和技能, codex 有 相当丰富的官方插件和 skill 生态。先说说两者的区别, skill 就是 纯文档,本质是给一份 ai 的 说明书,告诉他在特定场景下应该怎么做事。比如说我前面提到的 planning with files, 就是 一个 skill 插件的概念会更大一些,你可以把它理解为 codex 打补丁,里面可以包含 skill, 也可以带上 mcp 配置,甚至集成其他的 app。 一个插件装下去, codex 就 多一套能力。 另外, codex 在 插件和 skill 的 管理体验上面要比 cloud code 的 友好太多了。 cloud codex 需要改配置文件,而在 codex 里直接在界面上点击安装,或者自己创建,整个过程非常的直观。 第六章浏览器和电脑操作 codex 可以 直接操控浏览器,你可以让它自动填表,抓取数据,验证 ui 效果。 比如我需要批量收集一些网页上的信息,直接告诉 codex 去哪个页面拿什么数据,它就能自己打开浏览器去完成操作,整个过程中都不需要你的介入。除了浏览器, codex 还能直接操作你的电脑文件的整理,应用的打开都可以交给它来处理,相当于有一个助手在帮你操作桌面。 不过这里要说明一点,随着 ai 自动化越来越普及,现在已经有不少软件开始加强安全控制,对自动化操作做了限制,所以实际能操作的范围会因软件而异,遇到限制情况也很正常,大家用的时候留意一下。 第七章通用功能这些功能不是 codex 独有的,很多 agent 都支持,但作为一个完整的工作站,这些基础能力 codex 当然也不会缺少。先说 play mode, 在 执行一个比较复杂的任务之前,先让 codex 把完整的计划列出来,你过一遍觉得方向对了再让他动手, 这个习惯能帮你省掉很多返工的时间,大任务尤其推荐开 play mode。 再说 m c p, 也就是模型上下文协议,通过 m c p 可以 把各种外部的工具和服务接进来,让 q d x 能力边界大幅扩展,无论是连接数据库,调用第三方的 api, 还是接入自己家的服务,配置好之后, q d x 就 能可以直接调用。 另外还有一点, q d x 相较于 logot code 的, 有一个非常关键但很容易被忽视的小功能,语音识别。目前我的任务几乎都是语音发起的,连打字都很少了。 ok 以上就是我在使用扣袋子过程中总结的一些技巧,如果对你有帮助的话,希望能得到你的点赞和关注。 最后我想说一句, ai 发展太快了,各家 a 键的功能越来越趋同,但工具再多,适合自己的才是最好的。有时候做做加法,找到真正需要的,做做减法,去掉用不上的,慢慢摸索出一套自己的工作范式才是最重要的。我是布鲁,我们就下一期再见。

monologue 软件切换中文版教程?下载完 monologue 打开一看全是英文,别慌,三步就能快速切回中文,不想看视频拉到最后有操作截图。 一鼠标右键点击 monologue 图标,打开文件所在位置。二在文件夹里找到 config 文件并打开。三,把里面的 language english 改成 language chinese, 保存后关闭。重新打开 mono link 界面就变成中文版啦。如需其他技术支持,可联系闪客客服,选择闪客,省心放心。