粉丝98.3万获赞329.7万

我们继续精读 openai 的 工程博克 harness engineering leveraging codex in an agent first world。 当代码生成速度不再是瓶颈,验证能力就成了新的瓶颈。 openai 的 解法是让 agent 自己验证自己,但这里有一个前提条件, agent 得先看得见系统的状态。什么意思呢? 一个人类工程师修完一个 bug, 它会打开浏览器,看看有没有报错,看看性能监控面板, 确认响应时间正常。这些动作的本质是人在用眼睛和听诊器感知系统的状态。但以前的 ai agent 不 具备这些感官,它只能写代码,写完就甩手了。 它看不到页面渲染成什么样,不知道系统有没有报错,更不知道性能有没有变差,需要人验证后截图告诉它哪里有问题。而现在,如果让 agent 自己验证自己需要可读性 legibility, 它的意思不是代码写得好不好读,而是 系统的状态对 agent 来说是不是透明的、可解析的、可验证的。这给我们带来的思维转变是,不要问 agent 能为你做什么,而是问你能为 agent 提供什么。那 open i i 的 团队具体是怎么做的呢?首先要解决一个前提问题, agent 需要一个独立的工作空间。在技术上,他们用了一个叫 gitworktree 的 方案,你可以把它理解为从主代码库附了一份独立的副本, agent 在 这个副本里自由折腾, 改什么都不影响别人。就像每个厨师有自己独立的操作台,各做各的菜,互不干扰。有了这个独立空间之后,接下来就是装感官了。第一个方向, 给 agent 装眼睛。把 chrome 浏览器的开发者工具协议接入了 agent 的 运行时,你在 chrome 里按 f 十二,会弹出一个开发者工具面板,可以检查页面结构、看网络请求、调试代码。 现在 agent 它也可以用这套工具了,它可以启动应用,打开页面,看到页面上每个按钮、每段文字、每个输入框的位置和状态。它们还给 agent 创建了专门的技能,来处理 dom 快 照、截图和页面导航。 dom 快 照是什么?你可以把它想象成网页的 x 光片,网页表面上是你看到的按钮和文字,但在底层,它是一棵树状的结构,叫 dom。 dom 快 照就是把这棵树在某一刻的状态完整拍下来,交给 agent 的 分析。 有了这些, agent 就 能够直接复现 bug, 验证修复结果,并推理 ui 的 行为。注意这里的直接,以前 agent 写完代码就结束了,现在他可以自己打开应用,自己看效果,发现不对自己修。第二个方向,给 agent 装听诊器, 光看 ui 还不够。系统内部的状态、日制、性能、指标、请求、链路,这些肉眼看不到的信息同样重要。 open ui 对 可观测性工具做了同样的改造。可观测性是什么?简单说就是系统运行时的体检报告,包含三样东西,日制记录、发生了什么事、指标、各项性能数据是多少。 链路追踪一个用户请求从进来到出去,经过了哪些环节。他们给每个 agent 任务搭建了一套临时的可观测性环境,每个任务有自己独立的日制和指标, 用完就销毁。这就像给每个 agent 配了一间隔音室,他看到的日制只属于自己,这个任务不会被其他并行任务的信息干扰。然后 agent 可以 用 log ql 查日制,用 prom ql 查性能指标。 log q l 和 prom q l 是 什么?可以理解为专用的搜索引群。 log p l 用来在海量日记里精确搜索某一条错误记录, prom q l 用来查询最近五分钟的平均响应时间是多少这样的性能数据。 有了这些工具之后,像确保服务启动在八百毫秒内完成这样的 prompt 就 变得可执行了。还有更复杂的,比如这四个关键,用户旅程中没有任何一个环节超过两秒。以前,这些约束不容易被 agent 验证,需要靠人类盯着监控面板去看。现在 agent 自己就能查, 就能判断,就能通过或者打回这两个方向的投入。装眼睛和装听诊器带来的最终效果是什么呢?三次 codex 运行在一个任务上,工作经常超过六个小时,通常是在人类睡觉的时候。这就是可读性投资的回报,因为 agent 有 了眼睛和听诊器,它可以自主地写代码, 看效果,查日记,发现问题,修复再验证。这个循环完全不需要人盯着才能干活儿, 变成了可以自主干活儿值班。总结一下,这一期讲的是状态可读,让 agent 能看见 ui, 得知系统内部状态,从而实现闭环自主工作。下一期我们聊如何让知识被 agent 发现。这里是慢学 ai, 我 们下期再见。


很多人问我,为什么你们搞逆向的总是能让网页说真话?明明网站设置了禁止复制,我们可以一键解除,明明加密了的数据在我们眼里全是铭文,是我们攻破了服务器吗?不,我们只是对浏览器施加了一个小小的魔法。我的天呐, 今天带你来看看这次逆向工程师最常用的核心武器,互可技术。看完这个视频,你眼里的网页将不再是钩子的意思。在编程的世界里面,原本的数据是从 a 点 直接传输到这个 b 点的,但是啊,我们可以在它们中间挂一个钩子,在这个数据传过去之前呢,我们先把它勾出来看一眼,或者说呢,我们会进行代码的一个篡改, 这样就可以拿到我们想要的信息。这就像是你去买奶茶,原本的流程是你付钱,然后店员呢,他给一个奶茶给你,但如果说我户口处的这个流程,我在里面加了一个钩子,那么在这个奶茶送到你的这个手上面之前呢,他会经过我的这个手,我会往里面 往这一个奶茶里面呢加一点这个料。但是啊,这个店员还有你并不知道这个过程里面发生了什么,然后我把经过我加工之后的这一个奶奶茶再给到你, 这个结果呢,其实已经被我改变了,这其实就是互克技术。雅诗准备好了吗?好,我们现在可以来看一个这个实战性的案例,更为直观的来理解这个过程。那么首先我们在这里使用 f 十二快键打开这个开发组工具的面板,结果您猜怎么着?它里面弹出了一个弹窗,并且啊 检测到非法调试,小菜鸡别爬了,那我看这几个字眼怎么那么碍事呢?又开始了是吧?所以说呢,我想改一下, 想改一下这个提示啊,把它改成什么呢?哎,大哥你真棒。好,那怎么实现这个功能?我们来看一下,首先还是打开这个开发者工具面板,我们在这个控制台上面可以直接进行户口代码的注入,首先你得有这个脚本代码啊,我们把这个代码复制粘贴到这一个控制台上面。好, 然后呢这里要注意的一点是,现在它还没有在你的这个浏览器执行,那么怎么让它跑起来,我们要按一下这个回车键。好,现在的话呢,我们这个鼠标已经跑起来了,并且你看一下我的第一个代码是什么意思, 第一个代码就是说我先把原本的这个弹窗的功能,我把它保存起来,以防呢,后面我如果说想要再用这个功能怎么办呢?所以我先把它保存起来,第二步的话呢,就是替换重启一下这个功能,就是说不管什么网页传进来,我都改成,大哥你说的对,这一句话。好,现在我们这个代码已经跑起来了。好,然后我们去 点击 f 十二键,你看一下现在弹窗的提示,就从小菜鸡别爬了,变成,大哥你说的对,其实网页原本的逻辑 他一点都没有变的,他还在拼命的想谈这个小菜鸡别爬了,但是啊,在他张嘴的那一瞬间,被我们这个后壳钩子直接截获了,原本这个话呢被吞了回去,他被迫吐出了我们设定好的这一句,大哥你说的对, 这就是互客,在代码的世界里面,我们是规则的制定者,而网页他只是执行者。当然实战中的互客远比这个更加复杂,比如说我们要互客一些加密入口,拿到加密密钥,或者互客他的数据包,把付费视频变成免费的, 这一些都是非常复杂的一些应用场景。那今天教你的这个只是逆向工程,露出拼命的一个小角,试着去这个网页上面试试看。注一个代码,或者说呢,你可以再串改一些其他的功能,只要你学会了控制浏览器,你会发现互联网其实就是透明的。

你知道什么是浏览器扩展吗?下面这个视频将会带你入门。浏览器扩展的神奇事件,假设你想批量下载图片,可以找个图片扩展,想下载视频可以找个视频下载扩展。想免费听音乐找个音乐扩展,想让网页无广告找个去广告扩展。 我们回到视频开头的这个疑问,什么是浏览器扩展?我想举个通俗的例子告诉你,假设浏览器是电脑的操作系统,那么浏览器扩展就是电脑操作系统上的应用程序, 只不过扩展是基于浏览器的,就像应用程序是基于操作系统上的一样,一句话概括就是可定制浏览体验的小型软件程序,让你使用浏览器更 方便顺手。那么如何安装浏览器扩展呢?我将会介绍三种浏览器的安装方法,推荐使用 h 浏览器。 h 浏览器安装扩展最为简单,只需要点击右上角三个小点,然后点击更多,然后点击扩展, 点击管理扩展,点击获取扩展,在这里我们随便点击一个,然后点获取点添加, 就可以将这个扩展安装到你的扩展列表了。接下来我们讲一下恐龙我们浏览器如何安装扩展, 由于长的缘故,我们是打不开科罗姆扩展的商店的, 我们可以百度插件一,然后在这个网站当中下载,这里我已经下载了一个,那么怎么安装它呢? 首先我们得解压,然后打开更多工具。扩展程序要打开开发的模式,然后点击加载已解压的扩展程序,选择这个扩展的文件夹,然后点击选择, 然后就可以成功的安装了其他浏览器的安装方法和上面这两种类似,大家可以自行去尝试。接下来我们来尝试安装一个扩展,我想,嗯,安装一个听歌的扩展, 这里我使用 h 浏览器选择扩展管理扩展,获取扩展,然后搜索 listen 一,然后点击获取,点击添加到扩展, 我们就可以看到这个扩展程序已经配置好了,我们可以让他显示到工具安装中,然后点击这个扩展,他集成的多个音乐平台的资源,可以很方便的查找自己喜欢的音乐,并且在线听和收藏。 好了,到这里就结束了,如果本视频对你有帮助,可以一键三连支持一下。下期视频我们讲如何这个神奇的浏览器扩展。

接上一条视频,就是很多朋友还不太了解 open claw 和养龙虾计划这两个词到底是什么意思?是不是 最近快把你们的耳朵都磨出茧了?别急,这里花两分钟的时间速冻版分四个部分给你介绍什么是最近爆火的龙虾水产养殖计划,以这个 open claw 对 我们跨境电商会有什么样的作用,以及它的影响。 那么第一部分就是什么是 openclot 和养龙虾计划。 openclot 就是 一个能够动手干活的本地 ai 智能体, 圈内圈外的人士都叫它龙虾。普通的 ai 只会聊天,它能够接管鼠标、键盘、浏览器,打开文件,还能登录电商店铺的一个后台,调用你各种 ai 工具和大模型,还可以装各种的 skills, 自动执行任务,相当于你二十四小时在线的数字员工。 所谓的养龙虾计划,就是把 open crawl 部署好,为模型装技能,调我们的那个流程,把它养成帮你干活的一个 ai 助理,这个过程就叫养龙虾。 那第二部分就是它对我们的跨境电商有什么样的作用和影响呢?对做跨境的一个运营来说,如果你的能有能力去部署训练 open crawl, 这简直就是解放你的生产力的效率神器。 你可以把它当做一个自动选品,整理各类数据,查竞品的信息,计算选品利用的一个工具。它还能给你一键分析整理出来的各种各样的一个报告, 这只是其中一个部分的能力,它还能够帮你整理和写出完整的历史顶文案,自动的给你的历史顶做标题,做描述,做图,甚至我看到有些商家朋友已经用来批量化的生成短视频,全流程的一个自动化,但这需要专门的一个部署和训练,不是一个小的工程啊。 上面的内容如果没有 ai 时代,传统的电商是依靠人力去对工作量和数据出来的,现在有了这样的一个 ai 工具,还有各种各样的大模型,效率直接翻倍。 有很多人说这玩意只是一个噱头,但是如果你能够用好的话,在人均的产出,人均的评测上面,会比那些没有用 ai 的 同行公司会省出很多成本。 那第三部分怎么去安装使用呢?这部分有点复杂,一个视频估计也讲不清楚,如果说你们想去使用的话,可以通过去问 ai 怎么去安装 ai, 教你一步一步按照流程操作就行了。 其实安装整个过程不难,难的就是他会有调试的一些代码,或者说有一些细节上的东西比较繁琐,需要花一点时间。 那么目前对我们跨境电商的朋友来说,这个工具它有什么样的一个短板呢?呃,目前在使用上面,它的短板就是第一个就是还不太稳定吧,容易出各种各样的一个 bug, 但是这种 bug 它是根据你的调试的技能以及你使用的一个大模型有关的。 第二个就是,呃,它的使用成本上面,因为它是要耗费 token 的 token, 呃,大部分大模型现在的 token 都是要收费的了,可能会有一些免费的给你体验,但是体验的数量和质量并不是特别的好, 所以收费的版本的话,这里面会产生 token 的 一个使用的一个成本,这也是我们在使用那个龙虾这个工具的时候会产出的一些 费用之类的,这也是我把它归类为它的一个小缺点吗?但是你使用任何的工具都是需要,都意味着你要花时间成本还有资金成本这些的。 所以至于你要不要去用,我觉得一个新的工具的出现,他无疑就是一个生产力的一个方式的改变,如果去用他可能会对你这样的业务会有一点点帮助,也可能会没有帮助,至至于 至于有什么样的一个帮助,得要看你怎么去使用它了。所以最近很火的这个 open globe 和养龙虾的计划,我觉得跨境电商的商家朋友们都去试一下,都建议去试一下,确实在一定程度上,呃,会刷新我们对 ai 的 一个认知。