接下来登场的是前端开源框架领域的格局重塑者。响应是网页开发标准的标杆,全球首款自适应多终端布局的框架开创者, 打破了不同浏览器、不同设备页面错乱的开发困境,一套代码兼容电脑、平板、手机全终端浏览体验, 从企业官网、后台管理系统、政务信息平台,到电商展示页面、个人簿客、各类小程序网页界面的全能选手, 全球前端普及率遥遥领先。前端开源生态,划时代经典制作,网页开发界里程碑级框架,推特 bootstrap 视野。
粉丝5.0万获赞94.9万

你的浏览器是不是也有这种问题?明明自己的网络很快,但下载速度非常慢,而且越来越慢,直到停止。很多人怀疑是自己网络的问题,但其实不是你的问题,我来教你解决。 如果你使用的是 h 浏览器,可以先在上方地址栏输入这行神秘代码,然后回车进入浏览器实验功能, 在这里的上方框输入另一串神秘代码,回车找到多线城下载功能,改成 e mail, 这样就开启了多线城下载,改完之后再次尝试可以下载更快,如果下载还是缓慢,就考虑使用下载器。 下载器我就不推荐 i d m 了,配置还是麻烦,我们这里直接用迅雷就好, 这里注意不要登录,具体设置可以按我的操作来,也不要绑定浏览器插件,非必要误增实体。这是奥卡姆剃刀原理,我觉得也可以适用于电脑软件上。很多时候我们只需要软件的一个功能,就比如迅雷, 我只是想让它在 h 下载缓慢时,当好一个简单的下载器,别的功能我不需要也不需要,它一直挂在后台,随时接管浏览器下载,所以也不给他自启动权限, 只有在我需要的时候打开,除了我想要的功能外全部关闭。这是我对沉浸系统的定义,不要一开机就一堆软件。自起弹窗 软件设置完成,我们看一下怎么使用。在浏览器右上角找到下载,鼠标右键下载缓慢的内容,复制下载链接, 然后 ctrl 加 v 或者鼠标右键粘贴到迅雷 enter, 回车就弹出来任务页面了。从这里下载速度一般都是可以拉满的, 然后双击或者右键就可以正常打开。如果你不想要,下载完软件再把迅雷删了就是了。

gitnexus 纯浏览器端代码智能工具的功能架构一、代码理解与语义导航 gitnexus 的 首要功能层是对代码库的深度理 解与快速导航工具。在浏览器内基于 trigon sitter web assembly 解析器构建四十余种编程语言的抽象语法术,并在此基础上生成项目的完整符号缩影。 用户在本地打开代码库后,无需任何上传等待,即可获得与桌面集集成开发环境相仿的语义感知能力。定义跳转与引用查找 双标志。于任意函数、类变量或接口名称上使用快捷键可立即跳转至其定义位置至无论该定义位于当前文件还是深层 目录。反向操作同样支持,即从定义处列出所有引用该符号的位置,并以列表形式展示,点击即可切换调用层次关系。 对于选定的函数或方法工具,可计算完整的调用图,向上追溯调用方,向下展示被调用方。调用关系。已可展开的树形式图呈现,帮助开发者快速理解直行路径与模块藕 和程度。符号。大纲与悬停信息。当前文件的符号结构以大纲形式显示,在侧边栏,含该类方法属性及接口声明,点击即跳转 光标悬停于标识符时,浮动面板即刻显示该符号的类型。注解定义位置、摘要及关联文档。注视文件模糊搜索项目文件数,支持按文件名片段快速筛 选,渐入字体即可定位目标文件,大幅提升大型项目的切换效率。上述功能的数据源均为本地语法术语,内存缩影 响应延迟控制在数十毫秒以内,交互体验流畅无卡顿。二、本地人工智能增强 get nexus 在 纯浏览器环境中集成了离线可用的代码大语言模型, 推理过程完全依赖本地算力,无任何数据外传。模型经量化压缩后存处于 origin private file system, 通过 transformers js 运行时与 web gpu 后端执行推理型内代码补全编辑过程中,工具根据当前文件的语法、上下文与作用域内符号信息,自动生成灰色幽灵文本作为补全建议。 建议内容包含未写完的表达式函数、参数级完整语句块,按 tab 键采纳,继续输入则自动消失。 自然语言生成代码在注视中以自然语言描述需求,触发快捷键后,工具在注视下方生成对应代码,实现生成逻辑会适配当前文件的编程语言。于已有代码风格、代码解释与文档生成。 选中任意代码片段,可请求工具以自然语言解释其执行逻辑、边界条件及潜在 风险,同时支持为一键选中函数或类,生成标准格式的文档。注视内容包含参数类型、返回值、说明与使用。视力重构,建议对选中代码执行分析后,工具提供具体重构选项,如提取重负逻, 即为函数、简化嵌套条件优化、变量命名等。建议以差异对比形式呈现,用户可逐条采纳或全部应用。提交信息自动刊写。在查看代码差异时,工具分析变更涉及的符号类型与影响范围, 自动生成符合 conventional commits 规范的提交说明。所有人工智能功能运行于独立的 web worker。 现成股权与生成延迟在数百毫秒级别,不影响主现成编辑操作。 三、项目管理与协助支撑除面向代码内容的智能辅助外, get nexus 还提供围绕项目整体的管理工具,助利开发者从宏观视角把握代码结构。依赖关系图谱 工具解析文件间的导入与引用关系。生成模块依赖图,图中清晰标注各节点的上下游关系,并以颜色区分、循环依赖与未被使用的引用,为架构优化提供直观依据。 本地版本对比,直接读取项目目录下的 get 版本库信息,支持在工具内浏览文件变更、历史对比任意两次提交之间的差异。 差异式图采用并排高亮模式,新增删除与修改区域一目了然。锁影快照与恢复 可将当前项目的完整语义、锁影文件摘要及用户配置打包为单一档案文件,该档案可在其他设备的 git nexus 中直接打开,迅速恢复至相同工作上下文, 无需重新解析项目文件。多标签页状态同步同时打开多个 git nexus 标签页,访问同一代码 库时缩影缓存最近打开文件列表即位保存的编辑状态,通过 broadcast channel 自动同步,保证跨页面体验一致。隐私边界保障,上述所有功能执行期间代码内容路径、符号缩影及人工智能推理过程均 不离开浏览器沙箱。工具不包含任何遥测、上报或数据收集、逻辑网络请求面板中无任何外发流量。四、辅助功能与效率工具 除核心功能外, get nexus 还内置多项辅助工具,覆盖日常开发的边缘需求、权威检测与符号搜索, 侧边栏提供局搜索入口,即可对代码注视字母串及标识符进行权威关键词 解锁。也可基于语义缩引对项目内全部符号进行模糊搜索,搜索结果按文件分组并高亮命中位置符号搜索同时附带类型标注。代码格式化与编辑增强 集成基于 web assembly 的 pre tier 格式化核心,支持主流语言的即时格式化。缩进风格与引号规则,可配置编辑器。还提供括号自动闭合、多光标边及批量注视切换及缩进引导线等增强 功能与一级语法高亮高亮渲染,依据抽象语法数节点类型精确着色,避免正则表达式方案中常见的 字体串内关键字误着色问题。主题系统支持亮色与暗色模式,并允许导出自定义配色方案。本地静态检查,利用语法术进行基础规则检查,包括未 使用变量标记不可达代码检测及作用域内重复声明问题以波浪线标注于编辑器内,点击可查看说明并跳转。片段与模板管理, 用户可将常用代码块保存为片段绑定触发词后通过 tab 快 速展开项目级模板,用于快速生成组建骨架或模块出,使结构减少重复建入 图表与报告导出调用层次图与依赖关系图可导出位,使量图或位图格式便于嵌入文档。工具还支持生成项目结构、摘要、报告输出、文件统计、符号数量及复杂度分布等 原信息。以上功能共同构成 get nexus 的 完整能力集合,从底层语法感知到上层智能生成,从单文件编辑到跨项目写作工具,严格 格守代码,不离开本地的隐私承诺,未开发者提供了无需后端、不依赖网络的即呈开发环境替代方案。

codex 不 止会写代码了,现在还会点浏览器,可以直接进谷歌浏览器 com 工作,查网页,看后台,填表单,整理数据。很多原来要你手点的事, 它现在都能接上,具体能干什么,可以看下以下三个场景。第一个,整理你登录过的网页信息,它可以进入你 com 里已经登录好的网站,读取页面上的数据,帮你筛选和整理。比如从邮件里找出差报销记录,或者从后台把一场订单归类汇总。 我的看法是,这个登录太是关键,以前你让 ai 帮你做这类事,要么导出数据再粘进去,要么这张 a p i, 现在他直接进你已经登录的页面,省掉了这一步。第二个,多标签页后台并行处理, 他可以同时在多个扩容标签页里后台工作,任务之间互不干扰,也不会卡住你的浏览器。比如同时打开几个系统,分别处理不同的任务,我觉得这个能力被低估了。以前 a 阵操作浏览器分别处理不同的任务,我觉得这个能力被低估了。以前 a 阵操作浏览器就全卡, 现在并行跑,效率差距很明显。第三个,自动判断用什么工具。如果一个任务同时涉及浏览器插件、代码仓库,他会自己判断每一步用什么工具,不需要你指定。比如从网页读数据,处理完再写为代码,他自己串起来。这才是这次更新真正的变化, 它不是一个会点浏览器的脚本,而是一个会自己拆任务选工具的 a 阵边界,从 id 扩到了真实工作流。如果你的 codebox 如果找不到这个插件的话,可以把你 codebox 更新为最新版本, 然后重新退出登录在插件菜单就可以找到 chrome 插件了。我 windows 跟 mac 亲测是没有问题。装完这个插件之后,你还需要安装一个浏览器 codex 插件。完成这两个插件安装之后的你就可以让你的 codex 输入 iphone 进行在浏览器干活。我是 sami, 我 们下期见。

你在上网时使用浏览器时,嗯,比如说某一个网址,它会跟踪用户的信息啊,这个原理是极其简单的。 为什么这么说呢?在开发者,呃,上网时,它可以设置相应的代码,就是我们在写代码的时候可以把这个呃用户跟踪的这个代码去写上去。有些这个网站它会有统计,包括你的这个 设设备啊,定位啊, ip 信息啊,以及从哪个网页进去的啊,或者从什么搜索引擎进去的,都是可以直观的看到的。如果针对于某一个设备进行啊,数据分析的话,也是完全可行的啊, 这是正常表现啊,有些网有些网站他会给你弹窗啊,可以获取用户这个 qq 信息啊,或者是可以他对于他自己的网站进行这个啊人员分析啊,他是可以进行跟踪的。那不法人员啊,在加入相应的这个恶意代码时可以获取用户的历史记录。我记得他有个叫做 技术吧,有个技术他是,可他是,呃,直接可以突破浏览器的限制,可以啊,查看到用户的这个叫做,嗯, 叫什么来着?叫做这个历史浏览记录理论上是不允许的,嗯,因为浏览器做了限制,但是在某些技术的支持下,他是可以获取到这些信息的。那在这里给大家说一点浏览器跟踪用户信息啊,有危害吗?哦, 我认为哈,如果说你在合法途径下使用浏览器啊跟踪或者是网站跟踪的这种啊合法代码的话是可行的,并且 告知给用户通知有通知给用户是合法的。如果说你在不通知用户的情况下,针对于用户啊,这个比如说啊,他加了一个照片啊,照相机的啊,这个开启功能就可以对用户的这个人脸或者是你所处的环境进行拍照,这个是需要用户点击允许的,所以说有些用户他不注意啊, 直接使用了允许的这个啊按钮,那你的这个照片信息也是可以被获取到的,这就是非法途径啊。所以说比如说 gps, gps 的 话,它也是可以获取用户的定位信息的。其实我在之前的视频当中讲解过,关注我每一期会给大家讲解不一样的网络安全知识,提高用户的这个网络安全意识,在这里大家可以去探讨啊。然后我下一期 给你们说明一些情况,感谢大家支持和喜欢。

今天又给大家带来一个从高手那扒过来的工具,做了我使用上的修改。这工具是这样的,在使用外部抠钉的时候呢,经常会遇到一个问题啊,有的时候页面太深了,需要给 ai 反馈说,呃,哪有问题,不太好去描述, 正好看网上有高手写了一个应用,是在浏览器的呃收藏夹里边使用的一个方式,他可以去选择程序页面里边的一个要素,并且把它代码化, 那这样我发现这个东西对于我来说就挺有用了。可是我不太喜欢用浏览器的这个收藏夹,我都是用插件,所以我把它做了点改造, 直接使用 ai 去实现的,实现之后感觉还算可以,并且解决了一个我在用 uni app 开发的时候获取路径的问题。简单给大家展示一下,这是一个 uni app 开发的程序,还没上线,争取早日能给它上线。 在这个里头之前有一个问题,在这个号码组里头编辑的时候,这个删除按钮会被微信的右上角会挡住它,我想改它,但是我又不想去这么一层一层的描述它,我就可以用这个插件 点开它之后,点击这个,它就能提取到这个插件,插件就能提取到这个元素它自己的代码,这个代码我也做了一点格式化, ctrl c 拷贝了之后,我们来看一下,这就是那个代码,而且这个插件它本身还支持着多去一次多取,比如说按住 shift, 它可以连续取多个,这样要给 ai 描述的时候,就可以把这些发给他。当然我现在也觉得 取到的有点多,它里边有一些信息可能是不必要的,所以我也会在后边再去使用的过程中去给它做一些优化, 基本上就是这些插件的来源随便来的,希望大家能喜欢,后边我会再继续分享。朋友说想看一下如何开始 web coding 话题,我后边也会把这个准备一下,那今天就分享就到这,感谢大家。

欢迎观看 hamis agent 加 playright ai 驱动浏览器自动化实战教程!为什么要 ai 驱动浏览器?重复性的操作非常多,耗时费力,让人头疼,人工操作容易出错,效率很低,而且需要七成二十四小时监控,根本无法执手。 整体架构分为双层, ai 决策层,负责分析和规划浏览器控制层由 playwrite 驱动, chromium 浏览器实际执行操作形成闭环, ai 决策执行反馈不断循环环境。准备很简单,确认安装了 node js 十八以上版本,以及 python 三和 playwrite 一行命令,安装 peep 三 install playrite, 然后运行 playrite install 来安装 chromium 浏览器。安装 playrite 非常简单, peep 三 install playrite, 然后 playrite install chromium 来安装浏览器。 国内用户可以使用加速镜像,安装完成后即可使用,无需复杂配置。第一种调用方式是 terminal 命令行模式,适合快速验证命令。 playwrite screenshot url pass, 适合单次操作和测试,快速返回结构化的页面快照。第二种方式是 execute code, 在 python 脚本中内嵌运行, 支持 headless 模式启动。 chromium 支持复杂自动化流程,与 ai 对 话无缝集成,实现智能控制模式。一是 ai 分 析快照决策页面加载后自动提取页面结构和内容, ai 分 析页面语义,然后 ai 决定下一步操作是什么, 循环执行,直到任务完成模式二是多轮对话控制, ai 先规划出一系列操作系列, playwrite 依次执行每一步,每步结果都返回给 ai 判断,适合复杂多步骤的任务模式。三是 ai 自主探索,没有固定流程, ai 根据页面内容自主判断下一步, 每次提取页面后,判断哪个链接值得点击,通过深度控制防止无限循环。实战技巧,语义化提取页面结构,带重视机制的 ai 点击提高稳定性。 每次操作后截图记录状态,拦截无关图片,可以大幅加速页面加载。跨平台连接 windows 浏览器很简单, windows 上开启调试端口九千两百二十二 wsl, 通过 cdp 协议连接,可以附用已登录的浏览器环境操控任意网页应用。总结一下 ai 决策,配合 playright 执行页面状态返回,给 ai 进行下一轮决策。 terminal 命令行模式做快速验证, execute code 模式做复杂自动化任务。感谢观看,欢迎关注交流 ai 自动化技术!

今天又给大家带来一个从高手那扒过来的工具,做了我使用上的修改。那工具是这样的,在使用外部抠钉的时候呢,经常会遇到一个问题啊,有的时候页面太深了,需要给 ai 反馈说,呃,哪有问题,不太好去描述, 正好看网上有高手写了一个应用,是在浏览器的呃,收藏夹里边使用的一个方式,他可以去选择程序页面里边的一个要素,并且把它代码化。 那这样呢,我发现这个东西对于我来说就挺有用了,可是我不太喜欢用浏览器的这个收藏夹,我都是用插件,所以我把它做了点改造,直接使用 ai 去实现的,实现之后 感觉还算可以,并且解决了一个我在用 uni app 开发的时候获取路径的问题。简单给大家展示一下,这是一个 uni app 开发的程序,还没上线,争取早日能给它上线。 在这个里头之前有一个问题,在这个号码组里头编辑的时候,这个删除按钮会被微信的右上角会挡住它,我想改它,但是我又不想去这么一层一层的描述它,我就可以用这个插件, 点开它之后,点击这个,它就能提取到这个插件。对啊,插件就能提取到这个元素它自己的代码。这个代码呢,我也做了一点格式化, ctrl c 拷贝了之后,我们来看一下,这就是那个代码,而且这个插件它本身还支持着多去一次多取,比如说按住 shift, 它可以连续取多个,这样要给 ai 描述的时候,就可以把这些发给他。当然我现在也觉得 渠道的有点多,它里边有一些信息可能是不必要的,所以我也会在后边再去使用的过程中去给它做一些优化, 基本上就是这些插件的来源是一边来的,希望大家能喜欢,后边我会再继续分享。朋友说想看一下如何开始 web 扣顶话题,我后边也会把这个准备一下,那今天就分享就到这,感谢大家。
![[html系列教学]第一期 编写你的第一行代码 [html系列教学]第一期 编写你的第一行代码](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/b992082ae966ad5421c65f90548cff3c~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2094656400&x-signature=b51NwEVragngBwmL3ObLmIofcnY%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=202605210155319FE03F938EE4D51901EC)
你是否好奇过,每天浏览的网页看到的文字、图片布局究竟是怎么被浏览器呈现出来的? 从今天开始,我们将开启一套零基础 html 入门系列教程。没有复杂的理论,没有晦涩的术语,我会用最简单最直观的方式带你从零开始,一步步搞懂网页的核心语言。 不管你是编程小白还是想入门前端,这个系列都能让你轻松学会。现在我们正式开始。 首先我们来回答第一个问题,什么是 html? html 全称是超文本标记语言 hypertext markup language。 我们先拆开看第一个关键词,文本,这里的文本指的是纯文本,意思就是我们可以用任何能编辑纯文本的软件来写 html, 比如电脑自带的记事本, 如果条件允许,现在你就可以在你的电脑当中右键新建文本文档,来创建一个空的记事本。 然后我们双击打开这个记事本,在其中我们输入以下内容,请注意输入的时候记得换行哦。 这样我们就以日记的形式记录下了今天所学的内容。有标题,有日期,有政文,是常见的文章的格式。 那么接下来我们按住键盘上的 ctrl 加 s 保存我们所写的内容,然后关闭这个记事本,观察一下这个记事本文件的名字是什么样子的。 如果只有新建文文本档这几个字,那请跟着我做如下操作,随便找一个文件夹,我们双击打开,在上方点击查看, 在显示隐藏项目里勾选文件扩展名,这样你会看到你的新建文本文档后方多出了个后缀, 右键点击这个文件,找到重命名,我们更改这个后缀,将原来的点 txt 改为点 html, 改完鼠标点击空白处,这时通常会提示更改后缀名可能导致文件不可用,不必理会,我们确认更改即可。然后你就会发现你的文件变为了浏览器的图标, 然后我们双击左键打开这个文件,你就会看到电脑按照网页的模式打开了你刚刚写的日记, 这就是你在 html 学习当中所写下的第一个网页。当然你会发现它依然存在问题,比如标题和正文没有区分,所有的文字都在一行等等。当然修改它们就是我们下节课的内容了。

仅用五百多行代码实现,让大模型控制浏览器的最轻量级 harness ai 浏览器自动化黑码 browser use 今天又开源了一个神级项目, 无需预设,不用框架, ai 看到网页缺什么功能,能自己现场写代码补上。简单说,这是一个能自我修复的浏览器智能体框架。最大的亮点是 ai 遇到不会的操作,可以动态编辑代码库,自己加函数进去。它彻底抛弃了传统浏览器自动化框架的限制,只用一个 web socket 直连 chrome, 给 agent 最大程度的操作自由,作者甚至发起挑战,目前还没找到他完不成的网页任务。他代表 agent 的 一个主流方向,从按照预设指令执行,变成看到问题现场编码解决。


dha 八十七 k 新升级开源项目,一句话, ai 直接接管你的浏览器,还在熬夜写爬虫被反爬,针对手动点网页点到手酸,开一堆标签页找不到重点。 这款 browser use 直接解决 ai 跟真人一样操作网页,点击按钮,百分之九十九反爬都绕得过!还能多标签并行处理,自动抓取结构化数据,效率直接拉满, 自动搜信息,下单找工作,爬数据,写文档转 pdf 全能搞定,开放几行代码就能跑,兼容 gbt 四 cloud 小 白也能轻松上手,从此解放双手,想学的赶紧码住!

大家好,今天再给大家分享一个好用的工具叫 browser honeys, 它是目前 ai 操控浏览器最省 token 的 一种方式,它非常的简洁,只有五百九十二行的 python 代码,然后上线三周已经突破了一万的 star, 呃, token 是 比以前的方式能省很多的 呃,目前我们 ai 操控浏览器一共有五条路径,一个是呃 cloud in chrome, 就是 我们平时用的比较多的一个 cloud 的 插件。然后第二个是 computer use, 就是 相当于你把 cloud 交给了呃的电脑,交给了 cloud, 让它去控制这个整整个电脑,但这种方式非常消耗托管,因为它需要截屏确定位置在哪 啊?第三种是 zenium, 这种是传统的方式我就不说了啊。第四个是 pre write mcp, 这是目前像那个 brother u, 呃,那个 use 啊,用的这个框架, 然后 brothers use 他 们现在开发出的 brother hannis, 这个是 c d p 直连的啊,为 ai 造的工具,这个是我们今天要重点介绍的,就前四个呢,它有各自的局限性。然后第五个就是专门给 ai 量身定做的啊,下面我给大家拆解一下。就是它的呃,架构呢,是 quad code 的 呃, 通过 c i 命令行,然后把这个命令发给了 d m, 然后 d m 再通过 c d p 的 web socket, 然后再到你的框,就就非常的简单简洁。它一共就四个核心文件,目前迭代了几个版本,它的命令的代码还是小于九百行的 啊,非常的非常的少,非常的简洁动,不像那些几万行的比起来还是简洁很多的。而且它是直接附用你的 cookies, 还有登录状态,所以能直接操控你的浏览器 啊,他本身还设计了一个叫自愈架构的,他有个 agent helps 啊,他开箱呢,就是你刚装完是空白的,你的 agent 通过各种各样的浏览器执行之后,碰到了一些问题他会解决,解决完之后他就会记录进去,相当于是一个自我迭代跟循环的。 然后仓库本身呢,就是你下下来之后,他已经有了几十个网站的这个操作的经验,就是你的 agent 用的时候就能直接去读取这些经验, 然后这样你一直用下去,它就有一个啊, feedback, feedback, loop, 然后正反馈的循环啊,就形成一个经验的,就是操作浏览器的一个经验的自动沉淀,因为每个网站的它的这个操作的方式可能有些细微的差别, 你怎么怎么去决策用不用这个软件呢?是,首先要看是这么判断的,首先要看你这个网站有没有专用的 m c p。 呃,你像 github, notion, slake 这些是有直接专用的 m c m c p 的, 就相当于它有 ipad 接口,你就根本就不要碰浏览器,你就去找他们接就好了, 通过那 mini 上去接就好了,这个就浏览器根本就用不着。那如果说你要开浏览器,那传统的现在用的可能多一点的就是 playwrite 的 mcp 啊。然后现在我建议你们大家都转成这个 bardeen, 因为它真的很省头,肯啊,非常的好用。 呃,反正大部分场景下 broderhanys 是 性价比最高的路线。呃,然后我我通过这个方式啊,我封装了一个技能,它这个技能的用处是什么呢?就是我们平时用这个追美版 a p i 不是 很贵吗?然后我用这个浏览器的技能接了呃追美版的订阅版, 就是它通过控制浏览器,然后打开 jimmy 订阅版的 jimmy, 然后输入这个提示词,然后就会自动把这个图片生成了,然后下载到呃项目的文件夹里,就这一套下来,你升图片相当于你就可以把额度用呃 jimmy 的 额度用满,就不用花这个 api 的 投肯了, 从投肯的消耗相比的话,大概比 content 柚子能省很多省省个八八倍左右。 呃,我的分享就到这里,然后我接下来会放一下我用这个呃 opus 四点六,然后控制我命令它,然后去生成图片,它自动调取我的技能 去呃生成那张图片并保存下来的过程。大家有兴趣可以接着往下看一看啊,欢迎大家关注今天我的介绍,先到这里,谢谢大家。

大家好,今天我想跟各位开发的小伙伴分享一个我刚才玩坑的一个真实经历,真的是让我彻底的感受到不同大模型之间的差距,在实际项目里面到底是有多么的离谱。 事情是这样的,我最近在开发一个浏览器插件嘛,就是遇到一个很具体的一个需求,就是,呃,就左左边这里存了一个值, 就这个值的话目前它是存在那个存在一个对象,就是在那个,呃,这个对象就是在这个,这个对象我看一下啊,就这个不光是点实体,实体 storey 的 logo 就 存在这个对象里面,然后存在这个对象里面,它有个特点就是,呃这个值的话,只要你浏览器插件用户不卸载的话,它就一直在,它就是永久保存的,相当于那个,呃,我们前端开发里面用的那个 storey 跟那个属性很像,就是它会永久保存。那我现在有个需求呢,就是 我把这个浏览器我关闭掉了以后呢,就这个值,下次我打开打开浏览器的时候,这个值它马上给我变成一,不管这个值是多少,就是我每次关闭浏览器再打开,然后它这个值给我变成一,我现在是有这样的一个需求,所以我把这个这个我就是分别给了两个模型,就第一个是我是用 open code 的, 用的这个 mini max 的 这个模型, 然后我我为了为了把这个事情讲清楚,然后我害怕他不理解,我还在前面问他要是这个值,问他这个是什么逻辑?好,然后他把这个逻辑给我理理出来了,理出来我看了一下是对的,然后然后呢我就进一步的去问问他这个问题,我问我说呃,这个数据 在下一次打开浏览器的时候,这个数据应该还在吧?就是我告诉他这个数据是永久保存的这个特性,他他这里其实也回回答的挺好,然后我就把这个需求就扔给他了,我说我要把这个浏览器关闭之后再打开,然后把这个值数值化, 就是这里必须要用到这个,要要用到这个这个对象,这个值必须要存到这个对象,因为因为这个值的话他是要被注入到一个页面里面去的,所以这这里不能用其他的对象,然后我告诉他了,然后好他这一顿操作给我下来。第一个 他还这这一轮的话,他是还没有理解这个问题,他问什么时候要读去这个值?他问这个这个问的这些跟我这个其实没什么关系啊, 就是我直接告诉他我这个需求,我就是说要每次关闭浏览器再打开之后,你就就得把这个字给我更新了,然后不能去用其他的对象, 然后他这里他还一直问我,然后我该说你还没理解我意思,然后我说我现在只需要在之前的这个逻辑上增加一个逻辑,就是用户关闭浏览器之后呢再打开,然后把这个字变成一好,他现在又说他理解了,然后你看他给我的这个方案是什么? 他现在是他把这个之前的那个删掉,然后下面就是深圳他给的方案,就是说,呃,他去浏览器里面,他先去,他先去把这个值拿到,拿到之后呢?判断,判断这个值,判断这个值,呃,存不存在?如果不存在的返回一, 这不就是问题吗?这个值你只要只要用户用,用了之后他那个里面存了之后这个值拿出来一定是存在的,所以说你这个逻辑根本就不会走这个逻辑,他,所以他这个永远不会变成一,所以我就觉得 我就觉得他这个逻辑有问题。现在我又给他纠正了一下,我刚说这个值是永久的,就如果当前值是十的话,用户关闭浏览器,下次打开之后仍然是十,我把这问题告诉他了,然后下面给我一针操作啊,你看啊, 然后就是说移除之前的这个逻辑,然后就是从十多页提取真实采集任务开始,是从那个十多页里面提取这个,这个你这个就原原就是完全就偏离了我的那个需求,就是跟你你这样这样实现的话,就是把我之前的需求也改变了, 就整个第一个是完全就是做不到那个效果,第二个呢就就有可能把我之前的一些逻辑就改坏了,所以就是这个 mini max 的 这个模型的一个问题,然后我同样的就做了对比,然后我就直接是我用的这个 cloud, 我 把这个需求我就给他说的很简单,也我也没有做任何铺垫, 我就告诉他就是当前的就是这里面采集了一个值,他会永久保存,然后呢我想的效果呢就是用户关闭浏览器之后 再打开浏览器,这个值变成一,然后我让他先和我讨论啊,好,他现在他是呃,对我的几个方案,就是第一个方案用 c 型十多位记,然后第二个方案呢?就是说呃,记录一个那个时间戳,就是说他在就是把这个这个东西,这个东西的话就是在每每次这个浏览器在启动的时候呢,他把这个值主动设为一, 他这个实现简单。然后第三个方案呢,就是说他在启动的时候存一个 c 型 id, 然后之前他每次的话就去判断这个 c 型 id 一 不一致,如果是不一致他就会去重置这个其实也能实现,这两个方案都能实现。然后第一个方案的话就是就是肯定不行的嘛,就是就是因为不能用,这不能替换成这个 c 型,是对这个是有问题的,这个问题我就具体不讲了。然后 他给我的建议是用方案二,我觉得没问题,然后让他用那个方案一,方案二把这个实现了,下面就是给我实现的, 就这样就是这个对话就很顺畅,所以所以我觉得这个呃大模型之间的差距其实蛮大的,就是他大模型的那个呃 的那个效率会影响我们的那个开发的效率,我觉得就是在开发的时候就是呃条件允许的话尽可能的是去选好的大模型,就是呃不要用这种这种不好的,这种大模型反而会拉低你的效率,我觉得这个呃花钱买大模型的这个买买更好的大模型,这个投资是值得的。

哎呦你要在工程化层面处理好像还真没有啥别的办法,因为他是零散的你只能自己去删。我是来问你个问题的,就是关于工程化相关的问题。嗯呃是这样的。就是金融老版本的浏览器。 呃。金融老版本的浏览器听到吗?嗯能听到了。对就是有什么办法可以做了之后金融老版本浏览器然后研发写代码的时候可以不用去考虑那么多。 哎等一下,刚才我在调这个哎怎么回事啊?可以了,等一下啊。你说兼容老版本浏览器? 对。然后呢?呃就是要怎么做然后可以让研发写代码是不用关注到兼容性的问题,或者说不用过度关注到兼容性的问题。这是谁这是? 呃还有其实我再细划一下这个问题嘛其实还有背包它可以翻译,它是可以兼容语法问题的。呃但是它是基于扣住 s 然后扣住 s 是 兼容 ecm a screen 的 那个标。哦哦哦你说 gs 是 吧?哦那就是背包。 呃然后还有个问题就是最近遇到的。呃我举个例子就是问你一个有点带坑的,这个呢就是如果你用 voe 你 用了 voe 的 use xil 那 个方法然后这个时候你什么都没考虑,你用了这个方法,呃有一个 use 一个 sale, 呃。又是那个 a x s i o x l x l 不知道是不是这么读。啥玩意? a x s i o 一个全球酷。你在说啥?现在我们聊到又是 excel 了。然后呢?不是 excel 哦是 excel 是 吧? excel 啊啊啊。对,然后说 它有个 u 十 x 的 这个酷 vivo u 十零六九啊。对,然后如果你用了这个酷它就会有坑。但是其实我是想问你啊,我是想问你,你用这个酷,你,你会考虑什么吗?然后我就,我都不知道我没用过这个酷,这个酷干嘛的?你给我解释一下。 呃,它的底层用了一个叫做 a bot controller 的 a p i 啊,里边有,然后那个 a p i 是 有兼容性问题的,哎,不对啊。哦,没事没事没事没事。哦,它底层是用这个,然后这个方法有兼容性问题。嗯,然后回到了上面的问题,就是,呃,它没有背包自动 polifil, 但是它有 polifil 的 实现, 嗯,就是地图上面有一个叫做 aboard controller polyfoil 的 一个库有这个实现。嗯,呃。然后我们呢?研发,呃,至少三到五次,就是不是同个部门的,嗯,我知道他们遇到了这个坑,然后我就在想这个问题有什么办法?从功能化手段来说,做了一个项目给别人用,然后我们研发用的时候, 他能够不用把这个问题带到线上,他现在是带到问题到线上去了。我靠,你要在工程化这个层面解决,嗯,要不然流水线这个层面解决呢?啊?可以把一图一措施做好啊。 很难。就是首先他里面实在是很多坑。我再跟你讲一下。呃,第一版本,比如说六十二版本他跑过了,那我就这么说吧,那你的问题可以转换成另外的问题,如何发布一个程序保证线上没有 bug? 我 能不能这样理解?呃,那这个问题就更大了。这个,那不是一样的问题吗? 那也不用大到这种程度,那就有点像那个背包一样嘛。就比如说你用了可选链,或者说 promise or settle 这种高级 a p r, 它就能自动帮你去转,就是它可以在跟前面的方式去帮你解决,就不用你说测出来它有问题再去加,对吧?就我是想做到这个层面,哪里只能这么做? 你在打包的时候他不是有个分析一代吗?对不对?嗯,那你就要把第三方的一代要加上去,第三方库的东西要加上去。如果说一般来说我们打包的话都不会加入第三方库的,就是分析,因为第三方库我们都默认他已经处理完了,但是你这个如果说兼容老版本浏览器的话,可能第三方库里要做一个检查。 呃,这这个步骤都还可以。前置在安装包的时候,安装包的时候它可能不行。它是这样的,它有个 bros 历史,就是你的这个项目要兼容到哪个浏览器。嗯,它是动态的,就是如果我兼容的很新。哦,明白明白明白明白。那就不行, 那只能在打包的时候,打包的时候处理。哎,你刚才说的是 coregs 里面是没有这个东西的, polly 的 标准,它不属于语言的提案的一部分, 所以他就不会去做这个。明白,他的兼容。哦哦,明白,他是兼容语言层面的,他不是兼容 web api 层面的。对,这个他把这个当成 web 的。 那 web api 层面有没有那个类似的库呢?应该有吧。 呃,我就是找不到。然后这个东西他是自己写了个 public file, 很多很多东西,像那个 over server, 他 也自己写了 public file, 这是浏览器的库里有没有相关的插件可以去做 web api 层面的一个兼容处理的。 pos 是 c s s, 不是 处理 c s s 的。 呃,北风啊,北风它我其实还调研了一下。呃,有一个叫做 es link compete, 就是, 呃, es link 的 兼容插件,它能帮你检查到你用的这个版本不兼容,就比如说你用了这个 pos, 它就会红线告诉你这个东西在某某版本之后才兼容,然后你现在要兼容的是什么?什么浏览器版本。但这个方案还有个问题,就是, 呃,依赖他检查不到 es 键,不可能检查 node 下的东西吗?呃,对对对,你得让他检查呀,你只能让他检查,因为你要第三方库里边有那个问题咋办呢?或者在打包的时候让他自动处理。我想想啊,他给我回复的是个 qgs, 但是 qgs 他 只检查那个 es 的 语法呀, es 层面的,但是它本身未被 a p i 层面的呀。 你问,哎呀,你说他兼容不了 autoconture 了?我之前也问过,哎呀,然后你一问他了,他就告诉你原因了,你不问他,他就说靠嘴,还怎么做?他给的哦,他得一个一个去整啊。对,他给的方案就是一个一个整,但这样的话你就要求研发,他有这种意识,然后刚刚我说的是工程化嘛, 研发他不需要有这种意识嘛。哎呦,那确实有点麻烦啊,我觉得这个他属于整个业界都有这个问题,那整个业界怎么没有一个贵啊? 哎呦,我说这确实麻烦,要不然就自己手动的去做。哎呦,这手动做有点麻烦啊,那还要去收集多少东西啊?嗯,还要做按需加载,要把所有东西全部要收集齐,还要做按需加载,还要动态去判断那个 browser list 那个倒是还好,因为他这个看又是那边他有相关的 a p i。 对, 那是现成的,就判断浏览器兼容。呃,这个倒还好,我要知道去收集这个挺麻烦啊。呃,收集的话那个 es 令他也帮你收集了,就 es 令的 kanp 发给我想想为啥为啥不应该是这种情况。我想想为啥会出现这种现象。外部 ip 到底问题存在哪儿? 我想想啊。 vivo api 的 降级。 vivo api 啊,确实是啊,问题是好多 vivo api 根本就降不了级咋整?比如说发现我 api 他 降不了级咋整?降不了级没关系,你告诉我,就你更简单,你抛出告诉我,我能明确的知道风险。我自己在业务处做降级也可以。 他是带到现在,然后报了一个 ndi, 然后 ctrl, 然后这种报错,然后页面摆平了肯定就不行。 哎呦,你要在工程化层面处理好像还真没有啥别的办法,因为他是零散的,你只能自己去删。就是把一些库全部集合在一起去形成个大包。我收集数据我觉得都还好,但是我不知道怎么集成进去。比如说我自己做个背包插件吗?嗯,对,自己要去写个背包插件。嗯, 我看看啊,这几天背包插电其实好像检查也很不知道,然后背包还得那个啊,你首先要开启背包第三方库的检查。嗯,打包的时候他一旦有,比如说第三方库吗要开启这个检查,首先这个打包速度就会很慢。这个特性呢,你可以在生态环境下起用,开发环境下禁用。 嗯,这样子的话会稍微好一点。但是呢,这个问题就被拖后了,延后了就可能会以新新库开发完了发现有些根本就不能用。嗯, 要么就听规范,就是你安装了新的库过后就使用了新的库过后再打包一次看一下他们识别不出来,像那个 vuv 是 大家就觉得他这个库可能不是,你只能在生产环境看,你看下背包来打包的时候,他肯定是在生产环境里边可以参与嘛,对不对?他参与的时候那个生产环境的配置他必须要去配置好,就是要让他能够去 检查那个第三方库,就 note 猫就是里面的东西要让他检查,那么他这样子检查的时候,他不是要经过那些插件吗?对不对?就会经过你自己写的插件。嗯,那么在你自己写的插件里边。哎呀,背包那个是怎么写插件的?我忘了,你知道吧?你在里边你要去检查有没有就是相关的这个东西,我看他下面按需要的是不错的 破例法 i o。 那 个我也知道,这个也是我们想过的,破例法 i o 也不行,而且破例法 i o 已经去啃了,他被投毒了啊。没事没事,现在你自己去不需要他了,你去查一下那个背包的插件里边,你肯定是可以拿到一个抽象语法素的吧,这个你是可以拿到的,你知道如果说要狠一点的话,就是从抽象语法素里面去检查, 但是呢,我觉得应该不至于那么狠吧,应该是有一些现成的工具可以让你去配置一些特性,你检查到某些特性的时候,然后去调用相关的库来进行 引入,就引入相关的库到打包结果里边去,就是流程应该是这样子的,就是生产打包,生产打包的话那么它会加入 lodem, 就是 检查啊,就这个东西要加入进去,那么在打包的时候它不是有一代关系吗?每个一代关系的都有个图吗?这个图里边不是有那个加入了个 paper 吗? 啊?经过背薄,背薄的话还要经过你的插件,插件的话你就可以拿到抽象语法数,那么你要去找一下有没有一个现成的工具可以进行特征配置,就是我可以配置一下里边有哪些哪些特征,然后配置好了过后你就要去引入某个建筑,如果说有这个工具的话就现成的,那还好解些,没有现成的话你要自己去搜索啊,搜索特征可以自己去整个配置文件嘛? 啊?就是 gs 配置文件,就是这么说有个 gs 配置文件,呃,比方说,呃,这里边有一个飞曲儿,就是 那个叫啥呀?特征就是个速组啊,这个速组里边他要经过一段函数的检查,速组里边一个就是一个函数,这个函数呢?他会接受一个抽象语法术,然后呢返回的是什么呢? 如果说返回 love 的 话,或者是 on d 范的话,就不用做任何处理。如果说返回的是有一个对象,对象的话,那么对象里边他就可以可以规定啊,这个要秉入什么库?怎么去引入啊?就是一段脚本 啊,这个对象里面包含一段脚本,那么到时候如果说他返回了对象的话,你去执行那段脚本,就可以把相关这个特征的问题处理掉了,就是一个一个的函数这样去处理,那么这个 st 拿到过后,你去调特征库找一个特征 啊。我是这么想的,你看一下,应该是有一个现成的工具啊。嗯,现成工具,看能不能能够简化一下这里的流程啊。特征完了过后就是搜索特征库吗?搜索特征库处理那基本上就完事了。嗯 啊,然后这边可以多传点参数啊,比方说现在那个看 u s 的 一些接口啊,你可以把这些东西封装好传进来吧,边边搜索嘛。嗯,我其实想的可能也只有这种方法。我自己想到的是这个方法。对,你他如果说没现成的话,那只能这么去弄了,也去收集收集。嗯,咋弄? 那没有其他问题了,就是这个问题。嗯嗯,好,行,那下去了。哎,好,拜拜。嗯,拜拜。

就是我们实现的方法非常的简单,我们就用 vs code, vs code 有 很多,有很多插件,比如说我们首先有个插件叫 rocode, 然后我们现在用的 coplay 了, coplay 了里面呢它有一个叫远程,远程开发,还有个方法是什么呢?不用电脑安装,我们可以做一个网页版本 vs code 的, 我们是做了一个网页版本的 code server, 不知道大家有没有注意到有个这样的插件,通过这个插件的话呢,你可以有一个网页版本的 vs code 的, 而且这个网页版本的 vs code 呢,它是有一个 coopilot 的 一个插件的,也就是你可以通过这个 icloud 这边本身带有的这个网页版的 code server 来实现一些 ai 的 编程。

ai 写 ios 代码全靠瞎猜,这工具让他真的看见模拟器 serve sim。 一个开源小工具,直接把 ios 模拟器画面实时串流到浏览器,专门给 cloud cursor, codex 这些 ai 编码工具用。作者来头不小, ellen beckon export 框架核心开发者, react native 圈的人都认识他,他怎么干的?一个 swift 小 程序,通过 simcloud 抓模拟器画面六十帧每秒, mgpeg 推流到浏览器 web socket, 把你的鼠标键盘操作回传到模拟器, 手势拖放,图片视频网址同步转发,全都支持。最关键的是,不用装 xcode 插件, app 里也不用加任何代码, 模拟器一启动,直接 enpx serve sim 一 行命令搞定浏览器,打开 local host, 三二零零就能用。支持 iphone, ipad, apple watch 全套也能同时挂多个模拟器, 部署也灵活。本地用局域网,用隧道到远程 mac 上,让 ai 远程操控都行。还能当中间键直接塞进 metro white nex js 这些 dev server 里,跟现有开发流程无缝衔接。以后 cloud cursor 调试 ios 不 用再瞎猜了,能看到屏幕能按按钮, ai 真正变成了你的远程结队程序员。