粉丝3069获赞7783


哈喽大家好,最近 h 浏览器升级了,升级完以后发现浏览器的右侧边栏缺少了 ai 撰写和聊天功能,甚至直接找不到右侧边栏,接下来我们来介绍如何快速找回浏览器边栏, 同时找回 ai 撰写和聊天功能。大家可以先点赞关注,避免后续找不到本视频。接下来我们来进行操作。首先我们在浏览器地址栏里输入 h 的设置命令, 这样就可以快速打开 h 浏览器的设置页面。在浏览器输入视频中的内容后,使用回车键就可以打开 h 边栏的设置。接着我们可以看到上面可以有 一个始终显示边栏的按钮,我们将这个按钮进行打勾,打勾以后我们发现右侧边栏已经出来了,接着我们打开下面特定语应用的设置 discover, 我们点击 discover 就可以将显示发现进行勾选, 勾选完毕,我们可以看到右侧右上角会出现 b 的图标,这个呢就是快速打开边栏的按钮, 这个时候还没有出来我们想要的 ai 撰写和 ai 聊天功能,这个在之前的视频也有介绍过,是因为我们地区 目前是无法使用的该功能,所以微软会默认进行地区重定向到当前,这时我们需要在设置里面进行修改操作。 当我们打开微软冰主页的时候,如果发现主页显示国内版和国际版,这时就说明微软已经将国家和地区进行了重新设置,我们需要点击菜单进行地区设置,点击右上角的三条杠的设置按钮, 然后打开设置,点击设置里面的国家地区,我们选择 美过就可以了,选择以后右侧边栏是无法 立即刷新出来 ai 撰写和 ai 聊天,这时我们需要稍作等待并多次尝试刷新浏览器, 大约需要五到十秒的时间,我们同 同时可以打开新的浏览器标签,等待右侧发现进行刷新,变成新的 ai 撰写和 ai 聊天。等待时间到了之后,我们发现右侧边栏已经打开了 ai 聊天和撰写功能。 本期视频就到这里,感谢大家在使用过程中有任何问题可以在评论区留言,我会给大家一一答复。

cloud code 最新版现在已经原生支持调用 chrome 浏览器了,我们只需要将 cloud code 升级到最新版本,然后在 cloud code 中使用斜杠命令加上 chrome, 就 可以进入 chrome 浏览器的设置。 在是否默认起用这里我这里设为了起用,而且这里还可以管理权限,点击之后这里就会自动打开浏览器,并且在这个扩展这里我们就可以设置权限。如果大家没有安装扩展的话,到这一步应该会提示安装扩展,大家只需要按照它的提示安装扩展就可以。 当这些设置好之后,大家就可以在 cloud code 中原声调用 chrome 浏览器。在之前的视频中,我为大家演示过 chrome devtools 在 chrome code 中以及在 codex 中的使用,用来实现浏览器自动化以及 ui 调试。 但是 chrome devtools 为了安全,它打开的浏览器是一个新的实力,当我们需要执行浏览器自动化任务的时候,我们就需要重新登录所有的账号,像这样的话就非常麻烦,而且非常浪费时间。 但 cloud code 它原生支持的 chrome 浏览器调用它打开了浏览器就保存了我们日常使用的一切信息,包括账号登录状态以及浏览记录,还有 chrome 的 扩展插件等功能。 所以我们在 cloud code 中直接调用 chrome, 既适合 ui 验证,也适合端到端的自动化。而且它支持多种交互操作,包括点击输入,表单填写, 还有多标签管理,还可以对标签进行分组管理,而且它可以读取 cancel logs 还有 network requests, 并且可以结合盗墓状态来定位 ui 以及逻辑问题。好,本期视频将为大家深度测试 cloud code 调用 com 浏览器 完成自动化任务、 u i 调试任务以及 api 接口自动化测试等任务。下面我们可以先用一个最简单的任务进行测试,我这里直接输入任务,让它打开我的簿刻,点击进入第一篇簿刻,并将它改写为一篇 x post, 然后发布到我的 x 账号, 我们直接运行,先测试一下它最简单的浏览器自动化能力。好,可以看到这里它自动打开了我的簿刻, 然后它自动点击了我博客的第一篇文章,然后我们回到终端,就可以看到这里它正在执行这个任务,现在已经阅读完了博客文章,正在改写帖子。然后这里它需要申请权限,我们直接给它权限,然后它就自动打开了 x 平台。 好,可以看到它自动点击了发布, 这样的话这篇 x post 就 发布成功。整个过程不需要我们重新登录 x 账号,因为它会自动调用我们日常使用的 chrome 浏览器的配置。我们再测试一下 cloud code, 调用 chrome 浏览器 实现信息搜索,并且将搜索到的信息填写到谷歌的表格中,我们看一下他能否准确操作谷歌表格。这里我们输入提示词,使用奎姆搜索特斯拉近七天的股票信息,并且打开谷歌表格,将内容填入到表格中,我们直接运行 自动打开了谷歌浏览器,然后这里需要我们授权给他。好,可以看到他打开了谷歌,并且搜索了特斯拉的股价相关的内容。 好,这里他进入了雅虎 finance。 好, 可以看到他能准确点击并且复制相关内容。 好,可以看到他提取了特斯拉七天的股票数据,现在他打开了谷歌表格,我们看一下他能否将这些数据准确的填入谷歌表格中。 好,可以看到他在第一个单元格中输入了日期,然后定位到了第二个单元格。好,现在又在第三个单元格中输入了内容,现在这个表格的表头已经输入好了,然后这里提示他开始点击第二个单元格,开始输入数据。 好,这里他填完了十二月十八号的数据,现在在填十七号的数据 好,这里提示所有数据已经输出完成,这里我们就看到了它填入的特斯拉股价相关的信息,而且整个过程都是由它自动化完成。这样看来这个效果还是非常不错的,因为它能对这些非常复杂的表格进行精细化操作, 通过测试可以发现它的浏览器自动化能力还是非常强大的。好,刚才我们测试的是浏览器自动化任务,下面我们还可以测试一下让 cloud code 调用 chrome 实现 ui 调试。我们可以先在 cloud code 中让它为我们开发一个 react 组建。 我们可以先看一下这个提示词,让它使用叉款 ui 创建一个语言学习的 react 组建。这里是技术站 里,是页面结构,还有核心功能,还有设计要求,包括主题字体等,还有响应要求,以及数据结构,还有交互细节,还有性能。在最后这里我们让它创建一个完整的可交互的应用原型,要求任务完成之后,使用 crm 自动测试所有功能是否正常。 然后我们完整地粘贴这个提示词发送给 cloud code, 让它为我们开发这个 react。 组建,并且自动调用 chrome 浏览器进行测试,这是它生成的开发任务。最后一个任务就是在 chrome 浏览器中进行测试。 好,为了节省时间,开发步骤这里就略过,我们直接跳到它打开 chrome 浏览器的步骤。 five minutes later。 好,这里他已经完成了开发,现在正在安装依赖,这里他需要我们授权他权限,现在他就自动打开了浏览器,我们看一下他能否自动点击页面上的这些内容,对页面进行测试。 好,可以看到他自动点击了单词卡片,单词卡片翻转之后,这个单词出现了镜像翻转,我们看一下他是否会修复这样的问题。 好,这里他提示他看到卡片翻转有一些 css 效果的问题,他需要修复这个问题,这样的话,他就通过调用浏览器自动点击发现了这些问题。好,现在他正在测试练习页面。 好,他还选择了一个正确的答案。这里点击了进度。好,可以看到这里他输出答题反馈功能完美。好,这里提示进度页面非常漂亮。他继续测试设置页面。好,这里他提示页面显示空白,他需要检查控制台是否有错误, 然后这里他发现了这个错误,他正在修复这个错误。好,这里提示修复完成,他刷新页面, 可以看到他现在点击了设置。好,这里他提示设置页面所有功能都正常,他现在需要修复首页单词卡片翻转的问题,他需要创建一个简单可靠的翻转实线,替换当前的三 d 动画。 好,现在他又切换到了首页,然后我们看一下这次单词卡片的翻转是否修复好, 可以看到它自动点击了单词卡片,这次单词卡片翻转就正常,就显示了单词的中文翻译好,这里提示单词卡片翻转效果现在完美工作, 并且提示所有功能都测试通过,然后这里就输出了已经完成的这些功能。这样的话,我们没有经过任何干预, cloud code 就 调用 chrome 浏览器实现了自动开发,自动测试,并且发现了单词卡片翻转出现了问题,然后 cloud code 进行了自动修复, 可以发现整个步骤非常流畅,完全由 cloud code 全自动完成。刚才我们测试的是在 cloud code 中调试前端 ui 项目,下面我们还可以测试一下用 cloud code 调用 chrome 对 api 进行测试。 我们可以先看一下我准备的这个开发任务的提示词,让它创建一个 node js 加 express 的 代办事项, api 包含 get 请求获取所有代办事项, post 请求创办代办事项,还有 put 与 delete, 并且集成 swag ui express 自动生成 api 文档。 启动服务后,在 com 中进行下面的操作,并且将测试结果汇总,如果测试过程发现 bug, 直接修复并且验证。 然后我们回到 cloud code, 直接粘贴刚才的提示词,直接运行。像这样的话,我们使用 cloud code 调用 chrome 对 api 进行测试,在一定程度上甚至可以取代 postman。 这里它生成了开发任务,这里我们要稍等一下。 five minutes later 可以看到这里他开始对 api 进行测试,然后这里提示 get 端点已展开,他将点击这个按钮,这里提示点击 execute 执行 get 请求,并且提示需要滚动查看响应,这里他又重新点击了 execute 按钮, 好,这里提示 get 请求。测试成功,返回了两个代办事项,现在它需要测试 post 的 端点,创建新的代办事项。这里点击了 post 进行展开,然后这里提示它需要使用 find 工具定位 post 按钮 好,可以看到他将 post 进行了展开,这里提示他需要点击这个按钮,这里提示 post 的 成功,他创建了代办事项,现在他需要继续测试 put 还有 delete, 然后这里提示 put 和 delete 都创建成功, 这里提示他需要在 swag ui 中执行一个请求来捕获网络请求,这个任务执行完成,这里是生成的测试结果汇总报告, 包括 api 端点测试结果,这些端点都测试成功,而且这里还有响应时间,这里就是错误处理测试。下面这里就是 network 面板验证, 这里给出了总结,所有测试都通过,没有 bug, 发现 api 功能完整,错误处理,正确响应时间均在毫秒级。这样的话就在 cloud code 中自动调用 chrome 浏览器完成了 api 的 测试, 而且整个过程全部都是由 cloud code 自动完成的,不需要我们进行任何干预。通过我们在 cloud code 中调用 chrome 浏览器测试浏览器自动化以及前端 ui 调试,还有后端 api 的 测试,可以发现在 cloud code 中调用 chrome 浏览器效果非常不错, 它们全自动为我们完成各种复杂的任务。 cloud code 有 了 chrome 浏览器的加持,就变得越来越实用,越来越强大了。

手把手带你看看 comet 这款 ai 浏览器为啥这么火,简单来说,它不仅是一个浏览器,还是一个会思考,会动手的 ai 助理。 ok, 首先我们在 publicist 官网可以下载 comet 浏览器,安装好之后就是这样一个界面,中间这个输入框以及上面这个输入框 都可以用来提问或者搜索。那么下面这三个按钮分别是搜索、研究以及实验室。呃,普通人用的话,我觉得搜索这个就够用了, 也是免费使用的。研究这里普通用户每天只有三次的额度,实验室这个功能是需要会员才可以使用。后面两个其实就是基于更多的搜索来源,呃,给你提供更加深入的研究报告。 ok, 右侧呢,可以设置搜索来源,选择模型以及语音输入等等。模型这里呢也是集成了呃,目前最强大的模型,像 g p t、 五点二、 cloud、 jamaica、 crook 这些都有,那么它会自动选择一个最佳的模型。那么左侧边栏这块呢,这个图书馆相当于是一个历史记录 发现页,就是当前那些热点新闻之类的。这个空间呢,你可以把它理解成是不同的主题,这里可以创建一个新的空间,起个名字,比如说 ai 相关。 ok, 你 就可以在这里添加相关的文件链接等等。之后呢就可以在这个主题当中去专门用来搜索这个主题相关的内容。后面几项其实就是系统设定的一些主题,比如财务啊,学术主题啊及 旅行、购物、运动等等。那么以上呢,都是它的基本功能,它最厉害的点其实是它这个右上角的 assistant, 点击它,你就可以随时召唤出你的 ai 助理,可以让它总结网页内容,截屏提问, 总结视频内容等等。厉害的是,它不仅可以回答你当前页面的问题,还可以基于你打开的所有的标签作为上下文来回答问题。比如你问他帮我总结现在打开的三条视频的共同点, 看,他已经查到了我目前正打开的这三个标签,并且给我分析出来了共同点。其实这些都不算什么,我觉得他最厉害的点在于他可以通过你的指令直接控制你的浏览器。比如我最近想在 twitter 上关注呃,国外的 ai 内容,那我不需要一个一个去搜相关的博主,我只需要告诉他帮我找到十个 ai 领域相关的 知识分享博主,并关注他们。 ok, 当你看到界面变成这种蓝色的时候,他就已经接管了这个网页,看他在一个一个的去输入这些博主的名字,然后搜索他们。 经过一通的操作,他已经成功的帮我找到并且关注了十个 ai 领域的知识分享博主。这是十个列表就非常神奇。那根据这个案例呢,我们就可以让他帮我们做很多事情,比如我们可以让他从京东帮我们找到吃火锅的所有食材,并加载到购物车,比如让他选出 tiktok 上本周卖的最好的母婴产品等 等等,这些需要我们动手去做的重复劳动都可以让他去做。看到这,你是不是已经迫不及待的想把传统浏览器卸载掉,但是你又舍不得你收藏的书签?最后我教你一键转移书签的方法哈,打开你之前的浏览器,选择文件, 导出书签,把它存储到本地,然后在新的浏览器中打开最上面的书签管理器,点击这三个点,导入书签,选择之前的文件,这样就可以无痛使用新的浏览器了。 ok, 因为它是国外的产品嘛,需要魔法。那么下期我会手把手教你国产平替产品的使用方法。我是普通人的 ai 学习向导,关注我们一起学 ai。

很多使用 win 十或者是 win 十一的朋友都在使用微软自带的 a 的浏览器,那么使用 a 的浏览器的时候,有朋友发现他的 a 的浏览器不像我现在这样打开是 a 的浏览器默认的首页, 而是一些其他的首页,比如说百度三六零或者是二三四五等,那么我们怎么把它恢复成微软默认的首页呢?那么首先我们点击 a 的浏览器的右上角的三个点,点击设置,点击 左侧的开始主页新建标签页,我们在这个位置可以看一下默认的选项是哪一个,那么比如选的是打开以下的页面,那么我们 可以选择打开新标签页,或者把打开以下的页面里面的网页地址给他删除掉,删除掉之后他默认就是打开新标签页这个选项, 那么重启浏览器如果还不行,那么我们可以看到左下角有一个重置设置,那么我们点击重置设置,点击将设置还原为其默认值,点击重置,那么提示设置已重置,那么我们关掉位置浏览器再打开, 那么一般我们的首页就被初始化,就恢复成默认的状态了,那么如果这种情况还不行的话,那么还有另外一种可能性,就是我们的电脑上安装了三六零电脑管家等其他的一些安全软件,把我们的首页给锁定了。下面我们 以电脑安装了三六零安全卫士为例,给大家看一下如何来更改首页。当我们的电脑安装了这些安全软件之后,我们再去打开 a 子浏览器的时候,我们就会发现 浏览器的首页变成了我们安全软件的导航,那么我们怎么来把它取消呢?我们双击打开安全卫视,找到网络安全,它这里面有一个主页防护,那么点开主页防护,我们可以看到,那么这里啊一被子上的浏览器 的主页都已经被锁定为三六零安全网址导航,那么我们点击后面的解锁,把这种首页的防护给他解锁掉,然后退出三六零安全卫视,那么我们再重新 打开 a 制浏览器,那么我们就会发现 a 制浏览器自带的主页就回来了。那么还有一种可能是我们的电脑中了一些病毒木马首页被篡改了, 但是这些木马病毒的广告程序我们自己手动又很难关掉,这样的话我们可以借助安全卫士等安全软件 查查一下病毒,查查完病毒后,我们再通过刚才视频中讲到的浏览器的重置等把首页给恢复一下。好了,今天的视频就到这里,谢谢大家。

curser 在 v 二点零就上线了 browser automation 功能,可以实现浏览器自动化操作。但如果你不是 curser 订阅用户,想在 cloud code codex 或 tray 这类工具中实现浏览器自动化操作,最便捷的方法就是借助 m c p。 市面上的浏览器自动化 m c p 其实很多,有的说官方的 chrome dev tools m c p 颠覆浏览器自动化,有的说 chrome c p 才是 web 开发必备,也有人说 play right m c p 才是自动化之王。 为了搞清楚谁才是真正的浏览器驾驭者,我把市面上主流的五款 mcp 工具 chrome dev tools、 playrite、 chrome mcp 等做了一次深度的横向测评。 hello 各位精神股东们,我是菜菜,今天主要通过四个回合和大家分享这次浏览器自动化 mcp 的 横向测评结果。 首先是劝退环节,配置复杂度。 chrome cp、 browser mcp 以及 browser tools mcp, 这三款 mcp 都需要配合浏览器插件使用。其中 chrome mcp 如果采用 standard i o 的 连接方式,还要手动配置路径,说实话,对于只想快速上手的人来说有点折腾。相比之下, chrome devtools mcp 和 playwrite mcp 的 配置就舒服多了, 只需要将相应的 mcp 配置文件粘贴到 mcp 点 jason 文件中保存即可生效,你甚至可以让 ai 直接帮忙安装配置,一步到位。这一回合, chrome devtools mcp 和 playwrite mcp 领先。 相比使用门槛,大家可能更关心他们谁干活更利索。如果你平时只在 chrome 浏览器测试,那么这几款 m c p 的 基础能力,点击输入滚动截图其实都差不多,只是在一些具体拓字的功能上可能有细微差别。 比如 chrome devtools mcp 和 playwrite mcp 在 自动化中支持文件上传和对话框处理, chrome mcp 则是支持书签的查找、添加和删除。但如果你是做跨浏览器测试的,需要同时跑 chrome、 firefox 和 safari, 那 playwrite mcp 是 唯一的选择,它的多浏览器支持确实最强。 不过需要注意的是, playrite mcp 是 默认不保持浏览器登录状态的。如果你想要实现保持登录状态,一般需要经过额外的配置,比如修改 user data 的 地址,或者借助专门的浏览器插件。对非技术人员来说,这又是个比较高的门槛。 这么一对比,默认支持登录状态保持的 chrome devtools mcp 和 chrome mcp 明显更香。你想想,你让 ai 去爬个需要登录的后台,就不用担心它动不动就跳回登录页,这对日常使用来说太关键了。 所以在这一回合, chrome devtools mcp、 playwrite mcp 和 chrome mcp 各有胜负手, 如果只比点击和截图,那只是入门浏览器自动化 mcp 真正的分水岭在于深度调试能力。大家继续看这张表,在视觉与环境模拟和性能分析这两栏, chrome devtools mcp 简直是降维打击。 其他工具大多只能做外层交互,但 chrome devtools mcp 继承了 chrome 开发者工具的灵魂。那相比其他工具, chrome devtools mcp 能做哪些不一样的事情呢? emulates network, 让 ai 模拟弱网环境,测试你的网页。 emulates cpu 模拟低性能手机的加载速度,最绝的是 performance start trace, 它能直接生成性能追踪报告, 帮你分析页面哪里卡顿。这已经不是简单的浏览器自动化助手了,它相当于给你配了一个 ai 性能优化工程师,这是其他几个 m c p 目前做不到的。即使是支持各种审计 tools 的 browser tools m c p, 它也只是帮你看页面性能,而不会帮你分析页面性能并定位问题。这一回合, chrome devtools m c p 完胜。 最后一回合可能是大家比较感兴趣的 tokens 消耗情况,主要在 client 中做了两个任务对比,一个是文章内容抓取, chrome devtools mcp 的 token 消耗相较其他 mcp 更大。 注意, browser tools mcp 不 支持文章内容抓取,另一个是获取 console 信息。在这轮任务中, browser mcp 和 playwrite mcp 的 token 消耗最大, browser tools mcp 则是获取失败。我个人觉得使用 mcp 的 token 消耗更多取决于模型对 tools 调用的智能程度。另外,建议后续模型的上下文窗口会越来越大, 集越来越多,模型量大管饱。我反而觉得 m c p 的 token 消耗在未来不会是什么大问题。比如这两个任务,我都是用的国产模型去跑的,不会很心疼。从这个角度去看待这一回合的对比,我更倾向所有工具打平, 每个 m c p 都有其独特的优势和适用场景,选择哪个 m c p 主要取决于你的具体需求、团队技能水平和项目复杂度。如果你只是做一些简单快速的自动化任务,那么轻量的 chrome m c p 更适合你入门。 如果你是硬核的 qa 团队,必须要跑全浏览器兼容测试,那么首选 playwrite mcp。 但如果你是前端开发数据分析师,或者只想让 ai 在 chrome 里最高效的干活调试代码分析性能稳定抓取,那么 chrome devtools mcp 是 目前综合体验最好,能力最深的选择。 测评表格我待会会放在评论区,大家可以自己下载查看。如果你觉得这期视频对你有帮助,可以一键三连,我们下期见。

兄弟们,这个是最强的浏览器的内置 ai 文件和文档的处理工具,它可以算是二零二五年研究者和学生的终极阅读神器。它是一个完全浏览器扩展的 ai 助手,不需要安装复杂的软件,零配置就开始用那支持文件的识别,像 pdf 文档批量翻译都是可以的, 智能阅读和分析都可以,然后完全本地化,隐私也没有问题。比如说你打开一个论文的网页,然后或者是 pdf, 它直接给你话池,再加上全选 ai, 秒级翻译,总结问答都有,全程不需要离开浏览器,有需要的可以关注试一下。