粉丝9924获赞4.0万

有几个伙伴在私信我问我说如何让 qq 的 任务自己去执行,不需要再去手动确认,比如执行命令的时候都会去跳出来让你去手动确认,就非常麻烦,这是一个,还有一个就是说 我们的任务是不是需要自己手动一个个点,这个是的,但是有一点啊,你手动点完之后他自己会去排队,点过执行的下面他会自己去排队,就是你可以去设置里面让对应的命令不需要在你确认。 左下角有一个设置设置这边有一个 settings, 点完之后搜上面搜索一个 trust t r u s t 搜完之后出来第一个,比如说你配的信号,搜你的 agent, 在 写代码的时候,他都不会去跳出来,让你确认 这个命令是否需要执行。还有一个就是右下角这边 autopilot 给他打开,这样勾选完之后呢,他就会自己去执行命令,他也不会跳出来让你确认,全程其实已经算是一个自动挡的。

不是蝌蚪用不起啊,而是 kiro 更具性价比,这款亚马逊推出的 kiro 开发工具比蝌蚪还香,免费用上最强大脑筋。 cloud 四点五兼容,分为编程规范、 s、 d、 d 编程,很多都不知道的六个 kiro 高级用法,掌握多一个就能帮你快速拉开和普通程序员的差距。第一个信任命令, 这是最提现的设置啊,比如我不想每个命令都手动确认,让 keto 疯狂的执行。找了半天啊,才发现在这里配饰搜索 just command, 添加信任命令,或者嫌麻烦的话直接加个星号,全部通过。第二个规范编程 back, 它内置了需求设计和实现三阶段的流程,分别对应了文件、 requirements、 design 和 task, 还有 whoos 钩子,可以把你经常要执行的操作保存下来, 比如每次回答都要求他用中文,还有每次生成代码时候都进行 git commit 进行保存,随时备份,非常的方便。另外还有个 steering 的 引导机制,也就是局文件无论什么时候对话,他都会引进来作为上下文, 它能帮你设置产品架构,还有技术的规范要求。第三个版本控制功能,它集成了 get 号的提交代码工具,我们可以点击活动栏的这个标签,这下面是我们修改的内容,我们点击添加, 相当于执行了 get add。 我 们可以用 ai 来生成我们要提交的信息,内容自然就写成了,检查一下没问题我们就可以 get 提交。提交成功之后, 它下面就显示了我们的提交分支内容,然后可以提交到我们的远程仓库,确认 ok 就 上传成功了,但前提是你要配置好你的 get up。 第四个子代理功能,这功能就是并行协助的功能,子代理,它允许 killer 并行地执行多项的任务,相当于开多个县城一起工作。以这个例子为例, 他要提取最近的五个项目的一手从下面的这个 report github 的 项目里面去获取。 他调用了 m, c, p, 调了多个子系统进行同步获取。每一个子系统呢?获取一部分的一手内容,最终拼成最后的结果。 第五个检查点,当我们进行多人聊天的时候,我们可以点击 restore 返回到某一个分支节点上面来达到回退的效果,让你能够更安心的去尝试多种的解决方案,更方便的去做恢复 而保留,所以每一次的修改都会有一个快照保留功能。第六个总结摘要,每一个模型它都有上下文的窗口,有一定的限度。当对话长度达到百分之八十的时候, kiro 会进行自动的总结,进行压缩,减少后面的 token 消耗, 更减少了幻觉的出现。这些技巧根本不用学,一用就会了,快去试试吧! kio 的 使用教程文档我放在了评论区,关注我,带你了解更多好用的 ai 工具。

只需要一声令下, ai 们呢就会全天无休的执行调整再执行,我们只需要检查结果就行了。虽然谈不上是大作,但是 kiro 呢,能让我在一天内搞定三个机制完整的小游戏,已经让我觉得非常惊艳了。 三年前大模型横空出世,到今天呢,我们终于迈进了智能体的时代,我们从只能和 ai 简单对话,变成了真正能依靠 ai 实现创意,创造新的交互形式。 前段时间,在亚马逊云科技 re invent 大 会上, ceo matt garmin 也强调了这一点。 ai assistants are starting to give way to ai agents that can perform tasks and automate on your behalf this is where we're starting to see material business returns from your ai investments。 可以遇见的呢?随着 ai 能力的继续变强,我们和 ai 互动的方式还会继续迭代,比如这次我用的 kiro。 在 reinvent 大 会上,亚马逊又发布了新的全自动模式 kiro autonomous agent, 可以 在后台同时执行十个任务,还能持久记忆我们的开发偏好在不同任务间保持一致,和我们一起进化。 在这种模式下,我们相当于有了一个忠实的执行调整再执行,我们只需要检查结果就行了。 那当执行的门槛被技术无限拉低,是不是说我们每个人的审美和判断力才是未来真正有价值的硬通货呢?行,今天的视频呢,就到这了。

cloud code 最新版现在已经原生支持调用 chrome 浏览器了,我们只需要将 cloud code 升级到最新版本,然后在 cloud code 中使用斜杠命令加上 chrome, 就 可以进入 chrome 浏览器的设置。 在是否默认起用这里我这里设为了起用,而且这里还可以管理权限,点击之后这里就会自动打开浏览器,并且在这个扩展这里我们就可以设置权限。如果大家没有安装扩展的话,到这一步应该会提示安装扩展,大家只需要按照它的提示安装扩展就可以。 当这些设置好之后,大家就可以在 cloud code 中原声调用 chrome 浏览器。在之前的视频中,我为大家演示过 chrome devtools 在 chrome code 中以及在 codex 中的使用,用来实现浏览器自动化以及 ui 调试。 但是 chrome devtools 为了安全,它打开的浏览器是一个新的实力,当我们需要执行浏览器自动化任务的时候,我们就需要重新登录所有的账号,像这样的话就非常麻烦,而且非常浪费时间。 但 cloud code 它原生支持的 chrome 浏览器调用它打开了浏览器就保存了我们日常使用的一切信息,包括账号登录状态以及浏览记录,还有 chrome 的 扩展插件等功能。 所以我们在 cloud code 中直接调用 chrome, 既适合 ui 验证,也适合端到端的自动化。而且它支持多种交互操作,包括点击输入,表单填写, 还有多标签管理,还可以对标签进行分组管理,而且它可以读取 cancel logs 还有 network requests, 并且可以结合盗墓状态来定位 ui 以及逻辑问题。好,本期视频将为大家深度测试 cloud code 调用 com 浏览器 完成自动化任务、 u i 调试任务以及 api 接口自动化测试等任务。下面我们可以先用一个最简单的任务进行测试,我这里直接输入任务,让它打开我的簿刻,点击进入第一篇簿刻,并将它改写为一篇 x post, 然后发布到我的 x 账号, 我们直接运行,先测试一下它最简单的浏览器自动化能力。好,可以看到这里它自动打开了我的簿刻, 然后它自动点击了我博客的第一篇文章,然后我们回到终端,就可以看到这里它正在执行这个任务,现在已经阅读完了博客文章,正在改写帖子。然后这里它需要申请权限,我们直接给它权限,然后它就自动打开了 x 平台。 好,可以看到它自动点击了发布, 这样的话这篇 x post 就 发布成功。整个过程不需要我们重新登录 x 账号,因为它会自动调用我们日常使用的 chrome 浏览器的配置。我们再测试一下 cloud code, 调用 chrome 浏览器 实现信息搜索,并且将搜索到的信息填写到谷歌的表格中,我们看一下他能否准确操作谷歌表格。这里我们输入提示词,使用奎姆搜索特斯拉近七天的股票信息,并且打开谷歌表格,将内容填入到表格中,我们直接运行 自动打开了谷歌浏览器,然后这里需要我们授权给他。好,可以看到他打开了谷歌,并且搜索了特斯拉的股价相关的内容。 好,这里他进入了雅虎 finance。 好, 可以看到他能准确点击并且复制相关内容。 好,可以看到他提取了特斯拉七天的股票数据,现在他打开了谷歌表格,我们看一下他能否将这些数据准确的填入谷歌表格中。 好,可以看到他在第一个单元格中输入了日期,然后定位到了第二个单元格。好,现在又在第三个单元格中输入了内容,现在这个表格的表头已经输入好了,然后这里提示他开始点击第二个单元格,开始输入数据。 好,这里他填完了十二月十八号的数据,现在在填十七号的数据 好,这里提示所有数据已经输出完成,这里我们就看到了它填入的特斯拉股价相关的信息,而且整个过程都是由它自动化完成。这样看来这个效果还是非常不错的,因为它能对这些非常复杂的表格进行精细化操作, 通过测试可以发现它的浏览器自动化能力还是非常强大的。好,刚才我们测试的是浏览器自动化任务,下面我们还可以测试一下让 cloud code 调用 chrome 实现 ui 调试。我们可以先在 cloud code 中让它为我们开发一个 react 组建。 我们可以先看一下这个提示词,让它使用叉款 ui 创建一个语言学习的 react 组建。这里是技术站 里,是页面结构,还有核心功能,还有设计要求,包括主题字体等,还有响应要求,以及数据结构,还有交互细节,还有性能。在最后这里我们让它创建一个完整的可交互的应用原型,要求任务完成之后,使用 crm 自动测试所有功能是否正常。 然后我们完整地粘贴这个提示词发送给 cloud code, 让它为我们开发这个 react。 组建,并且自动调用 chrome 浏览器进行测试,这是它生成的开发任务。最后一个任务就是在 chrome 浏览器中进行测试。 好,为了节省时间,开发步骤这里就略过,我们直接跳到它打开 chrome 浏览器的步骤。 five minutes later。 好,这里他已经完成了开发,现在正在安装依赖,这里他需要我们授权他权限,现在他就自动打开了浏览器,我们看一下他能否自动点击页面上的这些内容,对页面进行测试。 好,可以看到他自动点击了单词卡片,单词卡片翻转之后,这个单词出现了镜像翻转,我们看一下他是否会修复这样的问题。 好,这里他提示他看到卡片翻转有一些 css 效果的问题,他需要修复这个问题,这样的话,他就通过调用浏览器自动点击发现了这些问题。好,现在他正在测试练习页面。 好,他还选择了一个正确的答案。这里点击了进度。好,可以看到这里他输出答题反馈功能完美。好,这里提示进度页面非常漂亮。他继续测试设置页面。好,这里他提示页面显示空白,他需要检查控制台是否有错误, 然后这里他发现了这个错误,他正在修复这个错误。好,这里提示修复完成,他刷新页面, 可以看到他现在点击了设置。好,这里他提示设置页面所有功能都正常,他现在需要修复首页单词卡片翻转的问题,他需要创建一个简单可靠的翻转实线,替换当前的三 d 动画。 好,现在他又切换到了首页,然后我们看一下这次单词卡片的翻转是否修复好, 可以看到它自动点击了单词卡片,这次单词卡片翻转就正常,就显示了单词的中文翻译好,这里提示单词卡片翻转效果现在完美工作, 并且提示所有功能都测试通过,然后这里就输出了已经完成的这些功能。这样的话,我们没有经过任何干预, cloud code 就 调用 chrome 浏览器实现了自动开发,自动测试,并且发现了单词卡片翻转出现了问题,然后 cloud code 进行了自动修复, 可以发现整个步骤非常流畅,完全由 cloud code 全自动完成。刚才我们测试的是在 cloud code 中调试前端 ui 项目,下面我们还可以测试一下用 cloud code 调用 chrome 对 api 进行测试。 我们可以先看一下我准备的这个开发任务的提示词,让它创建一个 node js 加 express 的 代办事项, api 包含 get 请求获取所有代办事项, post 请求创办代办事项,还有 put 与 delete, 并且集成 swag ui express 自动生成 api 文档。 启动服务后,在 com 中进行下面的操作,并且将测试结果汇总,如果测试过程发现 bug, 直接修复并且验证。 然后我们回到 cloud code, 直接粘贴刚才的提示词,直接运行。像这样的话,我们使用 cloud code 调用 chrome 对 api 进行测试,在一定程度上甚至可以取代 postman。 这里它生成了开发任务,这里我们要稍等一下。 five minutes later 可以看到这里他开始对 api 进行测试,然后这里提示 get 端点已展开,他将点击这个按钮,这里提示点击 execute 执行 get 请求,并且提示需要滚动查看响应,这里他又重新点击了 execute 按钮, 好,这里提示 get 请求。测试成功,返回了两个代办事项,现在它需要测试 post 的 端点,创建新的代办事项。这里点击了 post 进行展开,然后这里提示它需要使用 find 工具定位 post 按钮 好,可以看到他将 post 进行了展开,这里提示他需要点击这个按钮,这里提示 post 的 成功,他创建了代办事项,现在他需要继续测试 put 还有 delete, 然后这里提示 put 和 delete 都创建成功, 这里提示他需要在 swag ui 中执行一个请求来捕获网络请求,这个任务执行完成,这里是生成的测试结果汇总报告, 包括 api 端点测试结果,这些端点都测试成功,而且这里还有响应时间,这里就是错误处理测试。下面这里就是 network 面板验证, 这里给出了总结,所有测试都通过,没有 bug, 发现 api 功能完整,错误处理,正确响应时间均在毫秒级。这样的话就在 cloud code 中自动调用 chrome 浏览器完成了 api 的 测试, 而且整个过程全部都是由 cloud code 自动完成的,不需要我们进行任何干预。通过我们在 cloud code 中调用 chrome 浏览器测试浏览器自动化以及前端 ui 调试,还有后端 api 的 测试,可以发现在 cloud code 中调用 chrome 浏览器效果非常不错, 它们全自动为我们完成各种复杂的任务。 cloud code 有 了 chrome 浏览器的加持,就变得越来越实用,越来越强大了。

最新澎湃堆叠后台,但是部分机型下载完桌面安装包没有效果,打开任务样式也是发现没有堆叠后台,这时只需要打开黑域进行无限调试后,只请艾特输入这串指令 等待完成,然后就发现有了堆叠后台,这个方法适合绝大部分没有效果的红米、小米手机。

u i 自动化的发展方向正在从人眼观察、大脑决策、手动操作进化到视觉感知、智能决策、自动执行。在寻找 u i 自动化解决方案的时候,我们的期望是什么? 成功率?稳定性?执行效率,这些是保证程序持续稳定、有效运行的底线。使用难度、花费这些是我们要投入的学习和金钱。成低改动成本和难度兼容性 等等,这些能带来更好的使用体验。通过实测,目前我的推荐是 medicine 点 gs 加 ai 视觉模型千万三 f l plus 自主规划任务执行不柔的解决方案。 medicine 点 gs 是 字节调动旗下 webinfra 团队开源的 ai 操作助手, 可使用视觉 ai 模型驱动,支持全平台的 ui 自动化 sdk, 适用于外部网站、安卓、 ios 自动化和测试。我们先通过 mitson 点 gs 的 执行报告回放, 直观的感受一下这个解决方案执行超长步骤复杂任务的表现。 下面总体介绍一下选择这个解决方案的几点原因。高成功率和稳定性, 即使在无缓存的情况下,九十五个执行步骤的复杂任务重复测试,仍然保持了百分之百的高执行成功率和稳定性。 主要得益于,一、备测系统良好的前端界面元素和交互设计。二、视觉模型千问三 vr plus 的 识别理解能力。 三、 magson 点 gs 良好的框架设计保证了执行的稳定性、 高执行效率。在有缓存的情况下,单个任务的执行时间与人工执行时间接近,多个任务可并行执行,并且自动化执行时不占用人工,可以做其他事情。 一、上手难度和学习成本与传统自动化脚本相比,任务步骤编辑基本接近自然语言的描述, 并且绝大部分逻辑代码编辑需求可借助 ai 编程助手解决。 低费用成本九十五个执行步骤的赋值任务单次执行投肯消耗花费约零点一四元,在有缓存的情况下,没有缓存的情况下约零点二八元。 一、改动成本和难度 ai 视觉加缓存自动适配界面变化一、元素外观不变,无需改动。二、位置和大小微调基本无需改动, 与 ai 视觉模型交互后会自动重新定位。三、元素和交互变更仅需要更新描述文字和逻辑, 更新难度较传统方式更低。兼容性一,它兼容多种模型,可以根据需要选择使用不同的模型。 二、兼容多种浏览器,可通过 playwrite 配置选择起用。 推荐的使用场景一、使用 medicine 的 gs 加千问三、 vlplus 人工自主规划执行步骤 成功率、稳定性、执行效率比较高。上手难度、学习成本、费用成本、改动成本和难度都比较低,因此推荐用于做任务自动化执行、场景自动化测试。 使用 madison 点 gs 加具备探索规划能力的视觉模型,如 dooboard、 ui tabs 等等。自动规划 任务执行的方式,任务执行正确率不高,耗时和花费偏多,可以考虑对用户高频使用的前端页面展现交互设计做探索性、可用性的验证。不推荐的使用场景 一,如果执行操作的对象不允许或者限制截图功能,比如某些考试网站会检测截图到达一定的预知后终止考试, 那么就不推荐使用这个解决方案,原因是 matesson 点 gs 的 解决方案依赖截图后与 ai 视觉模型进行交互。二、 如果执行操作的对象有高保密要求,例如某些系统不允许通过互联网传输系统的信息, 那么就不推荐使用。原因是在线的 ai 使用模型参数更大,效果更好。 如果急于保密安全的考虑选择使用本地部署的 ai 视觉模型,可能难以保证效,能够正确执行复杂任务,用时准确率接近手工测试执行 学习维护费用成本低,可以帮助我们腾出时间做其他事情。这样的 u i 自动化解决方案实测推荐分享给可能有同样需要的你。 详细的部署测评文档参见视频下方链接,如果这期视频对你有切实帮助,记得一键三连,我们下期再见!


b f 四点六固件的穿越机也可以自动旋停了,但是 b f 四点六怎么没了?去哪刷?怎么刷?自动旋停功能怎么设置?还有 b f 四点六的时钟同步功能有没有必要?那这期视频再来点干货,解答大家对 b f 四点六的几个疑问,来先教大家怎么刷 b f 四点六。以泽鑫这块最新的 h 七飞控为例, 所有 b f 飞控都是同样的方法,大家现在拿到的大部分飞控还是四点五的。首先我们用原来的地面站连接并读取到飞控型号和版本,则新这个飞控固件版本是四点五点一,具体型号是这一串 gina s t d pro, 记住这个型号一会要用到。然后我们点更新固件,这里启动专家模式,然后选显示后选版本, 这里选开发版,这儿我们选自己的飞控型号,刚才看到了是这个,这个千万别选错。然后这里在线加载出了这些版本,可以看到四点五还是以前四点五这种格式命名的, 而四点五之后不再叫四点六了,全部改成了二零二五十二这种日期格式,这些就是咱们之前讲的四点六。然后这些又分为 rc 发行后选版本和 beta 测试版本。选好你想刷的版本,下面勾选全盘擦除 下面,这是关键。如果你用黑洋或 e r s 接收机,这里就选 c r s f 协议。如果你用大疆图传内置 s b s 接收机,选 s b s 协议。 这就是很多人遇到的疑难杂症之一,就是从 e l s 换到大疆遥控以后,怎么设置遥控都不好使,那很可能是需要重刷固件,选 s bus 就 好了,然后下面这也是关键,这是要刷的功能,默认都是必要功能。还有辅助功能,就比如 b f 四点六新加的 altitude hold 高度保持功能,还有 position hold 位置保持功能, 其他的比如多机功能你也可以选等等,这些都选好以后点这从网络下载固件,这里是下载进度条,下载完以后会变成绿色,然后点稍写固件,这时候会弹出提示,建议大家选这个备份原文件, 点了以后会让你选个此盘位置,把非控原文件备份保存出来一份保存好以后,我们继续刷固件,这里阅读风险提示,然后确认刷写,这就开始刷了,过程中不要拔掉非控,必须等它彻底刷完, 同样刷完会变成绿色。刷完以后我们先不拔飞控,再来连接飞控试一下,这样可以看到这个地面站无法连接到这个飞控了,告诉咱们这个地面站不支持二零二五点一,二点零了,也就是四点六这个部件了, 所以 bf 四点六故障的飞控以后,可能需要用在线地面站调餐了,在线地面站地址就是这个,它的操作和我们之前的地面站几乎完全一样,点连接以后提示校准加速度计,我们校准一下就好了,校准完以后该怎么调餐还是怎么调餐都一样了。可以看到则心,这个 h 七飞控有八组串口可以接的,外设非常多,算力和闪存也足够。 四点六最大的不同是这里,这里可以看到陀螺仪则新,这是双四二六八八 p 陀螺仪,它也有单四二六八八 p 陀螺仪的版本,然后下面比以前多出了两个传感器,一个是声纳,里面有这些型号可以选,下面是光流计,目前有这一个型号可以选,比如光流定位就需要光流计。 然后就是模式页面,因为我们刚才刷固件的时候选了高度保持,所以这里就会有高度保持的模式开关,意思就是自动定高,再往下这就是刚才我们刷的位置保持,这也就有了位置保持的模式开关,意思就是自动定点, 那这两个模式同时打开,就是我们很熟悉的定高定点自动旋停了。讲到这,大家是不是豁然开朗了?好了,大家就可以拿起你的飞控刷个 b f 四六,加上起亚剂 g p s 罗盘,然后设置下定高定点去试一下了, 这下 b f 也有了自动旋停功能,那具体效果怎么样呢?我们以后实测视频再见。好了,方法我讲完了,大家肯定还有两个疑问,就是你之前说 b f 四点六有个时钟同步功能,这个功能在哪呢?这个问题我目前也不知道, b f 官方我目前也没找到具体的说明, 现在知道的是这些,要想有时钟同步功能,那得飞控硬件支持。这个我之前给大家讲过,泽鑫这个新飞控是支持的,之前还有人问,那如果手里的老飞控不支持时钟同步怎么办?是不是就没法玩定高定点旋停了?并不是这样,他俩没有关系,自动旋停和时钟同步没有关系,不支持时钟同步照样可以玩自动旋停, 也不影响你正常使用 b f 四点六,所以不要焦虑,不用慌,老飞控限阶段照常用就行了,除非你想要更高的算力和响应。或者你想要刷 adu palette 固件,可以用这种 h 七飞控。 h 七主控也是限阶段算力和闪存最顶的,则新这个飞控目前也在申请 p x 四 adu palette、 nv 这些固件, h 七主控可以通吃,它有十二个外置设备插口,包括数字图传、模拟图传、四个 led 接收机、 gps 罗盘、双电条、两个躲机,这些叉勾陀螺仪也采用了 bf 官方建议的 ldo 滤波电路。好了,这就是本期视频所有内容了,你学会了吗?学会了别忘了多多关注转发,我们下期视频再见!

大家好,今天教你们一个超实用的技能,用提示词生成 flex 组建代码。首先什么是好的提示词?不是说帮我写个 flex, 而是要具体结构化可执行。来看我的提示词, 我会说,请创建一个 flex 组建教学 demo, 包含四个演示基础概念,主轴、交叉轴、 direction、 方向切换、实际应用要求,添加按钮、交互使用不同颜色,看具体到演示数量、交互方式、视觉效果,哎呀,就知道该怎么做了。现在来看生成的代码, 第一个演示基础概念,三个子元素,横向排列,红青黄三种颜色,一眼就看出 flex 是 干什么的,弹性布局容器。第二个演示 主轴和交叉轴,这是 flex 的 核心概念,看这三个不同高度的元素,横向排列是主轴,纵向就是交叉轴,我还加了箭头标注,主轴交叉轴一目了然。第三个演示是重点, direction 布局方向,四个按钮, reverse column column reverse 点 row 一 二三四横向排列点 row reverse 四三二一反向排列点 column 幺二三四纵向排列点 column reverse 四三二一反向纵向看,当前按钮是蓝色高亮,其他是灰色,这就是状态管理, 用 at state 控制 current direction, 点击按钮就切换方向,实时看到效果。第四个演示实际应用场景,一是导航栏首页分类,购物车我的均匀分布,这就是 flex 的 典型用法场景。二是表单布局,用户名、密码、登录按钮垂直排列用的是 column 方向。 为什么这个代码好?因为提示词写得好,我明确了四个演示交互方式,视觉效果,代码规范, ai 就 能生成完美的代码。总结三句话, 一,提示词要具体,说清楚演示数量和场景。二,要求要明确交互方式,颜色布局都要说。三,代码要简洁,添加注试,记住好的提示词等于好的代码,学会了就去试试。这里我用的是 qio, 用提示词生成你自己的组建 demo 下课。