好,我们上一个版本已经可以实现这个目标,检测加标注,加这个前台的信息显示了,这个功能就已经比较完善了,但我们今天还可以给它加一个更为实用的功能,那就是免字库识别。好,我们来看这个免字库识别怎么去加啊? 这里我们可以先问一下 ai 啊,有哪些免字库识别的第三方库? 好,它这里给了我们很多答案呢,一个,两个、三个、四个,五个,六个、七个,然后它这里有建议啊,你看 如果需要开源方案,那他推荐这个 easy 和这个 pad, 这个 pad 就是 百达翡丽讲啊,我们现在讲过了,这个是我们的老朋友了,我们很熟悉这个,然后别的我们就没怎么用过,都很陌生。那然后这里有一个高精度识别,他也推荐这个 pad, 那 这个 pad 占了两个名额,既免费开源,又可以高精度识别,说明这个老朋友还很强了。 后面还有这个轻量级的,轻量级的就是啊,体积比较小啊。嗯, easy, 企业级的就是 google, 还有这个微软的啊, microsoft。 那 你可以根据你的实际情况来选择使用哪一种免税库识别的第三方库啊,首先我们肯定是用免费的啊,是吧,所以企业级的我们就不考虑啊。 然后如果你的计算机配置比较有限的话,那你可以优先考虑 easy 啊,因为它是轻量级的,轻量级就意味着它的体积不会很大,相对来说的话啊,触制化的话,速度应该比较快一点啊。 然后高精度的话就是百度飞讲啊,那高精度就意味着他的体量肯定比这个一直要大步数的话,说实话速度肯定是要慢一些,那我的这个计算机配置还可以啊,所以我还是考虑我们的老朋友啊,百度飞讲这个我们也比较熟悉一点,以前用过, 好来看我的这个新需求啊,帮我在现成控制的这个代码里面加入我们的百度飞翔,后面有个括号, gpu 版啊,因为百度飞翔有两个版本啊,一个是普通版,一个是 gpu 版。如果你的显卡还可以啊, 那么你可以尝试使用这个 gpu 版,它的速度会快一点,如果你的显卡不太行的话,你可以就使用它的普通版本,也还可以。 然后用这个百度分享啊,方便我通过一个函数识别指定屏幕坐标区域的文本内容,并且将识别的文本内容显示到调试信息窗口中,就是我们的前端的那个 ticking 啊,好,这里我为了确保内容的准确性啊,我使用了这个优化功能啊, 好,他这里并没有直接帮我们去安装这个百度飞翔的库啊,他这里只是把这个功能先集成进去了啊,我们先测试一下按 alt 加三,可以测试它的这个文美识别的功能, 这是我们的常规目标检测啊, alt 加三啊, 但是你看他闪了一下就没了啊,说明我们没有这个百度飞翔的功能啊,没有集成进去。 那我们就来让 ai 帮我们去把这个直接安装上去啊,先保留我们的代码,然后直接运行这个啊,我们要这个 gpu 版本啊,我们点这个运行 直接报错了啊,我们把这个错误给复制过去,没有顺利安装啊。 爱就一个字,我只说一次, 我们来看下说明啊,前面没有能够顺利安装是因为百伦飞翔啊,它与 python 的 三点一、四点二的版本不兼容啊,因为 python 有 很多版本啊,我们的第三方库有时候它没有及时更新的话,可能就会导致这个不兼容问题, 然后它这里给我们采用了替代方案,还是用了这个什么 easy ocr。 嗯,那我们来试试看啊, 快捷键是二加三啊。嗯,识别区域一百到五百,三百,也就是说大概是屏幕的左上角这块区域。差不多啊, 大致这块区域识别结果啊, get png 啊,还可以啊,自信度,这个零点三八比较低啊, 自信度就是它的这个准确度。好,下面终端这里出现了一段信息,我们把这段信息复制过去,问一下 ai, 我们再来试试看啊, 如果这个还不行就算了啊,因为这个不是什么严重的错误问题啊,他只是警告,警告很多时候是不影响我们的程序他本身执行的,所以说实在解决不了就无所谓了。 好,还是有啊,算了吧,就这样吧。然后这里还有一个提示啊,它告诉我们这个东西就是这个免置库识别功能啊,它也有这个 gpu 版本的第三方库啊, 所以我们可以让 ai 帮我们去使用这个 gpu 版本的。 好,他这里似乎没有去改动我们代码,只是重新安装了一下,我们的环境依赖,我们来试试看啊。 嗯, 它现在就没有这个提示使用 gpu 版本了,那应该我们用的就是 gpu 版本。好,我再给他提个新需求啊,帮我把二加三的识别功能整合进二加一,因为我不想按两次这个快捷键,一次就够了。 好,我们来试试看啊。 嗯, 有问题啊,怎么没有检测文本呢?好,我发现问题了,他这里不是这个一闪而过,他是这个文本检测的这个间隔太长了,有问题。还是这个间隔问题好,继续提需求, 帮我去掉二加三的快捷键,并且将所有影响程序执行间隔的数值都胜民主变量,方便我调整所有的执行间隔。 好,我们把这些间隔全部改短一点,看看会不会出现这个问题。 它文本识别间隔三秒一次。难怪,难怪刷新的这么尴尬,我还以为它这个出问题了,太慢了, 除了这个错误重试以外,我们都可以改快一点。 嗯,现在正常了啊。 嗯,没问题。 好,最后我让他给我一个开关,因为很多时候我们未必需要这个免智库识别。 免智库识别它还是需要占用我们一些这个系统内存的啊,所以很多时候如果你最有效率的话,那能不使用就不使用啊。 那我们一定要使用的话,我们就加个开关啊,让它来控制啊。就是你需要使用的时候,我们就要这个变量等于 true 来打开它啊,你不需要使用就把这个变量设为 false 啊, 就类似于我们这个前端的调试信息面板,对吧?我们可以用个开关来控制它的话,就比较方便啊,需要用就用啊,不需要用就不用。 好,他这里帮我们加了一个变量啊, use ocr, 他 这里默认等于 force, 就是 默认不使用这个完美识别啊,我们看一看, 嗯,然后就没有,对吧?没有这个完美识别。好,我马上停掉啊,然后再把它打开看看。 嗯,打开之后它这里会显示啊,初次化成功啊啊,你看打开就可以识别完美啊, 这里我直接复制下这块代码,然后粘贴过来它这里会把它浓缩成一块啊,方便我们去阅读,然后让它帮我声明一个变量,统一复制给这些变量啊,免得我一个个去改啊,就很麻烦是吧? 好了啊,它这里用了一个新的变量啊, default interval, 就是 默认的执行间隔,然后我通过这个调整啊,就可以直接去修改我们所有间隔了,除了这个错误的重试时间以外啊, 嗯,非常好啊,好,我们来看一看啊,最终的这个成品啊,那现在这个模板就已经非常的强大了啊,非常方便的啊,我们可以通过它来去识别目标啊,识别文本啊,这样就可以在这个基础上去做很多工作了啊。
粉丝2.6万获赞7.8万

挑战只用两分钟,从零到一学会 agent skills 二零二五年十月, andrew pig 公司提出 agent skills 概念。没错,它有一个大名鼎鼎的子公司 cloud code。 由于效果太炸裂, cursor、 tray codex 等 ai 编程工具纷纷宣布支持 agent skills。 由于 tray 在 国内无门槛,今天就实战 tray 怎样使用 skills。 假设你在辅导一名实习生,你去帮我写个文档,文档主题和格式是这样的,要注意 a, 还要注意 b, 每次写的时候都要重新说一遍。你换了一个会 skills 的 ai 小 助手,仅需给他一本操作手册,将主题和规则封装到一个 skill 的 文档中, ai 小 助手就会自动从 skill 中学习文档。写作的要求就是让 ai 永久性告别健忘症。通过加载不同的 skills, ai 可以 具备不同的专业知识、工具使用能力。如何在 tree 中运用 skills 呢?你可以去 getipe, 找到 anspec 官方写好的 skills, 点击扣按钮,点击 download, zip, 查看浏览器中下载文件的位置,解压到本地文件夹,可以看到 skills 文件夹中已经创建好的目录。打开 tray, 切换到 solo 模式,点击设置按钮,点击规则与技能,点击创建 skills, 选择 skill md 文件,修改技能名称为 word 大 师,感兴趣的同学可以学习指令中的内容。点击确认按钮, 在 solo coder 对 话框中输入指令。帮我用 word 大 师生成一份关于 a 股春季行情的调研报告, tray 就 开始使用 word 大 师 skills 开始干活了。调研报告像模像样,果真是打工人的福音。 打开 tray 的 solo 模式,只需要像平时一样对 ai 说帮我新建一个检查代码 bug 的 skill, tray 就 会自动帮你生成一个 skill, 特别适合新手。小白 切换到 solo 模式,点击设置图标,点击规则与技能,点击创建按钮,依次输入技能名称、描述和指令。简单的 skill 只需要描述清楚就可以运行,后续还可以慢慢加入具体的操作指令,怕你后面找不到,点关注不迷路, app 带你上高速!

最近 agent skill 这个词在 ai 圈,尤其是在 ai 编程圈子里面特别火,它最早是由 cloud code 的 母公司 ansorepic 在 二零二五年十月份提出来的,因为效果太惊艳,现在各大顶尖 ai 编程工具,比如说 cursor codex, anti gravity 以及字节推出的 tree 都在第一时间进行了适配。由于 tree 对 国内小伙伴没有什么使用门槛, 而且它非常全能,能够兼容几乎所有的大模型,尤其是它上手极快,支持一句话,创建技能。所以本期视频我就以 tree 为例,给大家做一个详细的讲解,包括 skill 到底是什么,怎样在 tree 中创建 skill, 以及我们普通人可以用 skill 来做什么具体的事情。最后还有跟大家推荐一些非常好用的 skill。 首先跟大家讲一下这个 skill 到底是个啥?举个通俗易懂的例子,假如你把 ai 当做你刚招的 skill 到底是个啥?举个通俗易懂的例子,假如你把 ai 把写文章的 prompt, 也 就是具体要求和注意事项强调一遍,而使用了 skill 之后,你就可以把写文章的规则要求封装到一个 markdown 文档里面,你只需要告诉他写什么主题, ai 就 可以自动从 skill 中获取文章写作的要求。所以说 skill 要解决的核心问题就是让 ai 彻底告别间歇性失忆。有了 skill, 就 像是给 ai 装了记忆,你只需要告诉他想做什么,他 就能够自动调取写好的技能包,按照你的流程瞬间搞定。那这本给 ai 准备的操作手册在电脑里面长什么样子呢?其实它本质上就是一个普通的文件夹 里面最核心也是唯一必须的文件叫做 skill 点 m d, 你 可以把它理解成这本手册的核心,大脑里面清清楚楚的写的这个技能叫什么,什么时候触发,以及具体的执行步骤。如果你想让这个实习生表现的更加专业,你还可以往文件夹里面塞几个附件包,比如说在 examples 文件夹里面放几篇满分范文给 ai 参考,或 或者是在 resources 文件夹里面放一些复杂的背景资料和自动化脚本。所以 skill 的 结构其实非常简单透明,它就是把你的经验打造成了一个标准的知识包,只要把这个文件夹交给 ai, 它就能够瞬间读起并掌握这项新技能。那怎样在翠中创建 skill 呢?主要有三种方式。 一种方法最为简单,就是直接白嫖其他人分享的 skill 技能,你可以去 github 找到各种大牛写好的 skill, 把包含 skill 点 m d 的 整个文件夹下载到本地,然后在 tree 的 设置里点击规则和技能,选择创建并导入文件夹就可以了。第二种方式是对话式创建,也最适合小白用户。首先打开 tree 的 solo 模式, 然后你只需要像平时聊天一样对翠说,帮我创建一个检查代码性能的 skill, 真的 只需要一句话,翠就能够自动理解你的需求,帮你把名称、描述和指令瞬间生成好。 而且最方便的是,翠的内部就集成了很多非常专业的技能模板,我们直接调用就可以了,完全不需要再额外下载或者是配置任何复杂的环境。第三种方式适合动手能力强的小伙伴,那就是手动创建,直接在标准的 markdown 模板里面填写技能名称、出发条件和详细的操作步骤。 简单的 skill 其实只需要名字和描述就能够跑起来,复杂的流程还可以慢慢的往里面加具体的执行指令。无论你是直接导还是想自己写,核心都是为了给这个实习生立规矩,让他彻底变成最懂你工作习惯的专业助理。 学会了创建,那创建好的 skill 到底该怎么用呢?有两种姿势,第一种叫做显性调用,也就是点将法,当你想要精准控制输出结果时,直接告诉翠用哪个技能,比如说用 用周报大师帮我整理一下工作,或者用小红书分身写一个文案,这时候翠就像接到命令的专家,严格按照你设定的流程干活。第二种更高级,叫隐性调用,你只要在创建时把什么时候用写清楚,比如 skill 的 出发条件是用户要求写复盘,那下次你随口问一句,看看我这周表现怎么样, 就能够自动识别并瞬间激活,这个技能完全不需要你指定。虽然 skill 是 ai 编程工具中的功能,但它的应用场景远不止写代码。对咱们普通打工人来说,只要你的工作有规律有模板,它就是你翻倍提效的秘密武器。 比如说你可以用来做下面几种事情,第一个是职场提效,写周报复盘,再也不用发愁建个周报大师技能,把模板和语气存进去以后,随手甩一段白话总结,翠就能够秒出一份专业报告。 面对几十页的 pdf 或者是乱码表格,你不需要记住任何复杂公式,调用数据分析技能,它就能够自动完成清洗和分析,直接给出你要的答案。第三个是标准化创作,不管是小红书的爆款逻辑,还是回邮件的固定语气, 都能把要求通通打包,以后每次调用的效果都像你亲手写的一样稳。说白了,这就是把经验变成自动驾驶,只要你想把专业知识沉淀下来,它就是你最强的全自动助理。 最后跟大家分享几个可以找到优质 skill 的 地方。首先要推荐的就是 osropic 官方维护的这个 skill 开源项目,目前已经收获了四万五千多个 star, 这里面的 skill 覆盖了非常多的类型,比如创意设计类、开发技术类、企业沟通类,以及最实用的文档生产类, word、 ppt、 excel、 pdf 这一整套全部都给你安排上了。 其次再跟大家分享一个专注分享 skill 技能的导航网站,该网站目前已经收入了七万多个实用技能,它把公开的 skill 做了搜索和分类,量非常大,适合找冷门场景。

在我之前的视频里面啊,我介绍了一款编程工具叫 tree, 在 这个视频里面,我演示了如何让 ai 帮我们去写一个多现成的范例,以及去写一个俄罗斯方块的小游戏。然后就有朋友问我了, 这个东西能不能利用它来写脚本呢?可以的,但是你要知道,我们用它来写脚本的话,其实本质上还是在用 python 去写啊, 因为 python 和 ai 的 兼容性比较好啊,我们可以让 ai 帮我们写很多 python 的 代码,通常来讲的话,这个错误率还是可以接受的啊,但是你需要掌握 python 的 一些语法基础和它的一个代码结构啊, 就是说你不能什么都不懂啊,完全指望 ai 帮你去写套复杂的脚本啊,那是不太现实的。所以,如果说你想要 希望利用 ai 来帮助你辅助写脚本的话,你至少得掌握 python 的 一些基础。而 python 的 学习门槛呢,实话实说啊,他肯定是要比按键精灵更高了。 所以说,如果你是一个零基础的小白啊,你想要写脚本,那么我建议你把按键精灵作为起点啊,还是去先看这个编程基础,先看这个, 然后你再去看这个,最后你再去尝试啊,让 ai 辅助里去写脚本,要不然的话,他写错了,你都不知道怎么改对不对?就算没错,你也不知道怎么去用啊。好,当你具备了一定的编码技术之后啊,你就需要具备一定的理论基础。 我们的主要脚本理论基础其实就是两个系统啊,一个是识别啊,一个是操作。 关于这两者的关系呢,你也可以去看一看我的这个视频啊。好了,我们再来说一下这个用 python 写脚本的好处啊,第一个我之前说过了,就是 ai 跟它的兼容性比较高。 第二个就是他不太会被针对性检测,他的安全系数啊,是要远远高于按键精灵的啊,而且他的封装性啊,代码的封装性也要远远好于按键精灵,所以他的整体上限也要远远高于按键精灵啊,但是他的部署和发布啊, 要比安吉基尼更复杂。那说了这么多废话,我们来看一下怎么去通过实力啊,来去写一个最基础的目标识别加点击啊。好了,接下来是使用拍摄啊,你需要先安装好我们的拍摄环境啊,自己去往上下一个。这里我的版本是三点一,四点二, 这是我的拍摄路径啊,我们需要在我们的这个开发环境里面把这个路径给指定一下啊,在我们的这个开发环境这里啊,拍摄就是起的, 你看啊,这个路径啊,你要去指示一下。好,这里还是先打开我们的之前的项目文件夹, hello, world, 然后我们来设置一下这里,把我们的编码的界面啊,把这个字体把它改一改,改的稍微大一点, 方便你们去看啊,要不然的话太小了看不清楚。好,我在这里向 ai 提下需求啊,在这个多线层代码内,帮我实现如下功能, 在一条线层中检测一张目标图片,在一条线层中判断是否检测到图片,如果检测到,那么则让鼠标移动过去,并且进行点击操作, 同时按一下键盘的 h。 后面是这个目标图片路径啊,就这个,就这个桌面,这个美女的嘴巴。 好,这里我们把这个名字改一下啊,排序他对中文的支持还是不太好啊,我用按键用习惯了写中文,我们把它改为这个英文啊, target。 好, 这里我们来启动一下啊, 然后这里有提示啊,它的快捷键比较简单粗暴啊,是 e 和 h, 那 我们就先按 e 再按 h 吧, 大家看见没有啊?我们的鼠标确实可以过去,看见没有,对吧?这个说明没问题啊,我们的键盘输出的话,这里看不出来啊,应该也是没问题的。 好,我刚才按 q 把这个停掉了啊,刚才鼠标不是我自己动的啊,千万不要以为是我自己动了啊,是这个程序动过去的,我们可以看下这个输出啊, 检测到目标图片这个位置,你看九四五啊,五三三。我们这里粗略量一下,九四五啊,五三三是不是,你看差不多啊,九四五三三的话 啊,你看九四五三三啊,他量这个图片的位置,你看他不是以这个左上角为基准啊,他是以这个中间点为基准啊,所以我们看他鼠标过去的点也是这个中间点啊。 好,那我们再来一起浏览一下这个源代码啊,我们看一下它这个原理是怎么实现的啊?我们看到这个 cvr 就 应该知道啊,它用的检测原理是用了 open cv 啊,然后这个是我们的图片路径啊。 好,这一块是他这个我们的工作线层,这个一代表一秒钟啊,他和我们的按键的这个计时不太一样啊,按键的话这个单位是毫秒,他这个是一秒钟,那我们这里可以把它改快一点啊,比如说零点零一秒啊, 好,这里是我们的图片检测这个线层 啊,这里是输出我们的这个图片位置的,你看这个算法,它就是按照我们的这个中间点去算的这个位置啊,啊,除以二,对吧?宽高除以二 center 嘛,你看啊,中心点啊,然后这个 w 就是 y s 宽啊, h 的 hit 啊,高, 后面这里就是我们的控制线层啊, 然后这个鼠标操作用的是这个啊,用的是这个第三方库 p y l to g o i 啊,然后用它去移动我们的鼠标,这个间隔是指的是我们鼠标从我们的这个当前位置啊移过去,它所需要花的这个时间,这个零点五就是零点五秒的啊,就这个意思。 但是这里显然这个 ai 啊,还是把我的一个意图给理解错了啊,就是我这个 h 啊,我的意思是让这个鼠标移过去之后啊,按一下我们的键盘 h, 对 吧?在这里去按一下我们的键盘 h, 我 这个意思啊,但是他理解我了。什么?他理解我了,我们这个 去用 h 去启动我们的县城,是吧?你看他这就是理解错了啊。那好,我们再把这个间隔把它改短一点,比如改为零点零零一秒啊,他就可以做到。什么呢?瞬间移过去啊,他就没有这个轨迹了。好,我们可以看一看啊,启动 我们按一下,一再按 h 啊,好,看见没有,对吧?我们鼠标闪过去了,看见没有啊,对吧?直接瞬移过去啊,它就没有这个过程了啊, 然后 h 它按下去了,你看见没有?我们的这个这个文件夹,你看 h, 你 看它会亮,对吧?它会闪一下,说明我们这个键盘 h 啊也被按下去了啊。 好,现在是我们去借助这个 ai 啊,去帮我们写脚本的一个基础的方法,如果你有兴趣的话可以去尝试一下啊。

如何用锤写出自己想要的工具,实现工具自由?这是我写的一个用来自动清理电脑运行内存的一个小工具,因为每次电脑运行多个程序的时候,运行内存总是很快就会占满,所以我做了这么一个小工具,用来自动清理电脑的运行内存,不用再频繁的点击那个加速小球。 我做的这个工具主要有两个功能,一个是设置一个时间,到时间他就会自动清理内存,还有一个就是设置一个值,达到这个值他就会清理内存。接下来我演示一下如何用锤写一个类似的小工具。 首先我们需要在电脑上创建一个空白的文件夹,然后打开软件之后点击打开文件夹,然后找到你创建文件夹的地方,点击一下这个文件夹,选择这个文件夹就可以了,选择之后他就会打开这个文件夹,然后打开文件夹之后,我们把我们的需求发给他,发这个需求的时候一定要带上这个字,不然的话他写的脚本是没有界面的。 如果你对自己写的贴纸字不满意,这有一个优化输入内容的一个按钮,我们也可以让他优化一下输入的内容,只要点一下,他就可以帮我们自动优化, 很支持他优化好的一个输入内容,优化了也不满意,这还可以撤销优化,因为优化之后他需要写的东西比较多,所以我就不让他优化了,直接撤回,让他用这个地球简单的写一个,然后发送给他就可以了,等待一段时间他就会帮我们写好这个脚本, 现在他已经创建好了,创建了好之后一般他会自动帮我们启动这个脚本,如果生成好之后,他没帮我们运行,我们只需要点击一下这个代码的这个文件,然后点击一下这个三角符号,就可以启动这个脚本了。 哎,这是启动之后的界面,这就写好了,写好之后我们需要测试一下这个脚本能不能用,可以设置时间,然后也可以自动设置一个内容,我们就需要手动告诉他, 然后把问题发给他,他帮我们去判断一下是什么问题,等他改好之后,我们再次启动程序,我们再点击立即清理,再试一下,然后试完之后你会发现他还是没有清理内存,然后我们再次把这个问题抛给他,不是这个问题 发给他,然后我们再次启动脚本,然后再试一下。啊,现在已经可以清理了,就说明这个脚本已经写好了。

好,我们上一个版本已经可以对我们的一个多目标进行检测了,并且可以成功的复制这个检测框以及我们的检测信息啊,那我们来继续优化啊,来看我的新需求, 帮我生成一个格式化窗口,用来显示 print 中的调试信息以及所有检测目标的名称及坐标信息,窗口尺寸,窗口位置,背景色、前景色,还有我们的字体以及字号 信息,采用竹行显示,排版,整洁美观。 好,我们来测试一下啊, 调试窗口没有成功显示啊,好,那我就继续跟大家提需求啊, 我启动现成后,调试窗口没有正常显示,帮我修复这个问题。 好,还是有问题啊?这里报错了。 好,我们再来试试看啊。哎,这一次好像没问题啊,那没问题啊。嗯, 好,我再给大家提个新的需求啊,在调试信息窗口中每一轮信息更新后,清空之前的信息。 好,我们来试试看啊, 我们要把这个脚本切换到这个啊,现场控制, 嗯, 它这样就不会无限的往上面叠加累积啊。 嗯,没问题啊, 好,这个窗口的作用,它是为了方便我们实时观察我们的程序运行状态啊,有的时候你要看这个调试信息,你还需要先停止,然后切回来看,那你就不能够太方便的去观察我们的代码有没有什么问题啊, 然后我们这里尝试加个开关,就是让他帮我去增加一个变量,方便我决定是否使用。调试信息窗口 当变量为 q, 这使用调试进行窗口当变量为 force, 这采用 print 的 方法,常规调试输出相当于给我们这个调试窗口给个开关,对吧?我们需要用的时候我们就把它打开,我们不需要就可以把它设置关掉啊,这样就比较方便。 好,他这里告诉了我们用法,在我们的这个线层控制里 ctrl, 我 们找一下。那这里啊, may 啊,是我们的入口, 它这个是默认开启窗口啊,我们可以写个备注啊。 但是有个新问题啊,就是我这里如果把它改为 force, 我 不用调试窗口的话,程序就有问题了,会报错,我们来看一看,你看,直接报错, 我把这个错误直接给复制过去, 然后跟他说在我不使用调试窗口后报错了。 好,我们再来试试看。 嗯,它这里就默认没有使用了吗?我看看 它这里默认没有开启吗? ctrl 了。哦,对,没有开启。那 好,那我把这个 force 改过去啊,看能不能开启了, 嘿,啊,这就可以了啊, 开关激活 force。 嗯,没有问题。

hello, 大家好,第六期视频来喽!直接进入主题,国内编程工具 tree 真的 很难用吗? hello, 大家好,之前我们带着新手用 google ai studio 从零到一开发 app, 还借助 tree 完成了后续优化。这一期就深度扒一扒, tree 真的 如网上吐槽的那般难用吗?当下 ai 编程工具层出不穷,老牌的 curser 口碑不俗,新进的 kiro 也热度飙升,但我始终对 tree 情有独钟。 至今我已用 tree 开发出几十款实用工具,还一托它完成了公司大型前端项目的更新与维护。今天就结合这些实战经验,深度分析 tree 的 优劣,给想要进阶的编程新人一份真实参考。聊到 tree cn 版,从零级别的试镜奇偶它到视频的镇店,这也是大家吐槽最多的点。 即使用 solo 模式输入相同提示词,不管是上传设计图还是粘贴网站地址让它复刻,我试了多次基本都无法实现。但 我发现用它来做 app 优化却格外实用,这也是我一直用它的原因。首先, tree 个人版是完全免费的, 不用像其他 ai 编程工具那样时刻算计 tok 使用量。你可以毫无成本的让它先分析代码输出、优化方案,再从它给出的诸多方案里挑选合适的进行代码调整,改出来的代码不仅精准,质量也很高,其实只要用对方法, tree 的 实用性一点都不差。其次,很多人都会吐槽,让 ai 修改某个功能时, 他总会顺带改动无关功能。这其实不是 tree 的 问题,而是所有 ai 编程工具的通病。我摸索出的解决办法是,每次修改功能时,把需要调整的部分截图发给他,明确指定只修改图中的功能或逻辑,这样操作基本能杜绝 ai 乱改的情况。而这一点也得益于 tree 的 免费, 能让我们毫无成本地通过发图精准指定修改需求,特别实用。 tree 国内版虽仅支持国内编程大模型,但限阶段国内大模型的发展速度十分迅猛,像 dob code、 glm、 四点七这类模型实测测评的表现都相当惊艳。 接下来结合实际开发案例作对比,带大家直观感受 tree 在 代码修改场景的实际能力,也给大家提供实操参考。本次实操需求很明确,用 crypto 杠 gs 替换原有方式实现的签名算法, 这个需求的核心只是更换签名插件,重写代码。原有签名算法的逻辑已经完全实现,属于基础的代码替换类需求。我先尝试用 kiro 来完成这个需求,整个过程耗时足足半个小时。 kiro 虽自动编写了测试用力也对比了原有算法逻辑,但始终无法完成正确的代码修改,还给出了诸多错误结论, 甚至让我误以为是 api 接口存在跨域问题,额外耗费时间去找客服排查问题,最终问题仍未解决,无奈之下切换到 tree 来操作,按这两步执行即可完成需求。第一步,让 tree 先深度分析原有签名算法的完整逻辑。第二步,直接下达指令,让其用 crypto 杠 gs 替换原有签名插件重写代码, 没想到一次执行就成功完成了修改,代码可直接正常运行。但是这个实操案例就让我对 tree 的 代码处理能力刮目相看,也让我更加坚定了继续使用 tree 的 想法。作为技术开发者,很多人会更偏爱海外的 ai 大 模型,毕竟 gemini 三 cloud 这类模型的表现确实足够亮眼。 但这里要给大家一个实操建议,千万别忽视国内 ai 编程大模型的发展速度,看看 tree 的 版本更新,日制能明显看到它一直在高频迭代。 嗯,我明白了。新人或者想进阶的同学还是建议直接从吹一入手,免费无门槛功能,完全能满足日常开发代码优化需求, 性价比和实用性都很可观。好了,你学会了吗?那这一期的教程就到此结束了,咱们下期再见。

我觉得目前的 ai 编程对大多数人来讲,做数据分析处理汉格式化才是最实用的,这个确实是能够给工作和生活带来便捷。前段时间初一发布了一个周年庆的活动,我是免费用户,领取了六零零的高级模型,快速额度,一直也没使用。今天我手头业务暂时告一段落了, 我突然发现一个问题,我接单项目和账单的管理,我一直是使用 excel 来进行处理的,我觉得很不方便,然后我就突然想到搞一个项目管理工具来帮我处理这部分数据,那工具的开发肯定是要使用 ai, 刚好我想到初一的免费额度还没使用,留着也是浪费,正好试试初二模型。然后先给他留下我的需求,让他给我规划一份开发的方案, 然后他理解我的需求后,给出了一份初步的方案文档。紧接着我看了一下他给出的方案,有一些细节的地方我继续跟他掰扯,因为是拍模式,他不会直接执行,要等全部确定好之后才开始。最后这里给出了一份完全符合我需求的文档,我看了一下没啥问题,然后就让他开始执行了,这里还是选择的主点。二,按照我们沟通好的需求文档一步一步地进行的开发,期间我基本上没怎么管,然后开发好之后,这里还给我总结了一下, 这里告诉我一共产出了多少行代码。接下来就是我开始进行测试的过程,因为基本上很难一次性就直接能够一比一的把咱们的实际需求完全开发出来。这里是我第一次测试,有点前端的小 bug, 我 直接截图给他,然后用大白话告诉他什么问题,他很快就给我进行了排查焊处理。然后后面就是我一系列的问题测试焊他的排查处理。这里是我觉得前端不太好看,于是我就找了一个 u i 的 提示词,然后切换了一下 demo 三 pro 模型,因为 demo 三 pro 处理前端效果很好。然后接下来就是他巴拉巴拉的一顿修改, 要是我巴拉巴拉的一顿检查还提出我不满意的地方,这里是因为我英文不太好,所以我想着只要是我能看到的地方,我都需要中文显示。然后我依旧是截图加大白话,它依旧是巴拉巴拉的一顿检查加修改加输出。 最后我觉得没啥大问题,就让他给我打包了一下,因为我使用的是 windows 系统,我觉得可以直接打开使用的应用比较方便,所以这里打包处理一下就比较好,要不然我每次使用还得去找项目文件。 ok, 这就是最终的效果。功能不是很多,但是确实对我来说很实用。首先这里是项目管理部分,这里我可以添加项目 有项目名称,客户来源,项目的状态,项目的价格,还有接单交付开始结束的日期,项目的需求需求,这里我还添加了一个文档上传,这个也是很方便,我就不用担心项目文档的管理了。然后项目列表这里做了卡片式的处理,一个是一个很清晰,不会很乱, 点击项目卡片,还有项目的详细情况,这里还可以添加此记录,比如 bug 修复,功能升级等等,然后后续的这些服务的费用都会自动增加,计算到这个项目的总金额里面。 设置这里我做了两个功能,一个是主题的切换,这里可以切换全局的夜间模式,晚上使用这个小工具也不会觉得晃眼。这个我只给 ai 说了一句话,它的效果还是挺不错的。然后这里是数据的管理,这个项目因为是本地使用,所以数据处理使用的 sq i i。 然后浏览这边,可以看到我的项目数据,当前进行中,已交付本月的项目数量以及累计成交额等等。下面做的数据格式化,接入了一个图标,能够只观察看我每个月的项目收入情况。右边这个是对项目成交额做了一个排序, 然后下面这个收入组合查询,就是可以根据员粤汉项目进行精确的数据查看它分析,这样可以很清晰地分析自己每个月或者每个项目的收益情况。 项目这里还可以一键修改交互状态,这个也很方便,不用我再整理一个个的表格了, ok 呢,大概就是这么多,我这个小工具整理下来大概花费了三百多额度,反正是官方免费送的,不用白不用。好了,那本期作品就到这里,关注主播,持续给小伙伴们分享一些实用的 ai 编程经验和经历。哦对了,最近又找到一个免费的 a b i, 每天下午十五到十七点无限额度,爽用,需要的找主播。

今天教大家用国产桌面使用 u i x pro max skill, 让桌面写 ui 界面更高端。用上这个神器, i 编程插件、 ui、 u x p r o max skill 自动适配格式、 create code 等开发软件。打开桌面,再打开这个文件新建终端。我们先来 get up 复制指定到桌面 创建智能体, 把 skill 提示词复制粘贴到智能体中,生成高端的网页提示词。稍等几分钟, ai 正在努力开发网页中,它根据 skill 知道我们的需求,分解成十个任务,还会通过拍山读取预设的风格,比如颜色、字体、布局等, 这些都封装在设备的文件中,支持各种框架, vr、 微 o, a, c, m、 l 等各种模块,超 x、 color styles 等。这段是发给出的中文提示词,我们看看到时候是否符合提示词的要求。 对话框、行动按钮、 ai 功能、特色卡片等,还有骚气的紫罗兰色点缀,你说是不是都齐活了?想要使用方法的自取。


上期我们分享了去的认识和安装,分享了安装的一个途径以及常见问题解决方法, 本期我们将分享第二部分,就是去的界面功能导览,我们不做过多的功能分享,只分享常用的功能,我们直接上手使用即可,其他的功能大家在使用的过程中可以慢慢的去探索。现在我打开了这个去,这就是我们正常打开的一个主界面。 首先第一个分享就是在我们使用的时候要有一个创建项目目录的习惯,就是在这里可以看一下,我们可以打开文件夹, 然后去选择文件,选择文件之后就是后面我们在生成的任何网页内容,任何文件都是基于我们创建的目录保存的,这样方便我们后面的一个规划和整理。 如果是打开已有的项目,比如本地我们已有配置好的微信小程序的项目,我们在这里直接选择打开文件, 选择微信小程序的项目文件夹即可。当我们打开之后,我们第一次对话,就先让他去分析项目,然后去认识项目,这是第一个使用的注意事项。 然后下面我们直接进入界面功能导览,它的界面也是非常简洁的,左侧就是资源管理,包括一些文件搜索,还有常用到的 就是这个扩展,扩展的安装就是我们比如运行 python 脚本,可以通过这里去安装扩展程序,然后中间部分它就是中央的主工作区代码编辑器。 右侧就是 ai 对 话区域,它有四个模式,第一个就是 chat 模式, chat 模式就是和 ai 聊天,问问题,提需求,学知识。然后第二个就是这个 build 模式,它适合让 ai 帮助一步步写代码,这里就像搭积木一样。 然后第三个就是这个 m c p m c p 就是 这个 build 的 升级版,它可以自动调用工具,它会更加聪明。然后最后一个就是这个 solo 模式,它的功能是比较强大的,它能做的就是让 ai 独立完成整个项目,它就像一个全自动的程序员, 当我们切换到这个 solo 模式之后,它的界面会有一些改变,在 solo 模式下,最左侧它是任务列表, 然后中间区域就是我们的 ai 对 话区域,最右侧就是我们这个代码区域,它的功能是比较强大的,它可以是编辑器,可以是终端,可以是浏览器,当我们打开浏览器的时候,它这里可以直接预览,生成的一个效果都是可以实时预览的,还可以去选择元素直接修改, 功能比较强大。然后编辑器功能就是我们生成的代码,他会实时的一个展示,然后选择编辑器模式之后右侧就会有这个资源管理器的一个区域出现, 这是关于 solo 模式下的一些常用的功能,在这里我实操演示一下,我们看他生成的一个效果,以及看他的一个强大功能,在这里我输入提示词,就是让他帮我做一个简单的今日心情记录器, 让它生成 html 网页。关于这个模型选择,这里如果我们选择凹凸模式,这里就不支持我们再去选择指定模型了,如果我们关闭之后,我们就可以选择指定模型,在这里我选择 glm 四点七,然后我们直接发送就可以。 好,这时候就帮我们生成完成了,然后我们选择保留,然后我们预览一下,这就是生成的一个页面效果,比如我们输入开心,然后保存心情, 可以看一下,这里就保存了,它是基于浏览器存储的,如果我们点击刷新,我们保存的内容就会清除掉, 这是关于生成的这个界面,也就是我们有了这个 ai 编辑器,我们就可以把想法变成一个小的作品,小的工具,这就是这款工具的一个强大之处。现在我们是 solo 模式,如果我们是想退回到 ide 编辑器模式,我们选择左上角切换, 可以看一下,这就是我们正常的 ide 模式。关于这个模型选择,这里同样也是,如果我们选择 auto 模式,这里就不支持自定义选择模型了,如果我们关掉 auto 自动模式,这里就可以去选择模型, 这就是关于这个 tree 的 功能导览分享的,这些都是我们经常用到的一些功能。好了,本期内容我们分享就到这里,我们下一期我们将分享利用 tree 创建 scale 和使用 scale 的 方法。好了,本期内容分享就到这里,我们下期再见。