同学们大家好,今天给大家分享的是对优乐二十六模型进行代码下载训练验证和导出全流程的一个讲解, 然后简单的分成了八个步骤,分别是官方文档的一个讲解,以及对我们这个优乐二十六代码进行一个下载,并且找一个数据集让他去训练一下,然后验证一下,检测一下,最后把我们这个 pdf 去导出一下,那么也就完成了我们这个优乐二十六的基本所有的一个功能了。 那么首先去进行一个第一步我们官方文档的一个简单的介绍,我们进到这个 ultra 优乐二十六里面来看一下, 嗯,他说的是主要为边缘和低功耗设备而设计,消除了不必要的复杂性, 我们来看一下它都做了哪些创新。一是消除了 n m s, 通过消除这一个后处理步骤,推理速度变得更快了。二使我们部署效率提升。三是把我们这个 s g d 变成了 m u s g d, 使得我们这个优化期变得更加的稳定和有更快的一个收敛啊,同时它也在分割以及我们这个姿态,估计上面有一个不错的效果。 那么其实对于我们这个检测的话,它的这个修改的部分并不是很多,然后最后它在 cpu 上的运行速度提高了百分之四十三,然后这个就是我们对官网的进行一个大概的讲解。二是我们代码的一个下载,我们打开我们的 give up, 然后输入这个 u l t a l y t s, 把这个代码给下载一下, code down zip, 那 么我们就把这个代码放到桌面吧,然后对它解压缩, 呃,我们找个地方放一下吧,要不太乱了,我们创建个文件夹,叫做我扣的一 把代码拉到最下面,然后用排插把打开, 那么我们就把我们这个代码给下载好了啊,同时也要去找一下我经常使用的一些文件,然后方便我们去更好的使用这个代码。我们把这个 data 复制到里边,然后放到这里边, 然后一会我们就使用 data 里面的这些文件,对我们这个代码进行一个训练,然后我们去找一个数据集,那么我们就用这个 river flow, 然后去做一个检测小猫的一个图像,我们找一下 cat, 然后它有两百张图像,那么我们就把它给下载下来,然后它的一个规模也比较小,然后这个猫也长得很漂亮,我们下载这个优乐二十六,当 data set, 然后当 zip to computer, 那 么它就会把我们这个小猫的数据机给下载好,我们把它进行一个复制,然后把这个数据机放到这里面,然后对它进行一个解压缩, 那么它会生成我们的训练级、验证级和测试级这三个图像文件,以及一些我们数据的说明文档和我们这个 data 叠加模的一个文件。我们自己设置一下 data set, 把这些图像和标线文件都放到这里面, 然后我们打开这个 ultra sim, 啊,我们已经打开了,然后点击这个 dota, 点击这个 dota 里亚姆,首先要设置一下我们这个数一级的一个路径,呃,我们把这个名字和类别数首先给它替换一下,然后这三个图像的路径,我们分别要给它也替换一下, 分别放到这里,然后这是我们训练级的,这是我们验证级的 啊,这是我们测试期的,我们把这三个图像的路径放到这里面,然后这样我们就准备好了我们这个数据机,数据机下载并准备,我们就做好了。然后第四个是我们环境的一个介绍,我们使用的环境是 padlock, 然后在这里面我们要进入到这个 office man 的 这里面,用 open in terminal, 然后首先把这个网络给关了, 然后使用 pad 三 install 杠一点去把我们这个代码的 altos 给打爆一下, 那么它就会提示,然后我们就可以去训练我们这个代码,我们来看一下我们这个包里面都有什么,一些核心的包使用康纳利斯,大家看一下, 我们有这个 touch, 我们 touch 是 二点一点二的,以及 touch audio 和 touch v 以及这些 p y project 的 这些宝都需要满足, 那么这个就是我们这个数据级的一个准备,那么下面就可以训练我们这个代码了。我们打开这个串点 p y, 然后指定一下我们要训练哪个模型,就例如我们想要训练这个 yellow 二十六点压模键,那么我们就把这个路径放到这里面, 如果你不知道这个在哪的话,它是在 altus 的 config 的 model 下面,你看从这里有从 v 三的, v 五的六八九十十一,十二以及二十六以及阿里德的这里面全都有,那么我就把这个 ym 文件复制到这里面, 然后再指定一下我们这个 data 点 ym 的 一个路径,那么再指定一下训练的轮数 by size 以及 min 的 size 以及 ip, 那 么就可以训练了,我们给大家示范一下 啊。从这里可以看到使用的 ultra ticks 是 八点四点八的, python 三点八的,它是二点一点二的,然后这是我们这一堆的参数,然后这里面全都有, 以及我们这个网络结构啊,从这里可以看到它和优乐十一 n 没有很大的区别,它们都是使用了 c 三 k l 以及我们这个 spf 以及 crpsa 以上彩色测测头,然后这是开启了混合精度计算,然后把我们这个图像给加载一下,然后就开始训练了, 因为训练的速度很慢,然后在这里就不给大家完全从头到尾去训练完成了,我的这里面已经有一个训练得到的这个文档了,然后他也是一个小猫的一个文档,那么我们就把这个春舞也放到我们这个 我们的这个代码的这里,然后再把这个给停了吧,因为他确实很慢, 那么这个就是我们训练,那么下面我们需要对它进行一个验证的操作。 嗯,我们得到的这个春舞的一个训练结果并不是由我们这个 dna 赛的训练出来的,而是我们的这个 kite 里面的这个 dna 赛的训练出来的,那么我们就需要用这个里面的去替换一下吧, 然后那么我们就可以对它进行一个 vr 的 操作了。首先打开这个 vr 点 py, 然后把我们的这个春舞这个里边的 best 的 pt 的 路径放到这里面, 然后指令一下,我们使用的是 data 亚姆下面的 split 的 test 的 六四零, 我们就让它跑一下,可以看一下, 那么这个就是我们对它进行 vr 以后的一个操作啊,它用的是优乐二十六 n 这个模型,然后它有五点二 g 的 一个复印件数量,然后这是它的一个总的 p r m a p m a p 五零到九五的一个指标, 这是下面的这若干个类别的小猫的一个种类的一个指标,以及它的一个结果保存在我们这个 vr 里,我们可以从这里看一下,它会生成 f 一 曲线, p 曲线, r 曲线, pr 曲线,混响矩阵以及一些图像等等, 那么我们就把我们这个 vr 做好了,我们就可以把这些数据贴到我们这个文章里面来,增强我们文章的一个说服力。验证也做好了,那么就可以检测一下。 呃,我们把这个 vr 的 这个 pt 文件放到这里面, d t c t 的 p y, 把它放到这里, 然后再找一个我们想要检测的一个图像或者一个文件夹里边的图像,就找一张吧, test 里边的隐秘着。 假如我们想要检测的是这个项目,那么就把这个图像加入它,那么把它重命名一下,把它变成一点 gpg, 这里面放一下啊,这是一点 gpg, 再让它跑一下, 那么它就会提示这一个图像检测成功,那同时它的结果保存在这里,那么就是 predict 的 它,那么它就会把这个小猫给框出来,同时标注一下这个小猫是哪个品种的, 我们这个就是我们对它进行一个 predict 的 一个操作,那么最后我们对它进行一个导出的操作, 导出使用的是 o n x, 我 们看一下我们有没有,我们没有,那么我们就写一个 o n i o n x, 找一下这个代码,点击这个 ultrodex 训练验证预测即导出, 我们就把这个代码复制一下放在这里面,然后把它擦掉,把我们这这个路径 s t p t 放在这里面, 测试一下绝对路径啊,然后让它跑一下, 那么它就会显示我们导出完成,嗯,它结果保存在我们这个位子里边,然后这个也是它的一个命令,然后这是我们网络一个结构,我们从这里可以看一下 open model 桌面,然后扣的一串五位子,那么这个就是我们生成的一个 o n x 的 一个文件,我们打开它,我们可以看一下,那么这个就是我们这个整个网络结构, 同时它的 o n x 也保存在了这里。嗯,好了,这就是本次要给大家分享的我们这个 yellow 二十六模型的一个全系列的一个操作。然后如果你需要这个代码和文档的话,可以关注加三连私信邮箱即可获取。如果你觉得我视频讲的不错的话,可以进行一个一键三连,拜拜。
粉丝1668获赞8474

大家好,这里是 call 顶茶水间。注意,昨天 uritalics 官方发布了 yolo 的 最新版本 yolo 二十六啊,通过名字可以看出来, yolo 呢,这次版本号命名为二十六,以年份作为它版本号的命名,取消了之前按照序号 的命名方式,说明这次的版本更新比较大啊。它这次更新呢,主要的特点在于有这么几个,首先呢,它 专门为边缘和低功耗的设备进行了设计,所以呢,即使你的设备没有特别良好的显卡,利用 cpu 的 预测也能达到一个非常良好的一个预预测效率。 另外,它还提到了它是一个原生的端上端的模型直接生成,预测结果没有取消了之前的一个非极大值的抑制方式,因为这一步的缺少导致效率更高,更清亮。所以呢, 刚才我们提到的插在 cpu 上的预测效率会会更快。另外呢,它还针对小目标的检测有更良好的优化效果。而且呢,引入了新的优化器,可以让训练更快更稳定的进行一个收敛和迭代。 它这里提到,呃,在 cpu 上的运行速度提高了百分之四十三,成为了目前在资源受限的环境中最实用的和可部署的优络模型之一。 好,废话不多说,我们这一期主要的视频呢,就是给大家看一下我们如何本地来 啊,运行部署和训练自己的 u 六二十六的模型。同时呢,我们可以比较一下和它上一代的最新版本 u 六二十六,它们之间的一个 cpu 的 预测性能真的如它所说有这么大的提升吗? 然后呢,为了进行我们模型本次的训练呢,这里提前准备好了数据集,数据集呢是之前在有一期我专门讲 u 六十二的时候用到的一个数据集,就是这个 石头剪刀布的手势识别检测可以,石头可以检测啊,石头剪刀布这三种手势,这里有一个检测效果的一个记复动图,大家可以看一下。 另外就是我们本次视频中所用到的数据集和训练后的 u 六二四六的结果都可以呢,发给大家,想要的小伙伴可以三联加关注,留下自己的邮箱。 然后数据集仍然是有训练级,验证级和测试级,我们可以看一下这个数据集的这个代码文件 一共呢有三类,然后三类分别是 paper, rock 和 series, 也就是剪刀石头布这三种类型, 然后训练级大概有六千四百五十六张图像,这个数据集还行呃,这个数据集基本能够达到我们预期的一个检测效果。 然后我们打开 utero tex 的 官网的 github 官网,把它的代码呢最新的代码克隆下来,或者我们直接把它的通过这里把它的压缩包代码压缩包下载下来。 下载之后呢,我们本地可以提前创建一个一个叫 ulu 二十六的文件夹,然后把代码中这里的 ulu 二十六的文件夹单独把它拷贝出来,放到我们新建的这个 ulu 二十六的文件夹里头去。 然后我们打开 vs code, 导入我们创建好的 url 二十六文件夹。后面我们的开发工作呢,就是在 vs code 下的这个 url 二十六的文件夹下进行操作, 然后我们再回到 usualitix 官网,我们需要把 url 二十六的权重文件下载下来。 在这里我们先看一下它提供的一个性能数据。在这个 e c l t x 官网上有一个模型,左边呢有一个 u 六二十六,它这里提供了检测在 coco 式数据下的一个 性能参数啊,我们可以单看 u 六二十六 n 这个模型,也有它这个最小的模型里头,关于速度, cpu 在 o x 导出的情况下的一个呃,读取时间以毫秒为单位, 大概是一个三十八点九毫米,有上下零点七毫米的一个误差。然后我们可以再看一下同样的在 u 六十一,因为 u 六二十六它这个模型是没官方没有提供 cpu 的 一个处理速度的,我们以 u 六十一为总, 它这里提到的 u 六十一,同样在 qq 数据数据集下的 u 六十一 n 的 一个速度, cpu 预测速度是一个五十六点一毫秒,所以呢,按照官方的这个显示来说,从 五十六点一毫秒下降到了三十八点九,确实提升很大。然后可以稍微留意一下,这里会有一个 m a p 五零杠九五的一个精度的一个数据, 这个呢,在 u 六十一 n 是 一个三十九点五, u 六二十六呢是四十点九,这个题是基本上是微乎其微的, 所以它这一代 u 六二十六的模型,我这里预测可能最主要的优点呢,特色呢,就在于它能够极大地降低了在 cpu 模型上的一个预测速度。 好了,我们接着进行点击,这里呢, u 六二十六 n 可以 把 u 六二十六 n 的 预训练模型下载下来, 我们保存到 u 六二十六 n 的 一个文件夹里头去, 然后我们把刚才我们的数据集也拷贝到当前的目录里里面。 好,这个时候我们应用训练模型准备好了,然后优乐的框架的代码 user latex 也拷贝进来了,然后数据集也准备好了,下一步我们就要构建一下优乐优乐训练一个需要插件的环境。我们打开终端啊,我这里用的是一个 mac 的 一个系统,大家如果用 windows 的 话,道理是一样的,打开命令控制行就可以了。当然这里提前大家需要 啊,配置好对应的开省或装一个 vs code 的 这一步我这里就省略了,有兴趣的小伙伴可以看下我之前的一期视频,有关于优乐十六十二的一个 呃,讲解那个讲的比较详细,那个步骤都有啊,我这里就打开终端之后创建一个优乐二十六的一个虚拟环境。 大家如果电脑装有 mini cuda 或者 android cuda 的 话,一样的,或者呢,你直接在你新装的 python 环境下直接运行也 ok。 我 这里通过这个 python create 一个 u 六二七六的一个虚拟环境,然后我用一个 python 三点一零的环境, 然后把虚拟环境激活一下。 好,激活之后我们再回到 ulo 的 官网上,在它这个快速入门这里提到了安装,其实它的环节很简单,直接通过这个 pip install 杠 e o utility x 杠 e o 这个命令呢,可以不用, 不用去显示调用它,它表示我们要去强制升级。如果我们创建的虚拟环境因为是一个空的,所以呢直接安装它即可。我们把这个命令复制一下,然后回到终端,把刚才粘贴过来的指令给它粘上去, 然后我们回车。 好,这样就把它所要求的包都安装完了,我们就可以回到 vs code。 可以直接先看一下 yellow 二十六的一个预测效果,我们直接拿它的嗯,拿它的传统文件来预测一下它本地模型所带的图片,看看效果如何。 我们先新建一个文件, 我们先把呃 yellow 的 包导进来,通过 from 这里先保存一下吧, 保存为呃内点 p 万吧,然后我们 from utrivox 这个包把 yolo 导进来。然后第一步我们先,我们先粗制化一个 model, 这里呢,我们需要载入我们刚才下载好的 yolo 二十六 n 的 传送文件。 有了这个模型之后,我们就可以直接用这个模型来预测对应的图片了。图片我们可以使用 utilix 这里头提供的。呃,两个四维图,在这个 utilixouch 里头有一个 bash, 还有这个两个人物的一个图片,我们分别可以看下效果。 呃,直接在 model 里头传递对应图片的路径 啊,这里这个路径扫一个 a search, 然后我们可以把 route 中的结果直接展示出来, route 零的授,然后定它的寿命里,就可以把我们预测的图片的结果拿到,我们可以用心看一下效果 好。结果出来了,可以看到他可以把前面的人 person 展示出来,还有后面的这个 bus。 好, 我们再换一下第二张图片,第二张图片是这个, 然后再看一下效果好,第二个图片也没问题,要把两个人识别出来,包括这个人,他带着这个领带。 好,这就是我们拿 u 六二十六的这个预训练群众文件来直接预测它模型本地的图片的效果。那么下一步我们就用 u 六二十六来训练一下刚才我们自己的这个石头剪刀布的手势的数据集。 我们再重新创建一个文件,先保存一下,这里改成 make。 然后呢,第一步,我们可以仍然把 yolo 导进来 啊,仍然。第一步,我们先创建一个 model, 然后在 yolo 模型里头仍然传递我们的域训练全量文件 yolo 二十六 点 p t。 然后呢,我们通过这个模型直接调用渲染的函数, 我们把这个 tree 的 代码直接粘过来 model tree, 然后 data 这里呢,我们要传递成我们刚才呃, 数据集这里头的这个 data tree, data 下的 data 呀,代码文件就是这个文件,所以这里路径我们得注意写对 to date 下的 date 点样板文件。然后我们训练的迭点次数是一百轮,然后图片呢?载入的图片载入的一个默认次数规划尺寸是个六四零。 好,这样的话我们其实就可以直接来运行我们的一个训练方法了。 啊,这里有报错,我们看一下啊,报错是它这个样板文件里头的数据集找不到,我们做一下调整, 我们在 date 页面这里头呢,可以再增加,把这个 pass 改一下。这个 pass 写的不对,这是我之前的一个路径地址。嗯,改成这个 地址我直接粘过来吧, 是这个地址,嗯,这是我们桌面上的一个 u 六二十六文件夹对应的 print。 好, 我们再次来运行一下这个修改函数。 好,这次没问题,训练开始了,但这里会有一个细节,就是我们为了验证我们的 c p u 的 性能,所以呢,我们这次在安装环境的时候,直接默认装的官方呢提供的那个方法。呃,所以我们装的这个 test 呢,是个 c p u 的 版本, 所以 cpu 虽然说 u 六二十六它有一个很大的性能提升,我们也是为了验证一下 u 六二十六的 cpu 性能是否有非常好的一个预测效果。 但是我们训练的时候仍然需要找一个比较好的显卡的一个电脑去训练它,因为用 cpu 训练的话还能时间比较久, 所以这里呢,我给大家演示到这里以后,把这个训练呢放到服务器去训练,然后用服务器训练后的模型,我们去验证一下 cpu 的 一个预测效率。 大家可以看到这里头提示的,用 cpu 训练的话,一轮大概需要三十九分钟,那这个时间要训练一百轮的话,那就时间很久了,我这里就先停止了,把它放到服务器去训练。 好,这里我已经把服务器租好了,这里可以看到我们服务器用的是五零九零的显卡,那这个显卡训练是很快的,然后我已经把我的刚才的 u 六二十六的压缩包拷贝到拷贝到服务器目录了,我们把它解压一下, 然后我们 cd 进对应的目录里头去, 然后直接运行我们的嗯, tree 命令啊,这里的 python 可能得再去改一下,就是刚才我们这个 tree data 里头,因为这个路径用的是我电脑的路径,所以得改成,呃,服务器目录的路径。 好,我们运行试一下,直接 python make tree 点 p y 啊,它这里头需要先下载个 uno 十一 n 的 一个全场文件,因为有一个精度较验的一个操作,它可能需要用到这个 uno 十一 n 的 全场文件。 好,它已经开始训练了。这里可以看到训练一轮大概是二十多秒,这样的话速度就快了很多。我们训练呃一百轮的话,就是时间基本上用不了一个小时吧。 这里训练就给大家暂时先跳过了 two thousand years later 好 了,这样的话就训练结束了。训练结束后,它会把这个训练的模型保存在,呃,有个同级的 r 式目录下,然后 detect 我 们是这个翠舞,前面是之前训练的一个结果, 然后翠谷,这里头就是对应的训练各种各样的一个图表的结果和对应的这个权重文件。我们先把它压缩后下载到我们的本地,这里我已经提前压缩好了, 然后拷贝到本地。之后,我们还是把它放到这个 rush detect 的 目录下啊。这里头的性能曲线我们大家可以瞅一眼,这个基本上跟之前的模型可能相差不是太大。我们本次呢也主要看一下它在 cpu 上的预测速度是不是有如官方所说有大幅度的提升。 呃,我们先直接来预测一张图片,先看看预测效果如何。这里呢,我们把模型要改成啊,把六六六二十六的模型改成我们训练的这个模型。这个模型的地址呢?就是啊, run detect, 然后是翠舞,然后是 richfast, 这是我们刚才从服务器训练好下到本地的这个全中文件,然后图片呢,就选择我们这个 数据集里头的一个图片吧,然后数据集是在 trace data 目录下 推荐的目录,我们可以随便找一张吧, 我们看选哪一张,它这里头有一些是啊干扰的图片,就是为了让模型有更好的放大能力, 用这一张吧,我们看一下效果 好没问题,他把两个人的手势都是 rock, 自信度呢也有对应的零点九四和零点九五都识别出来了, 下面我们就可以把验证一下。呃,用 yellow 十二和我们这个 yellow 二十六都去检测同一张图片,它们之间的一个时间差大概是多少?我们回到我们的代码, 我已经把这个 yellow 十二的全能文件拷过来了,就是在这个 u 六十二 n, 为了方便比较呢,我把刚才那个翠物的名字改成了翠高 u 六二十六 n, 这样的话方便来区分它们之间的一个路径,所以这里我改成翠 二十六。嗯,翠 yellow 二十六 n 这个 model 呢,我们可以写一个二十六吧,然后我们同理再粗式画一个 u 六十二 n 的 一个模型,然后这个写成十二。嗯,这样的话我们就有两个抽象的模型呢,一个是 model 二十六,一个是 model 十二,分别表示 u 六二十六和 u 六十二的模型。 然后图片我们可以把图片路径先写下来吧。图片呢,就我们刚才呃找的这个图片, 然后下面我们就分别可以让它去预测一下这个图片它们所的所用到的耗时。一个是用用 model 十二来预测, 我们把它改成 model 十二,预测得到的是 route 十二的结果,然后这个是 model 二十六,呃,返回的是 reroute 二十六的结果,然后我们需要在两两个的代码中预测的时候加上时间的一个统计, 接着呢,我们先导入时间的这个包, 然后我们在每次预测前和预测后统计一下它们的时间差 啊,这块代码略繁琐,我就直接给大家跳过了。我们可以看到,在 yellow 十二在预测之前,我们先计算一下它的时间,然后预测完之后,我们看一下它的预时间的一个差值,然后同样呢,在 yellow 二十六这里头,我们也统计一下它们之间的时间差值,然后我们再把对应的这个时间差值打出来, 把它们的叉值呢都已经通过 logo 打出来,然后看一下时间是否是如我们预期所示, u 六二十六呢,会有一个比较大的提升。我们来运行一下代码 啊,这是两个结果,两个结果的话啊,是自信度上有一点差异,但是,但是检测的效果呢,都是一样的,基本上。 然后我们这里可以看一下时间啊,这个时间确实很明显, u 六二十二 n 呢,用了一百二十毫秒, u 六二十六 n 呢,用了六十七毫秒, 确实将近一倍的提升,时间呢,几乎降低了一半,那么说明 u 六二十六 n 呢,确实相对之前的模型在 cpu 预算上有大幅度的提升。 好了,这个就是本期给大家介绍的 u 六二十六的介绍,包括我们通过 u 六二十六来训练自己的模型,并且验证了它的一个预测效果,是否如官方所述, cpu 呢,有有大幅度的提升。

最近把这个标注工具给完善了一下,然后现在的话支持三种标注方式,分别是矩形、多边形和旋转框。我以这个旋转框为例,我觉得这是一个比较有创意的标注方式吧, 然后我用过很多旋转框,现在的话,呃,我总结了好多的这个各家的优点又缺点,所以说 通过键键鼠还有这个鼠标中键可以啊。旋转现在展示的是一个自动标注的过程,这个是通用的,而非是预训练模型,这个是用的一个通用分割模型, 支持大概能支持一百万种类别,常规的话生活中常见的是比较准确的。 然后现在的话是一个关联关联标注模式,通过一个提示点可以标出嗯,整张图片里同类别的其他点。 然后现在展示的是啊,提示词标注是基于语言语言视觉分割模型进行制作的,然后这些都是自动标的 这个标注。还有这个编辑是比较简易的删除键,利用了各种快捷键,然后可以看到这个手很小也可以标的标标注出来。 这个展现在展示的是一个啊多边形闭合算法,通过简单的一些算法是非法多边形进行纠正。我们人手工标注的话是比较麻烦的,所以我们直接用 通用模型去进行分割。自动标自动标注,看得出来它是比较精准的, 这是分割七十字标注,这些都不是预训练模型,而是一个通用模型,大概可以支持啊百万种类别,用的是 sim 三前段时间出的,然后我现在又以进行训练嘛, 以我之前那个数据集进行训练, 一般来说这个四零六零就可以完美运行实时实时化训练指标, 我们可以下载这个历史的结果嘛,然后我训过了,所以说就不在这里再训了,我直接去下载已有的这个结果, 然后可以解压缩, 可以看到这是就正常的这个训练的这个数据吗? ok, 这就是整个项目代码。

今天给大家演示一下如何精准自动标注目标。 首先手动标注几个目标, 接着选中你要自动标注的目标,右键鼠标选择,以此目标标记剩余样本图。这里提供了两种方式,原理都是以找图的方式去标记剩余样本图。 我们可以看到样本集里的图片,所有相同的目标都被标记了出来,并且是完全准确的。 右键目标框就能不断往后标记剩余的样本。 接下来我们介绍第二种方式,打开自动标注控制台。 这里我之前已经用少量样本训练了一个参照模型,把参照模型加载进控制台窗口, 输入模型的尺寸参数, 我们先选中 j l 和 j a, 分 类看一下模型原始的标注效果。点击标注, 可以看到标注出来的框是有偏移的,不是很准确。 如果我们想让模型标注出来的目标框是完全准确的,可以使用精准标注功能。 这里我们直接使用大墨工具来框选精准坐标。 首先使用大墨工具绑定画板页面, 精准地框出目标的坐标范围, 将目标的坐标范围填入表格内, 这里给大家演示一下填了数据之后的自动标注效果。 可以看到这两个图标标注就是完全准确的了,其他的依然是歪的。 填好的数据可以直接导出成 txt, 以便以后使用或者发给别人使用, 同样可以导入已有的数据文件直接进行使用。 接下来就选中所有的分类进行自动标记, 现在可以看到自动标记出来的是非常准确的。 下面开始进行训练,切换到训练页面,在训练例三时,如果你想要最好的识别效果,可以选择自动计算尺寸参数, 点击确定。例三开始训练了, 如果你想训练 le 八,切换到 le 八页面,选择你要使用的训练环境显卡版本,高的就用第二个版本,低就用第一个。 v 八已经跑起来了, 并且右侧开始绘出曲线图,曲线会逐渐下降并趋于平缓,当红色的曲线趋于平缓的时候,则可以停止训练。 训练了几分钟,曲线已经平缓了,直接关闭训练窗口。这里我们直接让软件输出免环境清亮模型, 直接点击开始转换,将模型输出到刚刚创建的文件夹里, 下面我们来验证一下该模型能不能进行识别。目标,将模型拖入验证页面编辑框里, 选择一张图片 能进行识别了。 下面我们再来训练一下 v 二六模型,方法和立八基本是一样的,也是直接点击训练就行了。 v 二六已经跑起来了, 方法也是和之前一样的,输出 v 二六的免环境模型, 同样的方法对模型进行验证, 模型已经可以识别了。 好了,谢谢大家观看。

ok, 小 伙伴们,本期呢,我们进行一期优乐二六的最新改进系列的更新,本期呢是进行了一个双卷集合的一个卷机的操作,改进好本期的内容啊,比较简单。第一部分呢,我先带大家跑通塔,然后告诉大家如何来跑这个模型就是改进的模型。 第二个呢,跟大家来说一下这个写作的相关内容。第三个我带大家走一下这个云服务器,它的搭建环境非常简单啊,一分钟就 ok 就 能搭建成功。 然后最后给大家介绍一下相关的项目嘛。首先第一个啊,先带大家来跑一下吧,我们打开这个环境,无论是云服务器还是这个 本地环境都是一样的啊,大家打开寸,这些寸啊,都是我给大家写好的寸,然后进来以后大家只需要改这个就行,那这个怎么改呢?你要跑哪个模型,就在这里面 model 二六是吧,这个是我们改进的资料包,里面有近四十五种改进,然后你随便排列组合,完全够你发个几十篇,几百篇写,完全够用, 只要你时间够用,只要你能有时间去写,绝对够用啊。朋友们,那我们本期代表的跑的是这个这一个模型,你看啊,从这里面右键 右键以后,在这里面它有重构,用这个吧成倍名,然后 ctrl c, 对 吧,就 ok 了吗?对不对? so easy 啊, so easy 啊,就是怎么能省时间我们就怎么搞,大家千万不要浪费太多的时间啊,开顿挫,然后这样他跑的模型是啥?就是 u 二六和 d o e l, 我 给大家看一下,我把它放到了 这个地方。 ok, 我 们看一下跑的,我们看一下他跑,跑的时候一定会打印出来,他的参数量一般也会发生变化,就是网络成数啊,乱七八糟的,会发生一定的变化,那么他就肯定是成功了,然后最后他的结果肯定也是不一样,大家可以看在这看到了吗? d u a l 解 con 改进来了,然后我们能跑通就行了, 就 ok 了。然后这里是他的一些参数,大家别忘了看一下啊。好,还有一个你看寸,这是他的训练数据集,大家可以对应看一下这个樟树是不是你自己的樟树,还有 v e l 对 不对啊?好,这就可以了,就跑通了啊,在这里就不给大家再去这个赘述了啊, ctrl 加 c 就 终止。好, 那么你跑通了以后便写涨点了,那我这个模块我想把它放在文章里面,那么我们看它的原文,这个原文在这里啊,这是我的这个博克 csdna 棒棒牛,然后大家看原文,然后从这里点进去,然后看一下详细的看啊, 在这里啊,我想跟大家提两个点,就是你要写这个模块的话,我们的亮点在哪里?或者说我们可以有哪些可以把它的文章的东西拿过来直接放进去。首先啊,它这一个模块提出来的时候,它对比就有啥,就有数据,这个数据, 注意大家小伙伴们,这个数据你可以直接拿过来用,但是你要引用他,但是你可以直接引用过来以后放一个表格,这个表格放上去会极大的丰富你的文章,能明白吗?而且这不主要的是这部分实验不需要你去做,如果你自己做这部分实验的话,每一个几个月你肯定做不完的, 但是人家给你了,你直接拿过来用就行,而且用的时候它里面甚至就直接告诉你了,它的在优录的数据集上取得了一个多么好的效果,明白吗?你看显著提高了它的检查速度,并且在我游戏的数据集上提高了百分之四点四,那你为什么要用这个模块?等等等等,这不都有理由吗?这是第一点,第二点呢,就是 它解决了什么问题,它解决的问题就是我们想要的,那实际上在更多的这种,比如小目标多米啊,还是你的这个方向上,比如说 a 方向, b 方向啊,它都存在着 跨通道信息和原主输入信息保存的问题,因为这个信息他的流失,或者信息他的剔度剔减,或者说是他这种模糊啊,信息的丢失啊等等等等,他一定是存在的,如果他不存在,你的精度永远是百分百,对不对?所以说既然他丢失,竟然他不能,就是将特征毫无这个 损失的保留下来,那么这永远是我们的改进方向,所以说精度还有速度永远是我们的改进方向。这就第二点,大家涨点以后,拿着原文,拿着原文,然后详细的去看就 ok 了, 真的是非常主要是这一个模块他只要讲解真的是很有帮助啊,小伙伴们,对你的写作你可以省很多劲。还有他里面的一些图啊和表什么的,在这也就不详细跟大家去说了,到时候大家看着原文啊,这里面的图啊,表什么,你看这 些图和表很漂亮,拿过去用对比,拿过去用,可以极大的丰富你的文章,包括他的公式,你看这些对比实验,你说你你,你不用对不对?这都是现成的,为啥不用?对不对?你非要自己去跑吗?非要自己去搞吗?多费劲呀,是不是 看热力图等等等等, ok, 这就是这一部分,所以说这两角大家抓好了,应该问题就不大。接下来要看 auto d l, 大家点进首页这个地方点点应用, 然后在这里面大家注一下,搜索幺零零八六,一定是搜索啥?搜索用户啊,用户用户,这样的事情说三遍,用户点击还是没有对吧?因为选择镜像,然后剩下直接点击下载就行,直接点击下载就是优酷二六,你一键下载,这个呢是它的对比啊,或者是 read data 啊,或者说优酷 v 十三,优酷 v 十二等等等等, unet 等等, ssd 对吧? v 十一, v 八, v 九, v 十,还有下一页还有很多,大家都可以直接去对比,一键下载就 ok 了,非常非常的简单啊,这个就一键训练跑操,这个教程在我往期有,大家自己去看就行了。最后啊, 呃,最后一段打个广告,小伙伴们看到这没有什么东西了,如果你不需要直接划走,直接划下一个视频。好,优乐二六的目标检测持续更新,这个大家是最新的,我建议大家直接用最新的跑就行,就是优乐二六改进资料直接入就行,不用考虑。然后就是时间一对一指导,趁着过年这个时间段啊,大家的时间都比较充足,我的时间呢相对来说也比较充足, 所以我尽可能的去帮助更多的小伙伴,然后大家有需要的话可以直接来联系我,或者说也比较充足,所以我尽可能的去帮助更多的小伙伴。如果大家实在你这, 特别是大论文马上就要毕业了,你如果你实在遇到困难的话,你再考虑啊,一般来说优先这一个啊,我的时间也优先给这一个。好,本期的视频就是这些,最后呢,也祝愿大家呢,能像这个 dua l 一 样,既要速度又要质量, 精度又高,整哪打哪,加油吧小伙伴们,祝你们新年快乐,也祝你们呢,在新的一年里面能够旗开得胜,芝麻开花节节高,加油!

最近啊,很多同学在自己的必设和论文当中啊,想做一些计算机视觉相关的结合深度学习啊,去做一件事,那我们该如何去补充基础呢?首先第一点就是如果说你要做计算机视觉相关的啊,积极学习这件事啊,咱们暂时就可以先放一放了,因为传统计算机它基本上做不了视觉的东西, 以前你看用 c 域分离啊,做什么人脸啊,关键点啊,一些检测估计那是以前啊,现在基本上通用来说都是清一色神经网络,所以说咱们学基础来说,只拜深入学习,把神经网络卷积网络穿的丰满,我们花个一周时间,咱们快速过一下, 接下来呢,咱们再花个一周时间,把拍套的框架我们再熟悉熟悉,因为后卷咱们跑哪些,每一个原码吧,都是基于拍套框架去做的。再往下呢,那大家可能说,那我想去入门物体检测,我们该选哪些算法呢?其实最经典的就是优喽这个算法 拥有这个东西啊,给大伙当中啊,首先人是开源的,并且人家官方的社区当中本身就有教程,咱们按这个顺序学习啊,就是先去跑通啊,知道我怎么能把一个模型预测出来一个结果,这个非常简单,就配备环境,大概一个小时的事。第二件事,我们学一学如何训练自己的数据, 你的数据该准备成什么样的格式,你的数据标注应该怎么去标注,那标注的结果怎么用效果的模型训练自己的数据,我们能跑出来一个结果呢? 第二件事,我建议大家咱们去看一看基本训练,还有推理逻辑。第三件事如果说你更有时间,我们想深入细看一看 每一个步骤,每一个模二怎么做的?建议大家我们再深入到原码当中去,从零开始吧,我们 delete 一 遍,那比如优酷当中每一行代码去做什么东西,这样呢?我们算是对物体检测有了一个基本入门。

大家好,今天教大家如何在优乐模型里面插入极差极用模块,这里是六四个极差极用的模块以及它对应的论文。 我会使用一种标准化的方式教大家如何在优乐模型里面插入不同的模块。我会使用这个优乐二十六和这个 cbm 极差极用模块,举例子,其他模块使用方式也是同样的, 所以说咱们先要学会使用其中的一个,举一反三才会才能学会其他。第三个,这个优乐模型就是训练优乐模型,咱们还需要一个数据集, 数据集的话,我使用的是电力设备热成像红外故障检测数据,就像这样,它已经是一个标准的优乐格式了,你看它现在还分为训练级和这个验证级,现在都已经分开,标签的话 也是使用的是 text 格式,也是一个非常标准的 euro 格式,这就是咱们的数据集。接下来看下咱们这个 euro 二十六, 训练优乐,你必须得有数据集,数据集我是在这个 data yammo 里面定义好,这就是找到数据集的路径,就通过这个路径咱们找到数据集。数据集这里一共有六类,这里写的六,这就是这六类的名字,这六类的名名字。 接下来我会正式教大家如何在优乐模型里面插入其他模块。第一步咱们需要在这个 uttlix 打开这个文件夹, 再找到这个 n n, 找到这个 module, 因为咱们需要在这里插入这个 c b a m 这个机叉结构模块,我在这里已经提前插入了,我在这里重新给大家演示一下, 我先将这个删除掉,先将它删除掉,咱们我从头开始教大家如何去插入这个模块,咱们就需要右键 找到这个 python 文件,点一下给它起一个名字,就叫 cbm, 因为咱们这个模块就叫 cbm, 给它起个 cbm, 再从这六四个即插即用的模块当中找到这个 cbm, 双击一下将它全部复制 粘贴到这里,咱们就将这个 cbm 模块放入到这个 module 文件夹里面了。 接下来咱们还需要在这个 module 文件夹里面的 unit 里面将这个 cbm 导入进来,不然这个优乐模型是找不到这个 cbm 模块的,大家看一下怎么导入进来,就是在这行里面咱们写上这个 from, 就是 from, 点儿 c b a m import c b a m 这个类是不是出现这个 c b a m, 看一下它导入了 c b a m 这个类, 现在将 cbm 导入了进来。接下来咱们还需要找到这个 task 这个文件夹,看一下这个 test 文件夹在哪里。它是在这个 module 文件夹的外面点一下这个 test, 咱们看一下这个 test 文件夹,咱们需要在这个 这个里面去导入咱们那个模块,咱们那个模块叫 cbm, 咱们就是这样斜下 注意显示导入那个是类,咱们就用大写的 c b a m 这里写一个逗号,这里就可以了。将这个 c b a m 导入这个 task 这个文件夹以后, 现在是将这个 cba 模块导入进来了。还有一步,既然咱们将这个模块导入进来,那么咱们还需要在这个优乐模型里面指定这个 cba 模块它必须在哪里?怎么去指定它这个模块必须在哪里,那么咱们就需要 在就是 u l trigix 这个文件夹里面找到 c f g 这个文件夹,咱们要找到它里面这个 yammo 文件,然后再找到这个 module, 咱们因为这个 yolo 使用的是 yolo 二十六,所以咱们就打开这个 yolo 二十六,选择第一个, 那来在这里去指定 c、 b、 a、 m 这个模块具体的位置看一下,咱们随便插入一个位置,就比如说插入,比如说插入这里,咱们将 c、 b、 a、 m 模块插入到这里,比如说 c、 b、 a、 m 这里要注意一下,你插入一个模块以后,咱们一定要保证它的通道数一致,比如说上面它这个通道数是五幺二,所以咱们这里也要写一个五幺二的通道数。现在咱们测试一下, 咱们找到这个训练文件夹,这个觑这里要注意一下,如果你要是修改完这个模型以后,咱们要运行的是这个压默文件,怎么看怎么去运行这个压默文件,点击这个 优了二十六右键找到他的绝对路径,点一下,这样这里框选框选一下,再右键 右键给它粘贴上去,注意一下这里是个 r 这里它这里的字母就不会发生改变,下一步这个 date, 这里就是咱们这个数据集的位置。 现在咱们先测试一下咱们这个 cpa 模块是否插入成功了,右键运行一下,这里是报错了,你看它这里, 你看他期望一个一百二十八的通道数,但是你给了五幺二,看下他是怎么回事?继续到咱们这个压默文件,是不是看这里,这里是不是零点二五, 他说他这个意思就是将这个通道数说为四分之一,所以你这里写五幺二是不对的,但是他这个通道数即使是五幺二乘以零点二五,缩小了四分之一,呃,五幺二乘以四分之一的话,他就是一二八, 现在改成一二八以后,咱们再继续训练一下,右键运行一下,现在看,现在看一下,将这个控制台往上提一下,他是在现在他已经开始 跑,呃,跑起来了,他现在已经跑起来了,咱们现在再看一下咱们这个 cbm 极差极用模块是否插入成功了,反正他这个模型已经成功的运行起来,咱们现在手动暂停一下,这是他打印出了这个模型的结构,你看 是不是 cb 模块,说明咱们这个极差局的模块已经成功的插入进来了。这里的演示就到这里,如果大家对在优喽里面插入其他模块,大家可以使用我这些极差极用的模块,都是相同的步骤。最后感谢大家的观看。

hello, 小 伙伴们大家好,今天和大家分享的驱动云社区项目是 rolo 二十六, rolo 二六是 rolo 系列实时对象检测器的最新眼镜,从头开始专为边缘和低功耗设备而设计。它引入了简化的设计,消除了不必要的复杂性, 同时继承了有针对性的创新,以实现更快、更轻、更易与访问的部署,在精度等各方面都表现良好。目前这个项目的镜像和合适算力配置都已经配置完成,只需我们点击运行一下即可。 此时项目正在克隆到工作台的过程中,克隆完成后,下次使用就可以在我们的工作台打开了,合适的算力规格也选择好了,也可以进行修改,这里我们点击立即运行, 此时项目正在启动中,右侧状态栏可以看到启动状态,当运行状态显示运行中,即可进入开发环境。 在开发环境的这么奈后,目录下找到使用说明,使用说明中是对项目详细的介绍,包括官方项目简介、对本项目的简介、官方链接、推荐的算力规格、使用说明和使用的截图等。 下面我们来启动一下这个 weby 界面,选中使用说明单元格,点击运行, 大概等待两分钟左右就会生成 local, 当生成 locore 即可。添加端口,点击端口,添加端口号七千八百六十, 用途可自行填写。添加端口后会生成外部访问链接,复制链接到浏览器打开即可。 这里是 role 二十六的多任务推理演示界面,包括实力分割、目标检测、姿态估计,下面我们来使用一下, 我们来看看其他功能的效果, 最后使用完不要忘记关闭开发环境哦。如果安装了新的包或依赖,需要先保存环境,再点击停止并销毁。这里我没有安装新的东西,直接点击停止并销毁即可。

今天我们来学习如何用最新版的 rolo 二六进行摄像头检测。首先准备好摄像头,安装好 rolo 二十六,在命令行输入这行代码 model 的 意思是使用的权重文件, source 是 视频或图片来源。 source 等于零的意思是本地摄像头收等于出的意思是弹出一个窗口,显示实时已推理的摄像头画面, 按回车运行,实时在命令行打印推理结果,窗口显示已经画好框的结果。想要退出,我们按键盘 q 就 可以退出。

hmm 各位小伙伴们大家好,今天给大家带来的是 u r 二六的从零到一的入门教程,我将手把手带大家训练出属于自己的目标检测模型,哪怕你没有任何基础也是可以的。今天我们的素材就是这一只绝世好猫, 就是这只绝世好猫,我们需要它达到的效果就是我们训练完之后,要能够实时的检测出它在视频中的这个范围, 给它标注出来。当然还有一点不足的就是因为受限于这个数据集的问题啊,它没有标注,它没有标注 部分被遮挡过后的情况,所以导致这个识别中还有是还是有些不准的,你看就像现在他在柱子后面的时候,其实他就没有识识别出来。 ok, 废话不多说,我们就直接开始看一下这个路由二六吧,它的官方文档。首先它之前的版本呢,是 v 八 v 十一都是以这种虚列号命名,然后今年就直接跳到了路由二六,它是以今年的这个年份来命名的, 它呢是一个原生的端到端的模型,可以直接生成预测结果。它去掉了 那个 n m s 的 处理处理步骤,还移除了 d f l 模块,让它输出更快,它部署也更简单,尤其是在没有 g p u 的 边缘设备上面呢,它在 cpu 上的运行速度还提高了,这个应该就是这个版这代的 主要功能了。 ok, 我 们直接开始部署吧,我的设备上面呢,因为我是 md 的 显卡, 我没有办法去跑 call 打,所以说本本视频所有的所有的部署呢,都在这台知心云平台上面去部署,我会在上面购买一台 四零九零的四零九零的服务器,然后通过它去训练出我的目标检测模型,然后再放到我的本地去进行一个检测,是非常好的, 而且这个价格呢,也是比较便宜的,一个小时一块三,一天的话啊,也就三十块钱一杯奶茶钱差不多吧, 不然的话依靠自己的 cpu 去运行的话,其实是比较慢的,那我们直接开始吧。 嗯,这些贷款我建议拉一下,不然的话三十二兆的贷款确实是有一点 太慢了,等会我们下载数据集的时候也要等好久。然后这里的系统呢?我选的是无伴图啊。 其实选择云选择这种云服务器还有一个好处就是它不需要我们再去配置各种各样的环境,比如说它已经内置好了我们的显卡驱动,我们的 iac 的, 还有我们的 pad touch, 这些都是比较方便的。否则的话,呃,你一上来你的电脑上面,或者说你的服务器上面 配置各种环境其实都是很复杂的,尤其是像这些啊,可能一搞就是几个小时,但是服务器像这种服务器呢,它已经给你集成好了, 你可以你是可以直接拿来训练的,非常方便。直接哦,两个小时应该就够了。对, 三个小时吧,我直接创建一个实力,其实就是要注意一下。 呃,因为我们是只租了三个小时,如果你在三个小时之后 还没有训练完的话,他是直接删掉的,他这里会有保留全部死板,但是他是他也是要他也是,他也是要计费的,所以我们尽量处理完成之后就尽快把数据重要数据给导入下来,哎,创建一下, 你等一下它。然后呢给大家介绍一下,我推荐大家在这个网址上面去下载我们的数据集啊,我就是在这个上面上下载的这种数据集,比如说我今天要训练的是 cat, 对 吧?你直接搜 cat。 然后呢,我们再看一下底下有三点七 k 的 image 三十六六十,我们尽量选择数据量稍微大一点的,就比如这个三点七吧。好吧, 点进去之后呢,我们就可以在这里看到左侧啊左侧的 image, 这儿可以看到它的已经标注好的,这样就省得我们去标注了,标注也是一个费心费心费力的活。然后呢在这里就可以找到它的那个数据集, 等一下啊 cut。 对, 那这有多个版本也是在进行不断的更新,我们呢是优乐二六嘛,对吧?我就选择是优乐二六,如果说你是优乐 v 八或者 v 十一的话,你你就可以在这里选择优乐 v 八 v 十一。 嗯,好,已经在运行了。然后呢,我们现在就可以直接去连连接它 s s h, 创建一个程序, 然后端口,端口我个人比较喜欢使直接使用固态,因为因为切换实在是太麻烦了。 好,这样呢,就已经可以直接使用了。你看我们前面带了一个 base 的 环境,对吧?这个就是 kindle 的, kindle 的 那个虚拟环境啊,我们可以通过 kindle list 去查看到,对吧?它已经有一个虚拟环境了。然后呢,你可以在如果说,呃, 你没有这个云服务器的话,你可以根据我前面的这些这些步骤去安装你的 nvidia 的 驱动啊。这个 nvidia 的 驱动需要你自己在网上安装啊,这个只有查看,然后这个, 这个是安装那个 mini coder, 然后还有这个基本命令啊,都都放在这里啊。最后就是我们安装这个 python, python 的 话,网址在这里也是也是在这里啊,我都给大家放好了,大家可以去根据你的, 根据你的 nvidia 的 驱动版本啊扩大版本去选择适合你自己的这个 pad, 就 比如说 nvidia, 对 吧?我们在这里就可以看到我的扩展 version, 它是十二点四,那么它官网上面这里放了一个十二点六,其实没不要紧啊,因为我们在这里可以看到它实际上是从这下载的,对不对?我们直接 啊,直接就是改一下他十二点六,我需要的是十二点四,对不对?你看也是可以进来的,一测他只要低于十二点四好像就不行了,对,低于十二点四好像就不行了,所以说你的最低的扩展版本可能就是十二点四,好吧, 然后你去安装一下,最后去验证一下它有没有成功,识别成功,你看我这是为处,那就表示我的这里的 code 是 可以直接被派头是给识别到的。然后最后我们去安装一下它的这个包, 嗯,它这就已经在下载了啊,我们等,我们先等一下,我们继续回到我们的数据集下载的这个,好吧, 如果你还需要其他的数据集的话,也是可以直接在这里搜索的,当然它一开始的话,它可能是需要你去注册一个账号,呃,你可以使用你的谷歌账号或者你的邮箱去注册一个就可以了。 现在我们就等它下载,然后我们的开发环境呢?是是这一个 v s 啊, 这里已经我已经创建好了,它是通过 remote 的 s s h 协议去 链接到我们的 g p u 服务器,然后直接去在以服务器的环境去运行。实际上的代码开发是在我们的本地啊,这样非常的方便,不需要我们不需要我们去把那个 像什么各种数据集啊,像什么文件啊什么的全部都往上面传,没有必要,我们都是直接在线下载的,好吧,我们首先打开这个 scode 之后呢, 在这个扩展这里搜索 remote s s h, 对, 就是这个,我已经安装好了,大家可以安装一下。安装好了之后呢, 我们可以直接什么 ctrl shift 加 p, 然后在这里搜索 remote s s h。 这有个连接到主机,或者添接添加一个新的 s s h 主机,我们选择添加一个新的,然后在这里填什么呢?填你的用户名和你的 和你的那个主机加上端口,比如说,比如说我在这里租的服务器,对吧?它的地址是这个,然后它的账户是 root, 对 吧?我就直接先把地址复制下来, s s h root at 它的地址。 注意一下这有个端口啊,它的端口不是二十二,是幺八零幺二,我们把端口写上去,然后杠 a, 这样的话我们随便保存一个,然后连接 它在问询问你是什么系统,我们选择 linux 系统,然后是否要继续继续,然后输入它的它的这个密码 s s h 的 密码回车,这样呢,它就已经在配置它的 v s code 的 服务器了, 然后我们继续回到这里的,刚才这个库已经装好了,对吧? 绘景装好之后呢,我们就要开始下载这个数据集,下一个数据集也是在线下载的,非常方便啊。我们先等一下这个,等一下这个 vsco 的 这个安装,安装好了之后我们直接使用代码一键安装, 在这里我们点一下这个 user 二六之后它会让我们下载,我们不要,我们不要选择上面一个,上面一个是直接在它的在这个网址的云端创建一个项目,然后去运行, 我们选择 download, 实际上呢是通过这个 show download code 去官方下载啊,去云端下载,而不是 download zip to computer, 不是 下载到我们的电脑上面,通过代码其实比较方便的,我们 copy 一下,把这个 copy 一下, 哎,怎么还没下载好? 没有关系啊,我们直接在这个里面先创建,让它先慢慢连。好吧, 我们先 make 一个优酷的文件夹,然后在这里面 touch 一个曼点 p y, 我 们在这里呢 copy 一下。首先它还需要安装一下这个,它的这个文件 前期需要下载的东西也会比较多,但是装好了之后就可以了,一次性的 它这里报错啊,说什么依赖,依赖冲突,这个不影响我们正常使用啊,因为它是,它是 cuda 的 那个依赖冲突。 更新完了之后呢,我们继续编辑一下我们的那里 p y, 然后把这一行给它删掉。好,这里呢其实就可以直接开始下载数据集了,它这个数据集是会直接下载到当前目录下的 它的那个数据集的名称。下面这个 a p r k, 大家,大家不要用我的,我等会会把它重重置掉,大家千万不要用我的,好吧?然后我们 ctrl x 保存一下, 然后直接运行啊, ps 点 py, 这样呢,它就已经开始下载,图片还是比较多的,它会下载一段时间啊,等会我会给大家加速一下,好吧, 我给大家再演示一遍,好吧,因为刚刚我好像是闭麦了。我们首先打开这个 westcode, 之后呢 ctrl shift 加 p, 调出我们的这个 搜索框,然后在这里搜 remote 杠 s s h, 这有添加新的 s s h 主机和连接到主机,我之前有这个有这个配置文件,如果说你也有的话,我们可以先把它打开,对吧?然后把它删掉, 把它删掉,只留一个,这样的话不容不容易连接错。然后我们再去链接主机的时候,就选择这个主机,然后他会新打开一个对角框,告诉我要我输密码, 你选择把它的密码给它粘上去,粘上去之后呢,这边就已经你你看左上角就已经显示已连接到远程,然后我们去打开我刚刚创建好的这个优乐的这个目录,让它作为我们的工作目录 啊,他又要我输密码,我们再 ctrl 一下,好,这样呢,整个整个远程的环境就已经配置好了,现在只需要等到我们的这个服务器,把这个服务器把这个数据集下载下来就行,好吧? ok, 这里数据集也是下载完了,这个数据集比较大,下载时间确实比较长。 然后这里的代码呢?其实就没有什么用了,不过我再来创建一个 tree, 这个主要用来训练,我们可以在这里看到,这是我们的 test 测试的数据集,这是我们训练的数据集,这是我们验证的数据集,里面呢都有很多的 image, 这是图片,看这个猫的图片, 然后这是它的 apps, 也就是它标注的那个标注的那个框框的位置, 这是它的,这就是我们需要的这个 data 的 ymail, 这里面写了它的那个类别,比如说这只有一个 cat, 如果说你后期还想要增加一个新的,增加一个新的 那个行为检测,比如说我要检测这只猫是不是在哈气,对不对?我们就需要到时候把两个数据集合并起来,然后在这里新增它的那个类型,这样的话指向这个对它压面,才可以两个数据集的同步训练啊。 然后这里呢,我就直接把我之前写好的代码放上来,然后给大家讲一下这是什么意思啊?首先这个包大家刚刚是都已经装好了,然后呢我们这里使用它的这个优乐二六的这个权重权重文件啊,然后 这个这个文件也是在线下载的,不过这个这个下载的很快,然后我们就可以直接开始训练了,这个 date 呢,就是指向这里的 date 的 ymail 来指向过去啊, cut go, 有 上下的,对对对, ymail 啊,这是跑多少轮啊?大概,呃,四零九零的话, 租的四零九零跑的话,大概是需要一个小时左右啊,如果说,呃,我之前的那一张 p 一 百的来跑的话, 可能得跑三四个小时,这个租了一台 gpu 的 服务器还是比较方便的。然后这里的处理进程我们要改一下, 默认是八,然后他的那个内存只有十六 gb, 大 概会吃掉十个 g, 十个十一个 gb 左右,十一到十二个 gb 左右,如果说你调成八的话,他这里就直接内存溢出,他就直接把那个进程给杀死了, 所以说我们这里要改一下,然后这个 name 就是 这次训练的名称,最后的结果就是会放在这个 result 上面, 这里呢我们选择的是 gpu 半尺,这里我们设置的六十四张图,一次性就是为六十四张进去,这里的半尺越大呢,它占用的显存也就越多,半尺越小,当然它 它还会对你的训练的那个训练级啊,训练的结果会有一些影响, 默认的话可以设置到十六到三十二到六十四,可以依次的慢慢的去调整你的这个半尺,这个参数是比较重要的, 需要你后期的去慢慢的调整。然后自己的 size 呢,我们默认就是六百四十,像素一百多,然后底下呢就是他的旋转啊,裁剪啊什么之类的,避免避免说这个最后训练出来的这个结果他陷入到了最有解中, 这些都属于后期的那个优优优的那个调优参数调优啊,然后我们可以直接开始运行测试一下,先,他会先下载他的那个他的那个文件, ok, 这就已经开始下载了, 我们看一下,然后这里的内存其实就已经在跑了,然后我们看一下显卡,显卡的显存你看也长上来了, ok, 这就已经开始在跑了。 ok, 这里我们的这个模型其实就已经训练完了,可以看一下这里的结果。看,这里就出现了我们的最好的这一个模型和一个最后一次的 零点三九三的时候达到了零点九四, 这个呢是我们训练的第零张图和第八千七百三十二张图,这是他训练的那个,那个, 这不是 bench, 这是他的第多少张图片?呃,倒着的也可以,侧着的也可以。 然后去看我们验证的这个呢是我们手人工标注的这个 apps, 人工标注,然后这是机器的识别,我们来看一下, 然后四个、五个、六个、七个、八个、九个,嗯,这个也识别到了,这个也识别到了 这个人工标注,一二三四五六一二三 一二三。哎,这里四五六啊。对对对,可以,这个识别率其实还是很高的。 然后呢,我们只需要下载这个 base, 这个这个到我们的本地来,嗯,我们通过这里的 d r 查一下, 我们下载到本地,我联系找,然后通过我们的本地去去验证它, 这是我们的模型文件,然后这是我们的验证验证的,对吧? protect, 这里选择的是我们的选中文件,然后这个呢是因为我在我的本地也安装了一个 mini cuda, 然后去激活一下它。你们呢?也可以在自己的这个电脑上面安装一个 mini cuda, 然后通去给大家创造一个环境, 然后再去运行我们这个 mini p y, 这是我们的那个友善的小猫,对吧? 这是没有做任何处理的。然后我这台电脑呢,只有只有 md 的 显卡,所以说我只能够通过 cpu 去进行进行推理, 然后这是保存,这是他的那个名字,这个值呢需要改成我们的那个 f 一 的那个值啊,有最佳信度的法值。他在什么情况下最好呢? 是我们这里啊,零点三九三,这里他达到百分之零点啊,他达到了零点九四,越接近一肯定是越好,对吧?但当然他不可能,他,他不可能等于一啊。零点三九,哎,其实跟我们之前跑的一样,跟我之前跑的一样,然后我们去运行一下, 然后你看我的,你看我的 cpu 就 已经已经开始在工作了。这一个视频呢,它会逐帧的去处理,每一共有六千多帧嘛,它会逐帧去进行一个识别, 然后最后呢就会输出到我们的根部录像,我们等一会, ok, 我 们本地已经推理完了,我们去看一下我们最后的结果, 哎,不知道大家有没有注意到,就一开始,一开始他好像把上面这里这里也识别成了猫,哎,对对对,就是刚刚那一瞬间啊,这其实也是有误差的 啊。零九, 这个识别度其实还是可以的,因为毕竟我们只训练了这么一点数据集嘛,对吧?满打满算,我们好像也就只训练了一个小时吧,你看我们的时间, 录制时间,现在也就只有一个半小时,我们花了大概将近半个小时的时间来下数据集,然后 一个小时不到再训练, ok, ok, 这个就是本视频的全部内容了,后续的话可能就需要大家去根据这个结果去慢慢的调整调整我们的这个参数, 调整我们的这个训练参数,对吧?多少个 bunch, 然后它的那个这个是旋转 之类的,如果说你还需要往往这个训练集中新增一些数据集,比如说我现在只检测的猫,我还希望能够检测狗,那么我们就需要再下载一个数据集,然后给它 整理好放进去,然后再修改咱们的这个 data ymail 之后再拿着我们有的就是 就是我们已经跑出来了的这个 last 点 p t 这个文件,然后继续去训练,这样的话我们就不需要从头继续从头开始训练了。我们记得要把这里改成,改成咱们这个 last 点 p t, 然后把咱们的数据集整理好之后就可以继续开始跑。 ok, 以上就是本视频的本视频的全部内容,非常感谢知心云对咱们这个视频的大力支持,这个四零九零用起来还是还是很爽的。哈哈哈, ok, ok, 我 们下期再见,拜拜。

基于优乐二六和大模型的路面缺陷监控预警系统, 在视频最后有完整的安装部署教程哦,今天我们这是一个道路安全智能监控系统, 主要是用来检测我们路面上的一些缺陷,有一些坑洞或者是有裂缝的这些地方,包括了我们路面监控智能识别、实时预警,还有一些监控的录像的记录。我们这个还加装教程,系统启动教程, 还有项目介绍文档,系统使用注意事项,包括数据库表结构的详细说明,还有我们这个优乐模型的这个训练的文档,包括我们这个 ppt 里边的一些系统架构图,系统交互图这些,包括 识别模块的这些流程图,还有一些这个我们优乐模型训练的时候的一些过程的图片啊,这个的话我们等会再去看,我们首先来显示一下系统, 然后演示之前呢我们可以看一下这个,呃,我们优乐模型用到的这个数据集,我们数据集就是长这个样子,就是每张图片呢他进行了一些这个已经进行了一些数据增强啊,包括这个图片的旋转啊这些内容,然后每一个里边呢都包含了一些呃,四个这种不同的路面的缺陷,我们检测那个训练的时候呢,就是去用这些数据和他对应的那个 标签文件来进行训练。现在呢我们就去先演示一下系统,我们首先去分别登录两个两种不同权限的这个用户账号,第一个呢就是我们管理员的这个账号,另一个呢是我们普通用户的这个账号。 好的,他们的话主要的区别就是在于一些操作的权限,管理员的话他是能够控制的更多一些,比如说用户管理啊,控制台啊,能看到一些全部用户的这些数据,包括这个维修人员的管理的增删呃,改啊,这些内容都可以去做。然后我们普通用户呢就权限少一点了,只能看到自己的新建的这些摄像头, 然后只能看到自己摄像头对应的这些检测记录啊,包括维修人、维修人员管理和这安利库的话,他也没有权限去操作,只能去查看一些这些内容。好的,然后我们回到管理员端去演示一下我们的系统,首先我们整体看一下系统有哪些功能吧。 呃,管理员的话,这是我们的首页,如果检测到了这个违规的记录啊,有这种路面缺陷的这种情况的话,他会在我们这里进行一个实时的通知。另外呢就是由我们的控制台, 控制台的话就是系统的一些数据了,然后是我们的用户管理,管理一些用户给他增加一些权限什么的这些内容。然后就是摄像头管理啊,摄像头管理的话,我现在是开启了 八个摄像头吧,然后有几个是我这个用户的,有另外几个是测试用户的摄像头,然后这里呢?嗯,这个摄像头启动的方式啊,就是我们模拟二 t s p 的 这种 摄像头启动方式呢,后面会有视频来教大家怎么去启动,现在就不讲了,大家直接看后面的那个视频就可以。然后检测配置的话,我们这里是提供了有两种啊,一种是优喽去检测路面的缺陷,另一种是用我们的视觉大模型去检测路面的缺陷啊, 然后还有一个是第二阶段的这种分析啊,然后第二阶段的确认的话,就是主要就是确保第一阶段检测出来的一些内容,确保它是正确的,就是减少一些这种误减的情况,我们也可以关掉它,不用它,但是建议在这个系统里面呢,也有三种可以选择啊。第一种的话是仅分析新事件的第一针, 然后的话第二种是分析每一针,然后这个的开销可能比较大一点,因为每一次检测他都会进行一次二阶段的分析,然后这个是节省资源一点的,就是按时间间隔分析啊,我们可以这里设置一个时间间隔啊, 设置好了之后呢就呃这个时间间隔之后,他会去进行一次分析,我们就一般的话先用这个推荐的这种方式来做就可以了。好的,然后这是摄像头管理,另外呢就是我们摄像头 启动了之后,我们其实在后台他就已经去实时的进行监测了,但是如果我们想看到这个具体的监控画面呢,我们就可以打开这个实时监控啊,在摄像头启动了之后呢,这里就会有我们启动后的摄像头啊,点击之后呢,我们就能查看他的一个检测的画面的情况,然后如果检测到了这种路面有缺陷的情况呢,就会自动的去记录到我们的检测记录里边,我们这里也可以去查看具体的每个摄像头的他的这个 检测情况啊,除了我们这种摄像头的实时检测之外呢,我们还有这个图片检测,然后图片检测的话我们也是分了两个阶段啊,我们就是去上传一张啊路面的图片,让我们的优喽或者是视觉大模型去检测一下我们这个路面上面有没有这种有缺陷的情况。这个的话就是对于 单帧图片进行一个分析,然后我们维修人员的管理呢,就是说这给我们提供一个就是新增的这种工人的一个功能啊, 也就是说我们摄像头检测到了这种情况,然后会通知给我们相应的负责人,然后我们负责人呢就可以去看一下我们现有的这些工人,在职的这些工人或者维修人员啊,哪一个现在是空闲的状态啊什么的,或者我们可以直接打他的这个联系电话啊, 然后就能给他通知他去修复一下路面的情况这些内容。然后这里呢还给每一个这个维修人员配备了一个这种设备管理啊,就是说这个维修人员他可以使用哪种设备来进行这个呃,维修作业,就是这样一个功能。然后另外呢我们安利库是会保存一些我们 呃之前发现过的一些路面缺陷的情况啊,包括这个场景的描述,还有这个嗯,当时是怎么去应对的,这个措施怎么去解决的啊?都会在这里记录下来,并且他对应的这个图片图片也会记录到这里,包括当时如果有些视频的话,他也是会在这里去记录的啊, 然后这个这些案例呢,呃,除了就是我们人工手动的去查看这些啊,当然还有在我们等会 ai 检测记录 等那里会有一个 ai 分 析啊,分析的话就是分析新检测出来的这些记录的内容和这些案例库里面的内容有哪些是相似的,它会自动的解锁这些相似的案例,并且给出一个呃较好的解决方式来供参考。然后我们现在就去演示一下系统吧。首先我们这个摄像头都已经打开了,然后我们 现在首先是去都去用这个优喽去检测一下我们的系统,这里能设置一个优喽的预值,我们设置一个零点二吧。然后第二阶段的话,我们就是启动第二阶段的这个确认的分析啊,用这个模式。好的,我们保存一下,那么这个检测的 呃摄像头的规则我们就确定了。然后我们首先是去一个一个看的啊,我们,呃第一个呢是我的电脑的摄像模拟的电脑的摄像头啊,这个我们等会再去再去看一下,我们从第二个开始启动这个摄像头。好的,我们去打开一下这个监控, 好的,可以看到它是已经在检测了, 这里有一点卡住的原因呢,是因为应该是检测到了我们的一个新的事件,所以他进行了这个呃大圆模型的这个分析,所以刚才那里会有一点卡顿,因为大圆模型的话处理的时间是会比较长的啊。然后刚才是检测到了,应该是检测到了一个违规记录啊,所以就你看已经弹出了一个这个异常,已经通知了我们的负责人,联系方式是这个。嗯, 当然这个你看优乐的话,其实是这个检测的不是很准确啊,因为优乐我们,呃,因为他这个图像画面的话,有效的部分只有中间的这一部分,然后我们现在这个优乐模型呢,对于这种裂缝的检测其实是不是很好的一种状况啊?然后等会这个用我们的视觉大模型去检测的话,效果会更好一些啊。好的,然后的话 我们就先把它关掉,把这个摄像头关掉, 关掉摄像头呢,我们再去开启第二个摄像头, 应该是检测到了刚才,对吧?他刚才这里检测到一个坑洞啊,所以报了异常情况啊, 然后这个为什么刚才我们看到检测到了那个这个异常情况,为什么没有给我们这里弹出这个通知呢?啊?是因为我们这个摄像头呢是属于我们测试用户的摄像头啊,所以呢他通知的是我们测试用户,而不是我们这个管理员用户,因为他通知的是他的负责人嘛,他的负责人是我们的测试用户,所以他会在这里给 通知到我们这个用户了,当然我们在首页的话也能查看这个位查看的通知啊。好的,我们这个就先也先关掉, 然后我们开启第三个摄像头, 哎,你看他这个已经检测到了啊,检测到一个坑洞,对吧?看他检测到了这个坑洞,然后已经通知到了, 哎,对,你看这个我们大圆模型呢也给分析出来了,说这个场景分析呢,就是画面中检测到一个明显的坑洞啊,然后建议尽快修复坑洞啊, 然后他也肯定是通知给了我们具体的这个负责人嘛,我们可以看这个测试用户,哎,这里他又通知到了,然后我们刷新进来首页呢,他就会这里会多一条这个通知,然后这个呢我们就先关掉吧,他已经检测出来了, 好的,然后我们再去启动一个摄像头, 嗯,这个的话也是检测到这个空洞的情况,对吧?但是这些检测到情况的这些录像呢,是会保存下来的,等会我们在检测记录里面就能看到他。 好的,这是我们这个画面里边了,然后我们再去看下一个摄像头, 哎,刚才看的是这个,是吧?然后我们该看应该是看一下高速公路收费站检测记录里边肯定有这些东西了,对吧?刚才就检测了,这个我们可以看他的录像,是吧?刚才已经把这个 检测到的这个画面,对吧给记录了下来, 对,然后该这个第五个摄像头 看一下,他是检测刚才检测到了啊,也是检测到了一个坑洞, 嗯,对,这个呢可能比较小一点啊,坑洞。好的,我们接下来再看另一个摄像头,我们可以看到就是说我们现在 检测到这么一个异常情况呢,是通过两个阶段来分析的,第一个阶段是优喽去把我们的 这个空洞给检测出来啊,这是第一第一部分。那第二部分呢?检测出来之后呢,我们还会进行一个大圆模型去给他确 认的这么一个过程,也就是说大圆模型再看一遍这个图片啊,确定了这里面确实有这种路面缺陷的话,他才会报异常啊。如果说第一阶段我们优乐模型去误减了,也就是说优乐模型第一阶段检测的不正确啊,就是说本来没有路面缺陷,但是优乐模型也给检测出来了,那么我们第二阶段的这个大模型他就会发挥这个我们的作用啊, 一看第一阶段一路模型,他说检测出来了,但是大元模型我自己没看到路面缺陷啊,所以那么就不会报这种异常啊,这就是我们第二阶段的确认分析的这么一个作用。接下来呢,我们就可以看一下刚才说的这种情况,我们可以 同时启动这两个摄像头吧,这两个摄像头都启动来,我们去看一下啊, 哎,你看啊,这个倒是这个检测出来了,你看这个是说刚才我们看的是这个吗?这个首先第一阶段呢,优乐是检测出,他说优乐模型检测出一个坑洞,对吧?嗯,但是 这好像有点误解啊,这个我们先不看,然后的话我们看这个啊,我们还是放大一个一个看吧, 哎,你看这个呢,就是说第一阶段游乐模型我们他检测出一个这个坑洞,对吧?实际上我们一看这个画面,他就是一个误剪,他把这个墙上的这些洞啊,窗户啊,认为是一个坑洞的啊,所以你看, 呃,第二阶段呢,我们大模型就去看了一下这个画面吧,说是画面里边是一条狭窄的这个街道,就是没有看见这种明显的这种龟裂啊,裂缝啊,还有这种修补区域或者坑洞的这种情况,所以就是说没有认为他不是我们这种目标场景,也就是说他没有道路的缺陷,所以我们这个 你看他虽然显示了那个修补区域,但是这里也没有弹出来那个呃,警告的那种情况啊,就是我们大语言模型的那个二阶段分析在起作用,就是说你优乐模型第一阶段属于误解,我大源模型给你校正了,不用通知负责任,因为他没有这种路面缺陷,所以就是这么一个作用, 然后我们关掉它,再 这两个都关掉吧。啊, 好了,这两个关掉了之后呢,我们,呃,首先看一下,因为现在的这个检测配置是用优乐模型来检测的嘛,所以我们看一下检测记录这里边都有哪些内容啊?这个其实,嗯,这个其实是属于一种误解,就是第二阶段这个大圆模型的判断也出错啊,也出错了,就是明显他没有空洞,但他大圆模型给的判断也是错的啊,那么这种情况呢?呃, 我们就可以去这个检测的时候呢,就可以用这个分析每一帧的这种 二阶段分析啊,他的话就会更准确的去分析我们这个视频画面了啊,就不会进行,不会有这种长时间的误报的情况啊,可能只有一两针误报的情况啊,但这个的话是比较消耗资源啊。然后我们去看一下其他的记录啊,看这个的话是由我们的检测到一个空洞,对吧? 然后我们的这个录像也有啊,也能看到啊,带检测框的和不带检测框的我们都能去看的,同时呢,我们下边还有这个场景的描述和应对措施,也会在这个图片里面录像里面去体现到啊,那我们接下来看其他的内容的话也是一样,我们看这个吧, 这个呢就是会检测到坑洞啊,然后我们的话在录像这里也能够看到这个录像的回放,对吧?检测到坑洞,然后大圆模型也给出了这种场景的描述,也能看到。嗯,这就是我们这个录像记录的这么一个作用。 然后我们如果想去处理这个,想去处理这种情况啊,在我们这里可以直接写这个处理的记录,也可以点我们的 ai 建议啊, 点完之后呢,就是他会去我们刚才说的这个案例库里边去解锁我们相似的这种路面缺陷的记录,然后参考你当时的解决方案,来给出我们现在这个解决方案的这种一个 ai 的 建议,我们也可以直接采纳他的这种建议,也可以去参考他的建议去进行一个修改。 嗯,这个超时了啊,我看一下是什么原因超时了呢? 这应该是我们这个前端的这个请求,用大圆模型可能分析的比较多啊,这个请求给他稍微放大一点吧。 好的,我们再来给他处理一下这个情况啊, 刚才那个错误呢,就是说,呃,我们大约模型接收到就是在这个推理的时候,他假如本来可能需要推个几十秒啊,内容比较多,也可能就是因为网络的一些不好的这种情况,他可能这个传输的时间比较长,但是我们前端去 设置的请求的耗时呢,没有这个时间长,所以他直接去把这个请求给截断了。现在的话,你看我们调大了那个请求的这个时间啊,现在就正常了。嗯,等他现在已经给出了我们这个 ai 的 建议啊,我们可以直接采纳这个建议,就是说已经确认画面中检测到一个明显的坑洞,我们可以,我们可以这个检查路面有没有其他的这些缺陷呀?啊?然后就是进行这个处理,我们点击确认处理呢,就是可以把它给处理好了啊,然后我们处理了之后呢,如果我们觉得这个案例比较 比较普遍,比较典型的话,我们也可以在这里直接给它设为这个案例,你就可以说设成坑洞啊,坑洞处理案例,案例类型呢,就是坑洞严重程度呢还是挺高的,我们点击确定。 好的,我们确定了之后呢,我们就在这个案例库里面就可以看到我们刚才新增的这个案例了啊,我们查看详情,他这里边检测到这个图片,对吧?我们保存已经有了相关的这个案例的这个检测的录像啊,我们也有了,对吧?嗯, 当然我们这个案例的话,除了从我们检测记录里边去新建,我们也可以手动的去创建这种案例,就是不依赖于我们这个检测记录,这个我们就不去演示了,刚才我们是通过, 我们是通过这个优乐模型去进行的这个路面的缺陷的检测,我们现在换成我们的视觉大模型去 进行一个检测啊,这个的这个呢,他检测的这种精度会更高啊,因为他理解能力比较强,另外呢他这个速度是会比较慢的,所以我们这个检测间隔需要稍微调的长一点,刚才优乐的话,我们是每一秒去让他检测一次啊,现在呢我们换成大模型去检测的话,我们检测间隔就成了给他设一个三秒去检测一次啊,我们点击保存, 首先我们我就这里,我们我把这个打开吧,这个是用的我的电脑的摄像头啊,我们启动起来呢,我们在这个实时监控这里点开它, 这里当前模式呢就是会显示的用这种大模型去检测啊,你看我们这个这个其实呢是用我的手机啊,我是用的手机去 在我的电脑摄像头去放了一个这么画面啊,他已经检测出来了,对吧?他检测出这个是个呃,这种龟裂啊,你看这个大模型去检测的话就检测的很稳,对吧?刚才优乐模型的话,他就可能会呃检测的比较跳变一些,但是大模型的话,你看他检测的就比较稳,然后我们再换, 再换其他的摄像头啊,看这个, 哎,你看刚才我记得我们用优乐模型的话,这个是没有检测出来的,对吧?那他这个我们大模型的话可以检测出来了啊,看看检测的这里一直是说有一条这个纵向的裂缝,对吧?是非常完美的去检测出来了,我们也画面分析的话,也是说存在一条严重的这种纵向裂缝,对吧? 嗯,所以这就是我们大模型的这种优势吧,它检测的还是非常好的,你看一直能够把这个裂缝给检测出来啊,然后我们关掉这个, 让我们再去开启下一个这个摄像头,再来看它, 你看这个大模型的话,检测出来的内容就比较丰富了,既有这个坑洞,又有这个龟裂,对吧?还有这个修补区域啊,它检测的也是比较准确的,这个确实,我们远看的话确实像添了两块,后来添了两块砖头嘛,所以这个确实像是一个添修补的区域啊,大模型也给检测出来了,还是检测的非常好的, 然后我们再去关掉, 然后再去开启这个摄像头啊。 哎,你看他检测到了这个空洞,这个呢大模型检测呢就非常的平稳,对吧?他一直在这个空洞,而且这个空洞呢,他是把这个空洞全部都给圈了出来。我们刚才这个刚才这个优乐模型去检测的话,他可能就检测的比较小的一部分,但是刚才这个可能是因为轮胎占了一部分,所以优乐检测的话就把这检测出来了,但是大模型的话,你看就检测的会非常的平稳,非常的全面。 好的,我们然后继续换下一个摄像头, 这个呢我们是检测到了这种主要是坑洞啊,还有一些溃裂这种情况, 还有一些纵向的裂缝啊。好的,然后我们就换下一摄像头吧,这个好像也没有什么太大的可以看的东西啊, 这个呢也就是我们这个溃裂坑洞,对吧? 然后刚才这个我们的优乐模型呢,我记得是, 我记得是会把这个东西给误剪出来,对吧?有一些误剪的这种坑洞,但是我们换成我们的大圆模型呢,你看他就根本就没有检测出来这种坑洞的情况,所以看大圆模型的这种理解能力还是很强的, 这个呢,这个就相当于是我们一种这个正常的路面,对吧?正常的路面呢,我们就不会给他进行这种报警的错误的机制了啊。 然后我们打开我们的最后一个摄像头, 这个刚才呢我们游乐模型也是去进行了一个这种误减的情况,但是我看我们的大圆模型呢,他是认为这是一个正常的路面,没有这种路面的安全隐患,所以你看他就不会进行我们这种报警的行为啊, 他好像现在检测到了一个啊,看一下他检测到了什么啊?看一下,哎,看他啊,你看他检测到了这种车辙,对吧?嗯,但这个是属于误讲,但这个车辙的话,他他确实检测的也没没毛病,对吧?啊,因为确实这里有两条这种车辙啊, 好的,然后我们给他关掉。 好,关掉之后呢,我们就基本上是演示完了, 摄像头部分我们就基本也是完了,然后我们现在去检测记录呢,我们刚才也看了啊,就是每一种检测记录呢,我们都会有这个检测到的这种录像的情况,对吧?录像的情况 还有这个,当然这个录像呢,不一定只保存一个啊,如果我们有长时间的这种监控的话,他有会有多个这种录像保存下来,然后这里呢,我们相亲也能看到这个具体的摄像头啊,还有选择,我们这个 能够看到测试用户啊,对吧?测试用户他的这种摄像头的记录都是可以的。嗯,当然我们 在我们普通用户的检测记录里边呢,是只能去看到普通用户他拥有的摄像头啊,的这些检测记录,不像我们管理员是能够看到所有用户的检测记录。好的,下面呢我们就去演示一下这个图片检测吧。啊,然后我们去点击上传,点击了之后呢,我们在这个测试图片这里我们会有这么一些 内容啊,我们首先去上传这个,首先去用优乐模型去检测,开始一阶段检测。 哎,这个呢,它是没有去检测出来任何的目标的啊。嗯,我们优乐模型对于这种裂缝呀,它检测的效果不是很好,然后现在呢,我们就可以去用我们的视觉大模型去检测啊, 哎,你看我们大模型就检测出来了啊,检测出了这个纵向的裂缝这种情况啊,然后我们也可以进行二阶段分析啊,这个的话就是让大模型去再看一下这个图片啊,它确实是有一条这个纵向的裂缝,对吧?也给了这种建议的措施。那我们来接下来分析下一个图片, 我们还是先用优乐去进行检测,因为优乐的话它检测是比较快的,优乐模型呢,这个又没有检测出来啊,那么我们继续换我们的大模型去进行检测。 好的大模型呢,检测出来,这是一个规律啊,整个图像都是一个规律啊,我们等会再去测试下一个图片,还是先用优乐去检测 好的,优乐又没又没有检测出来了,又没有检测出来,然后这个大大模型肯定是能检测出来的,我们就先不去重复的看了,我们继续看下一个,还是先用优乐去检测 行,优乐又没有检测出来了,然后大模型肯定是能检测出来的,我们就不去看了,看这个吧,看优乐模型能不能检测出来。 这这种情况呢,是属于我们的数据集可能会。呃,有一些问题啊,也不是,就是说我们,他可能训练出来的模型泛化性不是特别高啊,你看这个的话它就检测出来了,对吧?检测出来这是一种菌列,这还有一个小的菌列,这是检测出来的, 然后换下一个。该这个了吧,还是先用我们的优喽去检测。好的,优喽呢检测到了,这里是个坑洞啊,这他他没看清啊。然后我们再进行这个二阶段的分析啊,看二阶段分析之后呢,我们说画面中明显存在这种坑洞啊。 嗯,好的,这个换下一个来检测。这个的话是坑洞比较明显啊,看优喽模型能检测出来应该是能检测出来。 好的,这个优乐检测出来了,是两个明显的坑洞啊,但是你看这里也有一些坑洞啊,他没有检测出来。优乐没有检测出来啊,我们换我们的这个大模型去试一下,用大模型的话去检测一下看行不行 哦,我们的大模型呢也是只把这两个检测出来了啊。那那这个就,呃还行吧,优乐算优乐检测的还行吧,通关,但这个,呃刚才说优乐模型检测出来效果不好的原因啊,并不是优乐模型本身的原因,是因为我们可能数据集的质量啊, 还有这种泛化性啊,不是很高的原因,如果能把数据集的质量给提升上去的话,那他,呃包括,呃如果数据集的数量更多一些的话,他训练出来的优乐模型效果也是会更好的。好的,我们这个又还是用优乐模型去检测 好的,这个优乐模型呢检测出来了, 这也是用优乐模型检测 这个他倒是优乐模型没检测出来。 嗯,这个呢优乐模型检测出来了是一个坑洞, 这个又没检测出来啊?看一下这个裂缝能检测出来吗? 好,这个优乐模型没检测出来,但是我们用大圆模型去看一下。 好,大圆模型呢是检测出来这是一个纵向的裂缝啊, 嗯,这个呢他倒是检测出来了,他说是一种龟裂啊。 好的,然后呢我们就呃这个也不进行这个二二阶段分析啊,分析一下,然后对这里还有一个这个两个阶段耗时的情况,优乐模型呢可能就比较快一些啊,零点几秒就完成了,然后用大模型的话,他可能得个一两秒的时间啊,然后我们在这里呢也能够去查看刚才的这些识别的历史记录啊,都是可以查看的啊, 这些呢就是一阶段都没有检测到的这种情况啊。 嗯,这些呢就是一阶段的这种分析。 好的,这是我们图片检测的这个功能的演示,现在我们来看一下控制台啊, 现在呢就这些记录都有了,看没有处理的这种,呃检测的记录啊,还有已处理的,包括这个用户的活跃度啊,还有这个摄像头的分布状态,还有这种各种摄像头的这个异常的检测的数量,包括工人的状态分布呀,案例的这种分布,还有案例严重程度的分布,都已经会在我们这里展示出来啊, 然后呢我们还有首页里边啊,刚才看到了,就是假如说我们这里有这个 有这个没有查看的通知,也就是说,呃,刚才报了这个提示,但是你没有查看啊,你可以去点击对应的这个啊,我们会自动的去给你把这个案例啊搜索到让你去查看啊,之后呢我们这个案例你就不会再显示这种未查看的通知了,这也就是方便我们每天登录系统去看一下有哪些这个情况还没有被处理啊?我们这个查看了之后呢,这里就会有 不会再出现那个被查看的通知的那条记录了啊。好的,然后这就是我们整体整体系统的一个演示,然后呢我们现在把这些所有的摄像头啊都去打开一下, 现在呢我们把这些所有的摄像头都打开了啊,除了第一个,第一个是我自己的电脑的摄像摄像头,我这里就不去开启了,然后呢后面的几个呢我都打开了,然后我们管理员是可以看到所有的用户的这种摄像头啊,我们能够去都给他开启, 能够看到他的这些画面啊, 好的,现在都已经摄像头都已经正常的运作了啊, 然后呢我们呃在,但是在这个呃普通用户这里呢,是只能够去看到自己的,因为他只有三个摄像头啊,他自己只有三个摄像头,所以他也只能查看这三个摄像头的监控的画面啊。 好的,然后我们现在呢就去把这些摄像头给关掉吧。 好的,我们现在都已经把摄像头关掉了啊,然后我们系统的功能都已经演示完毕了,然后这个因为我们关掉摄像头,他是一个异步的这种情况,就是说你关的时候他可能上一次的检测还有一点没有处理完啊,所以他检测到了这个异常情况呢,他就会最后的再去通知一下。 好的,这些呢,我们刚才也也讲到了,对吧?工人还有安利库,好,现在呢我们就去看一下文档吧,然后我们文档的话,这个环境安装教程和系统启动教程后面是有 专门的视频来教大家怎么在自己的 windows 系统上面部署运行起来,所以这两文档直接大家去看后边的视频就可以了。然后我们看一下这个项目介绍文档,打开我们的这个预览模式啊, 这个呢是我们有项目概述然后支持的这个优乐模型呢,是有优乐二十六啊,还有这一些核心特性呢,技术的一些应用上面的创新点,包括服务的架构啊, 还有这个具体的前后端的技术站,还有这个项目目录的结构啊,包括这个目录结构的一些说明呀,每一个文件是用来干什么的,都会在这里有写到。然后的话是我们还有这个一些功能模块的一些,这个不是讲解,不是详细的讲解啊,它是一个 嗯该药性的描述啊,就是大概告诉我们有哪些功能啊,它具体的主要功能是什么?包括下面有一些代码里边用到核心的代码会贴到这里啊,下面都是一些这些功能的说明的一些内容。然后对应的呢,我们再去看一下我们数据库表结构的详细说明啊,然后我们表结构的话 这里啊每一个表的这个表格啊,都会详细的列到这里,如果你有写文档的这种需求的话,这个东西是可以直接贴在文档里边的啊,这个是非常规范的一个表格的形式啊,我下边有些所以和业务说明这些介绍啊,都会很详细的写到这里, 然后在下面的话,呃,就是我们建表的 circle 语句了,这个也可以贴到文档里边,但是这些语句不需要你去自己执行,因为系统启动的时候,我已经帮你自动的去把这些表都给建好了,所以这些你可以看一看,不需要你真正的去自己去执行啊。好的,这是我们这个数据库表的详细结构的说明, 然后我们再看一下这个模型训练文档。模型训练文档呢?嗯,第一部分是我们数据集的一个介绍,有多少个样例啊,包括支持的检测的类别都会在这里列出来。第二个就是我们怎么去训练自己去训练这么一个模型啊?主要是看第二部分,然后下第三个部分呢,就是说我已经训练好的这个模型的一些精度啊,会列到这里啊, 然后至于怎么去训练自己的模型呢?我们后边的那个有一个专门模型训练的视频,会教大家怎么去用我们的这些命令去训练我们的模型,主要其实用到的就是这四行命令啊。这个呢大家直接去看后面的视频就可以,这里就不多讲解。然后下一个呢,我们就去看系统使用注意事项啊。 第一个呢就是说我们,呃,因为支持大圆模型的这种检测嘛,对吧?那么我们分了,因为用大模型去检测的话,他这个耗时和需要的成本也是会高一些的,所以我们这里给出了这种三种模式啊,第一种的话就是用大模型去检测,成本较高的,那么怎么去降低检测呢?降低成本呢?就第一阶段用 u 模型去检测啊,第二阶段呢,呃,用这个大模型去确认分析啊, 然后这里也写了一些这种嗯限流的解决方案,大家拿到文档之后可以去仔细的看一下。然后呢就是说我们系统支持的这种类别,但在实际的测试使用中,会由于这种模型的性能呀,场景的复杂度,还有这个目标大小的这些限制,未必能够检测出所有配置的类别。刚才我们其实演示的时候也已经看到了,就是有一些嗯路面的情况, yellow 其实是检测不出来的。 另外呢,就是我们系统现在默认支持是九路的摄像头,这个摄像头的数量可以调整啊,但是如果你开启的这个数量越多啊,需要的这个电脑的配置就越大啊,当然,但是你如果也不是说需要非常大的啊,就是一般的话,我们现在的内存差不多都是十六 gb 就 可以了啊。 然后就是我们系统支持哪些二 t s p 的 摄像头流呢啊,前两种呢,都是我们模拟的摄像头流啊,就是模拟的我们的监控摄像头流啊,你可以用自己的这种 m p 四视频呀,或者是电脑的本地摄像头呀啊,都可以去进行演示。如果你要接进入真实的网络摄像头啊,你需要这个呢,不能保证你成功的接入啊,你需要去用这种标准的二 t s p 协议的摄像头啊, 并且需要提前用我们这个测试包里面提供的这个工具点测试一下你这个摄像头能否联通啊,也就是在我们测试包这里的这个工具啊,提供了这个问系统下边的这个可执行文件包,你双击点开就可以用了啊,测试一下,看你的这个网络摄像头到底能不能用啊,如果能用的话就可以,然后下边的话就是一些其他的注意事项,我们这里就不去细看了啊, 接下来呢我们就去看一下最后一个文档吧,就是我们系统图的话,这里有系统加固图,加固的这种交互图,还有这个 功能模块的代码图呀,功能模块的流程图呀,这些内容啊,包括识别模块的这个图,但是这里这些图你如果看不清的话啊,我们也提供了在这个项目文档里边提供这个系统的备份啊,你直接点开双击点开,我们就可以在 浏览器里边啊,很清楚的看到这个图片了啊,现在就非常清晰的啊,我们这个是一个识别模块的功能流程图,我们可以看到这个流程还是我们画的,还是非常详细的啊,但是这里我就不多去介绍了,大家拿到这个文档图以后可以去仔细的看一下,也可以做一些调整啊。 好的,这个我们就前面这些流程图呢就不多看,下面呢就是一些啊,用了我们六十六模型的一些训练过程图,那么这个呢,主要就是看啊损失图,这个是训练的损失,这个是 我们的精度啊,训练的过程图,这个呢就是我们测试结果的一些图,包括 f 一 指标啊,这个精确率啊,召回率,还有这个呃,精,呃,这个是对,就是这些图大家也可以看一下,这个呢就是我们测试级的这个混淆矩阵啊。嗯,基本上还是比较,呃,还还是 ok 啊。 好的,然后这就是我们整个系统的演示和文档介绍了。好的,我们下期再见。


ok, 今天我们来看 c u p r 非常棒的一篇文章,这是二五年刚提出来的一个 r f d t r f d t 呢,它具有一个超强的功能是啥?是一个 n a s 可调参数,也就是说呢,它可以自动搜索雷,进行一个参数的调优活动。那么为啥说今天是一个重磅更新,因为 很多小伙伴一直在纠结 data 和 url, 那 么现在 url 加 data 完全给到你对不对?这个是嘎嘎创新啊,超级超级棒的一个创新点,那么在这篇文章当中呢,当大家涨点以后,然后再仔细的去研究这篇文章的原文就行了。那我们能够看到的是啥? r f data, 也就是说这个我们参考的改进模型, 他呢实现了四十八个 ap, 比他高了五点三个 ap 啊,这个还是非常牛逼的,是吧?他这个提升,所以说人家发了这样一篇文章,那么我们把他的方向,把他的思路拿到我们自己的文章当中,作为一个创新点,这不就完全 ok 吗?同时呢,大家也可以根据我们往期的二次改进,三次改进的一个手搓模型的教程, 自己去搞,对不对?同时呢也可以进行一个 ym 的 减震排列组合,然后自己抖手搓一个属于自己的优柔网络。那这样的话,你的文章还能发布出一篇比较不错的吗?至少是二区 ssr 没有问题。 s, 切,你随便搞搞,写个差不多是吧,下次去投一投,应该是可以中的啊,当然这个还得看大家的运气,各方面的原因吧,在这里不多说了啊。首先我们来看一下这一个呢,是一个模块,大家呢可以去参考这个模块的一个网络结构图, 好公式啥的,大家自己去参考一下就行。然后在这里面呢,这里面就是配色的标识,他是什么颜色,什么颜色?为什么给大家放配色的标识呢?是因为这个配色我觉得真的很棒啊,这个配色大家可以参考一下,作为自己的这些文章的配色。 那这样一个文章来给搞进来以后,我们的创新点,或者说我们的切入点怎么来搞?在这个地方我给大家写出来了,然后大家自己把里面的这个一共是四个吧,四个创新点,然后自己呢去看一下,把里面的内容融合到自己的方向上去就够了。比如说那你做的是这个 任何一个,比如说火焰检测,那你做的火焰检测呢?你又可以怎么写啊?基于 c 什么什么什么优乐二六,原来呢它具有什么什么样的特点,但是它们存在什么什么样的问题?就是因为基于这个,这个这个景能普照,火焰局部的空间依赖长虫,建模能力比较弱,当然大家要扩一下啊,不要 我说啥你就写啥,这样的话重复率太高,对不对?那么因此呢,论文提出了 rf data 的 一个改进,我们使用了 nms 的 一个改进, 那多尺度,然后捕捉纹理特征,轻量化交互,什么什么状态空间啊?那可以完美的适配到无 n m s 的 一个 设计,增强小目标的表达能力,对吧?然后 n a s 姿势用权重融合,从人工设计到自动则优等等等等等等等等,你看每一个一共四条,你每一个都可以按照第一条我说的那样,然后去融合,去改进,去写读,重点是写注啊, 重点是斜度好,也是在这个地方,这个呢仅供参考啊,你要以自己的实验为为为为基准啊,你不能说看到这个它是三十加,为啥我的不是三十加,因为你的模型它不一定就是 u 六 n, 不是, 不一定就是 u 六 s, 或者说 u 六叉,是不是? 好,那这个呢,大家就看一下吧,这个看一下,我觉得你用创新点来写的话,其实足够用了,这里面的图大家都可以参考一下。好,那接下来要干什么?大家想一下,接下来当然是给大家跑一下了,所见即所得啊,这是我们的优乐改进这么多,大家想想搞的话都可以用啊。然后在这里面的这个去哪里呢? 在这, ok, 出来,在这就是我们的公众号啊,大家别忘了关注一下这个 ai 计算机视觉,好吧。 嗯, ok, 然后我们开始跑吧,跑一个,给大家从零到一开始跑一下,首先啊,就是咱在本地环境,你得激活一下你自己的环境是吧?得有训练环境。那有的小伙伴说我这本地显卡太垃圾了,或者说万一我根本跑不了怎么办? 那怎么办?用云服务器,大家翻一下,搜一下我这个视频里面有云服务器的教程,直接一键跑通啊,这个所有的优喽代码,基本上我们改进的包都可以包跑通的,包跑通的, 然后排成寸是吧?训练一下,排成寸,我们要改一下,这个是优乐二六的,看一下,这里面估计七八十这种是有了,完全够大家用了,你这个发个几十片的现在都够用, 所以说当然了,选择有的时候太多啊,也不是说太好,为啥呢?因为很多小伙伴你一看这么多选择反而慌了,不知道该选哪一个,那你就随便圈出十个来排列组合就行,是不是 好给大家找一下啊? read data n a s 好 自动择优,然后当大家涨点以后呢,一定要去看原文,然后详细的把原文里面的各种东西给挖掘出来,是不是挖掘他的写作点,我给大家提供了就是一个写作思路,大家要靠自己去挖掘写作点,具体怎么挖掘,我们每期视频有的时候都会讲,一定要多看, 现在是时间,现在的时间已经晚上十一点了,我没猜错的话,现在一定会有小伙伴在搞科研,因为还有一对一的小伙伴在给我发消息, 所以说大家要一定要多努力啊,这个东西真的是你努力才有成果。好,大家可以看啊,实际上这副劳劈子增长的并不多,那我们给它融合在哪里啊?融合在这个地方是不是?那这个地方可以融合,实际上在这个地方你也可以替换,都没有问题。 记住一点,能跑通就是优秀,跑通就是优秀。好吧,那这样,理论上我们也搞了实验操作,我也带大家做了理论加实践,希望大家呢都能够早点发文章,那本期的视频就是这些,祝愿所有的小伙伴们能够在科研领路上一路长虹,一帆风顺,加油吧小伙伴们。