今天给大家来简单的介绍一下 us 这个目标简单算法的一个整体的加购。嗯,大家首先看到这个就是最左边这个部分,他是主观特征的 tc 网络,他实际上就是对我们输入进来的图片经过 rise blog body 大家可以看到重复了三次, 然后进行一个通道数的逐渐扩张以及图片尺寸逐渐压缩的过程。嗯,最终得到了一个就是二十乘,二十乘幺零二四这么一个特层层,然后我们将下面这三个有效层层层传入到中间的,这个就是加强层层提醒网络 中,然后他实际上就是一个特征融合的过程。然后大家首先看,大家可以看到首先经过上三样的特征融合以及经过下三样特征融合,最终得到了这个优罗汉的,这三个优罗汉的他分别对应的是大目标中目标、小目标。 然后最后一部分就是我们对这个优罗汉的进行一个解码的过程,然后就得到了一个就是具体目标的一个位置以及 种类信息。嗯,然后就是接下来的几期视频中,我将会带领大家详细的来解读一下他这个网络的架构,以及他是怎样来实现的。嗯,感兴趣的话可以关注一下,谢谢大家。
粉丝5.9万获赞28.3万

天下武功,唯快不破,就是优乐三分钟带你来搞定优乐唯一的测试和训练过程。在目标检测任务里边有两种方式,第一呢就是我们上次讲的 rcn, 它是属于典型的 two stage, 这种目标检测的方法要切出一个一个的图片,再把每一个图片丢到一个分类的模型里面去进行一个识别。另外还有一个 one stage, 那当然就是 yolo 了, ulo 呢,就是 you only look once, 也就说不用你两个阶段再去完成目标检测的事情了。而你只看一次 one stage 呢,首先肯定是会让他变快了很多,在这种设计模式下,因为他一下呢就是能够把整个图片都看到了,所以这样的话,他是能够统领全局的,能够看到图片当中的每一个对象,以及图片当中的对象之间的关系,对象和背景之间的关系,这个 都是 yolo 非常有优势的地方。 yolo 呢,其实这个网络啊也比较简单,你不用管它中间是一个怎么样的过程,但总之呢,中间就是一个准备时间网络,它的测试阶段的话,输入呢是四四八乘以四四八三通道的彩色图片, 输出的呢,就是七乘七乘以三十这样的一个数据了,输入的这个图片和输出的七乘七乘以三十他们是对应的,相当于是说我们在输入的图片上面画了七乘七四十九个格子,每一个格子对应的这个区域呢, 就负责来检测这个目标检测的中心点所落在这个格子里边的这些对象了,这个格子所对应的到了七乘七的那个位置上的那个,对应的那个对以为的那个数据里面就对应了一个长三十围的一个香量,这三 视为的香量里边就包含了两个框啊,每一个框呢都有五个数据,其中包含的四个是它的坐标位置以及这个框的知心度。 两个框每一个都是五个值,所以他们有十个值,另外还有二十个是这个里边的一个类别的概率, 所以这五加五加二十就构成了这一个三十的项量了。从这个输入到这个输出,这个网络就已经跑完了,但是在这呢还不是我们通常所看到的最终的那个结果。在得到这个七乘七乘以三十的这个输出了以后呢,还会去做一些后续工作。 这个后续工作是干嘛呢?就是通过这个 n m s 非极大抑制的方法来找到最终我们要的这个输出的结果,所以这样的话就完成了用 ulo 进行一张图片的目标 检测的过程了,这个是测试的过程,训练的过程会在这个基础之上再加上损失函数,通过损失函数我们才能够反向传播去更新这个模型的里面的参数,对应我们刚才所说的问题。损失函数都要涉及什么呢? 第一,每一个坐标的值我们都需要给它去进行一个纠正,所以呢一个部分是这个 x y 坐标的中心点进行一个纠正。第二个部分呢就是它的 h 和 w 这个高和宽 这个值的一个纠正。第三个部分呢就是如果这个格子是需要用来预测物体的话,那么这个格子的知性度就应当接近于一, 如果这个格子不需要用来去对于物体进行一个预测,也就说这个格子它里面就是没有的,我不希望它里边能够给我预测出东西来的话,那么我们就让它所生成的那两个格子的知心度趋近 近于零,这又构成了这个损失函数里面的两点。另外还有一点的话就是类别概率了,如果这个格子里边是需要它来识别物体,那么就让他的类别概率里边所对应的应当的那个类别的概率尽量的去接近于一,而其他的尽量接近于零。 所以综上所述,这五个方面就构成了 ulo 的损失函数的部分了。跟曹老师学 ai 入门如此简单。

手把手教你 ulov 八推理检测。哈喽,各位小伙伴,上一期我们已经单独安装了,拍照时,接下来我们第二步就是下载 ulov 八原码,这里我已经下载好了,到时候你们再 get up 搜索 ulov 八就行了。 第三步直接安装,要了一百了,依赖要了一百了,依赖在这个类似快这个文件他里面已经写好了,这是官网给出的文,安装里面的拍摄依赖就行了。我们直接进入这个目录进行安装, cnd 打开中断 又激活你的虚拟环境。 c o n d a 一起一起一起优龙 v 八,因为优龙 v 八我之前已经创建过了, 数错了, c one d a a c a c t i v a t activity you will be by 幺六成功就进入了幺六一八的虚拟环境。接下来我们安装那个文件, k p install 二二 a q, 这里等待下载就行了,官网这个文件也给出了安装命令,就是这个, 我们这里等待安装就行了,没什么难度。 好的,这里已经安装成功了。接下来我们用 p y 串打开幺六一八的项目,鼠标右击,这里有个用 p y 串打开这个项目, 第一次打开的话,他这个解析器还没有设置,我们需要设置一下解析器, 这里剪辑器设置, 弹出这个窗口,我们添加解析器设置。之前的视频讲解过了,这里就不详细讲解了。 好的,解析器加载完成了,接下来我们进行用 v 八推理 点开 ulov 八的项目,我们看到有一个文件夹叫 out, 这个点开,然后看到 ulo 要要看到一个 v 八点开,然后他这里有很多,比如说分类啊,目标检测还有分割的,我们主要讲解目标检测,点开这个里,点开这里, 然后这里有训练验证预测的代码,我们首先打开 预测的代码,首先需要改的地方就是这里的,这里就是你那个官网的模型,其中官网的模型我已经下载好了,如果你们需要的话,我我也可以发给你们,如果第一次运行的话,他会自动下载的,我已经运行过了, 然后有了一般的配置文件。在哪里呢?在这个 fig 这里, before 这里, before 点样这里。然后模型的话需要复制这个路径就行了。右击复制它的路径一,一定要复制它的角度路路径,然后把这里复制过来。 ctrl v, 还有一个你要检测的照片,检测的照片用官网的照片,官网的照片在 在这里,这里就是他的官网照片,我们选用这张照片进行推理,也是复制他的绝对路径。复制,然后在配置文件这里粘贴就行了。然后我们直接右击 一运行这个 play 的 play days, 嗯,差点找不到这里路径错了, 你看这里多了一个一删掉,你们复制的时候一定要小心一点, 你看他的预测结果,保持在这个目录下面,我们打开看,在这里 v 八这里,你看他已经检测出来了,我们在 在测试这张卡,复制这张的路径到配置文件这里,这个传送 sos 这里跟 ulov 五的差不多,直接运行 他的结果保存在这里,我们 来看一下结果,你看这里已经预测出来了。好的,这期视频讲到这里,如果配置有问题的话,评论区留言,谢谢,喜欢的帮我点个小爱心,谢谢!

优乐吧, you only look one 自我忍吧是犹如目标检测算法的最新版本,它可以实现在图像中同时检测多个目标,并给出检测框和致信度等信息。使用优乐吧需要掌握一下步骤, 一、下载游乐八的源代码和相应的预训练权重。二、在拍箱中安装必要的酷如问、 cv、 np 等。三、加载预训练权重,建立游乐八模型, 输入图像并进行预处理,将图像转换为神经网络能够理解的格式, 在游乐坊模型中进行预测,得到图像中的目标检测结果。六、对检测结果进行后处理,包括非极大值意志 nice、 筛选出自信度超过预值的检测结果等。七、可以将结果可视化保存,或者将检测结果用于其他应用程序。 这只是优乐吧使用的基本步骤,具体使用中还需要根据实际应用场景进行一些调整和改进。对于初学者来说,可以参照优乐吧提供的文档和例子进行学习和实践。

大家好,今天要讲的内容是基于优乐 v 八训练一个安全帽佩戴的目标检测模型。 在本节课中,我们将使用 ulo v 八提供的 python 接口训练一个佩戴安全帽的目标检测模型。完成模型的训练后,使用这个模型识别图像和视频中的人物是否佩戴了安全帽。 首先需要准备训练数据,最简单的方法就是在开购平台搜索相关的数据。打开开购平台,搜索 safe, tea helmet 或者 worker safety 等等,可以找到相应的训练数据。 这里需要注意数据格式,例如 safety helmet 这份数据的格式是 pasco voc, 而 sat safety 这份数据的格式是 yolo v 八,前者需要将数据转为 yolo 格式,后者可以直接使用。 我们选择 set safety 这份数据下载后可以直接使用。 将下载的数据解压在 c s s data 文件夹中。春运保存了两千六百零五个训练数据, valid 保存了一百一十四个验证数据, test 保存了八十二个测试数据。 打开春雨文件夹,其中 image 文件夹保存了图片数据, levels 文件夹保存了数据的标记结果,标记格式为 you 格式。同一个数据的数据名和标记名是相同的,可以对应上 我们随意打开一个数据图片和对应的标记数据。简单来说,每一行表示一个目标物体,在标记数据中包括了十四行,因此对于这个图片数据会标记十四 这个目标物体。 每一行的数据格式如下,第一列是 class id 代表类别的编号。第二列和第三列是 x center 和 y center, 代表物体边界框中心点的坐标。 第四列和第五列是 white 和 height, 代表物体边界框的宽度和高度。这四个值的取值都在零到一之间。 我们以图片中的第一个目标物体来说明,也就是红框标记的蓝色安全帽,它的标记数据是第一行零,零点四九八,零点一一零等等。这里的编号零 对应类别,安全帽 边界框中心点的坐标是相对于图像宽度和高度的比例。边界框的宽度和高度同样是相对于图像的宽度和高度的比例。 例如,这个蓝色安全帽边界框中心点的 x 坐标是零点四九八乘以 image y s。 中心点的外坐标是零点一一零乘以 image height。 物体边界框的宽度和高度分别为零点零二一乘以 image white 和零点零六二乘以 image height。 另外,从这张 图片可以看出,每个图片可以分为多张子图,每个子图也包括了多个目标物体。因此这份数据虽然只有两千六百零五张图片,但实际上可以有两万多个标记。结果, 使用康大 create 创建一个名为 safe head 的新 python 环境,其中 python 版本选择三点十, 创建后激活环境,并输入 pipe install autolitics 安装 yolo。 完成。安装后需要编写一个模型训练使用 的压帽配置文件,文件取名为 save head 点压帽。该文件说明了数据的地址和待训练的类别。 数据的地址有三个路径, train 对应训练数据, v l 对应验证数据, test 对应测试数据。 接着定义模型的类别数量。 n c 冒号十代表十个带检测的类别。这十个类别的名称保存在 names 中,这里我们重点关注 heart head 戴安全帽和 no heart head 未戴安全帽这两个类别。 编写模型的训练代码 ulo trim, 点 p y 一行表示导入 ulo 模块。 第二行加载 yolo 的预训练模型 yolo v 八 n 点 p t。 这个模型使用了 coco 数据级训练,是通用的目标检测模型,我们将它作为基础模型,在该模型的基础上训练安全帽。模型 第三行代码表示训练自定义的数据级,数据的配置,保存在 save head 点压没中。已 pose 等于一百,表示一百轮迭代。 最后串一点 v a r 表示使用验证机验证效果。 完成训练代码的编写后, 运行训练程序 ulo tree, 点 p y。 从运行后打印的调制信息中可以看到,我们当前的环境是 ultralitics ulo v 八版本 python 三点十 c p u 环境进行训练。 训练需要持续一段时间,每个已 post 可能需要训练三到五分钟,整体训练一个下午基本就可以完成了。 完成训练后,会在当前目录下的 runs detect train 路径下保存训练过程中的数据和模型文件,其中 waits 文件夹中保存了模型文件。 接下来我们使用 bass 的点 pt 进行测试。 编写测试代码 you low test 点 p y。 首先导入训练好的模型 nice 点 p t。 这里我们可以随意找一些测试数据,也可以自己构造一些数据,图片数据和视频数据都是可以的,直接将数据传入接口就可以了。 另外,在识别我自己构造的数据时,传入了 classes, 等于零二,它代表只输出零和二这两个类别, 也就是指识别安全帽是否佩戴 linewise 等于三十,表示指定识别框的字体大小为三十。 运行测试程序可以看到模型识别数据的过程,视频会一针一针的识别,识别结果会保存在当前目录下的 runes detect predict 中。 打开结果文件夹,可以看到图片和视频的识别结果, 其中视频会将每一针都识别好。从视频中可以看到人物安全帽、安全衣、挖掘机都被识别出来了。 另外,在识别时可以只选择一部分需要 识别的类型,例如在我自己构造的数据中,只识别是否佩戴安全帽这两个类别。我们可以看到模型准确地将结果识别出来了。 那么到这里,基于 ulo v 八训练,一个安全帽佩戴的目标检测模型就讲完了,感谢大家的观看,我们下节课再会。

大家好,今天要讲的内容是快速上手优乐 v 八,进行目标检测。 在本节课中,我们将在 windows 环境部署优乐 v 八,使用优乐 v 八提供的拍摄接口进行目标检测。另外,我也会进一步讲解如何阅读优乐 v 八的原码文件。 ulo 是一个端到端的实时目标检测算法,从他的名字就可以看出, ulo 算法只需要一次前向传播计算,就可以实现图像的多目标检测 做任务。 优乐算法兼顾了识别的准确率和检测速度,因此非常适合在实时检测的应用场景下使用, 例如视频监控、自动驾驶、无人机等领域都可以使用优乐来完成相关的任务。 yolo 算法于二零一六年首次推出,目前已经升级到 v 八版本。简单来说, yolo v 一到 v 三是 yolo 算法原始作者发布的版本,它的主要作者为 joseph redman。 从优乐 v 四开始,后续的升级版本来自不同的作者和团队开发。严格来说, 他们属于优乐系列的精神序作,例如美团、旷世科技等公司的研发团队都有参与其中。 我们可以在 outrelitics 公司的官网上找到 yolo 的各个版本,这些版本都有对应的开源代码。在本节课中,我们将详细介绍 yolo v 八的安装和使用方法。 ulo 模型的安装和部署非常简单,我们使用 conduct crete 创建一个新的拍摄环境,然后激活这个环境,再输入 pipe install ultra ctx, 就完成了 ulo 的安装。 接着在这个康大环境中打开 python, 输入 from autolitics import yolo 这行代码,这里如果不出现错误,就说明完成了 yolo 的安装。 打开 ultralitics 的官网,在 quick star 中可以找到 python 的样例代码。下面我们基于这段样例代码来详细说明 ulo 接口的使用方法。 我们将样例代码的前两行复制过来,第一行表示在代码中导入优乐模块,然后是 model, 等于优乐。 yolo v 八 n 点 yamo, 这句代码表示读取 yolo 的配置文件, 那我们要注意的是官方给出的样例代码中的这个配置文件。 yolo v 八 n 点 yamo 实际上并不在 yolo 的模块中,要用这句代码后也不会从互联网中下载这个文件,这一点可能会给新手带来困惑。 为了弄懂这句代码背后的意义,我们需要找到 altrolytics 模块儿的原代码,并在其中写一些 print 调试语句。最后找到真实的 yama 配置文件进行阅 阅读。 首先找到刚刚在康纳中创建的 ulo v 八环境目录,从中找到 ultralitics 模块, 具体路径是 e n v yellow v 八 lab set packages ultralitics。 继续打开其中的 models yolo 文件夹,然后打开 model 点 p y, 会看到刚刚使用的 yellow 类,这个类继承了 model 类具体的实现。在 model 类中。 从第一句的导入代码可以知道 model 类在 autolitics 下的安真文件夹中的 model 点 py 文件中。 找到这个 model 点 p y 文件后,我们要在它的 unit 函数中加几句 print 调试代码进行进一步的研究。 unit 函数传入的 model 参数代表了配置文件名或模型的名字,我们在 unit 函数的第一句前打印第一个井一标记和 model 的值, 它的下面是一些初始化的代码,我们忽略这些代码。继续向下看, 在 softix 等于 pass model 点儿 softfix 这个位置打印第二个井二标记 和 sophics 的值,然后继续忽略下两行代码。这里要注意 if sophics 音点压木这一句对于样例代码的调用方式会走这个分支,也就是进一步调用 sof 点 new 这个函数。 向下找到 new 函数,函数的第一个 cfg 参数就是我们刚刚传入的 model。 在 new 函数中打印第三个井三标记和 cfg。 下一句代码鸭某 model load c f g 是关键内容,我们可以在 ultralitics 点 n n 点 task 中找到这个函数的实现。 打开 task 点 py 文件,找到 yama model low 的函数,函数传入的 pass 就是刚刚的 cfg 变量。在这个位置打印第四个警次标记和 pass 变量。 观察下一句很复杂的代码,它具体在做什么其实我也没搞明白,实际上这行代码有什么作用也不重要。在下一句 unified pass 后打印第五个标记, 在下面的压模 low 的前打印第六个标记。实际上 ulo 最终读取的配置文件名保存在压模 file 中,这样我们就完成了必要的 print 调试代码 运行程序会得到如下结果,首先打印了标记一传入的文件名是 ulo v 八 n 点压木, 实际上这个文件根本就不存在。其实我也很困惑为什么样例代码要使用一个根本不存在的配置文件,了解其中原因的小伙伴可以留言讨论一下。 接着打印二三四五这几个标记,这说明我们正确的理解了代码的执行流程。 最后打印的标记六, ammo file 这个变量保存了真正调用的配置文件的路径, 按照这个路径 打开对应的文件夹。在 cfg models 下保存了 ulo 各个版本的配置。 v 八是我们当前使用的版本,打开 v 八目录,可以找到我们正在使用的配置文件。 ulo v 八点 yamo, 在这个配置文件中记录着必要的初始化信息,例如 n c 冒号八十代表了模型需要识别的类别,数量是八十。 scales 表示模型的规模。 backbone 是模型的主干,用于特征提取。 pad 是模型最后的决策部分,用于预测物体的类别和边界框。 弄明白 yolo 的配置后,下一句 model 等于 yolo。 yolo v 八 n 点 p t 用于加载模型。 这里要注意模型最初是没有的,依次调用,会从互联网中下载优乐 v 八 n 点 p t 这个模型。 model 点 predict 用于预测结果。这里 bus 点 gpg 是官方给的样例数据,我们可以再找一些其他的测试数据一起进行测试。 另外有兴趣的同学可以进一步使用刚刚的调试方法,在代码中写一些 print 语句调试并理解其他的接口。 还有一点要说明,即使我们最开始不加载压模配置,也可以正常使用模型和预测结果。这个压模配置文件主要是用来训练模型用的 运行程序控制台会打印出运营信息,从信息中可以知道三个图片的结果会保存在当前目录下的 rise detect predict 文件夹中。 将结果图片打开,可以看到 ulo v 八的运行结果,其中在 bus 点 g p g 中识别出了行人、汽车等,在 image g p g 中识别出了行人、风筝等等。 那么到这里快速上手优乐 v 八进行目标检测就讲完了,感谢大家的观看,我们下节课再会。

好,今天的话我们来学习一下 ulo 的多线层识别。首先打开我们的一元创建一个窗口程序, 然后我们把先把这个创口程序保存在我们的文件夹里面,就保存在我们的这一个练习的这一个文件夹里面吧,然后就是一个测试。好,接着我们双击这个窗口页面,就是这个空白页面,他会生成一个启动窗, 创建完毕的一个子程序。然后我们首先把我的模,我们的模块给他加载进来, 这个模块是一个绘制模块,就是可以绘制嗯,图形之类的,我们这一个多线层的话主要用来绘制,还有就是图片的识别就同时进行两件事情,一个是绘制,一个是图片的识别,然后加载我们的模块,就是这个 ulo 模块, 然后再加载模块超级模块,再加载一个精英模块。 好,我们可以看一下这个优乐模块,优乐模块的话现在是已经完全封装好了,总共的话它是有这个 cpu 识别,还有 cpu 的多线程以及 gpu 的多线程。我们可以看到 cpu 和多和这个 gp 他里面的那个函数都是一样的,所以说使用方法也是一样的。如果说你想更换的话,直接更换一个名字就行了。 我们在这个程序局这里创建一个变量,就是一个 ulo c, 然后它的类型的话就是一个 usb 识别的一个多线程。好,现在我们,嗯,我们这里还需要填一个速读,就说因为我们这个是多线程的,所以说你是需要同时有几个线程来进行一个推理识别,你这里就填几, 比如说我们要两个线层同时进行识别,所以说,所以说这里我就填二好。然后我们窗口创建完成的时候,我们要做什么事呢?首先我们要对这一个对象进行一个初始化, 我对第一个对象进行一个初始化,然后再对第二个对象进行一个初始化,因为我相当于是有两个县城可以同时识别,所以说我有两个对象分别都需要对他进行一个初始化。 接着我们就需要加载模型了,我就先对第一个对象来加载一个模型, 我用字节级的形式进行一个加载,你可以看到他现在是需要加载这个网络的 param 的模型,还有这个网络 bia 的模型。 bin 的模型。好,我们打开我们已经准备好的模型。 嗯,我们如果用如果用训练工具训练出来的模型的话,它默认是 cf 机和威特值的模型的, 所以说我们需要对这个模型进行一个转换,转换成这个呃,多线层调用的格式。打开我们的训练工具,我们可以先对这个模型进行验证一下,看是不是一个有效的模型。我们加载我们的模型。 好,加着这个 lamer 文件, 好,接着导入我们的图片,我们的图片的话可以直接拖放进入,也是可以的文件,这些都可以拖放进入的。好,点击识别看。现在我们的这一个模型是有效的,可以进行一个识别的,我们对这个模型进行 一个转换,我们切换到训练这里,点击转为 gpu 模型,然后选择我们的那个呃, cfg 模型,就是这个学习里面的 cfg 模型,然后的话这个也是可以进行一个拖放的,我们直接拖进来就行了 啊,这个不能进行投放,那么直接进行一个选择吧。 好,点击开始转换,然后选择你要输出的文件夹,我们一样的还是放进这一个本身的一个文件夹里面吧。好,转换成功。 好,现在你可以看这个文件夹里面就已经多了很多文件夹了,是已经那个,呃,转换完毕的,然后这个带有 o p t 的模型是一个优化后的模型,还有这个 o p t, 然后我们 cpu 的话啊, cpu 多线程的话就可以直接调用这个带 opt 的模型,然后我们现在就来写这个代码,然后我们首先要加载这一个 param 的模型,然后就是取运行目录, 我们要做的就是加载我们这一个运行路径下的模型 里面的这一个 o p t 的一个 p a r a m 的模型。 好,我们加载的是这一个模型,还要加载另外一个模型,就是那一个带 o p g 的 b i n 的模型,然后是一个 p i n, 找到就是这 这个,我们把它的路径复制下来。 好,现在的话我们就已经嗯能够把这个模型加载行加加载进来了,然后这个模型加载之后他会给我们返回一个锁引, 就相当于他在内存里面给这个模型进行了一个编号。 好,我们加载之后就会返回一个锁引,这个锁引的话我们直接就整出行吧,也没关系。 好,我们现在的话就第一个模型已经加载完了,我们现在需要加载第二个模型,然后我们第二个模型也可以用这一个方式去加载不同的模型,但是如果说我多多个这个,呃,对 的话,都需要加载一个模型的话,我们就可以直接用机制循环手直接提供这个锁引序号来进行一个加载。比如说我这里只有两个对象,我就填二,然后进行一个循环。 九,直接就是 yolo c 的一个 a, 然后就是一个,我们直接再用锁引进行加载,因为这样的话它速度非会非常快,我们直接根据这个锁引进行一个加载就行了, 这样的话我就循环两次,然后对每一个对象都加载了我这个所有的这个模型。好,现在的话我们就已经加载,对,模型已经加载完成了。 好,接下来我们就需要调用一个识别了,我们在这个窗口上面创建一个一个识别的一个子程序,我们添 添加一个按钮,然后的话就是一个识别。 好,然后我们再画两个编辑框,我们到时候直接就把这一个识别结果给他,同时输出在这两个编辑框里面,然后方便一个对比。 好,我们双击这个识别按钮,进入一个识别的一个子程序里面。 好,当我们单击这个按钮的时候,我们要做什么事呢?我们可以就直接写一个指程序吧,就写一个识别一吧,就说我们用第一个对象来进行一个识别,然后我这里直接写一个判断,循环手就 不断的对里面的数据进行一个识别,然后真,然后我要识别它就是一个 ulo c, 然后一个一,我先用第一个那个对象去进行一个识别。 好,我们看识别的数据,他是,呃,他的第一个边呢?是一个图片,你要识别哪一张图片?那假如我第一个对象,我要识别的就是我这个文件夹里面的这张图片,就是我这张图片, 那么我直接把他的路径给他填进来,我要识别的是就读入文件,然后是取运行目录,然后再加上我们的路径,我们的图片名 名字给他复制下来。 我第一个对象,我就识别这一张图片,然后我们看第二个数据, 第二个数据是它的一个输入宽和高,我们直接就填四幺六就行了,就默认填四幺六,然后后面呢是一个相似度,相似度的话我们填零点五,然后最后一个数据就是把识别的结果给它返回出来, 就 you 了,结果一一百。好,我们要注意我们的这个结果类型,数据类型它是一个识别结果,然后是一个数组类型的一个数据。 好,然后的话我们对这个识别解 结果进行一个输出,然后就是一个嗯,判断一下我们识别出来的是不是有结果,如果取数字成元数 ulo, 结果一,然后是大于零,就是说我这里是如果是识别到了结果的话,那么我就把每个结果挨个给他放进我的编辑框里面去,然后就是取据次循环,取数组成员数, 然后约了结果一,然后还有一个嗯,一个 a, 好,再把我们的每个结果给他放进我们我们的编辑框里面 去,那么的话,嗯,看一下,这是一个编辑框一,那么就是编辑框一 里面,然后是嗯,加入文本,我要加入什么呢?就是识别到分类, 然后是嗯 us 数据一的 a 的一个分类,然后加横坐标, 坐标 v, 然后就是一个到文本的一 个有了数据 a 的 x, 这里的话我们直接写目标吧,识别到目标 好,然后的话我们同时把这个识别的一个耗时也给他加进来嘛,就方便我们知道我们识别到底是消耗了多少时间。这里就是一个取函数运行开始, 取函数运行结束,然后有一个 t, 还有一个文本性 好,然后我们的话这里就已经就说这个函数运行,看 开始的时候,我们就已经开始统计运行这一句代码所需要的一个消耗的一个时间,然后这一句代码的话主要就是有一个读入文件,还有一个识别两个一起所消耗的时间,然后我们把这一个时间也给他写在里面吧,然后再加 耗时, 然后再加一个 t, 再加毫秒, 好,这样的话就已经可以。嗯,我们对第一个变量已经开始进行一个识别了,所以说我们点击按钮一的时候,我们要做什么事,我们就直接启动线程,就直接一个启动线程,我们启动这一个识别 的一个线程,然后就是一个识别一,要加上一个这个法 好,现在的话我们就已经启动了这个线程,然后的话我们再写一个吧,就说用用对象二来进行一个识别,然后如果说我们用对象二识别到了,我们就把它画出来,就画在那个我们的屏幕上, 然后就相当于一个县城是用来识别图片,一个县城是用来识别我们的那个桌面。好,我们再写一个子程序,这里的话我们就直接创建一个绘制吧,创建绘制 好,我们看他的一个参数,首先你要创建一个呃窗口的一个类名,随便取个名字就行了,就一个窗口位置。好,接下来的 话就说你这个呃窗口的左边,我们就创建一个零零,就是和我们屏幕一模一样大的一个透明的一个窗口,然后在这个窗口里面绘制,然后就是在我们的桌面上绘制,然后是取屏幕宽度, 然后去屏幕高度,然后后面的话就是一个呃指,那个指程序指针,这里的话我们就直接一个绘制循环, 会自循环,然后是一个指针的一个指针所说,我们要加这个符号。好,然后我们再看其他的一个参数。先,这样。 好,后面的话是一个禁止截图,禁止截图的话我们看它提示二是关闭,我们直接填二就行了。好,我们执行这一局代码的时候就会启动这一个子程序,并且这一个子程序是无限循环执行的。 好,然后的话我们就直接跳到这一个程序里面来。嗯,然后的话这里会返回一个那个呃创作句柄,就是我创建的这一个透明的画板,会生成一个创作句柄,然后就是一个绘制句柄吧,这个甜不甜都可以,没关系啊,是一个程序级的变量。 好,接着的话我们就在这一个选指承器的一个指针里面就进行一个无限循环,用那个呃 ulo 二,就是 ulo 第二个 变量来进行一个识别,然后达到了就是说线程一和这一个绘制两个线程同时进行一个识别的一个功能,然后我们里面写的就是一个, 这里我们要给他直接复制下来改一下就行了,我这里直接调二十遍就行了。然后我要识别的图片的话,就是我直接截取拼截取屏幕的一个图片,我直接用这个模块自带的一个函数版 ulo 极速截图,这个截图的话方式很多,你自己想用什么方式就用什么方式就行, 然后本身自带的这一个,呃,截图的话就比你用快照或者是用那个那个举截取屏幕区域要稍微快一点,所以 说你这个就自己随意吧,我直接就用这个模块里面的函数来截取我们的屏幕,然后发送给这个优罗来进行一个识别。首先这个创作句柄的话我们就填零,因为我们如果说是对整个屏幕来进行一个识别的话,截图的话,然后他的句柄就为零, 然后是我们的左边左边一样的左上角零零,然后是一个顶边和那那个右边和里边右边的话就是取屏幕宽度,取屏幕高度。 好,然后然后的话就是一个是否带鼠标夹就行,不带,我们不需要解序鼠标出来。好,然后这里的话就把我们的桌面解序出来了,然后我们 就直接识别我们截取的桌面就截图,然后这里的话我们就直接用这个结果二吧,然后就方便我们直接对这个结果进行一个绘制就行了。 好,然后的话我们现在就需要来判断我们的结果是否有效,能能不能识别出结果,如果能识别出来我们就给他画画出来, 那就是一个祭祀,祭祀循环手对所有的这个娱乐数据进行一个判断。 嗯,这里的话我们首先还要进行一个判断,如果有的话我们退货,就如果这个判不判断也都没关系,去数字上面说, 因为如果说你本身没结果的话,这个循环也是不会执行的,所以说你不判断也没关系, 结果二大于零,就说我如果是识别到了对象,我才进行里面的循环, 好,我要循环多少次嘞?就是要循环我这个这个成员过成员成员数的这么一个次数,然 a, 接下来我们就对每一个结果进行一个绘制, 嗯,我们就有一个函数,就是一个绘制矩形 绘制,矩形绘制,然后他需要填入我们的左边,就是我们这一个你要画的这个左边顶边宽度,高度和颜色透明度就就行了。然后我们左边的话就是我第一个数据的左边, 这里就是 ulo 结果了,结果二的第一就是第一个数据第一次循环的 a 就等于一嘛,然后它的左边就是 x, 然后它的顶边 他的顶边就是 y, 然后这一个矩形的一个宽度,然后就是他的宽度,然后这一个对象的高度 a 的一个高度,然后是一个颜色,哈,记得是颜色 颜色,颜色的话这里我们就直接用蓝色吧,然后最后一个是透明度,直接填二五五就行了。 好,然后的话这样的话就能够呃进行一个呃绘制了,就已经进行一个绘制的一个效果, 然后我们现在的话就来试一下吧,就来试一下我们的这个代码,啊,怎么样?先点保存,嗯,然后的话我们这里就直接开始吧, 就是说他这个,嗯,我们这里有写错了,说的是不能将整数型 转换为这个文本型。好,我们这一个是一个整送的,要给他转换成文本到文本。好,我们同样在编辑框二里面也给他显示在里面吧, 就是我把这个结果二,然后是一样的,把那个结果二识别到的也给他放进我们的这个里面, 然后是一个取函数运行开始,取函数 运行结束。好,现在的话应该没问题了,我们试一下啊,这里 t 是一个文本型, 这里也是二, 这个加载有一有一点慢,稍等一下, 他说的是不能将文本型的数据转换为字节级的数据,你看我们这里是,嗯,加载的字节级的数据,所以说我们这里是填入路径,所以这里我们要写一个读入文件, 我们要把这一个路径的文件直接读入,读入。 好,这样的话没问题,然后再试一下。 好,你看现在他是可以进行可以进,可以申请窗口了,我们先点一下识别吧。你看这边的话,他在一直这个弹这个数据出来,但是另外一个他没有弹,那么话也没关系,我们把这个窗口给他打开, 现在看到看两边都在同时运行呢,都在同时视图,然后为了让他更清晰一点,我们改一下这个窗口吧,更清晰一点,我们改一下这个窗口, 我们这样画吧,给他画大一点。 好,我们这里的话要给他再加一个换行符,然后才能看的更清楚一点,然后加入这一个换行符, 然后是一个加一个欢欢符。好,现在的话我们再来试一下。 好,我们来试一下,我们先点识别,这里已经能够识别到目标了,就是这是目标的分类,就是零和三这两个分类,然后识别耗时,再给我们调试输出识别耗时, 然后我们把这个图片也打开,看见没有,这个图片上面就已经给我们画出框了,就是这里你看见没有,这里就是怪物的框,不管我们用在哪里,他也是在识别的,他两个线层同时在识别, 所以说不管是两个县城,三个县城或者是多个县城都是可以同时识别的,就比如说我们还需要添加县城的话,我们直接就改就行了,就比如说我这里是直接有三个数组对象,那么我一样的,我再对三进行 一个初始化就行了,这里是三,然后这里是三,也填三,然后的话我们再复制一个吧,再启动一个线程,再启动一个线程识别二, 然后这里在十点二,嗯,我们给他改一下,然后这一个啊,就是一个三三识别。 好,把编辑框也改一下,改成三吧。三,我们再复制一个编辑框, 这是编辑框一,这是编辑框二。好,再复制一个编辑框三, 好,我们来试一下,试一下。就是说现在的话啊,三个线程同时运行,同时执行。 好,我们可以先点开始 已经有两个县城在识别了,另外一个他没有识别是因为他没有检测对象,我这里是写的,他必须要我们识别到结果,他才会在我们的这个框里面加入数据。好,我们把那个图片打开, 打开这个图片可以看到我们这个图片上面已经给我们画出来了,然后同时这个编辑框二里面也进行 一个识别输出了。好,然后我们现在的话就已经完成了一个多线程的一个识别了,然后这个 cpu 和 gpu 的使用方式是一样的, 就说使用方式是一样,你自己任意去调用就行了。比如说我这里直接改改成机就行了,就 gpu 识别就行了。 好,就直接可以调用这个就可以了。好,今天就先讲到这里,然后有兴趣的朋友的话可以。嗯,私我,然后进行一个讨论学习吧。

这是用优乐 v 七开发的火灾检测系统,周期标注火灾图片,训练一个目标。检测模型能同时识别浓烟和火苗, 把模型放到嵌入式机逼优上做实时监测,一旦发生火灾,可通过电话通知并回传现场视频流。 火灾检测的难点比较多,比如干扰样本多,容易造成误解。再比如标注不统一,导致无法有效的计算。按摩 ap, 这里有些开源的资料,可以优化模型,提高征兆,感兴趣的朋友可以关注一下。

想入门或树立目标检测领域,这篇论文一定别错过,其对目标检测网络 yolo 的演变进行了全面的分析,对 yolo v 一道 yolo v 八每一次 更新、迭代和贡献进行了总结,讨论了模型结构变化及美带网络训练技巧,总结了美带网络的经验,包括 ulix dumbo、 ulo p p、 ulo。 此外,为方便大家理解和运用,还给大家准备了 ulo v e、 ulo v 八相对应的论文和配套代码,赶紧收藏备用吧!

今天给大家展示一下我用数维派和英文我实现了目标检测的一个小任务。公交检测是计算机视觉中比较简单的一个任务,因为在一张图片中找到某些特定的物体,同时标出这些物体的种类、 位置。 logo 就是这样一个实现目标检测的系统,他本身是基于当代的构建的神经网络,算法优恶的全都是有 nangplans, 就是说只需要表演一次就可以识别出图中的物体的类别和位置。优乐的作者每次更新模型的时候都会给出一个猜你版本,这种轻巧的版本用精度换来了速度快和性能要求低的优点, 适合练手或学习。或者像我想在树煤炭上尝试一下的条件。我使用的是最新的优乐 v 三版本,不过我们应该见不到威斯了,因为优乐之父称无法接受木齐研究成果的负面影响,宣布退出 cvj。 回到实验看,这个是识别系统自带的图片,我们可以看到用时大概是六秒左右,我们可以看到识别出一些动物, 这个是我用出门拍摄像头拍摄的照片,然后进行了识别,效果还不错吧。相关资料我放在这里,感兴趣的可以去看看。下一次我准备尝试一下视频的识别,有兴趣的朋友可以继续关注这个话题。
![[课程][原创]yolov8训练自己的目标检测模型windows版
课程地址;
https://edu.csdn.net/course/detail/38254
本课程将带您进入yolov8面向目标检测框架搭建环境,标注,训练,测试等完整实现过程。主要内容如下
1、 yolov8框架基本介绍
2、搭建windows上yolov8环境
3、用labelImg标注自己的数据集
4、转换数据集
5、配置参数
6、参数调节和训练
7、测试自己的模型
yolov8是yolov5团队最新佳作,是一个anchor free的框架,集成了yolov3,yolov5,yolov8框架。yolov8发布形式为cli版本,大大降低了使用难度,是目前非常优秀目标检测图像分类实例分割的框架。yolov8不仅仅是一个目标检测框架,而且集成了图像分类,实例分割。让我们在cv领域又多出一个非常实用深度学习算法框,本课程主要针对目标检测做自己的数据集训练,不对实例分割和图像分类训练做讲解,请同学中注意一下本课程主要内容,请观看本课程的课程导论,了解课程主要内容和体系结构。](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/e7fcbde979e588e08a6ff0416e5aed0a~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2081530800&x-signature=4NtH2wwyUrbCDmjDCrBH%2FAkPB2E%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=2025122003272939172C6E96554A96E56B)
各位同学们好,我是你们的讲师云归来,那么这个课程呢,主要是教大家呢去做一些啊, 就是我们的整个整个课程呢,是第一个就是教大家去怎么去在温度上搭建自己的这个勾搭环境,还有安装 l 空挡, 然后呢我们会对这个 ulov 八做个介绍,然后我们重点就是教如何教大家在温度上训练自己的这个数据级,然后用然后用 ulov 八这个框架去训练自己的数据级,并测试这个自己这个这个训练的模型的一些效果啊,这个就是我们整个课程的一个, 呃,这这个这个这个流程啊,然后呢我们主要是跟大家就是我们这个课程的目标是教会大家如何在文字上训练自己的这个 ulov 八的一个模型啊,根据自己的税积啊,自己标注的税积啊,然 然后呢?嗯,怎么去把自己的参数啊,设置对,然后,嗯适合自己的这个显卡啊,带这样的一个参数,然后并且,嗯训练出这个模型啊,这个是我们课程的一个主要技巧,然后我们这课程呢是在文字上操作的,所以大家呢 嗯要对应自己的平台啊,有的人是 u 光图,那么可以借鉴一下,但是不能够全借鉴啊,因为 windows 和 u 光图上面毕竟是有一一点区别的啊,嗯, 大家也可以去借鉴一下啊,我们这个如果你是六六次的,也可以借鉴一下,然后呢还有一个就是说我们这个呢,不对这个导出啊,部署做这个讲解,因为我们这个课程的目标呢,是教大家是如何训练自己的模型啊,这个是最重要的 啊,所以呢我们的这个呃课程的这个目标呢是训练啊,训练模型啊,不是这个部署啊,不,不是在这个 部署封面啊,跟大家去做讲解啊,然后呢我们这个课程呢就是分为这个十一个课程啊,大家十一节,十一节,然后呢?嗯,我们会逐步的去跟大家去讲解一下,然后呢有的讲解来的,如果大家很熟悉的话啊,我们是面对于初学者啊,或者说帮助我们的一些 啊同学去做这个章节的,如果说大家觉得就是说在安装这个 coda 和安乐 coda 啊比较熟的话,大家可以跳过这些章节啊,然后自己去对照对应的章节,找到这个想学想学习的这样的一个 啊课程呢进行呢进行学习啊,然后呢嗯去看一下我们是怎么做的啊,然后呢我们啊后面会跟大家就是依次的去按照这个课程从上到下依次为大家去做讲解。然后呢我们这个课程呢是,嗯,因为我这个是实时,就是 实时录播的,不是提前的,也就是说我不会对这个录制的视频进行这个剪辑或者是后期的这个处理。我们这个是我们这个就是实时讲的啊,实时讲的,尤其,呃因为有的东西啊, 长时啊,长时间没有弄,可能自己也有一些疏忽啊,所以说,呃,可能会在某些地方有一些呃错误啊,所以大家可以指正一下啊,可以在这个评论中啊给我指正一下,然后呢我给你们大家去做修正。 然后呢我们这个课程呢就是基本上的这个讲解的,大家可以按照我们的这个章节啊,十一节课,看一下我们这个课程到底是什么啊?然后呢我们后面呢就是正式就是从这个第一节,第二节啊,第三节去做讲解啊。因为这个, 呃,第一节,第二节,第三节啊,是我以前也讲过,所以我就直接把以前的视频这个放上去啊,因为讲的也是特别 详细的啊,所以大家可以按照我们的视频去,嗯,做讲解啊,然后后面我们就会依次的往上跟大家去讲,然后呢我们这一课呢,嗯,跟大家介绍啊,就是到到此结束,到到此结束了啊,我们这节课呢就正式的进行,大家去挨个去讲解了。

今天给大家介绍一个利用优录 v 三以及速算法实现的对车辆进行检测跟踪以及技术的一个项目。先来看一下最终的输出结果,最终会输出一段视频,大家先看效果怎么样, 然后来看一下整个项目是怎么实现的。呃,整个代码的话比较简单,比较适合新手来学习。然后首先我们下载一下优乐 v 三的那个官方的一个权重放到这个这个目录下。呃,然后我们看一下这个文件,然后指指定一下这个输入以及输出的一个视频机制,然后我们直接运行就可以了。 好,整个上面已经开始开始运行,然后这个就是正在运行中,因为我用 cpu 跑的,然后比较整个不是很流畅。

大家好,欢迎来到一起学 ai, 今天来介绍一个小项目,关于目目标检测的,计算机视觉方面的一个,我们先来看一下检测结果,哎,就是这样的,他可以把我这个视频里面的人物呢一一标注出来, 标注出来之后呢,啊,他给你这个显示出来啊,你是一个人呐?啊?还是一个,这个地方看到了吗?还有一个看的 bag 是一个包包啊,这个大部分都是我随便找的一个视频啊, 然后我又找了几张图片,哎,这个很准确,他认为百分之九十二的准确率,汽车呢?百分之九十四的啊,一个 bus。 然后这个人呢,他漏了一小部分也可以检测,他认为 百分之五十七的可能是一个人因为漏了一个手啊之类的。好,这是比较简单的,比较简单的就船漏了一小部分也能检测出来。好,那么具体怎么实现的呀?哎,咱们来看一看啊, 这个是他的官方网站啊,就是 yolo, 用 yolo 来进行试算实现。 哎,这个广网站他说的啊,为什么是 you low 啊啊?说 you only look once 啊,你只要看一次 就可以进行分辨出来你是什么类别的,哎,比如这种,这个是用的非常好了啊,很多很多是这个网络网络巡警啊,或者一些这个在 交通部门啊,在摄像头上经常用它来分析,来分析的话找一些违章汽车啊之类的 非常有用啊,这是一个计时检测,叫做 real time object to detection 以及计时的一个目标检测系统,我把它翻译成中文啊,咱们就看着更更友好一些。 好,他说是一个嗯,计时的一个实时物体的一个检测系统, 然后这个他三十个 fps 的速度来处理图像啊,什么是 fps? 他们经常打游戏的都知道啊,他就是,呃, 他的英文是 frame per second, 就是每秒他有多少个真频数, 就是在一个视频里面,咱们都知道他是有一张张图片组成的,也就是每一秒他有几张图片给你展示出来。这个呢,就是每一秒三十张图片,他以每秒三十张图片的速度来处理图像。 并且这个这个 coco test 是,呃一个检测物品的啊,他检测物品大概有五十七点九啊,咱们来看一看这个 coco test 包含哪些类目啊?在这个, 在这个小项目里面有,我一会来介绍这个小项目,在 qq 找一下 qq classes tests 这些物品啊,有 person, bicycle, car, 还有这些东西啊,飞机啊,汽车, 轮船啊, trunk boat 之类的非常多,还有一些动物,那些 cat, dog, house, sheep, call 啊,还有一些这个,呃,其他的 snowboard 啊, sports ball 啊,球类啊, cat, 风筝啊之类的各种物品,它可以检测这么多,检测这么多 啊,在里面的准确率呢?达到了一个百分之五十七点九啊,目前是这个 map 是,嗯, mean average position, 好像是,就是准确率的意思带掉的,然后咱咱们再往下看哈,我一会要介绍的这个项目也是优乐威三,他说这个准确度非常高,速度呢?也非常快啊,速度? 他是,呃,这个 这是什么意思?就是我可以把这个模型啊部署起来,我直接用它训练好的一个小项目,这个客户数据积压的,接着就不太去看了, 好,咱们就接着来运行一下我的项目,他是他的这个项目呢啊,就是这个啊,感兴趣的话可以给我留言,我到时候把它发给你, 然后他怎么部署啊?部署我要打开那个安的康达哈,首先你电脑里面要装一个安的康达,因为它里面需要非常多的环境,非常多的一个运行环境,我是重新新建了一个。呃,运行环境啊,因为我里面呢有很多 非常多的环境,别给我的之前的一些环境冲突了,我在这个地方新建一个啊,比如 yolo, 我就不再新建了,你建一个 yolo 建完之后的话啊,他就会出来啊,等隔一两分钟了出来这个看看他装了哪些东西啊?咱们需要在这个特定的环境下运行他只是的一个环境呢?啊是这是这个在我的这个包里面都已经有了, 这是别人配置好的啊,咱们也是拿来学习一下,在这个 requestment 点儿 test 哦,他需要 metropolitan leap 是三点二点二,然后 non pie 是多少, open open cv 是多少,这个配置多少之类的这些东西。但是呢咱们不需要挨着去安装哎,我教大家怎么安装啊,咱们一装完之后呢?哎,打开这个 tommy no, 打开透明的前面有一个 ulo, 看到了吗?因为这个时候呢就是我的 ulo 的一个环境下安装的,他跟我的这个贝斯啊,还有安的康大三啊,不冲突,因为这个贝斯我经常使用来做一些测试啊,不能给我的去冲突,我就重新建了, 好,我怎么运行啊?哎,我来运行这行代码就可以了啊,我运行之前我首先我得去调到我的那个目录下面啊,比如我的那个目录在哪?我看一看啊,我放到了这个,呃,地盘 ai 零四 u 喽,然后 位三杠 monster, 把它复制一下地盘冒号切换到地盘之后呢,点击 cd, 哎,这时候他就给我切换到了我的那个木炉下啊,我看一看我的木炉下,第二,下面有有哪些东西啊?就是这些东西, 我现在是需要找的是 requestment requirement, 点儿 text, 点儿 txt 运行这个,运行这个我就 把我这我就把我这一行代码啊,写上你的 paper in 四道杠 r require requestments requirements, 点儿 test, 然后把它复制粘贴过来,点运行,那就可以了,因为我已经装过了啊,我也非常快 啊,每一个我都运行了一遍啊,运行完之后呢,咱们去使用它啊,怎么使用啊?那就是我先把。呃,哎,这个就牵扯到之前我讲过的一个迁移学习了啊 啊,如果不太懂他是怎么用的,可以去看一下我的那个迁移学习啊,这里面我已经给他写好了啊,只需要一行单码就可以,我运行这个 percent detected 点 py, 然后呢,这个杠杠臊子是什么意思?就是我需要的去传入的我要去检测的几个照片,然后后面呢就是我加载他的位置,他的权重,他在我的那个包里面,他就有,在这个包里面,他加载的是优柔位三点 pt, 哎,这个就是权重,他把这个权重呢加载过来,这是杠杠 c o n f 点二点零点二五啊,这个版本我把它复制,复制完之后呢,哎,我直接的去 去这个地方去粘贴,嗯,打开我的这个 yolo, 我直接在这个地方粘贴。哎,这里面呢?他也需要是检测的一些图片啊。啊?在 data 的 images 里面 来,第一次在你妹子里面她有需要检测的图片,我把这两个都删,我把这个删除掉了,我把这个我看看我的这个视频是什么类型呢? 哎,这是目前我找的一一些水果啊,还有一些人啊,我看他的测试效果是什么样的,我看一下,就是能不能给我标记出来,哎,这时候我来点一下。运行 可能会需要一些时间哈,是因为他每秒钟来看看,他目前的话权重已经给我加载了啊,如果咱们是第一次运行的话,他可能会需要一些时间 啊,加载的时候会需要一些时间。我的这个就嗯,运行过一次了。大概 不到一分钟吗?来咱们看一看,他是每一张图片,每一张图片的去运行,他是八十六个图片,你看一看是不是八十六个。 从这地方属性里面找一个详情,他说每秒钟,他的真品每秒钟是三十三十,我这个是两分 两秒钟,两秒钟六十多个,六十多个,他这个不可能是正好的两秒钟啊,可能是两秒多一点,我四舍五入了,这时候应该是两秒多一点点,这截取的应该是八十多针,没有,没什么问题。 好,他就他会去,每一张图片都会去,我画上小框,画上小框之后呢才去这个。呃,给我输出来结果啊,咱们来看看他这个训练他的 这个测试过程啊, 我这个安装呢是用那个拍 touch 进行安装的,因为我没有找到 cars 的一个版本, 好让他训练一会啊训练一会,咱们来看一下这个。呃, u 六输网站里面还有什么东西啊啊?他说版本三有哪些功能?嗯? 用哪些功能?艾灸类似于这样啊,去给我检测出来。 dog bicycle trunk 水果的。我不太清楚他能不能检测出来。 然后如果你只想对一个图像进行检测,不需要知道这一点。嗯,这是 test, 可口点儿。 detait 有个微三微四还是去加载权重进行训练。 house 马马的一个检测。 其实他还可以去实时的。啊啊,下一次我找个摄像头啊,来实时的去检测一些物品,就我照到哪他这个地方随时的去给我打打出来。我这时候是录的那个。 呃,连这个地方写了吧。网络摄像头上的一个实时检测对吧?如果用这个的话, 部分 c v 变异 原理是一样的,我用这个原理也是一样的。嗯,我看是不是训练完了。 好,给我训练完了。他说你,你的 results save the tourance detect x accept 五啊,放到我找一下我的路径 放到了 rance detect except except example。 哎,这时候看一看。好哎,它已经 检测出来了。来,咱们来看看啊,我随便找一针上停止。嗯,字比较小啊, 他说这个是 person 搭的,然后这个呢是 do not 啊,百分之七十,然后这个 with 啊,花瓶啊,百分之七十六啊,这个 with 百分之六十五。然后一些水果 也检测出来了啊,这个他检测的是 orange, 这应该是一个莱蒙啊,这个检测错了,这个是 ball。 对,这个检测对了,这也是 ball。 这个是 这个菜菜的名字。不知道啊,不知道对错,这个菜好,基本上还差不多啊。检测的还差不多啊。好,这就是这个小项目啊, 如果感兴趣的话,嗯,把它分享出来,嗯。

有朋友问我这个 ulva 三是怎么进行目标识别的,我今天给大家演示一下。嗯,打开右路官网,按照他这些代码一步一步的进行环境配置。然后咱们识别一下,这是今天我识别照片,这张照片识别,先打开终端 cd doctor net 输入代码,嗯, 输入你想识别图片的路径。 这个过程在苹果电脑上将会需要十七秒左右,因为他没有,因为打的显卡不能在这屏幕上运行, 大家可以等待一下。好了,这张图片使用完了,汽车还有路灯。


get to it to get to it。
![[深度学习][目标检测][项目介绍]yolov7项目简单介绍 #编程入门 #学习 #程序代码 #在线学习](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/a8fca5eb124847727d67a633baf1d60c~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2081530800&x-signature=1pSZsiOQMCsXvMPSMDlXhjH7gaQ%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=2025122003272939172C6E96554A96E56B)
大家好,今天来跟大家介绍一下我们这个深度学习里面比较新的一种目标检测算法,叫 uv 七啊,我们只是从他的这个 呃原理,还有他的一些简单的这个呃就是相当于我们只是做一些简单的介绍。首先我们可以在各大号码去搜这个 uv 七,然后我们可以得到这个 呃,得到几个一楼为期的项目,比较典型的项目,第一个就是很明显就是呃我们用的是这个四大是最高的,然后这个以前我有网管,这个也是很不错的,然后大家可以看自己去对上去看一下,目前我们肯定是用这个, 然后我们点进去看一下,然后呢初学者的话,一般的话我们需要只需要就是说跟着这个步骤走,虽然说这个是英文的,但是我们其实 英文的话,你没有没有多少很多的用啊,大家只要按照这个步骤走,你比如像这个啊,测试啊,怎么传入参数啊,还有这个怎么去做训练啊?大家都可以看到,其实都有,你看大家都有像这个呃 gpu 的训练, 还有一些这个呃,这是 p 五的魔斗,还有 p 六魔斗,大家可以看到啊,然后这个是多 gpu 的训练啊,基本上都有啊,这边都有,还有如何去在这个视频上做检测,然后在图片上去做检测, 还有导出模型啊,基本上就是非常一体的,还有他扩展性的,像这个骨骼检测,还有这个 啊,实力分割啊,看一下这就是他的一些项目。那么呃大家如果是初次接受这个项目的话,实际上大家只需要下载原码,下载原码,然后下载对的模式, 那模型在这个美丽子下面下载就可以了啊,大家可以点美丽子进去看一下啊,这里面都有这个模型啊,大家可以在这下你看这里面有很多模型啊,大家认得下。然后原码其实在这也有啊,大家可以点一下下载这个。 然后我们重点就是说大家最主要就是说要解决这个啊,就是要用啊,就是用的就是底胎个派,还有这个部署的一个 spot, 就是导出模型的,还有这个寸,这是我们用的是最多的 这三个大家可以对照一看一下,其实里面的代码还是比较多的啊,大家可以对照这个代码去仔细的阅读,那么对你自己这个对他的一些体系和结构啊,是非常有帮助的。 然后呢这个就主要是这个跟,嗯,主要是跟大家说一下这个项目它的优势在哪里?它就是嗯大概的这个 这个原创团队去出品的一个优乐威七,那么大家可以如果大家现在接受过优乐威武的话,他可以大家可以看到这个优乐威七跟那个优乐威武的这个呃像训练呢,然后像这个吉他的一个泡的基本上都是长得非常像的,基本上都是一样的, 就是说你可以用原来用数据优乐威武的数据集,可以在优乐威七上面轻轻松松训练起来。然后他们俩他们这个迪达亚的流程啊,基本上都非常非常像,基本上可以说就是就是一样的可以轻松。 然后出去的时候大家最关注的就是他的这个怎么去验证和测试,这个是非常重要的,大家可以看到这个里面,然后最主要的就是一个指定模型的参数,然后还有一个 sus, 你这个 sus 里面你大家可以看到他们两个是一模一样的,大家只需要关注于 传这个硕士啊,这个硕士是支持文件夹啊,图片还有视频啊等等啊,这些都会是支持的,大家只要换一下他就会自动去做检测, 然后导出的话,呃,他导出是,呃,现在导出是知识非常多的,这个模型,大家可以去进去这个圆满里面去看啊,这个我就呃 给大家看一下外面他的他里面支持导出的东西还是非常多的,非常多的像这个,呃呃, touchscreep, 然后这个扣 mail 这个我没接过,然后 atsucres 还有这个 ovs 基本上都是支持的 ovs 啊,目前就是这这三种啊。给继续看看作者去更新优鲁五可能支持导出支持多一点,然后大家要问的话,就是凭直观 就是说就是优楼物的算法,其很强,但是在实际上测试过啊,就是目前的话,呃,我经过这个许的训练区以及发现这个好像优乐威武还是稍微要比优乐威七强一点,优乐威七强一点就是,呃,我一般是用这个优乐威七的 台里,然后用优鲁鲁五 s 他们俩去做对比,但是他们两个其实说实话,呃,真正的像模型级别的话啊,没有什么对比,但是从这个效果来看,优鲁鲁目前的话稍微还是要比优鲁鲁七要效果要好一点,效果要好一点, 嗯,大家可以去对到这去学习,然后去看看。然后还有一个就是说大家一定要注意一下这个优乐微七,大家也可以在网上去搜一下,网上其实有很多关于优乐微七的介绍,这是我是推荐的,也就说大家如果要学 的话,就是第一个就是跟着教官方的教程走,肯定是最重要的,因为官方的教程是是最原原汁原味的。然后呢你如果要是想扩展的话,就可以在网上去搜一下,呃,这个博客的这一些比较重要的一些讲解啊,他对你们一些呃,讲解还是比较详细的,大家可以去 搜一下,其实他在像什么优漏的结构啊啊,对比啊等等啊都有啊,那么大家可以对着这个项目去做啊,然后这样呢,我们可以就是在目标检测里面啊,就可以去做这个 去,就是非常好的去掌握他的一些像这个训练啊,然后导出啊,部署啊,还有这个他的一些检测啊,啊就是他的一些测试啊,二次开发到哪,这是我跟大家去介绍的,就是学习方法,就是第一个就是跟着原教程走,就是呃 对英文有一点要求,但是大家不要怕英文,英文是最好的啊,所以说第一个看官方教程,第二个就是看这个博客,第三个就是看视频啊,如果要在网上能找到视频看的话,看视频也是可以的,这就是我们推荐给大家的一个框架。