#YOLO26 #YOLO26创新点 #AutoDL #星图2026年毕设来了，YOLO26来了，YOLO26创新点解析，使用YOLO26训练自己的数据集和推理，租用 GPU 服务器训练教程，AutoDL服务器训练教程

YOLO26参数设置

130

9

90

18

举报

发布时间：2026-01-29 08:54

查看AI文稿

AI文稿

最新优喽二六来了，今天我将使用优喽二六训练自己的数据集合推理，并教你本地训练和租用 gpu 服务器训练，顺便带你解析优喽二十六创新点全网最详细教程。哈喽，大家好，优喽二六来了，听说它是更好更快更小的优喽模型，那么优喽二六还能使用吗？肯定是可以的，官网都出新的，肯定是可以用的，那本期教程我教你使用优喽二六训练自己的数据级和推理，如果本地没有 gpu 的话，那么我会教你们做用 gpu 服务器来训练的。顺便来讲一下优喽二六的创新点，它是前几天刚出的，我们来看一下这个目录，点击它就行了。载药这里优酷二六是在二零二六年一月十四号发布的，我今天才写完这篇文章，在博客就可以收到了，我们来看一下优酷二六的更新点，但是有这么多，但是可能也不止这么多吧，这些主要的创新点我会一个个讲的，会根据代码来讲的。我们先下载优乐二六的源码，在目录这里找到就行了。源码的下载，打开官网的地址，打开了之后呢，这里找到它的最新版本号，它最新是八点四点五，我前两天是下载是八点四点二的，选中它就行了，有 code 点击下载就行了，这里等待它下载我，那我就用前两天下载的八点四点二的代码，是会一直更新的，我们用之前的就行了。如果你需要我提中的原码，在公众号这里发送 yellow 二六原码，就可以获取我的完整原码了。我的完整原码是什么样子的呢？我们来看一下，它是包含了训练的测试数据集，还有训练脚本，推理脚本数据，配置文件等，把它解压出来，然后打开就行了。拍 tom 打开由官网的运训练模型下载在这里下面这里它是有目标检测的模型啊， n s，这个是模型的大小，还有分割的模型，还有分类关键点检测的，还有个旋转框的 o b b 的，根据你们的需求来下载就行了。点击就可以下载了，点击你看它就会自动下载，我已经下载过了，我就不下载了。在我的元码包里面也是有这几个模型的，你们用哪个就下载哪个代码打开了然后呢？环境怎么配置呢？先配置一下环境吧，环境的话在看下在哪里。环境配置在这里， uolo 二六， uolo 十一十九八七五，它的环境都是通用的，只需安装一次就行了，我还是用之前的 uolo 十一，环境还是没变，选中你之前的环境就行了。不懂的话可以看这个教程，从四分五十三秒开始看环境安装教程，我这里就不演示环境怎么安装了，它是很简单的，看这个教程就可以安装了。假设把环境安装完了之后呢，就可以运行推理训练脚本了。我们先进行推理吧，因为环境已经配置好了推理，在这里复制这个脚本就行了，如果你下载我的原码就不用复制，我原码已经包含了我们打开推理的脚本在这里第一个参数就是放你模型的路径，我的模型是在这里，你用哪个推理就填哪个，你用你自己的模型也是可以的，上述参数就是放你那个推理图片或视频的路径，我这个推理视频是在根目录的，所以直接填他的文件名就行了，也可以填他的绝对路径，复制路径填到这里就行了。然后是否要显示，如果你要显示的话就填处，不显示就 force，我们直接运行，看下它的推理速度快不快。好的，推理结束，如果你需要推理图片的话，你就把图片的路径填到这里就行了，图片我就不用显示出来了，然后重新运行，然后它的结果会保存在这里，这个就是它的推理结果了。然后上面这个是我刚推理的视频结果是优喽二六跟优喽十一的推理方式训练方式一模一样的，跟 v 八也是一样的。那我们先讲一下优喽二六的创新点吧，等一下我再讲训练，训练很简单的，我们先找到目录这里，创新点在这里我们先讲第一个移除分布焦点损失模块嘛？它在哪里呢？它的代码在 ross 点 py 文件这里，我们打开代码来看一下。双击打开了之后呢？分布焦点损失模块的核心代码在 bbox 这个类里面，我们打开代码来看一下，然后进行搜索就行了，把这个类的名字复制，然后呢 ctrl f 搜索就是这个了。从这行代码就可以看出来，它是通过 i g max 这个参数来控制是否使用分布焦点这个损失的，如果这个参数大于一，那么就使用分布焦点损失，如果小于或者等于一就为空嘛。这个参数是在它的模型文件里面写的，我们打开它的模型配置文件，在这里二六这里打开了，你看它的 ig max 这个参数是等于一的，那么就移除了这个分布焦点模块嘛，然后下面的再看一下，这个就是分布焦点损失了，如果为空的话就使用下面这里就用 l e 损失嘛，在这里这行代码前面的就是他的归一块处理了。 u 二六，它为什么用 l 一的损失呢？我觉得应该是为了提升速度嘛，而分布焦点损失目的是为了提高模型精度，它是通过 i g max 这个分布值来提高定位精度的，但是会增加它的计算量，它这里出师值是十六的，如果使用分布焦点损失的话， u 二六它是走这条分支的。好的，这个创新点过了，我们继续讲下一个，我们来看一下博克，第二个就是端到端，无需 n n s 推理。优乐二六，有点类似优乐威时的双标签分配思路，在训练时同时使用两个分支，推理时候只有一个分支。我们来看一下它的代码在哪里，可以在它的 head p i 来看一下。打开代码还是在这里 head 这里看一下。检测，这里这个就是检测头了门，往下面来看一下在哪里，代码在这里，我们来看一下博克，它是有两个分支，一个是一对多，一个是一对一，一对多就是一个真实物体对应多个的预测框嘛，一对一就是一个目标对应一个预测框嘛，他的分支怎么走呢？训练的话他是走两条分支的，一个是一对多，这行代码就是一对多吗？ one two many 一对多，然后继续往下面走，下面走就是一对一嘛，在这里要把一对一和一对多放到一个字典里面，然后在训练的时候他返回，回去嘛，所以他是走两条分支的，这个就可以看得出来，如果在推理的时候他就使用一条分支，就是问图问嘛，就是一对一嘛，从这行代码就可以看得出来了，这里是推理的，大家来看下这里就行了。他这样做的目的是为什么呢？就是在推理时候降低延时嘛，一句话就是优乐二六在训练和推理上比之前的优乐 vs 一理论上更快嘛。好的，这个创新点过我们继续讲下一个，下一个就是什么呢？更详细的内容大家来看一下博克就行了，下一个就是 pro ross 和 d a l pro ross 的代码，在 ross 点 py 这个文件里面，我们来看一下，先找到它，然后它的类在哪里呢？在这里复制这个类搜索就行了，直接搜索到了，就是这个 boss 大概思路就是在训练过程中动态调整一对多分支和一对一分支的损失权重，在训练初期侧重一对多的分支，这样加快模型的特征提取嘛。在训练后期就是侧重一对一的分支嘛，我们可以从代码这里来看一下，在代码这里它是这样定义的，一对多它的权重值是零点八就是百分之八十嘛，剩下的就是一对一的权重嘛，一减去零点八就是零点二嘛，定的就是百分之二十嘛。然后在训练的后期就是一对多的权重变成了零点一，然后他的一对一分之就变成了百分之九十嘛，他的权重值还是通过这个方法来更新他的权重值的，在训练过程中他会动态调整的，在这里他的权重衰减是在哪里计算呢？是在这个方法来计算的，大家来看一下就行了，在这里。好的，继续来看。扑克还有一个小的创新点，就是优化小目标的，就是 s t a l，如果目标大小，它会将框高放大处理的，就好比一个篮球框，它太小的话，你投篮的话难度会更大，你把那个篮球框变大了，你投篮的几率就会变大了，它的意思就是这样子的，它的代码在哪里呢？我们来看一下他的代码在 t a l 这个文件里面，我们打开以后搜索就行了，我们主要看他的核心代码，在这里看这位 f 核心代码在哪里呢？跳进这个方法里面，他的核心代码就是在这里宽高获取原始的宽高吗？如果他太小的话，会进行放大处理，在训练过程中，如果你的目标太小的话，他会将其放大放大，那么理论上你的精度会提高，理论上哦，好的，这里过了，我们讲最后一个，最后一个就是优化器了，他用的优化器是 miui s g d，应该是他最新提出的优化器，这个优化器是将 miui 和 s g d 结合在一起的，两个权重各占一半，在代码这里可以找到，我们可以打开代码来看一下。它在这里，在这里打开这个就是它的最新优化器了， vivo 和 s g d 各占一半，就是各占百分之五十嘛，它这里写有的具体代码实现，大家来看一下。这里，在这里这么多，大家来看一下就行了，我们来看一下博克，其中铭文部分就是负责结构化的更新嘛，就是对 t 度的正交化处理，它应该是参考大模型的处理方法，目的是防止 t 度消失和爆炸，整体上实现更稳定的训练和更快的收敛速度。这 g t 部分就是提高它的计算效率的好的创新点解析完毕，官网说优乐二六最小版本在标准 cpu 上运行速度最高提升了百分之四十三，大家拿到原码来试一下就行了。然后训练还有推理的速度是不是比优乐十一更快，大家来试一下就行了。好的，优乐二六更新点基本讲完，这只是我的个人观点，更多的更新点在源码里面，可能官网没有说出来，大家拿到原码来看一下就行了。然后呢，我们来讲一下它的模型结构吧，它的模型结构在这里，它的模型结构跟之前的优乐 v 十一一模一样，几乎没有变，只是加了一些参数而已。我们来看一下这是优酷二六的模型配置文件，它加了两个参数，还有一些，这里 c 三 k 二，这里也是加了一些参数，这里我这里也写出来了。在这里 c 三 k 二的小优化，我们来看一下在哪里 c 三 k 二。找到这里， c 三 k 二在这，它的小优化就是在上面，这里，它现在有三个分支，一个分支，两个分支，三个分支，它之前是有两个分支的，我们来看一下这里，它之前是有两个分支的，现在多了一个。然后看一下优路 v 十一的配置文件在哪里呢？ u 六十一在这里，它的模型结构是基本一样的，只是这里的参数不一样，它这里只有一个处，它这里是多了一个处的。多了一个处是代表什么意思呢？就是它这里就多了一个分支嘛，如果等于 a、 d、 d、 n，就走前面这条分支，否则的话就走 c 三 k 这条分支，后面的分支就是跟优路十一的分支一模一样的，只是它这里的全仓多了一个簇簇的话就是调用前面这个分支嘛。是两个的话就是调用前面那个分支，一个的话就是调用 c 三 k 这条分支，它的参数在这里可以看得到的。 force force 把两个处传进来就是调用这条分支了，这里不讲这么多了，好了，这里结束，最后讲一下优乐二六的训练，优乐二六的训练跟优乐十一、优乐 v 八 v 十 v 十一 v 十三都是一模一样的，初级处理也是一模一样的，我们来看一下初级准备，这里有目标检测，还有分割的，还有关键点检测 o v 的，大家来看一下使用什么工具来标注就行了，你也可以用现成的数据来训练，就不用自己标注数据。这里我就不讲了，假设你弄好一份数据就可以直接训练了。在这里优鲁二六训练，这里我这里也写了本地训练，还有服务器训练，我先教一下本地训练了，如果本地训练不起来，我后面租服务器来教你们怎么训练。这里拿到我的训练测试数据集，在这里填一下你的配置文件就行了。这个是我之前训练的行人数据集，那我就用之前的就行了，如果你用其他数据改一下路径，还有类别的数量还有标签就行了，大致都是一样的。然后这里改完了之后就可以直接训练了。在训练这个文件里面，这里填上你的模型配置文件。在哪里呢？在刚刚那里，二六这里，把这个路径复制到这里就行了。这里的路径填你们的，然后是否加载你的训练权重？如果你不加载，就把这条代码注册掉就行了，我就加载，然后他的训练速度可能更快吧。然后训练次数，批次大小，然后现成数肯定的话也可以填八或者填零，如果选成八的话，你就最好填个零，然后其他都不用动，然后直接训练这里，等待他加载就行了。好的，这里他是训练成功的。好的，这里先暂停了，我这里只是演示一下怎么训练，更详细的教程可以结合播客的内容来看。好的，接下来就是租服务器来训练的，我之前也出了一期租奥拓 d l 的远程服务器来训练的，训练方式跟本地一样，把你的代码还有数据上传到上面，然后改上路径就行了。然后直接训练跟本地训练一样的，只是上面是没有界面操作的，然后在只能在终端这里操作就行了。终端也是可以训练的，比如说在服务器的话，你就需需要用命令来训练了，如果说派森，派森去按住回车键，他就会自动补全，然后直接回车。服务器训练就是这样子的，我这里先暂停，他是能训练起来的。好了，接下来进入服务器训练教程，这里暂停。如果你使用奥拓 d l，你就看这个教程来就行了，这里是手把手教成的，大家来看下去就行了，很详细的。那这期视频我是租用 c s d n 的星毒 ai 进行训练，它是 c s d n 官网推出来的，博主已经在这个星毒 ai 平台上面配置好了优柔的训练和推理环境，它适合优柔二六十一 v 八 v 十的训练的，不过你训练其他模型，你也可以自己配置。环境很简单的，就是点击这个链接，然后呢直接这里自动续费可以关闭，然后你需要时长在这里勾选就行了。这里机器两个， gpu 或者三个，我这里就用一个就够了，要是用我的镜像就行了，我已经配置好了。然后这里也有教程，大家来看看就行了，要直接部署这里带大家来部署一下，这里续费直接关闭，然后直接部署用这里直接支付就行了。设置用四零九零的机器，然后点击运行中，这里等待它创建。也可以看这个教程，这个镜像只需要你上传数据集就行了。环境我已经配置好了，路由二六的代码也在里面，如果你用你的代码的话，也可以上传到上面，我上传的代码是版本号是八点四点二的，如果你有最新的话，你也可以上传最新的代码上去，这里写的很详细，这里等待它创建。我们先把数据集上传。先上传数据集，我是用的工具是叉 f t p，那这里有安装教程的，大家来看一下就行了，我这里就不教你们怎么安装了，这里写的很详细的，打开叉 f t p 上传的下载数据都是用这个工具，然后这里等待它启动。我数据先准备上线，我是用优优二六官网提供的数据，它是用于家居物体检测的，它的类别是有多少个类？有十二个类别，我们来用这个数据集来训练，你也可以训练自己的数据集，反正上传上去就行了，很简单的。这里等待它创建。怎么创建这么久？这里先暂停一下这个星途 ai，它创建镜像怎么这么慢？应该有半个钟了，还没创建完成，我这里先等待它创建吧。我在奥拓迪奥鲁这里创建一个环境吧，到时候我会分享出去，到时候你们直接用就行了。现在我是从零开始创建一个环境，创建优酷的环境，先租一个实力先，然后这里地区的话，大家根据自己需求来选择就行了。然后显卡租个四零九零，他这里没有了五零九零，五零九零又太贵了，租不起，这个更贵，六千。北京的看有没有选内蒙，内蒙应该有。那我就做一个四零九零的，然后 gpu 数量它这里自己可以选的，到时候我把我的镜像分享给你们。社区镜像应该也是有的，如果你们在这里也可以搜索社区的镜像，我先创建一个镜像先 id，我还是用这个吧。然后呢直接创建就行，这里等待它开机。它这个开机应该挺快的。这里还没得呢还没得，我去，这里已经开机成功了，这里是运行中，这里可以连接你的叉 f t b，把这个命令复制一下，然后这里属性，然后把这里粘贴过来，这里方便复制。然后这个主机就是 at 后面的全部，这是我刚刚复制，然后端口号粘贴到这里，然后呢这里就选这个，然后名称随便写，优喽二六或者优喽二六就写个 url 吧，随便写的，然后端口号是多少？是刚刚那个，然后用户名输入的，然后密码在这里复制，密码粘贴到这里，然后呢进行这里先把它删除下，然后直接连接，然后这里接受，一般把一般把代码还有数据上传到这个数据盘这里，我们打开 jupiter 这个服务，它这里也有帮助文档的，如果不会的话来看这个教程，我之前出过教程的，在这里这里打开一个终端，然后它这里有的数据盘实体关机，不会丢失，一般不会随镜像保存，如果你要保存镜像的话，你就不要把这个数据放在这里，然后系统盘就是录的上面的使力关机，但是会随你的镜像会保存，就是你的环境啊，会保保存在你的镜像里面，然后这个也大家来看一下就行了，然后直接来看这里，然后我是内置了他的拍照曲的，然后来看一下他的拍照曲版本是多少，因为刚刚创建的拍照取应该是一点一，一点零的，然后库达是十一点三的，如果你的环境和他提供的不一样，你也可以自己新建，然后他在哪里新建呢？在他这里有教程的，大家来看看就行。镜像如果平台上没有你想要的版本，你可以在开机后创建自己想要的 ps 版本和扩展版本，我这里是适合用，那就用它的原来的环境就行了，原来环境如果缺什么就安装什么就行了。我先看一下星图 ai 这里。好的，这里已经启动了，我先这里先等一下吧，先关机先吧，等一下我再过来弄这个，然后我先教这边的教程，然后它这里也有教程的。启动完成了之后呢，打开这个 jupiter 这个服务，点击它就行了，这里就会等待它启动。嗯，启动完成了之后呢，看这个教程，因为我系统盘已经放有 uolo 二六的代码，要把它复制到数据盘就行了，复制这条命令，然后呢回收就行了，然后它这里会把那里的原码复制到这里来，如果没有的话，你可以自己在这里上传，往这里重新连嘛，这里重新新建一个 yellow 二六的就叫优喽二百，然后把这个端口号什么都复制过来，跟刚刚的操作一样的，其实每个远程服务器的操作基本都是一样的，然后主机是艾特后面的全部，然后端口号复制到这里，不能有空格后面，然后用户名是录的密码，在这里复制粘贴到这里连接。嗯，进来就可以看到系统盘的全部文件了，然后这个是我镜像保存的优乐二六的原码，八点四点二，如果你有自己的原码，你也可以上传到上面，用我的工具就行了。我的数据盘是在这里的，刚刚已经复制过来了，为什么要复制到这里呢？因为这里更好的操作嘛，比如说打开它，然后就可以在这里修改了，直接进行训练。我先把数据集上传，先上传也是上传到这个数据盘这里，把这个代码双击或者拖拽过来就行了，如果是文件夹的话就要进行拖拽，文件的话就双击它自动会上传到这边来，这里等待它上传，在服务器也是可以推理的。然后呢，先激活你的环境在这里，然后进入这个代码的目录，也可以进入代码的目录 cd，然后就进入你代码的目录，就是这个目录。然后呢，下一步应该是激活了。激活的命令在哪？激活的命令在这里也可以看一下服务器的环境有哪些。又弄错了， emv l i s t 然后服务器的虚拟环境是有这么多，前面三个应该是服务器自带的，这个优乐环境是我自己创建的，就是分享给你们的环境，你们就可以用我的环境了。你要激活激活命令怎么激活？ c o n d a h e t i v a t 然后优酷就行了，这里是就是你优酷的环境的名字，然后回车，只要左边这个括号变成优酷，你就可以用我的环境了。然后就可以在我的环境里面看一下有哪些包，它是有安装了这么多，如果没有的包，你也可以自己自己安装， p i p 安装就行了，如果你需要加载其他的环境，跟 windows 的环境安装一样的，它也是有个终端的。跟这里一样，数据已经上传到上面了，然后我们进行解压，怎么解压呢？在上面只能用命令，我们看一下数据的包在哪里，我们先退出上级目录群，然后看上了有哪些，这个就是我的税级了。我们进解了解压的命令，如果不会的话来看教程，它这里有常用的命令来，看完这个教程就懂了，不懂你就问 ai 吧，它的包名前面 h，然后按住 tab 键，它就会自动补全了，然后接着杠的就是你要解压的目录在哪里，那我就解压到当前目录，当前目录就是这里，然后文件名，文件名叫什么呢？叫换吧，然后加一个斜杠，然后呢回车就行，然后这个命令打错了，应该是 u n 的 u n 杠一 c p，然后压缩包的名字，然后需要解压到的目录叫 home d a t a，这文件名可以随便取这里等待它解压完成，这里返回上一个目录，就可以看到你解压的文件夹了，然后这里的类别全部复制过来，然后在你的代码的配置文件数据及配置文件这里粘贴，它，应该是十二个，十二，那又填十二，它这里填的列表也可以用字典，也可以用中括号，就是刚刚的原始方式，用哪种都行的。然后这里训练的路径是在哪里呢？我们也可以在这里来看一下。这里重新进入，然后训练的把它这个路径粘贴到这里填绝对路径啊，这样就不会容易出错。然后这个就是 vl，然后这里改一下 vl，然后保存， ctrl s 保存。然后呢回到训练这里，然后训练的次数我就填个五十轮吧，然后皮子大小填一二八吧，如果你显卡显存大的话就填多一点，就是芝麻服务器的显存嘛，然后现场数填八，然后使用的设备是零，零代表第一个 gpu，如果你有两个，你就填一嘛，零一嘛，那我就有一个，就填零嘛，然后什么都不用动就可以训练了。模型的文件在这里，然后配置文件这里修改一下吧，在哪里呢？在这里可以找得到，快在这里吧，二六是哪个呢？是目标检测，就把这个路径复制过来，这个路径把前面的删掉，写成一个点，然后就保存了点斜杠就是这个原版的跟路径嘛，然后就可以找到这个配置软件了。如果你这种方式出错的话，就填绝对路径，然后在终端这里进入你的原码路径，原码路径，然后直接拍摄就行了， d r，然后直接回车，然后服务器训练，就是这么简单，用我的镜像就不用拍摄环境了，已经帮你们配好了，如果缺什么包，你可以自己安装的，没问题的。嗯，继续等待吧。训练完了之后呢？怎么下载你的模型呢？它会有你的结果的，然后把它拖拽到这边就行了，然后你就可以在本地测试了。这个是我在服务器上面推理的，它会保存结果在这里，如果你需要下载的话，在这里下载就行了，或者在这里它是有 w w 下载就行了。这里训练成功了。好的，这里服务器已经训练成功了。这个就是我创建的镜像，又是帮你们配好环境的。后面我在这里再创建一个环境嘛，因为这里启动的话比较慢，你们看着来选择吧。这里先开机，这边等待它训练。我先把这边的教程弄一下。好的，这里重新连吧，这里看能不能重新连好了。重新连已经成功了，因为这里已经开机了，然后这里刷新吧。好的，这里打开终端，它前面是被子，就是系统默认的环境，命令还是跟之前的一样，它是只有一个环境的，那我就用默认的环境就行了，如果这个环境缺什么，就安装在里面就行了。我们先装安装优酷的环境吧，因为它已经安装了 pose 了，因为前面已经看过了。我这里再看一遍，你看它这里有的。那我就不用安装，直接安装下一步就行。看优优的环境安装在这里。 ipad 已经安装完成了服务器，然后呢？安装其他环境。我们先把原码上传上去吧。 cd 到数据盘。原码是哪个？看一下。原码是重新去官网下载一个吧，方便你们知道怎么弄。选最新的八点四点五的，复制这个命令，看看能不能下载它好像没有这个命令。那直接上传这个压缩包吧，我之前下载过了。那就擦掉。那直接上传就行了，找到源码先，我们就上传最新的。你也可以上传之前的原码，比如说优路十一 v 八 v 七 v 九 v 十等等，各种原码都是这种方式的。在服务器训练的话，然后数据集也上传一下吧。数据集还是用刚刚的吧。在哪里呢？找一下先。我用其他的。那就用其他的，用行人的收集这里，等待他上传就行了。然后这里先解压人马是这里不？嗯，这里可以看得到解压，看一下人。然后需要解压的文件是哪个需要解压的。需要解压到的路径在哪里呢？那就在当前目录下。嗯，当前目录下。 person 吧。加个斜杠，然后呢？回车。哦，这不是，这是尤洛。解压到哪个文件夹呢？啊？这个是，这是原码的文件，需要解压到原码 u l。需要解压到的文件夹是哪个呢？这里随便建一个 u l t i l y t i c s，加个斜杠吧，原码就解压到这个文件夹了，然后呢？数据集上传完成没有？上传完成了，继续解压。需要解压的文件是哪个？优酷数据集的杠 d，需要解压到哪个文件夹呢？这里新建一个 p i s o n，加个斜杠，然后呢？这里已经解压完成，然后这里还没有基础环境，就是其他依赖，还需要安装其他依赖，安装其他依赖。在这里新建一个文件，你要把这个包全部复制到里面就行了，在本地直接上传到上面就行了，这里重新打开，然后在这里找一下那个文件在哪里。先在本地新建好，就可以上传到上面了。我之前的源码包是有的，数据及配置文件上传到上面前，模型也可以上传，需要的文件上传到上面就行了，然后配置文件环境，配置文件也是可以上传的。上传到上面，在你上传完成之后呢，就可以安装依赖了。复制这条命令在这里粘贴。大家是不是没有找到这个文件，因为你的路径不在这里，需要进入到这个文件的路径在哪里呢？按住 tab 键， tab 键它就可以进入了，然后再使用这个秒模拟安装就行了，这里可以打开的，这里等待他安装好的。安装完成就可以测试训练了，训练太简单了，然后把那个路径复制过来，这里的路径要填你服务器的路径在这里。模型二六，我的配置文件是这个目标，复制路径粘贴到这里就行了，这里点就行了，如果你不放心的话，就填绝对滤镜，绝对滤镜在这里，这个就是它的绝对滤镜。不是，这个是原版的绝对滤镜。模型配置文件还是在这里这里复制，复制到后面这里就行。好的，然后修改一下，启动，先修改一下数据级的配置文件，我们在这里复制过来，这里应该是 vl，反正你们的文件怎么命名就怎么写。确实是 vl，有一个类别标准对点，然后训练字数，那就五十吧，一二八，现成数是八，看一下哪里要改，这里需要填个零，就是用第一个 gpu 这里保存，看看能不能训练成功吧。 picken，看这边训练完成没有，这里是什么警告，不用管，这边已经开始训练了。打包这个错误呢，就是缺少这个包嘛，遇到报错不用框的，它是跟 windows 安装环境差不多的，就是缺什么包就安装什么包，问题不大。星途 ai 的训练教程我都有了，奥拓 d l 的教程我也是刚刚从零开始教你们的，也是很简单的，如果你有其他原版也是这样子训练的，你在本地弄好你的训练文件，这里文件等等模型啊什么的，然后上传到上面，然后训练就行了，很简单的。好了，这里等待他训练，然后训练完成我就要关机了，因为他是有收费的，到时候我把这个镜像分享给你们就行了，然后你们直接用就好，如果你们不用的话也可以自己安装，因为安装环境我刚前面演示过了，很简单的，缺什么就安装什么，没什么难度。如果在服务器上面推理，也需要修改一下模型的文件呢？需要推理文件的路径啊在这里，然后这个参数之后显示在服务器上面是不能显示的，因为它只有一个黑黑的终端，这里只保存它的结果就行了。然后这边训练完成了没有？好的，训练完成，它保存结果在这里。然后大家来看一下，在这里，这这一叉。 b 二，我是训练 proson 这个人呢，要训练结果都在这里，你需要怎么下载到本地呢？很简单的，这里暂停，暂停，暂停点错了，把它拖拽到这边就行了，这里就可以下载到本地了。然后这边也是一样，这边还没训练完成。奥特迪亚鲁服务器训练教程到此结束。好的，这里先关机，因为它是收费点，这里存完没？存完了就可以关机了。然后这边呢，这边，这边还差几轮就训练完成。好的，先保存一下镜像就填优酷就行了，优酷二六吧，优酷二六十一 v 八的都行。我看一下我的镜像在哪里。应该是这个，到时候共享给你们。这里怎么共享出去呢？这镜像到时候弄好再分享。这里先关闭。这里已经训练完成了，然后这里也是输出它的结果了，让我们把它的模型啊训练结果都下载下来，它是保存在 e x p 这个文件，把它拖到这里就行。好的，训练完成了，然后本地也可以用的，本地用你刚刚训练的模型进行推理。在哪里呢？在 e x p 这里保存的结果在这里，看一下。为啥没有结果呢？因为我的模型不是检测人的，是检测家具的。我们拿另外一张看一下，直接去拿测试的数据，直接复制一张，然后把这个路径粘贴过来。好的，你看检测成功。好的，全部教程到此结束。然后训练中断的话，在这里看一下就行了。然后全部教程到此结束。幺二六幺二十一，幺二 v 八的改进，还有系统原码都在这个专栏目录里面，大家有兴趣的可以来看一下。如果这期视频对你有帮助的话，请点个小爱心，谢谢，下期见。

落花不写码

粉丝4642获赞3.2万

相关视频

22:11
YOLO26来了，带你手把手用YOLO26训练自己的数据集 #深度学习 #yolo #人工智能 #计算机视觉 #目标检测
338Coding茶水间
25:22
yolo系列视觉检测模型参数和训练结果分析视频有帮助就点个赞吧。#人工智能 #深度学习 #目标检测算法 #ultralytics #机器学习
99宋大水
02:14
yolo设置模型参数
3Lizzy阿志
01:41
全面分析 YOLO26 从关键架构增强和性能基准测试，看YOLO26重塑边缘检测新标杆。
近日，在伦敦举行的年度盛会 YOLO Vision 2025（YV25）上，Ultralytics公司创始人兼CEO Glenn Jocher 正式宣布了 Ultralytics YOLO 系列的最新成果—Ultralytics YOLO26！
全新的 YOLO26 是一款更快、更强、更轻量的计算机视觉模型，能够高效地分析和解读图像与视频，并且采用精简化的架构，在速度、准确性与部署便捷性之间实现了理想平衡。
与前代相比，YOLO26 在模型设计上进一步简化，同时引入了多项增强功能，并继续保留了 Ultralytics YOLO 模型一贯的优势：易于使用、支持多种计算机视觉任务、可灵活集成与部署。
#科技 #人工智能 #具身智能 #计算机视觉 #机器人
45深蓝前沿
32:19
YOLOv8 核心配置：模型初始化 + 参数 + 返回结果 #计算机视觉 #人工智能 #机器学习 #深度学习 #编程
查看AI文稿
AI文稿
哈喽，各位同学大家好，我是江山老师，那么上节课呢，我们已经利用优乐 v 八完成了视频中每一帧的多目标检测实时追踪的效果，并且呢可以汇聚出物体的运动轨迹啊，那么可以达到现在如视频中一样的效果啊，那我们上次写的这个怠速程序呢，也很炫酷了啊，但是呢，多多少少还存在这些问题，比如说呢，现在在整个画面的高速公路上呢，我们竟然被检测出来一个类似于火车一样的物体，对吧？那说明呢，这个物体其实不应该被检测出来，但是呢，他也被检测出来了，我们先不管他对不对。首先的话呢，我们有一个诉求，就是我希望在整个的视频画面中只检测出特定的类别，可不可以啊？另外呢，还有一些问题，就是我们的优乐 v 八默认给我们绘制出来的这些检测框啊，它有 id，然后呢？有类，然后有知心度等等。那么我还有一个诉求啊，假设说这些 label 标签我不想要那么多，比如说我想把执行度去掉，或者说呢，我想改变一下字体，甚至是说我想改变一下检测框的绘质的粗度啊，就是我嫌它太粗了，或者嫌它太细了啊，可不可以实现？那么当然呢，这些呢，在优乐维巴黎都提供了定制化的参数，以及呢甚至是一些函数的功能啊。那么今天的话呢，我们先来启迪一下 uov 八的关于它的 model 模型里都返回了哪些值，可以进行哪些多样化的设计啊。那么这个的话呢，其实在优喽的官方文档里是有专门的篇章去解释和提供这些 api 的内容的，但是呢，由于它的官方文档是英文的，所以说江山老师呢特意花时间啊，把所有对大家能够用得到的有用的这些英文的文档呢翻译成了中文，并且呢放置到了课间当中，大家呢可以去参考。那么在接下来的课程里呢，我将带领大家去实践一些我们可能会经常用的到的一些属性以及函数。好的啊，我们先关掉这个视频的效果，那么我们继续上一节课的项目，首先为了全起底优乐 v 八的这个模型，那么我们首先呢就从模型的初步化开始讲啊，我们呢先新建一个项目叫做零三啊， model 初步化啊，那么我已经呢在桌面上准备了一个文件夹啊，这个文件夹里呢是我从 voc 二零零七里面截取出来的一些图片啊，主要呢是人相关的比较多一些，还有一些其他物体啊。然后呢，我现在先把这个图片文件夹呀复制到我当前的项目当中， ok，那么现在复制进来了之后呢，我们先拿其中的一张图片作为例子啊，给大家去讲，因为呢，如果说呃还拿视频的话呢，不是不可以啊，运行速度可能会相对来说慢一些。我们先拿一张图片来给大家去讲啊，因为呢， yolo 呢就是做目标检测起家的，它是著名的一个 one stage 的目标检测算法，所以它的核心的 a p i 其实就是它的目标检测的方法，那包括后面优乐 v 八现在已经新增的包括姿势识别啊，图像分割啊，甚至还有我们的视频追踪啊，都是呢，在以目标检测为基础来去延伸的。我们先来看一看优乐 v 八的这个 model 在创建的时候都有哪些值得我们去注意的事情。好，首先呢，我先引入一下优乐 v 八 from autolytics 啊， import 尤洛。好，那么我们如何建立一个尤洛维达模型呢？大家应该已经很熟悉了啊，我们 model 等于一个尤洛初步化，呃，用什么来初步化呢？我们可以用它的这个预训练的模型啊，那么现在的话呢，我们已经有尤洛维八 n 点 p t 了啊，那我们依然是用这个模型，那关于不同模型之间的区别，我已经在优乐环境部署的那节课呢，给大家进行了讲解，关于模型的精确度以及呢体量大小啊，都是不一样的，我们这个八 n 版本呢，是相对来说比较敏捷的一个版本。好，那么得到了优乐的 model 对象之后啊，就是这个模型对象之后，我们能干哪些事情呢？那么在优乐的官方文档里，这个 model 啊啊，他给出了六大功能，那这六大功能呢，主要也是六个函数啊，我们来看看 model 主要能干哪些事啊？第一件事啊，它可以做的是 tree 啊，也就是 model 点 tree 这个函数，那么这个函数呢，顾名思义啊，主要是用来训练的。然后第二个的话呢，它是 model 点 v l，咱们就都给它写成括号吧，那么这个呢，其实主要是用来做验证和测试用的好。那么第三个，它能干什么呢？它还能 predict 啊，那么这个 predict 呢，就是对已有来源的图像也好，视频也好，进行预测好，还有呢，它能干什么呢？它能 track 啊，那么这个呢就是追踪，那么追踪的话呢，其实跟 predict 有很多的参数呢，都是可以共享的，都是一样的啊，所以说今天我们主要讲的重点呢，就是预测和追踪，那么训练验证和测试呢，主要是用来做自己的数据集的时候会用的到啊，那么今天我们先不主要设计这个，然后还有呢，它可以导出模型啊，那么这个呢叫做 export 啊，这个呢主要是导出第六个啊，叫做 benchmark，那么 benchmark 呢，几乎支持所有的导出格式啊，在这些导出格式上运行 u 罗 v 八的基准测试，那么他可以导出呢参数的完整列表，那也就说呢，这个呢是用来运行精准测试的。好好，那么这六大功能的话呢，咱们今天呢主要是详细的讲解三和四啊，那么四三有很大的重合程度，那么主要呢就是讲解三，我们把这个预测函数的参数呢，讲解明白了之后，最终函数的参数呢，几乎跟预测呃，有很大程度上是重合的啊。好的，那么 model 的六大功能给大家说了啊，这就是优喽给我们提供的关于模型的这个对象能够做的哪些事？好，那么这个 model 呢，它不简单啊，我们呢可以直接把我们的数据源呢传给 models，然后呢得到一个 results 对象，比如说最简单的，我们可以传一个路径的地址 images，然后呢下面呢，我们比如说找一个这个吧，零零零幺七七这么一个图片啊，点 j p j ok，那么当然呢，我们这个 models 里，还记得我们第一次在训练的时候，我们还给它传了两个图片，对吧？那也就是说呢，它也可以接收数组的形式，那么不但可以接受数组的形式这个来源这块啊，它的第一个参数来源这块可以接收很多很多种来源，举几个比较经典的啊，可以接受的来源包括图像， url，屏幕截图，视频，对吧？呃，流媒体等等等，甚至还可以支持呢，文件夹啊，带通配符的路径等等啊，那么具体的呢，它能够接受哪些参数，以及这个参数如何赋值？它的类型是什么样的？它的解释是什么样的？我在课间中有详细的解释啊，那么这里我想跟大家说的一点呢，就是由于它可以接收很多种类型，那么在初步的时候呢，我们可以对 model 进行一些类型上的设置，比如说呢，呃，图像，那么它就是最最基础的一种我们优喽模型可以去处理的文件格式了，那么当然呢，现在优喽 v 八支持视频啊，流媒体等等。那么在视频流媒体作为 model 的这个数据来源的时候呢，它支持一个参数叫做 stream 啊，我们再写一个吧， result 二啊，然后比如说呢，这里边我们给它赋值一个 mp 四啊，就我们加个点杠吧啊， ok， test person 啊，点 mp 四好，那么大家可以看到啊，如果说我传的是视频或者流媒体类型的，那么像这种的时候呢，我们可以在 model 里加一个 stream 啊，这么一个参数，当 stream 这个参数等于处的时候，那么它呢，在处理长视频或者大型的数据集里呢？呃，是非常的有效的，它可以非常有效的管理内存，当你的 stream 默认是 false 的时候呢，我们所有处理的帧或者数据点呢，都会存存在内存当中，这有可能会导致你的内存迅速增加，并且呢导致大输入的情况下呢，内存不足错误啊，那么 stream 等于处的时候呢，我们只把当前的帧或者数据点的结果保存在内存当中，从而可以减少由于内存消耗内存不足的这个问题啊，这个呢就是我们可以去设置好，那么这里头呢，我要说明一下，不是所有的类型都可以用 stream 等于处的，那么不同的来源，比如说像图像来源，它就不支持 stream 处啊，所以说呢，哪些格式支持，哪些格式不支持，我也在课间中列了，大家呢可以去课间中去查看，一般的话呢，就是比较大的，比较耗内存的这种来源呢，它是支持 stream 输出的好，那么这个呢，是 model 的出场函数，能够返回的这个值叫做 result，而这个 result 呢，我会单独拿出来一个小节来专门讲， result 里面都包含了哪些数据啊，当然在上一节课的时候，我们在做实战的时候，也通过 debug 的方式呢，让大家看到我 results 里面的数据结构，那么这节课呢，我们将更加的细化来通过这个数据结构呢，有没有一些数据我们是可以直接用上的啊，比如说里面的 boxes 啊，这个对象，其实呢它自身也是有自己的属性和方法的。好的啊，那么讲完了这个 model 的抽象函数之后呢，我们主要来讲解一下 predict 以及 track 方法啊，那我刚才也说了，我们呢先从 predict 入手，来看一看 predict 有哪些参数，那基本上它的这里头的参数呢， track 呢？都可以用得上啊，我们回顾一下，上节课我们讲零二的时候呢，其实我们用的是 model 点 track 这个函数，对吧？ ok 啊，那么 node 点 try 这函数呢，里面有一个 persist 等于处，我也给大家讲过，什么意思啊？好，那么除了这个 persist 的参数，我们能不能借用这个 predict 里面的参数呢？当然是可以的啊，那么接下来呢，我们先再生成一个测试的文件，我们叫做 predict 函数。好，那么我们呢，先把这个零三里面的上面这个给它拿过来，有了这个 model 模型对象之后呢，我们可以直接用 model 点 predict 来进行预测啊，那么它的第一个参数呢，叫做 sauce，那这个 sauce 里面呢？呃，包括可以图像数据来源啊，第一个参数吧，叫做数据来源 source，这里面呢可以接收图像路径，视频，然后呢目录 url 啊，然后还有一些设备 id，比如说你自身的这个电脑的摄像头啊等等啊，都是可以的，所以说呢，这里面支持的这个数据来源很丰富，那么我们今天呢，就是还是用最简单的啊，我们就给他一个图像啊，来进行一个预测。好，我们让他预测一下零零零幺七七这个图像啊，这个是第一个参数。好，那么现在的话呢，我们运行啊，运行一下之后呢，其实呢，过了几秒之后啊，大家可以在命令行中看到我们 model predict 一个运行的结果啊，他告诉我们了，里面呢，你这张图像有八个人，两个瓶子啊，五个杯子，三个什么碗，一个披萨，还有一个，等等等等啊，这些东西那么用了多少秒呢？哎，他都会在这个命令行里呢去输入啊，这个呢就是 model predict 啊，运行出来的一个基本结果。好，那么接下来我们来看一下他有哪些参数啊？呃，我呢在课间中已经列出了详尽的它包括的所有的参数，当然有一些参数呢，我们不是特别常用啊，姜老师在这里呢就不给大家测试了，我呢举一些比较常用的可能会用到的一些参数，那么比如说第二个我们经常会用到的这个 counf，那么这个 counf 呢，就是知心度的意思，我们在这里呢可以设置整个在预测中的这个最小知心度，那么他的默认值呢是零点二五，那么设置这个检测的最小知心度的域值呢？如果说低于此域值的知心度呢，检测到对象呢，我们将被忽略，那么通过调整这个值呢，可以有效的帮我们去减少误报啊，当然这里头呢我们可以直接啊，他是一个 flow 类型的，我们直接可以用 c o n f 来等于，比如说一个零点七啊，这是零点五，无所谓啊，你就是你根据你自己想要去设置的去设置就可以了。然后呢，当然这里头呢还有这个 i o u 这两个呢，都是我们其实在讲那个目标检测算法的时候已经给大家讲到了啊，它们会影响最后的那个检测框的结果，是非常重要的两个参数。呃，那么这个 i o u 呢，就是交并比，呃，默认的值呢？默认值是零点七，那么这个里头呢，就是如果说你低于这个这个胶并笔，那么这里头呢，我们可以通过调节胶并笔的域值来控制同碟框的数量。好，那这里呢也是可以调节的，默认是零点七啊，好，这两个值呢，我们先给它去掉。嗯，呃，如果说你有需要的可以去设置啊，还有一个可能会用的到的 max dat 啊， max dat 呢，其实表示的是你每一个图像中预测允许的最大的检测数啊，这个的话默认的值是三百，也就是说呢，你这个图片里哪怕有三百零一个人或者是五百个人，我也只能预测出来三百个框啊。这个呢就叫做最大的这个图像检测数，防止呢，如果说你有图像或者是人流车流密集的场所呢，防止这个输出过多影响系统的效率啊。这个的话呢是类型，是一个整数啊。接下来讲一个有意思的也是大家特别想知道的一个参数，叫做 colossus，这个 colossus 呢，它呢用来返回指定类别的检测结果啊，那么它呢是一个什么类型呢？是一个整数的序列类型，比如说呢，我只返回第二类，第三类和第七类啊的结果，那么其他的类别结果呢？我不会显示这个其实是不是说我们想要的在一个高速公路上，我不想显示出来火车这个类别，我只想显示出来汽车啊，卡车啊，不公交车，对吧？哎，行人等等。那么我不想检测出来类别呢，可以不检测啊，这个叫做 classes，那么它传入的呢是一个整数的列表，那么其中的话呢，这个整数代表这个类别的 id。好，这里头呢非常的有意思啊，好，我们先来看一看啊，刚才呢，这个零零零幺七七这张图片里头呢，有这么多个类别都被检测出来，对吧？比如说呢，现在我只想要人，然后瓶子，然后还有这个披萨吧，其他的呢，我都不要啊，那么这里头呢，我们应该怎么去控制呢？首先的话呢，我在这里头得到一个 result 吧先，我们现在呢先给他来一个 print 吧啊，然后我们把断点打到 print 这，然后我们再调试。好，那么现在的话， results 就已经有了啊，我们点击这个 results 呢，来看一下这个里面的 names。好，目前的话，如果说我们只想要 person 啊， person 是第几个呢？是第零个，对不对？我们先来控制一个这个 obj 的类啊，哎，好，我们来一个整数的序列啊，比如说呢，我们要零，然后还要哪个呢？瓶子啊，有瓶子可真的是还挺远的一个类啊，啊，三十九，对吧？然后呢，我们还想要什么呢？还想要披萨啊，哎，披萨五十三，好啊，找到了，那我们就要这三类吧，其他类我们都不要啊，然后呢，我们先停止一下，好，现在的话呢，我们把这个 o b j class id 呢这个虚列传到这个 classes 参数里， o b j。好，我们右键运行一下。好，大家会发现啊，现在检测出来呢，只有八个人，两个瓶子和一个披萨啊，其他的是不是就没被检测出来了？也就是说呢，我呢这个 classes 里呢，可以检测特定你指定的类的一个检测结果啊，在多类检测任务中呢，聚焦相关的对象，这个是非常的重要的。好，那么现在的话呢，可以修改我们在优喽的视频检测跟踪里，在这个 track 里， model 点 track 里依然是可以用这个 classes 属性的啊，直接在后边写就可以了啊，这个里面呢，你比如说你要哪几个类啊，直接写在里面就可以了，那么这个呢，就留给大家做一个小作业了啊，大家可以去优化一下我们的这个文件。好的，那么这五个是我提炼出来的可能比较常用的在 predict 里头啊，经常用到的一些参数，那么接下来呢，我们可以看一看 predict 这里面还有什么好玩的参数呢？好的，接下来呢，给大家讲一下关于 model 点 predict 里头啊，一些关于可式化的参数，就是改变这个 predict 的预测框的一些参数啊。那么首先的话呢，我们先把这个 class 先去掉啊，大家已经知道它的用法了，然后给大家讲解一个受啊，这么一个参数，那么当这个受等于处的时候呢，顾名思义，就是我能够及时的在窗口中显示我被注视了的图像，或者是呢视频，那就取决于你的数据源了，那么这个呢，用于在我们开发或者测试期间呢，可以提供一个及时的视觉反馈。好的，那我们呢，先来运行一下啊，那么结果呢，一定是一闪而过的哎，大家看到那个窗口一闪而过了吗？呃，那这里头的话呢，呃，有一个窗口出现了，那我们让这个窗口呢，等待一下时长吧啊，让这个窗口呢能够被我们所看见，这里头的话呢，我们就用 cv 二里的这个 vita key 吧，我们先 import 一个 cv 二，让它直接来个三万毫秒啊。好，那么大家可以看到啊，这个里头呢，就自动给我们弹出了一个窗口，而这个窗口里面呢，标出了所有的类别，它里头有类名，还有知情度，还有这个检测框， ok，哎，你会发现这个窗口很有意思啊，左上角也是零零，对吧？然后呢，呃，它的这个颜色通道也告诉你是 rgb 的颜色通道啊，不是 bg r 的啊。好的，这个呢，就是受等于处的时候可以在窗口中显示。好，那么接下来再讲一个参数叫做 save，那么 save 呢，默认也是 false 的啊，当它等于处的时候呢，会有什么不一样的地方啊？大，大家跟我一起再来运行一下程序。好，你看啊，这里面呢，命令行多出了一句话，叫做 result saved to runs dict predict 啊，你看，这里面儿自动增加了一个 run 文件夹，然后呢，在这个 dick predict 里头又多出了一个图片，这个图片呢就是我们的结果。很显然呢， save 这个参数呢，就是把我们预测出来的图像保存在持久化在我们的词盘里。那么在我们处理视频的时候，也有一个参数叫做 save frames，它呢可以直接通过优漏算法把单个的帧保存为图像，这个呢通常用来我们提取特定的帧来进行详细的逐帧分析。那我们来试一下 save frames 啊，在处理视频的时候，这个参数，我呢把呢我刚才列举出来的和 save 也写进来啊。好，来再领大家练一个叫做 save frames，现在呢，我先把这个语句给它注视掉啊，然后呢我引进来一个视频，这个视频呢不要太大吧，呃，要小一点的，这个 traffic 这个视频应该是相对来说要小一点啊，我来看一看，这个是一个三十一秒的，然后这个呢是五十秒的，所以说呢，咱们来这个 traffic 这个视频嘛，然后呢我在这啊来一个 save frames 等于 true。好，然后咱们咱们运行一下程序啊，好，大家可以看啊，它在逐针地把我们的这个检测结果呢给我们预测出来，然后的话呢，这里呢它有一个提示，提示是什么意思呢？就是你在使用这个 save frames 的时候，你没有使用这个 stream 等于处，那么呢你有可能会造成内存溢出的问题啊，那么他的这个警告的意义呢，就是他奉劝你呢，直接在初步化的时候就用这个参数来预测视频的内容，并且呢把这个预测结果呢存到 result 里，而不是用这个方法啊，那么当然在这里头呢，我们只是进行一下测试啊，告诉大家有这个东西具体的使用呢，我还希望大家在这个 result 里头呢，我们其实也是把 track 的结果附到了 result 里，然后呢再对 result 进行相关的操作啊。 ok，这里头呢系统已经给你提示了，如果视频特别大的话，很容易造成内存的溢出的问题。好，那么接下来呢，我们还有一个参数啊，叫做 save txt 啊，这个的话呢是将我们的检测结果保存成一个文本文件，然后这个呢我也写一个注示啊，好，然后呢我们来试一下这个 save text，然后呢我们运行一下。好，这里头呢会把我们的这个检测结果呢保存在 labels 啊 predictor 里头啊，大家会发现这个呢，就是我们每一个对象的一个检测结果了，有它的这个类别以及呢目标检测框的位置。好，下一个参数啊， c o n f 这个的话呢，它可以在文本文件中同时保存每一个对象的知心度，现在的话呢，是只有类别和位置，对不对？哎，如果说有它呢，可以在啊文本文件中保存知心度，然后这里头呢，我们 save c n f 啊，等于一个处。好，来再运行一下。好，我们来看看第三次的这个结果啊，我们呢可以跟刚才的这个对比一下啊，你看第二次的话，我们是没有这个知心度的啊。后边的话呢，第三次我们是在后面加了一些知心度的信息，大家通过对比可以知道啊，知心度它是放在最后一列的。好的啊，我们先把这两个呢参数也去掉，还有哪些有趣的参数呢？ show labels，通过这个名字你就可以看到啊，他那标识了，你在显示检测窗口的时候是否呢？显示每一个检测的标签受为处的时候啊，是否显示啊标签，这个标签就是那个方框框上面那些信息啊，我们可以受等于一个处，然后呢 show labels 等于一个 false，就不让它显示啊，我们来看一看，它默认是显示的啊，好，你看现在什么都没有了，只有框框，对吧？呃，然后还有什么呢？叫做 show c o n f 就是显不显示信度，还有什么呢？ show boxes 是否显示框框哎，还有呢？ line x 这个呢，是设置框框的宽度，就是框框这个边框的宽度啊，这里头的话呢，我就不挨个给大家试了，大家呢可以去自己试一下。呃，这个框框宽度呢，咱们来一下吧，叫 line x，其他的那些瘦啊什么什么的啊，大家可以去自己试啊，比如说我们就像最细的一个一啊，哎，你看这个细特别细了，对不对？这个框啊，其实这些呢，都是关于目标检测中的这个显示样式的一些设置啊，那么关于 predict 的一些显示的设置以及呢，它的内部的一些数据的设置呢，我都已经给大家常用的啊，已经给大家讲了。好呢，那么剩余的呢，大家可以根据我的课间呢再去进行测试和练习。那么这里头呢，我要补充一句啊，关于 model 点儿 track 啊，这个函数的话呢，里面的参数几乎是可以和 model 点 predict 通用的，所以说呢，我就不去赘述了。
43爱学习的阿程
47:47
#人工智能 #YOLO26 #YOLOv11 #YOLOv8#AI YOLOv8/YOLOv11/YOLO26目标检测系统与多目标跟踪检测系统，PySide6目标检测界面搭建，目标检测、分割、姿势估计、旋转框，用户端系统+后台管理系统开发实战，系统是一个通用的目标跟踪与目标检测系统，适配多种场景如：鱼苗检测与跟踪、行人多目标跟踪、车辆多目标跟踪、牛只行为识别与跟踪、口罩佩戴检测、安全帽佩戴检测、火灾检测等。
109落花不写码
03:02
🔥 YOLO26 来了：下一代 AI 视觉革命！ Ultralytics 重磅发布 YOLO26 | 速度与精度全面升级#yolo #YOLO #目标检测 #深度学习 #AI
269Ai缝合大王
05:41
Yolo目标检测匹配 Yolo目标检测匹配，简单来说，是连接预测结果与真实目标的桥梁，直接影响检测的准确性和可靠性。
触控精灵yolo目标检测匹配可用于模型训练，优化模型参数；评估指标或实际应用#yolo #模型训练 #开发 #安卓 #大数据
27触控精灵APP-自动化
01:56
YOLO26对比YOLO11,鸟类检测训练真实结果对比 #深度学习 #目标检测 #yolo26 #优化器 #大模型
查看AI文稿
AI文稿
大家好，四天前，也就是元月十四号， euro 发布了最新的版本 euro 二六。呃，我测试一下，确实效果有显著的提升，它官方的说明有这么几点，第一个是分布焦点的移除，第二个是端到端的非极大值啊移除，第三个是从时间域和空间域对这个小目标的检测的提升。第四个是受这个跃至暗面的启发，它有一个新的优化器啊，在 s g d 上面做了一个提升，叫 m u s g d。最后一个是在 cpu 上面的这个训练和检测的提升，这个幅度还挺大的，有百分之四十三。那我们来看一下我自己测试的情况，这个是我训练的情况啊，有一个图片方便大家看对比再绘图，稍等啊，好，出来了，那我们可以看一下这个是大家可以看到这两这三次的对比情况，这是同一个数量的检测级的对比，我们先看这一个吧。呃，蓝色的是 u l 六，这个黄色的是以前的啊，幺幺，那我们可以看到确实他平滑很多啊，他的曲线会平滑很多，大家可以看到第二个，他的精度要高，这四个参数很直观的，可以看到一个对比的情况。
11图动中国
07:16
YOLOv26_电路元件检测与识别系统实现与优化项目源码和数据集来源：http://www.visionstudios.ltd/
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
本视频内演示的项目用到的数据集专注于电路元件的检测与识别任务，包含六种常见电子元件类别：Arduino Uno开发板(Arduino_uno)、发光二极管(Led)、电位器(Potentiometer)、电阻器(Resistor)、面包板(breadboard)和超声波传感器(ultrasonic sensor)。视频内演示的项目用到的数据集采用YOLOv8格式进行标注，包含训练集、验证集和测试集，适用于目标检测算法的训练与评估。视频内演示的项目用到的数据集中的图像展示了各种电子元件在不同背景下的实物特写，包括元件的外观特征、结构细节以及在实际电路环境中的应用场景。这些图像涵盖了元件的正面视图、侧面视角以及不同光照条件下的表现，为模型提供了多样化的训练样本。视频内演示的项目用到的数据集的构建旨在支持电子工程、自动化控制、物联网等领域的智能检测需求，能够有效提升电路板组装、故障诊断和维护过程中的自动化水平。通过本视频内演示的项目用到的数据集训练的模型可应用于电子产品生产线质量检测、电子教育辅助教学以及电子爱好者项目的智能识别等场景，具有广泛的实用价值和学术意义。
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
项目源码和数据集来源：http://www.visionstudios.ltd/
0群山科技工作室
06:32
YOLOv26实现Maruti Suzuki Swift车型项目源码和数据集来源：http://www.visionstudios.ltd/
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
本视频内演示的项目用到的数据集为Maruti Suzuki Swift车型的识别与分类视频内演示的项目用到的数据集，采用YOLOv8格式标注，专注于单一车型'Maruti Suzuki Swift'的实例识别任务。视频内演示的项目用到的数据集包含训练集、验证集和测试集三个部分，总类别数为1，即仅包含Maruti Suzuki Swift这一特定车型。根据视频内演示的项目用到的数据集元信息，该视频内演示的项目用到的数据集遵循http://www.visionstudios.ltd/ 许可协议，可通过指定URL访问原始资源。从图片内容分析，视频内演示的项目用到的数据集包含多种视角和环境下的Maruti Suzuki Swift汽车图像，包括正视图、后侧视角等，部分图像带有红色轮廓标注以突出车辆形态。图像背景多样，既有自然景观如黄昏时分的环境，也有简洁的渐变灰色背景，部分图像还包含交互式界面元素，如功能按钮和缩放控制图标，表明这些图像可能来源于汽车展示或交互式平台。视频内演示的项目用到的数据集中的车辆呈现不同颜色，包括深红色、浅灰色和深色调等，且部分图像清晰标注了车型名称'Maruti Suzuki Swift'及车牌信息，为模型训练提供了丰富的视觉特征。整体而言，该视频内演示的项目用到的数据集旨在支持针对特定车型的高精度识别算法开发，适用于汽车品牌识别、车辆类型分类以及自动驾驶场景中的目标检测等应用领域。
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
查看AI文稿
AI文稿
我们的照片世界在一。
0群山科技工作室
30:35
YOLO26在RK3588上部署详解在RK3588上推理YOLO26s的代码，代码已自带模型。 #YOLO26 #瑞芯微
CPP版本的板端推理代码：https://github.com/li2390893/yolo26-rk3588-cpp.git
转换及python推理代码：https://github.com/li2390893/yolo26-rk3588-python.git
7Tangerine
07:21
YOLOv26：棉质烟雾与火焰检测系统实现与优化项目源码和数据集来源：http://www.visionstudios.ltd/
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
本视频内演示的项目用到的数据集为棉质烟雾检测视频内演示的项目用到的数据集，采用YOLOv8标注格式，包含754张图像，视频内演示的项目用到的数据集分为训练集、验证集和测试集，共包含两个类别：'Fire'和'Smoke'。视频内演示的项目用到的数据集于2025年7月1日通过http://www.visionstudios.ltd/ 平台导出，图像已进行了自动方向校正处理，但未应用任何图像增强技术。从图像内容分析，该视频内演示的项目用到的数据集涵盖了多种火灾和烟雾场景，包括农田焚烧、夜间篝火、房屋燃烧等不同环境下的火灾情况，以及火焰特写等细节场景。视频内演示的项目用到的数据集标注精确，对火焰和烟雾区域进行了明确的边界框标注，适用于开发针对火灾早期检测、烟雾识别以及火源定位的计算机视觉模型。该视频内演示的项目用到的数据集采用http://www.visionstudios.ltd/ 许可证，允许在遵守许可条款的前提下进行学术研究和商业应用。
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
查看AI文稿
AI文稿
你在落夜繁飞鸽喧嚣里沉着，那白雪漫漫草一阴，撞了满墙，腾波在这燃烟晃一年，那山高路远又爱却。你在落夜繁飞鸽喧嚣里沉着，那白雪漫漫，草一阴，漫向腾波在这燃。
0群山科技工作室
04:34
#yolo26 #rk3588 #算法盒子最新支持yolo26/11/8/5检测模型 EasyAI_多算法服务器版_前后端版
1、模型检测库支持yolo26/11/8/5检测模型，包括最新的yolo26，但是最yolo26慢，大概50ms一帧
2、模型修改导出onnx+onnx模型转rknn+上传服务器+算法配置最新上传模型
3、前段web(NVR+大屏)+后端C++服务器（ffmepg拉流+nvidia硬解码+yolo检测+nvidia硬编码+abl推流）
4、后台全C++：http服务交互+ffmepg拉流+nvidia硬解码+yolo检测+nvidia硬编码+abl推流+gpu自动分配+报警http发送
5、模型管理模块，直接上传，支持yolov5/6/7/8/10/11/13/26
6、算法设置支持模型选择，类别过滤，阈值和nms值设置，多ROI区域设置
7、前段web支持NVR基本功能，录像/抓图/全屏/各种分屏，轮巡播放+录像和图片回放，报警查询和警情处理+用户管理
8、支持中英文切换，国际化友好
9、带软件加密工具，设备加密，限运行时间和加密防拷贝
10、支持各种摄像头rtsp流接入，直接部署到服务器，通过网页即可预览和设置
21心随你转
05:39
YOLOv26改进版 - 凝聚层与聚集物检测识别研究项目源码和数据集来源：http://www.visionstudios.ltd/
项目源码和数据集来源：http://www.visionstudios.ltd/
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
本视频内演示的项目用到的数据集名为"Coacervate detection v2"，由http://www.visionstudios.ltd/ 用户提供，采用http://www.visionstudios.ltd/ 许可证授权，于2025年1月7日通过http://www.visionstudios.ltd/ 平台导出。该视频内演示的项目用到的数据集专注于凝聚层(coacervates)和聚集物(aggregates)的检测任务，包含105张图像，所有标注均采用YOLOv8格式。视频内演示的项目用到的数据集划分为训练集、验证集和测试集，其中包含两个类别："aggregates"和"coacervates"。从图像内容分析，该视频内演示的项目用到的数据集主要涉及微观层面的物质结构识别，包括生物凝聚体、材料科学中的颗粒聚集以及沥青混合料中的集料分布等应用场景。图像背景多为深色或灰色，目标对象表现为不同形态和密度的颗粒或聚集结构，通过红色矩形框进行标注。值得注意的是，该视频内演示的项目用到的数据集在导出前未应用任何图像增强技术，保持了原始数据的真实性。此视频内演示的项目用到的数据集适用于计算机视觉领域的目标检测任务研究，特别是在材料科学、生物医学图像分析和微观结构识别等方面具有潜在应用价值。
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
7群马视觉
03:10
YOLO26全网最新独家改进！最全的科研资料，没有之一！ YOLO26全网最新创新改进系列：全网最新独家改进！创新点多且持续更新改进各种绘图写作资料，科研必备！！最全资料！一步到位！！#YOLO26
查看AI文稿
AI文稿
ok，大家庭的小伙伴们，那本期啊，优路二六正式开始发布了，那么我呢，第一时间呢，就给大家更新到了二十，加种改进已经足够大家使用了，然后后续啊也会持续的进行一个改进的更新，那么优路二六的详细介绍啊，大家可以看一下，它的官网在这里呢就不再赘述了，它肯定是优路系列版本当中最新最强的一个版本。好，那么本期的视频内容啊，第一个啊，我先给大家看一下啊，我们为什么要这么拼呢？是因为有很多的小伙伴呢，给我这个回馈，我觉得真的特别的感动，特别的感动，我的所有的努力，所有的付出都得到了一些回报，而且这些回报呢，给我精神上巨大的鼓舞，让我瞬间充满动力，然后现在已经是二十三点三十二分，已经到了半夜了，嗯呐，还在继续给大家去更新一些干货啊，也希望所有的小伙伴们能够一起努力，一起奋斗，将来呢能够投中更多的 top 旗刊，为我们中国人的科研呢，在整个国际上面呢，持续的这个拔高啊，这就是我觉得我能做到的，和小伙伴们能如果一起努力做到的一个非常棒的一点啊。那么优乐二六本期啊，首先跟大家来说一下你环境怎么搞，对吧？凹凸 d l 云服务器的环境怎么搞，在这里面大家选择 ai 应用， ai 应用里面大家注意一下，一定要搜索用户啊，用户幺零零八六，幺零八的是谁？也就是我，好在这里面是空白的对吧，别慌，镜像我现在因为现在还没有审核通过，所以大家呢可以优先使用优酷 v 十三的环境，或者是优酷 v 十一的环境，然后这个环境怎么使用？在我往期有这个环境的云服务器环境搭建的一个教程，大家跟着一步一步来，最后上传优酷二六的代码包就行。好呃，这两个啊，需要安装两个包，更新两个包，然后非常简单，非常快速，如果购买资料的小伙伴，所有大家庭的小伙伴，你不会的话私信我，然后我教你搞。然后后续呢，我们这个更新了以后就 ok 了，给大家直接一跑即通。接下来啊，我给大家看一下我们改进的这个是两个检测头，这个是四个检测头的啊，来看一下，然后这些呢都是一些改进的，然后现在呢是二十五个左右，三天之内我会给大家更新到四十加整，然后最最终我们优乐二六的代码包一定不会低于五十加，甚至是六十加整的，所以说其实十整就是目前来说，别说二十几种了，就是十整你完全排列组合完全够用，但是目前二十五整足足够用，后续的所有的改进足够让你在这个文章里面没有任何的问题啊。那接下来我给大家跑一下吧，给大家跑一下我们改进的一个 ethernet 为二主干网络的一个改进啊，也就这一个好，好了，跑一下，看一下啊，这就是一个 ethernet 为二，然后我们刚刚改进的一个工信啊，有需要的小伙伴直接入手就好啊。也然后本期的视频比较简短，主要是给大家更新，然后又是半夜了啊，就不跟大家去详细采访了，后续优路二六系列我会出更多的视频，非常多的视频，还有绘图工具，然后还有这种网络结构图啊，模型图啊，包括三 d 损失图啊，特钟图啊，热力图啊，所有的信息，所有的内容，我都会给大家加上，逐渐的进行一个持续的更新啊，买到就赚到。实话实说，你越早入手，然后越早有时间去发更多的文章，去写更多的文章，也祝愿所有的小伙伴，越来越多的小伙伴都能够中一去靠谱即可。好，非常感谢小伙伴们啊，非常感谢感恩的小伙伴们给我的反馈，也祝愿所有的小伙伴们在科研之路上一路靠谱！靠谱！靠谱！
138Ai学术叫叫兽
01:57
YOLO26与YOLO11的差异化思通数科视觉算法技术分享交流-01集#YOLO26 #YOLO11 #目标检测算法 #深度学习 #计算机视觉 #AI算法对比 #核心算法工程师 #视觉智能
查看AI文稿
AI文稿
大家好，今天呢，我们非常荣幸能邀请到我们四中宿科核心算法工程师郭喜同学来为我们大家做一次分享。优乐二十六和优乐十一啊，到底有哪些差别？下面有请郭喜。优乐二十六相比于优乐十一，它其实有三大优点，第一大优点是它的部署也变得比之前更简单了。第二个优点是 cpu 调用时的速度会比之前要好，它的实时性会更强。然后第三个优点就是它提供了一个训练的范式，因为它是从 kimi 那边学到的一个训练的思路。 ok，我打断一下，你说的那个 kimi 是咱们中国那家公司吗？对，是月战面训练的。 p m p r。哇，那太伟大了啊，那我想问一下，就是去掉这些技术之后，优路二十六有哪些新的创新呢？因为你刚才说已经去掉了一些东西，是为了保证速度吗？是为了保证速度和部署的一个简变性。 ok，啊，那我想知道他比如说把那个 mms 去掉之后的话，对整体性能会不会造成影响，还是说他用了哪些新的技术进来？ ims 的话，你可以想象你再开一个新闻发布会，下面有一百个记者，对，你如果不去，就是你如果使用这个 ims 的话，就相当于是一百个记者都会分别向你提问，你需要一个一个去回答，或者是去过滤它的一些，就是去过滤一些问题来回答。然后但是你去掉 ims 之后的话，就相当于是所有人就只有一个人能提出这个问题，相当于是把所有人的问题整合到了一个，所以它的速度会变快。 ok，你这么说大概理解了。好的，那我们非常期待能把些新的技术融入到我们产品研发过程当中来，给用户和大家带来新的体验。今天我们非常感谢郭喜给我们带来的分享，谢谢大家。
1思通数科
07:59
YOLOv26哈密瓜花朵识别与分类_雄花雌花区分与花瓣结构识项目源码和数据集来源：http://www.visionstudios.ltd/
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
本视频内演示的项目用到的数据集名为"Flowers on cantaloupe plants recognition"，构建目的是区分哈密瓜植物上的雄花与雌花，以支持自动授粉过程。该视频内演示的项目用到的数据集由http://www.visionstudios.ltd/ 用户提供，采用http://www.visionstudios.ltd/ 许可证授权。视频内演示的项目用到的数据集包含5677张图像，以YOLOv8格式标注，分为训练集、验证集和测试集。在授粉过程中，仅雌花具有重要意义，特别是茎部区域，农民会在该部位喷洒溶液。视频内演示的项目用到的数据集对雄花使用边界框进行标注，对雌花则使用分割技术分离其不同部分，如茎和花瓣。视频内演示的项目用到的数据集中包含三个类别：'flower roll'、'male gametophyte'和'petal'，分别对应花卷、雄配子体和花瓣结构。图像预处理过程中未应用任何图像增强技术。该视频内演示的项目用到的数据集的构建旨在通过计算机视觉技术辅助农业生产，特别是提高哈密瓜授粉过程的自动化程度和准确性。
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
查看AI文稿
AI文稿
用我全部生命中伤，清除所有情绪也罢，化除属于我们的家那些有着光的勇气在踏足与拥有所有生命在画着的眼。 oh my name is al。只有你是我的，先让我为你画一幅画。用我全部生命中伤清除所有情绪也罢，化除属于我们的家那些从此光明的勇气在踏足与勇气，所有生命在幻影。我心似海，放眼望去，那些高楼全部坍塌，后悔，哪怕身下背影要在我身旁安家。
0群山科技工作室
01:35
思通数科视觉算法技术分享交流-02集 YOLO26与YOLO11应用场景的差异化#YOLO26 #YOLO11 #目标检测算法 #深度学习 #计算机视觉 #AI算法对比 #核心算法工程师 #视觉智能
查看AI文稿
AI文稿
今天呢，我们再次邀请郭喜，是我们团队当中的德胜川好工程师，在此来跟我们分享关于优柔二十六啊一些新特性啊。今天呢，主要是想来分享一些在应用场景或者在应用层面的啊，关于优柔二十六的一些新特性逻辑公式。我觉得二十六的应用场景其实主要分为三大，第一个部分是就是一些 arm 的边缘计算的一个设计，第二个的话其实就第二个的话就是家用的或者是工业上的一些摄像头。第三个的话就是航拍或者是无人机去检测一些微小的目标，嗯，就是说在小目标方面的话， volvo 二十六也是能发挥出来它一些新特性，可以这么理解吗？嗯， ok，那么我想在让大家总结一下，无论是在应用层面也好，还是在技术层面也好啊，就谈谈你心里面的想法，就优乐二十六在应用层面都有哪些这个新特性，优乐二十六在应用层面更倾向于面向一些小目标，还有一些就是批量的一个部署，就是批量边缘设备的部署，保持在这两个方面。 ok，行，非常好，那我觉得优乐二十六还是值得期待的，所以呢，我想尽快把这种新技术啊融入到我们这个新发布的产品当中，能给用户给大家带来更好的体验，我们再次感谢 boss 给我们带来的分享，好，谢谢。
2思通数科
06:52
多场景圆柱体与鸭类物体目标检测技术详解——YOLOv26改进项目源码和数据集来源：http://www.visionstudios.ltd/
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
Ale-Project视频内演示的项目用到的数据集是一个专门用于目标检测任务的视频内演示的项目用到的数据集，包含2086张经过精心处理的图像，视频内演示的项目用到的数据集采用YOLOv8格式标注，共包含5个类别：鸭子(duck)、绿色圆柱体(green cylinder)、粉色鸭子(pink duck)、红色圆柱体(red cylinder)和白色圆柱体(white cylinder)。该视频内演示的项目用到的数据集由http://www.visionstudios.ltd/ 平台于2023年4月8日创建，并于2025年6月28日导出，遵循http://www.visionstudios.ltd/ 许可协议。在数据预处理阶段，所有图像均被统一调整为640×640像素尺寸。为增强视频内演示的项目用到的数据集的多样性和鲁棒性，研究人员对每张源图像应用了多种增强技术，包括50%概率的水平翻转、0至15%的随机裁剪、-33%至+33%的随机亮度调整、0至1.5像素的随机高斯模糊，以及对5%像素添加椒盐噪声。此外，还对边界框应用了-20度至+20度的随机旋转变换。视频内演示的项目用到的数据集按照训练集、验证集和测试集进行划分，适用于开发能够准确识别和定位不同场景下圆柱体与鸭类物体的计算机视觉模型。从图像内容来看，视频内演示的项目用到的数据集涵盖了多种复杂场景，包括室内环境和物体，展示了不同视角、光照条件下的目标实例，为研究多物体检测和分类任务提供了丰富的样本资源。
❤️投币关注点赞转发并且【在评论区留言】的粉丝会定期私信分享项目源码和数据集❤️
查看AI文稿
AI文稿
我已留下了，把你的眼中敏感，叫他一笑成花无。
0群山科技工作室

热门推荐

热门分类