粉丝77获赞300

今天教给大家一个可以一键运行的优乐模板,只需要准备这三个文件就可以了。首先就是数据级的配置,也是我们唯一需要动的地方, 第一行是我们数据级的路径,第二行第三行按照数据级的格式修改就可以了,一般下载好的都是这种标准结构的, 注意名称一定要对应上。最后两行是类别数汉名称,一般在下载好的数据集里的 txt 文件和 em 文件都能看到。到这里我们就完成了 右键一键运行我写好的模板就可以了。首先代码会自动下载他需要的文件,由于我们没挂梯子,所以比较慢。 of my eyes on the things i've never。 开始运行了 就可以了,可以查看电脑显存的使用情况,根据自己硬件情况调节这个参数。 由于我们数据集不是很多,像素也不大,所以训练很快, 训练完成了,我们所有训练过程的曲线模型、精度信息,看模型文件等都在这里。接下来一键运行我们的网页模板。 首先需要注册焊登录,选择我们训练好的模型文件,选择需要检测的图, shit! 大部分的数据集是没有视频的,需要我们用图片来合成, 如果需要换成别的模型,只需要 c t r l 加 f 替换名称就好啦。模板还支持训练中断恢复功能,再也不用担心同时训练多个程序不小心爆显存了。明天教大家用十分钟部署到云端网页。

最近啊,很多同学在自己的必设和论文当中啊,想做一些计算机视觉相关的结合深度学习啊,去做一件事,那我们该如何去补充基础呢?首先第一点就是如果说你要做计算机视觉相关的啊,积极学习这件事啊,咱们暂时就可以先放一放了,因为传统计算机它基本上做不了视觉的东西, 以前你看用 c 域分离啊,做什么人脸啊,关键点啊,一些检测估计那是以前啊,现在基本上通用来说都是清一色神经网络,所以说咱们学基础来说,只拜深入学习,把神经网络卷积网络穿的丰满,我们花个一周时间,咱们快速过一下, 接下来呢,咱们再花个一周时间,把拍套的框架我们再熟悉熟悉,因为后卷咱们跑哪些,每一个原码吧,都是基于拍套框架去做的。再往下呢,那大家可能说,那我想去入门物体检测,我们该选哪些算法呢?其实最经典的就是优喽这个算法 拥有这个东西啊,给大伙当中啊,首先人是开源的,并且人家官方的社区当中本身就有教程,咱们按这个顺序学习啊,就是先去跑通啊,知道我怎么能把一个模型预测出来一个结果,这个非常简单,就配备环境,大概一个小时的事。第二件事,我们学一学如何训练自己的数据, 你的数据该准备成什么样的格式,你的数据标注应该怎么去标注,那标注的结果怎么用效果的模型训练自己的数据,我们能跑出来一个结果呢? 第二件事,我建议大家咱们去看一看基本训练,还有推理逻辑。第三件事如果说你更有时间,我们想深入细看一看 每一个步骤,每一个模二怎么做的?建议大家我们再深入到原码当中去,从零开始吧,我们 delete 一 遍,那比如优酷当中每一行代码去做什么东西,这样呢?我们算是对物体检测有了一个基本入门。

cloud code 的 最强宿敌它来了,是专为 deepseek 打造的专属 ai 终端编程神器,每天一个硬核的网站推荐第五十九期,它刚刚在 github 开源就直接原地起飞,狂揽三十三点八 k 的 star。 它是专为 deepseek 深度定制的 ai 编程终端,只需要一行命令,它自己去读文件改代码, 跑命令,搜网页,连 m c p 服务器,它全能干。更离谱的是,它还有个优乐模式,开启之后 ai 自动审批,所有工具调用,全程无需你确认它自己一路干到底。

手把手教你运行优楼 v 八区域检测代码。哈喽,各位小伙伴,新店文手把手教你运行优楼 v 八区域技术检测。 首先这个功能是官网上一个月更新的,首先我们进入官网来看一下这个远吗?我们打开浏览器,在搜索栏这里输入 tw, 点 c o 回车,然后在这里搜索 u 一八, 右手一把回正,然后看到第一个就是右手一把了,圆满了。 点击进去,用他的区域代码,在这个 example 文件夹这里,我们点击进去,然后看到这个 ulov 八一整 canter, 这里就是区域检测 这里有,点击进去以后这个就是官网的预测效果了,然后对视频进行区域检测,我们来翻译这个文档, 然后他这里也有安装教程的,然后他说下载原码 pro, 我没有来,我们进行原码下载, 找到这个扣的,然后到这个牙刷包就行了, 到时候我把整个源码分享到我的博客里面,你们从我这里下载就行了。好的,这里已经下载完成了,我们打开它要解压到其他目录, 把它放到其他的工作目录, 我这里新建一个文件夹, 英明叫 又容易罢了。然后选中这个文件夹,确定解压,这个就可以擦掉了。 我们进入刚解压的右楼预报文件夹这里。 然后首先我们准备好 ulo 一八的模型 们看着他的文档来操作 example, 这里区域检测, 他要下载一个 ulov 八的模型,之前我已经下载过了,要把它, 但是模型在这里我已经下载过了,就不会下载,到时候我把全部原码分享出去,然后我们用皮外全部打开 uri 八的原码, 右击打开,然后我们准备一个视频, 把这个视频复制一下,到时候我把这个视频也分享出去, 粘贴到这里,谢谢。 因为环境的话,之前的视频有讲解过了,你们按照之前的视频安装环境就行了,我这里已经安装好了,就不用重新再安装,我们直接选用之前安装的环境, 我这里选这个, 选中完等他更新。然后我们进入先跑文件夹这里找到这个区域检测,这里他这里有个文档, 这个就是区域检测的代码了,我们翻译成中文, 他这里是用命令行来运行的,待会我们不用他的方式来运行, 他这里也有参数的解释。这个 sos 就是放视频路径,这这指定你 cpu 还是 gpu 的,我电脑是 cpu 的,就指定为 cpu, 要这里就是指定模型了,你们可以来看一下这个参数, 然后这个就是跨那个区域的坐标了,你们也 也可以更换其他坐标。 我们直接找到一百九十六行这里,然后把这个权重的路径更改一下, 就把这个路径复制就行,这里把它替换掉, ctrl v, 然后再加一个斜杠,英文状态下的斜杠,因为前面加一个二,用来转移斜杠的, 加这个二就是把这个斜杠转换成这个斜杠,因为 windows 它 啊支持的斜杠是用反斜杠,然后这里用 cpu, 也可以不写这个检测的视频路径,我们加一个参数,在这里复制就行,选择 c, 然后 ctrl b, 后面这个就不用了,后面这个参数一定要删掉,不删掉他会报错的。以后把这个视频录进复制过来。 嗯,复制到这里容易,因为前面加一个二,然后这里二加一个加速, 这里就是检测时候那个视频是否显示,我这里是显示,没错,然后这里是保存,我这里就不保存了, 以后我们直接运行, 你看他的效果就是这样, 这个就是他的跟踪线,然后当我们人进入这个区域时候,他会进行技术,你有病,你有病,这个 这个三就是代表在这个区域的目标数量, 然后我们按住 q 键退出。好的,这期视频讲解到这里。 对了,还有一个问题,如果他提示没有这个这个包的话,你就安装这个包,在终端这里安装 pap, 如果环境没有这个包,你就要安装这个包,因为这个包我已经安装了,所以就不用安装。 好的,这里再补充一点,当我们用了一把 环境配置好了之后,我们直接运行的话,他会爆没有这个模块,那这模块就是我们需要下载, 要这里,这里已经选中你那个环境的话,要在这里点终端,要发现前面是 ps 的, 然后就是不行了,这时候我们需要设置一下,在文件这里点击设置, 然后在这个工具这里,然后点击他,然后找到终端,然后下了路径,选择与终端的环境一样,然后确定,然后我们在新的 一个,然后前面就是变成你虚拟环境的名字,变成你虚拟环境的名字,就代表成功进入你这个虚拟环境了,然后他安装了包,就会安装在你的虚拟环境这里了,有很直接 pip 要安装这个包就行了,这里作为一个补充,安装完之后就可以运行了。好的,这里补充完成这期视频讲解到这里,如果有问题的话评论区留言,喜欢的帮我一键三连,谢谢。

ok, 小 伙伴们本期要给大家录一个小白的教程,就是如何啊,如何把这个包我们给他跑通卡。这个非常的小白啊,很多小伙伴就不用看了,因为没啥用,对于我大部分粉丝我觉得都会,但是呢,之前有个小伙伴问我,问我,然后就说这个 怎么来搞看,就是这一个,就我忽然间发现还有很多小白,其实他是不会搞的,那怎么办?录教程,详细的教程给大家来搞啊,这个小伙伴你看到啊,我还跟你说过,有时间就给你录个视频,详细的教程,你看到别忘了给我点个一键三连。 行,那我们先来说一下这个,先来说一下这个啊,非常有趣,这一个这个呢,小伙伴是二六年二月三号,然后我们开始实验一对一指导的,现在是四月二十七号,四月二十七号发我的稿,也就说他的 s c a 中文稿已经发给我了,初稿就完成两个月的时间, 两个月有近三个月的时间了,三个月的时间你看,哎,这些初稿搞出来,我觉得这个时间呢,相对来说也是挺不错的,关键他的这个稿我也看了,然后总体来说还是质量还是很不错,不像是一个初稿,更多的是打磨了很多次,给我的一个稿件,非常的棒啊,然后里面一些问题我也给他说了,还有就是, 呃,粉丝,然后就购买资料的小伙伴,你不会搞,不会搞,那我们就录一个详细的教程吧,回头我更新到我们的手册里面,对吧?好,重新开始啊,这是一个压缩包,首先你把这个包给压缩了,然后来这里面一按用用,看到他有的时候会变名字,在这个地方他可能会更改,但是都是在这 应用,然后你搜索用户幺零零八六过来搜索到,你看这只有一个,是吧?那我们选镜像,选镜像啊,不是应用看到吗?是镜像,选镜像,然后你跑哪一个? yellow 二六还是 redata 还是啥?我们以 yellow 二六为例,在这 再猜一遍啊,在这点这个地方,然后进来,进来以后这有个奥拓创建,实力创建好,在这里呢,我给大家推荐啊,你选这个四零九零的是最好的啊,他相对来说性价比也比较高,但四零九零、四零九零 d 也都可以,我们就直接创建开机,在这个地方下面啊,有个创建开机, 大家可能看不到,就是在这这有创建开机,就是下面录屏,可能录不到,我就 ok 了,我有个习惯,在这里我会给他写一个这个名字,比如说实力, 这样的话我能记住他是干什么用的,推荐大家也这么搞。 ok, 这就 ok 了,大家可以进来,进来以后呢,这就是一个基础的环境,基本上都没问题,但是随着我们的改进,他可能需要添加一些包,因为你不断的改进,加的模块就很多嘛。 那这些东西有没有用啊?建议这个没什么用,你可以删掉,你也可以看一下啊。好,接下来重点啊,把它拖进来,移动进来上传就 ok 了,就这样在下面这个地方看看大家能不能移动到。看在下面这个地方有个正在上传,就在这上传完以后我们给他解压就行, 那我们需要等一段时间。 ok, 稍等片刻。然后大家呢可以去喝个水啊和烤麸。 ok, 我 们继续马上上传完,然后在这里面你需要解压,它用指令来解压,按 z 普,然后 alt shift ok, 解压。看这就 ok 了嘛,是不是 往下一点啊?往下一点,这样大家都能看到。好,往下一点,然后进入这个包,那实际上 cd 在 中端,你是 cd, 然后进入这个包,那实际上 cd 在 中端是不一样的,大家要用指令来记住代码, 那拍叉母也是一样啊,你跑的是整个原码包,你不要跑这把雅米给替换了,那样它跑不通的等,不是说只能跑雅米,它很多底层和代码也需要改好,它会报 mmcvv 的 问题,那大家记一下 ppmmcvv, 因为是一点四点零, ok, 然后还有一个是 pap, 因此到 timi, timi 是 多少?零点六点一三 在这啊, p a p 已经死掉, timi 零点六点一三会撤好,然后接下来就没有其他的版本了,他还会报一个措施,你 s t e l l m m e n j i n e 没准好这一个他也需要安装一下 哦,他就缺啥,你装啥就行。然后没有问题呢,我们就派人串试一下,缺啥挨啥,如果还有问题我们就继续。这是我们的改进资料包一六二六的,它非常多,你看三 d note 在 里面,这个是这的三,是一个数据扩充的一个代码,然后这个呢?是还有这个是 f d 监听, f d 监听的一个对比, 然后我来看一下啊,这个是什么?这个是 k g 验证, k g 验证好,你看这就跑通了,哎,去哪? ok, 看一下,这就跑通了,这就没问题了, p g 验证这些是打印网络太呃,截过图的,然后训练的验证奖,还有这个技术的,这些都很多,这些都是你写文章丰富的,在这里面 models 给大家看一下啊,非常惊艳, 这里面一共得有近五十整,这五十整你自己排列组合,然后去排列组合,比如说三种,你看这里面结合了三种,这是一个势力排列组合,三种以后你自己去发文章,完全够用,对吧?所以现在大家看就是这样,这个跑通了,然后你自己去排列组合,下一步就排列组合就 ok 了。接下来你看 环境有了改进,代码有了,跑十页就行了,对吧?你听完从自己的数据集干就完了,大家在自己做的时候会更快的, 基本上你说你还会遇到啥困难,没有啥困难啊,对不对?好,这就是这个,然后在我的抖音,抖音首页有一个群,大家可以去入一下,这样的话呢,有什么消息我第一时间会发布,发布在那里面,抖音啊,抖音同名啊,都是这个名字, 都是这个名字,你去搜一下,关注一下,然后去入群就行,有什么福利我也会发在里面,什么好的东西啊都会发在里面。第一次见,祝愿所有小伙伴们也要领先吧,加油,五一快乐!

哈喽,大家好呀,这里是滴学长滴学长今天做了一个叫做 ulo 工地安全目标检测系统来给大家学习,这个项目是用 ulo v 八去做的整体的效果。是啊,这个我已经运行了, 这个是我们的整体的工程,我们整体的效果呢,今天就是学长来给大家演示一下这个效果。我们有图片识别功能,有视频识别功能,实时识别功能,实时识别就是从摄像头视频识别的话,你就可以选择视频文件,别说像啊, 我随便选一个人点击开始识别,我们这里就会有识别的信息,以及他是否有进行一些违规的操作,一些违规的工地的违规的一些行为,你比如说他没有戴安全头盔,没有戴口罩,没有穿安全衣,这里都会把它给检测出来, 这里相关的我们有检测的类别,能够检测多少类别,检测多少类别和数量,这里都会有展示,并且呢我们以实时的格式化的图标把它给显示出来, 再随便选,随便选一下,开始识别,这些图标都会变化的以及类别他都会显示。对的,看这个识别的精度,我已经训练的非常高了,这效果是非常好的。接下来我们看一下视频识别啊,视频识别我录制了一些,录制了一个用图片录制的一些视频, 大家可以看一下,大家也可以自己去找任何的工地场景的图片或者是视频来这边啊, 看检测效果其其实是非常好的, u 六 v 八对小目标,很小的目标他也能检测到,整体效果还算是不错的 说,没有检测到违规行为的时候,它就会显示安全作业,我们再来看一下,识别的话,我们就是点一下实时识别,再点开始识别,我们就可以打开摄像头了,检测的精度还是很高的,大家以后还可以把它放到那个, 放到那个,比如说像一些工地场景啊,应用在摄像头上啊,或者是自己改进一下,大家可以拿去学习, 改进成自己的作品吧。这个是我们的数据集,数据集这里也帮大家准备了训练的一个接口,也帮大家准备了 这里有一个运行说明,这里是写好的怎么去运行这个项目,以及是运行哪个脚本就能够看到和一样的效果,训练是哪一个,交互界面是哪一个,还有这里有我的一个训练的一个结果,还有一些相关的一些图标,大家可以自己去自行拿去自行学习,自己去看一看。好,今天这这个项目讲解就到这里。

u 六二零二六新套路拿下顶会在计算机视觉攻点落地中实时目标检测直观重要。 u 六系列因速度与精度的平衡成为标杆。传统 u 六基于 c n n 架构虽在自动驾驶等场景广泛应用,却因预定义类别限制,难以应对开放场景的未知物体检测。随着多模态技术发展, u 六研究转向融合视觉与语言信息, 通过视觉语言域训练,让模型知识开放。词汇检测能识别自然语言描述的位置类别。探索高效集成注意力机制,在保持轻量化的同时 增强特征表达能力,解决传统 c n n 与异关联建模的局限。如今, ulo 正从封闭类别检测向通用视觉理解眼镜,借助引入注意力模块、跨模态融合等创新,提升模型最复杂场景的自适应能力,为多模态交互、动态环境检测等应用开拓新路径。另外,我整理了十篇前沿论文加代码,方便大家参考。

今天我们来学习如何用最新版的 rolo 二六进行摄像头检测。首先准备好摄像头,安装好 rolo 二十六,在命令行输入这行代码 model 的 意思是使用的权重文件, source 是 视频或图片来源。 source 等于零的意思是本地摄像头收等于出的意思是弹出一个窗口,显示实时已推理的摄像头画面, 按回车运行,实时在命令行打印推理结果,窗口显示已经画好框的结果。想要退出,我们按键盘 q 就 可以退出。

同学们,上一个视频,我们已经把收集到的数据进行了标注,标注完之后我们需要对数据进行训练,那这个视频我们就是来搭建训练环境以及训练步骤。那第一个就是说我们先安装 uro 十一, 那怎么安装呢?就是在 uro 的 官方网站上通过这条命令就可以安装,当然既可以在 windows 下面环境下边, 那这一次的话,我们先我这里使用纽邦兔二十二点零四的一个系统来进行安装以及训练。那我这里装了一个虚拟机, 就是这里有用 waterbox 也是一个开源的工具,安装了一个有关注二十二点零四的一个虚拟机。我在这里的话在这里。 ok, 那 我们来安装先安装呢 u r 十一的环境,我们使用这条命令,同样我们也是把圆的话放在国内啊,这样装的速度可能就比较快一点。那我们先来安装环境, ok, 现在有一个 ipot 一个版本不兼容优乐的版本号已经装上了啊, 这里面是有一个阿 k n tokit 和那个当前的 touch 版本存在冲突, 那我们先先也可以在一个虚拟的环境里面去安装啊,那我们现在暂时先忽略这个冲突看看。那接下来我们就来进行 搭建训练的就是训练的目录结构,它的目录结构的话是我们可以看这里啊,环境已经安好了,安装好了,那现在训练的话,我们就是使用这样这两两条 passion 的 脚本来进行训练。这里它有三种方式来加载,呃, usual 的, 第一个就是说加载的是一个呃全新空空白的一个这样的 权重就是说训训练模型来进行训练。第二个就是说,哎,我把 euro 这个十一 e 训练好的模型,在它的基础上进行自定义的一个数据级的一个训练。 第三种就是说,哎,我需要构建一些,就是说我可能是一些审视函数啊,用一个自定义的一个审视函数来进行训练,也是权重,也是使用 uolo 十一预训练好的一个模型。但是我要改变某些一些训练方法,那可能就是说使用这第三种,那我们这里就是说使用 uolo 预训练好的一个模型好了,我们就采用第二种,这个第二种方法,这种方法来做训练。 那训练之前的话,我们先需要把标准好的数据,包括图片以及文本文件放在一定的目录结构里面,他的目录结构是这样子,需要创建一个这样的一个目录结构,然后 给他一个,然后再创建一个 data yummy 这样的一个数据文本的描述方法。这样的一个第一个就是说,哎,我的训练 路径数据路数据集的路径在哪里?然后是 chain, 就是 训练的图片是在哪个地方, 然后数 verify 就是 验证的数据是在哪里。 ok, 那 我这里面就是说,哎,需要告诉告诉他说,哎,我总共有几个类别的,三个类别,然后分别它的名称是什么? 是这三三个名称啊,那这里的名称的话和 label studio 那 边导出来的 那边要保持一致,这里我们从那个标注好的数据导出来的时候,它是这种顺序,那我们这里也需要以导出的顺序完全一致。 ok, 那 我们先来创建 树这个目录结构吧,我们在创建一个目录好了, euro 十一到 euro 十一里面来,我们创建一个这样的目录, 我把几个目录一次性创建好好了,然后是 image, 然后还有个下面还有一个目录 chain, ok, 我 们再创建一个 verify, 然后再创建 labels, ok, 这里的目录结构已就已经创建好了。创建好的话,我们需要创建一个 date 点 ymail 文件, 那这个文件的格式的话是这样子,我们也 copy 过来。 ok, 创建好了之后的话,我们需要把图片给它拷贝到对应的目录里面去,我们从这里拷贝这个是图片过去, 我们复制 u r 十一在 image chain 复制到这里来, 我们把所有标注的数据都拷贝过来。 ok, 这是图片,我们就 copy 过来了。接下来我们需要把 标注文件也 copy 过来,我们在这里把标注文件导出来的标注文件也 copy 过来。 我们把这个 labels 整个目录 copy 过来, 先 copy 到这个目录里面。 由于我们导出来的标注文件前面带了一个 hash value, 我 们需要把这个 hash value 给它去除掉, 这因此我们写了一个判断程序来做,如果手动去这样做的话,那很麻烦。如果数据量很大的话,比如说几 好,几千张,五千张以上,上万张,甚至几万张,那这个工作量是最大的。那意思我们这里面写了一个拍摄程序来做啊,就是 把移除掉前面的 hash value 这样的一个简短的一个拍摄程序。 当然也可以可以使用一些人工智能来写这样的程序,比如说 deep seek 啊,用这种方法来做,那我们直接这里面这个程序,它我就不作说明了,我们直接 copy 过来,然后这里面来创建一个这样的 一个程序啊, 因为我们我们看 labels, 这里面都是带了前缀的 hash value 前缀的,那我们来执行一下 python, 引入点 labels 给它这样的一个目录。还有点错误,这里第十七行有对 unico 的, 这里有点问题,我们改一下, 我们把它改成这个样子, 我们再来执行一下, 再来看看 labels, ok, 这里就已经把前缀的 hash value 给它移除掉了,那我们需要把 训练的图数据局就是到数据局里面,我们进入到数据局看一下啊, data set chain image, 我 们总共所有的数据图片都在这里的,那我们需要把就是说一部分的图片放入到验证验证级的一个数据里面,也继续去说, 我们需要把券里面的百分之二十的数据放入到 验证级这个目录里面来,那我们就是每隔四张图片,我们移除一张图片到 verify 这个目录里面,也就是说从 chain 这里面的数据移除到移到这个 verify 里面。那我们也写了一个一个拍摄程序啊, 我们把这个代码 copy 过来, ok, 我 们来执行一下。 执行这个程序的目的就是说把百分之二十的训练数据移到验证数据级目录里面。 ok, ok, 就 移了七十七张图片到 vref 这个目录里面,我们看一下, ok 就 有了。现在我们所有的 图片内容的话,一开始是放在券里面的,然后我们是然后把百分之二十,每隔四张图片就把一张移到这个 wifi 里面, 那同样道理,我们现在所有的标注的 text 文件都是放在圈里面,我们要依据 where 这里的目录里面的文件名,从 这个目录 copy 到移到这里来。 ok, 那 我们就也写了一个派生脚本啊,就是说 我们执行这样的一个拍摄内容,就是 e g 这里的文件名称,从这个目录 把这个目录下面 txt 文件移到我们的 label 的 一个 verify label 里面去。 ok, 那 我们也把这一段代码 copy 出来, 我们在这里是随便取个名称好了木? ok, 我 们也来执行这条命令啊,把对应的 标注文件也需要有对应的文件,我们来移动一下,执行一下。 ok, 这里还有一个也是 unico 的 问题,这面打印错,我们先看一下 data set 里面的文件名称和 劝你的 verify 两个目录里面的内容是不是一样的,我们看一下 image verify, 然后是 labels, 看一下有几个 ok 文件内容是一样的,那都是文件名称都是相同的。 ok, 这里面我们的目录目录结构内容就已经好了,我们看一下 verified, ok, 那 接下来我们就来训练了,那我们来创建一个 chain, 这样的,我们先 copy 过来, 我们使用第二种方法,把第一个和第三个注视掉。 这里的话,训练就是图片大小,它会自动进行压缩,缩放啊,缩放成六百四乘以六百四,然后 epo 的 话就是,呃,它的 就是训练的次数啊,我们这个小数据的话,我们给他稍微改大一点,通常这里面是,呃改成一百到两百之间,我们改成一百二,也不要太长太,因为他训练收练了之后的话,你训练次数再长都没有用, 那就是说它修炼之后的话就马上就应该停止掉。 ok, 这里面的话,我们是。呃 data set, data 点样的这样的一个文件啊,好,这样子我们来执行一下。 piston chain 训练的时候,我是在普通的一个笔记本电脑上去执行啊, 那这个时间可能会慢一点,那有条件好的话可以在英伟达的一个设备上去训练,这样子的话,它的训练就会因为它的算力很高, 这样训练它会非常的快速。那我们这个只有三百张图片呢?我估计恐怕也要几好几个小时,那我们就等着它训练完吧, 这里是一些默认的一些参数。 呃,这里面还还不能在这个 普通的笔记本电脑上面进行训练,因为这里面还出现了一个 call dumped, 我 估计这可能是因为那个 ddr 不 够, 我们可以看一下这个需要很大的 ddr 上面 八个 g 的 话 quadant。 那 我们把这个环境在一台,呃, cpu 够强劲,内存够够多的一个环境上面来来做训练好了,搭建的过程还是一样的。 那我们只需要我在,我在这里看看,在这里来做这个,我们在这里来做训练吧。换一台机器, 然后把这里的内容给它 copy 过来。一样的东西啊,我们把 uro 十一里的所有的 内容给它 copy 过去,因为我在这台电脑上面也安装了 训练环境。 ok, 我 们来 copy 这里的内容。把 euro 十一全部 copy 到。 ok, 拷贝好了之后,我们在这里来训练啊, 我们把那个 cache 文件给删除掉, data set 里的 重新开始来训练。 ok, 我 们来执行一下啊,这里面也需要有个虚拟环境 and count activate yellow 十一, ok, 我 们来执行一下, ok, 这个环境也是一样的,这里就可以进行。呃,进行下去了,因为在普通的笔记本电脑上的话,它的内存不够,而且 cpu 的 呃处理能力的话也是非常的弱。 呃,因为它我们在做优酷十一的训练的时候,需要消耗大量的 ddr 的。 ok, 这样子的话就开始在第一批次的训练了, 因为这里我们也可以看到。呃,第一个它这里的就是一个框的一个类别, 就是识别类别的筐啊,然后这是类别的一个损失函数,这里面如果值越小的话,它是准确的越高的。 ok, 这里面平均菌度的话是百分之六十啊,应该要这第二次它就到了百分之八十了, 它收敛很快的,这个是已经百分之七十五了。 ok, 接下来我们就等着它训练完好了。 ok, 我 们这里模型也就训练好了,大概花了一个多小时,然后训练好的模型是放在这个路径下面, 它是一个 py torch 的 一个格式,训练就是模型格式,那接下来我们需要把 py torch 的 格式导出为 onyx 模型, onyx 模型是一个也是一个 open source 的, 在各种跨平台下面都支持的,包括 rockchip 也支持这个 onyx 模型。 然后我们也可以看到下面是一个模型训练结果,训练结果的话,它这里是 有类别啊, class 类别,它所有的平均的话就是所有的类别当中的话,它这个 image 七十七张验证的图片当中 有框的类别,就是说他预测这样一个类别的在哪一个框之内,他的准确率达到百分之九十九点七 啊?然后平均的话他是就是说有百分之五十的概率的,平均的话呢,也是百分之九十九点五,然后是在呃九十六点四,百分之九十六点四啊, 然后下面是具体的每一个类,每一个类别,它这里面推理的一个概率范围, 看这里面都百分之九十九点多,这就是说这已经非常高了,就是训练的非常理想了。 ok, 那 我们来把这个模型转换成 onyx 模型,那我们先看 yolo 的 官方网站上面 export, export, 我 们直接用命令行来来转换好了,也是就是使用这样一条命令, 我们来执行这条命令,然后把这里的路径改一下, 改成这个 我们来执行一下。 ok, 现在就有了这个 onix 模型,我们到这个权重里面来查看一下。 ok, 这就是我们转换后的 onix 模型,刚刚转换的, 那我们在先在在转换成 mk 模型之前,我们先在 pc 上面来运行一下这个 onyx 模型,看它推理的准确率怎么样。 那我们来继续来查看啊,通过这里来写一段小的推理代码, 我们来看这样一个推理啊,然后我们把这个代码拷贝出来, 拷贝出来的话我们在这里面, 然后创建一个推理的拍摄程序, 然后 ok, 我 们来改一下这一个路径,把这里改成 我们刚刚训练好的模型 onyx, 然后图片的话也改一下,这里我们修改一下,把两个 两张图片我们改成一张,因为我们设置的时候只是每次只输入一张的图片,在内存这里面删除掉,我们使用这样这一张图片来推理试一下,看看它输出什么结果, 我们来执行一下,还是 ok, 它这里面就有输出结果了,而且是输出了有小炒肉、米饭和西红柿炒蛋,这里我们来打开这张图片看一下, 在输出结果是这张,我们来打开, ok, 这就全部识别出来了,这是米饭,这是小炒肉,这边是西红柿的,而且是 推理的自信度非常高的百分之九十五了。 ok, 这也就是我们训练好的模型,直接运行 onyx 模型的时候,在 ppt 上面有一个推理结果, 下一个视频,我们,哎,怎么把 onyx 模型转换成 r k n 模型?

基于双阶段优喽检测分类和大语言模型的智能垃圾分类监控系统,在视频最后有完整的安装部署教程哦。呃,今天这是一个基于双阶段优喽检测分类和大语言模型的智能垃圾分类监控系统, 然后他主要是用这种 ai 视觉加大模型的这种双隐形架构,然后在垃圾桶顶部集成这种高清摄像头,然后还有一个交互屏,就当有人靠近投放垃圾的时候,这个优喽目标检测模型能够识别到这个垃圾的类别,然后在屏幕上这种高亮的图标提示他投放到正确的这种入口, 然后的话同时系统也支持这种抓拍的瞬间。然后后台的话因为是双优喽目标检测模型还有一个分类模型,那么后台会用这个分类模型再对 目标检测出来那个截图进行一个二次的精细分类,然后并且最终能够在这个格式化大屏上面展示这种精细化类别的这种识别的场景什么的。啊。还有一个的话就是通过大圆模型的系统里边这些垃圾分类的监控来预测,能够预测这个监控摄像头附近的超市里边 他的一些呃热点商品,就是说接下来通过这个呃垃圾检测到的呃垃圾类别数量这些预测看看,就大家最近是都会买买买,哪些东西买的多一点,然后从而就是推测出这种周边超市便利店潜在的这种热销商品,然后能够 给商户们提供一个决策的依据。最终的话就是有一个可刷大屏来展示这些东西,然后这个是一个介绍文档, 这个文档还有一个系统使用注意事项啊,还有就是模型,模型的训练教程,还有就是我们的系统图啊,包括这个架构的交互图,这这些图流程图,还有这个数据流向图啊,我们等会再看啊,当然这个还原教程和系统的启动教程啊,后面是有视频来配套的讲解的。好,现在我们去看一下系统演示, 这是它的登录界面和那个注册界面,首先我们登录一个管理员的账号, 登录进来之后呢,这是可以看到一个首页啊,首页的话这里头像可以在个人中心里面去上传,我这里就先不传了,首页的话就是有一些系统的介绍, 然后因为我们现在登录的是管理员账号,它能够看到这个系统的控制台上面是有一些这些系统的数据,因为现在我们系统还没有被用过,所以这些数据都是空的,然后管理员账号还能看到我们的所有用户啊,然后进行一个管理, 然后就是监控设备,也就是说我们系统里面接入的这些摄像头的情况,然后因为现在登录的是管理员账号,所以才能看到所有用户创建的这些设备。如果你只是登录这个测试用户,普通用户的话,那么他是只能看到自己的这个摄像头的设备的情况。现在我是开了五个摄像头 检测记录的话,就是在实时监控这里会将检测到的垃圾这种情况,还有他具体的那个截图记录到这里, 实时监控的话就是去开启我们的摄像头去做这种监控,这个等下再看,然后是地图监控啊,地图监控的话就是说,呃,我们这个是摄像头的位置啊,这是我们五个摄像头的位置,会在地图这上面显示出来的,然后现在都是零次的检测啊,然后你点它的话,我们可以对它进行一个销量的预测, 然后能够分析它周边商品的这种情况。因为现在这个呃还没有检测记录呢,所以他也能进行一个智能分析,等会这个就会有记录。然后格式化大屏的话, 我们有全屏模式,可以打开全屏模式啊,可以看到这是有这些记录,还有这个中间的地图,我们可以点这个摄像头,对的这个位置图标他就会定位到这里了啊, 我们先退出全屏,但是这个摄像头的摄像头的位置我们可以在这里去选择, 我们选择一个在天津的吧,天津东丽区这里点一下,然后我们去更新一下,那么他就会被换到那个地狱了。新增的时候我们也可以在这里选择具体的位置。我们再来看一下刚才的那个这个摄像头的话, 就可以看到他其实是已经位于天津了,那四个还是在这个北京这里呢。好的,我们下面来开那个摄像头来监控一下,看一下这里有一个模拟短信的通知啊,也就是说 当那个某个摄像头里边检测到一个新的垃圾的时候,他才会触发这个短信的提示,而且只有新的摄像新新垃圾出现的时候,他才会做一次检测记录,如果一直是旧垃圾的那个 就是显示在摄像头里边的话,他是只会记录一次的检测记录,我们来先看一下这个区域, 我们能看到,就是说他说这里边有可回收垃圾,也有有害垃圾,大部分是有害垃圾,因为这个是电池嘛,电池肯定是属于有害垃圾的, 你再点一下,可以看到,就是这里可以记录他最近会检测的一些记录啊。 我们关掉这个摄像头,我看一下这是这有一个,这个是开的我那个手机,呃,那个电脑的摄像头啊,这是我用我用手机去播放的这个东西啊, 那是橘子皮吗?它可能会检测到这种厨余垃圾啊,我们关掉摄像头,再开一个这个的话就是一个矿泉水瓶啊, 那这个就一直是这个矿泉水瓶啊,它这里其实有一个跟踪跟踪 id 啊,它这个 id 如果没变的话,它就不会去记录一个新的东西啊。看这里一共记录了两条啊,第一个是有它,第二个是它这个可能是有一个物件啊,它检测了两个,然后出现一个新 id 的 话,它才会再次的那个 记录一下啊,出现一个新 id, 他 其实模型会认为就是说出现了一个新的垃圾,所以他会再次记录一下,然后再去看一个摄像头。 嗯,这里面大部分是可回收垃圾,有也有刚才检测到了那个其他垃圾,还有厨余垃圾。刚才啊其他垃圾有一个厨余垃圾啊,你再关掉它,然后看最后一个摄像头,然后这些摄像头的启动的过程,在那个后面的那个教程里面都有啊, 这个显示的是一个传送袋啊,传送袋里边大部分是可回收的垃圾,然后我们关掉它。好的,现在其实我们已经有了很多的检测记录啊,我们可以看一下这个它的分析状况啊,我们可以对它, 对它进行一个处理啊,就是说这个也就是垃垃圾已经被正确分类,但这里你可以选择它的处理图片,这里就先不上传,直接点击处理啊,已经被处理了,我们再去处理一个, 然后我们问有数据了吗?我们可以到这个系统控制台里边去看一下这检测记录啊,看这个话,呃,今天是有这个四十六个检测记录,然后检测记录处理的状态,刚才处理了两条,还有四十四条没处理,然后这个检测记录的来源分布的话,在这个这个摄像头它是 它是最多的啊,然后这个的话是最少的,它会有这个记录的分布,然后我们的地图里边看它也有一些这些检测记录的,它这个轻度检测刚才没有没有检测记录的话,它是 绿色的吗?有轻微的检测记录的话,他会变成蓝色,如果是高频的重度的话,他会有这种变成红色。红色是在哪呢?就刚才我们换成天津的那个东西,你可以随便点一下,因为能够去预测一下啊,点预测的话他就会这个功能的话,就是他会根据他那个检测到的这五次, 五次里边他都是什么垃圾,什么种类,呃,然后去预测他的这种,可能周边超市他能够最近买什么东西的人比较多啊?他预测出来的是这个可回收的这种东西比较多什么什么的。但是你在这里查看详情的智能分析这里,你点击它的时候, 它也会让大约模型去给出一个非常详细的这种分析,他这个总检测数是五,可回收垃圾检测到了五个,他有这种销售预测,就是说,呃,什么什么的这些都会预测出来。那么我们去看一下这个高频的检测记录,这里边 看一下他的智能分析是什么,因为数量越多,他可能分析的东西啊,这种有有依据一些。嗯,看他,哎,这个的话,他也是,就是可回收物, 他说可回收物是有一百五十四个有害垃圾,是检测到二百九十四个这个东西,这个摄像头其实应该就是那个刚才检测电池的那个东西啊,然后 那他说可能电池需要的非常的高吧。呃,就因为他这个摄像头检测的大部分都是电池,所以他这里会有高要求的东西啊, 然后有害垃圾是这么多,那么可回收物是这么多啊,所以就是他说环保贷啊什么的,这些可能也是要要求比较多的啊。那我们去可知化大屏这里看一下啊,你看,呃, 它这里会显示有害垃圾,然后可不收垃圾这么多,其他垃圾啊,除垃圾,但是百分比会显示到这里啊。 当然我们这里也可以去预测它的一个销量, 你看它这里也能会预测出来, 然后我们可以打开全屏模式也能看到了,其实我们这里能够看到,说是这个里边这些数据都有了,但是这有一个惊喜分类统计啊,它是没有的。这个是个什么东西呢?这个其实就是我们说的 这个系统,是一个双优漏检测,这个是我们目标检测的一个记录,惊喜分类是我们用这种优漏分类模型做的一个统计啊,这个我们还没有去操作,我们现在去操作一下,我们打开检测记录啊,我们可以随便随便点开一个, 然后我们可以看到这里的分类结果是内个未分类状态,就是我们还没有对它进行一个精精细的分类啊。我们目标检测的话是对整个画面里面的这些 这些方块进行那个检测吗?他是分成了四大类,就是可回收垃圾、厨余垃圾、其他垃圾,还有有害垃圾。我们惊喜分类的话是对我们上一部截取出来的这个图片啊,他做一个惊喜的分类,这个的话是用的另一个模型,和这个目标检测模型不是同一个模型啊,它是优喽这种分类模型,它支持四十种惊喜分类的类别,我们可以点击这个惊喜分类, 点击之后呢,它整个一个过程的话就是把这截图分别的传递给优喽的这种分类啊,就是在这里啊,说第一个是一个塑料玩具啊, 嗯,这是他判断的,第二的话他说是一个充电宝,第三个的话他说也是叫什么粘板啊?不太懂啊。然后我们可以再找一个, 这是刚才那个电池的那个东西嘛,那像这个的话,因为全部是电池,它全部检测的是这种有害垃圾啊,那他截截图也当然都是这种截的电池啊,我去给他精细分类一下, 嗯,这个其实他分类的不是特别正确啊,是因为这四十种类别里面他可能没有对这个电池专门做这种,呃,没有电池的这种特别的专门的数据,可能他呃分类的不是很很准确啊,这个的话可以之后在数据集里面补充数据,然后去做这种再进一步的做这种训练啊, 然后因为我们其实现在的话是一个批量进行分类的这么一个功能,就是我们可以 选中多个,然后一次性对他进行这种精细分类的处理。你看他像这一页的话,他就已经全部做了精细的分类了啊,可以随便点一个看一下,这个时候呢,我们就不用去再点这个每一个的精细分类的这个按钮,我们再打开第二页,然后我们再全部选中,再去用这种批量的精细分类。 好的,然后的话第三页, 然后是第四页, 然后是最后一样,我可以看下,就是现在你看他都是被分类的东西啊,你看这个的话啊,然后我们点击批量清洗分类之后, 我们这个东西再看的话,他就已经是全部做了这种分类的结果了啊, 我们现在去这个格式化大屏里边再看一下啊,就可以看到看这个精细分类这里统计的也有了啊,这些东西他会显示到这里啊, 我们去这个时候我们再点击这个小摄像头,这里在预测销量的时候,他就会根据这个检测分类的统计和这个精细分类的统计一起去做这种预测了,他这里检测到的,因为我们这个其实就是刚才那个 检测电池的那个摄像头嘛,然后他这里会列出前五名啊,第一个的话就是这个环保型的包装商品,第二个他说这个周围可能充电设备啊,配件不是电池嘛,他就比较多,剩下的就是这些比较多。 我们这里的话,你像这个,那他他旁边就有一个这个购物中心啊,有一个便利店啊,他俩的话我们就可以按照刚才他统计出来的东西啊,他就可以多采购一些这种充电设备啊,还有环保型的装品啊,那么可能他就会卖的好一些。我们在地图监控这里的 这个智能分析这里啊,他也会,现在也会,就是根据两种结果去进行这种预测了,一个是优乐的目标检测,一个是优乐分类的结果啊,去做这种预测,嗯, 那他就这这里也会,因为我们刚才的话是没有这个精细分类的这个东西的,现在是有了啊,他说可会收物啊,这个插电头、皮鞋啊、塑料衣架啊这些多,所以他就会,呃,这里会有这种向量预测的一个描述啊,看有垃圾啊、软膏、过期药物、干电池这些,嗯,他就会根据这些这些东西去进行一个向量预测啊。 好的,这个的话就是我们这个系统内呃所有功能的演示啊,然后这个界面的话,它是会每隔一分钟去自动刷新一下,所以它是动态变化的。然后我们再去登录一个普通用户的账号, 普通用户的话他是只能看到自己新建的这些设备啊,但是地图监控的话,他也只能看到自己新建的监控的这些情况,包括可放大屏,你看他也只能看到两个摄像头,包括这些精细分类的东西和这个检测分类的统计啊,因为他这两个只是他这两个自己的这两个摄像头的一些东西啊,所以和那个管理员看到还是不太一样的, 这是整个系统的这个演示过程了。然后下面的话我们去看一下这个文档吧。这个环境安装和系统启动的这两个教程啊,他是配套后面的那个视频教程,跟着视频教程,然后结合这个文档去装环境和启动就可以了。项目介绍文档的话,这里面主要是项目开处啊,还有我们的系统加扣, 然后的话就是核心功能的这种展示,还有项目的目录结构会列在这里,然后核心的一些数据库表的设计,还有这个用的这种深入模型,深入学习的模型啊,他会这里有那个介绍,还有一些核心的这个 ip 的 接口, 然后应用场景会列在这里,系统属使用的注意事项的话我们可以看一下。嗯,单元模型的话是用的这种 kpi 服务啊,然后系统的话是提供了两个数据集,一个是垃圾目标检测的数据集,另一个是垃圾分类的这种数据集,目标检测的话它是数量是这么多,主要分成了这四种类别, 这是他一个训练的进度是列在这里,这是我已经训练好的模型了这个进度。然后分类数据集的话它是有四十种类别,我们可以看一下这四十种类别是什么东西吧。 啊?你看这个就有有这么多东西的分类啊,然后这是他的数据量,还有训练好的这个模型的筋骨,这是一些其他的功能,你可以到时候下载下来看一下。然后是我们的这个模型训练啊,模型训练其实 他的这个代码是放到了 model tree 这个目录下边,一个是这个目标检测的训练代码,一个是这个分类的训练代码,那么我们要训练的话其实也比较简单,我们只要新建一个终端啊, 那新建终端之后呢?我们因为要用拍摄环境嘛,然后这个环境是你启动完项目之后就已经装好了,它和我们算法端是用的同一个环境啊,当你看到这里的时候,其实这两个里边已经告诉你了这个呃环境怎么装,怎么启动了,这里只需要去跟着这个操作执行就可以了。激活了环境之后呢,我们如果要训练分类模型的话,那么我们就去 首先进入到这个目录,然后去运行这个 train 的 命令,然后他的这个训练的结果会放到 up top 的 下边,包括他的损失图呀,还有模型权重呀,还有训练的一些记录啊放到这里边, 然后这里面你可以用十一 v 八可以去训练这个分类模型,然后检测模型也是一样的,你就先进入到这个检测的目录,然后去运行这条命令就可以了,这是他的训练代码都写到了这里,然后每一个下边是提供了两个数据集,一个是测试数据集,一个是完整的数据集, 这个的话他可能在加载模型和这个加载数据的这个过程可以看一下,我在这个等他这个时间训练的时间过程中,让我们看一下那个开始了,你看他他已经开始训练了, 你可以看到他训练完了之后,我们就能够在这个春下边看到他的这个这种结果啊,一些过程图,包括这个他每训练完一轮啊, 好像他每训练完一轮就会在这里多一个记录啊,看他现在训练完两轮了,这里会多两个记录,那这包括就是他的一个精度的变化、损失的变化啊,都会记录到这里啊。 然后这个就是为此下边这个 best 点 p t 就是 他训练的这种权重啊,到时候你训练完之后,把这个 best 点 p t 换成换到我们的这个这里边啊,替换掉就可以了,但是你不替换也行,因为这个是已经训练好的,那这些在那个系统注意事项里边也都有写。 然后我这里就先终止掉这个训练过程了。最后我们去看一下系统的这个 ppt 吧,它这里面是画的我们的这种系统的加固图,还有这种加固的交互图啊,看一下交互图的话,它就是说我们刚才这个架构,它那个它们之间是怎么交互的, 像这个是数据存储层,还有这个算法服务层,他们之间的交互关系什么的,都会有线连接起来的,这个就不多看。然后功能模块图的话,这里是列了一些这些功能模块啊,当然你可以继续补充啊。 然后就是这个优酷识别加打磨性分析的这种流程图,这个我们可以看一下, 首先就是视频由的输入啊,然后视频帧提取、图像预处理,然后在优酷检测阶段的话,是用这个目标检测的模型检测到垃圾保存下来啊,然后这的话它会继续下一帧循环。那么我们刚才说了,我们除了优酷目标检测,还有一个优酷的精细分类的模型了,它的话是能对这个截取出来的某一个小的截图进行一个更精细的分类啊。最后就是能尽可能去统计这些 检测和分类的这种记录,然后用这个大圆模型的接口去预测这种根据这些统计的数据去预测周围这种商品的销量的趋势。然后在这个格式化大屏地图上面显示出来。最后一个的话是这个系统的数据流向图啊,就是说数据从这个处理层到数据承受。