粉丝832获赞2560



最新优喽二六来了,今天我将使用优喽二六训练自己的数据集合推理,并教你本地训练和租用 gpu 服务器训练,顺便带你解析优喽二十六创新点全网最详细教程。 哈喽,大家好,优喽二六来了,听说它是更好更快更小的优喽模型,那么优喽二六还能使用吗?肯定是可以的,官网都出新的,肯定是可以用的,那本期教程我教你使用优喽二六训练自己的数据级和推理, 如果本地没有 gpu 的 话,那么我会教你们做用 gpu 服务器来训练的。顺便来讲一下优喽二六的创新点,它是前几天刚出的, 我们来看一下这个目录,点击它就行了。载药这里优酷二六是在二零二六年一月十四号发布的,我今天才写完这篇文章,在博客就可以收到了,我们来看一下优酷二六的更新点, 但是有这么多,但是可能也不止这么多吧,这些主要的创新点我会一个个讲的,会根据代码来讲的。我们先下载优乐二六的源码,在目录这里找到就行了。 源码的下载,打开官网的地址, 打开了之后呢,这里找到它的最新版本号,它最新是八点四点五,我前两天是下载是八点四点二的, 选中它就行了,有 code 点击下载就行了,这里等待它下载 我,那我就用前两天下载的八点四点二的代码,是会一直更新的,我们用之前的就行了。如果你需要我提中的原码,在公众号这里发送 yellow 二六原码,就可以获取我的完整原码了。我的完整原码是什么样子的呢?我们来看一下, 它是包含了训练的测试数据集,还有训练脚本,推理脚本数据,配置文件等,把它解压出来,然后打开就行了。拍 tom 打开 由官网的运训练模型下载在这里下面这里 它是有目标检测的模型啊, n s, 这个是模型的大小,还有分割的模型,还有分类 关键点检测的,还有个旋转框的 o b b 的, 根据你们的需求来下载就行了。点击就可以下载了, 点击你看它就会自动下载,我已经下载过了,我就不下载了。在我的元码包里面也是有这几个模型的,你们用哪个就下载哪个 代码打开了然后呢?环境怎么配置呢?先配置一下环境吧, 环境的话在看下在哪里。环境配置在这里, uolo 二六, uolo 十一十九八七五,它的环境都是通用的,只需安装一次就行了,我还是用之前的 uolo 十一,环境还是没变,选中你之前的环境就行了。 不懂的话可以看这个教程,从四分五十三秒开始看环境安装教程,我这里就不演示环境怎么安装了,它是很简单的,看这个教程就可以安装了。 假设把环境安装完了之后呢,就可以运行推理训练脚本了。我们先进行推理吧,因为环境已经配置好了推理,在这里 复制这个脚本就行了,如果你下载我的原码就不用复制,我原码已经包含了我们打开推理的脚本在这里 第一个参数就是放你模型的路径,我的模型是在这里,你用哪个推理就填哪个,你用你自己的模型也是可以的,上述参数就是放你那个推理图片或视频的路径, 我这个推理视频是在根目录的,所以直接填他的文件名就行了,也可以填他的绝对路径,复制路径填到这里就行了。 然后是否要显示,如果你要显示的话就填处,不显示就 force, 我 们直接运行,看下它的推理速度快不快。 好的,推理结束,如果你需要推理图片的话,你就把图片的路径填到这里就行了, 图片我就不用显示出来了, 然后重新运行, 然后它的结果会保存在这里, 这个就是它的推理结果了。然后上面这个是我刚推理的视频结果是优喽二六跟优喽十一的推理方式训练方式一模一样的,跟 v 八也是一样的。 那我们先讲一下优喽二六的创新点吧,等一下我再讲训练,训练很简单的, 我们先找到目录这里,创新点在这里我们先讲第一个移除分布焦点损失模块嘛?它在哪里呢? 它的代码在 ross 点 py 文件这里,我们打开代码来看一下。 双击打开了之后呢?分布焦点损失模块的核心代码在 bbox 这个类里面,我们打开代码来看一下,然后进行搜索就行了,把这个类的名字复制,然后呢 ctrl f 搜索 就是这个了。从这行代码就可以看出来,它是通过 i g max 这个参数来控制是否使用分布焦点这个损失的, 如果这个参数大于一,那么就使用分布焦点损失,如果小于或者等于一就为空嘛。这个参数是在它的模型文件里面写的,我们打开它的模型配置文件, 在这里二六这里打开了,你看它的 ig max 这个参数是等于一的,那么就移除了这个分布焦点模块嘛, 然后下面的再看一下,这个就是分布焦点损失了,如果为空的话就使用下面这里就用 l e 损失嘛,在这里这行代码前面的就是他的归一块处理了。 u 二六,它为什么用 l 一 的损失呢?我觉得应该是为了提升速度嘛,而分布焦点损失目的是为了提高模型精度,它是通过 i g max 这个分布值来提高定位精度的,但是会增加它的计算量,它这里出师值是十六的,如果使用分布焦点损失的话, u 二六它是走这条分支的。好的,这个创新点过了,我们继续讲下一个,我们来看一下博克, 第二个就是端到端,无需 n n s 推理。优乐二六,有点类似优乐威时的双标签分配思路,在训练时同时使用两个分支,推理时候只有一个分支。我们来看一下它的代码在哪里,可以在它的 head p i 来看一下。打开代码 还是在这里 head 这里 看一下。检测,这里这个就是检测头了 门,往下面来看一下在哪里, 代码在这里,我们来看一下博克,它是有两个分支,一个是一对多,一个是一对一,一对多就是一个真实物体对应多个的预测框嘛,一对一就是一个目标对应一个预测框嘛, 他的分支怎么走呢?训练的话他是走两条分支的,一个是一对多,这行代码就是一对多吗? one two many 一 对多,然后继续往下面走,下面走就是一对一嘛,在这里要把一对一和一对多放到一个字典里面,然后在训练的时候 他返回,回去嘛,所以他是走两条分支的,这个就可以看得出来,如果在推理的时候他就使用一条分支,就是问图问嘛,就是一对一嘛,从这行代码就可以看得出来了, 这里是推理的,大家来看下这里就行了。他这样做的目的是为什么呢?就是在推理时候降低延时嘛,一句话就是优乐二六在训练和推理上比之前的优乐 vs 一 理论上更快嘛。好的,这个创新点过 我们继续讲下一个,下一个就是什么呢? 更详细的内容大家来看一下博克就行了,下一个就是 pro ross 和 d a l pro ross 的 代码,在 ross 点 py 这个文件里面,我们来看一下, 先找到它, 然后它的类在哪里呢?在这里复制这个类搜索就行了,直接搜索到了,就是这个 boss 大 概思路就是在训练过程中动态调整一对多分支和一对一分支的损失权重,在训练初期侧重一对多的分支,这样加快模型的特征提取嘛。在训练后期就是侧重一对一的分支嘛,我们可以从代码这里来看一下, 在代码这里它是这样定义的,一对多它的权重值是零点八就是百分之八十嘛,剩下的就是一对一的权重嘛,一减去零点八就是零点二嘛,定的就是百分之二十嘛。然后在训练的后期就是 一对多的权重变成了零点一,然后他的一对一分之就变成了百分之九十嘛,他的权重值 还是通过这个方法来更新他的权重值的,在训练过程中他会动态调整的,在这里他的权重衰减是在哪里计算呢?是在这个方法来计算的,大家来看一下就行了,在这里。 好的,继续来看。扑克还有一个小的创新点,就是优化小目标的,就是 s t a l, 如果目标大小,它会将框高放大处理的,就好比一个篮球框,它太小的话,你投篮的话难度会更大,你把那个篮球框变大了,你投篮的几率就会变大了,它的意思就是这样子的,它的代码在哪里呢?我们来看一下 他的代码在 t a l 这个文件里面,我们打开以后搜索就行了,我们主要看他的核心代码,在这里看这位 f 核心代码在哪里呢?跳进这个方法里面,他的核心代码就是在这里 宽高获取原始的宽高吗?如果他太小的话,会进行放大处理,在训练过程中,如果你的目标太小的话,他会将其放大放大,那么理论上你的精度会提高,理论上哦, 好的,这里过了,我们讲最后一个,最后一个就是优化器了,他用的优化器是 miui s g d, 应该是他最新提出的优化器,这个优化器是将 miui 和 s g d 结合在一起的,两个权重各占一半,在代码这里可以找到, 我们可以打开代码来看一下。它在这里, 在这里打开这个就是它的最新优化器了, vivo 和 s g d 各占一半,就是各占百分之五十嘛,它这里写有的具体代码实现,大家来看一下。这里, 在这里这么多,大家来看一下就行了,我们来看一下博克,其中铭文部分就是负责结构化的更新嘛,就是对 t 度的正交化处理,它应该是参考大模型的处理方法,目的是防止 t 度消失和爆炸,整体上实现更稳定的训练和更快的收敛速度。 这 g t 部分就是提高它的计算效率的好的创新点解析完毕, 官网说优乐二六最小版本在标准 cpu 上运行速度最高提升了百分之四十三,大家拿到原码来试一下就行了。然后训练还有推理的速度是不是比优乐十一更快,大家来试一下就行了。好的,优乐二六更新点基本讲完,这只是我的个人观点, 更多的更新点在源码里面,可能官网没有说出来,大家拿到原码来看一下就行了。 然后呢,我们来讲一下它的模型结构吧,它的模型结构在这里,它的模型结构跟之前的优乐 v 十一一模一样,几乎没有变,只是加了一些参数而已。我们来看一下 这是优酷二六的模型配置文件,它加了两个参数,还有一些,这里 c 三 k 二,这里也是加了一些参数,这里我这里也写出来了。在这里 c 三 k 二的小优化,我们来看一下在哪里 c 三 k 二。找到这里, c 三 k 二在这,它的小优化就是在上面,这里,它现在有三个分支,一个分支,两个分支,三个分支,它之前是有两个分支的,我们来看一下这里, 它之前是有两个分支的,现在多了一个。然后看一下优路 v 十一的配置文件在哪里呢? u 六十一在这里, 它的模型结构是基本一样的,只是这里的参数不一样,它这里只有一个处,它这里是多了一个处的。 多了一个处是代表什么意思呢?就是它这里就多了一个分支嘛, 如果等于 a、 d、 d、 n, 就 走前面这条分支,否则的话就走 c 三 k 这条分支,后面的分支就是跟优路十一的分支一模一样的,只是它这里的全仓多了一个簇簇的话就是调用前面这个分支嘛。 是两个的话就是调用前面那个分支,一个的话就是调用 c 三 k 这条分支,它的参数在这里可以看得到的。 force force 把两个处传进来就是调用这条分支了,这里不讲这么多了,好了,这里结束, 最后讲一下优乐二六的训练,优乐二六的训练跟优乐十一、优乐 v 八 v 十 v 十一 v 十三都是一模一样的,初级处理也是一模一样的,我们来看一下初级准备,这里 有目标检测,还有分割的,还有关键点检测 o v 的, 大家来看一下使用什么工具来标注就行了,你也可以用现成的数据来训练,就不用自己标注数据。这里我就不讲了,假设你弄好一份数据就可以直接训练了。 在这里优鲁二六训练,这里我这里也写了本地训练,还有服务器训练,我先教一下本地训练了,如果本地训练不起来,我后面租服务器来教你们怎么训练。这里拿到我的训练测试数据集,在这里 填一下你的配置文件就行了。这个是我之前训练的行人数据集,那我就用之前的就行了,如果你用其他数据改一下路径,还有类别的数量还有标签就行了, 大致都是一样的。然后这里改完了之后就可以直接训练了。在训练这个文件里面,这里填上你的模型配置文件。在哪里呢?在刚刚那里, 二六这里,把这个路径复制到这里就行了。这里的路径填你们的,然后是否加载你的训练权重?如果你不加载,就把这条代码注册掉就行了, 我就加载,然后他的训练速度可能更快吧。然后训练次数,批次大小,然后现成数肯定的话也可以填八或者填零,如果选成八的话,你就最好填个零,然后其他都不用动,然后直接训练 这里,等待他加载就行了。 好的,这里他是训练成功的。 好的,这里先暂停了,我这里只是演示一下怎么训练,更详细的教程可以结合播客的内容来看。 好的,接下来就是租服务器来训练的,我之前也出了一期租奥拓 d l 的 远程服务器来训练的,训练方式跟本地一样,把你的代码还有数据上传到上面,然后改上路径就行了。然后直接训练跟本地训练一样的, 只是上面是没有界面操作的,然后在只能在终端这里操作就行了。终端也是可以训练的,比如说在服务器的话,你就需需要用命令来训练了,如果说派森,派森去按住回车键,他就会自动补全,然后直接回车。服务器训练就是这样子的, 我这里先暂停,他是能训练起来的。好了,接下来进入服务器训练教程,这里暂停。 如果你使用奥拓 d l, 你 就看这个教程来就行了,这里是手把手教成的,大家来看下去就行了,很详细的。 那这期视频我是租用 c s d n 的 星毒 ai 进行训练,它是 c s d n 官网推出来的,博主已经在这个星毒 ai 平台上面配置好了优柔的训练和推理环境,它适合优柔二六十一 v 八 v 十的训练的,不过你训练其他模型,你也可以自己配置。环境很简单的,就是点击这个链接, 然后呢直接这里自动续费可以关闭,然后你需要时长在这里勾选就行了。这里机器两个, gpu 或者三个,我这里就用一个就够了,要是用我的镜像就行了,我已经配置好了。然后这里也有教程,大家来看看就行了,要直接部署这里带大家来部署一下, 这里续费直接关闭,然后直接部署用这里直接支付就行了。设置用四零九零的机器,然后点击运行中,这里等待它创建。也可以看这个教程, 这个镜像只需要你上传数据集就行了。环境我已经配置好了,路由二六的代码也在里面,如果你用你的代码的话,也可以上传到上面,我上传的代码是版本号是八点四点二的,如果你有最新的话,你也可以上传最新的代码上去, 这里写的很详细, 这里等待它创建。 我们先把数据集上传。先上传数据集,我是用的工具是叉 f t p, 那 这里有安装教程的,大家来看一下就行了,我这里就不教你们怎么安装了,这里写的很详细的,打开叉 f t p 上传的下载数据都是用这个工具, 然后这里等待它启动。我数据先准备上线,我是用优优二六官网提供的数据,它是用于家居物体检测的,它的类别是有多少个类?有十二个类别, 我们来用这个数据集来训练,你也可以训练自己的数据集,反正上传上去就行了,很简单的。这里等待它创建。怎么创建这么久?这里先暂停一下 这个星途 ai, 它创建镜像怎么这么慢?应该有半个钟了,还没创建完成,我这里先等待它创建吧。 我在奥拓迪奥鲁这里创建一个环境吧,到时候我会分享出去,到时候你们直接用就行了。现在我是从零开始创建一个环境,创建优酷的环境, 先租一个实力先,然后这里地区的话,大家根据自己需求来选择就行了。然后显卡租个四零九零,他这里没有了五零九零,五零九零又太贵了,租不起, 这个更贵,六千。 北京的看有没有选 内蒙,内蒙应该有。那我就做一个四零九零的,然后 gpu 数量它这里自己可以选的,到时候我把我的镜像分享给你们。 社区镜像应该也是有的,如果你们在这里也可以搜索社区的镜像,我先创建一个镜像先 id, 我 还是用这个吧。然后呢直接创建就行, 这里等待它开机。它这个开机应该挺快的。这里还没得呢还没得,我去, 这里已经开机成功了,这里是运行中,这里可以连接你的叉 f t b, 把这个命令复制一下,然后这里属性,然后把这里粘贴过来,这里方便复制。 然后这个主机就是 at 后面的全部,这是我刚刚复制,然后端口号粘贴到这里,然后呢这里就选这个,然后名称随便写,优喽二六或者优喽二六 就写个 url 吧,随便写的,然后端口号是多少?是刚刚那个,然后用户名输入的,然后密码在这里复制,密码粘贴到这里,然后呢进行这里先把它删除下,然后直接连接,然后这里接受, 一般把一般把代码还有数据上传到这个数据盘这里,我们打开 jupiter 这个服务,它这里也有帮助文档的,如果不会的话来看这个教程,我之前出过教程的,在这里 这里打开一个终端,然后它这里有的数据盘实体关机,不会丢失,一般不会随镜像保存,如果你要保存镜像的话,你就不要把这个数据放在这里,然后系统盘就是录的上面的 使力关机,但是会随你的镜像会保存,就是你的环境啊,会保保存在你的镜像里面,然后这个也大家来看一下就行了,然后直接来看这里,然后我是内置了他的拍照曲的,然后来看一下他的拍照曲版本是多少, 因为刚刚创建的拍照取应该是一点一,一点零的,然后库达是十一点三的,如果你的环境和他提供的不一样,你也可以自己新建,然后他在哪里新建呢?在他这里有教程的,大家来看看就行。镜像 如果平台上没有你想要的版本,你可以在开机后创建自己想要的 ps 版本和扩展版本,我这里是适合用,那就用它的原来的环境就行了,原来环境如果缺什么就安装什么就行了。 我先看一下星图 ai 这里。好的,这里已经启动了,我先这里先等一下吧,先关机先吧,等一下我再过来弄这个,然后我先教这边的教程, 然后它这里也有教程的。启动完成了之后呢,打开这个 jupiter 这个服务,点击它就行了,这里就会等待它启动。 嗯,启动完成了之后呢,看这个教程, 因为我系统盘已经放有 uolo 二六的代码,要把它复制到数据盘就行了,复制这条命令, 然后呢回收就行了,然后它这里会把那里的原码复制到这里来,如果没有的话,你可以自己在这里上传,往这里重新连嘛, 这里重新新建一个 yellow 二六的 就叫优喽二百,然后把这个端口号什么都复制过来,跟刚刚的操作一样的,其实每个远程服务器的操作基本都是一样的,然后主机是艾特后面的全部,然后端口号 复制到这里,不能有空格后面,然后用户名是录的密码,在这里复制粘贴到这里连接。 嗯,进来就可以看到系统盘的全部文件了,然后这个是我镜像保存的优乐二六的原码,八点四点二,如果你有自己的原码,你也可以上传到上面,用我的工具就行了。 我的数据盘是在这里的,刚刚已经复制过来了,为什么要复制到这里呢?因为这里更好的操作嘛,比如说打开它,然后就可以在这里修改了, 直接进行训练。我先把数据集上传,先上传也是上传到这个数据盘这里, 把这个代码双击或者拖拽过来就行了,如果是文件夹的话就要进行拖拽,文件的话就双击它自动会上传到这边来,这里等待它上传, 在服务器也是可以推理的。然后呢,先激活你的环境在这里, 然后进入这个代码的目录,也可以进入代码的目录 cd, 然后就进入你代码的目录,就是这个目录。然后呢,下一步应该是激活了。 激活的命令在哪?激活的命令在这里也可以看一下服务器的环境有哪些。 又弄错了, emv l i s t 然后服务器的虚拟环境是有这么多,前面三个应该是服务器自带的,这个优乐环境是我自己创建的,就是分享给你们的环境,你们就可以用我的环境了。 你要激活激活命令怎么激活? c o n d a h e t i v a t 然后优酷就行了,这里是就是你优酷的环境的名字,然后回车,只要左边这个括号变成优酷,你就可以用我的环境了。然后就可以在我的环境里面看一下有哪些包, 它是有安装了这么多,如果没有的包,你也可以自己自己安装, p i p 安装就行了,如果你需要加载其他的环境,跟 windows 的 环境安装一样的,它也是有个终端的。跟这里一样, 数据已经上传到上面了,然后我们进行解压,怎么解压呢?在上面只能用命令,我们看一下数据的包在哪里, 我们先退出上级目录群,然后看上了有哪些,这个就是我的税级了。我们进解了解压的命令,如果不会的话来看教程,它这里有常用的命令来,看完这个教程就懂了,不懂你就问 ai 吧, 它的包名前面 h, 然后按住 tab 键,它就会自动补全了,然后接着杠的就是你要解压的目录在哪里,那我就解压到当前目录,当前目录就是这里,然后文件名,文件名叫什么呢?叫换吧, 然后加一个斜杠,然后呢 回车就行,然后这个命令打错了,应该是 u n 的 u n 杠一 c p, 然后压缩包的名字,然后需要解压到的目录叫 home d a t a, 这文件名可以随便取这里等待它解压完成,这里返回上一个目录,就可以看到你解压的文件夹了,然后这里的类别全部复制过来, 然后在你的代码的配置文件数据及配置文件这里粘贴, 它,应该是十二个,十二,那又填十二,它这里填的列表也可以用字典,也可以用中括号,就是刚刚的原始方式,用哪种都行的。 然后这里训练的路径是在哪里呢?我们也可以在这里来看一下。这里重新进入,然后训练的把它这个路径粘贴到这里填绝对路径啊,这样就不会容易出错。 然后这个就是 vl, 然后这里改一下 vl, 然后保存, ctrl s 保存。然后呢回到训练这里, 然后训练的次数我就填个五十轮吧,然后皮子大小填一二八吧,如果你显卡显存大的话就填多一点,就是芝麻服务器的显存嘛,然后现场数填八, 然后使用的设备是零,零代表第一个 gpu, 如果你有两个,你就填一嘛,零一嘛,那我就有一个,就填零嘛,然后什么都不用动就可以训练了。 模型的文件在这里,然后配置文件这里修改一下吧,在哪里呢?在这里可以找得到, 快在这里吧, 二六是哪个呢?是目标检测,就把这个路径复制过来,这个路径把前面的删掉,写成一个点,然后就保存了 点斜杠就是这个原版的跟路径嘛,然后就可以找到这个配置软件了。如果你这种方式出错的话,就填绝对路径, 然后在终端这里进入你的原码路径,原码路径,然后直接拍摄就行了, d r, 然后直接回车,然后服务器训练,就是这么简单,用我的镜像就不用拍摄环境了,已经帮你们配好了, 如果缺什么包,你可以自己安装的,没问题的。 嗯,继续等待吧。训练完了之后呢?怎么下载你的模型呢?它会有你的结果的,然后把它拖拽到这边就行了,然后你就可以在本地测试了。 这个是我在服务器上面推理的,它会保存结果在这里,如果你需要下载的话,在这里下载就行了,或者在这里它是有 w w 下载就行了。 这里训练成功了。好的,这里服务器已经训练成功了。 这个就是我创建的镜像,又是帮你们配好环境的。后面我在这里再创建一个环境嘛,因为这里启动的话比较慢,你们看着来选择吧。这里先开机, 这边等待它训练。 我先把这边的教程弄一下。好的,这里重新连吧,这里看能不能重新连好了。重新连已经成功了,因为这里已经开机了,然后这里刷新吧。 好的,这里打开终端,它前面是被子,就是系统默认的环境,命令还是跟之前的一样, 它是只有一个环境的,那我就用默认的环境就行了,如果这个环境缺什么,就安装在里面就行了。我们先装安装优酷的环境吧,因为它已经安装了 pose 了,因为前面已经看过了。我这里再看一遍, 你看它这里有的。那我就不用安装,直接安装下一步就行。 看优优的环境安装在这里。 ipad 已经安装完成了服务器,然后呢?安装其他环境。我们先把原码上传上去吧。 cd 到数据 盘。原码是哪个?看一下。原码是 重新去官网下载一个吧,方便你们知道怎么弄。 选最新的八点四点五的, 复制这个命令,看看能不能下载 它好像没有这个命令。那直接上传这个压缩包吧, 我之前下载过了。那就擦掉。那直接上传就行了,找到源码先, 我们就上传最新的。你也可以上传之前的原码,比如说优路十一 v 八 v 七 v 九 v 十等等,各种原码都是这种方式的。在服务器训练的话,然后数据集也上传一下吧。 数据集还是用刚刚的吧。在哪里呢?找一下先。 我用其他的。那就用其他的,用行人的收集这里,等待他上传就行了。然后这里先解压人马是这里不?嗯,这里可以看得到解压,看一下人。 然后需要解压的文件是哪个需要解压的。需要解压到的路径在哪里呢?那就在当前目录下。嗯,当前目录下。 person 吧。 加个斜杠,然后呢?回车。哦,这不是,这是尤洛。 解压到哪个文件夹呢?啊?这个是,这是原码的文件,需要解压到原码 u l。 需要解压到的文件夹是哪个呢?这里随便建一个 u l t i l y t i c s, 加个斜杠吧,原码就解压到这个文件夹了, 然后呢?数据集上传完成没有?上传完成了,继续解压。需要解压的文件是哪个?优酷数据集的杠 d, 需要解压到哪个文件夹呢?这里新建一个 p i s o n, 加个斜杠,然后呢?这里已经解压完成, 然后这里还没有基础环境,就是其他依赖,还需要安装其他依赖,安装其他依赖。在这里 新建一个文件,你要把这个包全部复制到里面就行了,在本地直接上传到上面就行了,这里重新打开, 然后在这里找一下那个文件在哪里。先在本地新建好,就可以上传到上面了。 我之前的源码包是有的, 数据及配置文件上传到上面前,模型也可以上传, 需要的文件上传到上面就行了,然后配置文件环境,配置文件也是可以上传的。上传到上面,在你上传完成之后呢,就可以安装依赖了。复制这条命令 在这里粘贴。大家是不是没有找到这个文件,因为你的路径不在这里,需要进入到这个文件的路径在哪里呢?按住 tab 键, tab 键它就可以进入了,然后再使用这个秒模拟安装就行了,这里可以打开的, 这里等待他安装好的。安装完成就可以测试训练了,训练太简单了,然后把那个路径复制过来,这里的路径要填你服务器的路径在这里。 模型二六,我的配置文件是这个目标,复制路径粘贴到这里就行了, 这里点就行了,如果你不放心的话,就填绝对滤镜,绝对滤镜在这里,这个就是它的绝对滤镜。不是,这个是原版的绝对滤镜。模型配置文件还是在这里 这里复制,复制到后面这里就行。好的,然后修改一下,启动,先修改一下数据级的配置文件,我们在这里复制过来, 这里应该是 vl, 反正你们的文件怎么命名就怎么写。确实是 vl, 有 一个类别标准对点, 然后训练字数,那就五十吧,一二八,现成数是八, 看一下哪里要改,这里需要填个零,就是用第一个 gpu 这里保存,看看能不能训练成功吧。 picken, 看这边训练完成没有,这里是什么警告,不用管, 这边已经开始训练了。 打包这个错误呢,就是缺少这个包嘛,遇到报错不用框的,它是跟 windows 安装环境差不多的, 就是缺什么包就安装什么包,问题不大。星途 ai 的 训练教程我都有了, 奥拓 d l 的 教程我也是刚刚从零开始教你们的,也是很简单的,如果你有其他原版也是这样子训练的,你在本地弄好你的训练文件,这里文件等等模型啊什么的,然后上传到上面,然后训练就行了, 很简单的。好了,这里等待他训练,然后训练完成我就要关机了,因为他是有收费的,到时候我把这个镜像分享给你们就行了,然后你们直接用就好, 如果你们不用的话也可以自己安装,因为安装环境我刚前面演示过了,很简单的,缺什么就安装什么,没什么难度。 如果在服务器上面推理,也需要修改一下模型的文件呢?需要推理文件的路径啊在这里, 然后这个参数之后显示在服务器上面是不能显示的,因为它只有一个黑黑的终端,这里只保存它的结果就行了。然后这边训练完成了没有?好的,训练完成,它保存结果在这里。然后大家来看一下,在这里,这这一叉。 b 二, 我是训练 proson 这个人呢,要训练结果都在这里,你需要怎么下载到本地呢?很简单的,这里暂停,暂停,暂停点错了, 把它拖拽到这边就行了,这里就可以下载到本地了。然后这边也是一样,这边还没训练完成。奥特迪亚鲁服务器训练教程到此结束。好的,这里先关机,因为它是收费点,这里存完没?存完了就可以关机了。 然后这边呢,这边,这边还差几轮就训练完成。好的,先保存一下镜像 就填优酷就行了,优酷二六吧,优酷二六十一 v 八的都行。 我看一下我的镜像在哪里。 应该是这个, 到时候共享给你们。这里怎么共享出去呢? 这镜像到时候弄好再分享。这里先关闭。这里已经训练完成了,然后这里也是输出它的结果了,让我们把它的模型啊训练结果都下载下来,它是保存在 e x p 这个文件,把它拖到这里就行。 好的,训练完成了,然后本地也可以用的,本地用你刚刚训练的模型进行推理。在哪里呢?在 e x p 这里 保存的结果在这里,看一下。 为啥没有结果呢?因为我的模型不是检测人的,是检测家具的。我们拿另外一张看一下,直接去拿测试的数据, 直接复制一张, 然后把这个路径粘贴过来。 好的,你看检测成功。好的,全部教程到此结束。 然后训练中断的话,在这里看一下就行了。然后全部教程到此结束。幺二六幺二十一,幺二 v 八的改进,还有系统原码都在这个专栏目录里面,大家有兴趣的可以来看一下。如果这期视频对你有帮助的话,请点个小爱心,谢谢,下期见。

优喽 v 十三升级引入超图增强机制,听起来很高大上,对正在做优喽的同学有什么影响呢?在视频开始之前十年,行业老兵先给大家讲解一下 学习 ai 的 顺序,千万别搞反了,绝大多数自学 ai 的 人基础不牢,地震山摇啊,不是他们不努力,而是努力错了方向。你可以根据我这份学习路线,定制一个学习规划, 祝你两个月即可高效掌握 ai 人工智能,求职加薪不就来了吗?今天带你重新认识正确的学习方法。 v 十三当中啊,他提出一个东西叫什么叫做一个超图,什么叫做一个超图呢?就是,哎,光听这个概念, 你觉得这个东西你想不想看一看?哎,你再给我说加个注意力,我这个论文我连看都不看,但是你要给我提出个超图这个概念,我高低读一遍论文,我高低研究研究, 有意思,好玩。我们再说这个超图概念之前啊,我先给大家解释一个东西,叫做一个图结构。我们先简单解释解释什么叫做一个图结构,然后再解释个超图,因为 v 十三很难说实话,就是特别抽象这个东西。 我们先解释什么叫做一个图啊,嗯,我给你画,然后你来听一听的道理啊,这个东西可能有同学听过,他没听过,这都叫做一个图,神经网络。什么叫做一个图神经网络呢?我们先打给他,打开一个图,给大家画一画啊。图是什么意思? 既然说到一个图,那就是有点,还有边大家说什么叫做一个点,比如一个人,我是一个点,我说我有一个特征,我有个项链,我说那我说你也是一个点啊,我说你也有一个特征,你有个项链行不行?每个人都是一个点。然后大家想这个社会当中每个人他是独立的一个个体吗?每个人不是一个得力独立的个体, 你跟谁有关系?谁会影响你,是不是?那你看这个任务当中,假设我再画两个点,再画这个一个黑点,这一个黑点,好,大家来看,我说除了我现在有这个数据,有五个样本点,除了我现在有数据完之后, 咱们还有什么?还有一个东西叫做一个边,什么叫边边?就是其他点跟我连接连接关系啊。然后在这里大家来看,我们举个例子啊,我说假设,假设绿色这个点啊,说你对我有影响,蓝色这个点,我说你也对我有影响,黑色啊,对我没影响,有,这是我啊,有影响怎么办?其实我自己对自己也有影响, 有影响我就做加权,邻居给我什么影响?把邻居的特征考虑进来,是不是? 所以说图啊,大家听好图是要干什么?输入,注意啊,输入的是每个点,每个样本出土化的一个特征,输出的是什么?我们来看经过这个图之后,我说咱们算一组权重,随便写啊,零点五,自己跟自己,零点五,这个邻居跟我关系好一点。零点三,这个邻居跟我关系差一点。零点二, 输出什么?输出?合并指挥特征,零点五乘上自身就是零点五啊,零点五倍的什么?零点五倍的红色特征, 再加上什么?来,再咱们这么写,加上零点三倍的绿色这个特征,再加上什么?再加上零点二倍的这个蓝色的特征,得到咱们更新完之后这个红色点的特征。所以说图在做一件什么事,输入的是特征,输出的也是特征, 每个点的特征都在发生变化。然后问大家这东西跟注意力的区别是什么?来,大家先告诉区别。 注意力机制怎么做的?我们从给大家画一下,注意力机制有边吗?注意机制没有边,在注意机制当中,我问大家每个点要跟什么假设说我输入当中啊?咱们刚才说了有这么五个点,是不是注意力机制?我问大家怎么做的? 是不是每个点要跟所有的算关系?你是不是要跟每一个算关系啊?每一个都去算,是吧?但是你看现在我这个图当中,我是跟每一个去算的吗?我不是, 我只跟我有连接关系的去算。所以说图当中我问大家边是哪来的?两个答案吧,边,第一个条件人为指定的,第二个训练得到的。你想一想,图当中最核心的是不就是一个边?边咋来的 来,大家能不能告诉我这个答案?你能告诉我这个答案你,你就能大概理解什么叫做一个图结构了。我猜有同学想跟我说边 他是训练得到的,其实不对,边不是训练得到的,边是人为构建的,是我统计特性啊。比如说我就发现咱俩关系好,我就有这个统计特性, 我通过一些计算方式得到一些边,我自己设计一些边已知条件先验知识,还是我什么通过统计分析出来都行,但是你注意边不是训练的,边,是人为给定的 已知条件,是有点有边,我才能这个用这个边做加权,是不是?所以我一般来说啊,把这个边当做是一个鲜艳知识,已知条件嘛,就是个鲜艳知识,在有一个边是鲜艳知识前提下,我们做加权。那我问大家要训练什么? 要要训练是什么图啊?这个结尾要训练,训练是什么?谁跟我好,谁跟我坏?这是要训练的,这是要得到的一个值啊。有的跟我关系好,权重大一点,有的跟我关系不好,权中小一点,是不是?所以说训练得到什么?得到是个权重,再用训练权重做加权更新,我这个点得到的一个特征, 这就叫做一个图。好,然后呢,我们再来给大家想一下,就是你看优喽,大家说你讲这个图跟优喽有个毛关系啊?优喽是个图像数据,它里边又没有什么人的特征,我们简单来画一画啊,这都有点抽象,我简单给大家画一画, 你说我们特征图上有什么?有很多点,是不是?来大家看我这里边咔咔咔一列有这么多个点,哎,我问问大家,这些点,他们在一个特征图当中,我觉着他们能不能有点什么关系呢? 来,比如说我说这个点,这个点你可不可能跟谁有关系?另外一个点我说你可不跟谁有关系啊?当然有可能了,你说一个特殊图当中,咱能不能构建一些边啊?如果构建一些边,我是不是能强调强调一些关系的重要性呢?其实这件事理论是可以的, 但是咱们今天讲是什么?我们今天讲一件事,我们不是在说一个图,优乐 v 十三,他加了一个多,叫什么?叫做一个超图, 一个更高级别的概念,这东西怎么解释呢?什么叫做一个超图呢?我先给大家简单解释解释什么叫超图好不好?然后咱们再说一路当中怎么做的有点绕啊?因为一会我怕我不解释明白,你看代码看不懂,大概这样一个逻辑,就是假设啊,假设完这是一个点, 然后呢?这也是一个点,这也是一个点,然后这也是一个点,是不是?好,我说咱们之间有一些连接关系。好,我说这是咱们之间的一个连接关系,好比说在一个图结构当中,咱们有的人呢是互相认识的。 那我问问大家,在这里边,咱们现在是构建了完整的一个图结构,我这每一个点都可以干什么?每一个点哎,都可以去利用一些邻居的特征去更新自己,是不是? 这只是什么?这只是最浅层的概念。最浅层的概念是什么?直接按照边的连接方式做你邻居特征的一个加权。 但是大家想一想,咱们这四个人能聚到一块啊?就是能四个人聚到一块, 咱们高低地位共同点吧?就像是,就像,我给大家举我,我给大家举个例子,我们解释,我们分两堆,一堆打刀塔,一堆打英雄联盟啊,就是其实我们那年代,我们上大学那年代还很少还没出英雄联盟,我们大四才有英雄联盟, 我们就两堆,一堆就是大四的时候一堆玩刀塔,一堆玩英雄联盟。我们班那你想一想,玩刀塔这些人, 他们一定就是他们邻居之间会存在着一些关系吗?能不能有一个更高级别的概念。什么叫做更高级别的概念?我我我我开玩笑啊,你们别当我是嘲讽你们。我说玩刀塔的, 你的操作要求高啊,玩刀塔人聪明好不好,玩英雄联盟的人,那操作简单,可能小白也能去玩的。哎,我说能不能在这个基础上随便我提出来一些更深层级的含义呢?是不是可以做这样一件事,咱们四个坐在一起 不是简单在一起的,咱们肯定因为有什么共同的原因坐在一起了。那什么叫共同的一个原因呢?肯定是因为咱们有一些特征,是不是这些特征我们叫什么?就叫做一个超图当中所能体现出来的高级的特性。如果你们还没理解,我再问大家一件事, 你们看没看过电剧惊魂?兄弟们看没看过电剧惊魂?没看过的同学晚上睡不着觉一定要来两集啊,贼爽。电剧惊魂每一集都会有很多遇难者,就马上他们要挂了,他们会聚在一起,他们很懵逼,他说我们为什么会在这呢?随着故事的发展,你会发现 他们做过类似相同的一件事,要不然都做过什么伤天害理的东西,就是他们存在一起 不是一个偶然,是在他们本身有基础社会属性联系上,他们还有些高级特征,把他们聚合在一起了。能不能理解超土这个概念?你你你想想电影结合大家看没看过,其实我觉得挺像的,在这里边呢,就是超土啊。大家这么去理解,如果说咱们四个字在一起, 我能提出来一些咱们共同的特征,就比如咱们共同啊,我喜欢打刀塔,打刀塔人有什么特点?我们再推理推理,咱们聚在一起了,我们说咱们都喜欢打篮球,打见了篮球人又具备什么样特点?那超土的特征可能不是一个两个超土我可能会构建很多高级的特征, 我们先推理出来一些咱们可能一共同拥有的高级特征,推理完这些高级特征完之后干什么?咱们作为这个图当中的每一个节点,咱们可能都具备这个属性,那我说能不能咱们一方面在会集邻居特征同时,咱们再去平分 这些超图的特征呢?什么叫平行超图的特征?来超图,我算出来一些高级特征完之后,我再把算出来的特征给你这个红色点一些,给你这个绿色点一些,给你这个啊,给你这个蓝色点一些,给你这个黑色点一些。我们超图的目的是什么?其实本质来说还是要做一件事, 还是要把每个点的特征做更新,只不过说这回在更新的时候我们多考虑一件事,更高级别的特征有什么?然后大家说更高级别特征咋来的?我跟大家说学来的,一会咱们看代码就是学来的, 然后再给大家再说一个概念,就是超图啊,超图怎么样?超图,我们说咱们四个人之间可能具备着一些高级特征,不是有一组,可能有多组,什么叫做有多组高级特征?就我给他,我举个例子,就我媳妇, 我,我们上大学啊,我们媳,我媳妇啊,他们大学他们寝室有四个人,他们四个人有五个微信群,牛逼不?四个人,我看他们当时拉那个寝室群,我去,四个人有五个微信群,很离谱,是不是女生宿舍好像都这样 哎?那我那我问大家,就是他们拉了五个寝室群,那你想一想,我媳妇可能他在这个群当中充当一个角色,在另一个群当中也充当这个角色,在这个群帮着你骂他,在那个群帮着他骂你啊,就是可能是他干这种活啊。那你想一想,每个群里边 咱们学到的高级的特征是不是都可能不一样?但是这些高级特征回过头来是不是可能都会影响这个人? 那所以说你这个超图啊,我们要提出来特征,你们可以自己去定,我一个超图当中提四种高级特征,提五种高级特征,提六种高级特征,是不是都可以啊? 所以说这会先给大家解释一下,就是大概什么叫做一个超图,然后呢我们再来去看行不行, 我们再来看就是兄弟们能不能大概理解这个词吧,我相信我一说你肯定很懵逼的,因为可能图你也不了解,那说这个套图更更更懵逼了啊,你就当做一会我们要去在它基础的连接方式之上再学一种高级特征优喽,当做为啥调这一点优喽是在啊,他说, 他说呀,你们现在啊,都是只用什么?只用你用卷机,你想想卷机咔嚓一筐,咔嚓一筐,有什么高级特征吗?哪有什么高级特征啊?这一块区有啥特征算,这圈区有啥特征算? 都感觉什么像井底之蛙一样,没有体现出一种高级特性,只有表面特征。所以 v 十三,我觉得这玩意他有意思啊,他提出来什么叫做一个超土, 大概先给大家描描述这些东西,然后呢我们边看代码我边给大家分析,因为我觉得可能看代码叠起来更更简单一点先我希望大家应该有个比较朦胧的一个概念了,是不是?别着急啊?来咱们看代码,看看人家是怎么做这个事的。 我们先看一下他的配置文件啊,配置文件当中呢?呃,为大家简单看一下配置文件的,我看这是十三吗? 来简单看一下这个配置文件,配置文件里边我找一找,这呢配置文件里边唯一与众不同的,你看他多了一个层级,叫什么?叫这个 hyper ace, 这个就是优乐维三当中啊,他提出来新的一个模块,我们所谓的一个超图。那下面我们来看超图当中啊,他要输入的是啊多个层级,我给大家看,比如他把前面的三个层级的特征图, 可能是啊,他们的分辨率不一样的输入进来,我们就这个事来说一说这个超图他是怎么去做的啊?首先呢,咱们还是相同的方法进入到这个原版,为大家原版当中一行行捋一捋啊,因为我觉着就是 其他的结构啊,什么这个卷就那个卷,那太简单了,我不想给大家说了啊,咱们直接就看他这个超图模块是怎么去做,来看这个, 到时候大家你们定义到这个模块啊,就是如果说你们想去看原码啊,在这个还是在这个 block 点 p r 当中,然后呢有这个叫 hyper c e, 我 们在这个 地方咱们打上一个断点就行了,你看我这里边咱们是不是打上断点?好那么简单来分析一下第一步干什么?第一步大家来看,就是啊,我现在输入的是什么?我给大家,我给大家边截图边说啊,因为我不截图,他放大不了。 来,你看第一步,第一步大家来看,这里边他输入的啊,是不是啥输入的?你看就是三个层级特征图,但是这三个层级特征图啊,他是大小不同的,你要问我他为啥要输入三个?之前三个特征图,我就只能说他想综合的去利用这些特征。那怎么样把他们?他是要把他们做拼接,怎么做拼接啊? 最简单方法,你看这个零零是三十二,一会给大家看代码,对,三十二做一个下裁样,三十二下裁样变十六,是不是 八呢?做一个上裁样也变十六,所以说它是把不同层级大小要做一些上下裁样,上下裁完之后呢,它要再做一个拼接操作。来,大家点开看下这个代码,代码当中非常简单, 这步我都不想给大家往里跳了。这步非常简单,看一个什么,一个 down simple, 一个 up simple, 对 小的啊,对大的上裁样,对小的上裁样,然后干什么?然后把它 touch 一下,把它们拼在一起,是不是行了?这个比较简单啊,不打断点,咱们直接往下就走。 丹丹,你看第一步得到什么?第一步呢?你看我们输出完之后啊,是不是得到了一个特征图?来,大家看,这是我们特征图的大小,一一百二十八,十六十六。 好,首先呢,咱们通过这个方式得到一个特征图啊, tenor, tenor, 对, 跟你就当向量吧,没有大区别,他是在 gpu 当中的,然后再往下,再往下我们来看这个东西了,这块他写了一个分支,其实这个分支啊,就要去走这个超图的分支,我们重点去解释解释,就这个超图的分支怎么做的?他的核心的实现代码在这呢, 在这呢就是一个自适应的图结构的一个计算啊, a d a, 一个自适应的,然后图结构的一个计算方法也是在这个 bug 篇当中,你在这块也要打,也要先打上个断电啊。然后咱们看这个 flow 当中他是怎么做的?首先第一步啊,他说你这个超图针对什么去做的? 针对的是其中的每一个点,那你看现在我是一个点吗?现在我不是一个点,现在我是一个矩阵,有长有宽,是不是长十六?宽十六。那问问大家十六乘十六等于多少个点?十六乘十六,咱们是不是等于有二百五十六个点? 好,第一件事咱们任务当中我们现在是有这么二百五十六个点的。好,那大家来看这里边代码,代码当中他做了非常简单的一件事, x 点拉长,我问他二这个维度是什么?二,二,你这么想啊,就是 b c e h w, 它是不是把这个维度就相当于把 h w 做合并了?那么理解这个逻辑, h w 做合并了,是不是?然后呢?它又做了一个 transpose, transpose 啥意思?就是合并完之后 把他俩又做了一个,又又做了一个调换,是不是?那比如 bet 是 为一, h 是 十六,然后 w 是 十六,那你看正常时候乘数等于二百五十六,然后他又调换顺序,那是不应该是一乘,这就是 bet 乘上二百五十六,再乘 c c, 比如说他是六十四位还是多少位向量,再乘一个向量, 那你想一想,是不是给它展开成了一个向量?好,我们来指一下这个结果啊,其实蛮简单的,你看我们指一下这个结果, 截完之后呢,大家来看,我给它放大这个叫 token, 是 不是?然后给它放大,你看这个 token 是 我该说的一个一 bet, 然后长度呢?就是二百五十个点啊,拉成一条了,二百五十个点,然后每个点呢,它是六十四元的向量,对不对?没问题吧? 好,然后再往下,再往下,你看这一块,这一块就难了,这块就是他核心的一个计算逻辑,就是他的一个图结构,我们同样按住鼠标点,点住 ctrl, 然后呢,咱们去看一看他这个图,就当中啊是怎么做计算的,这就跟大家说,又到哪个类了?就到这个类了,这个类就是他,呃,整个的这个超图啊,最核心的一个实现的方法 都在这个类当中了,那我们就去看一看他是怎么做的啊?好了,我断点呢,现在已经给大家跳到这了,就首先第一步要干什么?第一步问大家,就现在我们说图啊,图最大的核心概念是什么?是有点有编的,但是现在你看我,我拿到手的是个特征图啊,你即便给他展开成一个二百五十位长度, 但是我说点有了编呢?我问大家编在哪呢?咱们好像还没有一个编的概念是不是? 那这里边你看第一步他这个代码干什么?你看顾名思义啊,他名字要干什么?去生成一个边是不是?好,那我们下面来看什么叫做去生成一个边啊?那我们点开,还是你自己 ctrl 找到他这个代码时间地方 就跳这个原码了?这个原码就是我们先要做什么去生成一个边啊?就首先得有一个边才能根据边做东西,是不是?来我们先往下跳,这里边看怎么做的? 他在做的时候我们先往下跳啊?就这一块我给大家来看这块,他走他走,这个分支就是我先给大家捋一下这个逻辑啊,这个逻辑是这样的, 就是你说我们现在要构建一个叫超图的东西,那这个超图他要描述什么特征呢? 超图我说是不是得有一个初实化的特征,然后再让这个特征去学呀?我们来举个小例,你看他做什么?你,你先想啊,就是我假设咱们家有四个点,好,红色一个,然后这一个就假设一个特征图当中有四个点,我们先拿我手的,然后说勾起一个超图,要说超图表示什么?超图,我说表示就是咱们共同 就共同,可能你也具备这个特性,我也具备这个特性的啊,让我说超图还要去学一学超图,学完之后再把这个特征分配给我们。那我问大家一件事,这个东西咱们该怎么办呢?一开始超图应该怎么做出式化? 我现在只有每个点咱自身的一个特征啊,那我说超图能不能通过一些统计特性得到基本的特征?咱们四个一个寝室,因为啥?因为咱们高考的平均分,咱们高考分数差不多,是不是?我说平均分能不能代表咱们四个共同的一个属性? 我说咱们都报考这个学校,都报考专业,为什么?你的爱好,你爱好这个,我也爱这个,他要这个爱好,是不是一个特征? 其实你想一想,在这地方我们能不能去统计一下?但是我们现在没有一些形象的可解释的东西,我们只有一些数值。所以说你看优乐维实验作者,他为了去先得到超图出土化的一个特征,他做了两件事,两件事分别是什么?都是统计的,第一步去求一个平均 dm 等于一是什么?沿着第二维度,第二维度是什么? bet 乘上,乘上啥?乘上二百五十个点,然后再乘上特征个数,是不是这块密什么意思啊?二百二百五十个点,求一个平均特征 max 什么意思?求最大的值啊?这里边求最大特征是不是?你想这是不是一个统计特性? 所以说啊,他是先算的一个统计特性,就是先当做咱们抄图的一个通知化,就像我说的一个平均成绩啊,或者咱们班的最高分,都可以表示咱们的一个小组所具备的一些信息,是不是?但你注意啊,这只是一个初步化, 一会这个特征其实是要去学,要去改的,但是他不是凭空来的,而是自身的一个统计特性。但是我觉着这里边发挥的空间很多了呀,你想一想人家 v 十三是不是只去我,我觉着虽然说我没想到啥,但是我总觉得少点啥,我觉得就求一个平均,就求一个最大, 是不是少点东西啊?能不能再求点啥呀?反正我没想到,你们自己想,你们可以给我说还能不能再求点啥东西?他非常简单,我给你们执行代码,你看求一个平均求到最大,是吧?然后我们看平均来,你看这个平均 求完之后二百五十六点一平均,二百五十六点一最大,那肯定得到一个值呗?得到六十四分量,六十四分量是不是?哎?两个都是描述,把两个六十四怎么样?把两个六十四拼在一起,到什么两个六十四拼在一起,咱们是不是可以得到一个一百二十八位向量? 所以说我们现在是有了一个出使画超图,出使画的特征他是什么?他是一百二十八的一个项链。好,但是你注意这只是一个出使画啊,就大家,大家代表啊,咱们可能都具备的一些特征,是不是 好进来,再往下,再往下,在咱们这个任务当中啊?哎,我说现在啊,咱们是不是只有啥?只有一个基本的出使画, 然后我再给大家说一下,咱们超图是有多少个来着?超图我说 不是说有一个呀,就像是我说我媳妇他们寝室四个人拉了五个群,那每一个群可能是一种特征的描述啊,那我说现在这样啊,咱们现在这一百二十八个,我说不够了,那咋办?你看这一块他做了一件事,我把我把这给他放大一下, 来咱们这边讲稍微细一点,因为这个有点难啊。来,你看,我给他放大一下,给大家说逻辑啊,就这里边我给你们看,你看他说啊,这块连了个全阶阶层,把这个一百二十八变成二百五十一特征一个全阶层。为啥你这么去想, 就是我现在啊,这一块假设说得到了二百五十六的一个向量,但是我说咱们做的超图不是一个,你看这块有个参数,就是超图的一个个数啊,超图的个数,这篇论文当中啊,他们选的是默认是四个, 那我说这样咱现在不是得到了二百五十六个统计的特征吗?好说咱们统计特征拆一下啊,说这是,这是一号的统计特征,这是二号的,这是四号的,我们现在就是把这个向量拆分成四种特征,为什么? 因为每一种特征一会呢,你可能要单独去学每个特征呢?你可能要去更新,更新完之后呢,咱们再把它分配出去,再分配给这些点。 所以这块他为了体现超图当中是有多种超图结构啊,而且要保证,而且他为了保证这东西是六十四的一个倍数,所以说他先把这个东西啊,他是要做四个超图,所以说他就一百二十八,先变成二百五十页向量, 然后一会呢二百五十个项链,它要切分成每一个,它是六十四维的项链,你就当做做了。现在你就这么理解,现在呢,咱们有四个超图,就是有四种高级的特征表示每一个高级的特征表示它是六十四维的一个项链啊,你就先这么理解就行了。好,然后咱再回来看, 在这个任务当中,你看这一块,这块就是你看人家自己写的参数,我把手往这一放,你看多少?他是不是一个四啊?好,我们来执行一下,执行完之后大家来看一下这个结果啊,看这个结果,我把这个再给大家截下图,咱们执行完之后再看这个结果, 来,这,哎,在这里边我看一下,来,在这边看这个结果,你看现在啊,就是我执行完之后得到他之后,你看他大有多少?一四六十四, 四代表什么?四就代表四个超图,每个超图呢?他是有六十四个 v 向量来表示他的特征是什么啊?然后再往下,再往下,咱们任务当中,呃,这里边他做了一件事,这件事吧,你听听我的理解, 你再跟我说说你的理解好不好?因为这个东西我不一定完全理解。对,我先给你们解释,你看我给大家框一下,就是我们刚才说那个六十四 v 的 一个向量 啊,它加右边了,它叫做一个 offsize, 叫做一个偏移量,反正我,我对这个偏移量,我给大家说说我的底气啊,它前面还有个贝斯,还有贝斯,贝斯是什么?我给大家举个小例子,你看这个贝斯,贝斯在哪来的?就是一个出就是基础的一个超图的特征,你为啥说这玩意有点绕你,我给大家看啊,你看它这个基础怎么来的? 基础的一个超图特征,它是出使化的,就是 n 点 per meter, 它是一个超图特征,它是一件事,它是个随机出使化的,是不是? 那我问问大家,你们,你们可以这么理解,然后你看他是这么想的,他说他呀,自己有一个叫贝斯出土化的,可学习的一个超腿特征,再加上什么,再加上个偏移量, 就是我们刚才统计的一些特性,分成四个,是不是?我是这么想的,我,我不一定完全对,我给你们简单简单说一说,我是这么想的,我说人家出土化的一个可学习的,什么叫做一个贝斯是不是出土外特征?然后咱们刚才做了四个,做了四个什么?就是四种啊? 不同的就是六十四维的向量,是不是每一个呢?可能都表示某一层面的一个含义,是吧?然后他把这东西叫什么?他把这个东西啊叫做一个 oversize, oversize 什么意思?他这边还要做个加法,这加什么意思呢?就是在这个超图啊,你可以当做一个超平面啊,就是你就不当超平面,在一个基础的特征前提下, 你说我加这个绿色的向量,那我说可能相当于什么?把我这个基础特征往一个方向做偏移,得到一个方向偏移之后的一个向量,就像是做一个投影, 然后这个蓝色,他说往这个方向做偏移 oversize 吗?不就加什么东西吗?往这个方向做偏移,得到另外一个维度的特征,这个呢?往这个方向做偏移,得到另外一个维度,这个还差啥色?还差红色,再往这个维度做偏移,得到另外一个维度的特征。 所以啊,大家可以这么去理解,他是自己呢,先设置了一个注意这个,这个是可学习的,这个红色不是,不是说随机数笔画完就拉倒了,他是可学习的,因为你说超图具备什么特征, 不是说光具备一个统计特性得到的,如果是统计特性的,那没意义啊,超图是要去学的,是要学更高级的含义,所以说他促使化了一个可学习的项链。然后他说啊,为了让咱们超图啊,这四个, 就是比如说我学了四种不同的超图,每种超图呢,都是能学到一些与众不同的东西,所以说他把这个叫叫 offsize 啊,就是叫 offsize, 什么意思啊?就是往不同的方向去学习,加上不同的东西啊,朝着不同方向去学啊,这样一件事。好,所以说最终学员是得到什么,学员之后其实还是得到了四种超图的特征。大概这样一个逻辑啊, 就是这块你先按着我的地来吧啊,因为这个论文道他也没有去解释这些东西啊,你就先按着我的地来,我觉着我理解的吧,我不能说八九不离十,但我觉着好像好像是这么个意思啊,然后再往下, 再往下,大家来看,在这里边就是他对我的输入,这只是去先干什么?我们先要去创建这个边,咱们先指着干啥?你注注意这个逻辑啊,我们说了半天,咱们先要去创建这个边呢, 我们是先做了一个超图的一个抽象特征,然后算了偏值像有四个超图的特征,是不是?然后接了还没完,大家再看这部其实没啥用啊,这部就是为你们放大一下, 这部就是把我的一个 x 我 给大家看,你看把手往这一放,这部就是把 x 又做了一个学习,这部没啥用,就是你看 x 呢,输入它是一个六十四位的向量,然后经过全阶层,它是不是输出还是一个六十四位向量啊?这一步其实作用不是特别大啊,然后再往下下一步,下边有点难了, 就是我们说在做这个超图的同时,能不能再把多头这件事引诱出来呢?多头这个东西,大家可能说注意力里面有,但是注意力里面有,是,但是我还要再做一件事,我给大家再画这个东西,我先画啊,嗯,反正这玩意,这玩意挺绕的。他这个代码大概这样一个逻辑,就是比如说你说我这一个点, 我们说呢,假设说啊,先把点画全吧,还是他们四个点,还是他们四个点,我再给大家说他们引入多头是干什么啊?就比如说现在对于这么每一个点来说,这块假设说现在就有,这么就有这么一个超土。 假如说这个超图更新完了,学完了,得到了一个很高级的一个特征,那我说是不是要把这个高级的特征分配给谁?分配给啊?就是你这个每一个点,是吧?那我就要知道你每个点跟我超图的关系是好还是不好?是不是要去学权重? 但是我问大家一道学权重这个事,你说咱们能不能学多组权重?什么叫学多组权重?我给大家举个例子,你看我说超图这个特征啊,咱这样,我说呢,把它拆分成两个行不行?左边呢?哎,就是超图这特征拆成两个,左边是一个,然后呢就是把这个特征一分为二, 然后呢他们分别去学啊,学完之后呢,就这样,我说红色这个就是红色左边这个超图就一个超图里边拆分成两两头 就写完,他不是两个多图啊,不是两个超图啊,是就像那个多头注意力,他是多头才有两个头,比如这个头呢?我说啊,跟你们算权重啊,可能是个零点四,这个头呢,可能跟我算完全重啊,他是个零点六,是不是每个头都可以去跟我算权重啊?算一个内积不就好了吗?然后我说哎呀,那我这个点, 我跟这个超图关系到底有多少呢?那我说这样,咱们把这个零点四加上这个零点六,两个头是不是再除以多少零点五? 所以说这个多头的目的是什么?我是这么理解的,他做多头是为了接下来我每一个点去算我能分配多少这个超图的特征的时候,因为分配多少就是一个权重项分配多少一个权重项的时候,为了这个权重项算的更准, 你想多投注意机制,每个投是不是只算了一种权重项?那他如果说算两组权重项,我把两组权重项做一个平均,是不是能结果做的更更稳定一点?大概这样一个含义啊,就你们先这么去理解好了,然后咱往下回头看, 在这里边,这里边你看一下人这个代码啊,人这这代码做了一件事,就是你看这个 bug 啊,比如 bug 是 为一,然后 n 呢?比如说二百五十个点,这两个是不变的,然后多了一个东西,多什么?多了一个 hs, 然后每个汉字当中它是有一个维度的,我给大家简单看一下,就是你看一开始我给大家先看啊,你看这个一开始啊,我给咱来做个对比 来,你看这里边,一开始你看我给它放大说咱们的输入就是没做多头之前,没做多头之前呢?它是一啊,就是拜师,然后二拜师的点,每个点它是六十岁向量,是不是好?这没做没做这个多头之前啊,然后你再看,做了多头完之后,你看看它是啥? 做了额头完之后,其实我觉着还是很简单的啊,他这块,他这块我看是几头啊?我给大家看一看啊,他是四头吗? 啊?我说错了,这是四头啊,我给大家看一下,不是两头,他这个样当然是四头。我再给大家看第二件事,我们来给大家再粘贴一下来,嗯,对比看这个东西,我们看输入啊,输入什么输入呢?是啊,二百五十六乘六十四,是不是?你看输出,假如说做四头,做四头沿着把哪个维度切开了, 你看是,原来是一二百五十六,看,原来是一二百五十六,六十四,是不是现在呢?是一四啊?四种是不是每种是十六?所以说他就是把这六十四为向量给他切成了四个,每一个单独学特征,学完特征之后呢,我再去算什么?再去算 你跟这个点的一个权重项,然后比如说算出来四种权重,四组权重。我说一会咱们要做一个加法,我们再除四就等于什么?就等于最终实际得到的一个权重值啊,大家这样一个逻辑能理解吧?好,然后我说这是什么?这是对我们的输入啊, 对咱们 x 做了一个多头。哎,那我再问问大家,就是啊,其实其实等于咱们俩都做你,你把我们刚才当做是对那个超图做的多头也行, 然后你把我们该对的东西对 x 做多头也行,其实他俩是配套的,就是带这样一个逻辑,我给你重新画一下,我就拿一个点举例子了,就是比如这是一个点, 然后呢?这是一个超图,然后这一个点他是有这么一个点的一个特征,是不是?我们刚才是不是把这个超图咔咔咔切成四个四头?是不是他是四头。 那你觉着我的输入,我的 x 每个点的特征是不是也要干什么?咔咔咔也做四个头,做完四个头之后怎么样?咱们讲究一件事叫一对应, 你俩去算一组权重,你俩就算内积呗?权重你俩去算,你俩去算,你俩去算,然后这样是不能算出四组权重,四组权重我们再求一个平均是不可以啊? 所以说就这一块,就这一块,这一坨代码在干什么?在做多头啊?就是把它的特征切分成头数,乘以切分完之后特征这个个数,这件事能理解吧?兄弟们,好了,这块咱们干什么?这块我们在做,做,在做这个多头这样一件事啊,这一些代码 我们就看到这了啊,就给你们解释一下,然后你们自己抵 bug 一 遍,你想你们看懂的,然后你说算完这个投完之后进来干什么?给大家看这个代码, 我们说切完之后干什么?是不是要算内积了?刚才我不是说,比如说就对对,这句话说的好,叫分头行动,就是分头行动啊。然后你看现在这个 x 也切成 x 害子,这个这个叫什么?这个超图害子 是不都有了?那我说你们各自算内积呗,各自算内积之后能算出几组内积?我们来折一下这个结,我给大家看一下。接下来他算这个内积,我给大家截个图,然后大家帮我分析一下啊, 大家帮我分析一下。你看看这里面东西他表达的是什么含义啊?来,大家先帮我看。呃,我们先来看一下就得到,就是我们去完内基之后得到了什么?这个老铁得到是什么东西?他是一个四,二百五十六四,我们简单分析下好不好?我们简单分析一下,就是第一个,我先问问大家这二百五十六四是什么东西? 呃,这个都有点照,大家听我来解释,二百五十是什么?我们现在是不是有二百五十六个点?我们特征图是十六乘十六的,我拉长一共是有二百二百五十个点,是,对吧?然后我说咱们是有是不是有四个超图? 我给大家画一画,这就是二百五十六个点,然后上面咱们说是不是有?咱们是不是该说做四种超图啊?就做四种高级的特征呢?来假设这有四种高级特征,那我是不是得去算一算每一个点 跟这个超图跟高级特殊之间的关系?你跟他算,你你们,你这个,你这个超图跟每一个去算,另外一个你也跟每一个去算。 那我问问大家,咱们得到矩阵多少?多少?啥是多少?这是二百五十六,这是四,算他们的一组关系。那是不是二百五十六点跟每一个超速的关系?跟每个超速权重是二百五十六乘四,对吧?前面还有个四是什么? 记不记得我们说了一个多头,他这个头也是四头,四头是不是有四组这样的权重?能不能理解?是不是四组这样的权重?每组是一个二百五十个点和四个高级特征之间的关系? 哎,是不能理解扎这样逻辑了。好了,来,这是我们算了一组关系,算完这组关系之后干什么?算完这组关系之后啊?来大家看这一块,这一块呢?他又做了一件事,又求了一个命,在这个的麦真等于一,这个维度求了一个命,这个维度是啥?这个维度是不相当于我,我给你们看结果吧。 来,咱们再去看这个结果。求完之后大家来看,刚才我是,刚才我是几个头来着?刚才我是四个头,是不是四个头每个头都有关系,现在我把这四个头求了一个平均就好。说的咱们是不是得到一组平均的一个权重?平均权重得完之后,我问大家,现在咱们得到了什么? 大家告诉我这二百五十六层次是什么东西?我们说图啊,图讲究什么?图不是讲究一个连接关系吗?他现在就构建了一个点和高级特征,我们所谓的超图之间的关系。 这个关系你可以暂时当做一个边,他跟图身网络当为,他跟图身经网络当为边。不太一样啊,他是这样构建一个边的,并不是人为去构建的, 它是这样算了一个关系好不好?来,大家能不能去理解这个逻辑?然后再往下来再看,回头底大一遍代码吧,我先给大家讲方法, 再往下它做了一个 sort max, 什么意思啊?你刚才得是 lodges, 是 一些数值,是一些内基值,我把它变成全中项是不可以。好,这一步钻咱得到什么了?来,咱们回来这一步钻之后来跑完了这么一行代码了。 这行代码咱们来看输入是什么?来捋一捋,输入的是一个特征图,经过这样代码我们产生了一个边。什么叫做一个边呢?在超图当中,边就是每个点跟我高级特征之间的关系,我高级特征这里边做了四个,我的点有二百五十六个,所以说它是一个二百五十六乘上四的一个矩阵, 这件事,对吧?是不是得到二百五十六乘四的一个矩阵啊?好了,来,再往下,再往下问问大家, 就是我们现在有了这样一个矩阵,表示每个点可能跟我超图之间的一个关系,我们再来画啊,你看咱们还是画这四个点,每个点跟我超图的关系啊?我说现在都有了呀。那我说我问问大家,最开始我这个超图什么?最开始我这个超图的特征是怎么算的? 最开始我只是一个统计特征算出来的结果,你觉着是不是不准?什么叫统计特征算出来结果?哎,我觉得这样,我说咱们班,咱们寝室啊,平均分多少?有高分有低分啊,你是前进了还是拉后腿了?看不出来啊? 那我说这样咱们现在是不是有权重了?来,咱来看,在我们任务当中啊,咱们先促使化是什么?你可以这么理解,就是我促使化的是每个点的特征,二百五十个点,每个点都有特征,然后现在咱们算出来什么了?是不是每个点跟这个超图的关系? 红色这个点咱们就画一个超图啊?红色这个点跟这个超图关系,蓝色跟这个超图关系,这一个跟这个超图关系,这一个点跟超图关系。咱们第一步算这个 a a 不 就是二百五十六乘四的矩阵吗?一个关系。那既然有关系,我问问大家,咱们能不能用这个关系去更新一下这个超图特征啊, 这是个零点四的权重。不就是权重吗?这是零点一倍的,这是零点一倍的,还差多少?这是个零点四倍的。 我说夏某做加权,零点四倍的。啥?零点四倍的?红色这个特征再加上什么? 再加上来?我写权啊,零点一倍的,想想是是不是这个点蓝色特征,再加上多少?零点一倍的这个黑色的一个特征,再加上零点零点四倍的这个绿色的一个特征。这样咱是不能更新一下什么 我们实际的一个超图特征,就大家看这样代码,这样代码它在干什么?把这个 a, 把这个矩阵,就是我们的关系呈在哪分配给 x, 分 配给 x, 相当于什么得到超图更新之后的特征,就从算超出的特征,这就不是一个统计特性了啊,就是谁占多谁占少,实际要看更新之后的是不是 来,大家看这个结果,这个结果等于什么?我们来看这个矩阵大小啊,更新完之后就是我拿这个矩阵再做了更新,你看咱这个矩阵维度变成什么?拜师,不看了,这是四,我们该说超图是不是有四个? 四个超图每个超图是六十四为向量,是不?更新出来结果了,你不用看后面那零啊,这是因为我们第一次提问是零,后面就不是了啊。好了,这是更新完之后的特征,结果是不是?好,那我们先具备一个超图特征,我再问大家一件事,就是我现在 有了一个超图特征完之后,我这个超图特征要不要去学一学?你觉得超图特征他就这样就拉倒了?不是的,我给大家看怎么体现出来他去学的, 来,大家看,现在对这个 he 就是 我超图特征,我又连了个圈阶层干什么?让他去学?学什么样的超图特征更合适的还是得到六十岁向量, 但是这一块他有什么?这一块他有学习的过程,是不是输入六十四页,向量输出也六十四,但是他是经过去学了,得到了一个新的学习完之后的特征,能不能这么理解?哎,我再问大家一个逻辑,就是学完之后这个特征咱们要干什么? 我们优老师为了学一个超土的特征,还是为了现在把我们当前腾出来的特征做一个更新,把它更新的更好呢?你想想我们要的是什么?你再看我们下面这样代码, 像这样代码,大家来看这个逻辑,用 a 乘谁 a 是 不是一个权重? he 是 什么?学好之后的一个超图特征,那现在我要做这样一件事了, 我投资的超图特征已经学完了,现在要给我回报了,什么叫给我回报?来,大家看刚才啊,咱们是不是说我的超图特征啊?就像是刘强东,刘强东咋样?人家相以相亲的,给他凑个鸡蛋, 每一哥们凑鸡蛋,你凑四个鸡蛋,他凑八个鸡蛋,现在刘强东学成回来了,他说你是报答大家了,咋报答大家?你给我四四个鸡蛋的,我给你四个别墅,你给我一个接蛋的,我给你一个别墅,是不是?所以说这块大家来看 我们还要干什么?还要把学之后注意这 h e 是 学之后的操作特征,再通过权重从新的分配给我每一个点上, 你看,那比如说刚才咱们这个权重五遍啊?就刚才你给我贡献多少?刚才比如你贡献零点四,你现在还是零点四,是不是我给你返回来,我把特权给你返回来,让你去加上我这零点四的,你给我贡献零点一。我说我现在学,学成之后给你返回来,这个我也给你返,这个我也给你去返, 你看这一块是不是又把我们这些特征返回给谁?按照你看这个 a 变了吗?大家看前面这个 a, 后面这个 a 变了吗? a 没变,所以说权重是不变的,之前你怎么给我贡献的,现在我怎么给你返回来,得到一个 s 六,我们来看 s 六是什么?来,咱们直线一下,直线完之后我们来看它矩阵的一个维度啊。 矩阵的维度多少?是不是跟我们刚开始一开始的矩阵维度是一样的?来,兄弟们看,在我们这里边来,你就这个逻辑,现在变成什么?一二百五十,二百六十四,是不是我的输入其实也是这样的大小啊?但是现在他是经过超图完特征之后分配回来之后, 你该拿多少?你更新作为特征多少?那这一步算数是不相当于每一个点都分配到了一个高级特征啊? 然后他说他对这些高级特征干什么?再去做一个学习。你看这一块,这一块我给大家简单说一说啊,不截图了,他又成了一个六十四乘六十四的一个全连接矩阵,再把这特征学一遍,最后怎么样?他说你超图学到了一些高级特征, 高级特征呢?我们说咱们加过来吧, x 原始什么样? x 原始啊?是是个,就是没见过什么大市面的,他是咱们原始的特征, x 六呢,是见过大市面的超图分配回来的特征。 把泰亚加一起,得到我们更新完之后学的特征,可不可以来,你看最后返回泰亚做了一个加法,这件事做完之后干什么?这件事做完之后咱们的故事就讲完了,这块就给大家说了一下,就是你看啊,这个 u 微实验当中啊,我觉得我觉得这个东西吧,起码是值得去讲的, 毕竟这个东西啊,在其他地方很少见,是不是?我觉得毕竟还算是个有有新意有想法的东西,他加上了这个东西吧,你看他加,他在这个害子层当中加上,我记着是两个吧,他这一块加了一个,还有什么地方 还有什么地方去加的,哎,好,就就这一个吗?那你就当就这一个吧,他就在害子层这块加了一个,就加了这么一个层,咱为大家从头到尾是不是抵 bug 的 一遍,就是基本的一个逻辑啊。 好了,这给大家看了一下,就是优乐 v 十三啊,他又做了什么事?然后他说下面还有一些层呢,哎,这些层我觉得不用我说了,你看他又加了一层,他说这个词我没见过,没关系啊,这个词你没见过,你到这个 blos 当中,你去搜一下这个东西,这个我不想讲为啥,这里边他就说加了一个门单元,哎呦我去,这也能成为一个创新点啊, 就正常两层去拼接啊,拼接做加法加呗,他不是看是加法之间怎么样,设计了一个可学习的权重参数 啊,这玩意我觉着没啥意思,咱就不讲了,就是他额外一设定门单元,他在做拼接的时候,你可以说当做一个小串音点吧,多了一个门单元成什么东西,怎么去加?自适应调节好不好? 好了,这是给大家去梳理了一下,就是优乐 v 三啊,优乐 v 十三大家能不能听懂?我不知道大家能听懂他有多少,可能第一次听这个概念稍有点抽象,但是有问题,当时其实我在看这都有点想, 如果超土这个概念能火起来,为什么很多其他地方没用到呢?所以我就在想优乐威十三这个东西啊,因为,毕竟,因为,毕竟这东西刚出啊,刚出才两三天,是不是也没有太多的实验结果? 至于这个东西啊,到底是好是坏,那就等后续大家咱们自己做实验吧,自己来去玩一玩。现在不敢说呀,因为没没几个人跑这个东西啊,刚出的优乐威十三, 我也是刚拿这个原码,刚拿原码我就花了两个小时时间,我去抵 bug 一 遍,就大概能理解这个逻辑,只按照我的想法给大家去理了一遍啊,然后大家呢,你们有时间干什么?咱们可以跟我一样按照这个方法,就是你们看到什么东西不理解,反正我不知道我的思路啊,对大家适不适用。我不太喜欢看论文, 我觉得看论文更烦,说那玩意我喜欢直接看原码,然后我去寻思,我这是特别喜欢自己寻思哈,我就边寻思边猜这个事大家干什么也可以去抵吧抵吧这个原码啊,行,这个 v 十三吧, v 十三跟 v 十二相比,我觉着可讲的东西它就也就这么一个点吧, v 十二确实没啥可讲的,它就是一个注意力。好吧, 行了,那咱们今天内容基本上也是给大家从头到尾去串了一遍优喽,其实我觉得优喽啊大家你们后续想复习啊,你就听我给你串一遍这个东西大概点就有了,你也可能也不用就是把咱所有优喽系列从头到尾刷一遍,因为从到尾去刷啊,确实可能有点太累了,需要学的东西太多了啊。 行了,然后最后给大家答疑吧,大家看还没有啥想去了解的东西,感觉像川普上 q 也不完全像 q 啊,就抄手这个东西吧, 反正论文是这么说的,他说这个优乐当中啊,你光去图像当中提特征,缺少了一些高级的特征,缺少了一些高维的特征,就是很难去理解到底什么是一个高维的特征啊。所以说他就大概这么描述的,有一些更高级别的特征, 可能咱们之间都有关系,那先用咱们之间的关系当做触制化,然后就像是啊,我们先给刘强东凑鸡蛋啊,就拿我们的统计像,像像能拿出多少拿多少,先给刘强东凑鸡蛋,凑好鸡蛋之后他去学, 他学成之后他回来跟我分东西啊,就这种这种感觉,其实能分什么东西,全看他学的怎么样好了, 兄弟们。行,那咱们大家没啥太有问题吧,把这个优酷系列啊,回头 v 十三啊抵 bug 一 遍吧,也是值得大家去学的,因为大部分都都一样。你看前面有啥东西没相同吗?我觉得前面没有啥看不到的东西啊,都跟以前没啥太大区别,就多了一个概念是吧?行了,然后咱们今天内容基本上就到这了, 源码理解怎么实现?不用背下来这个源码背它干啥?你,你能背下来?你厉害了,你现在写代码?说实话我写代码我也会用 ai 辅助工具啊。懒了,有 color 有 大模型,谁还自己咔写啊。我一般就自己改, 我估计大家以后的工作也如此,都是去改结构。可能不是说你站,除非你要当走在技术最前沿的,要不然大概率是改结构套开项目去改去调,你说开项目去改去调,现在卡瑟多厉害,你这些东西基本都能去调都能去做的。十二十三只能做检测吗?都能啊, 十二十三就是从优喽 v 五开始他就啥都能做了。他,你看这个十三啊,这个十三他不是写了一个新的代码,十三是在这个包里边去改的,他还是用这个包啊?他只不过说加了一个模块,十二也是加了一个模块,十二十三只是加了一个模块, 他还是优设,这个包不变不变,只是加了一个模块而已,优设这个基本大框架谁也动摇不了的,也也没有这个能力 啊,说自己开发了一套新的原码,这个太难了。行了兄弟们,咱们今天就到这了啊,后期有时间把。尤洛系列可以再看一看。我觉得毕竟是经典。经典东西啊,其实不管你用不用一定要会面试,你们听没听过一件事,你连尤洛都不会,那你说其他的我能信吗?原码好好看一看。好吧。

今天呢,我们再次邀请郭喜,是我们团队当中的德胜川好工程师,在此来跟我们分享关于优柔二十六啊一些新特性啊。今天呢,主要是想来分享一些在应用场景或者在应用层面的啊,关于优柔二十六的一些新特性 逻辑公式。我觉得二十六的应用场景其实主要分为三大,第一个部分是就是一些 arm 的 边缘计算的一个设计,第二个的话其实就 第二个的话就是家用的或者是工业上的一些摄像头。第三个的话就是航拍或者是无人机去检测一些微小的目标,嗯,就是说在小目标方面的话, volvo 二十六也是能发挥出来它一些新特性,可以这么理解吗?嗯, ok, 那 么我想在让大家总结一下,无论是在应用层面也好,还是在技术层面也好 啊,就谈谈你心里面的想法,就优乐二十六在应用层面都有哪些这个新特性,优乐二十六在应用层面更倾向于面向一些小目标,还有一些就是批量的一个部署,就是批量边缘设备的部署, 保持在这两个方面。 ok, 行,非常好,那我觉得优乐二十六还是值得期待的,所以呢,我想尽快 把这种新技术啊融入到我们这个新发布的产品当中,能给用户给大家带来更好的体验,我们再次感谢 boss 给我们带来的分享,好,谢谢。

大家好,今天呢,我们非常荣幸能邀请到我们四中宿科核心算法工程师郭喜同学来为我们大家做一次分享。优乐二十六和优乐十一啊,到底有哪些差别? 下面有请郭喜。优乐二十六相比于优乐十一,它其实有三大优点,第一大优点是它的部署也变得比之前更简单了。 第二个优点是 cpu 调用时的速度会比之前要好,它的实时性会更强。然后第三个优点就是它提供了一个训练的范式,因为它是从 kimi 那 边学到的一个训练的思路。 ok, 我 打断一下,你说的那个 kimi 是 咱们中国 那家公司吗?对,是月战面训练的。 p m p r。 哇,那太伟大了啊,那我想问一下,就是去掉这些技术之后,优路二十六有哪些新的创新呢?因为你刚才说已经去掉了一些东西,是为了保证速度吗?是为了保证速度和部署的一个简变性。 ok, 啊,那我想知道他比如说把那个 mms 去掉之后的话,对整体性能会不会造成影响,还是说他用了哪些新的技术进来? ims 的 话,你可以想象你再开一个新闻发布会,下面有一百个记者, 对,你如果不去,就是你如果使用这个 ims 的 话,就相当于是一百个记者都会分别向你提问,你需要一个一个去回答, 或者是去过滤它的一些,就是去过滤一些问题来回答。然后但是你去掉 ims 之后的话,就相当于是所有人就只有一个人能 提出这个问题,相当于是把所有人的问题整合到了一个,所以它的速度会变快。 ok, 你 这么说大概理解了。 好的,那我们非常期待能把些新的技术融入到我们产品研发过程当中来,给用户和大家带来新的体验。今天我们非常感谢郭喜给我们带来的分享,谢谢大家。