粉丝7205获赞4.1万

今天教大家用这个麦卡来制作 oc 曲线,那么我已经把数据准备好了,分为是指标 a 和指标 b, 指标 a 和指标 b 在我这里是通过实验测出来的数据, 这个第三列的是主别主别,我分为零和一,其中零表示正常组,一表示疾病组, 所以我们先要把数据像我这样准备好, 格式不要错了,要分成几列。 就是要注意的是分组作为 单独的一列,最好用零和一表示,而不要用其他一或二表示。我们现在开始分析,点击这里看到下面有个 oc 曲线, 然后点第一个 oc 曲线分析, 然后在变量这里选入我们想要分析的指标,比如我们先看一下指标 a, 这里选入分组的情况,下面有个蓝色字体,这里点开, 他默认就是零和一,所以我们刚才建议是要用零和一,他这里也说了,一表示阳性 的或者异常的、病例的,零的是阴性的,健康的或者正常的,我们点击 ok, 默认,其他的选项也是默认,就可以点击 ok, 这样他的结果就出来了,分为两个框,一个框是具体的数据,一个框是图片的展示。 我们先来看一下这个详细的数据,这里可以看到他的 auc 是零点六八一, 然后这也是他的百分之九十五自信区间,他的批值 是小于零点零零零一的, 这个是他的最佳的一个预知, 然后这个最佳的玉值对应的灵敏度是百分之六十五点八二,特异度是百分之六十五点四三,我们最常用的就这几个数字, 然后我们再看一下图片, 这个指标 a 这里可以,我们可以删掉, 有这些横坐标、重坐标,他都是给出了默认的注意在这里,因为他的横坐标 是二十、四十、六十到一百这样的,有的文章他是用零点二、零点四表示, 所以我们这里也是一百减,这个退一度 建议要加个单位,也就是百分号,同样这里也加个百分号, 这样子就会更加严谨一点,因为比如二十,这里有个单位表示百分之二十, 如果这里是零点二、零点四,那这里就应该是改成一减退一度, 有这些数字的格式都是可以改变的,我们双击一下, 这些都是可以改的。如果想改变字体的大小,不用双击,单击一下就选中他,然后这里可以选择,字体的大小就会变了,不要加粗也行, 这里也是可以改的,这里可以进行修改内容, 比如我想加上 灵敏度、特异度, 他这里就会展示出来,当然我这里就不加了。 然后这个 蓝色线条跟红色线条的格式也是可以改的,双击他有改成这种蓝色, 要不要那么粗,你看就会改了。同样的操作,点击红色的, 比如换一种颜色,把它弄粗一点,这样就可以了。 我们可以在这里输出图片,这里有好几种格式,可以选 tf、 f 或者 jpg, 或者是其他的格式, 这里我就不示范了,这些操作都是非常简单的, 那么我们再回到这里,那么如果我想把两个指标在同一个图片里面, 就是把这两个指标放在一张 oc 曲线的图片里面,怎么做呢? 我们还是选中这里,然后倒数第二个有个凹凸曲线的比较, 我们这里可以同时选用多个指标,把指标 ab 都选进来,这里同样是把分组的情况选进来,点击 ok, 这样就会出现两个指标的哦,是曲线的,而且 这里数据可以看到,指标 a 的 auc 是零点六八一,指标 b 的 auc 是零点六零九。那么显然从图片也可以看得出来,蓝色的是指标 a 的, 他的曲线下面积要比指标低的要更好一点。 具体的这些修图我就不一一介绍了,刚才已经讲过了。还有一种情况就是我要把指标 a 和指标 b 合并结合成一个新的指标,作为预测的一个指标。怎么做呢? 我们先在 这里选择 logistic 回归分析, 这里还是选用分 分组的一个情况,那这里选入指标 a, 指标 b, 这些也是可以选择默认的就可以了。点击 ok, 我们直接拉到最后面,可以看到把这两个指标合并成一个新的预测指标之后,他的 auc 稍微提高了一点点,是零点六九五, 这是他的百分之九十五之间区间。然后我们点一下这个左边的蓝色字体保存, 这里可以重新命名, 你看这里就会自动生成新的一列,就是一个新的预测指标,这个新的预测指标是综合了 a 和 b 的 形成的一个新的预测指标,如果你只是想单独展示这个新的, 那就直接在这里选入就可以了。如果我想把 a 和 b 还有新结合的这个新的指标三个放在一起, 那还是用刚才这种方法,用 comprove, 是这里 选用指标 a, 指标 b, 还有这个两者结合的指标 i'm okay, 这样子他就是有三条曲线,包括指标 a 的、指标 b 的,还有两者结合的。当然 其中的细节我就不一一再重复说了。好,今天的视频到此为止。

已经经过临床检验确诊他已经是患了某种疾病,那么你选取了某些数据,然后呢?你通过这些数据的检测啊,分析啊,你就可以得出来 这个这个指标对这个疾病诊断的意义和价值。那么当以后类似的患者,他的某个指标达到了一定的值的时候,那么他就很有可能患这种疾病 啊。所以我们这个状态变量,也就是我们在我们今天的这个示范的数据里面损伤情况,他就是要么损伤了,要么没损伤,那么隐身到你们的研究里面,就是 他要么患了某种疾病,要么没有患某种疾病,是不是好损伤情况就是状态变量,然后状态变量的值就是我们以一为参考哈,就是 发生了器械性损伤的患者,就是一嘛,我们刚才这里对这个就是一,对不对? 然后我们的营养评分啊,白蛋白、血糖、气血作用时间等等其他指标,你的一些生化指标啊,然后就是我们的检验面量选项卡里面的,基本上就是默认的,不用管啊。然后我们把这个对角线, 然后标准物还有那个曲线的坐标点勾选上,点击确定就是发生的器械性损伤的,大概有一百零三个人 啊,没有发生气性损伤的有七十九个人,这个没有什么意义哈,就是看一下,让你看了解一下本次数据的具体情况,那么具体的就是我们这个 ioc 曲线图这个蓝色的这条线,这个是蓝色吧,我应该不是色盲, 蓝色的这条线是营养评分,营养评分,哎,为什么没看到?他可能就是和某条线重合了,他估计就是没有诊断价值吗?那么我们看这个白蛋白就是这条绿色的线,绿色的线你看到没有?就是总的来说,我先给大家看了的哈,就是说 我们的这个线越靠近左上角,那么就说明我们的诊断价值越大。如果在这个对角线的右侧啊,就是在右下角,那么说明我们的这个指标对我们的诊断没有任何意义啊, 没有太大的价值。所以你看我们的这个白蛋白,他基本上就是在这个黄色的对角线右下侧,是不是好,他基本上就没有什么意义了。器械作用时间他也有一部分在这个黄线,就是对角线,这条黄色的是参考线,看到没有?我们的这个 细节作用时间他也在我们的这个左左上角啊,有一部分,右下角也有一部分,所以他对我们这个 是否发生器械性损伤啊?只只能因为这个数据我改了的哈,就是说他没有任,没有意义不是很大,但是这条血糖的话,他相对来说,相对来说他在这个参考线的,那么他相对于其 几个指标来讲话,那么他对于这个器械性水啊,有一定的参考意义,但是 越高越好。第二张表哈,就是我们这个曲线下面积,你看我们这个营养评分是零点零零零好,他可能就是和这条线重合, 应该是这个样子啊。然后我们的这个白蛋白他有他,他是这个面积,是曲线下面积吗?就是他这个曲线下面积, 白的白是绿色的,这条线看到没有?我们的这个一半面积哈,是零点五是不是?那么你看他很明显小于这个一半的面积,他的曲线面积他年他只有零点四一六啊,这个零点四一六是什么呢?也就是说他有百 百分之四十一点六的概率可以预测,就是通过白蛋白有百分之四十一点六的概率可以预测出这个患者是否会发生器械性损伤啊,同样这个血糖就是有百分之六十四点二, 你如果只观察血糖这个指标的话,你可以有百分之六十四点二的这个概率,能够预测出这个患者 会发生器械性损伤啊,至于他的血糖大达到什么什么指标呢?他他可能会发生器械性损伤,这个就是我先给大家说的阶段值 啊。嗯,关于这个阶段值还有这个约灯指数需要配合,这个约灯指数还有特异性敏感,敏感度有关啊 啊,如果有想要了解的朋友呢,你们留言啊,我后面会给大家分享,今天主要就是给大家讲解一下这个 ioc 曲线图的绘制啊,以及结果解读啊,谢谢大家。

哈喽,大家好,我是宋哥统计,今天呢在公众号的后台有一个人呢问了一个 roc 曲线诊断的一个问题,我觉得非常有意思,所以呢特别呢录制了这一个 roc 曲线的番外篇。那么 roc 曲线呢,我们在前期的课程呢都已经讲过了,它是非常简单的一种诊断线 诊断一直发现的一种方法,我们再演示一遍给大家开来看一下。我们点分析去寻找到 lc 曲线啊,松哥用的只是二十六点零,二十六点零的 lc 曲线已经不在分析里面了啊,二十六点零的 lc 曲线已经不在这个主菜单里面,在分类里面 里面啊,他有个叫 lc 曲线,并且他还增加了 lc 曲线的一个分析功能啊,比较强大一点点,可以进行的一个组间的比较。以前呢, lc 曲线呢,只能够做出他们的曲线的曲线,下面的一个 lc 和他的百分之九十五可以区间,但是对不同指标的 lc 之间的面积啊,没有办法来进行比较,我们通常是借助别的软件做了,但是呢, hps 在二十六点零呢,可以实现了 lc 曲线,不同的 lc 曲线呀,面积的直接那个比较 ok。 话不多说,我们来看这么一个案例, 比如说我们来诊断一个身高和一种疾病状态到底有没有什么关系,我们把 多一点,让大家感受深一点,把这个疾病状态呢,他定为一,一是疾病,二是没有疾病,所以状态值呢是一。 然后我们把相应的三个值勾选中之后了,我们直接点确定了这个 lc 曲线就做出来了。我们发现身高和体重对于这个疾病的诊断的一个消毒还是挺好的,是不是?而且身高呢,他这个曲线的面积应该比体重要更大,哎,这是我们通常所做的,但是 啊啊,顺便再把这个解释一下吧,我们可以看到你看身高和体重,他们的曲线下面积,哎呦细 哎,就是艾尔瑞亚昂德克五啊,他是身高是零点九三六,哎,体重了零点八幺幺啊,然后呢后面是他的一个什么标准物,我们知道这两者有一定的相差,但是差别到底有没有同居异议呢?哎,这个 是不太清楚的,然后可就可以通过下面这个灵敏度和意见特异度了,我们去计算出他的一个正确指数 对不对,然后就可以进行一个 lc 曲线,找到正确的一个诊断机制,貌似没有问题,但是呢,有一天啊,突然有一个问题, 就是后台啊有个问这样的一个问题,就是他说了说完描述这个问题之后呢,我就随机模拟了一个,就为了实现他讲的这样的东西,我又模拟了一组数据,他是研究艾滋病和 cd 四的啊, 如果你没有这个技术了,你也很好,你看啊,让我们来分析一遍,带大家看会出现什么样的结果。我们做 lc 曲线,然后呢把这个二疾病的状态,艾滋病状态是一啊,然后呢把 cd 四呢作为一个减 指标,是一种细胞印子检验指标,我们把相应的值给他,勾选中之后,我们点个确定,立马就会做出他的一个 lc 曲线,可是 我发现这个 lc 曲线他是什么,他是这个曲线都已经在这个下面 这一半了,我们讲的话,这是中间的参考线,是不是?然后肚子越大,肚子越大越往上面飘?意思是我们通常前面见到 lc 曲线是不是都是这样的,对不对?上面这样肚子越大,说明这个这个指标的他的一个诊断能力是不是越好啊? 可是我发现这已经降到这下面了,连他的正确率连百分之五十都没有,所以很多人看到这样的指标,直接就把他否定掉, 指标太差了,肯定不可以啊,肯定不可以,但是大家想想,有些指标他是越小越有诊断价值的指标,哎,我们刚才讲的那个身高啊,体重啊,都是什么?越大越能够诊断这种疾病,越大越能 血压一样,那就是越大越好,越大越好。可是呢,我们知道 cd 四呢,他是一个免疫功能细胞,当你 cd 四含量越少的时候,越可能这个人诊断为 lds, 是不是这样概念,所以他就和我们前面的套路不一样了。那么这时候进行 lc 曲线可以怎么办呢?哎,我们适当的先看一下,然后进行相互前后比较,你看这个 lc 曲线是到的是不是?然后我们发现他整段的概率只有多少?零点幺幺二,大家记住这个值零点幺幺二, ok, 好, 而且呢,下面给的这个是什么?大于或等于此之时为证。也就是我们在选他戒指的时候,那么选好了之后,比如说这个二点七五,我们就是大于等于这个二点七五,那么那就没有解决方案了吗?哎,我们知道 cd 四这个指标他是越小越好的,我们前面所研究的很多疾病都是越大越好的,血糖越高越危险,是不是高血脂?越高越危险,是不是高血糖、高血脂、高血压?一般来讲,我们体内的 某一种物质浓度越高,说明越有问题,可是有些东西是越少越有问题,比如说,哎,就像我们刚才讲的一个例子之外啊,比如说我们讲的那个血红蛋白含量越少,那是不是越容易贫血呢?红细胞含量越少,是不是也越容易贫血了?那对这些越小越 有诊断价值的指标怎么办呢?其实我们以前在讲的时候都忘了跟大家讲一个东西,就是在这个选项里面,他有个功能叫做什么呢?叫做通常默认的就是越大越代表更加肯定的检验,那么下面是这个就要 小的结果,代表更加肯定检验。我们只要把勾选那个较小的结果当做更加肯定的检验就可以了。当我们勾选他之后,点继续再次点确定,你会发现他立马就翻转过来了,是不是这样概念? ok, 你还记得上面我们讲的这个值是多少了吗? 是不是零点幺幺二?零点幺幺二,你看下面是多少?零点八八八。 那么零点八八八总共缺一样的面积呢?是多少?是不是一啊?一减去上面零点幺幺二就是零点八八八,是不是这样概念?而且他的百分之九十五肯定是零点七七六到零点九九九,我们再看上面的百分之九十五的减值是多少呢?是零点 零点零零一,对应的是不是零点九九九,然后是零点二二四,是不是零点七七六啊?零点七七六。所以对这些越小越小 好的指标,其实大家一定要注意一点,就是要勾选越小越好那个选项,同时我们也可以得到什么他这个绘制的 lc 曲线里面这个坐标值是什么?是小于等于此之时为正, 小于等于此之时为正。哎,上面我们这个是什么?是是大于等于此之时为正。 ok, 好,这就是越小的指标, 越小越好的指标,如何来去做他的一个 lc 曲线一个缝隙。 ok, 这一天呢就给大家简单补充这么多,大家也非常感谢呢, 公众号后台有这么一人问这么一个问题,真的一个好的问题啊,非常有意思,也欢迎大家继续来。嗯,问一些问题,宋哥跟大家一起来进行一个学习或者分享。

