粉丝2375获赞1.7万

orange 做这种相关性分析图有多方便?第一步,导入数据,然后点击右边的 correlation blocks, 选中除 x 列的所有数据相关性类型选择皮尔逊 piercing label, 输出选择 correlation cofficient 及相关系数,点击预览,然后点击 ok, 还可以双击图标调整颜色,注意这种类型的图要选择映射格式。此外还可以调整图形的图标类型,学会了吗?

大家好,今天来教大家怎么用 orange 来做相关稀释图,也就是 correlation plot。 那么首先打开这个 orange 的软件,我用的是二零二一版本,是在淘宝买的,然后在这里左上角创建一个新的项目, 然后创建之后就会出现这个表格,让你输入相关的数据, 我这里已经有现成的数据了,也就是这样,比如我想要探讨不同样本之间 的基因表达的相关性系数,那我可以把第一列把基因填进去,然后每一列后面的每一列从第二列开始是一个独立的样本, 这些数字就是每个基因在相应的样本的表达值。 那么输入这个数据之后,我就点这个右边这个 correlation pro, 也就相关系数图。 那么有的同学会发现,一开始这个相关系数图的功能不是默认就有的,需要去添加,但是 也有的版本或者软件会出现点这个添加,添加不了,那么我也咨询了在淘宝买的那个店主,他就发了这个 origin 的 a p p 给我,上面有各种 a p p 就可以 把它拉过去,你要安装哪个就把它拉过去,就可以添加了, 它就添加到这里了。那么我这个版本已经安装了这个 correlation plot, 也就是 输入了你想要分析的数据之后,按一下这个相关系数分析,然后左 边这里选择全部,注意选择全部之后把这个俊基因去掉,也就是把第一列的要去掉,去掉之后呢,其他的都是选中的状态了。 然后右边的上方可以选择三种计算方式,包括 person 以及另外两种相关系数的计算方法,那么我这里选择 person, 然后这些是默认的一些参数,我首先点击这个打勾, 预览一下它的效果是怎么样的,你看从这个预览图可以看出, 他就是分析了不同样本之间的基因表达的一个相关相关性, 我们可以试一下其他参数是有什么不一样,这个是里面的这个形状的,呃,具体的一个形状,比如 cycle 就是圆圆圈, 这个是这样的椭圆形,然后选择 color, 就是根据颜色来区分, 这个是一个相关系数,这个是图形与 这个相关系数的结合。你看这里就可以看出,其实有的同学就会发现他右上的这个三角形跟左下的这三角形是一样的,只不过他 就是以不同的形式来表现,他这个相关系数对应的就是上面的这些图形的大小。我们也可以换一下位置,比如现在就是上面是系数,下面是圆, 这里也可以改变上方的一个形状,比如把上方的圆 改成椭圆或者颜色 label 就是它的标签,就是那个每个方框里面要显示什么,这个是相关系数, 这个是显示 p 值, 这个是显示 这个不显著的标记,这个是显示显著的标记, 显数的标记,这里默认的是零点零五,也就小于零点零五的他就打一颗星。那么我们想要有不同的 p 值层是怎么样呢?比如小于零点零一, 还有小于零点零零一,那么我就在零点零五这里首先打一个空格,输入零点零一, 他就会多了一些框,他就出现了两颗星,两颗星就表示是小于零点零一,如果还想加多小于零点零零一的,就再敲一个空格,输入零点零零一, 这样他就会出现有些方框,他是三颗星的就表示小于 p 值小于零点零零一,两颗星表于表示 p 值小于零点零一, 一颗星的表示 p 值小于零点零五,那么其他的大家 就可以自己去尝试,喜欢怎么样的就调成怎么样的。比如我个人是比较喜欢这里选择 color, 就是用颜色来表示, fun 就是我刚说的,其实下面的一半跟上面一半是一样的,那么我不需要重复,我就可以选择这样一半或者在上方,当然我个人是比较喜欢这个三角在下方的, 那么这样我就是我个人比较喜欢的效果了,只显示一半,然后啊不同的星星数量表示不同的一个 p 值的范围,那么我就点击 ok, 点击 ok 之后呢这些可以调整字体的格式,默认的是 over, 一般都不用修改,你可以修改一下它的字体的大小, 你看这个字体跟图形之间有一定的间隙,你可以淡季一下,之后他就全部选中了,你可以往上移, 这边也是一样的,可以往右边挪一点,还有这个也是可以往这边挪动的, 那么这样子就可以做出一个相关。 我刚刚双击了这个轴,那么他弹出一个框,这些可以设置更多的细节, 这些我就不一一说了,因为最常用的操作就是我刚刚所说的了。 然后我们可以把图片输出 这里设置保存的路径,比如我保存在桌面 这里,你可以命名 这里选择图形的格式。我个人一般比较喜欢 pdf, 因为它是一个时量图,你选择 pdf 之后,它输出的就是一个时量图,然后点击, ok, 我们来到桌面看一下,那么这个就是我们刚刚生成的图片, 你看适量图的好处就是不管放多大,他都是非常清晰的。 好了,那么今天就讲解到这里。



哈喽,小伙伴们大家好,今天我来分享一下如何用二维真绘制相关技术的旅途。我们首先看到今天这个案例用到的一组数据,也就是时航四列, 也就是十个样本,然后每个样本从有四个变量,然后呢我们先在这里边对这个这组数据求一个相关系数举证,我们全部选中,点击统计,然后呢点击这个描述统计, 然后把这个相关技术可以计算出来,通常有三种类型,我们通常选第一种皮尔逊相关技术就可以了,然后点击确定,完事之后呢,在原来的顾客当中就生成了一个相关技术表格,我们可以看到这个结果呢,它是一个四成四列的方阵, 关于主对角线是对称的,我们把它全部选中,点击这个绘图,选这个带标签的这里图绘制,然后呢我们这里把 标题都给去除掉外,标题可以去除,然后呢这标题他是 parents and co relation coefficientpcc 这个系数,然后我们点击确定,然后就能生成我们这个热力图,这个热力图是不是和我们看文献中的有所不一样呢?我们把它修饰一下就可以了。首先我们把这个标题给去除掉, 然后呢点击右边这个 sy 坐标轴,给他翻转一下,变得更符合我们的直觉。然后我们通常所见到的是不是这个对角线呢?他是在主对角线,所以我们需要对这个坐标轴进行一个调整,我们双击这个坐标轴,然后呢再垂直这一栏,点击这个翻转, 翻转完事之后呢,这个对角线就变成主对角线了,然后我们可以看到上面这个刻度线标签呢,他应该是在下边的,他现在在上边,所以我们把上面给隐藏了点这个刻度线标签,然后把这个下 下轴给隐藏,然后把这个上轴给显示,点击应用,然后这样就可以了。最后我们把这个所有的框线给都给去除,点击轴线和刻头线,然后把所有的这个轴都给选中,然后把这个刻头线给隐藏掉, 最后呢点击这个确定,这样就变成我们想要的形式了。最后呢我们还可以变成这个上三角或下三角的形式,然后我们点击这个热力图双击,然后再填充这一段,可以改变这个颜色,这个颜色版是根据自己的爱好去调节的,我们选一种其他颜色吧。 嗯,然后点击确定应用,然后这个颜色版就更换了,然后呢我们点击这个填充显示,改成下三角,然后标签呢也改成一个下三角,要对应起来这个数字形式呢,我们显示两位小数就可以了, 然后点击这个应用,这个数字如果太大,我们还可以在这个字体里边更改,改成一个嗯,你觉得合适的字体,比如说三十号字吧。然后就点击应用,点击确定,然后这样的话就是 ov 证绘制相关技术率图的一个方法,大家学会了吗?

哈喽,大家好,今天分享一下如何用 s p s s 进行皮尔逊相关分析。皮尔逊相关分析它主要是适用于两个定量变量之间是否存在相关关系。 假如说我们现在有收入和消费两个变量,然后我们想看一下收入和消费之间是否存在显著的相关关系,这个时候我们就可以用皮尔逊相关分析。 我们首先把数据复制一下,然后打开一个新的 spss 文件,再把数据粘贴进来, 然后点击分析相关双变量,再把收入和消费两个变量放到这个变量框里面,这里相关系数就使用默认的 pr 讯相关系数,然后点击确定,这个就是收入与消费的相关分析结果表格。这里面我们可以看到收入和消费的 pr 讯相关系数为零点九八五, 对应的显著性 p 值等于零点零零零,这个 p 值是小于零点零五的,那就说明收入和消费之间存在显著的相关关系。如果这个 p 值是大于零点零五,那就说明收入和消费之间他是不存在显著相关关系的。 然后再来看一下皮尔逊相关性,皮尔逊相关性也就是相关系数,这里收入和消费的相关系数为零点九八五,也就是说收入和消费之间存在显著的正相关关系, 然后这个相关程度也是较强的。嗯,如何判断他的相关是正相关还是负相关?那主要看这个相关系数是大于零还是小于零,如果他大于零,那就是正相关,如果他小于零,就是负相关。 如果这个相关系数的绝对值越接近于一,那就说明这两个变量之间的相关程度越强。如果这个相关系数他的绝对值越接近于零,那就说明这两个变量之间的相关程度越弱。 以上就是皮尔逊相关分析的操作步骤和结果的解读。

在心理与教育领域中,有时会出现不能使用皮尔性相关分析的情况,那么有哪种情况呢?第一个是数据不是等距或者等比的数据, 那么第二个是数据不确定是否来自于正太的总体,因为我们知道你要使用皮尔性相关,那么他的总体是要成正态分布的。 第三呢,我们都知道皮尔逊相关啊,他要求是大样本,也就是我们的样本数要大于等于三十,那么如果样本数很少呢?小于三十呢?所以啊,在心理与教育领域中,经常会出现这样的一些情况,那么我们又该怎么分析他的相关性呢?这里面就有 与皮尔逊相关相对应的叫做斯皮尔曼相关,也叫做等级相关,那么这是大家要记住斯皮尔曼相关使用的三种情况。那么比如说举个例子,十名学生的所 数学成绩名次和语文成绩的名次,他们的排位是否具有一致性啊,也就是他们的排名是否具有一致性。那么这里面我们做一个分析,就是同一组背式十个学生,那么他有成对的数据,数学的排名和语文的排名,而且排名啊,他的数据类型是顺序型,那么顺序型的这样的一个 数据呢?所以我们选用四 pm 相关,这是这个例子,那么大家要记住四 pm 相关,既然它的应用范围这么广,对数据的整体分布状态也不作要求,那么它是有缺点的啊,它是有代价的,也就是它的精确度是降低了的, 因为同一组能使用基差相关计算的资料,若改用等级相关来计算,他就会损失一部分的信息啊,这就是他精确度降低的原因,所以我们就要得出一个结论,是什么呢?就是凡是我们可以用皮尔逊来 计算的资料,我们就不要用斯皮尔曼相关来计算好,这是大家记住的啊,凡是我们达到了用皮尔逊相关来分析,就不要用斯皮尔曼。所以有的学生在用 sps 进行分析的时候,反正就是多打把钩是吧?反正就多选一个,没有坏处。那么你要知道这背后的原因就是斯皮尔曼相关,它的精确度是不如皮尔逊的 好,是这一点。接下来我们看到怎么去看 sbss 导出的这样的一个结果,那么这个呢,比较简单,比较基础,我简要的说一下,那么主要这个表格啊,看的就是他的一个是相关性啊,也就是二指,再一个呢就是他的批指,也就是显著性括号双尾这一行批指, 那么批值小于零点零五呢,这个系数啊,就会标记一个星号,如果小于等于零点零一呢,就会标记两个星号,无论他标记一个星号还是两个星号,都说明有相关性,也相关性显著,就是这一点啊,比如说 在这里年龄啊,年龄和他这个总指数的一个相关性啊,负零点二幺九,这是他的相关系数,那么批值呢?批值是零点零零,零点零零,那就是极限注,是吧?那么就是这一点,就是很简单,好,一个是相关系数,一个是呢批值好, 这是关于怎么看这个结果。再一个呢,我们同样的两个变样的相关分析,我们用了两个表来做一个对比,上面这个是皮尔逊相关,下面这个呢是斯皮尔曼相关的一个结果,那么大家可以发现, 在斯皮亚曼相关分析当中,他的相关系数是负零点二一三,在这里,那么他的显著信括号双尾的这一行可以看到零点零零零, 其实对于我们这个分析来说,好像两个相关分析没有什么很大的差别,对吧?他都能得出一个显著相关的结论。那么这里面呢,要看到一点的是有 一个规律啊,就是斯皮尔曼相关他的相关系数的绝对值,绝对值是要小于皮尔逊的相关性的绝对值,你看这里是零点二一三,那上面呢是零点二一九,对吧?说明斯皮尔曼他的相关系数啊,一般来说是小于皮尔逊的相关系数的。好,这是这样的一个规律。好,第二个你要记住的是我们 斯皮尔曼他的相关性,他的精确度要更低啊,更低。好,最后呢,我们说两句话,第一个就是斯皮尔曼的相关系数对原始变样的分布不作要求啊,这就是说他的应用的情况很范围更广,对吧?他对数据不作要求,他应用的范围肯定更广,他属于非参数的统计方法,非参数统计方法, 所以他应用范围啊要广,当然非参数统计方法呢,他的精确度就要比参数统计方法要低。好,那么最后呢,大家注意的一点是,那么皮养性相关,他要求 数据成正态分布,但是呢,在理想情况下,我们都知道数据现实中是很难成完全的正态分布的,所以我们不能对于数据有过高的要求,过分苛刻的要求,那么结论就是在现实的研究当中,我们基本上使用皮咬逊相关还是斯皮尔慢相关呢? 好,记住,在现实的研究当中,我们其实基本上还是使用皮尔熊强光,因为皮尔熊强光其实他的这种稳定性还是比较好的, 也就是你数据稍微有一点点偏态,他是不影响你得出的这个结论的。这个是大家要知道的一点,也是一个技巧。好,今天的分享就到这里。
