白话统计阅读笔记:基于秩次的相关系数
发布时间:2023-08-15 12:18:07 作者:不爱说话的PhD 浏览量:967
当连续资料不满足正态分布时,一般不用Pearson相关系数,而是将连续资料进行排序,基于排序后的秩次进行相关分析,此外,当数据为等级资料时,尽管仍为分类资料,但对等级的赋值是有意义的,此时也相当于秩次,只不过每个等级的例数很多而已,本篇介绍三个基于秩次的相关系数。
Spearman相关系数
该相关系数的思路较为简单,就是求出每个变量各自排序后的秩次,然后以秩次作为变量,计算其Pearson相关系数。
Kendall的τ系数
该系数利用两个变量秩次一致和不一致的对子数,计算当前数据的一致性情况占理想中完全一致性情况的比例,如果所有对子数都一致,则相关系数为1,如果所有对子数都不一致,则此时相关系数为-1。
γ系数
该系数也是利用一致和不一致的对子数来进行计算,前一篇中介绍的Q系数就是γ系数的特例。
如果数据是偏态的连续资料,则选择Spearman相关系数或Kendall相关系数并无太大区别,但实际中由于Spearman相关系数更容易理解,所以使用得呃呃呃更加广泛。
但如果数据是等级资料,由于每个等级都有很多频数,则一般认为Kendall相关系数比Spearman相关系数能够更好地处理问题。
Ref: 《白话统计》 冯国双著
收藏
相关阅读
最热文章
为您推荐
最新文章
热门话题