介绍
相关性分析使用的是python的scipy.stats模块
输入
输入的文件
例如:
#OTU_ID C1 C2 C3 C4 N1 N2 N3 N4 S1 S2 S3 S4
var0 77 14 89 64 30 15 31 3 21 13 14 62
var1 7 31 38 55 80 96 16 83 53 79 79 50
var2 29 41 94 64 80 73 48 19 16 24 39 54
var3 11 87 63 66 94 36 36 13 41 34 44 55
var4 41 79 45 60 25 32 63 83 75 22 69 37
方法
Pearson:
最常用的相关系数,又称积差相关系数,取值-1到1,绝对值越大,说明相关性越强。该系数的计算和检验为参数方法,适合做连续变量的相关性分析
Spearman:
对原始变量的分布不做要求,适用范围较Pearson相关系数广,即使是等级资料,也可适用。
但其属于非参数方法,检验效能较Pearson系数低。适合含有等级变量或者全部是等级变量的相关性分析
kendall:
Kendall相关性比Spearman相关性更强健和有效。这意味着当样本量较小或存在一些异常值时,首选Kendall相关
Kendall相关系数是对于定类变量的统计,pearson是对定距变量的统计,而spearman是对定序变量的统计
Kendall协和系数关注的是不同的评价者评价的趋势是否一致
结果
相关系数表 corr.xls,相关性P值表 pvalue.xls
格式例如:
C1 C2 C3
C1 1.0 -0.035 -0.316
C2 -0.035 1.0 -0.523
C3 -0.316 -0.523 1.0