运行环境
参数设置
基本参数
表格处理—去缺失值行
表格处理—缺失值填充
表格处理—归一化
表格处理—对数处理
样本PCA分析
两组差异分析
使用R语言的t.test函数做student T 检验,比较两组数据是否有显著性差异
差异代谢物筛选
代谢物聚类
根据指定的相似度或距离定义计算出类之间的距离大致过程:1.将每一个元素单独定为一类2.重复:每一轮都合并指定距离(对指定距离的理解很重要)最小的类3.直到所有的元素都归为同一类层级聚类,使用Python的scipy.cluster包详细文档:https://docs.scipy.org/doc/scipy/reference/cluster.hierarchy.html
代谢物相关性分析
相关性分析使用的是python的scipy.stats模块