代谢组学生物信息分析主要内容

1.PCA分析

本步骤使用中心化换算(mean center scaling)的数据标度换算方式进行,首先对所有样本进行总的PCA分析,对信息进行初步把握,判断是否有异常样品。图例如下:

pca-score

然后我们对两组样品之间进行单独的PCA分析,掌握两组样品的初步信息。

loadingplot_pc1vspc2

Fig.两组之间的PCA scores plot

2. PLS-DA分析

本步骤对样本进行偏最小二乘法-判别分析(PLS-DA)。使用自适换算(unit variance scaling)的数据标度换算方式。对模型的质量用交叉验证法进行检验,并用交叉验证后得到的R2X 和Q2(分别代表模型可解释的变量和模型的可预测度)对模型有效性进行评判。在此之后,通过排列实验对模型有效性做进一步的检验。

plsda-score

Fig.PLS-DA  scores plot

plsda-cv

Fig.permutation test

3. 正交偏最小二乘法判别分析(OPLS-DA)

对PLS-DA模型进行正交矫正处理(OPLS-DA),最大化地凸显模型内部不同组别之间的差异。OPLS-DA使用自适换算(unit variance scaling)的数据标度换算方式。

oplsda

Fig. OPLS-DA  scores plot

4. 单变量分析

此部分分析在niurou.csv结果基础上进行normalization即可。

此部分分析是进行单变量统计分析,首先对每个变量即代谢分子应用Shapiro Wilk’s test进行正态分布检验,符合正态分布就进行Welch’s T test,不符合进行Wilcoxon-Mann Whitney test。

welchs-t-test
wilcoxon-mann-whitney-test