关联分析主要内容

1.蛋白质组与转录组测序的组装结果关联分析

利用转录组数据来建立蛋白搜索数据库,这将大大提升肽段及蛋白的鉴定数量。实验表明,基于转录组数据建立蛋白搜索数据库,平均可以增加蛋白鉴定数量20%~50%, 对于非模式生物来说,由于相关的研究非常少(公布的基因序列较少),其蛋白质序列数据库质量比较差。而蛋白质组学研究依赖于相关的蛋白质序列,因此对于这些物种来说蛋白质组学研究存在比较大的困难。采用转录组测序技术,拼接出这些物种的转录组并构建蛋白质序列数据库,可以大大提升蛋白质组学的鉴定数量和定性定量分析结果的准确性,采用转录组数据建库,可以比仅采用NCBInr全库的鉴定数据增加100%以上。

picture1

利用转录组数据建库和不利用转录组数据建库对比图

2蛋白组与转录组定性关联分析

将基于参考基因得到的蛋白质鉴定结果与转录组结果进行关联分析,用于验证mRNA可变剪接,当某一个蛋白鉴定到且在转录组水平有表达的信息时,被认为关联到。

2.1.差异蛋白与差异基因表达水平比较关联分析

对于上述两组学水平研究所获得的数据,首先将鉴定到的所有可靠性蛋白和与之相对应的基因的转录本进行综合关联比较分析。在此基础上,根据各自的表达变化的定量信息,对关联上的差异表达蛋白和与之相对应的差异基因的转录本进行比较分析。

2.2蛋白质组与转录组表达模式聚类分析

为了更加直观地展示两组学水平上不同基因或蛋白表达水平的变化情况利用Cluster聚类分析软件对所获得的组学数据进行表达量聚类分析,包括l)对所有可定量蛋白质及其关联转录本作表达量关联聚类分析;2)对差异蛋白质及其关联转录本作表达量关联聚类分析。最终分别以不同颜色来表示表达水平的变化情况(一般情况下,红色-上调,绿色-下调,灰色或黑色-表达量无变化)。

cluster

3.蛋白组与转录组定量关联分析

3.1 GO分析

蛋白和mRNA表达趋势相同基因的GO分析

蛋白和mRNA表达趋势相反基因的GO分析

蛋白无变化,mRNA差异表达基因的GO分析

mRNA无变化,蛋白差异表达基因的GO分析

go

GO 分析

3.2 Pathway分析

无论是转录组测序还是蛋白质组分析的结果中,都会给出差异基因或差异蛋白的Pathway代谢通路富集分析结果,比较关联分析两组学水平上的不同的Pathway代谢通路,之后对能关联上的代谢通路中的蛋白/基因的相互对应及表达情况进行一致性分析,从而挖掘出通路中几个代表性的关键基因/蛋白,此项分析内容需要结合老师的研究背景,具体情况具体分析。

蛋白和mRNA表达趋势相同基因的Pathway分析

蛋白和mRNA表达趋势相反基因的Pathway分析

蛋白无变化,mRNA差异表达基因的Pathway分析

mRNA无变化,蛋白差异表达基因的Pathway分析

pathway

3.3 富集分析

蛋白和mRNA表达趋势相同基因的GO富集分析和Pathway富集分析

蛋白和mRNA表达趋势相反基因的GO富集分析和Pathway富集分析

蛋白无变化,mRNA差异表达基因的GO富集分析和Pathway富集分析

mRNA无变化,蛋白差异表达基因的GO富集分析和Pathway富集分析