0716 学习
1.微生物研究对象:
2.研究方法(功能):细菌、真菌、功能基因
3.测序方法:二代测序--科属水平分类,短reads
三代测序--超长的,属/种水平鉴定
pacbio全长测序:序列扩增-加接头-识别ccs序列
4.分析方法和结果:
原始数据-聚类-特征表/序列
--》物种分类图
--》多样性分析
--》组间差异性分析
--》关联分析(物种与物种之间,物种与环境之间的关系)
--》功能预测分析(推测样品功能--重复以上4个分析作图)
数据质控(剔除低质量数据)-方法
聚类/降噪
聚类--基于序列相似性得到OTU,一个OTU中可能包含一些具有不同表型的菌株或物种的生物序列
降噪--ZOTUS 和 ASVs两种方法
实例解释:
物种分类:鉴定物种所在的等级
1.基于比对:blast/vsearch: 特征序列与参考数据库对比,找出一致性最高的
2.基于机器学习(贝叶斯、决策树)
3.比对结合机器:
物种分类分析:样品组成情况、各物种在不同样品中的丰度趋势变化--》热图的颜色变化
多样性分析:α多样性和β多样性
α多样性:单个样品物种丰富度以及物种多样性
衡量指标有:Chao 1和ACE,香浓、辛普森
- Chao 1和ACE:衡量物种丰富度,和丰度、均匀度无关;只对稀有物种敏感;
- Shannon(香浓指数):描述物种出现的紊乱和不确定性,对群落的丰富度和稀有OTU更敏感。
- 辛普森多样性指数:群落中种数越多,个体分配就越均匀,指数越低,群落多样性越高,对均匀度和群落中的优势OTU更敏感。
β多样性分析:描述样品间的差异性
组间差异分析(比较组间和组内差异的大小):箱线图和PCoA图
相似性分析(ANOSIM):R值接近1,表示组间差异>组内差异,是比较好的。
Adonis置换多因素方差分析:R²越接近1说明分组因素对样品差异的解释度就越高。
组间差异分析(比较物种组与组之间的差异):常见的方法--T检验;方差分析;秩和
常见的问题:1.哪一种分析方法都有应用,多多尝试不同的方法;2.目前多样性分析的差异结果,一般还需要更多的重复和验证,才能最终加以说明。
相关性和关联分析: 主要研究的是 微生物与微生物、微生物与环境因子之间的相互作用,
有两类方法:
- 排序分析(RDA/CCA db-RDA),坐标系射线与射线之间的夹角反应关系;
- 一种基于相关性系数 (Pearson、Spearman、Sparce)--》热图、网络图
功能预测分析:PICRUSt2计算方法--利用标记基因数据和一个参考基因组数据库来预测微生物功能组成。