操作步骤:
一、样品间分析:选择样品---提交(分析时间较长),图片从里到外分别表示了分类等级从高到低(界门纲目科属种),扇形面积大小表示了该分类等级的丰度信息,双击扇形可以把所有分类等级下的所有物种分类信息放大,查看该分类等级下的所有物种信息。
二、组间分析:同上
最后的分析结果可以保存和下载
操作步骤:
一、样品间分析:选择样品---提交(分析时间较长),图片从里到外分别表示了分类等级从高到低(界门纲目科属种),扇形面积大小表示了该分类等级的丰度信息,双击扇形可以把所有分类等级下的所有物种分类信息放大,查看该分类等级下的所有物种信息。
二、组间分析:同上
最后的分析结果可以保存和下载
一、样品间分析:选择样品---提交(分析时间较长)
图片从左到右分别表示了从高到低(界门纲目科属种)的分类学地位,饼图中不同的颜色表示不同的样品,饼图所在的位置展示了当前分支下无法继续分类的序列条数,饼图不同颜色的面积大小表示了在该位置的序列条数的高低
二、组间分析:同上
以颜色梯度反应物种在不同样品间的丰度差异,并根据物种的丰度相似性对样品和物种进行聚类
操作步骤:
一、样品间分析:选择样品--分类水平选择(OTU)---点击中心数字,确定,上面表格会展示共有OTU--点击花瓣上的数字,确定,上面表格会展示特有OTU
表格展现了OTU在不同样品中的序列条数,若某个OTU值为0,则该样品中不存在该OTU;图片展示了共有或特有OTU,需自己选择点击花瓣数字
二、组间分析:同上
Lefse在不同组间寻找具有统计学差异的差异物种。然后再通过LDA做线性判别分析,找每个差异物种对组间差异的贡献。有LDA值表示组间差异的大小,LDA值越高,表明这一物种对组间差异值的贡献越大。
由里到外是界门纲目科属种。
横坐标代表按照丰度排序的序号,纵坐标代表OTU的相对丰度
意义:(1)代表样品里面物种的丰富度,曲线末端对应横坐标值越高,该样品中OTU的数量越多,说明里面的物种越多。纵坐标越高,值越大,说明该样品中物种的丰富度越高
(2)曲线的平缓代表样品中物种均匀性高,陡峭代表样品中物种均匀性不好
Beta多样性分析
主成分分析:
共线率越高,越能反应原始信息,图中不同颜色反应不同样品
中间的10244,核心基因所在的共有家族,还有分化出的单拷贝直系同源基因家族 ,利用分化出的单拷贝直系同源基因做出系统进化树,这是一种通过单拷贝直系同源基因,进行共线性比对,做基因家族聚类做出的系统进化树
扩张,就是最后的拷贝出的基因家族的增加或减少,+代表扩张,-代表减少。
碱基的变化导致编码的氨基酸变化/没变化,即为非同义替换/同义替换
基因组水平共线性--后种方法
基因水平共线性---选前种方法
7.19 第2课 Beta多样性分析
0716 学习
1.微生物研究对象:
2.研究方法(功能):细菌、真菌、功能基因
3.测序方法:二代测序--科属水平分类,短reads
三代测序--超长的,属/种水平鉴定
pacbio全长测序:序列扩增-加接头-识别ccs序列
4.分析方法和结果:
原始数据-聚类-特征表/序列
--》物种分类图
--》多样性分析
--》组间差异性分析
--》关联分析(物种与物种之间,物种与环境之间的关系)
--》功能预测分析(推测样品功能--重复以上4个分析作图)
数据质控(剔除低质量数据)-方法
聚类/降噪
聚类--基于序列相似性得到OTU,一个OTU中可能包含一些具有不同表型的菌株或物种的生物序列
降噪--ZOTUS 和 ASVs两种方法
实例解释:
物种分类:鉴定物种所在的等级
1.基于比对:blast/vsearch: 特征序列与参考数据库对比,找出一致性最高的
2.基于机器学习(贝叶斯、决策树)
3.比对结合机器:
物种分类分析:样品组成情况、各物种在不同样品中的丰度趋势变化--》热图的颜色变化
多样性分析:α多样性和β多样性
α多样性:单个样品物种丰富度以及物种多样性
衡量指标有:Chao 1和ACE,香浓、辛普森
β多样性分析:描述样品间的差异性
组间差异分析(比较组间和组内差异的大小):箱线图和PCoA图
相似性分析(ANOSIM):R值接近1,表示组间差异>组内差异,是比较好的。
Adonis置换多因素方差分析:R²越接近1说明分组因素对样品差异的解释度就越高。
组间差异分析(比较物种组与组之间的差异):常见的方法--T检验;方差分析;秩和
常见的问题:1.哪一种分析方法都有应用,多多尝试不同的方法;2.目前多样性分析的差异结果,一般还需要更多的重复和验证,才能最终加以说明。
相关性和关联分析: 主要研究的是 微生物与微生物、微生物与环境因子之间的相互作用,
有两类方法:
功能预测分析:PICRUSt2计算方法--利用标记基因数据和一个参考基因组数据库来预测微生物功能组成。