进化分支图:黄色的点代表没有差异的物种,带有颜色的点代表差异物种;
LDA值分布柱状图:展示了所有物种的LDA值
丰度比较图:标记物种在多组
进化分支图:黄色的点代表没有差异的物种,带有颜色的点代表差异物种;
LDA值分布柱状图:展示了所有物种的LDA值
丰度比较图:标记物种在多组
操作步骤:
一、样品间分析:选择样品--分类水平选择(OTU或其他)---样品聚类或排序(聚类或排序均可选,默认聚类)--距离算法选择(binary jaccard)------提交
表格展现了样品中距离矩阵的数据,数值越大,两样品之间的差异越大;
图片展示了每个样品的聚类结果,不同的颜色表示不同的物种的丰度,红色表示两两样品之间的差异大,蓝色表示两两样品之间的差异小
二、组间分析:选中treat1(对来自同一组的样品标记同一颜色),其他同上
最后的分析结果可以保存和下载
多维空间的研究对象简化到低维空间进行定位、分析和归类。
操作步骤:
一、样品间分析:
选择样品---分类水平选择(OTU或其他)--- 距离算法的选择(计算样品与样品之间的距离,根据实际情况选择,这里选择binary jaccard)---提交
表格:样品、组和坐标信息
图片:点代表了不同的样品,不同颜色代表了不同的分组,可以修改图片,选择是否选择样品名称,选择加圈(置信椭圆,有五个样品才可做这个),是否进行组间差异检验(任意选择一种),主标题(NMDS),X轴标题(nmds1),Y轴标题(nmds2),点击确定
二、组间分析:同上
最后的分析结果可以保存和下载
操作步骤:
一、样品间分析:同下(组间分析会将不同样品标记不同的颜色,这个不会)
二、组间分析:选择样品---分类水平选择(OTU或其他)---提交
表格:样品坐标表(展示了每一个样品在第一轴、第二轴、第三轴的具体的坐标信息)
各坐标解释度表(反映了第一轴、第二轴、第三轴的贡献率)
图片:从三个层次反映PCA分析的结果(第一轴和第二轴;第一轴和第三轴;第二轴和第三轴)
点表示了不同的样品,点的颜色代表了分组信息;可以点击修改图片,选择是否选择样品名称,选择加圈(置信椭圆,有五个样品才可做这个),是否进行组间差异检验(任意选择一种),主标题(PCA),X轴标题(PC1),Y轴标题(PC2),点击确定
同一组样品添加了置信椭圆
最后的分析结果可以保存和下载
操作步骤:
一、样品间分析:选择样品---分类水平选择(OTU或其他)---提交
表格:OTU的ID、后面是没哟个OTU在不同样品中的序列条数
图片:横坐标:物种丰度从高到低的排序顺序;纵坐标:物种的相对丰度。曲线下降的平缓程度反映物种分布的均匀程度,曲线下降越平缓反映样品中物种分布越均匀。
二、组间分析:同上
最后的分析结果可以保存和下载
一、样品间分析:选择样品---分类水平选择(OTU或其他 )---提交
表格:样品ID、随机抽取的序列条数、当前抽取的序列条数下所得到的Shannon指数
图片:横坐标:随机抽取的序列条数;纵坐标:Shannon指数大小。不同颜色的线条表示不同的样品。
二、组间分析:同上
最后的分析结果可以保存和下载
一、样品间分析:选择样品---分类学水平选择(OTU水平或其他)---多样性指数选择(都选上)---提交
表格 展示了计算的各指数及其在95%可信区间下的最小值和最大值的结果分析
二、组间分析:选择样品---分类学水平选择(OTU水平或其他)---多样性指数选择(都选上)---组间差异检验方法,选择T检验或其他---提交
表格 展示了具体的指标信息、分组信息
第一行表示Shannon指数在各组之间的平均值,第二行表示Shannon指数在各组之间的标准差。
图片展示了alpha多样性指数在三组之间的差异性的情况,可以点击箭头看各个图片
操作步骤:
一、样品间分析:选择样品---分类学水平选择(genus水平或其他)---提交,表格展示了物种的分类学等级及物种在三个样品中的相对丰度信息
图片三个顶点表示三个样品,不同的点是不同的属,点的大小表示属的相对丰度的大小,不同的颜色表示不同的门,某个点距离某个顶点越近,表示该物种的丰度在该顶点所代表的样品中越高。
二、组间分析:同上
最后的分析结果可以保存和下载
基于代表序列,通过多序列比对构建物种间的系统进化关系
操作步骤:
一、样品间分析:选择样品---分类水平选择(genus水平或其他)---物种数量选择(微生物丰度20或其他,丰度比例1%或其他)---提交(分析时间较长),表格展示了所选的OTU、OTU在样品中的丰度的总和及该OTU的物种注释信息,图片有两种(环形进化树、常规进化树)
二、组间分析:同上
最后的分析结果可以保存和下载
操作步骤:
一、样品间分析:选择样品---提交(分析时间较长),图片从里到外分别表示了分类等级从高到低(界门纲目科属种),扇形面积大小表示了该分类等级的丰度信息,双击扇形可以把所有分类等级下的所有物种分类信息放大,查看该分类等级下的所有物种信息。
二、组间分析:同上
最后的分析结果可以保存和下载
一、样品间分析:选择样品---提交(分析时间较长)
图片从左到右分别表示了从高到低(界门纲目科属种)的分类学地位,饼图中不同的颜色表示不同的样品,饼图所在的位置展示了当前分支下无法继续分类的序列条数,饼图不同颜色的面积大小表示了在该位置的序列条数的高低
二、组间分析:同上
以颜色梯度反应物种在不同样品间的丰度差异,并根据物种的丰度相似性对样品和物种进行聚类
操作步骤:
一、样品间分析:选择样品--分类水平选择(OTU)---点击中心数字,确定,上面表格会展示共有OTU--点击花瓣上的数字,确定,上面表格会展示特有OTU
表格展现了OTU在不同样品中的序列条数,若某个OTU值为0,则该样品中不存在该OTU;图片展示了共有或特有OTU,需自己选择点击花瓣数字
二、组间分析:同上
Lefse在不同组间寻找具有统计学差异的差异物种。然后再通过LDA做线性判别分析,找每个差异物种对组间差异的贡献。有LDA值表示组间差异的大小,LDA值越高,表明这一物种对组间差异值的贡献越大。
由里到外是界门纲目科属种。
横坐标代表按照丰度排序的序号,纵坐标代表OTU的相对丰度
意义:(1)代表样品里面物种的丰富度,曲线末端对应横坐标值越高,该样品中OTU的数量越多,说明里面的物种越多。纵坐标越高,值越大,说明该样品中物种的丰富度越高
(2)曲线的平缓代表样品中物种均匀性高,陡峭代表样品中物种均匀性不好
Beta多样性分析
主成分分析:
共线率越高,越能反应原始信息,图中不同颜色反应不同样品
中间的10244,核心基因所在的共有家族,还有分化出的单拷贝直系同源基因家族 ,利用分化出的单拷贝直系同源基因做出系统进化树,这是一种通过单拷贝直系同源基因,进行共线性比对,做基因家族聚类做出的系统进化树
扩张,就是最后的拷贝出的基因家族的增加或减少,+代表扩张,-代表减少。
碱基的变化导致编码的氨基酸变化/没变化,即为非同义替换/同义替换
基因组水平共线性--后种方法
基因水平共线性---选前种方法
7.19 第2课 Beta多样性分析
0716 学习
1.微生物研究对象:
2.研究方法(功能):细菌、真菌、功能基因
3.测序方法:二代测序--科属水平分类,短reads
三代测序--超长的,属/种水平鉴定
pacbio全长测序:序列扩增-加接头-识别ccs序列
4.分析方法和结果:
原始数据-聚类-特征表/序列
--》物种分类图
--》多样性分析
--》组间差异性分析
--》关联分析(物种与物种之间,物种与环境之间的关系)
--》功能预测分析(推测样品功能--重复以上4个分析作图)
数据质控(剔除低质量数据)-方法
聚类/降噪
聚类--基于序列相似性得到OTU,一个OTU中可能包含一些具有不同表型的菌株或物种的生物序列
降噪--ZOTUS 和 ASVs两种方法
实例解释:
物种分类:鉴定物种所在的等级
1.基于比对:blast/vsearch: 特征序列与参考数据库对比,找出一致性最高的
2.基于机器学习(贝叶斯、决策树)
3.比对结合机器:
物种分类分析:样品组成情况、各物种在不同样品中的丰度趋势变化--》热图的颜色变化
多样性分析:α多样性和β多样性
α多样性:单个样品物种丰富度以及物种多样性
衡量指标有:Chao 1和ACE,香浓、辛普森
β多样性分析:描述样品间的差异性
组间差异分析(比较组间和组内差异的大小):箱线图和PCoA图
相似性分析(ANOSIM):R值接近1,表示组间差异>组内差异,是比较好的。
Adonis置换多因素方差分析:R²越接近1说明分组因素对样品差异的解释度就越高。
组间差异分析(比较物种组与组之间的差异):常见的方法--T检验;方差分析;秩和
常见的问题:1.哪一种分析方法都有应用,多多尝试不同的方法;2.目前多样性分析的差异结果,一般还需要更多的重复和验证,才能最终加以说明。
相关性和关联分析: 主要研究的是 微生物与微生物、微生物与环境因子之间的相互作用,
有两类方法:
功能预测分析:PICRUSt2计算方法--利用标记基因数据和一个参考基因组数据库来预测微生物功能组成。