一、.有没有基因组:
(1)无参转录组拼接技术
二、Trinity软件:
1:打断、延伸
2:overlap
3:转录本序列
三、Trinity转录本记录
1.命名方式:
(1)得到的转录本序列
>c81126.graph__C0___seq1
>c81126.graph__C0___seq2
来自同一个unigene
(2)Unigene序列(选择最长转录本序列)
>c0.graph__c0
CCTGT..............CTGG
>.c1000.graph__c0
GTTAC........CCTG
2.组装结果评判
(1)拼装结果组装数量(6-9万)
如果数量太多,拼装结果不好
N50长度越大,拼装结果越好
四、组装方式
1.合并组装(同一个物种)
2.分组组装
(Unigene组装,可能会丢掉部分转录本的信息)
五、CDS预测
transdecode预测:
正反各预测3次,一个基因一个预测结果
best:
complete:完整(明确的起始子和终止子)
5prime_partial (5"缺失)
complete:有起始密码子,终止密码子
internal:缺少起始密码子和终止密码子
六、Unigene 功能注释
NR注释:同源蛋白(来自植物、动物)是否有污染。相应的物种
七、定量相关性分析
相关性:皮尔曼相关系数r,R2越接近1,相关性则越强,<0.8,可能相关性就没那么好。
八、差异分析及差异基因富集分析
差异分析软件:
有生物学重复:DESeq2,DESeq,edgeR
无生物学重复:EBSeq,edgeR
筛选条件:FC(log2FC ),FDR(PValue)
差异基因功能富集
GO
KEGG
基因检索方法
寻找目标基因
根据已知的基因名,在功能注释中进行检索
差异分析结果中找关键基因
根据差异基因的功能富集结果(GO、KEGG),找关键基因