介绍
Trinity,是由 the Broad Institute 开发的转录组de novo组装软件,由三个独立的软件模块组成:Inchworm,Chrysalis和Butterfly。三个软件依次来处理大规模的RNA-seq的reads数据。Trinity的简要工作流程为:
Inchworm: 将RNA-seq的原始reads数据组装成Unique序列;
Chrysalis: 将上一步生成的contigs聚类,然后对每个类构建Bruijn图;
Butterfly: 处理这些Bruijn图,依据图中reads和成对的reads来寻找路径,从而得到具有可变剪接的全长转录子,同时将旁系同源基因的转录子分开。
输入
reads的类型:常用的有 fasta(fa) 和 fastq(fq) 文件格式
SS_lib_type
reads的方向。成对的reads: RF or FR; 不成对的reads: F or R。
在数据具有链特异性的时候,设置此参数,则正义和反义转录子能得到区分。
默认情况下,不设置此参数,reads被当作非链特异性处理。
FR: 匹配时,read1在5'端上游, 和前导链一致, read2在3'下游, 和前导链反向互补. 或者read2在上游, read1在下游反向互补;
RF: read1在5'端上游, 和前导链反向互补, read2在3'端下游, 和前导链一致;
结果
组装好的序列,Trinity.fasta