StringTie是一款用于转录组拼接和表达量定量的软件。它能够从RNA-seq数据中组装和量化转录本,并且可以检测新的转录本和可变剪接事件。
StringTie的基本工作流程如下:
1. 输入:StringTie接受BAM或SAM格式的比对结果作为输入,这些比对结果通常由比对工具如TopHat2、STAR等生成。
2. 转录本组装:StringTie使用一个图形模型来组装转录本,这个模型考虑了读段的覆盖深度、方向和长度。它可以识别出不同的转录本变体,并且可以处理复杂的基因结构,例如内含子和外显子的交替剪接。
3. 表达量定量:StringTie可以计算每个转录本的FPKM(Fragments Per Kilobase of transcript per Million mapped reads)值,这是衡量转录本表达量的一种常用方法。
4. 新转录本和可变剪接事件的检测:StringTie还可以检测到新的转录本和可变剪接事件,这对于研究基因表达调控和疾病机制非常重要。
5. 输出:StringTie的输出包括一个GTF文件,其中包含了组装出的转录本的信息,以及一个txt文件,其中包含了每个转录本的FPKM值。
总的来说,StringTie是一款功能强大的转录组分析工具,它可以帮助研究人员更深入地理解基因表达和调控机制。