RSeQC(RNA-seq Quality Control)是一个Python脚本集,用于评估RNA测序数据的质量。它提供了一系列的工具和指标,可以帮助研究人员了解RNA测序数据的质量,包括测序深度、基因表达水平、基因组覆盖度等。
RSeQC主要包括以下几个模块:
1. Basic modules: 提供了一些基本的统计信息,如测序深度分布、碱基质量分布、GC含量等。
2. Read distribution: 分析reads在基因组上的分布情况,例如reads在exon、intron、intergenic区域的分布。
3. Junction annotation: 对splicing junction进行注释,可以用来检测新的splice junction。
4. RNA integrity number (RIN): 通过比较reads在3'端和5'端的覆盖度,评估RNA样品的完整性。
5. Strand specificity: 分析reads的方向性,以确定RNA测序是否具有方向特异性。
6. Coverage profile: 计算基因组上每个位置的覆盖度,可用于评估测序深度是否足够。
7. Gene body coverage: 分析reads在基因体内的分布,可以用来研究转录过程中的剪接和降解现象。
总的来说,RSeQC是一个非常有用的工具,可以帮助研究人员全面地评估RNA测序数据的质量,并为后续的数据分析提供重要的参考信息。