Rfam是一个基于RNA家族的数据库,由英国韦尔科姆信托桑格研究所维护。它包含了大量已知和预测的非编码RNA(ncRNA)家族的注释和模型。
Rfam中的每个家族都有一个种子序列集合,这些序列代表了该家族的典型成员。此外,每个家族还包含一个CM( covariance model)或SEED(Stochastic Expectation Maximization for RNA AlignmEnt Evaluation Database)模型,这些模型用于识别新的家族成员。
Rfam数据库通过自动搜索公共序列数据库,如GenBank和EMBL,来更新其内容。然后,通过手动审查和注释过程,确保每个家族的准确性和完整性。
Rfam的数据可用于各种生物学研究,包括RNA结构和功能的研究,以及基因组注释和比较基因组学分析。它的数据可以通过Rfam网站直接访问,也可以通过一系列的生物信息学工具和软件进行下载和使用。