RefSeq是NCBI(美国国家生物技术信息中心)维护的一个数据库,全称为“Reference Sequence”,它提供了一组经过精心挑选和注释的基因、转录本和蛋白质序列。这些序列来自各种生物体,包括人类、其他动物、植物、微生物等。
RefSeq的目标是为科学研究提供一个权威的、高质量的参考序列集合。这些序列基于实验数据和计算分析,并经过专家评审。因此,它们在基因结构、编码蛋白质的序列等方面具有高度准确性和完整性。
RefSeq中的每个序列都有一个唯一的 accession number,这个号码可以用来在NCBI的各个数据库中查询和引用该序列。此外,RefSeq还提供了丰富的元数据,如序列的功能描述、来源物种的信息、相关的文献等。
由于其权威性和全面性,RefSeq被广泛用于生物学研究,例如基因功能研究、进化分析、疾病相关基因的研究等。同时,RefSeq也为基因组学、转录组学、蛋白质组学等领域的研究提供了重要的参考资源。