SRA(Sequence Read Archive)是一个存储高通量测序数据的公开数据库。以下是SRA数据的提交和管理流程:
1. 数据准备:在提交数据之前,需要对数据进行一系列的处理,包括质量控制、过滤、比对等。这些处理过程可以使用各种生物信息学工具完成。
2. 创建元数据:元数据是描述数据的信息,包括实验设计、样本来源、测序平台、测序策略等。元数据应按照SRA的标准格式创建。
3. 数据提交:将处理后的数据和元数据提交到SRA。这通常通过NCBI的Submission Portal完成。在提交过程中,需要提供一些基本信息,如联系人信息、项目标题、研究领域等。
4. 数据审核:SRA会对提交的数据进行审核,以确保其质量和合规性。如果数据存在问题,SRA会通知提交者进行修改。
5. 数据发布:审核通过后,数据将在SRA中发布,并可被公众访问。
6. 数据更新:如果后续有新的数据或者元数据需要更新,可以通过相同的提交流程进行更新。
7. 数据管理:SRA会定期备份数据,以防止数据丢失。同时,SRA也会监控数据的使用情况,以便于了解数据的价值和影响。
以上就是SRA数据的提交和管理流程。这个流程旨在保证数据的质量和可用性,同时也保护了数据所有者的权益。