PubChem是一个由美国国家医学图书馆(NLM)维护的大型化学数据库,它包含了大量的小分子和生物活性数据。这些数据主要来自以下三个来源:
1. Substance Contributors:这些是向PubChem提交物质样本的组织和个人。他们包括制药公司、研究机构、政府实验室和大学等。
2. Depositors to PubChem BioAssay:这些是提交生物活性数据的组织和个人。他们包括药物筛选中心、学术研究团队和政府资助的研究项目。
3. Data Exchange Partners:这些是与PubChem进行数据交换的其他数据库和服务,如ChEMBL、ZINC和SureChEMBL等。
为了确保数据的质量和准确性,PubChem采取了一系列的质量控制措施:
1. 数据验证:所有提交到PubChem的数据都会经过严格的验证过程,以确保它们符合特定的标准和格式。
2. 数据审查:PubChem有一个专业的数据审查团队,他们会定期检查和审核所有的数据,以确保其质量和准确性。
3. 用户反馈:PubChem鼓励用户报告任何可能存在的数据问题,这些反馈会被用来改进数据库的质量。
4. 数据源评估:PubChem会对所有的数据源进行评估,以确定他们的数据质量是否满足要求。
5. 数据清理:PubChem会定期进行数据清理活动,以删除重复的、错误的或过时的数据。
总的来说,通过这些严格的质量控制措施,PubChem能够提供高质量、准确和最新的化学和生物活性数据,为科研工作者提供了重要的资源。