GEO(Gene Expression Omnibus)是由美国国立生物技术信息中心(NCBI)维护的一个公开的基因表达数据存储库。它是一个广泛使用的公共数据库,用于储存和分发高通量基因组研究的数据,如微阵列、下一代测序和其他类型的高通量功能基因组实验。
在GEO中,研究人员可以提交他们的原始数据和元数据,并将这些数据与其他研究人员共享。这使得其他科学家能够访问和分析这些数据,从而促进科学发现和知识的传播。
GEO包含两种主要类型的数据集:Series和Samples。Series是一组相关的样本,它们一起代表一个特定的实验或研究项目。每个Series都由一个唯一的GEO Series accession number标识。Sample是来自单个实验单位的数据,例如单个细胞、组织或个体。每个Sample都有一个唯一的GEO Sample accession number。
除了存储原始数据外,GEO还提供了一系列工具和服务,以帮助研究人员搜索、浏览和分析数据。例如,GEO2R是一个在线应用程序,允许用户比较两个或多个GEO数据集之间的基因表达差异。此外,GEO还提供了与许多其他生物信息学资源的链接,以便于研究人员进行更深入的数据挖掘和分析。
总的来说,GEO是一个非常重要的资源,对于基因表达和功能基因组学研究有着极大的价值。