创作中心
反馈咨询
欢迎添加微信!
微信号:z_gqing
微信二维码:

生物信息数据库

1 生物信息学概述 1.1 生物信息学定义和历史 1.2 生物信息学的应用领域 2 基因组学数据库 2.1 NCBI基因组数据库 2.1.1 GenBank 2.1.2 RefSeq 2.1.3 dbSNP 2.2 Ensembl 2.3 UCSC基因组浏览器 2.4 EMBL-EBI基因组资源 2.5 其他基因组数据库 3 蛋白质序列和结构数据库 3.1 UniProt 3.2 Pfam 3.3 SMART 3.4 CATH 3.5 SCOP 3.6 InterPro 4 非编码RNA数据库 4.1 miRBase 4.2 piRNABank 4.3 snoRNABase 4.4 Lncipedia 4.5 Rfam 5 表观遗传学数据库 5.1 ENCODE 6 微生物数据库 6.1 NCBI微生物数据库 7 生物化学和代谢途径数据库 7.1 KEGG 7.2 Reactome 7.3 BioCyc 7.4 MetaCyc 8 医学和临床数据库 9 分子互作数据库 9.1 STRING 9.2 IntAct 9.3 MINT 9.4 BioGRID 9.5 iRefIndex 10 生物医学文献数据库 10.1 PubMed 10.2 Scopus 11 数据挖掘和分析工具 11.1 BLAST 11.2 HMMER 11.3 MAFFT 11.4 Jalview 11.5 Cytoscape 11.6 Galaxy 12 生物信息学软件和编程语言 12.1 R语言 12.2 Python 12.3 Perl 12.4 Biopython 12.5 Bioconductor
首页 教程 生物信息数据库 ENCODE
ENCODE,全称是"Encyclopedia of DNA Elements",中文翻译为“DNA元件百科全书”。这是一个大规模的国际合作项目,旨在全面解析人类和其他生物体基因组中的功能性元素。 ENCODE项目的起始目标是对人类基因组进行全面的功能性注释,即识别和定义所有具有生物学功能的DNA序列。这包括编码蛋白质的基因、调控基因表达的非编码RNA和DNA区域等。通过这样的研究,科学家们希望能够更深入地理解基因组是如何控制生物体发育和功能的。 ENCODE项目采用了多种实验技术来检测和定位基因组中的功能性元素,包括染色质免疫沉淀测序(ChIP-seq)、DNAse I超敏感位点测序(DNase-seq)和RNA测序(RNA-seq)等。这些技术可以帮助科学家们识别出哪些DNA序列被转录成RNA,哪些区域与特定的蛋白质相互作用,以及哪些区域对DNA酶I特别敏感,这些都是判断DNA序列是否具有生物学功能的重要依据。 自2003年启动以来,ENCODE项目已经取得了许多重要的发现。例如,它揭示了人类基因组中大部分区域都具有一定的生物学功能,而不仅仅是之前认为的只有一小部分基因编码区。此外,ENCODE项目还发现了大量的非编码RNA,这些RNA虽然不编码蛋白质,但在调控基因表达方面起着重要的作用。 总的来说,ENCODE项目为我们提供了关于基因组如何工作的重要信息,对于理解和治疗各种疾病具有重要的意义。 5.2 Roadmap Epigenomics Project Roadmap Epigenomics Project是一项由美国国家人类基因组研究所(NHGRI)和美国国立卫生研究院(NIH)资助的研究项目,旨在对人类及其他生物的表观基因组进行全面研究。该项目于2008年启动,目标是生成高质量、高分辨率的人类和其他模式生物的全基因组表观遗传图谱。 表观遗传学是一门研究基因表达和功能调控的学科,而这些调控并不涉及到DNA序列的变化。例如,甲基化、组蛋白修饰和非编码RNA等都属于表观遗传现象。 Roadmap Epigenomics Project的主要任务就是通过大规模的实验来揭示这些表观遗传标记在基因组中的分布,并研究它们如何影响基因的表达和细胞的功能。 为了实现这个目标,Roadmap Epigenomics Project采用了一系列尖端的技术,包括ChIP-seq、DNase-seq、FAIRE-seq、MeDIP-seq和RNA-seq等。这些技术可以帮助研究人员精确地定位表观遗传标记的位置,并测量其强度。 到目前为止,Roadmap Epigenomics Project已经取得了许多重要的研究成果。例如,他们发现了一些新的表观遗传标记,并揭示了这些标记与疾病发生和发展之间的关系。此外,他们的数据也已经被广泛应用于其他领域的研究,如发育生物学、神经科学和癌症研究等。 总的来说,Roadmap Epigenomics Project是一个具有里程碑意义的研究项目,它为我们理解基因表达和功能调控提供了全新的视角和工具。 5.3 H3K27ac ChIP-seq Atlas H3K27ac ChIP-seq Atlas 是一个大型的公开数据集,包含了从各种生物体和组织中通过ChIP-seq技术获取的H3K27ac修饰的基因组位置信息。ChIP-seq(染色质免疫沉淀测序)是一种强大的高通量测序技术,用于研究特定蛋白质(如转录因子或组蛋白修饰酶)与DNA相互作用的全基因组范围。 在细胞中,组蛋白是构成染色质的主要蛋白质,它们的化学修饰状态(如乙酰化、甲基化等)对基因表达具有重要影响。H3K27ac是指组蛋白H3上的第27位赖氨酸被乙酰化,这种修饰通常与活跃的增强子区域相关联,增强子是控制基因表达的重要调控元件。 H3K27ac ChIP-seq Atlas 提供了丰富的H3K27ac修饰的数据资源,对于研究基因调控机制、疾病的发生发展以及药物的研发等方面具有重要意义。研究人员可以利用这些数据来识别潜在的增强子区域,分析基因表达调控网络,并探索不同生理或病理状态下基因表达的变化规律。 5.4 Encyclopedia of DNA Elements in the Human and Mouse Genome (ENCODE) ENCODE,全称为 Encyclopedia of DNA Elements in the Human and Mouse Genome(人类和小鼠基因组中的DNA元素百科全书),是一个大规模的国际合作项目,旨在揭示人类和小鼠基因组中所有功能性元素。该项目由美国国立卫生研究院(NIH)于2003年启动,并在2012年发布了首个完整的人类基因组编码图谱。 ENCODE的目标是确定哪些DNA序列对于细胞功能至关重要,包括转录因子结合位点、启动子区域、增强子、沉默子、非编码RNA等。这些元素共同决定了基因表达的模式和水平,从而影响细胞的功能和生物学过程。 为了实现这一目标,ENCODE使用了一系列高通量实验技术,包括染色质免疫沉淀测序(ChIP-seq)、DNA甲基化测序、RNA测序等。这些实验数据被整合到一个公共数据库中,供研究人员在全球范围内访问和分析。 ENCODE的结果已经对基因组学和生物医学研究产生了深远的影响。它们不仅提供了关于基因调控的新见解,而且也为疾病的研究和治疗提供了新的思路。例如,通过比较健康和疾病状态下的基因表达模式,研究人员可以识别出可能与疾病相关的遗传变异和表观遗传标记。 总的来说,ENCODE是一个重要的科学资源,它为理解基因组功能和疾病机制提供了关键的数据和工具。

官方微信
点击收藏 编辑日记
木牛零码 Newmer生信 公司产品 意见反馈 联系我们 关于我们 招合伙-招聘-兼职
Copyright © 2021-2024 上海牛马人生物科技有限公司 沪ICP备 2022007390号-2