创作中心
反馈咨询
欢迎添加微信!
微信号:z_gqing
微信二维码:

转录组

1 转录组数据介绍 1.1 转录组定义 1.2 RNA测序技术 1.2.1 mRNA-seq 1.2.2 long-read RNA-seq 1.3 转录组数据类型和格式 1.3.1 FASTQ文件 1.3.2 BAM/SAM文件 1.3.3 BED/GTF/GFF文件 2 生物信息学基础 2.1 基因组注释 2.2 生物统计学基础 2.3 R语言编程基础 2.4 Python编程基础 3 转录组数据预处理 3.1 转录组数据质量控制 3.1.1 fastQC 3.1.2 MultiQC 3.2 转录组数据剪接和过滤 3.2.1 Trimmomatic 3.2.2 Cutadapt 3.3 转录组数据比对 3.3.1 HISAT2 3.3.2 STAR 3.3.3 Bowtie2 3.4 比对结果评估 3.4.1 Qualimap 3.4.2 RSeQC 4 转录本组装与定量 4.1 转录本组装 4.1.1 Cufflinks/Cuffmerge/Cuffdiff 4.1.2 StringTie 4.2 转录本定量 4.2.1 HTSeq-count 4.2.2 featureCounts 4.3 差异表达分析 4.3.1 DESeq2 4.3.2 edgeR 4.3.3 limma-voom 5 功能富集分析 5.1 GO富集分析 5.2 KEGG通路富集分析 5.3 Reactome通路富集分析 6 转录组其他高级分析 6.1 转录组之时间序列分析 6.2 转录组之稳健性分析 6.3 转录组之协作网络分析 6.4 转录组之热图、火山图、PCA等可视化工具 7 转录组实例研究 7.1 已发表论文解析 7.2 自己的数据实践操作 8 转录组数据库资源 8.1 SRA 8.2 GEO 8.3 ArrayExpress 8.4 ENSEMBL 8.5 STRING
首页 教程 转录组 转录组数据类型和格式
转录组数据是研究基因表达的常见类型,主要包括RNA-seq和microarray两种。这些数据通常以特定的格式存储和分析。 1. RNA-seq数据:这是目前最常用的转录组测序技术,它通过高通量测序技术对细胞中所有mRNA分子进行测序,从而获取基因表达的信息。RNA-seq数据主要以FASTQ格式存储,这是一种文本格式,用于存储序列读取及其相应的质量信息。另外,RNA-seq数据也可以转换为BAM或SAM格式,这两种格式主要用于存储比对到参考基因组的序列读取。 2. microarray数据:这是一种基于芯片的技术,通过检测固定在芯片上的探针与样本RNA的杂交程度,来定量测量基因表达水平。microarray数据主要以.CEL文件格式存储,这是一种二进制格式,包含了原始的荧光强度数据。此外,microarray数据也可以转换为.txt或.csv格式,以便于数据分析。 3. BED格式:这是一种文本格式,用于存储基因组区域的数据,如基因、CpG岛等。在转录组研究中,BED格式常用于表示基因结构和转录本的位置信息。 4. GTF/GFF格式:这两种格式都是用于描述基因组特征(如基因、转录本、外显子)的文本格式,它们包含了每个特征的起始和结束位置、所处的染色体以及相关的注释信息。 5. wiggle/bamCoverage/bigwig格式:这些都是用于存储基因组覆盖率或者信号值的数据格式,常用于可视化或者差异表达分析。 以上就是转录组数据的一些常见类型和格式。不同的数据类型和格式适用于不同的分析步骤和工具,因此理解和掌握这些基本知识对于转录组学研究是非常重要的。

官方微信
点击收藏 编辑日记
木牛零码 Newmer生信 公司产品 意见反馈 联系我们 关于我们 招合伙-招聘-兼职
Copyright © 2021-2024 上海牛马人生物科技有限公司 沪ICP备 2022007390号-2