创作中心
反馈咨询
欢迎添加微信!
微信号:z_gqing
微信二维码:

转录组

1 转录组数据介绍 1.1 转录组定义 1.2 RNA测序技术 1.2.1 mRNA-seq 1.2.2 long-read RNA-seq 1.3 转录组数据类型和格式 1.3.1 FASTQ文件 1.3.2 BAM/SAM文件 1.3.3 BED/GTF/GFF文件 2 生物信息学基础 2.1 基因组注释 2.2 生物统计学基础 2.3 R语言编程基础 2.4 Python编程基础 3 转录组数据预处理 3.1 转录组数据质量控制 3.1.1 fastQC 3.1.2 MultiQC 3.2 转录组数据剪接和过滤 3.2.1 Trimmomatic 3.2.2 Cutadapt 3.3 转录组数据比对 3.3.1 HISAT2 3.3.2 STAR 3.3.3 Bowtie2 3.4 比对结果评估 3.4.1 Qualimap 3.4.2 RSeQC 4 转录本组装与定量 4.1 转录本组装 4.1.1 Cufflinks/Cuffmerge/Cuffdiff 4.1.2 StringTie 4.2 转录本定量 4.2.1 HTSeq-count 4.2.2 featureCounts 4.3 差异表达分析 4.3.1 DESeq2 4.3.2 edgeR 4.3.3 limma-voom 5 功能富集分析 5.1 GO富集分析 5.2 KEGG通路富集分析 5.3 Reactome通路富集分析 6 转录组其他高级分析 6.1 转录组之时间序列分析 6.2 转录组之稳健性分析 6.3 转录组之协作网络分析 6.4 转录组之热图、火山图、PCA等可视化工具 7 转录组实例研究 7.1 已发表论文解析 7.2 自己的数据实践操作 8 转录组数据库资源 8.1 SRA 8.2 GEO 8.3 ArrayExpress 8.4 ENSEMBL 8.5 STRING
首页 教程 转录组 FASTQ文件
FASTQ文件是生物信息学中常用的一种文件格式,用于存储高通量测序数据。这种文件格式可以包含每个读取的序列以及对应的质量信息。 FASTQ文件的每一行都有特定的含义。一个完整的FASTQ记录通常由四行组成: 1. 第一行:以'@'字符开始,后面跟着序列的描述信息。这个描述信息可能包括样本名、机器名称、运行号等。 2. 第二行:包含实际的DNA/RNA序列。 3. 第三行:以'+'字符开始,后面可能跟着与第一行相同的描述信息。 4. 第四行:这一行包含了对应于第二行序列的质量信息。质量值通常是ASCII字符,其数值代表了测序错误的可能性。 例如,一个简单的FASTQ记录可能如下所示: ``` @SEQ_ID GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT + !''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65 ``` 在上述例子中,第一行给出了序列的ID(SEQ_ID)。第二行是DNA序列。第三行以'+'开头,表示接下来的一行是质量信息。第四行是质量信息,每一个字符对应第二行的一个碱基,字符的ASCII值越大,说明该位置测序的质量越高,碱基被正确识别的可能性就越大。 FASTQ文件是生物信息学分析的重要输入数据,通过对其内容的理解和处理,我们可以进行基因组拼接、变异检测、表达定量等多种研究。

官方微信
点击收藏 编辑日记
木牛零码 Newmer生信 公司产品 意见反馈 联系我们 关于我们 招合伙-招聘-兼职
Copyright © 2021-2024 上海牛马人生物科技有限公司 沪ICP备 2022007390号-2