`fastp`是一款快速、全功能的 Illumina 测序数据质控工具,它能够同时进行PE(paired-end)和SE(single-end) reads的质控,并生成详细的统计报告。以下是一个运行`fastp`软件的基本示例:
假设我们有一对端测序数据(PE reads),文件名为`R1.fastq.gz`和`R2.fastq.gz`,我们想要对其进行质量控制并输出过滤后的reads到新的文件中。
命令行示例如下:
```bash
fastp -i R1.fastq.gz -I R2.fastq.gz \
-o clean_R1.fastq.gz -O clean_R2.fastq.gz \
--html report.html \
--json report.json \
--trim_front1 5 --trim_front2 5 \
--length_required 50 \
--thread 4
```
命令解释:
- `-i` 和 `-I`:分别指定读1和读2的输入文件。
- `-o` 和 `-O`:分别指定读1和读2的输出文件,这里我们将过滤后的reads保存为`clean_R1.fastq.gz`和`clean_R2.fastq.gz`。
- `--html report.html` 和 `--json report.json`:生成HTML和JSON格式的质控报告。
- `--trim_front1 5 --trim_front2 5`:从每条read的5'端去除5个碱基。
- `--length_required 50`:设定保留reads的最小长度为50bp,低于这个长度的reads将被剔除。
- `--thread 4`:使用4个线程进行并行计算以加快处理速度。
运行上述命令后,`fastp`将会执行质量控制步骤,包括去除接头、低质量碱基修剪、过滤短片段等,并将结果输出到指定文件,同时提供可视化的质控报告。