创作中心
反馈咨询
欢迎添加微信!
微信号:z_gqing
微信二维码:

宏基因组测序数据分析流程-实战

1 宏基因组介绍 2 宏基因组测序数据质控-fastp软件 3 宏基因组测序去除宿主序列 4 宏基因组测序组装 5 宏基因组基因预测 6 非冗余基因集获取 7 基因集丰度 8 宏基因组物种注释 9 宏基因组测序Alpha多样性分析 10 宏基因组测序Beta多样性分析 10.1 PCA 10.2 PCOA 10.3 NMDS 11 LEfSe分析 12 ANOSIM 13 宏基因组测序功能注释 14 宏基因组测序的通路富集分析 15 宏基因组关联研究(MGWAS) 16 群落结构与环境因子的相关性分析
首页 教程 宏基因组测序数据分析流程-实战 非冗余基因集获取
非冗余基因集获取,是生物信息学中的一项重要任务,主要目的是从大规模基因或蛋白质序列数据中筛选出具有代表性的、功能相对独立的基因或蛋白质集合。在研究物种进化、功能注释、疾病相关基因识别等领域有广泛应用。 #安装cd-hit #输入 $1: 所有样本基因预测结果合并的氨基酸序列文件 cd-hit -i $1 -o out -c 0.9 -aS 0.9 -n 5 -G 0 -M 10000 -d 0 -g 1 -T 2 #对于大文件,可以通过拆分去冗余再合并再去冗余的方式,缩短总的运行时间 -M memory limit (in MB) for the program, default 800; 0 for unlimitted; -c sequence identity threshold, default 0.9 -G use global sequence identity, default 1 if set to 0, then use local sequence identity, -n word_length, default 5,

官方微信
点击收藏 编辑日记
木牛零码 Newmer生信 公司产品 意见反馈 联系我们 关于我们 招合伙-招聘-兼职
Copyright © 2021-2024 上海牛马人生物科技有限公司 沪ICP备 2022007390号-2