木牛零码
木牛零码
首页
分析
流程
任务
分析任务
工作流任务
文件管理
运行环境
NGplot
ADtool
主推NGplot,ADtool,其他在升级维护中!
登录
|
注册
首页
分析
流程
任务
环境
ngplot
VIP画图&分析&流程-
VIP分析&流程-
VIP画图-
V币充值
会员中心
账号设置
收支管理
退出登录
反馈咨询
欢迎添加微信!
微信号:z_gqing
微信二维码:
分类
全部
统计
比对
注释
DNA结构
进化
组装
质控
SNP/Indel
表格处理
序列处理
定量分析
机器学习
RNA
文件格式
qiime2
格式检查
单细胞
空间转录组
热搜:
预测
blast
检验
默认排序
名称
最新
热度
评价
IQ-tree建树
iqtree
newmer
2025-03-07
自动匹配最佳模型建树
mafft比对
mafft
newmer
2025-03-07
Mafft软件比对
删除缺失行(指定列)
na remove
newmer
2025-02-27
在指定的变量中,删除缺失值比例大于阈值的行
频数统计(按区间)
hist kde
newmer
2025-02-27
统计某一列值的区间分布。包括KDE计算
表格列值映射
dataChange
newmer
2025-02-27
PCA分析
pca
newmer
2025-02-27
包括判断主成分个数、提取主成分、主成分旋转、获取主成分得分,碎石图和主成分得分图
设置缺失值
na set
newmer
2025-02-27
读取表格文件将数值超过某个范围的值设置为缺少值,并记录行和列的编号
缺失值检查
na check
newmer
2025-02-27
检查数据表缺失值,输出缺失值的位置信息
合并相同表头的表格文件
tablecat
newmer
2025-02-27
根据表格列表文件合并表格,保留一个表头
缺失值统计和填充
miss value
newmer
2025-02-27
填充方法有去除行、均值、中位数、众数填充,前向填充、后向填充
频数统计(单列)
frequency table oneVar
newmer
2025-02-27
数据表指定列,统计频数
计算描述性统计量(分组计算)
num stat group
newmer
2025-02-27
分组对数据表的指定列的数据计算平均数、中位数、标准差、分位数、和、最小值、或最大值等
生成透视表
pivot table
newmer
2025-02-26
按照不同的维度和指标对数据进行重组
编码分类变量
label encoder
newmer
2025-02-26
将非数值型数据(如字符串、类别)转换为数值型数据
随机森林模型预测
RandomForest predict
newmer
2025-02-25
使用训练好的随机森林模型做预测或分类
随机森林模型训练
RandomForest train
newmer
2025-02-25
通过构建多个决策树(Bagging方法),并对结果进行投票或平均,降低过拟合
t-SNE
tSNE
newmer
2025-02-25
通过概率分布建模高维和低维空间中的样本相似性,最小化两者之间的KL散度。
FP-growth算法发现频繁项集
FP growth
newmer
2025-02-25
种用于发现频繁项集的高效算法,它基于Apriori算法构建,但在处理大数据集时性能更优。
Apriori算法关联分析
apriori
newmer
2025-02-25
经典的关联规则学习算法,主要用于从大量事务型数据中发现频繁项集和关联规则。该算法广泛应用于市场篮子分析、推荐系统等场景
树回归模型训练
tree regression train
newmer
2025-02-25
树回归结合了树和回归两者的特性,可以简单理解为分段函数。它利用树把数据分类,然后对于分类后的数据回归拟合
树回归预测
tree regression predict
newmer
2025-02-25
使用训练好的树回归模型做预测或分类
AdaBoost元算法模型预测
adaboost predict
newmer
2025-02-25
使用训练好的AdaBoost元算法模型做预测或分类
AdaBoost元算法模型训练
adaboost train
newmer
2025-02-25
于Boosting策略的集成学习方法。将多个弱分类器(通常是单层决策树)进行合理的结合,使其成为一个强分类器
支持向量机训练
svm train
newmer
2025-02-25
监督学习模型,主要用于分类和回归分析。SVM的基本思想是找到一个最优的分离超平面,使得不同类别的数据点被尽可能准确地分隔开,同时保证分类间隔最大化。
支持向量机预测
svm predict
newmer
2025-02-25
使用训练好的支持向量机做预测或分类
朴素贝叶斯分类模型预测
naive bayes predict
newmer
2025-02-25
使用训练好的朴素贝叶斯分类模型做预测或分类
朴素贝叶斯分类模型训练
naive bayes train
newmer
2025-02-25
基于概率论的分类方法
决策树模型预测
decision tree predict
newmer
2025-02-25
使用训练好的决策树模型做预测或分类
决策树的模型训练
decision tree train
newmer
2025-02-25
采用树状结构来进行决策或分类。这种模型可以视为一系列的问题和答案,或者是一系列的决策规则
k-近邻算法模型预测
knn predict
newmer
2025-02-25
使用训练好的KNN模型做预测或分类
k-近邻算法的模型训练
knn train
newmer
2025-02-25
简称KNN,属于监督学习,通过计算待分类样本与训练集中各个样本的距离,找到距离最近的K个样本,然后根据这K个样本的类别或值来预测待分类样本的类别或值
对应分析(CA)
CA
newmer
2025-02-24
用于分析分类变量之间关系的统计方法,常用于探索列联表中的关联结构
多维刻度分析
mds
newmer
2025-02-24
多维刻度分析(Multidimensional Scaling, MDS)是一种用于将高维数据降维到低维空间(通常是 2D 或 3D)的可视化技术
信度分析Cronbach's Alpha
cronbach alpha
newmer
2025-02-24
信度分析用于评估测量工具(如问卷或量表)的可靠性,常用的指标是 Cronbach's Alpha,内部一致性信度
Log-Rank检验
log rank
newmer
2025-02-24
生存分析Kaplan-Meier估计
kaplan meier
newmer
2025-02-24
实现 Kaplan-Meier 估计并绘制生存曲线
游程检验
runs test
newmer
2025-02-24
检验数据序列是否随机的方法
时间序列简单指数平滑法
tsa expSmooth
newmer
2025-02-24
通过对历史数据进行加权平均,赋予近期数据更高的权重,从而捕捉时间序列的趋势和季节性特征
时间序列分解
tsa seasonal decompose
newmer
2025-02-24
将时间序列分解为趋势、季节性、残差
时间序列移动平均法
tsa trend
newmer
2025-02-24
通过移动平均法,看长期趋势
时间序列平均发展水平、增减量、发展速度
time series summary
newmer
2025-02-24
时间序列SARIM模型拟合和预测
tsa sarima
newmer
2025-02-24
自动搜索自回归阶数、差分阶数、移动平均阶数
时间序列ARIM模型拟合和预测
tsa arima
newmer
2025-02-24
适用于平稳时间序列。自动搜索自回归阶数、差分阶数、移动平均阶数
时间序列KPSS检验
tsa kpss
newmer
2025-02-24
平稳性检验
时间序列ADF检验
tsa adf
newmer
2025-02-24
平稳性检验
时间序列偏自相关(PACF)图
tsa pacf
newmer
2025-02-24
时间序列自相关(ACF)图
tsa acf
newmer
2025-02-24
时间序列图
time series plot
newmer
2025-02-24
时间列格式为年-月-日
探索因子分析
efa
newmer
2025-02-21
包括判断公共因子数、提取公共因子、因子旋转、获取因子得分、碎石图和因子载荷图
岭回归
regression ridge
newmer
2025-02-21
处理多重共线性问题的线性回归方法,通过引入L2正则化来减少模型的过拟合
cox比例风险
regression cox
newmer
2025-02-21
用于生存分析的回归模型,适用于分析事件发生时间与协变量之间的关系。事件列的值是 0 或 1,时间列的值是非负数
泊松回归
regression poisson
newmer
2025-02-21
计数数据的回归方法,适用于因变量为非负整数的场景
Logistic回归
regression logistic
newmer
2025-02-21
因变量为类别型。兼容二分类和多分类
自助法-统计均值/中位数
boot mid
newmer
2025-02-21
对原始数据进行有放回的随机抽样,用于估计统计量的置信区间或标准误差
自助法-计算回归的R方
boot r2
newmer
2025-02-21
对原始数据进行有放回的随机抽样,用于估计统计量的置信区间或标准误差
置换检验-多项式回归
perm lm more
newmer
2025-02-21
多项式回归的置换检验。使用的是R的lmPerm包
置换检验-简单线性回归
perm lm
newmer
2025-02-21
简单线性回归的置换检验。使用的是R的lmPerm包
置换检验-两样本或K样本
coin oneway test
newmer
2025-02-20
采用蒙特卡洛重抽样
功效分析-检测效应量
power analysis effectSize
newmer
2025-02-20
包括t_test, paired_t_test, anova
功效分析-检测功效
power analysis power
newmer
2025-02-20
包括t_test, paired_t_test, anova, linear_regression, proportion, correlation, chi_square, f_test
功效分析-检测样本量
power analysis nobs
newmer
2025-02-20
包括t_test, paired_t_test, anova, linear_regression, proportion, correlation, chi_square, f_test
检验多元正态性
multivariate normality
newmer
2025-02-20
使用Henze-Zirkler's Test。 p-value < 0.05,通常认为数据不满足多元正态性
多元方差分析
manova
newmer
2025-02-20
因变量不止一个,自变量通常是一个分组变量
重复测量方差分析
anova repeated
newmer
2025-02-20
受试者测量不止一次
双因素方差分析
anova two way
newmer
2025-02-19
分析两个分类自变量(因素)对一个连续因变量的影响,同时还可以检验两个因素之间是否存在交互作用
单因素协方差分析检查交互项的显著性
ancova interaction
newmer
2025-02-19
自变量和单个协变量之间的交互效应
单因素协方差分析
ancova
newmer
2025-02-19
包含一个或多个定量的协变量
方差齐性检验
variance test
newmer
2025-02-19
Levene 检验:适用于非正态分布数据,Bartlett 检验:适用于正态分布数据。p-value 小于 0.05,则拒绝原假设,认为各组方差不齐
单因素方差分析的多重比较
multiple comparisons
newmer
2025-02-19
使用Tukey's HSD方法
标准化回归系数
regression scale coefficients
newmer
2025-02-19
计算各个自变量的标准化回归系数。用来比较不同自变量对因变量的相对作用大小。
线性回归模型的交叉验证
regression cross validation
newmer
2025-02-19
对指定的自变量,因变量做线性回归拟合,并交叉验证
向后逐步回归
regression backward
newmer
2025-02-19
使用RFE来逐步减少特征
向前逐步回归
regression forward
newmer
2025-02-19
依次增加候选自变量。统计每次循环模型AIC的值
全子集回归
regression full subset
newmer
2025-02-19
比较所有候选自变量的组合模型。通过AIC选择最佳模型
回归模型AIC、BIC比较
regression compare
newmer
2025-02-19
对不同自变量的2个模型进行比较
Box-Tidwell 变换
Box Tidwell
newmer
2025-02-19
用于线性回归模型中自变量的线性化。如果数据包含零或负数,需要先进行数据清洗(例如加上一个常数)
Yeo-Johnson 正态变换
normal Yeo Johnson
newmer
2025-02-19
指定列的数据可以包括非正数。自动计算最优值。用Shapiro-Wilk 检验检测变换后数据的正态性
Box-Cox 正态变换
normal box cox
newmer
2025-02-19
指定列的数据必须为正数。自动计算最优值。用Shapiro-Wilk 检验检测变换后数据的正态性
Q-Q图
QQ
newmer
2025-02-19
用于检查数据是否符合正态分布,如果数据点大致落在一条直线上,则说明数据符合正态分布
检测回归模型强影响点
calculate influential points
newmer
2025-02-18
方法通过计算Cook距离。结果包括图形
检测回归模型高杠杆点
calculate leverage
newmer
2025-02-18
方法是帽子矩阵(Hat Matrix)。杠杆值的范围是 [0, 1],值越大表示该观测点对模型的影响越大
线性回归模型检测离群点
detect outliers lineModel
newmer
2025-02-18
检测数据表的离群点,使用模型的预测残差来检测离群点
Z-score方法检测离群点
detect outliers zscole
newmer
2025-02-18
检测数据表某一列的离群点
方差膨胀因子
calculate vif
newmer
2025-02-18
用于多重共线性检测
偏残差图
partial residuals
newmer
2025-02-18
可视化线性回归模型中每个自变量与因变量之间关系的图形。它可以帮助我们检查线性假设是否成立,以及是否存在非线性关系
误差独立性检验
test error independence
newmer
2025-02-18
对包含“误差项”或“残差”的制表符分隔文件,做误差独立性检验
正态分布检验
normality test
newmer
2025-02-18
对数据表数值列,做正态分布检验
回归诊断
regression diagnosis
newmer
2025-02-18
对数据表指定列,做回归分析和诊断
多元线性回归
regression multiple
newmer
2025-02-18
数据表计算多元线性回归(多个因变量)
多项式回归
regression polynomial
newmer
2025-02-18
数据表计算两列的多项式回归
多分格相关系数
polychoric corr
newmer
2025-02-18
数据表计算两个有序分类变量之间的系数
偏相关
partial corr
newmer
2025-02-18
数据表计算偏相关系数
频数统计
frequency table
newmer
2025-02-18
数据表指定列或所有列,统计频数
频数统计(分组)
frequency table group
newmer
2025-02-18
数据表指定列或所有列,分组统计频数
描述性统计(分组)
stats desc group
newmer
2025-02-18
数据表指定列或所有列,分组做描述性统计计算(包括总数、均值,标准差,分位数,极值等)
描述性统计
stats desc
newmer
2025-02-18
数据表指定列或所有列做描述性统计计算(包括总数、均值,标准差,分位数,极值等)
zScole标准化
scale zScole
newmer
2025-02-18
数据表指定列或所有列做z-Scole标准化
MinMax标准化
scale minMax
newmer
2025-02-18
数据表指定列或所有列做minMax 标准化
随机抽样
random sample
newmer
2025-02-18
按样本数或比例随机抽取数据表
角度和弧度转换
num degRad
newmer
2025-02-18
对数据表指定的列,计算角度或弧度值
三角函数
num tri
newmer
2025-02-18
对数据表指定的列,计算三角函数值
计算描述性统计量
num stat
newmer
2025-02-17
对数据表的指定列的数据计算平均数、中位数、标准差、分位数、和、最小值、或最大值等
保留小数位数
num round
newmer
2025-02-17
将数据表的指定列的数据保留小数位数
数计算次方数
num power
newmer
2025-02-17
将数据表的指定列的数据取指数,包括开方
数取log值
num log
newmer
2025-02-17
将数据表的指定列的数据取log值
数取绝对值
num abs
newmer
2025-02-17
将数据表的指定列的数据转绝对值
日期转时间戳
date2num
newmer
2025-02-17
将日期列,转为数值列
线性回归置信区间(分组)
newmer
2025-01-14
表格值范围筛选
table filter
newmer
2025-01-13
多组差异(各等长列之间比较)
groups cols diff
newmer
2025-01-13
各组各变量均值标准差
newmer
2025-01-13
箱线图
newmer
2025-01-13
小提琴图
newmer
2025-01-13
韦恩图(2-3组)
newmer
2025-01-13
聚类-层级聚类(按列聚类)
hcluster
newmer
2024-12-01
根据指定的相似度或距离定义计算出类之间的距离大致过程:1.将每一个元素单独定为一类2.重复:每一轮都合并指定距离(对指定距离的理解很重要)最小的类3.直到所有的元素都归为同一类层级聚类,使用Python的scipy.cluster包详细文档:https://docs.scipy.org/doc/scipy/reference/cluster.hierarchy.html
表格行排序(按指定顺序)
table sortByList
newmer
2024-12-01
3D散点
newmer
2024-11-08
表格合并(按指定列)
merge tableByCol
newmer
2024-09-11
提取或删除列
table pickCols
newmer
2024-08-28
表格对列排序
table sortCol
newmer
2024-08-26
表格排序
table sort
newmer
2024-08-26
筛选表格(按其他文件某列)
table extractByList
newmer
2024-08-26
加表头
table addHead
newmer
2024-08-26
新增列(固定值)
table addCol
newmer
2024-08-26
矩阵转3列表
matrix2list
newmer
2024-08-26
去多余空格且制表符分割
format strip tab
newmer
2024-08-26
列堆叠(包含固定列)
die colsFixedCols
newmer
2024-08-26
列堆叠
die cols
newmer
2024-08-26
新增列(去除首尾特殊字符)
colValue strip
newmer
2024-08-26
新增列(分割获取索引值)
colValue split
newmer
2024-08-26
新增列(转换某列值)
colValue replace
newmer
2024-08-26
新增列(匹配某列值)
colValue re
newmer
2024-08-26
新增列(计算值)
colValue exp
newmer
2024-08-26
统计某值次数
ValueCountN
newmer
2024-08-26
表格转单列值
trans keysNV
newmer
2024-08-26
线性回归置信区间(无分组)
lmConfidenceNoname
newmer
2024-08-26
差异显著字母标记法
abcMark my
newmer
2024-08-26
表格转置
trans
newmer
2024-08-21
相关性分析(2大块列之间)
corr cols
newmer
2024-08-21
分群重命名
scanpy renamecluster
newmer
2024-03-16
空间可视化
spatial scanpy view
newmer
2024-03-16
基因表达等信息空间可视化
spatial_scanpy
spatial scanpy
newmer
2024-03-16
质控、过滤、标准化、降维、分群、差异基因
spatial_scrna_lab
spatial scrna lab
newmer
2024-03-15
空间转录组和单细胞RNA测序数据结合
scanpy_view_clust
scanpy view clust
newmer
2024-03-15
基因表达或样本来源等信息展示在pca、umap图上
scanpy_v_topgene
scanpy view topgene
newmer
2024-03-15
Top基因可视化
scanpy_v_genelist
scanpy view genelist
newmer
2024-03-15
marker基因可视化
scanpy_scrna
scanpy scrna
newmer
2024-03-15
scanpy分析单细胞RNA数据
spatial_samples_merge
spatial samples merge
newmer
2024-03-15
多样本合并
spatial_de_gene
spatial de gene
newmer
2024-03-15
使用spatialDE查找空间特异性基因
scvelo
scvelo
newmer
2024-03-12
RNA速率分析
velocyto_loom
velocyto loom
newmer
2024-03-12
velocyto生成loom文件
cellchat1
cellchat1
newmer
2024-03-12
细胞通讯
gsea_go_kegg
gsea go kegg
newmer
2024-03-12
GSEA富集分析
scrna_enrich
scrna enrich
newmer
2024-03-12
富集分析
scrna_g_diff
scrna g diff
newmer
2024-03-12
两组比较
scrna_1sample
scrna 1sample
newmer
2024-03-12
单样本质控、分群、可视化
monocle_cluster
monocle cluster
newmer
2024-03-12
monocle拟时序分析(聚类基因)
monocle
monocle
newmer
2024-03-12
monocle拟时序分析(离散基因)
harmony
harmony
newmer
2024-03-12
去批次效应
merge_rds
merge rds
newmer
2024-03-12
合并单细胞rds文件
rds_split_by_group
rds split by group
newmer
2024-03-12
单细胞rds文件按组拆分
zscore计算
zscore
newmer
2023-10-24
Z score标准化是数据处理的一种常用方法。通过它能够将不同量级的数据转化为统一量度的Z score分值进行比较。
cellRanger count 分析
cellranger count
newmer
2023-10-22
单细胞cellRanger软件主分析流程
提取fasta序列(根据列表指定列)
fasta list2
newmer
2023-10-20
根据序列名称列表,从总序列文件中提取序列
筛选表(通过匹配列中字符串)
filter str table
newmer
2023-10-20
保留或去除某一列包含某字符串的行
丰度biom文件转qza
qiime2 biom qza
newmer
2023-08-10
丰度表biom格式转qza格式文件
soap2建索引
bwt builder
newmer
2023-05-22
使用soap2软件的2bwt-builder程序对参考序列建索引,用于soap2比对。
PCA(带图表)
pcapy4
newmer
2023-05-22
PCA分析:主成分分析,使用的是python的sklearn模块。
nmds
nmds
newmer
2023-05-22
NMDS分析采用降维的思想对样本关系进行低维平面的、样本距离矩阵的投影。使用的程序是R语言的vegan、ade4包
欧式距离计算
euc distance
newmer
2023-05-21
使用的是python的scipy模块计算欧式距离
dada2 (paired)
qiime2 dada2 paired
newmer
2023-05-20
使用命令qiime dada2 denoise-paired
dada2 (paired)-1
qiime2 dada2 paired1
newmer
2023-05-20
会用命令qiime dada2 denoise-paired
组装序列统计
seq summary
newmer
2023-05-18
统计序列数、碱基数、Large序列数、Large序列碱基数、最大长度、GC含量、N50、N90和N率等
gtf转bed文件
gtf2bed
newmer
2023-05-15
GTF格式文件转BED格式文件。脚本根据各列的信息进行格式转换
丰度文件转biom
to biom
newmer
2023-05-14
使用biom软件,将丰度文件转biom格式的压缩文件
qza解压
qiime2 qza to
newmer
2023-05-14
使用qiime2 将qza格式文件解压成一般格式文件,例如表格或fasta文件
Trinity组装结果统计
trinity stat
newmer
2023-05-14
脚本通过读取组装序列,对序列个数、GC含量、最小最大长度、平均长度、N50等进行统计
alpha指数
qiime2 alpha
newmer
2023-05-14
使用qiime diversity alpha命令,计算多样性alpha指数:shannon,chao1,ace,simpson等
minced
minced
newmer
2023-05-14
使用minCED软件做CRISPRs分析。可用于基因组或宏基因组数据。
phispy
phispy
newmer
2023-05-14
使用phispy软件,对基因组序列做前噬菌体预测
rfam注释
blast rfam
newmer
2023-05-14
使用blast软件,RNA序列比对rfam数据库,做RNA注释
stringtie merge gtf
gtf merge
newmer
2023-05-14
使用 stringtie --merge : StringTie will assemble transcripts from multiple input files generating a unified non-redundant set of isoforms
圈图cgview
cgview
newmer
2023-05-13
CGView - Circular Genome Viewer See the following link for full documentation: http://wishart.biology.ualberta.ca/cgview/ Please cite the following paper: Stothard P, Wishart DS. Circular genome visualization and exploration using CGView. Bioinformatics. 21:537-539.
基因注释
eggnog mapper
newmer
2023-05-13
**EggNOG-mapper** is a tool for fast functional annotation of novel sequences. It uses precomputed orthologous groups and phylogenies from the eggNOG database (http://eggnog5.embl.de) to transfer functional information from fine-grained orthologs only. Common uses of eggNOG-mapper include the annotation of novel genomes, transcriptomes or even metagenomic gene catalogs. The use of orthology predictions for functional annotation permits a higher precision than traditional homology searches (i.e. BLAST searches), as it avoids transferring annotations from close paralogs (duplicate genes with a higher chance of being involved in functional divergence). Benchmarks comparing different eggNOG-mapper options against BLAST and InterProScan [can be found here](https://github.com/jhcepas/emapper-benchmark/blob/master/benchmark_analysis.ipynb). EggNOG-mapper is also available as a public online resource: http://eggnog-mapper.embl.de # Documentation https://github.com/jhcepas/eggnog-mapper/wiki If you use this software, please cite: [1] eggNOG-mapper v2: functional annotation, orthology assignments, and domain prediction at the metagenomic scale. Carlos P. Cantalapiedra, Ana Hernandez-Plaza, Ivica Letunic, Peer Bork, Jaime Huerta-Cepas. 2021. Molecular Biology and Evolution, msab293, https://doi.org/10.1093/molbev/msab293 [2] eggNOG 5.0: a hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Jaime Huerta-Cepas, Damian Szklarczyk, Davide Heller, Ana Hernández-Plaza, Sofia K Forslund, Helen Cook, Daniel R Mende, Ivica Letunic, Thomas Rattei, Lars J Jensen, Christian von Mering, Peer Bork Nucleic Acids Res. 2019 Jan 8; 47(Database issue): D309–D314. doi: 10.1093/nar/gky1085
提取fasta序列(根据列表)
fasta list
newmer
2023-05-13
根据序列名称列表,从总序列文件中提取序列
物种序列转qza
qiime2 seq qza
newmer
2023-05-13
使用qiime2软件,将物种序列文件转qza格式文件
真核转录组从头组装(trinity)
trinity
newmer
2023-05-13
Trinity,是由 the Broad Institute 开发的转录组de novo组装软件,由三个独立的软件模块组成:Inchworm,Chrysalis和Butterfly。三个软件依次来处理大规模的RNA-seq的reads数据。Trinity的简要工作流程为: Inchworm: 将RNA-seq的原始reads数据组装成Unique序列; Chrysalis: 将上一步生成的contigs聚类,然后对每个类构建Bruijn图; Butterfly: 处理这些Bruijn图,依据图中reads和成对的reads来寻找路径,从而得到具有可变剪接的全长转录子,同时将旁系同源基因的转录子分开。
编码区域预测(结合pfam)
cds predict p
newmer
2023-05-13
使用transdecode软件,并结合参考基因,做编码序列预测。 TransDecoder identifies candidate coding regions within transcript sequences, such as those generated by de novo RNA-Seq transcript assembly using Trinity, or constructed based on RNA-Seq alignments to the genome using Tophat and Cufflinks. The software is primarily maintained by Brian Haas at the Broad Institute and Alexie Papanicolaou at the Commonwealth Scientific and Industrial Research Organisation (CSIRO). It is integrated into other related software such as Trinity, PASA, EVidenceModeler, and Trinotate. Full documentation is provided at: http://transdecoder.github.io
编码区域预测
cds predict
newmer
2023-05-13
使用transdecode软件,做编码序列预测 TransDecoder identifies candidate coding regions within transcript sequences, such as those generated by de novo RNA-Seq transcript assembly using Trinity, or constructed based on RNA-Seq alignments to the genome using Tophat and Cufflinks. The software is primarily maintained by Brian Haas at the Broad Institute and Alexie Papanicolaou at the Commonwealth Scientific and Industrial Research Organisation (CSIRO). It is integrated into other related software such as Trinity, PASA, EVidenceModeler, and Trinotate. Full documentation is provided at: http://transdecoder.github.io
sam转bam格式
sam bam
newmer
2023-05-11
sam文件,全称Sequence Alignment/Map,一般是序列比对程序标准输出文件 bam文件,sam文件的二进制压缩文件。sam转bam可减小存储。 文件格式转化,使用的是samtools软件
rnafold
rnafold
newmer
2023-05-11
使用viennarna软件的RNAfold工具预测RNA的二级结构
bowtie2比对
bowtie2
newmer
2023-05-11
bowtie2先对参考序列建索引,然后比对生成sam文件,samtools软件再将sam转为bam文件
提取fasta序列(根据bed)
fasta bed
newmer
2023-05-11
使用bedtools软件,根据bed文件(包含序列名称、位置信息),从总序列中提取序列
islandpath
islandpath
newmer
2023-05-11
使用islandpath软件做原核生物基因岛预测。输入gbk文件
基因预测(metagene)
metagene
newmer
2023-05-11
使用metagene软件,快速的宏基因组基因预测
soap2比对
soap2
newmer
2023-05-11
soap2,用于短序列比对。是soap的升级版,提高了短序列比对的运行速度和精度,同时支持不同长度的读长
metaphlan宏基因组物种注释
metaphlan
newmer
2023-05-11
MetaPhlAn 是二代测序物种分类的工具,可得到宏基因组物种分类的列表,以及相对丰度信息。 可直接使用fastq数据。
fastp质控
fastp
newmer
2023-05-11
fastp A tool designed to provide fast all-in-one preprocessing for FastQ files. This tool is developed in C++ with multithreading supported to afford high performance.
kallisto定量
kallisto quant
newmer
2023-04-17
kallisto采用一种被称作伪比对(pseudoalignment)的方式直接将测序片段直接比对到cDNA序列然后定量
kallisto建索引
kallisto index
newmer
2023-04-17
kallisto采用一种被称作伪比对(pseudoalignment)的方式直接将测序片段直接比对到cDNA序列然后定量 在定量之前需要对参考序列构建索引。
hisat2比对索引
hisat2 step2
newmer
2023-04-11
Hisat2是一款短序列比对的工具,主要用于转录组数据的比对。 hisat2-build建好索引之后,输入reads进行比对。
hisat2建索引
hisat2 index
newmer
2023-04-11
Hisat2是一款短序列比对的工具,主要用于转录组数据的比对。比对之前需对参考序列构建索引。
RNA测序的reads比对
hisat2
newmer
2023-04-11
Hisat2是一款短序列比对的工具,主要用于转录组数据的比对。 hisat2-build建好索引之后,输入reads进行比对。
fastqc测序原始数据
fastqc
newmer
2023-04-11
FastQC软件用于二代测序数据质量的评估,能快速对测序数据进行检测,并生成详细的质量评估报告
bam排序
bam sort
newmer
2023-04-10
使用samtools软件对bam文件进行排序
宏基因组数据salmon定量
salmon metaquant
newmer
2023-04-10
Salmon不比对快速宏基因组基因定量
salmon建索引
salmon index
newmer
2023-04-10
salmon软件用于基因表达量或丰度的计算,需要先对参考序列建立索引。
去冗余序列(cd-hit)
cdhit
newmer
2023-04-07
使用cd-hit软件,去fasta文件的冗余序列
序列合并
merge seqs
newmer
2023-04-07
将多个fasta序列文件合并成一个文件。序列名称会加上指定的前缀,以防重名。
提取metagene预测的序列
metagene fa
newmer
2023-04-07
megagene基因预测软件生成的的结果是表格形式,包含基因在长序列中的位置信息, 根据该表和预测用的长序列,提取基因的核酸序列
megahit组装
megahit
newmer
2023-04-04
megahit用于宏基因组测序数据的组装。组装速度较快,消耗资源较低。
相关性分析(带图表)
corr3
newmer
2023-03-31
相关性分析使用的是python的scipy.stats模块
vsearch分类
qiime2 classify vsearch
newmer
2023-03-31
使用qiime feature-classifier classify-consensus-vsearch命令,对物种序列分类
重复序列检测
repeatmasker
newmer
2023-03-30
RepeatMasker Developed by Arian Smit and Robert Hubley Please refer to: Smit, AFA, Hubley, R. & Green, P "RepeatMasker" at http://www.repeatmasker.org RepeatMasker is a program that screens DNA sequences for interspersed repeats and low complexity DNA sequences. The output of the program is a detailed annotation of the repeats that are present in the query sequence as well as a modified version of the query sequence in which all the annotated repeats have been masked (default: replaced by Ns). Sequence comparisons in RepeatMasker are performed by the program cross_match, an efficient implementation of the Smith-Waterman-Gotoh algorithm developed by Phil Green, or by WU-Blast developed by Warren Gish
blast分类
qiime2 classify blast
newmer
2023-03-30
使用qiime feature-classifier classify-consensus-blast命令
vsearch OTU (de-novo)
qiime2 pick otu
newmer
2023-03-30
使用qiime vsearch cluster-features-de-novo 命令,获得代表的otu序列
vsearch 去重复
qiime2 vsearch derep
newmer
2023-03-30
使用qiime vsearch dereplicate-sequences命令,去重复序列。
样品fasta数据转qza
qiime2 sample seq
newmer
2023-03-30
使用qiime2软件,将fasta文件转为qza格式文件 qza格式是“Qiime Zipped Archive”的英文缩写,是Qiime软件使用的存档格式文件
deblur denoise-16S
qiime2 deblur
newmer
2023-03-30
qiime deblur denoise-16S 命令
原始数据 过滤
qiime2 quality filter
newmer
2023-03-30
使用qiime quality-filter命令,过滤低质量的reads
原始数据 join
qiime2 join pair
newmer
2023-03-30
使用qiime vsearch join-pairs命令,将左右端reads进行merge
去引物接头
qiime2 trim
newmer
2023-03-30
使用qiime cutadapt命令,去除引物reads引物
dada2 (single)
qiime2 dada2 single
newmer
2023-03-30
使用qiime dada2 denoise-single 命令
PE原始数据生成qza
qiime2 paired demux
newmer
2023-03-30
使用qiime tools import 命令,将PE原始数据生成qza
tax表转qza
qiime2 tax qza
newmer
2023-03-30
物种分类的tax表转qza格式文件
表格处理—去缺失值行
datarm
newmer
2023-03-29
删除表格缺失值达到一定比例的行
表格处理—缺失值填充
datafill
newmer
2023-03-29
对文本格式的表格进行缺失值填充
表格处理—对数处理
datalog
newmer
2023-03-29
输入
表格处理—归一化
datanorm
newmer
2023-03-29
对文本格式的表格进行归一化处理
dbRDA
dbrda
newmer
2023-03-29
dbRDA是一种基于距离的冗余分析方法,可用于分析环境因子对微生物群落结构和功能的影响。 使用的是R语言的vegan包
rda-cca
rdacca
newmer
2023-03-29
RDA-CCA分析使用的是R语言的vegan包进行分析
pcoa
pcoa
newmer
2023-03-29
PCoA分析采用降维的思想对样本关系进行低维平面的、样本距离矩阵的投影。 使用的程序是R语言的vegan、ade4包
聚类-kmean聚类
kcluster
newmer
2023-03-29
kmeans聚类大致过程 1.假定对N个样本观测做聚类,要求聚为K类,首先选择K个点作为初始中心点; 2.按照距离初始中心点最小的原则,把所有观测分到各中心点所在的类中; 3.每类中有若干个观测,计算K个类中所有样本点的均值,作为第二次迭代的K个中心点; 4.然后根据这个中心重复第2、3步,直到收敛(中心点不再改变或达到指定的迭代次数),聚类过程结束 采用的程序是python的sklearn.cluster.KMeans 详见: http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html
adonis分析
adonis
newmer
2023-03-29
adonis是一种基于距离的多元统计分析方法,是置换多元方差分析的简称。 通过投影到新空间,计算距离,从而确定样本之间的相似性或冗余度 使用的程序是R语言的vegan包
回归分析
regression
newmer
2023-03-29
回归分析使用的是R语言的lm函数
ROC
roc
newmer
2023-03-29
ROC用于评估二元分类模型性能的图形化方法。 程序使用的R语言的pROC包。 该曲线的横坐标为灵敏度(sensitivity),即模型预测某个类别的概率; 纵坐标为特异性(specificity),即模型预测为某个类别而实际为另一个类别的概率。 ROC曲线的斜率表示灵敏度和特异性的比值,比值越接近1,说明模型性能越好。
vpa方差分解分析
vpa
newmer
2023-03-29
VPA:方差分解分析(Variance Partitioning Analysis)可用于确定指定环境因子对微生物(原生生物/植物/动物等等)群落结构变化的解释比例。 平台使用的是R语言的vegan包
anova检验
anova
newmer
2023-03-29
比较多组差异的单因素方差分析,采用R语言的oneway.test函数分析
Wallis秩和检验
wallis
newmer
2023-03-29
Wallis 秩和检验是一种用于检验多个独立样本的分布是否相同的非参数统计方法。 使用的R语言的kruskal.test函数 该方法通过比较样本均值之间的差异来确定它们的相对顺序,从而避免了使用显著性检验或t-test等参数方法所带来的偏差。
fisher检验
fisher
newmer
2023-03-29
两样本之间的差异检验。使用的程序是R语言的fisher.test函数
chi-sq检验
chiSq
newmer
2023-03-29
两样本之间的差异检验。使用的程序是R语言的chisq.test函数
welch-T检验
welch
newmer
2023-03-29
两组差异的welch T 检验,采用R语言的wilcox.test程序分析
student-T检验
tTest
newmer
2023-03-29
使用R语言的t.test函数做student T 检验,比较两组数据是否有显著性差异
isescan
isescan
newmer
2023-03-29
插入序列(IS)是原核基因组中最小但最丰富的可移动元件 ISEScan用于原核生物基因组中的IS元件的鉴定
vcf文件合并
bcftools concat
newmer
2023-03-29
使用bcftools软件,合并vcf文件
vcf文件排序
vcf sort
newmer
2023-03-29
使用bcftools软件,对 vcf文件排序
svg转png
svg png
newmer
2023-03-29
使用python的cairosvg包将svg图片转为png图片
比较gtf文件
gtf comp
newmer
2023-03-29
比较gff/gtf 文件,使用gffcompare软件。 classify transcripts from one or multiple GTF/GFF3 files as they relate to reference transcripts provided in a annotation file (also in GTF/GFF3 format) More details and usage examples can be found in the paper: [DOI: 10.12688/f1000research.23297.1](http://dx.doi.org/10.12688/f1000research.23297.1) which can be also used to cite this software. The official documentation and download packages for this utility can be found online here: http://ccb.jhu.edu/software/stringtie/gffcompare.shtml For more information about the GFF3/GTF file formats expected by GffCompare please refer to the available online documentation -- a quick review can be found at: http://ccb.jhu.edu/software/stringtie/gff.shtml
biom转tsv
biom tsv
newmer
2023-03-29
使用biom软件,将biom格式的压缩文件还原成丰度文件
lncRNA注释
lncrna anno
newmer
2023-03-29
使用cmscan软件,用lncRNA序列比对rfam数据,从而对lncRNA做注释或分类
prodigal基因预测
prodigal
newmer
2023-03-29
Prodigal是为细菌和古菌基因组进行蛋白编码基因预测的软件。 可分析单基因组或宏基因组。 生成基因预测结果、基因核酸序列和蛋白序列。
gff3 转bed格式
gff3 bed
newmer
2023-03-29
GFF3格式文件转BED格式文件。脚本根据各列的信息进行格式转换
hmmscan
hmmscan
newmer
2023-03-29
使用hmmscan软件,将氨基酸序列比对pfam数据库
表达量计算-rsem
rsem
newmer
2023-03-29
使用rsem软件建索引并计算表达量
表达量计算-kallisto
kallisto
newmer
2023-03-29
使用kallisto软件建索引并计算表达量
表达量计算-salmon
salmon
newmer
2023-03-29
使用salmon软件建索引并计算表达量
染色体覆盖度分析
chr bam stat
newmer
2023-03-28
输入比对得到的bam,统计染色体的覆盖度
stringtie拼接
tringtie
newmer
2023-03-28
Stringtie是一个基因和转录本组装软件。
rrna污染检测
rrna stat
newmer
2023-03-28
reads的fasta文件比对rfam数据库,统计比对到rRNA序列的reads丰度
测序深度计算
seq depth
newmer
2023-03-28
计算测序深度 主要使用bowtie2建索引和比对。samtool处理比对生成的bam格式文件,计算测序深度。
tRNA预测
trnascan
newmer
2023-03-28
tRNAscan-SE: An improved tool for transfer RNA detection tRNAscan-SE was written in the PERL (version 5) script language. Input consists of DNA or RNA sequences in FASTA format. tRNA predictions are output in standard tabular or ACeDB format. tRNAscan-SE does no tRNA detection itself, but instead combines the strengths of three independent tRNA prediction programs by negotiating the flow of information between them, performing a limited amount of post-processing, and outputting the results in one of several formats.
rRNA预测
barrnap
newmer
2023-03-28
使用barrnap软件对细菌、古细菌、线粒体、真核等做rna预测。 并使用脚本提取rna序列 If you use Barrnap in your work, please cite: Seemann T barrnap 0.9 : rapid ribosomal RNA prediction https://github.com/tseemann/barrnap
核酸转蛋白序列
fnn2faa
newmer
2023-03-28
基因的核酸序列转氨基酸序列 使用EMBOSS-6.5.7的transeq子程序
基因预测(glimmer)
glimmer
newmer
2023-03-28
使用glimmer预测微生物DNA中的基因(特别是细菌、古菌和病毒)。
gapcloser
gapcloser
newmer
2023-03-28
组装序列存在Gap,Gapcloser可基于reads 填充Gap,使组装结果更完整。 gapcloser常用于Soapdenovo2软件组装后的Gap填充。
soapdenovo
soapdenovo2
newmer
2023-03-28
SOAPdenovo2是用于short-read组装的软件,可用于大型植物和动物、细菌和真菌等基因组组装
提取fasta序列(根据gtf文件)
fasta gtf
newmer
2023-03-13
使用gffread软件,根据gtf文件(包含序列名称、位置信息),从总序列中提取序列
置信椭圆
ellipse
newmer
2022-08-17
使用的是R的car包计算置信椭圆的坐标
vif分析
vif
newmer
2022-03-06
方差膨胀因子(VIF),是表征自变量观察值之间复共线性程度的数值。 VIF越大,说明自变量之间存在共线性的可能性越大。一般来讲,如果方差膨胀因子超过10,则回归模型存在严重的多重共线性。 平台使用的是R语言的vegan包
提取glimmer序列
glimmer2ffn
newmer
2022-01-12
glimmer基因预测软件生成的的结果是表格形式,包含基因在长序列中的位置信息, 根据该表和预测用的长序列,提取基因的核酸序列
fasta sort
fasta sort
newmer
2022-01-12
按序列的长度排序,序列重新编号
生信通明
木牛零码
NGplot
Newmer生信
Copyright © 2021-2024 上海牛马人生物科技有限公司
沪ICP备 2022007390号-2