反馈咨询
欢迎添加微信!
微信号:z_gqing
微信二维码:

介绍

GTF格式文件转BED格式文件。脚本根据各列的信息进行格式转换

输入

GTF全称Gene transfer format, 每列的含义如下 1. column1 第一列是seqid, 代表序列ID, 通常是染色体的ID, 每条染色体拥有一个唯一的ID。 2. column2 第二列是source, 代表基因结构的来源,可以为空,用.点号填充。 3. column3 第三列是feature, 代表区间对应的特征类型, 4. column4 第四列是start, 代表区间的起始位置 5. column5 第五列是end, 代表区间的终止位置 6. column6 第六列是score, 软件提供了统计值,如果没有,就用.填充 7. column7 第七列是strand, 代表正负链的信息, +表示正链,-表示负链,?表示不清楚正负链的信息。没有可以用.填充 8. column8 第八列是phase,当描述的是CDS区间信息时,需要指定翻译时开始的位置,取值范围有0,1,2两种 9. column9 第九列是attributes, 表示属性,每种属性写法为key value, 注意和gff中key=value有所区别,而且必须有gene_id和transcript_id这两个属性, 多个属性用分号分隔

结果

BED文件 BED(Browser Extensible Data)文件格式常用来描述注释的数据。 有3个要求的列和9个额外列 1,chrom, 染色体或scafflold 的名字 2,chromStart 染色体和scaffold的起始位置,第一个染色体的位置是0 3,chromEn 染色体和scaffold的结束位置 其次9个额外的可选BED列是: 4,name 定义BED 的名字 5,score 0到1000的分值,如果track线在注释时属性设置为1,那么这个分值会决定现示灰度水平,数字越大,灰度越高。下面的这个表格显示Genome Browser 6,strand 定义链的''+” 或者”-” 7,thickStart 开始的位置,这个特征是画thickly 8,thickEnd 结束的位置,这个特征是画thickly  9,itemRGB An AGB 值的形式 10,blockCount BED线在exon 的block数目 11,blockSize 用逗号分割block size 12,blockStarts-
生信通明 木牛零码 NGplot Newmer生信 公司产品
Copyright © 2021-2024 上海牛马人生物科技有限公司 沪ICP备 2022007390号-2