搜索
查看: 3147|回复: 0

[other] 从UCSC上下载人类基因组TSS(转录起始位点)区域bed文件实战

[复制链接]

7

主题

25

帖子

678

积分

高级会员

Rank: 4

积分
678
发表于 2017-7-26 14:56:21 | 显示全部楼层 |阅读模式
本帖最后由 xotong 于 2017-7-26 15:00 编辑

首先,进入UCSC官网 http://genome.ucsc.edu/,选择“Tools”——“Table Browser”,如下图选择参数:



选择输出格式:按照群主的perl代码,选择输出的是bed格式文件,如下: chrom / chromStart /chromEnd /name /score /strand (这里定义的TSS(转录起始位点)区域上下游2.5kb),代码如下:


[Bash shell] 纯文本查看 复制代码
perl -alne '{next if /^#/;if($F[3] eq "+"){$start=$F[4]-2500;$end=$F[4]+2500}else{$start=$F[5]-2500;$end=$F[5]+2500}print join("\t",$F[2],$start,$end,$F[12],0,$F[3])}' ucsc.refseq-hg19.tss.bed |sort -u >ucsc.refseq-hg19.tss.bed

删除掉其中一些非正常染色体的,得到如下文件。


[Bash shell] 纯文本查看 复制代码
grep -v random ucsc.refseq-hg19.tss.bed > ucsc.refseq-hg19-final.tss.bed






上一篇:使用GATK的GenotypeGVCFs工具处理HaplotypeCaller结果为何会丢失id?
下一篇:【bioamin-perl练习1】注释文件.gff和序列文件.fna提取16srRNA
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-14 22:18 , Processed in 0.029628 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.