搜索
查看: 2681|回复: 1

#文件准备【直播】我的基因组(十二):先粗略看看几个基...

[复制链接]

1

主题

1

帖子

29

积分

新手上路

Rank: 1

积分
29
发表于 2017-1-24 11:54:38 | 显示全部楼层 |阅读模式
在【直播】我的基因组(十二):先粗略看看几个基因吧文章中,博主在文章中会用到一个文件protein_coding.hg19.position这个文件在前面的文章中并没有明确的具体说明在哪里下载,有的小伙伴们,可能会不知道这个文件具体是如何得到的,这里我做简单的说明。
根据文件的名字,我们可以知道这个是编码蛋白质基因的区间位置,虽然群主没有给出具体的下载方法和制作方法,其实生成这个文件并不是难事,群主应该是直接从hg19的基因组注释文件中,提取蛋白质编码基因的位置信息即可。
通过阅读群主几篇相关的文章,基因组标准注释文件-Gencode数据库http://www.bio-info-trainee.com/1781.html),基因组各种版本对应关系http://www.bio-info-trainee.com/1469.html)。群主应该是从Gencode数据库(http://www.gencodegenes.org/)下载人类hg19的的注释文件,



然后通过编写一个小脚本,然后提取蛋白质编码基因的位置信息。




1.png
2.png



上一篇:【直播】我的基因组(一):直播的目的及意义
下一篇:【直播】我的基因组(二):科研和临床分析调研
回复

使用道具 举报

633

主题

1189

帖子

4054

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4054
发表于 2017-1-24 12:01:24 | 显示全部楼层
根据gtf格式的基因注释文件得到人所有基因的染色体坐标,http://www.biotrainee.com/thread-472-1-1.html
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-6-1 13:07 , Processed in 0.023936 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.