搜索
查看: 2596|回复: 1

[mRNA-seq] 转录组作业(四)了解参考基因组及基因注释

[复制链接]

11

主题

22

帖子

330

积分

中级会员

Rank: 3Rank: 3

积分
330
发表于 2017-11-4 02:44:31 | 显示全部楼层 |阅读模式
转录组作业(四)了解参考基因组及基因注释
作业要求:在UCSC上下载hg19参考基因组,从genecode数据库下载基因注释文件,并用IGV取查看你感兴趣的基因总也,截图几个基因的IGV可视化结构!还可以下载ENSEMBL,NCBI的gtf,导入IGV查看,截图基因结构。了解IGV常识。
1.下载hg19参考基因组。
目前常用的人的参考基因组版本:(来源于Jimmy)
NCBI                      UCSC                   Ensemble
GRCh36                   hg18                    ENSEMBL release_52               
GRCh37                    hg19                    ENSEMBL release_59/61/64/68/69/75
GRCh38                     hg38                    ENSEMBL release_76/77/78/80/81/82
NCBI截图
UCSC可能因为最近网络关系,我打不开。
Ensemble
2.参考基因组的下载
作业上提供的代码:
下载了很多次,都是一动不动,我自己也无法进入网站。今天晚上突然可以用了,我也是略略略
cd /mnt/d/reference/genomes/hg19
axel http://hgdownload.soe.ucsc.edu/g ... Zips/chromFa.tar.gz
#解压,得到所有染色体的信息
tar -zxvf chromFa.tar.gz
#将所有的染色体信息整合在一起,重定向写入hg19.fa文件,得到参考基因组
cat *.fa > hg19.fa
# 将多余的染色体信息文件删除,节省空间
  rm -rf chr*参考基因组注释下载
下载基因注释文件

axel    ftp://ftp.sanger.ac.uk/pub/genco ... 7.annotation.gtf.gz
##解压
gzip -d gencode.v26lift37.annotation.gtf.gz下载安装IGV
我下的是win版本。
双击igv文件
通过genome -> Load Genome From Files加载之前得到基因组文件。
进一步,还需要加载gff基因注释文件,File -> Load From Files ,这一步需要对gtf文件进行sort
选择 Tools-Run igvtools,获得sorted文件:command选择sort,再选择输入的注释文件,点击Run,就可以生成sorted.gtf文件。然后File -> Load From Files,选择新生成的sorted.gtf文件。
这是我截屏的TP53基因,觉得好丑,慢慢摸索吧。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:请教PLS-DA
下一篇:转录组作业(5)序列比对
回复

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-11-5 09:34:37 | 显示全部楼层
墙内的朋友做科研真心不容易啊
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-21 09:15 , Processed in 0.235234 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.