搜索
查看: 1804|回复: 3

有关mRNA疑惑

[复制链接]

12

主题

32

帖子

191

积分

注册会员

Rank: 2

积分
191
发表于 2017-1-9 21:54:54 | 显示全部楼层 |阅读模式
从RNA-seq中下载的TCGA数据中,我需要挑选出mRNA,是根据从GENCODE上下载的注释文件根据gene_type "protein_coding"获得吗?这样对吗?对的话获得的mRNA是否全面,如果不对的话,应该怎么选?非常感谢
回复

使用道具 举报

20

主题

68

帖子

870

积分

版主

Rank: 7Rank: 7Rank: 7

积分
870
QQ
发表于 2017-1-10 06:25:30 | 显示全部楼层
I used the gff3 file that is downloaded from Ensembl FTP. I think all genes are included.
You really shouldn't spend your time reinventing the wheel
回复 支持 反对

使用道具 举报

12

主题

32

帖子

191

积分

注册会员

Rank: 2

积分
191
 楼主| 发表于 2017-1-10 21:32:07 | 显示全部楼层
本帖最后由 w1035660826 于 2017-1-15 18:18 编辑
bioinfo.dong 发表于 2017-1-10 06:25
I used the gff3 file that is downloaded from Ensembl FTP. I think all genes are included.

那如果您筛选lncRNA时,也根据从Ensembl上下载的注释文件筛选吗?我是直接在GENCODE上下载了LNCRNA的注释文件进行筛选的。
ps:gene_id:ENSG00000187634.11的解释是不是gene:ENSG00000187634,版本号为11???
是版本号,已经找到了~~
回复 支持 反对

使用道具 举报

12

主题

32

帖子

191

积分

注册会员

Rank: 2

积分
191
 楼主| 发表于 2017-1-15 18:17:56 | 显示全部楼层
bioinfo.dong 发表于 2017-1-10 06:25
I used the gff3 file that is downloaded from Ensembl FTP. I think all genes are included.

不好意思,我想问一下,您在比对TCGA的的基因时使用ENSG00000187634.11还是ENSG00000187634(去除版本号的),这两者得到的结果差别比较大的?想问一下您是怎么做的?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-22 08:32 , Processed in 0.028573 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.