搜索
查看: 1538|回复: 1

[mRNA-seq] 请教一下基因组注释生成索引问题

[复制链接]

1

主题

2

帖子

23

积分

新手上路

Rank: 1

积分
23
发表于 2020-7-28 10:57:19 | 显示全部楼层 |阅读模式
简单概述:进行基因组注释的时候,从网站上下载的fa序列文件和gff3注释文件,并且用gffread将gff3转为了gtf,但是我在用STAR生成索引目录的时候,出错,显示GTF和FASTA文件之间的染色体命名不同,但是搞不清楚到底是什么的不同。



我从整合网站上,下载了fa文件和gff文件准备用于生成基因组索引’’按理来说都发网站了,这个版本对应应该没问题

由于下载的是gff3格式的文件
我用这个代码改成了gtf文件
gffread Ensembl79_UMD3.1_genes.gff3 -T -o Ensembl79_UMD3.1_genes.gtf
Cat了一下,输出没什么问题

用视频上介绍的代码,准备生成索引
STAR --runThreadN 6 --runMode genomeGenerate \   
--genomeDir bos_STAR_genome \
--genomeFastaFiles 00ref/UMD3.1_chromosomes.fa \
--sjdbGTFfile 00ref/Ensembl79_UMD3.1_genes.gtf \
--sjdbOverhang

但是就开始报错了:Fatal INPUT FILE error, no valid exon lines in the GTF file: 00ref/Ensembl79_UMD3.1_genes.gtf
Solution: check the formatting of the GTF file. Most likely cause is the difference in chromosome naming between GTF and FASTA file.

现在两眼一摸黑,完全搞不懂怎么解决这个问题,求大神进来看看指点我一下

图片1.png
图片2.png
回复

使用道具 举报

1

主题

2

帖子

23

积分

新手上路

Rank: 1

积分
23
 楼主| 发表于 2020-7-29 08:44:57 | 显示全部楼层
好吧,自己解决了!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-11-25 18:28 , Processed in 0.026221 second(s), 33 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.