搜索
查看: 2651|回复: 4

[function-annotation] 叶绿体基因组分析中mVISTA软件如何使用

[复制链接]

2

主题

5

帖子

76

积分

注册会员

Rank: 2

积分
76
发表于 2018-11-15 15:08:14 | 显示全部楼层 |阅读模式
近期处理叶绿体基因组结构分析内容,在关于叶绿体基因的变异可视化图mVISTA使用,网页版工具发现VISTA格式是需要自己生成,请问有做过相关工作的指导下VISTA文件格式是怎么弄出来的吗
回复

使用道具 举报

3

主题

25

帖子

464

积分

中级会员

Rank: 3Rank: 3

积分
464
发表于 2018-11-16 16:49:02 | 显示全部楼层
自己写了一个简单的python脚本处理genbank格式文件得到mVISTA的注释文件(需要安装biopython模块),可以给我邮箱我发给你

import argparse

from Bio import SeqIO

parser = argparse.ArgumentParser(description = 'This script was used to get mVISTA annotation file used to cp genome comparative analysis')
parser.add_argument('-i','--genbank',help="Please input genBank format file", required = True)
args = parser.parse_args()

fw = open(args.genbank + "_mVISTA_annotation","w")

for rec in SeqIO.parse(args.genbank,"gb"):
        for feature in rec.features:
                if feature.type == "gene":
                        for part in feature.location.parts:
                                if part.strand == -1:
                                        start_location = str(part.start)
                                        end_location = str(part.end)
                                        gene_name = feature.qualifiers["gene"][0]
                                        fw.write("<\t%s\t%s\t%s\n"%(start_location,end_location,gene_name))
                                else:
                                        start_location = str(part.start)
                                        end_location = str(part.end)
                                        gene_name = feature.qualifiers["gene"][0]
                                        fw.write("<\t%s\t%s\t%s\n"%(start_location,end_location,gene_name))
                elif feature.type == "CDS":
                        for part in feature.location.parts:
                                if part.strand == -1:
                                        start_location = str(part.start)
                                        end_location = str(part.end)
                                        fw.write("%s\t%s\t%s\n"%(start_location,end_location,"exon"))
                                else:
                                        start_location = str(part.start)
                                        end_location = str(part.end)
                                        fw.write("%s\t%s\t%s\n"%(start_location,end_location,"exon"))
                elif feature.type == "tRNA" or feature.type == "rRNA":
                        for part in feature.location.parts:
                                start_location = str(feature.location.start)
                                end_location = str(feature.location.end)
                                fw.write("%s\t%s\t%s\n"%(start_location,end_location,"utr"))
                else:
                        print("%s %s"%(feature.type,"is not needed"))
                       
print("The process is done!")

fw.close()
                       
回复 支持 1 反对 0

使用道具 举报

2

主题

5

帖子

76

积分

注册会员

Rank: 2

积分
76
 楼主| 发表于 2018-11-24 16:09:41 | 显示全部楼层
十分感谢,请问您有用过Mesquite来分析叶绿体基因组IR边界的扩张收缩吗,之前看论文作者说是用这个软件画的图,但是自己尝试用了这个软件发现根本画不出他的图,不知道是不是他的有问题
回复 支持 反对

使用道具 举报

2

主题

5

帖子

76

积分

注册会员

Rank: 2

积分
76
 楼主| 发表于 2018-11-24 16:10:21 | 显示全部楼层
本帖最后由 LDK2018 于 2018-11-24 16:15 编辑

D:\Aeridinae_data\Aerides-Gastrochilus\论文图表
捕获.PNG
回复 支持 反对

使用道具 举报

3

主题

25

帖子

464

积分

中级会员

Rank: 3Rank: 3

积分
464
发表于 2019-1-26 21:24:26 | 显示全部楼层
这个软件我不知道如何使用,话这个图我用的是IRScope这个在线软件
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-11-23 08:23 , Processed in 0.031286 second(s), 31 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.