搜索
查看: 1383|回复: 0

[software] 序列下载及处理之seqinr包

[复制链接]

29

主题

29

帖子

149

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
149
发表于 2018-9-17 15:04:14 | 显示全部楼层 |阅读模式
简单功能:希望大家能能够熟悉如何用该包去数据库下载数据,及简单的处理。
缺点:需要联网,经常出错,不是操作问题而是因为网络问题
安装[mw_shl_code=python,true]if("seqinr" %in% rownames(installed.packages()) == FALSE) {source("http://bioconductor.org/biocLite.R");biocLite("seqinr")}
suppressMessages(library(seqinr))
ls('package:seqinr')[/mw_shl_code]
###Retrieving a sequence and write into FASTA file###
1) 选择要去fetch序列的数据库(这里已genebank为例)
[mw_shl_code=python,true]choosebank()   #查看有哪些数据库
choosebank('genbank')[/mw_shl_code]

123

123

2)一旦选择好了数据库,用query信息进行收索
[mw_shl_code=python,true]BRCA1<- query("BRCA1", "SP=Homo sapiens AND K=BRCA1")[/mw_shl_code]
3)查看query返回的对象所有属性
[mw_shl_code=python,true]attributes(BRCA1)
mynames <- getName(BRCA1)  #查看所有搜索到的名称
length(mynames)             #查看共检索到多少,写入到文档的时候可以用来用来检查 209[/mw_shl_code]
4)查看所有收索到的序列所包含的属性
[mw_shl_code=python,true]BARC1$req[/mw_shl_code]
5) 获取所有检索到的序列,并以fasta格式写入到文件中
[mw_shl_code=python,true]all_myseqs <- getSequence(BRCA1)    #所有收索到的序列
write.fasta(all_myseqs, mynames, file.out = "MyBRCA.fasta") #将所有收索到的序列写入fasta格式文件。[/mw_shl_code]
6)提取上述特定的序列(第一条序列),及注释信息
[mw_shl_code=python,true]myseq <- getSequence(BRCA1$req[[1]])<br>annots <- getAnnot(BRCA1$req[[1]])
myseq[/mw_shl_code]

234

234

7)统计序列中各个含量
[mw_shl_code=python,true]table(myseq)       #统计该序列中碱基使用情况
length(myseq)       #计算序列长度
table(myseq)/length(myseq)  #统计碱基百分比
GC(myseq)            #计算GC含量
seqinr::count(myseq, wordsize=2)  #以2个碱基出现频率
seqinr::count(myseq, wordsize=3)  #以三个碱基出现频率
seqinr::count(myseq, wordsize=4)  #以四个碱基出现频率
seqinr::count(myseq, wordsize=5)  #以5个碱基出现频率[/mw_shl_code]
8)关闭接口,防止打开多个接口
[mw_shl_code=python,true]closebank()[/mw_shl_code]
除了上述之外,如果你知道ID号码也可以根据数据库AC属性 (AC attribute)提取搜索到的特定序列
[mw_shl_code=python,true]U61268<-query("BRCA1", "SP=Homo sapiens AND AC=U61268")  #也可以根据特定的ID进行搜索
attributes(U61268)
U61268$req
U61268_seq <- getSequence(U61268$req[[1]])
U61268_annots <- getAnnot(U61268$req[[1]]) [/mw_shl_code]

345

345

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-4-5 16:18 , Processed in 0.021209 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.