搜索
查看: 1278|回复: 3

求助:共有序列/保守序列

[复制链接]

5

主题

12

帖子

164

积分

注册会员

Rank: 2

积分
164
发表于 2018-1-30 12:26:11 | 显示全部楼层 |阅读模式
百万行规模序列片段,在20-30nt之间,用什么脚本能实现保守序列寻找?



上一篇:RNA-seq运行cuffmerge遇到的问题
下一篇:求助:定位序列
回复

使用道具 举报

3

主题

17

帖子

378

积分

中级会员

Rank: 3Rank: 3

积分
378
发表于 2018-2-6 15:15:51 | 显示全部楼层
MEME 本地化下? 我不知道可不可以,你可以试试
回复 支持 反对

使用道具 举报

5

主题

12

帖子

164

积分

注册会员

Rank: 2

积分
164
 楼主| 发表于 2018-2-8 10:56:13 | 显示全部楼层
zt1989 发表于 2018-2-6 15:15
MEME 本地化下? 我不知道可不可以,你可以试试

用动态规划算法,匹配分值最高的一群。
回复 支持 反对

使用道具 举报

0

主题

17

帖子

108

积分

注册会员

Rank: 2

积分
108
发表于 昨天 06:52 | 显示全部楼层
python 脚本

f=open('共有序列-保守序列.txt')
lines=[]
for line in f:
    line=line.strip()
    lines.append(line)

line1_len=len(lines[0])
sub_seqlist=[]

for i in range(line1_len):
   
    sub_forward_seq=lines[0][i:]
    for j in range(len(sub_forward_seq)):
        
        sub_reverse_seq=sub_forward_seq[:len(sub_forward_seq)-j]
        
        sub_seqlist.append(sub_forward_seq)

sub_seqlist.sort(key=len,reverse=True)
lines_n=len(lines)

for sub_seq in sub_seqlist:
    r=0
    for line in lines:
        if 20<=len(sub_seq)<=30 and sub_seq in line:
            r+=1
    if r==lines_n:
        print(sub_seq)
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-6-16 19:45 , Processed in 0.030068 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.