搜索
查看: 1509|回复: 3

求助:共有序列/保守序列

[复制链接]

5

主题

12

帖子

170

积分

注册会员

Rank: 2

积分
170
发表于 2018-1-30 12:26:11 | 显示全部楼层 |阅读模式
百万行规模序列片段,在20-30nt之间,用什么脚本能实现保守序列寻找?



上一篇:RNA-seq运行cuffmerge遇到的问题
下一篇:求助:定位序列
回复

使用道具 举报

3

主题

17

帖子

380

积分

中级会员

Rank: 3Rank: 3

积分
380
发表于 2018-2-6 15:15:51 | 显示全部楼层
MEME 本地化下? 我不知道可不可以,你可以试试
回复 支持 反对

使用道具 举报

5

主题

12

帖子

170

积分

注册会员

Rank: 2

积分
170
 楼主| 发表于 2018-2-8 10:56:13 | 显示全部楼层
zt1989 发表于 2018-2-6 15:15
MEME 本地化下? 我不知道可不可以,你可以试试

用动态规划算法,匹配分值最高的一群。
回复 支持 反对

使用道具 举报

0

主题

20

帖子

137

积分

注册会员

Rank: 2

积分
137
发表于 2019-6-15 06:52:38 | 显示全部楼层
python 脚本

f=open('共有序列-保守序列.txt')
lines=[]
for line in f:
    line=line.strip()
    lines.append(line)

line1_len=len(lines[0])
sub_seqlist=[]

for i in range(line1_len):
   
    sub_forward_seq=lines[0][i:]
    for j in range(len(sub_forward_seq)):
        
        sub_reverse_seq=sub_forward_seq[:len(sub_forward_seq)-j]
        
        sub_seqlist.append(sub_forward_seq)

sub_seqlist.sort(key=len,reverse=True)
lines_n=len(lines)

for sub_seq in sub_seqlist:
    r=0
    for line in lines:
        if 20<=len(sub_seq)<=30 and sub_seq in line:
            r+=1
    if r==lines_n:
        print(sub_seq)
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-20 03:23 , Processed in 0.028799 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.