搜索
12
返回列表 发新帖
楼主: anlan

从fasta序列中随机提取部分序列

[复制链接]

1

主题

22

帖子

160

积分

注册会员

Rank: 2

积分
160
发表于 2019-6-14 06:07:23 | 显示全部楼层
python 脚本
import random
f=open('300万条fasta序列.txt')
dict1={}
for line in f:

    if line.startswith('>'):
        k=line
        dict1[k]=''
    else:
        dict1[k]+=line
list1=[]
for key in dict1.keys():
    list1.append(key)

n=len(list1)
list2=[]
for i in range(int(n/10)):
    element=random.choice(list1)

    list2.append(element)
    list1.remove(element)

with open('300万条fasta序列output.txt','w') as f1:
    for i in list2:
        f1.write(i+dict1[i])
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-23 06:42 , Processed in 0.034911 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.