搜索
查看: 2059|回复: 4

16S扩增子数据拆分问题

[复制链接]

1

主题

3

帖子

96

积分

注册会员

Rank: 2

积分
96
发表于 2017-9-30 08:49:36 | 显示全部楼层 |阅读模式
最近在看刘永鑫老师的宏基因组教程,在实践的过程中遇到了一些问题,希望大家能够指导一二,在此谢过。
问题是关于数据拆分的,刘老师的教程中用到的数据的barcode碱基数是相同的,可以用qiime中的extract_barcodes.py脚本提取barcode,然后用 split_libraries.py 拆分数据。但是我的的barcode的碱基数是不一样的,不知道怎么利用这两个脚本来拆分数据,或者qiime支持这种情况吗?
不支持的话有其他软件可以拆分吗?
下面是我的引物和barcode序列:
primer  namebarcodebarcode+primer
16S-F1ACTACTCCTACGGGNGGCWGCAG
16S-F2CGAGCGAGCCTACGGGNGGCWGCAG
16S-F3GTGATGTGATCCTACGGGNGGCWGCAG
16S-F4TACTGGTACTGGCCTACGGGNGGCWGCAG
16S-R1GACTACHVGGGTATCTAATCC
16S-R2TTTTGACTACHVGGGTATCTAATCC
16S-R3CGACGAGACTACHVGGGTATCTAATCC
16S-R4ACTCTGACTCTGGACTACHVGGGTATCTAATCC



上一篇:<PERL> 如何对给定的motif序列匹配 fasta文件,并给出定位信息
下一篇:clusterprofiler>gseGO>genelist 怎么搞 多谢大家了【R语言】
回复

使用道具 举报

1

主题

3

帖子

96

积分

注册会员

Rank: 2

积分
96
 楼主| 发表于 2017-9-30 09:20:29 | 显示全部楼层
刘永鑫 发表于 2017-9-30 09:17
目前我感觉可用grep来手动筛选每个样品,如grep -P '^ACT' file.fasta|grep -P 'CGAG$'|less>16S-F1.fq,具 ...

但是要怎么允许错配呢?
回复 支持 反对

使用道具 举报

1

主题

3

帖子

96

积分

注册会员

Rank: 2

积分
96
 楼主| 发表于 2017-9-30 11:07:08 | 显示全部楼层
刘永鑫 发表于 2017-9-30 09:56
grep -P是支持正则表达式,是允许错配的,你查一下简并的碱基分别代表那几种,比如想检索 A/T/C,即 grep - ...

嗯,谢谢刘老师。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-5-21 15:42 , Processed in 0.046821 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.