搜索
查看: 2498|回复: 0

人生第一次实战-GBS数据的进化分析

[复制链接]

5

主题

26

帖子

291

积分

中级会员

Rank: 3Rank: 3

积分
291
发表于 2017-7-20 11:42:27 | 显示全部楼层 |阅读模式
    从日常打杂到现在第一次接到分析任务。。。我的内心是忐忑的,因为GBS完全不懂啊(只懂一点转录组的)。好吧,任务下来了,认真的mark一下好了。一、生物意义

          大概的流程就是用GBS数据找出SNP,然后利用这个来建进化树(作为一个计算机专业转过来的,我只能理解到这里了),应该是属于种间进化分析(妈蛋,生物基础断片是什么鬼)
二、计算机和软件准备
   1、原始数据是每个种1G的GBS数据(还没拿到,为啥我找不到这样的原始数据,翻了好几个文献都只有RAD的),据说是有好多个种,但是还是没找到数据练手,心累~~~(PS:有路过的大牛介绍一下RAD和GBS的区别吗?度娘跪了)

          2、数据的质控室测序公司做的,因为数据还没拿到,所以还没做过,也没有数据练手,很难受。不过看了一些资料,看起来,还是去接头盒去低质量,那就需要好好看看群主大大的质控的帖子。找不到练手数据的我心头那抹掉在地上的甜筒。
          3、好了,到了clean data了,现在考虑对这些数据进行assemble(有大大说在GBS里,这一步翻译成聚类,不是组装,因为测序结果是很短的序列),老板要求使用  --> pyrad流程<-- 听说这个地方比较经典和用得最多的是--> stacks<-- 反正都没用过,硬着头皮学好了。
         4、assemble之后就会得到VCF文件,通过VCF文件可以筛选出很多的SNP序列(我觉得这个过程和第一步的筛选质控很相似),后面就是建树了。
         一般正常情况下,一个项目书写成这样会直接原地爆炸吧,还是要向各位读者道个歉,严谨程度为零的就发出来了。
          附录:下面是安装部分(PS:因为是第一次做这个,也没有练手的,只是找了做这个功能的软件,具体好不好使,请期待下一次更新):
                     1)、可能(没有数据练手只能是可能了)要用到的质控部分软件包括fastqc、cutdapt、sikel,对于这个部分群主大大的那个帖子已经写的十分详细了,我就不在多嘴了。(ps:看这里哟:-->要充分了解你的测序数据--论QC的重要性
                     2)、接下来是assemble的部分,这一部分被要求用pyrad,其中包含了四个软件
[AppleScript] 纯文本查看 复制代码
1、安装pyrad流程的相关包
下载:git clone [url]https://github.com/dereneaton/pyrad.git[/url]
安装:cd pyrad
          sudo pip install .
          pyrad -h
然后还有它要求的muscle和vsearch(这俩暂时下次更新),如果是双端测序还需要一个pear:
[AppleScript] 纯文本查看 复制代码
1. git [url]https://github.com/xflouris/PEAR.git[/url]
2. cd PEAR
3. make
4. make install

最后还需要一个vcftools,这个的话,我只能说bioconda大法好



上一篇:Biostar:课程13、14-常用的mapping软件bwa &amp; sam格式简介
下一篇:求推荐一款linux版进化树画图的软件?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-22 00:11 , Processed in 0.028974 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.