搜索
查看: 8133|回复: 1

宏基因组分析软件大全

[复制链接]

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
发表于 2017-11-23 19:05:25 | 显示全部楼层 |阅读模式

1~2:宏基因组分析必备-Megan、VSEARCH
3~4:花式寻找差异的灵犬-STAMP、LEfSe
5~7:进化树界的三辆马车-ITOL、GraPhlAn、ggtree
8:自由绘图的利器-Cytoscape
9:序列拼接界的超级玛丽-PANDAseq
10:环形基因组可视化的圆满缔造者-CGView
11:优雅的小提琴图绘制者-Python

01
Megan


下载地址:http://ab.inf.uni-tuebingen.de/software/megan6/

Megan是一款非常简单好用的宏基因组分析软件。

它易于使用,所有功能都可以通过菜单、工具栏和图形实现,不需要使用者具备脚本技术。它功能强大,能够处理包含大量reads的数百个样本。

它分析全面,可以进行物种注释、物种和功能的PCoA分析、稀释曲线、SEED分析、KEGG分析、COG/eggNOG分析等等。

02
VSEARCH



下载地址:https://peerj.com/preprints/2409/

作为生信分析的常用软件,usearch在序列搜索、聚类、去重、去嵌合体等序列操作有非常重要的作用。但其64位版需要付费,因此当面对序列体积超过4GB的分析工作时,部分工作者没有了更多的选择。

而vsearch是一款开源软件,其64位版本也不必付费,这意味着使用者可以利用它来搭建宏基因组分析平台,在处理大数据量的序列搜索聚类时也可以游刃有余。

03
STAMP


下载地址:http://kiwi.cs.dal.ca/Software/STAMP

STAMP软件是一款可以进行组间差异分析的强大软件。

之所以说它强大,有三点原因:

①几乎适用所有的组间差异分析,可以是界门纲目科属种的多层级物种差异,也可以是基因表达差异、功能差异等单层级的差异;

②分析手段十分多样,如PCA散点图、聚类热图、差异条形图等;

③操作简单易学。

04
LEfSe



下载地址:https://bitbucket.org/nsegata/lefse/downloads/

LEfSe软件用于发现两组或两组以上的biomarker,主要是通过非参数因子Kruskal-Wallis秩和检验来实现的。

它强调统计意义和生物相关性。分析优点在于,可以同时将不同分类水平(门、纲、目、科、属)上的差异微生物一次性找出来。

05
Interactive Tree Of Life


下载地址:http://itol.embl.de/

当我们打开别人的论文时,总会看到很多高颜值的进化树 。

如果我们也能画出这么漂亮的进化树,那么高分文章,按时毕业,都不是事儿啊。

此时你需要这款功能强大的在线进化树美化工具——ITOL(Interactive Tree Of Life)。

06
GraPhlAn


下载地址:https://bitbucket.org/nsegata/graphlan/wiki/Home

GraPhlAn (Graphical Phylogenetic Analysis) 软件,是一种将微生物基因组和宏基因组可视化的计算工具。

一方面,它可以实现对物种进化树的可视化及注释,使进化树图的内容更丰富。

另一方面,也可以对物种注释结果进行总体展示,并且可以根据LEfSe分析的结果对不同分组添加不同颜色的biomarker。

07
ggtree


下载地址:http://www.bioconductor.org/pack ... oc/html/ggtree.html

随着系统发育树研究越来越广泛,人们需要对进化树做越来越多的个性化展示。

ggtree正好满足了人们的这些个性化需求,可以通过代码来添加进化树所需的内容,并控制展示形式。这是一款非常优秀的扩展包,是ggplot2的良好衍生,能够很好地利用图层进行绘图。

08
Cytoscape



下载地址:http://www.cytoscape.org/

Cytoscape是一款可图形化显示网络并进行分析和编辑的软件,它支持多种网络描述格式,也可以用以Tab制表符分隔的文本文档或Microsoft Excel文件作为输入,或者利用软件本身的编辑器模块直接构建网络。

Cytoscape还能够为网络添加丰富的注释信息,并且可以利用自身以及第三方开发的大量功能插件,针对网络问题进行深入分析。

09
PANDAseq



下载地址:https://github.com/neufeld/pandaseq/wiki

在对16S rDNA进行可变区测序的时候,往往选取多个可变区,但是Illumina测序长度不够,454测序数据量不够。

所以一般采用Illumina双端测序,这就涉及到序列的拼接,PANDAseq可以快速拼接双端的reads并修正大部分的错误。

10
CGView



在线网址:http://stothard.afns.ualberta.ca/cgview_server/

CGView拥有着Java软件包构成的强心脏,可将环形基因组(质粒、细菌、叶绿体、线粒体)以静态或者交互式形态高质量展示,构思出“圆”满的分析图。

它输入的基因组序列文件的格式可以为fasta、genbank、EMBL等格式,另外可以添加3条参考序列。

CGView Server使用blast比较基因组和参考序列,将比对结果或者是关注的特征区域可视化展示。

11
Python



下载地址:https://www.python.org/

小提琴图因整合了箱线图和核密度图,深受科研人员喜爱。

通过小提琴图,我们不仅可以看到箱线图展示的各分位数的位置,还能知道哪些位置的密度较高。
回复

使用道具 举报

1

主题

5

帖子

82

积分

注册会员

Rank: 2

积分
82
发表于 2017-12-5 21:42:45 | 显示全部楼层
太棒了,非常感谢!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2023-3-20 18:24 , Processed in 0.131612 second(s), 31 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.