搜索
查看: 3741|回复: 0

Galaxy——组学分析和工具云平台

[复制链接]

10

主题

52

帖子

559

积分

版主

Rank: 7Rank: 7Rank: 7

积分
559
QQ
发表于 2017-3-19 20:16:10 | 显示全部楼层 |阅读模式
本帖最后由 旭日早升 于 2017-3-20 16:05 编辑

组学的分析还是有必要说明一下Galaxy的在线平台(https://usegalaxy.org/),最早是我们老师给我们说的,楼主也有一篇帖子也是说用这个平台做了RAN-seq的差异分析(http://www.biotrainee.com/thread-214-1-1.html)。既然楼主已经写了,为什么我还要写。首先楼主是没有将Galaxy作为主题介绍,二来Galaxy其实包含很多内容,所以我这里简单介绍一下这个平台,也不可能穷尽上面的工具,只是为入门人提供一种可能,也算是在论坛为Galaxy立个帖子吧。
首页就介绍了Galaxy是什么?一个开源的,在线的数据分析云平台。既然是开源的,很多的工具都可以接入进来,左边栏就是工具栏,简直太多了,未来肯定更多。在线的话肯定有利有弊,好处就是你可以不需要服务器不需要自己安装软件,只要在他的平台运算即可,但是不好的地方就是需要把数据上传,I/O的问题,安全的问题我想还是需要考虑的吧,另外软件的版本之类的问题也不可忽视。另外Galaxy也接入了一些云平台(https://galaxyproject.org/cloud/),例如amazon等,相信也会扩大它的应用范围。

早先我是在上面尝试过的,但是太久没用了,只能简单说说吧。我记得是可以在上面使用单个工具,也可以搞个pipeline的,先说简单工具吧。拿QC来说吧,你可以在左边点击一个常用的工具例如(FastQC),右边就会出现它的界面,不仅可以使用,还有一些简单的介绍。

好吧,我把账号搞丢了,正在追缴密码,今天先写到这儿,下次再补。


继续分享一下。打开Galaxy首页,左边是工具栏,中间是简介,右边是history,history初始为空,你可以上传自己的文件以用来分析。

点击长传文件,就可以通过拖拽、浏览等方式上传文件,另外可以定义上传文件类型(如fastq、bam等)也可以选择自动检测文件类型,另外可以指定基因组版本信息。

我这里上传2个bam文件为例,上传成功后,你的文件就会在右边的history看到。

上传文件后,你就可以针对你的文件选取合适的工具进行分析了,例如选择bamtools对文件进行过滤,1、选择工具,2、选择操作的数据,3和4、设置参数,增加参数或其他设置,5、执行命令。

执行成功后,你就会得到操作后的文件,并可以对这些文件进行下一步的操作。当你把文件从一个操作到另一个操作链接起来就成为一个pipeline或者流程了。

最后就简单讲解一下如何用Galaxy定制一个pipeline。
在首页左边的工具栏最下面或者页面顶端菜单栏有一个workflows就存储着你的所有流程,包括你之前用过的,别人分享的,也可以自己新建一个,这里就以新建为例。
进入workflows页面如果你已经有一些流程就会在页面显示(如下图位置1所示),如果没有可以创建一个(下图位置2所示)。

点击新建流程命名后就可以通过选择合适的工具生成自己的pipeline了。点击对应的pipeline上对应的软件就可以设置基因组和参数等信息。所有设置完成后就可以保存使用了。

使用时要设置后输入文件,软件参数,以及输出设置,就可以run了。


本文用极其有限的篇幅简单介绍了Galaxy的入门使用,既可以使用单个工具,也可以定制pipeline跑自己的程序。定制pipeline前提是你掌握有比较熟练的流程。在线工具给你提供一种可能和方便,你需要不断学习才能更好的使用它。但它有时候也会限制你,你只能使用上面的软件。因而建议使用单个工具的时候可以考虑一下。而要跑大的project,建议还是好好学习编程和服务器。

本文由生信技能树表观组版主旭日早升撰写,转载请声明来源生信技能树。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:echart3——在线绘图工具
下一篇:ceRNA数据库操作指南
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-19 14:33 , Processed in 0.029300 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.