搜索
查看: 6520|回复: 1

[mRNA-seq] 小白生信学习记4:Linux系统下,RNAseq分析软件的安装

[复制链接]

33

主题

46

帖子

230

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
230
发表于 2017-2-27 23:29:07 | 显示全部楼层 |阅读模式
注:本文是生信媛微信公众号原创文章

作者:生物女博士
原文链接:http://mp.weixin.qq.com/s/0483a6zdKPerDINluCRxXg



前面介绍了转录组的基本知识以及简单的linux命令,今天开始正式的上机练习,今天先介绍软件的安装。

一、 linux基本操作。

到主目录下,cd表示进入某个目录,~表示主目录
cd ~

查看当前所在位置的路径
pwd

查看目录
ls
ls -l
ls -al

新建一个目录名为software
mkdir software

进入这个software,并查看所在位置
cd software
pwd

新建一个名为abc.txt的文件
touch abc.txt
ls

修改abc.txt的名字为xyz.py
mv abc.txt xyz.py
ls

在linux下,后缀名是可以不用太在意的。你写进去的东西,不会因为后缀名修改而修改。

举个例子
touch example.txt
echo "this is a test" > example.txt
more example.txt

输出结果是:
this is a test

mv example.txt example
more example

输出结果还是:
this is a test

在这里,我们用echo这个命令把this is a test这句话放到了example.txt中,用>指令覆盖文件原内容,并重新输入内容。若文件不存在则创建文件。举例来说:
echo "this" > example

会发现,原先的内容this is a test被覆盖了为this了

如果不想覆盖,只是想在后面加一些内容怎么办?使用">>"追加
echo "this is a test" >> example
more

输出结果是
this
this is a test

这几个文件都是没用的。我们删除
rm *

*在这里是一个通配符。rm * 是把当前目录所有文件删除。但是rm删除非空文件夹的时候需要使用rm -r来进行

更详细的使用,可以通过命令rm --help查看具体使用。

1.jpg

可以看到加上-r意味着把整个文件夹里的子文件夹和文件全部删除。

二、软件安装
(1)FastQC
确认我们现在在~/software下
pwd

先来下载fastqc这个软件:
curl -O http://www.bioinformatics.babrah ... /fastqc_v0.11.5.zip

curl 的用法网上有很多的中文版本。你也可以输入curl --help或者curl --manual来在linux下查看帮助文档。

如果遇到下载问题,可以直接到网上先下载到本地电脑,再用我们在《小白生信学习记2》中介绍的软件,传到服务器上。

zip格式的文件可以用unzip来解压:
unzip fastqc_v0.11.5.zip

怎么知道如何安装与使用?
http://www.bioinformatics.bbsrc. ... ownload.html#fastqc

大家可以进去看看相关信息。一般官网或者解压后的下载包里都会有相关指南。

由于FastQC是用java编写的。所以其使用需要服务器上安装了java
java -version
如果提示java版本即可以。

根据说明书,我们安装如下:
cd FastQC/
ls -l
chmod +x fastqc
上面这条  chmod +x  命令是使得fastqc变为可执行的命令

为了使得我们无论在哪个路径下都能使用这个软件,我们必须进行一些设置:

  • 可以把这个命令所在的目录路径,加到~/.bashrc(Linux)或者~./profile(Mac)中:


# On the Mac:
echo export PATH=$PATH:~/software/FastQC >> ~/.profile
source ~/.profile
fastqc -h

# On Linux:
echo export PATH=$PATH:~/software/FastQC >> ~/.bashrc
source ~/.bashrc
fastqc -h

  2. 建一个类似windows下的快捷方式的软连接(shortcut)

mkdir -p ~/bin

# 把fastqc的"shortcut" 放到 ~/bin
ln -s ~/software/FastQC/fastqc ~/bin/fastqc

# Mac:
echo 'export PATH=~/binPATH' >> ~/.profile
source ~/.profile
fastqc -h

# Linux :
echo 'export PATH=~/binPATH' >> ~/.bashrc
source ~/.bashrc
fastqc -h


3.其他:比如用alias命令,等下会使用到

这样,在bin目录下的程序,我们在服务器账号里任何一个位置都可以直接使用了。
我们来试一下:
mkdir seq

把我提供的fastq文件放入此文件夹
fastqc SRR1553610_1.fastq

过一小段时间,会出现2个文件。SRR1553610_1_fastqc.html和SRR1553610_1_fastqc.zip。这两个文件可以导出到本地电脑去打开查看。
另外,fastqc是有windows版本的。

如果有多个fastq在该目录下,想一次性全部用fastqc查看一下测序质量,可以这么操作
fastqc *.fastq


(2)trimmomatic
# trimmomatic说明书地址
http://www.usadellab.org/cms/index.php?page=trimmomatic

curl -O http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.36.zip
unzip Trimmomatic-0.36.zip
cd Trimmomatic-0.36

官网给出的用法如下:
2.jpg
需要输入  java -jar trimmomatic-0.36.jar  一长串才能用起来,有点麻烦,我们可以写一个小脚本来使得这个使用变得简单些:

下面命令的$@ 表示的是把所有的参数都传递给程序
echo '#!/bin/bash' > ~/bin/trimmomatic
echo 'java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar $@' >> ~/bin/trimmomatic
chmod +x ~/bin/trimmomatic
trimmomatic

此时发现会弹出来说明

3.jpg

或者我们也可以直接用vi来编辑trimmomatic这个文档(如果没有这个文件,则会自动新建这个名字的文件):
vi ~/bin/trimmomatic
此时会看到我们刚才输进去的

#!/bin/bash
java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar $@

这两句文字。

按下键盘上的   i   键,即切换进如“插入”模式,此时可以改写里面的内容。
如果想退出,先按下  esc  键,假设如下3种情况:
1、做出了更改需要保存:输入    :wq    即可保存并退出。
2、没有更改: :q  即退出
3、更改了不想保存::q!
vi还有其他用法,这里不一一介绍了。

写好trimmomatic文件后,跟上面一样
chmod +x ~/bin/trimmomatic
trimmomatic

这里还可以用alias的方法来简化用法:

echo "alias trimmomatic='java -jar ~/software/Trimmomatic-0.36/trimmomatic-0.36.jar'" >> ~/.bashrc
source ~/.bashrc

即可。

当然,你也可以用vi来编辑~/.bashrc或者~/.profile文件。

好了,今天先写到这里。给大家留下HISAT2和HTSeq自己尝试一下跟着官方提供的说明书来安装一下吧。

今天的内容很多改写自这个课程:http://www.personal.psu.edu/iua1/courses/code-repository-2014.html
这个课程我觉得是完整和详细的(虽然有少量的细节错误),强烈推荐大家可以跟着操作和练习一下!
所需上机文件链接: https://pan.baidu.com/s/1bpw1wBl 密码: axk2






欢迎到微信公众号订阅我们
生信媛
bio_sxy



上一篇:推荐5个生物信息学领域的教授
下一篇:【课程预告】手把手教你入门生信——The Biostar Handbook
回复

使用道具 举报

0

主题

4

帖子

55

积分

注册会员

Rank: 2

积分
55
发表于 2017-7-24 17:58:27 | 显示全部楼层
hello,我用trimmomatic的时候,它能过滤掉我一半左右的数据,这正常吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-11-20 00:48 , Processed in 0.032833 second(s), 33 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.