搜索
查看: 9243|回复: 0

[other] 转录组入门(1)-作业

[复制链接]

9

主题

22

帖子

168

积分

注册会员

Rank: 2

积分
168
发表于 2017-7-3 17:28:07 | 显示全部楼层 |阅读模式
本帖最后由 Panda姐 于 2017-7-4 08:44 编辑

本文为转录组入门项目的第一次作业,主要内容为软件安装系统环境
CentOS 7.0
软件安装
anaconda的安装请参考:
https://zhuanlan.zhihu.com/p/25085567
http://python.jobbole.com/86236/
需要安装的软件包括 sratoolkit,fastqc,hisats,samtools,htseq-count,R,Rstudio
sratoolkit
介绍: sratoolkit的主要用途还是把NCBI SRA(Sequence Read Archive)数据库中的NGS序列数据从 sra 格式转换到 fastq 格式,以便于后续的数据分析。
官网主页:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
中文相关介绍一篇:http://www.cnblogs.com/OA-maque/p/4799074.html
安装与测试:
[Bash shell] 纯文本查看 复制代码
#直接用anaconda安装 @沈梦圆提供
conda install -c jfear sratoolkit   
#或者手动安装:
cd Downloads
wget [url=https://ftp-trace.ncbi.nlm.nih.g]https://ftp-trace.ncbi.nlm.nih.g[/url] ... ntos_linux64.tar.gz  #下载已经编译好的适合CentOS 64位系统的版本
tar -zxvf sratoolkit.2.8.2-1-centos_linux64.tar.gz   #解包解压
mv sratoolkit.2.8.2-1-centos_linux64.tar.gz ~/biosoft #移动到专门安装生物信息软件的目录下边
# 加入环境变量
echo 'PATH=$PATH:~/biosoft/sratoolkit.2.8.2-1-centos_linux64.tar.gz/bin' >> ~/.bashrc 
source ~/.bashrc
# 测试
prefetch -v
# 下载测试文件SRR390728,默认存放在家目录下的ncbi文件夹中
prefetch -c SRR390728
功能简单介绍:
Frequently Used Tools:
fastq-dump: Convert SRA data into fastq format
prefetch: Allows command-line downloading of SRA, dbGaP, and ADSP data
sam-dump: Convert SRA data to sam format
sra-pileup: Generate pileup statistics on aligned SRA data
vdb-config: Display and modify VDB configuration information
vdb-decrypt: Decrypt non-SRA dbGaP data ("phenotype data")
Additional Tools:
abi-dump: Convert SRA data into ABI format (csfasta / qual)
illumina-dump: Convert SRA data into Illumina native formats (qseq, etc.)
sff-dump: Convert SRA data to sff format
sra-stat: Generate statistics about SRA data (quality distribution, etc.)
vdb-dump: Output the native VDB format of SRA data.
vdb-encrypt: Encrypt non-SRA dbGaP data ("phenotype data")
vdb-validate: Validate the integrity of downloaded SRA data
fastqc
介绍:二代测序数据质量分析软件
官网主页:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
中文相关介绍一篇:https://zhuanlan.zhihu.com/p/20731723
安装与测试:
[Bash shell] 纯文本查看 复制代码
conda install fastqc
fastqc  #测试是否能正常打开该软件

hisat2
简介:将测序结果比对到人类参考基因组上。HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用。
官网主页:http://ccb.jhu.edu/software/hisat2/index.shtml
中文相关介绍:https://www.plob.org/article/10380.html
安装与测试:
[Bash shell] 纯文本查看 复制代码
conda install hisat2
hisat2 -h  #测试


samtools
简介:一种处理SAM、BAM文件的工具软件。BAM格式文件是存放高通量测序中比对结果的标准格式文件。
官网主页:旧主页http://samtools.sourceforge.net/ 新主页http://www.htslib.org
中文相关介绍:http://www.cnblogs.com/OA-maque/p/4827146.html
安装与测试:
[Bash shell] 纯文本查看 复制代码
conda install samtools
samtools –help  #测试


htseq-count
简介:htseq-count 是一款用于reads计数的软件,他能对位于基因组上的一些单位的reads数进行统计,这里所说的单位主要是指染色体上的一组位置区间(我们常见的就是gene exon)
官网主页:http://www-huber.embl.de/users/anders/HTSeq/doc/install.html#installation-on-linux
中文相关介绍:http://yangl.net/2016/09/21/htseq-count_manual/
http://www.cnblogs.com/OA-maque/p/4835033.html
安装与测试:

[Bash shell] 纯文本查看 复制代码
#anaconda 只能安装0.7.2版没有最新版
conda install -c bioconda htseq 
#手动安装ubuntu
sudo apt-get install build-essential python2.7-dev python-numpy python-matplotlib
#Redhat系列 包括CentOs
sudo yum install python-devel numpy python-matplotlib
#下载HTSeq
wget [url=https://pypi.python.org/packages]https://pypi.python.org/packages[/url] ... /HTSeq-0.8.0.tar.gz
#解压
tar -zxvf HTSeq-0.8.0.tar.gz
#安装
mv HTSeq-0.8.0 Biosoft  #移动到Biosoft文件夹中
cd HTSeq-0.8.0               #进入该文件夹
python setup.py install –user  #安装
#测试  在非HTSeq-0.8.0文件夹下进行
python
>>>import HTSeq
>>>                               #能够在python中导入HTSeq这个包,说明安装成功。


R
简介:一种常用语统计分析的编程语言,在生物信息分析中用于数据分析和绘图
官网主页:https://www.r-project.org
中文相关介绍:http://www.oschina.net/p/r-language
安装与测试:
[Bash shell] 纯文本查看 复制代码
sudo yum install epel-release
sudo yum install r
r #测试

Rstudio
简介:Rstudio是R的集成开发环境
官网主页:https://www.rstudio.com
中文相关介绍:http://jingyan.baidu.com/article/a17d52853343828098c8f21c.html
安装与测试:
[Bash shell] 纯文本查看 复制代码
conda install rstudio
rstudio #测试





上一篇:关于芯片多个探针对应一个基因的问题
下一篇:我在biostar上面回答了一个问题Expand a DNA sequence with IUPAC code...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-9-22 08:30 , Processed in 0.038876 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.