搜索
查看: 656|回复: 0

三代软件canu的安装与初步使用

[复制链接]

2

主题

11

帖子

79

积分

注册会员

Rank: 2

积分
79
发表于 2018-10-12 08:57:51 | 显示全部楼层 |阅读模式
转一篇自己的吧。
原文地址:http://blog.sina.com.cn/s/blog_a869dd250102xsc8.html

Canu软件专门组装PacBio或Oxford Nanopore序列。



Canu分三个阶段运作:校正,修剪和装配。校正阶段将提高读数碱基的准确性。修剪阶段将读取修剪到看起来是高质量序列的部分,删除可疑区域,例如剩余的SMRTbell适配器。装配阶段将读数排序为重叠群,生成共有序列并创建图形。


对于真核生物基因组,超过20倍的覆盖率足以胜过当前的混合组装方法,建议的最小值为30倍至60倍。更多的覆盖度将让Canu使用更长的读取进行装配,产生更好的装配。


输入序列可以是FASTAFASTQ格式,未压缩或使用gzip(.gz),bzip2(.bz2)或xz(.xz)压缩
请注意,不支持zip文件(.zip)

Canu可以恢复不完整的程序集,允许从系统中断或其他异常终止中恢复。在每次重新启动Canu时,它将检查程序集目录中的文件以决定下一步该做什么。例如,如果除了两个重叠任务之外的所有任务都已完成,则仅计算缺失的两个任务。为获得最佳效果,请勿在两次任务中间更改Canu参数。


使用参数maxMemorymaxThreads可以明确限制内存和处理器。


canu安装

下载
链接在此canu软件下载github地址
或者链接 wget https://github.com/marbl/canu/archive/v1.7.1.tar.gz




解压
tar zxvf canu-1.7.1.Linux-amd64.tar.gz

确保java版本在1.8以上
java -version

安装gnuplot
https://sourceforge.net/projects/gnuplot/files/gnuplot/5.0.5/ 下载gnuplot
$ tar -zxvf gnuplot-5.0.5.tar.gz
$ cd gnuplot-5.0.5
$ ./configure --prefix=/public1/home/Serenity/installed_software/gnuplot-5.0.5
$ make
$ make install
配置环境变量
sudo vi ~/.bash_profile
export GNUPLOT=/home/lei/Desktop/Liujia/gnuplot-5.0.5
export PATH=/home/lei/Desktop/Liujia/gnuplot-5.0.5/binPATH
export MANPATH=/home/lei/Desktop/Liujia/gnuplot-5.0.5/share/man/man1MANPATH
export PATH=/home/lei/Desktop/Liujia/canu-1.7.1/Linux-amd64/binPATH
source ~/.bash_profile


这样就可以直接用canu了,此外还有gnuplot的image type要设置,等会写。



canu的初步使用



下载pacbio试用数据--大肠杆菌
curl -L -o pacbio.fastq http://gembox.cbcb.umd.edu/mhap/raw/ecoli_p6_25x.filtered.fastq      下载nanopare试用数据--大肠杆菌curl -L -o oxford.fasta http://nanopore.s3.climb.ac.uk/MAP006-PCR-1_2D_pass.fasta
对于PacBio:

canu \ -p ecoli -d ecoli-pacbio \ genomeSize=4.8m \ -pacbio-raw pacbio.fastq


对于nanopare:canu \ -p ecoli -d ecoli-oxford \ genomeSize=4.8m \ -nanopore-raw oxford.fasta

或者用配置文件运行
$ vi spec.txt
useGrid=1
gridOptions=-S /bin/bash -q all.q -l mem_free=60g
gridEngineThreadsOption=-pe mpi THREADS
gridEngineMemoryOption=-l mem_total=MEMORY
corOutCoverage=80
ovbMemory=8g
maxMemory=500g
maxThreads=48
ovsMemory=8-500g
ovsThreads=4
oeaThreads=4

$ canu -s spec.txt -p ecoli -d ecoli-oxford genomeSize=4.8m -nanopare-raw oxford.fa






上一篇:gtWAS:将基因组和转录组数据与表型数据联合关联分析的Rpackage
下一篇:【求助贴】在使用MIXCR过程中遇到的一些问题,求大神解答...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树    

GMT+8, 2019-3-25 00:12 , Processed in 0.031852 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.