搜索
查看: 960|回复: 11

基因组求助帖:platanus 高杂合基因组的组装

[复制链接]

11

主题

33

帖子

290

积分

版主

Rank: 7Rank: 7Rank: 7

积分
290
发表于 2016-9-19 20:56:16 | 显示全部楼层 |阅读模式
Although many de novo genome assembly projects have recently been conducted using high-throughput sequencers, assembling highly heterozygous diploid genomes is a substantial challenge due to the increased complexity of the de Bruijn graph structure predominantly used.
解决方案
Ø Fosmid-based (or Bac-based) hierarchical sequencing
牡蛎oyster (Zhang et al. 2012), 小菜饿diamondback moth (You et al. 2013), and 挪威云杉Norway spruce (Nysted et al. 2013)
Ø Inbred lines ( doubled-monoploid clone)
马铃薯potato (The Potato Genome Sequencing Consortium 2011)
However, these methods are costly and time consuming, forfeiting the advantages of massive parallel sequencing.
为解决这一困境,2014年日本学者开发的  Platanus 应运而生, <Efficient de novo assembly of highly heterozygous genomes from whole-genome shotgun short reads>。
2015年cell引用该软件进行蝴蝶基因组的组装来研究其进化(Tiger Swallowtail Genome Reveals Mechanisms for Speciation and Caterpillar Chemical Defense),根据文章结果看该软件对杂合基因组的组装有其独特的优势。
然软件虽好,但使用不易,软件本身的安装过程很简单,也没有任何问题,但使用起来问题还真不少,以下是我使用过程中遇到的问题;
1>问题描述:https://www.biostars.org/p/189452/
When I run this simple command for my paired-reads: platanus_trim xxx_1.fastq xxx_2.fastq
there is not any error, but I get an empty xxx_1.fastq.trimmed and xxx_2.fastq.trimmed files. 但又有一些paired-reads可以得到trim后的结果,不明觉厉,很是奇怪。
解决办法:暂无。
2>问题描述: https://www.biostars.org/p/178445/
platanus assemble -f ./A_R1.fastq.trimmed ./A_R2.fastq.trimmed -t 18 -o /results/platanus/ -k 31 -m 200 -u 0.3 -d 0.3 -a 5
K = 31, saving kmers from reads...
Error(5): Kmer distribution exception!!
Kmer distribution cannot be caluculated proper.

解决办法:暂无。
针对以上问题目前还没有找到解决办法,希望能得到大家的帮助解决下,不甚感激。




上一篇:有参转录组分析流程 -- 仅供参考
下一篇:【原创】循证之路-meta分析入门培训
欢迎访问 my blog : Hope, Bioinformation
回复

使用道具 举报

0

主题

2

帖子

20

积分

新手上路

Rank: 1

积分
20
发表于 2016-10-11 18:53:43 | 显示全部楼层
你好,我也遇到了相同的问题。尝试了一下在另外一台机器上面运行测试数据,是可以的,但是内存比较小,对实际的测序数据来说不够用。请问你的问题解决了吗?
回复 支持 反对

使用道具 举报

0

主题

12

帖子

147

积分

注册会员

Rank: 2

积分
147
发表于 2016-10-11 23:24:03 | 显示全部楼层
请教楼主,一般说基因组染色体大小都是指的是染色体碱基数量么?Mb还是bp呢?
回复 支持 反对

使用道具 举报

11

主题

33

帖子

290

积分

版主

Rank: 7Rank: 7Rank: 7

积分
290
 楼主| 发表于 2016-10-12 11:28:24 | 显示全部楼层
bampress 发表于 2016-10-11 18:53
你好,我也遇到了相同的问题。尝试了一下在另外一台机器上面运行测试数据,是可以的,但是内存比较小,对实 ...

很遗憾,还没有解决,我给软件开发者发邮件
欢迎访问 my blog : Hope, Bioinformation
回复 支持 反对

使用道具 举报

11

主题

33

帖子

290

积分

版主

Rank: 7Rank: 7Rank: 7

积分
290
 楼主| 发表于 2016-10-12 11:29:33 | 显示全部楼层
sleep在床上 发表于 2016-10-11 23:24
请教楼主,一般说基因组染色体大小都是指的是染色体碱基数量么?Mb还是bp呢? ...

一般是碱基数量,mb
欢迎访问 my blog : Hope, Bioinformation
回复 支持 反对

使用道具 举报

0

主题

2

帖子

20

积分

新手上路

Rank: 1

积分
20
发表于 2016-11-14 14:52:45 | 显示全部楼层
hope 发表于 2016-10-12 11:28
很遗憾,还没有解决,我给软件开发者发邮件

你好,楼主。请问你的问题解决了吗?我之前也给开发者发了邮件,一直未收到回复。
回复 支持 反对

使用道具 举报

10

主题

46

帖子

260

积分

版主

Rank: 7Rank: 7Rank: 7

积分
260
发表于 2016-11-16 00:57:58 | 显示全部楼层
还没有任何使用经验,看了下这个软件文章,个人意见仅供参考:
1)这一步不是必须步骤,试试看跳过这一步,直接使用trim过的input files.
2)看来报错与内存有关,如果不能升级硬件,就降低运算量, try to find the reads that give rise to faulty k-mers and remove them.
关注后续,有作者回信的话请更新,一起涨姿势,谢谢你。
回复 支持 反对

使用道具 举报

11

主题

33

帖子

290

积分

版主

Rank: 7Rank: 7Rank: 7

积分
290
 楼主| 发表于 2016-11-16 12:18:22 | 显示全部楼层
bampress 发表于 2016-11-14 14:52
你好,楼主。请问你的问题解决了吗?我之前也给开发者发了邮件,一直未收到回复。 ...

没有解决,我也是一直等不到回复邮件,愁人
欢迎访问 my blog : Hope, Bioinformation
回复 支持 反对

使用道具 举报

11

主题

33

帖子

290

积分

版主

Rank: 7Rank: 7Rank: 7

积分
290
 楼主| 发表于 2016-11-16 12:43:02 | 显示全部楼层
Mint 发表于 2016-11-16 00:57
还没有任何使用经验,看了下这个软件文章,个人意见仅供参考:
1)这一步不是必须步骤,试试看跳过这一步, ...

谢谢你的建议,第一个问题确实不是关键所在,就是发现存在有这个问题,想不明白为什么有的reads可以生成结果,而有的不行,有点好奇。
关键还是在platanus assemble这一步,硬件内存应该是够的,还有一点不好的是这个软件就只是输出了这个错误信息,没有其他任何文件,都没法查找哪里出问题了,源码也看了下,也看不懂有什么解决方案。


我翻出去找了半天这个文章一作的facebook和twitter,email地址,都留言了,就是都没有回复我,有后续解决方案,立马更新。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
欢迎访问 my blog : Hope, Bioinformation
回复 支持 反对

使用道具 举报

10

主题

46

帖子

260

积分

版主

Rank: 7Rank: 7Rank: 7

积分
260
发表于 2016-11-17 22:50:47 | 显示全部楼层
hope 发表于 2016-11-16 12:43
谢谢你的建议,第一个问题确实不是关键所在,就是发现存在有这个问题,想不明白为什么有的reads可以生成 ...

嗯,内存看上去可以的。 你的数据是下载的还是自己的?我自己做组装的时候,也会碰见类似情况,都出现在用PUBLIC DATA的时候,仔细查过某数据,原来有段序列缺失,所以说某些READS没有结果,是数据本身的问题。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|关于我们|手机版|小黑屋|生信技能树    

GMT+8, 2017-6-29 18:38 , Processed in 0.032962 second(s), 32 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.