搜索
查看: 201|回复: 2

求助帖:NCBI上下载的RNA-Seq fastq数据还需要质控去接头吗?

[复制链接]
回帖奖励 4 金钱 回复本帖可获得 1 金钱奖励! 每人限 1 次

11

主题

25

帖子

134

积分

注册会员

Rank: 2

积分
134
发表于 2019-6-28 13:15:06 | 显示全部楼层 |阅读模式
本帖最后由 snower 于 2019-6-28 13:16 编辑


求助:如上图所示是我在NCBI上下载的一个RNA-Seq的原始FASTQ文件,可以看出Per base sequence contentSequence Duplication LevelsAdapter Content都显示的是“不通过”

对于Per base sequence content

网上有人说只要去除前几个碱基就可以了,但是也有人认为RNA-Seq数据由于使用了随机六聚体引物,在reads开头会出现碱基成分偏离。这是一个真正的技术偏差,无法通过修剪reads纠正,不过在大多数情况下似乎不会对下游分析产生负面影响。所以还需要去除前几个碱基吗?

对于Sequence Duplication Levels

有人认为对于RNAseq,duplicates常常是高表达转录本的一种自然结果。对于差异表达分析,不建议去除duplicates所以这一项还需要处理吗?


对于Adapter Content

图中显示的是数据中存在通用adapter,但是由于数据是NCBI里面的,无法找到接头的具体序列。这种情况要怎么处理呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x



上一篇:Ubuntu 系统下Rstudio不能输入中文的解决办法
下一篇:关于CNVnator的使用:
回复

使用道具 举报

4

主题

56

帖子

531

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
531
发表于 2019-7-2 16:19:15 | 显示全部楼层

回帖奖励 +1 金钱

在大多数情况下似乎不会对下游分析产生负面影响,因为你只是看表达量而已,所以不重要,建议看完群主的B站转录组视频哈
回复 支持 反对

使用道具 举报

11

主题

25

帖子

134

积分

注册会员

Rank: 2

积分
134
 楼主| 发表于 6 天前 | 显示全部楼层
bioinfotrainee 发表于 2019-7-2 16:19
在大多数情况下似乎不会对下游分析产生负面影响,因为你只是看表达量而已,所以不重要,建议看完群主的B站 ...

好的,谢谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-7-18 09:35 , Processed in 0.032107 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.