搜索
楼主: 西花厅1989

[WGBS] BS-seq 分析流程初学1

[复制链接]

1

主题

12

帖子

128

积分

注册会员

Rank: 2

积分
128
发表于 2017-3-29 22:44:33 | 显示全部楼层
wly0410 发表于 2017-3-28 18:43
methylkit有自己一套分析流程,问什么要用extract数据?

嗯,现在遇到一个问题就是,我想分析所有甲基化位点,不仅仅是CpG 位点,还有CHH,CHG,这些context。但是我不知道怎么把这些全都放在一起分析。单纯的cat到一起?
回复 支持 反对

使用道具 举报

1

主题

12

帖子

128

积分

注册会员

Rank: 2

积分
128
发表于 2017-3-30 10:12:56 | 显示全部楼层
wly0410 发表于 2017-3-28 18:43
methylkit有自己一套分析流程,问什么要用extract数据?

现在我已经做了差异甲基化的分析,得到后缀是bgz的文件,不知道怎么打开,也不知道怎么去注释这些DMR。您知道怎么做吗?
回复 支持 反对

使用道具 举报

0

主题

19

帖子

1124

积分

金牌会员

Rank: 6Rank: 6

积分
1124
发表于 2017-3-30 22:38:19 | 显示全部楼层
应该是分别看吧,bgz可以直接打开,注释可以用methylkit,或者自己下载gtf写脚本注释,推荐methylkit
回复 支持 反对

使用道具 举报

1

主题

12

帖子

128

积分

注册会员

Rank: 2

积分
128
发表于 2017-4-25 17:31:10 | 显示全部楼层
wly0410 发表于 2017-3-30 22:38
应该是分别看吧,bgz可以直接打开,注释可以用methylkit,或者自己下载gtf写脚本注释,推荐methylkit ...

我在做tileMethylCounts的时候总是报错,查询了好几次了不知道那里出问题了。
> file.list=list("HLiver_CpG.txt","LLiver_CpG.txt")
> methylRawList = methRead(file.list,sample.id=list("HLiver","LLiver"),assembly="napar",treatment=c(1,0))
>tiled=tileMethylCounts(object=methylRawList,win.size=1000,step.size=1000,cov.bases=1,mc.cores=2)

然后报错就Error in (function (cl, name, valueClass)  :
  assignment of an object of class “NULL” is not valid for @‘NAMES’ in an object of class “IRanges”; is(value, "characterORNULL") is not TRUE
不知道问题出在哪里了。您知道么?
回复 支持 反对

使用道具 举报

5

主题

37

帖子

485

积分

中级会员

Rank: 3Rank: 3

积分
485
发表于 2017-4-28 11:56:17 | 显示全部楼层
bismark 比对的时候有个参数 --non_directional ,指的是非链特异性,不是很明白什么意思,全基因组甲基化(重亚硫酸盐处理)文库需要这个选项吗?我看有个protocol说明里面也是WGBS测序用了这个选项,但是同时说用链特异性也行,你知道这个参数到底是怎么确定的吗?
回复 支持 反对

使用道具 举报

5

主题

37

帖子

485

积分

中级会员

Rank: 3Rank: 3

积分
485
发表于 2017-4-28 16:23:24 | 显示全部楼层
我查了一些资料,选项 --non_directional 或者是默认的 --directional 是针对文库构建过程中非甲基化的 C 碱基的处理方式,貌似常规的全基因组重亚硫酸盐处理的建库方法是 directional 的。 以后都用PacBio 的方法测序时,可以直接通过碱基合成速度来判断 C 是否发生了甲基化,就不会考虑 directional 的问题了
回复 支持 反对

使用道具 举报

0

主题

19

帖子

1124

积分

金牌会员

Rank: 6Rank: 6

积分
1124
发表于 2017-4-29 15:26:18 | 显示全部楼层
这个还真没注意,一般都用默认参数,除非建库的时候有特殊要求吧。这个 “IRanges”感觉可能和 “IRanges”的版本有关
回复 支持 反对

使用道具 举报

1

主题

12

帖子

128

积分

注册会员

Rank: 2

积分
128
发表于 2017-8-7 16:10:19 | 显示全部楼层
wly0410 发表于 2017-4-29 15:26
这个还真没注意,一般都用默认参数,除非建库的时候有特殊要求吧。这个 “IRanges”感觉可能和 “IRanges” ...

大神,在问个问题,scaffold1       3       -       0       0       CHH     CTA
scaffold1       5       -       0       1       CHH     CTC
scaffold1       7       -       0       2       CHH     CTC
scaffold1       11      +       0       0       CHH     CAA
scaffold1       15      -       0       2       CHH     CTT
scaffold1       19      +       0       0       CHH     CAT
scaffold1       23      -       0       2       CHH     CAA
scaffold1       26      -       0       0       CHH     CAA
scaffold1       32      +       0       2       CHH     CAT
scaffold1       36      -       0       2       CHH     CAA
我的到这个数据了,分别是chr, 位点, 正反链,methylated coverage, unmethylated coverage,我想算单个某一个位点的是否发生了,甲基化,我看好像是要算二项分布,但是我不知道怎么用这几个数字算出来二项分布。来区分是否发生了甲基化
回复 支持 反对

使用道具 举报

1

主题

55

帖子

820

积分

高级会员

Rank: 4

积分
820
发表于 2017-11-20 10:03:42 | 显示全部楼层
想请教一下,甲基化数据一定要trimmomatic吗?如果数据还可以,应该不用吧?数据的质量也可以用fastqc来查看吗?
回复 支持 反对

使用道具 举报

1

主题

10

帖子

257

积分

中级会员

Rank: 3Rank: 3

积分
257
 楼主| 发表于 2017-12-19 20:53:48 | 显示全部楼层
生信小小菜鸟 发表于 2017-11-20 10:03
想请教一下,甲基化数据一定要trimmomatic吗?如果数据还可以,应该不用吧?数据的质量也可以用fastqc来查 ...

我都会除去一下,Trim Galore 软件也可以。甲基化数据也是可以用fastqc来查看的,就是C 的含量和非甲基化测序不同。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-19 12:42 , Processed in 0.040865 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.