搜索
查看: 6067|回复: 1

[other] Illumina HumanMethylation BeadChip基础入门

[复制链接]

10

主题

52

帖子

559

积分

版主

Rank: 7Rank: 7Rank: 7

积分
559
QQ
发表于 2017-8-20 23:22:57 | 显示全部楼层 |阅读模式
450K甲基化芯片数据处理传送门
写在前面
Illumina甲基化芯片目前仍是很多实验室做甲基化项目的首选,尤其是对于大样本研究而言,其性价比相当高。这种芯片的发展主要经历了27K、450K以及850K,目前积累的数据主要是450K芯片的,未来850K可能会成为主流。之前我写过一篇450K芯片预处理的帖子,其中也介绍了这种芯片的基础知识以及流程图和代码,大家可以先看看。芯片的处理流程一般就是:数据读入——数据过滤——数据校正——下游分析。
step1:计算机资源的准备
与测序相比,芯片的处理可能对计算资源的要求是不算高,主要使用的工具就是R,R的使用比较耗内存,尤其是处理大批量数据的时候。
R本身是支持各种系统的,所以不管是mac、windows还是linux理论上都是可以的,只要下载对应版本即可。当然,如果你会linux最好在linux操作。其实数据分析很多都是相通的,所以之前群主推荐的配置和工具都是可以拿来用的。
需要安装的R packages包括 ChAMP,minfi和wateRmelon等.
作业1
  • 安装好R软件及相应的包,下载R包的说明书,整理它们的官网链接。
  • 了解illumina 450K甲基化芯片的探针设计,下载manifest文件。

step2:读文章拿到测序数据
从文章里面找到数据存放地址如下:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE52025
作业2
看文章里的methods部分,把它的分析步骤摘抄下来,然后理解GEO数据库的数据存放形式,把规律和笔记发在论坛上面,类似于RNA-seq数据处理入门CHIP-seq数据处理入门
step3:了解芯片数据
需要阅读相关的资料,比如illumina的官网介绍及相关的文献,对甲基化及该芯片的技术核心有一定了解,对于存在的问题也要知道,这对于后面分析时理解校正的意义非常重要!
作业3
理解芯片的probe,Bead,p值,I型探针和II型探针等。
step4:了解probe注释
在GEO或者illumina下载450K注释文件,理解每一列的意义及探针的分类。或者下载官网的manifest文件并且理解。
作业4
下载注释文件,理解甲基化探针的分类及注释。
step5:数据读入
处理甲基化芯片的R包其实很多,我之前用的是minfi,现在用ChAMP应该更加方便,它整合了很多分析处理数据的方法,例如过滤和校正等,所以大家可以以ChAMP为主。
作业5
查看甲基化芯片文件的命名规则,整理文件读入所需的表格,使用ChAMP包读入文件。
step6:数据过滤及数据校正
数据过滤主要是根据p值和bead数,probe还需要注意过滤snp和multiple-hit,样本过滤可以考虑PCA或MDS,很多时候R包会直接帮我们做了,但是需要对过滤的标准做到心中有数。
数据校正主要是I型探针和II型探针校正,批次校正和混杂因素校正等。
作业6
根据p值和bead数过滤探针和样本,过滤SNP和multiple-hit的探针,使用BMIQ校正探针类型,使用combat校正批次效应,使用lm校正混杂因素。
step7:下游分析
下游分析一般根据需求来定,比如差异甲基化分析、甲基化与表达的整合分析等。
作业7
学习T-test和线性回归的差异甲基化分析。
step8:探针注释、绘图等
甲基化探针可以根据官方给的注释文件进行基因和CGI的注释。
也可以使用webgestalt对感兴趣的探针做GO和Pathway的分析。
可以使用ggplot等对探针的分布进行绘图。
作业8
理解甲基化探针的CGI及基因位置注释并且简单可视化。
后记
希望和大家一起学习,共同进步。

扫下面微信二维码添加好友,拉你入群,请注明姓名+单位+研究方向。
    欢迎添加入群   





上一篇:gene symbol 与gene ID 批量转换?
下一篇:请问根据序列ID号提取相应ID用python该怎么实现
回复

使用道具 举报

29

主题

131

帖子

1208

积分

金牌会员

Rank: 6Rank: 6

积分
1208
发表于 2017-8-21 14:52:36 | 显示全部楼层
看样子最近要学的东西好多了嘞
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-10-22 15:07 , Processed in 0.031550 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.