本帖最后由 hfliu 于 2017-7-5 16:34 编辑
测序和微阵列样品通常以多个批次或不同时间收集或处理。这通常会产生技术偏见,导致下游分析结果不正确。 BatchQC是一种软件工具,通过提供交互式诊断,可视化和统计分析来简化批量预处理和评估,以探究批量变化对数据的影响程度。 BatchQC诊断有助于确定是否需要完成批量调整,以及在进行下游分析之前如何应用校正。此外,BatchQC对数据进行了多种常用的批处理效应处理,用户可以快速查看每种方法的优点。 BatchQC被开发为Shiny App。输出被组织成多个选项卡,每个选项卡都是批处理效果分析和数据可视化的重要部分。 BatchQC报告具有以下部分:总结,差异表达分析,中值相关性,热图,圆形树状图,PCA分析,形状,ComBat和SVA。
Bioconductor BatchQC
在Bioconductor中这个包的教程是Rmarkdown写的,很容易懂,BatchQC package Introduction BatchQC Examples
一个例子
[AppleScript] 纯文本查看 复制代码 library(BatchQC)
data(example_batchqc_data)
#内置的数据,包含表达量矩阵和批次的信息和数据是分为哪几组,比如不同时间点的数据
batch <- batch_indicator$V1
#批次效应分组,一共三组
condition <- batch_indicator$V2
#数据标签,一共10种不同情况下的数据
batchQC(signature_data, batch=batch, condition=condition,
report_file="batchqc_signature_data_report.html", report_dir=".",
report_option_binary="111111111",
view_report=FALSE, interactive=TRUE)
#生成BatchQC报告
这里将 interactive=TRUE,交互模式打开,结果是生成网页的形成查看
如果觉得要进行批次效应的消除,可以运行
[AppleScript] 纯文本查看 复制代码 #Apply combat and rerun the BatchQC pipeline on the batch adjusted data
combat_data.matrix = ComBat(dat=signature_data, batch=batch)
#combat_data.matrix即为校正后的表达矩阵
batchQC(combat_data.matrix, batch=batch, condition=condition,
report_file="batchqc_combat_adj_report.html", report_dir=".",
report_option_binary="110011111",
interactive=FALSE)
将生成校正后的报告,这里将交互模式关闭,生成本地的报告文件
|