搜索
查看: 10830|回复: 7

R语言无法处理这个CEL文件数据。

[复制链接]

3

主题

9

帖子

82

积分

注册会员

Rank: 2

积分
82
发表于 2018-12-13 16:07:10 | 显示全部楼层 |阅读模式
R语言:> library(affyPLM)> library(affy)
> Data<-ReadAffy()
Error:
The affy package is not designed for this array type.
Please use either the oligo or xps package.
平台文件是:Platforms (1)         GPL17586        [HTA-2_0] Affymetrix Human Transcriptome Array 2.0


无法读取。
根据提示应该是oligo or xps package.
请问那个大神有oligo package该语言怎么写啊?求指导啊。谢谢啊。
回复

使用道具 举报

0

主题

11

帖子

149

积分

注册会员

Rank: 2

积分
149
发表于 2018-12-14 15:53:17 | 显示全部楼层
ReadAffy()的括号里要写上你的数据文件内容。
回复 支持 反对

使用道具 举报

3

主题

9

帖子

82

积分

注册会员

Rank: 2

积分
82
 楼主| 发表于 2018-12-14 17:17:01 | 显示全部楼层
ant 发表于 2018-12-14 15:53
ReadAffy()的括号里要写上你的数据文件内容。

不是吧。这个代码我用其他的文件都可以读取。这里提示的error应该是aff包不能处理这个文件吧。
回复 支持 反对

使用道具 举报

0

主题

11

帖子

149

积分

注册会员

Rank: 2

积分
149
发表于 2018-12-14 17:40:45 | 显示全部楼层
narutao 发表于 2018-12-14 17:17
不是吧。这个代码我用其他的文件都可以读取。这里提示的error应该是aff包不能处理这个文件吧。 ...

哈哈,我想了半天猜出来了:
你不输入文件名时,它会读取工作目录下的所有文件CEL文件,你以前是这样通过的。而当你的工作目录中没有CEL文件时,还这么不指定文件名和目录,那就出错了。
所以,你要么把工作目录用setwd()设置一下,要么在ReadAffy()的括号中输入文件名和路径。
回复 支持 反对

使用道具 举报

3

主题

9

帖子

82

积分

注册会员

Rank: 2

积分
82
 楼主| 发表于 2018-12-19 15:07:46 | 显示全部楼层
ant 发表于 2018-12-14 17:40
哈哈,我想了半天猜出来了:
你不输入文件名时,它会读取工作目录下的所有文件CEL文件,你以前是这样通过 ...

你猜错了啊。我很多文件CEL格式都可以用这个affy包来读取,代码完全一样,但是 Affymetrix Human Transcriptome Array 2.0平台处理的CEL格式文件都会提示这个错误。我在网上查了好像确实要oligo包,但是不会啊。
回复 支持 反对

使用道具 举报

3

主题

9

帖子

82

积分

注册会员

Rank: 2

积分
82
 楼主| 发表于 2018-12-19 15:27:02 | 显示全部楼层
ant 发表于 2018-12-14 17:40
哈哈,我想了半天猜出来了:
你不输入文件名时,它会读取工作目录下的所有文件CEL文件,你以前是这样通过 ...

然后我找到了生信菜鸟团里发的一文。http://www.bio-info-trainee.com/1586.html。不知可否帮忙仔细看看帮忙把这个代码完善详细一点。


用oligo包来读取affymetix的基因表达芯片数据-CEL格式数据
Posted on 2016年4月23日
前面讲到affy处理的芯片平台是有限的,一般是hgu 95系列和133系列,[HuGene-1_1-st] Affymetrix Human Gene 1.1 ST Array这个平台虽然也是affymetrix公司的,但是affy包就无法处理 了,这时候就需要oligo包了!

oligo包是R语言的bioconductor系列包的一个,就一个功能,读取affymetix的基因表达芯片数据-CEL格式数据,处理成表达矩阵!!!


同理,我们也是要下载原始数据:一个例子:GSE48452

下载之后,解压到指定目录,就可以直接用oligo包啦!

geneCELs=list.celfiles('/path/GSE48452/cel_files/',listGzipped=T,full.name=T)
#用全路径,一般cel文件也是压缩包形式,没必要解压
affyGeneFS <- read.celfiles(geneCELs)  ##读取cel文件
geneCore <- rma(affyGeneFS, target = "core")  ##这一步是normalization,会比较耗时
genePS <- rma(affyGeneFS, target = "probeset")
#两种normlization的方法,##一般我们会选择transcript相关的
## 这个芯片平台还需要自己把探针ID赋值给表达矩阵
featureData(genePS) <- getNetAffx(genePS, "probeset")
featureData(geneCore) <- getNetAffx(geneCore, "transcript")
## 探针ID还需要注释到基因ID,这里就不讲了!
处理之后得到的表达矩阵应该是与GEO官网的一致,大家可以自己对照检查一下:

ftp://ftp.ncbi.nlm.nih.gov/geo/s ... eries_matrix.txt.gz
回复 支持 反对

使用道具 举报

0

主题

11

帖子

149

积分

注册会员

Rank: 2

积分
149
发表于 2019-2-10 12:07:59 | 显示全部楼层
narutao 发表于 2018-12-19 15:27
然后我找到了生信菜鸟团里发的一文。http://www.bio-info-trainee.com/1586.html。不知可否帮忙仔细看看 ...

那你应该是需要装这些个包:
source("http://bioconductor.org/biocLite.R")
biocLite("org.Hs.eg.db")
biocLite("hgu95av2.db")

详见http://www.bio-info-trainee.com/875.html
回复 支持 反对

使用道具 举报

4

主题

54

帖子

880

积分

高级会员

Rank: 4

积分
880
发表于 2019-8-13 05:50:06 | 显示全部楼层
这个是很新平台的昂飞芯片,HTA2.0。如果想从原始数据开始处理,只能去昂飞官网下载TAC软件,转换为表达矩阵。不然的话,只能下载已经提供的表达矩阵。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2023-3-25 11:39 , Processed in 0.101503 second(s), 31 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.