搜索
查看: 3166|回复: 5

[assembly] GEO表达谱数据怎么按照临床指标汇总成平均数?

[复制链接]

1

主题

4

帖子

30

积分

新手上路

Rank: 1

积分
30
QQ
发表于 2017-3-16 09:07:02 | 显示全部楼层 |阅读模式

条件:
1.表达谱数据中有基因x样本矩阵。
2.临床资料是样本x形状矩阵。
文件如果打开有问题,请用notepad++打开,再导入到excel查看。


问题:需要求各个基因按照临床分期(T1,T2,T3,T4)的平均表达量。
尽量用R语言实现。
输出到excel,类似result.csv的格式。



测试数据如下: GEO_mean_by_clinicalData.zip (3.46 KB, 下载次数: 14)
回复

使用道具 举报

1

主题

4

帖子

30

积分

新手上路

Rank: 1

积分
30
QQ
 楼主| 发表于 2017-3-16 09:11:02 | 显示全部楼层
求各位解答一下,提示一下也行 @Jimmy
还有  多个转录本  汇总成  基因 时,差异比较大的,取平均值还是中位数都感觉不靠谱,怎么办?
回复 支持 反对

使用道具 举报

633

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-3-16 09:19:51 | 显示全部楼层
JimmyWang 发表于 2017-3-16 09:11
求各位解答一下,提示一下也行 @Jimmy
还有  多个转录本  汇总成  基因 时,差异比较大的,取平均值还是中 ...

你这个帖子发错地方了,如果你希望别人无偿回答你,你应该放在QA版块,如果你愿意付费,请放在广告专区,谢谢
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

1

主题

4

帖子

30

积分

新手上路

Rank: 1

积分
30
QQ
 楼主| 发表于 2017-3-16 11:30:44 | 显示全部楼层
变科普吧,这是有人问我的问题。
1.可以用mysql解决。大概就是average和group by,没尝试;
2.使用R语言:
[AppleScript] 纯文本查看 复制代码
#获取各个基因的在各个分期的平均值

#############
# 参考
# [url]http://www.cnblogs.com/studyzy/p/4316118.html[/url]
# [url]https://cos.name/cn/topic/12365/[/url]
#############

setwd("D:\\data\\meanGEO")
getwd();

###############读取表达数据
expdata=read.csv("expression.csv",header=T)
rownames(expdata)=expdata[,1]
expdata=expdata[,-1] #减去第一列
#expdata=t(expdata)

###############读取临床数据
clinicalData=read.csv("clinical_data.csv",header=T)
#rownames(clinicalData)=clinicalData[,1]
#clinicalData=clinicalData[,-1] #减去第一列

###########
#从namedNum中获取数值数组
getNum=function(namedNum){
  arr=c();
  len=length(namedNum)
  for(i in 1:len){
    arr[i]=namedNum[[i]]
  }
  return(arr)
}

###############按照TNM分期获得GSM编号
tnm=clinicalData$TNM

for(i in unique(tnm)){
  subgroup=expdata[,which(clinicalData$TNM==i)] #获得GSM列
  #求行的平均数
  assign(paste('T',i,sep=""), getNum(rowMeans(subgroup)))
}


############## 合并成数据框
result=data.frame(T1=T1,T2=T2,T3=T3,T4=T4)
rownames(result)=rownames(expdata)

############## 输出结果
write.csv(result,file="result2.csv")
回复 支持 反对

使用道具 举报

1

主题

4

帖子

30

积分

新手上路

Rank: 1

积分
30
QQ
 楼主| 发表于 2017-3-16 11:33:46 | 显示全部楼层
Jimmy 发表于 2017-3-16 09:19
你这个帖子发错地方了,如果你希望别人无偿回答你,你应该放在QA版块,如果你愿意付费,请放在广告专区, ...

抱歉,没理解板块分类,以后会注意。
好像我没有权限移动帖子
回复 支持 反对

使用道具 举报

2

主题

51

帖子

477

积分

中级会员

Rank: 3Rank: 3

积分
477
发表于 2017-7-7 12:28:21 | 显示全部楼层
好像在 stackoverfow 见过一个用 aggregate 实现类似功能的,可以查查这个函数。而且这个貌似已经重复探针取平均值这个处理中了?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-12-16 11:35 , Processed in 0.033991 second(s), 32 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.