搜索
查看: 3384|回复: 5

关于TGCA生存时间的问题

[复制链接]

4

主题

20

帖子

395

积分

中级会员

Rank: 3Rank: 3

积分
395
发表于 2017-4-4 22:09:32 | 显示全部楼层 |阅读模式
请教各位大神,我在做TCGA生存分析的时候遇到一些问题,一是我们分析出来的结果大都是1500天或3000天的生存时间,即分别为5年或10年生存时间,但有时候我不想需要比较那么长的时间,因为这么长的时间比较可能没有显著差异,

所以我想比较1年或3年的生存时间,这个在R该如何实现?

二是很多R包是根据某个基因的中位数来划分表达高低,再进行生存时间比较,然而,有时候我只想比较基因在表达最高和最低的30%
的样本上生存时间,这在在R又该如何实现?


还请群主和各位大神不吝赐教,谢谢!


回复

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-4-5 08:45:33 | 显示全部楼层
首先,假设 dat是你的TCGA数据,os_time 列是你的每一个样本的生存时间,gene_value列是你想用来分高低表达的基因的表达量。
第一个问题, dat$os_time <3000 取值即可,
第二个问题,先求出30%的值threshold,然后取dat$gene_value > threshold为高表达,取dat$gene_value <threshold为低表达,分组。
这是R的基本功。
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

3

主题

43

帖子

212

积分

中级会员

Rank: 3Rank: 3

积分
212
发表于 2017-4-5 08:51:18 | 显示全部楼层
我个人觉得这个就是一个数据挑选的问题,你直接把满足你要求的样本筛选出来再做分析不就行了?
回复 支持 反对

使用道具 举报

4

主题

20

帖子

395

积分

中级会员

Rank: 3Rank: 3

积分
395
 楼主| 发表于 2017-4-5 10:53:55 | 显示全部楼层
Jimmy 发表于 2017-4-5 08:45
首先,假设 dat是你的TCGA数据,os_time 列是你的每一个样本的生存时间,gene_value列是你想用来分高低表达 ...

谢谢群主!
回复 支持 反对

使用道具 举报

1

主题

5

帖子

40

积分

新手上路

Rank: 1

积分
40
发表于 2017-4-9 23:53:54 | 显示全部楼层
Jimmy 发表于 2017-4-5 08:45
首先,假设 dat是你的TCGA数据,os_time 列是你的每一个样本的生存时间,gene_value列是你想用来分高低表达 ...

群主我有个疑问,如果只挑选dat$os_time<3000(单位是天的话应该是<300吧)的话,只是选择了事件在一年内发生的样本,那一年内没有发生事件的样本岂不是被忽略了?是不是应该dat$os_time<300的status是1,剩下个体status 为0 事件没有发生么?
回复 支持 反对

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2017-4-10 09:10:41 | 显示全部楼层
鸡血红 发表于 2017-4-9 23:53
群主我有个疑问,如果只挑选dat$os_time

人家只想比较基因在表达最高和最低的30%的样本上生存时间~~

当然是要忽略呀, 我是回答他的问题,必须按照他的思路来
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-23 07:22 , Processed in 0.032596 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.