搜索
查看: 6040|回复: 7

生存分析

[复制链接]

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2016-9-15 08:49:26 | 显示全部楼层 |阅读模式
有朋友发邮件问过我生存分析的问题,我就把博客的资料搬过来吧~
其实我都快忘记了,毕竟是自学的,也好久没有回过头来看了,还好笔记什么的还在,下次用就很简单了。
生存分析简介
TCGA数据里面的生存分析例子
用TCGA数据做cox生存分析的风险因子(比例风险模型)
基本上看完这三个介绍了,对生存分析是没有太大问题的。





上一篇:GWAS中如何计算BLUP
下一篇:学习WGCNA总结
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

365

主题

512

帖子

1713

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1713
发表于 2017-6-1 08:58:56 | 显示全部楼层

生存分析的核心是生存时间资料,包括两大元素,第一是事件是否发生,也称为删失(censor),事件发生记为censor=0,事件未发生(无论因为研究提前终止,还是因为失访)记为censor=1. 第二是事件发生的时间(time)。以肺癌患者死亡为例,当临床研究终止的时候,如果某一患者的状态为存活,从治疗到研究终止的时间为34个月,则该病例的censor=1,time=34.

进行生存分析时,我们需要关注几个关键的问题,即中位生存时间、中位随访时间、特定时间点生存率、KM生存曲线、某因素是否与生存率相关。中位生存时间和特定时间点生存率可以反映出该组患者的预后情况,KM生存曲线将结果可视化;中位随访时间反映该研究覆盖的时间段,越长的随访时间则越可靠;某因素是否与生存率相关则是最有临床价值的问题。

生存分析中的生存率是应用乘积限法(KM法)对存在删失的各各时间段计算累积生存概率得到的。即某时间段生存概率pi=单位时间内存活人数/单位时间初尚存活人数,特定时间生存率S(t)=p1×p2×…×pt. 因此生存分析中的各种“率”都不是简单的做个除法就能得到的哦。

回复 支持 1 反对 0

使用道具 举报

0

主题

2

帖子

30

积分

新手上路

Rank: 1

积分
30
发表于 2016-12-10 16:50:47 | 显示全部楼层
我是刚刚在学生存分析,是个小白,想请教下楼主,cox 怎么做HR呢,按照上面的代码没有额
回复 支持 反对

使用道具 举报

2

主题

52

帖子

474

积分

中级会员

Rank: 3Rank: 3

积分
474
发表于 2016-12-29 15:11:23 | 显示全部楼层
叶子handsome 发表于 2016-12-10 16:50
我是刚刚在学生存分析,是个小白,想请教下楼主,cox 怎么做HR呢,按照上面的代码没有额 ...

[AppleScript] 纯文本查看 复制代码
summary(coxmodel)

输出里面,coef就是beta值,相应的exp(coef)就是HR了。
回复 支持 反对

使用道具 举报

0

主题

2

帖子

30

积分

新手上路

Rank: 1

积分
30
发表于 2016-12-31 11:12:03 | 显示全部楼层
尚目目 发表于 2016-12-29 15:11
输出里面,coef就是beta值,相应的exp( ...

非常感谢,已经解决啦
回复 支持 反对

使用道具 举报

634

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
 楼主| 发表于 2017-2-10 18:00:27 | 显示全部楼层
应用Kaplan-Meier法对每个危险因素的两个暴露水平做生存曲线,若曲线存在交叉,则不能应用Cox生存分析

censor的本意是审查的意思,在生存分析里面译为删失

删失=存活+死于其他疾病+失访,就是预计生存时间要长于你随访到的时间,一般统计时以0表示

随访的研究目的在于研究预后因素与生存函数之间的关系。生存函数时暴露于预后因素的对象生存时间大于t的概率。

确定研究因素。研究因素是要根据临床需要而制定的,还要广泛查阅相关文献,从中选择你想研究的因素。可以选择很多因素,但是要注意,每个因素需要至少10个(有的版本是5~15个)事件(event)来负载,也就是说:研究因素的数量和样本量是呈正比例关系的。换句话说,当研究的样本量有限的时候,要用各种方法减少研究因素。具体方法下文中会详细介绍。另外一定要详细记录生存时间。
数据录入。对于一个大型的多因素分析,建议研究者规范应用病例报告表,可以直接录入原始数据,也可对数据进行编码后录入,后者更为简洁。
数据编码。
研究者要了解每个因素的变量类型,主要分为
离散型变量(用1,2,来表示的,如性别),
连续型变量连续型变量还是记录原始数据(如血色素的值),
分类变量(1,2,3,等来表示的如疾病分类,胰腺炎1,阑尾炎2,胆囊炎3,肠梗阻4
等级变量(1,2,3,如轻度,中度,重度)。

1,若研究分组,比如放疗组,编码1;化疗组,编码2;…)
2.终点事件编码(如存活1,死亡2),
3,数据状态编码(完整数据1,删失数据:0)
4.危险因素编码:非暴露状态0,暴露状态1,
若分层,也要根据临床经验把非暴露赋值为0,其它按照危险程度递增。
因为在最终结果时会计算相对风险HR,值大于1为危险因子,值小于1为保护因子。
比如RR值为2.13,是说明危险因素每增加一个单位,所增加的风险的倍数。若由于编码颠倒了,原来大于1的比值会小于1,危险因子会被误认为是保护因子。



删失数据是指在观察或试验中,由于人力或其他原因未能观察到所感兴趣的事件发生,因而得到的数据(censored data)。在临床试验中,感兴趣的事件可能包括:,病人死亡、出现癌症、红细胞减少、病情缓解等。删失情况分为:左、右删失
若在进行观察或调查时,一个个体的确切生存时间不知道,但只知道其生存时间大于
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

1

主题

5

帖子

40

积分

新手上路

Rank: 1

积分
40
发表于 2017-4-9 22:36:30 | 显示全部楼层
Jimmy 发表于 2017-2-10 18:00
应用Kaplan-Meier法对每个危险因素的两个暴露水平做生存曲线,若曲线存在交叉,则不能应用Cox生存分析

cen ...

看到有些帖子说如果某变量违反了cox的比例风险假设就把这个变量做分层strata然后控制这个变量呢?http://rpubs.com/xuefliang/153247
回复 支持 反对

使用道具 举报

2

主题

13

帖子

87

积分

注册会员

Rank: 2

积分
87
发表于 2017-9-20 22:10:49 | 显示全部楼层
Jimmy 发表于 2017-2-10 18:00
应用Kaplan-Meier法对每个危险因素的两个暴露水平做生存曲线,若曲线存在交叉,则不能应用Cox生存分析

cen ...

您好,请问如何对基因集进行生存分析呢?比如对WGCNA得到的module做生存分析
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-8-23 17:59 , Processed in 0.037473 second(s), 28 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.