搜索
查看: 3967|回复: 5

mRNA和protein表达水平的相关性-摘抄贴

[复制链接]

633

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
发表于 2016-11-14 11:21:35 | 显示全部楼层 |阅读模式
很有趣,先记录一下:不是很明白,为什么都是十几年前的讨论了。

摘抄:http://www.dxy.cn/bbs/thread/32976311#32976311

mRNA水平与蛋白质水平在很多情况下相关性并不好,特别是低丰度蛋白,相关性更差,可参考以下几篇文章:
Gygi SP, Rochon Y, Franza BR, Aebersold R. 1999. Correlation between Protein and mRNA Abundance in Yeast. Mol.Cell.Biol. 19, 1720-1730.
Chen GA, Gharib TG, Huang CC, Taylor JMG, Misek DE, Kardia SLR, Giordano TJ, Iannettoni MD, Orringer MB, Hanash SM, Beer DG. 2002. Discordant protein and mRNA expression in lung adenocarcinomas. Mol.Cell.Proteomics 1, 304-313.
Mackay VL, Li XH, Flory MR, Turcott E, Law GL, Serikawa KA, Xu XL, Lee H, Goodlett DR, Aebersold R, Zhao LP, Morris DR. 2004. Gene expression analyzed by high-resolution state array analysis and quantitative proteomics - Response of yeast to mating pheromone. Mol.Cell.Proteomics 3, 478-489.
Tian Q, Stepaniants SB, Mao M, Weng L, Feetham MC, Doyle MJ, Yi EC, Dai HY, Thorsson V, Eng J, Goodlett D, Berger JP, Gunter B, Linseley PS, Stoughton RB, Aebersold R, Collins SJ, Hanlon WA, Hood LE. 2004. Integrated genomic and proteomic analyses of gene expression in mammalian cells. Mol.Cell.Proteomics 3, 960-969.



上一篇:KO某个基因后,做mRNA-seq或者芯片,表达值就为0吗?
下一篇:【菜鸟Python练习13】[ROSALIND-IEV] Calculating Expected Offspring
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复

使用道具 举报

633

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
 楼主| 发表于 2016-11-14 11:21:45 | 显示全部楼层
现在就某个基因处理后蛋白和mRNA水平改变的几种搭配的情况列在下面,请广大战友说说自己碰见过下面那种情况,怎么解释?以及不可能出现的情况及你的精彩分析?
1-mRNA水平不变 蛋白水平不变;
2-mRNA水平增加 蛋白水平不变;
3-mRNA水平降低 蛋白水平不变;
4-mRNA水平不变 蛋白水平增加;
5-mRNA水平增加 蛋白水平增加;
6-mRNA水平降低 蛋白水平增加;
7-mRNA水平不变 蛋白水平降低;
8-mRNA水平增加 蛋白水平降低;
9-mRNA水平降低 蛋白水平降低;
我个人认为下列情况是最能合理解释的:
1-蛋白水平不变;mRNA水平不变
5-蛋白水平增加;mRNA水平增加
9-蛋白水平降低;mRNA水平降低
我个人认最不能合理解释的是:
6-蛋白水平增加;mRNA水平降低
8-蛋白水平降低;mRNA水平增加
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

633

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
 楼主| 发表于 2016-11-14 11:22:14 | 显示全部楼层
在思考不同实验层次产出数据比较的问题时,我觉得有一个很重要的问题要首先考虑一下:就是蛋白组和转录组数据间的关系,这决定我们可不可以拿这两个不同层次的产出数据来相互比较并下结论。众所周知,就是同一种脏器甚至样品来源的蛋白组数据和转录组数据间定量对接都没有好的相关性。退一步说,不考虑定量而只考虑有无,蛋白组数据与转录组数据也很难对等。面对这种现象,极端地,无非有两种判断:
第一,认为这种蛋白组与转录组的数据不可对接性就反映了这两层次生物过程的在质上的不等价性,也就是有转录本不一定会接下来有蛋白产物,甚至蛋白也不一定来源于所在细胞的转录本。在这种情况下,以下两种数据产生的原因分别是:
⑴ 蛋白组有而转录组无——蛋白来源于外界合成后转运进来。
⑵ 转录组有而蛋白组无——转录本根本就没有表达成蛋白。
第二,认为这种蛋白组与转录组的数据不可对接性只反映了这两层次生物过程的在量上的不等价性以及检出技术的局限,也就是凡是到了转录本这步,通常一定会接下来继续得到对应的蛋白产物。在这种情况下,以下两种数据产生的原因分别是:
⑴ 蛋白组有而转录组无:转录本因为低丰度或其它技术原因未能被检出。
⑵ 转录组有而蛋白组无:蛋白因为低丰度、极端理化性质或其它技术原因未能被检出。
由于基因检测技术远远成熟于蛋白检测技术以及基因的可扩增性等原因,因而呈现出转录组数据远多于蛋白组数据的状况。
对于蛋白组数据与转录组数据的不对等性,这两种肇因应该是都有可能存在的,但我个人认为第二种是决定性的,也就是是技术问题导致数据集的不对等性。试想生物体到了转录本这一步而不继续得到蛋白产物,是一种资源的浪费,是不符合效率的,即使在某些紧急调控和病理情况下存在,也绝对不会是主流行为。扩展开来:
⑴ 逐级调控是可以的,但一般是线性或级联放大的才符合经济有效的调控原则。
⑵ 那些在转录本水平高但蛋白水平低的产物,应该也是线性的或级联放大的,较低的放大系数可能用以稳定重要蛋白的量。在这种情况下,蛋白水平实际上与转录本水平持平更多是稍有放大,但由于基因检测技术远远成熟于蛋白检测技术以及基因的可扩增性等原因,因而转录本可被检出的阈值较低,呈现出表观上对应蛋白检测不出来的现象。
⑶ 至于第一级(转录)放大而第二级(翻译)抑制的情况,从生物学效率上怎么都说不过去。
如果承认以上的观点,也就是转录组有的,蛋白组也一定会有,只是技术所限而没被检出罢了。那么自然会有这样一个推论:除去某些紧急调控和病理情况,在正常情况下,在质(有无)上,蛋白组对应的转录本应该就是转录组本身,而并非后者的真子集。
至于讨论到定量,也就是转录本到蛋白产物的放大系数,可以依据这个放大系数或更进一步的mRNA→蛋白数量模型来将基因-蛋白分类而不是强行对接。但是还是因为技术本身的局限,数据中加入了很多干扰和不定因素,目前在定量问题上只能量力而行。
回到蛋白组和转录组数据整合上,如果遵循蛋白组对应的转录本应该就是转录组本身的原则,蛋白组得到的数据应该和转录组得到的数据加合在一起,得到一个在技术上加合而生物上(非定量)均质的数据集。每个集合单元(比如每种组织来源)间的这种数据集进行比较,在集合单元内就“不分门户”。一句话:如果不考虑转录翻译中的定量变化而只考虑有无,蛋白表达谱数据和基因表达谱数据实际是不同技术对一个生物实体的测量。
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

633

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
 楼主| 发表于 2016-11-14 11:22:24 | 显示全部楼层
我正好这几天做了个相关的分析。这里简单介绍一下
不过是从代谢组水平看转录物的。
我觉得转录物的数据,如果在代谢组上分析就会有很大的不同。于是就可以从全局上看到pathway的过程。
于是我就尝试了一下:
1.我做的是arabidopsis的ATH1芯片,这个数据可以从NCBI的GEO里面搞到。
2.找到几篇已经发表文章的数据,而且方向是当今热门的,比如激素,抗性,病原反应等等。然后下载。
3.对microarray数据进行基本分析,这个就很简单了。
4.找个pathway分析的软件(我用了3个:genmapp,pathwaymapa,kapa-viewer),看看有没有明显趋势。最后找到了一个在全局上都会受到下调的pathway。
5.然后到KEGG上看看这条pathway的其他信息。
6.NCBI上逐个搜索这几个酶的是有试验验证,还是只是个putative gene.
7.找个统计方法把这个pathway的现象给描述一下。
8.找文献支持论点。
我在这方面看到的情况是,有些在转录组水平上明显被上调或下调的基因,实际上在代谢水平上并没有一致性表现,多数的pathway成员,甚至是一个family的不同成员都不会有一致性的调节。很多在序列上同源的基因实际上在表达上有很大的不同,有些则是表达完全相反。(当然这部分没有写进去的)所以探索一下哪些转录物真正编码了蛋白,那些又行使了一些别的功能,那些还是未知的,应该是个不错的方向。
这个paper太小了(只做了10天左右),就不拿出来献丑了,有需要的pm。
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

633

主题

1182

帖子

4030

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
4030
 楼主| 发表于 2016-11-14 11:22:33 | 显示全部楼层
写的很有点意思。第一种的判断有些道理,比如一些pseudogene,其实还是表达的,但是,显然不会有翻译产物,也就是没有对应的蛋白组的产物。“蛋白来源于外界合成后转运进来”,有这样的文献么?真的有蛋白是不从基因组上翻译出来而直接合成的么?我觉得很疑惑。呵呵,没看过这样的文献。
第二种判断,我同意,目前更合理。比如蛋白组,检测的技术还是很差。我们这边的质谱仪已经很old了,灵敏度非常差。而且质谱的一个致命弱点是,蛋白太小,就无法检测,比如,SUMO蛋白,ubiquitin蛋白,神经肽之类的。不知道现在有没有什么好的方法能够研究这些小蛋白。
“对于蛋白组数据与转录组数据的不对等性”,不全是线性不线性的问题。蛋白存在一个问题,就是降解。比如ezrin蛋白,裂解细胞的时候降解极快。因此,蛋白组的数据的质量,要狠狠地打一个折扣。而且,蛋白是存在活性的,并不是量越多,功能发挥就越强劲。比如cdk-cyclin,有丝分裂的时候,不同时期会受到磷酸化的调控,活性会发生改变,从而引导细胞有丝分裂的进程。翻译后修饰对蛋白功能,结构,活性方面的影响非常重大,更麻烦的是,往往只有少数一部分蛋白被修饰。比如,正常hela细胞里面,50% RANGAP1被sumo化,但是其他的,比如PML, P53这些蛋白,一般只有1%-2%被sumo化。
基于蛋白分类然后分析亚对应关系,还是很难的。比如一个同一个family的蛋白,有些被某个激酶磷酸化,有些则不(unpublished observation)。
目前的数据,本身质量就太差,基于这样的数据来建立模型,显然,不大可靠。
不管考虑什么,目前来说,转录组也好,蛋白组也好,我很悲观的说一句:大家就是为了灌水而灌水。比方说,你说“如果遵循蛋白组对应的转录本应该就是转录组本身的原则,蛋白组得到的数据应该和转录组得到的数据加合在一起,得到一个在技术上加合而生物上(非定量)均质的数据集”,这里,关键的一个地方是“在技术上加合而生物上”,什么技术?嗬嗬,这可能就要牵涉到无数个独立的因素了...
你这个问题很复杂,需要打赏,请点击 http://www.bio-info-trainee.com/donate 进行打赏,谢谢
回复 支持 反对

使用道具 举报

0

主题

1

帖子

27

积分

新手上路

Rank: 1

积分
27
发表于 2017-6-15 16:28:26 | 显示全部楼层
很受用,谢谢
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2019-11-21 17:45 , Processed in 0.036344 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.