搜索
查看: 2154|回复: 0

II-2——生物信息学的定义(1)生信放映室

[复制链接]

5

主题

5

帖子

54

积分

注册会员

Rank: 2

积分
54
发表于 2017-5-18 16:22:59 | 显示全部楼层 |阅读模式
如同所有新兴学科一样,生物信息学有的是更多的定义和相对较少的实践者,且这些定义本身已随着人们认识的增长而不断演变。与其规范的讲解,不如选择性地给出一些突出其演变过程的定义。
起源
生物信息学一词(法语为bio-informatique)在1968年首次出现在Rybak的教科书中。当时最长的核苷酸序列是76bp的tRNA,遗传密码也才破译不久。当时阿波罗飞船上的计算机只有相当缓慢的CPU和只是现代手机百万倍分之一的存储空间,整个NASA的计算机能力都比现在的一台家用电脑弱。书中有3个章节,Rybak概括了生物分子、细胞、组织和生物体编码信息的方式,及这些信息是如何根据热力学定律进行传递的。这种编码包括以下6种:
1. 手性氨基酸、糖类和其他代谢产物
2. 分别存在于核酸、蛋白质和多糖中的碱基序列、氨基酸序列和糖类
3. 不同复合物、细胞成分、细胞类型和生物体小分子与大分子的光谱,不同组织与器官的解剖学
4. 生物种群的密集度与分布,大分子转录、翻译和复制过程中的信息传递
5. 生物体内通过循环系统及生物体间通过扩散代谢物的激素信号、神经脉冲
6. 表皮色素、声音和触觉
据此,Rybak在1978年概述了生物信息学课程的内容,比其他大学早10多年开展了这门学科的研究生课程。序列数据的爆发是从20世纪80年代后期开始,于90年代中期自动测序仪首次问世时泛滥。

有意思的是,生信的起源,就像每个垂直领域一样,都争论是自己首先开创或发现的,有兴趣可以看看Paulien Hogeweg的文章《The Roots of Bioinformatics in Theoretical Biology》


王室的定义
有这么一个未经证实的故事。1995年,伊丽莎白二世女王陛下被邀请到一个生物信息学领头单位,她说:生物信息学是个可怕的词。女王陛下简洁的定义概括了一下内容:
1. 这是个不得体的拼法,给了英国和各地的欧盟反对者及反法国者以利器
2. 这个词很容易写错,能正确拼写和发音的人一定是该领域的专家
3. 在制药公司和研究机构为重要项目确定人选时,那些会写这个词而知之甚少的人反而会排挤掉真正拥有生物信息学技术的人
4. 长期以来,计算机科学家和数学家都惊讶于生物信息学家所受到的追捧和荒唐的高薪,因为他们仍然在用旧的算法和数学工具来处理生物学数据,除了应用领域,其他的创新之处又从何体现?
5. 成功的生物信息学项目通常不遵照IT产业的发展实践,如全面分析问题,形成阶段性项目计划,最后实行方案。生信学家只能提供快速、局部的方案来分析数据,因为快速发展的技术导致不同的数据内容和不同的生物学问题产生。对生信开发者而言,他们的工作更像是一个汽车技工在开车时想重新设计一辆车
6. 生物信息学涉及生物数据,且是真正恐怖的数据!实验得出的结果通常不精确(有噪声)、多变和不完整。而且一些术语的使用不一致,一个基因、蛋白质或代谢物会根据先前发现者和随后进展而赋予很多不同的名字。更糟的是,同一术语还被不同生物学分支的学者用在不同的分子上。这样说来,我们应该感谢多年前肌肉分子生物学家放弃用首字母缩写DNA来表示变性肌动球蛋白(de-naturalized actomyosin)。

标准定义
生物信息学是一门融合生物学、信息科学和数学的交叉学科。这个定义暗示了一系列问题。
1. 没有人能在所有方面都胜任。曾有段时间,有些人称自己是生信专家,他们很快遭到质疑并失去信誉,因为他们竟然不知道这些学科中的一些显而易见的部分。随着生物学研究和信息技术的持续发展,这种现象变得更加严重。
2. 生信学家应该致力于某一学科,但也要对其他学科足够熟悉以担任不同领域专家间的翻译员。即为“一专多能”。
3. 实践者应该带着不同专长凝聚于一个团队来解决一个问题。
4. 生信的创新总是来自于至少3个方向之一。第一,对数学或算法的良好认知被用于处理一类新的生物学数据。第二,计算机科学或许会开发新的硬件或界面使得某些方面的生物学研究更易处理。第三,开发新的算法或数学技术来突破生物学问题的一些瓶颈。
5. 生物学家解决为什么这个项目重要到必须去完成问题,而信息学家和计算机科学家最擅长思考怎样开发一款软件;数学家能找到哪种算法或技术最适合相应的数据分析问题。任何项目都会遇到可选择的不同方式,而在某个方面看来最好的方法往往在别的方面看来并不是最好的,有时甚至是糟糕的。在发展的每个阶段,决策必须达成共识。
6. 各个学科必须保持平衡,否则就有可能开发出垃圾软件,甚至在已经解决的生物学问题上浪费时间。
基于之前的发展,21世纪将会见证生物信息学的焦点转向生物个体间的动力学过程,特别是处于不同物理水平的个体。例如,多细胞生物体中一个细胞的生理状态很大程度上取决于其在生物体中所处的位置、生物体的攻击状态和所处的环境,同样也取决于它的发育来源和当前的基因表达谱。

功能定义
(生物)信息学寻求(生物)实体的属性、群体和过程产生的知识。
这是更一般化的信息学定义,生物学实体可以有任意的物质形态,小到分子细胞,大到生物体和食物网。也可以是虚拟的物体,如有关生物实体的数据库和软件。

公共定义
生物信息学是应用计算和数学来管理、分析、理解数据并解决生物学问题,它还涉及医学信息、化学信息、神经学信息等信息学科。
生物信息学可认为是一个整体的过程,它包括原始数据的获取,建立合适的数据库并管理,分析数据并以文本的形式系统地阐述结果,这些结果必须是对相关生物学问题的真实的新的认识。数据的数量和质量对于这门学科直观重要。
生物信息学已成为生物学研究活动中必不可少的部分,并且很快将会在生物科学中变得越来越普遍,我们相信它就像分子生物学在20世纪80年代那样。



上一篇:I-3——linux初步:“里子”和“面子”-谈谈配置文件
下一篇:II-1——生物学研究的新面貌
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|生信技能树 ( 粤ICP备15016384号  

GMT+8, 2020-3-31 08:56 , Processed in 0.023456 second(s), 31 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.