 2005-5-16 迎接生物数学时代的到来生命经纬载文:迎接生物数学时代的到来(全文),是对数学家王梓坤院士的访谈录。王梓坤院士谈到:
为什么生命科学研究中会有数学问题?生物学家告诉人们说,一个生物的全基因组序列蕴藏着这一生物的起源、进化、发育等所有与遗传性状有关的信息。所有这些重要信息都写在由4种碱基(A、T、G、C)组成的基因组DNA那条长长的双链上。已知大自然各种生灵的千变万化仅仅是由ATGC四个字母排列的变化而致。我们的汉语基本上也就是由2000个左右的汉字排列组合,这些文字有规律地组合生出无穷多的语境。中文起码要2000个字才能组成各种文章,而大自然只需4个字母,所有生命体都是这四个字母的排列组合。四个字母何以能构造出如此无穷多的变化?生物学家告诉我们,四种碱基的基因排列决定20种氨基酸的蛋白质序列。排列不同所生成的蛋白质也不同。再进一步,不同的蛋白质序列导致了构象的不同,构象的不同又决定了功能的不同。可见排列是最基本的,排列中包含着极为丰富的信息。而在排列决定构象、构象决定功能的过程中就有不少数学问题。另外,现在知道那些构成基因的DNA序列中很大部分是非编码序列,即所谓的“垃圾DNA”,怎么区分编码和非编码序列?这也需要用到数学,如各种算法,通过比较,用已经认识的东西来比较还不认识的东西。再如从基因变化预测疾病。我们知道有些基因突变是正常和必需的,有些突变则会致病。研究基因突变需要用到概率论等数学,从基因突变预测疾病则涉及到概率统计。
如果再深下去探究排列如何决定构象?排列与构象间是怎么关系?构象又是如何形成的?我们知道,有些构象是缠绕的,有些是打结的,那么到底有多少构象?研究这些问题就要涉及各种数学分支,如涉及构象的就可能要用到拓扑学、几何学等数学分支,用到几何中弯曲、扭结、缠绕等理论。至于这些构象是如何决定功能的现在还很不清楚,需要用到何种数学就更不好说了,很可能需要创造新的数学才能解决问题。
人类基因组序列目前已基本测定,面对这部由ATGC四个字母、30亿文字构成的“天书”,如何才能读懂?其中有没有语法?这可能涉及到很多数学问题。 …… 22:07, #, By xp 读书:他山之石 |
|