快好知 kuaihz订阅看过栏目

 

遗传密码又称密码子、遗传密码子、三联体密码。指信使RNA(mRNA)分子上从5'端到3'端方向,由起始密码子AUG开始,每三个核苷酸组成的三联体。

它决定肽链上每一个氨基酸和各氨基酸的合成顺序,以及蛋白质合成的起始、延伸和终止。

遗传密码是一组规则,将DNA或RNA序列以三个核苷酸为一组的密码子转译为蛋白质的氨基酸序列,以用于蛋白质合成。几乎所有的生物都使用同样的遗传密码,称为标准遗传密码;即使是非细胞结构的病毒,它们也是使用标准遗传密码。但是也有少数生物使用一些稍微不同的遗传密码。

遗传密码决定蛋白质中氨基酸顺序的核苷酸顺序 ,由3个连续的核苷酸组成的密码子所构成。由于脱氧核糖核酸(DNA)双链中一般只有一条单链(称为模版链)被转录为信使核糖核酸mRNA),而另一条单链(称为编码链)则不被转录,所以即使对于以双链 DNA作为遗传物质的生物来讲,密码也用核糖核酸(RNA)中的核苷酸顺序而不用DNA中的脱氧核苷酸顺序表示。

特点

大自然将奥秘或法则隐匿于一套密码之中,藉此创作出数以千万计的物种,之后又将其销毁,终而复始,生生不息。

方向性

密码子是对mRNA分子的碱基序列而言的,它的阅读方向是与mRNA的合成方向或mRNA编码方向一致的,即从5'端至3'端。

连续性

mRNA的读码方向从5'端至3'端方向,两个密码子之间无任何核苷酸隔开。mRNA链上碱基的插入、缺失和重叠,均造成框移突变。

简并性

指一个氨基酸具有两个或两个以上的密码子。密码子的第三位碱基改变往往不影响氨基酸翻译。

摆动性

mRNA上的密码子与转移RNA(tRNA)J上的反密码子配对辨认时,大多数情况遵守碱基互补配对原则,但也可出现不严格配对,尤其是密码子的第三位碱基与反密码子的第一位碱基配对时常出现不严格碱基互补,这种现象称为摆动配对

通用性

蛋白质生物合成的整套密码,从原核生物到人类都通用。但已发现少数例外,如动物细胞的线粒体、植物细胞的叶绿体。

破解历史

遗传密码的发现是20世纪50年代的一项奇妙想象和严密论证的伟大结晶。mRNA由四种含有不同碱基腺嘌呤(简称A)、尿嘧啶(简称U)、胞嘧啶(简称C)、鸟嘌呤(简称G)的核苷酸组成。最初科学家猜想,一个碱基决定一种氨基酸,那就只能决定四种氨基酸,显然不够决定生物体内的二十种氨基酸。那么二个碱基结合在一起,决定一个氨基酸,就可决定十六种氨基酸,显然还是不够。如果三个碱基组合在一起决定一个氨基酸,则有六十四种组合方式,看来三个碱基的三联体就可以满足二十种氨基酸的表示了,而且还有富余。猜想毕竟是猜想,还要严密论证才行。

自从发现了DNA的结构,科学家便开始致力研究有关制造蛋白质的秘密。伽莫夫(George Gamow)指出需要以三个核酸一组才能为20个氨基酸编码。1961年,美国国家卫生院的马太(Heinrich Matthaei)与尼伦伯格(Marshall Warren Nirenberg)在无细胞系统(Cell-free system)环境下,把一条只由尿嘧啶(U)组成的RNA转释成一条只有苯丙氨酸(Phe)的多肽,由此破解了首个密码子(UUU -> Phe)。随后科拉纳(Har Gobind Khorana)破解了其它密码子,接着霍利(Robett W.Holley)发现了负责转录过程的tRNA。1968年,科拉纳、霍利和尼伦伯格分享了诺贝尔生理学或医学奖。

阅读方式

破译遗传密码,必须了解阅读密码的方式。遗传密码的阅读,可能有两种方式:一种是重叠阅读,一种是非重叠阅读。例如mRNA上的碱基排列是AUGCUACCG。若非重叠阅读为AUG、CUA、CCG、;若重叠阅读为AUG、UGC、GCU、CUA、UAC、ACC、CCG。两种不同的阅读方式,会产生不同的氨基酸排列。克里克用T噬菌体为实验材料,研究基因的碱基增加或减少对其编码的蛋白质会有什么影响。克里克发现,在编码区增加或删除一个碱基,便无法产生正常功能的蛋白质;增加或删除两个碱基,也无法产生正常功能的蛋白质。但是当增加或删除三个碱基时,却合成了具有正常功能的蛋白质。这样克里克通过实验证明了遗传密码中三个碱基编码一个氨基酸,阅读密码的方式是从一个固定的起点开始,以非重叠的方式进行,编码之间没有分隔符。

验证猜想

1959年三联体密码的猜想终于被尼伦伯格(Nirenberg Marshall Warren)等人用“体外无细胞体系”的实验证实。尼伦伯格等人的实验用人工制成的只含一种核苷酸的mRNA作模板,提供核糖体、ATP、全套蛋白翻译所必需的酶系统和二十种氨基酸单体等等作为原料,在合适的条件下接着观察这已知的核苷酸组成的mRNA翻译出的多肽链。结果发现形成一条多个氨基酸组成的肽链。从而表明mRNA上的碱基决定氨基酸。此外实验同时也证明了mRNA上的密码是奇数的三联体,因为只有奇数的三联体才能形成交互的二个密码。

破译方法

尼伦伯格等发现由三个核苷酸构成的微mRNA能促进相应的氨基酸-tRNA和核糖体结合。但微mRNA不能合成多肽,因此不一定可靠。科兰纳(Khorana,Har Gobind)用已知组成的两个、三个或四个一组的核苷酸顺序人工合成mRNA,在细胞外的转译系统中加入放射性标记的氨基酸,然后分析合成的多肽中氨基酸的组成。

通过比较,找出实验中三联码相同的部分,再找出多肽中相同的氨基酸,于是可确定该三联码就为该氨基酸的遗传密码。科兰纳用此方法破译了全部遗传密码,从而和尼伦伯格分别获得1968年诺贝尔奖金

后来,尼伦伯格等用多种不同的人工mRNA进行实验,观察所得多肽链上的氨基酸的类别,再用统计方法推算出人工mRNA中三联体密码出现的频率,分析与合成蛋白中各种氨基酸的频率之间的相关性,以此方法也能找出20种氨基酸的全部遗传密码。最后,科学家们还用了由3个核苷酸组成的各种多核苷链来检查相应的氨基酸,进一步证实了全部密码子。

破解原理

DNA分子是由四种核苷酸的多聚体。这四种核苷酸的不同之处在于所含碱基的不同,即A、T、C、G四种碱基的不同。用A、T、C、G分别代表四种核苷酸,则DNA分子中将含有四种密码符号。以一段DNA含有1000对核苷酸而言,这四种密码的排列就可以有41000种形式,理论上可以表达出无限信息。

遗传密码

遗传密码(geneticcode)又是如何翻译的呢?首先是以DNA的一条链为模板合成与它互补的mRNA,根据碱基互补配对原则在这条mRNA链上,A变为U,T变为A,C变为G,G变为C。因此,这条mRNA上的遗传密码与原来模板DNA的互补DNA链是一样的,所不同的只是U代替了T。然后再由mRNA上的遗传密码翻译成多肽链中的氨基酸序列。碱基与氨基酸两者之间的密码关系,显然不可能是1个碱基决定1个氨基酸。因此,一个碱基的密码子(codon)是不能成立的。如果是两个碱基决定1个氨基酸,那么两个碱基的密码子可能的组合将是42=16。这种比现存的20种氨基酸还差4种因此不敷应用。如果每三个碱基决定一个氨基酸,三联体密码可能的组合将是43=64种。这比20种氨基酸多出44种,所以会产生多余密码子。可以认为是由于每个特定的氨基酸是由1个或多个的三联体(triplet)密码决定的。一个氨基酸由一个以上的三联体密码子所决定的现象,称为简并(degeneracy)。

每种三联体密码决定什么氨基酸呢?从1961年开始,经过大量的实验,分别利用64个已知三联体密码,找出了与他们对应的氨基酸。1966-1967年,全部完成了这套遗传密码的字典。大多数氨基酸都有几个三联体密码,多则6个,少则2个,这就是上面提到过的简并现象。只有色氨酸与甲硫氨酸这两种氨基酸例外,只有1个三联体密码。此外,还有3个三联体密码UAA、UAG和UGA不编码任何氨基酸,它们是蛋白质合成的终止信号。三联体密码AUG在原核生物中编码甲酰化甲硫氨酸,在真核生物中编码甲硫氨酸,并起合成起点作用。GUG编码结氨酸,在某些生物中也兼有合成起点作用。分析简并现象时可以看到,当三联体密码的第一个、第二个碱基决定之后,有时不管第三个碱基是什么,都可能决定同一个氨基酸。例如,脯氨酸是由下列四个三联体密码决定的:CCU、CCC、CCA、CCG。也就是说,在一个三联体密码上,第一个,第二个碱基比第三个碱基更为重要,这就是产生简并现象的基础。

同义的密码子越多,生物遗传的稳定性越大。因为当DNA分子上的碱基发生变化时,突变后所形成的三联体密码,可能与原来的三联体密码翻译成同样的氨基酸,或者化学性质相近的氨基酸,在多肽链上就不会表现任何变异或者变化不明显。因而简并现象对生物遗传的稳定性具有重要意义。

历史起源

除了少数的不同之外,地球上已知生物的遗传密码均非常接近;因此根据演化论,遗传密码应在生命历史中很早期就出现。现有的证据表明遗传密码的设定并非是随机的结果,对此有以下的可能解释:

韦斯(Carl Richard Woese)认为,一些氨基酸与它们相对应的密码子有选择性的化学结合力(立体化学假说,stereochemical hypothesis),这显示现在复杂的蛋白质制造过程可能并非一早存在,最初的蛋白质可能是直接在核酸上形成。但王子晖(J. Tze-Fei Wong)认为,氨基酸和相应编码的忠实性反映了氨基酸生物合成路径的相似性,并非物理化学性质的相似性(共进化假说,co-evolution hypothesis)。谢平指出,遗传密码子是生化系统的一部分,因 此,必须与生化系统的演化相关联,而生化系统的核心是ATP,只有它才能建立起核酸和蛋白质之间的联系(ATP中心假说,ATP-centric hypothesis):ATP(a)是光能转化成化学能的终端,(b)导演了一系列的生化循环(如卡尔文循环、糖酵解和三羧酸循环等)及元素重组,(c)它通过自身的转化与缩合将错综复杂的生命过程信息化——筛选出用4种碱基编码20多个氨基酸的三联体密码子系统、精巧地构建了一套遗传信息的保存、复制、转录和翻译以及多肽链的生产体系,(d)演绎出蛋白质与核酸互为因果的反馈体系,在个体生存的方向性筛选中,构筑了对细胞内成百上千种同步发生的生化反应进行秩序化管控(自组织)的复杂体系与规则,并最终建立起个性生命的同质化传递机制——遗传。因此,遗传密码子的起源是原始生命从能量转换到信息化的过程中实现的。

原始的遗传密码可能比今天简单得多,随着生命演化制造出新的氨基酸再被利用而令遗传密码变得复杂。虽然不少证据证明这一观点,但详细的演化过程仍在探索之中。经过自然选择,现时的遗传密码减低了突变造成的不良影响。Knight等认为,遗传密码是由选择(selection)、历史(history)和化学(chemistry)三个因素在不同阶段起作用的(综合进化假说)。

其它假说:艾根提出了试管选择(in vitro selection)假说,奥格尔(Leslie Eleazer Orgel)提出了解码(decoding)机理起源假说,杜维(Christian de Duve)提出了第二遗传密码(second genetic code)假说。Wu等推测,三联体密码从两种类型的双联体密码逐渐进化而来, 这两种双联体密码是按照三联体密码中固定的碱基位置来划分的, 包括前缀密码子(Prefix codons)和后缀密码子(Suffix codons)。不过,Baranov等推测三联体密码子是从更长的密码子(如四联体密码子quadruplet codons)演变而来,因为长的密码子具有更多的编码冗余从而能抵御更大的突变压力。

密码子表

此表列出了64种密码子以及氨基酸的标准配对。

1994年版曾邦哲著《结构论》中对密码子和氨基酸的组合数学计算公式为:C1/4+2C2/4+C3/4=20氨基酸,C1/4+6(C2/4+C3/4)=64密码子。

第 二 位 碱 基
-UCAG-
UUUU (Phe/F)苯丙氨酸UUC (Phe/F)苯丙氨酸UUA (Leu/L)亮氨酸UUG (Leu/L)亮氨酸UCU (Ser/S)丝氨酸UCC (Ser/S)丝氨酸UCA (Ser/S)丝氨酸UCG (Ser/S)丝氨酸UAU (Tyr/Y)酪氨酸UAC (Tyr/Y)酪氨酸UAA (终止)UAG (终止)UGU (Cys/C)半胱氨酸UGC (Cys/C)半胱氨酸UGA (终止)UGG (Trp/W)色氨酸UCAG
CCUU (Leu/L)亮氨酸CUC (Leu/L)亮氨酸CUA (Leu/L)亮氨酸CUG (Leu/L)亮氨酸CCU (Pro/P)脯氨酸CCC (Pro/P)脯氨酸CCA (Pro/P)脯氨酸CCG (Pro/P)脯氨酸CAU (His/H)组氨酸CAC (His/H)组氨酸CAA (Gln/Q)谷氨酰胺CAG (Gln/Q)谷氨酰胺CGU (Arg/R)精氨酸CGC (Arg/R)精氨酸CGA (Arg/R)精氨酸CGG (Arg/R)精氨酸UCAG
AAUU (Ile/I)异亮氨酸AUC (Ile/I)异亮氨酸AUA (Ile/I)异亮氨酸AUG (Met/M)甲硫氨酸(起始)ACU (Thr/T)苏氨酸ACC (Thr/T)苏氨酸ACA (Thr/T)苏氨酸ACG (Thr/T)苏氨酸AAU (Asn/N)天冬酰胺AAC (Asn/N)天冬酰胺AAA (Lys/K)赖氨酸AAG (Lys/K)赖氨酸AGU (Ser/S)丝氨酸AGC (Ser/S)丝氨酸AGA (Arg/R)精氨酸AGG (Arg/R)精氨酸UCAG
GGUU (Val/V)缬氨酸GUC (Val/V)缬氨酸GUA (Val/V)缬氨酸GUG (Val/V)缬氨酸GCU (Ala/A)丙氨酸GCC (Ala/A)丙氨酸GCA (Ala/A)丙氨酸GCG (Ala/A)丙氨酸GAU (Asp/D)天冬氨酸GAC (Asp/D)天冬氨酸GAA (Glu/E)谷氨酸GAG (Glu/E)谷氨酸GGU (Gly/G)甘氨酸GGC (Gly/G)甘氨酸GGA (Gly/G)甘氨酸GGG (Gly/G)甘氨酸UCAG

注:(起始)标准起始编码,同时为甲硫氨酸编码。mRNA中第一个AUG就是蛋白质翻译的起始部位。

逆密码

此表列出了和20种氨基酸和密码子的标准配对。

AlaAGCU,GCC,GCA,GCGLeuLUUA,UUG,CUU,CUC,CUA,CUG
ArgRCGU,CGC,CGA,CGG,AGA,AGGLysKAAA,AAG
AsnNAAU,AACMetMAUG
AspDGAU,GACPheFUUU,UUC
CysCUGU,UGCProPCCU,CCC,CCA,CCG
GlnQCAA,CAGSerSUCU,UCC,UCA,UCG,AGU,AGC
GluEGAA,GAGThrTACU,ACC,ACA,ACG
GlyGGGU,GGC,GGA,GGGTrpWUGG
HisHCAU,CACTyrYUAU,UAC
IleIAUU,AUC,AUAValVGUU,GUC,GUA,GUG
起始AUG终止UAG,UGA,UAA

技术细节

起始和终止密码子

蛋白质的转译从初始化密码子(起始密码子)开始,但亦需要适当的初始化序列和起始因子才能使mRNA和核糖体结合。最常见的起始密码子为AUG,其同时编码的氨基酸在细菌为甲酰甲硫氨酸,在真核生物为甲硫氨酸,但在个别情况其它一些密码子也具有起始的功能。

在经典遗传学中,终止密码子各有名称:UAG为琥珀(amber),UGA为蛋白石(opal),UAA为赭石(ochre)。这些名称来源于最初发现到这些终止密码子的基因的名称。终止密码子使核糖体和释放因子结合,使多肽从核糖体分离而结束转译的程序。另外,在哺乳动物的线粒体中,AGA和AGG也充当终止密码子。

简并性

大部分密码子具有简并性,即两个或者多个密码子编码同一氨基酸。简并的密码子通常只有第三位碱基不同,例如,GAA和GAG都编码谷氨酰胺。如果不管密码子的第三位为哪种核苷酸,都编码同一种氨基酸,则称之为四重简并;如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为二重简并,一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是起始密码子;另一个是色氨酸,由UGG编码。 遗传密码的这些性质可使基因更加耐受点突变。例如,四重简并密码子可以容忍密码子第三位的任何变异;二重简并密码子使三分之一可能的第三位的变异不影响蛋白质序列。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大,因此二重简并密码子也具有很强的对抗突变的能力。不影响氨基酸序列的突变称为沉默突变

简并性的出现是由于tRNA反密码子的第一位碱基可以和mRNA构成摆动碱基对,常见的情况为反密码子上的次黄嘌呤(I),以及和密码子形成非标准的U-G配对。

另一种有助对抗点突变的情况,是NUN (N代表任何核苷酸) 倾向于代表疏水性氨基酸,故此即使出现突变,仍有较大机会维持蛋白质的亲水度,减低致命破坏的可能。

阅读框

“密码子”是由阅读的起始位点决定的。例如,一段序列GGGAAACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个阅读框,每个都能产生不同的氨基酸序列(在上例中,相应为Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因为DNA的双螺旋结构,每段DNA实际上有六个阅读框。实际的框架是由起始密码子确定,通常是mRNA序列上第一个出现的AUG。 破坏阅读框架的变异(例如,插入或删除1个或2个核苷酸)称为阅读框变异,通常会严重影响到蛋白质的功能,故此并不常见,因为他们通常不能在演化中存活下来。

非标准的遗传密码

虽然遗传密码在不同生命之间有很强的一致性,但亦存在非标准的遗传密码。在有“细胞能量工厂”之称的线粒体中,便有和标准遗传密码数个相异的之处,甚至不同生物的线粒体有不同的遗传密码。支原体会把UGA转译为色氨酸。纤毛虫则把UAG(有时候还有UAA)转译为谷氨酰胺(一些绿藻也有同样现象),或把UGA转译为半胱氨酸。一些酵母会把GUG转译为丝氨酸。在一些罕见情况,一些蛋白质会有AUG以外的起始密码子。 真菌、原生生物和人以及其它动物的粒线体中的遗传密码与标准遗传密码的差异,主要变化如下:

密码子通常的作用例外的作用所属的生物
UGA中止编码色氨酸编码人、牛、酵母线粒体,支原体(Mycoplasma)基因组,如Capricolum
UGA中止编码半胱氨酸编码一些纤毛虫(ciliate)细胞核基因组,如游纤虫属(Euplotes)
AGR精氨酸编码中止编码大部分动物线粒体,脊椎动物线粒体
AGA精氨酸编码丝氨酸编码果蝇线粒体
AUA异亮氨酸编码蛋氨酸编码一些动物和酵母线粒体
UAA中止编码谷氨酰胺编码草履虫、一些纤毛虫(ciliate)细胞核基因组,如嗜热四膜虫(ThermophAilus tetrahymena)
UAG中止编码谷氨酸编码草履虫核细胞核基因组
GUG缬氨酸编码丝氨酸编码假丝酵母核基因组
AAA赖氨酸编码天冬氨酸编码一些动物的线粒体,果蝇线粒体
CUG亮氨酸编码中止编码圆柱念珠菌(Candida cylindracea)细胞核基因组
CUN亮氨酸编码苏氨酸编码酵母线粒体

按信使RNA的序列,在一些蛋白质里停止密码子会被翻译成非标准的氨基酸,例如UGA转译为硒半胱氨酸和UAG转译为吡咯赖氨酸,随着对基因组序列加深了解,科学家可能还会发现其它非标准的转译方式,以及其它未知氨基酸在生物中的应用。

结构基因

一个生物体携带的全套遗传信息,即基因组。具体化学分子是DNA线状分子。分子中每个有功能的单位被称作基因,每个基因均是由一连串单核苷酸组成。能编码蛋白质的基因称为结构基因。结构基因的表达是DNA分子通过转录反应生成线状核酸RNA分子,RNA分子在翻译系统的作用下翻译成蛋白质。

每个单核苷酸均由碱基,戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸三部分组成。碱基不同构成了不同的单核苷酸。组成DNA的碱基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的碱基以尿嘧啶(U)代替了胸腺嘧啶(T)。

三个单核苷酸形成一组密码子,而每个密码子代表一个氨基酸或终止信号。

蛋白质合成的过程中,基因先被从DNA转录为对应的RNA模板,即信使RNA(mRNA)。接下来在核糖体和转移RNA(tRNA)以及一些酶的作用下,由该RNA模板转译成为氨基酸组成的链(多肽),然后经过翻译后修饰形成蛋白质。

因为密码子由三个核苷酸组成,故一共有43=64种密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码了代表了长度为3个氨基酸的一段蛋白质序列。(DNA也有类似的序列,但是以T代替了U)。

一代密码

遗传密码是由核苷酸组成的三联体。翻译时从起始密码子开始,沿着mRNA的5′——3′方向,不重叠地连续阅读氨基酸密码子,一直进行到终止密码子才停止,结果从N端到C端生成一条具有特定顺序的肽链。

“遗传密码”一词,现在被用来代表两种完全不同的含义,外行常用它来表示生物体内的全部遗传信息。分子生物学家指的是表示四个字母的核酸语言和20个字母的蛋白质语言之间关系的小字典。要了解核苷酸顺序是如何决定氨基酸顺序的,首先要知道编码的比例关系,即要弄清楚核苷酸数目与氨基酸数目的对应比例关系。

从数学观点考虑,核酸通常有四种核苷酸,而组成蛋白质的氨基酸有20种,因此,一种核苷酸作为一种氨基酸的密码是不可能的。如果两种核苷酸为一组,代表一种氨基酸,那么它们所能代表的氨基酸也只能有42=16种(不足20种)。如果三个核苷酸对应一个氨基酸,那么可能的密码子有43=64种,这是能够将20种氨基酸全部包括进去的最低比例。因此密码子是三联体(triplet),而不是二联体,(duplet),更不是单一体(singlet)。

国际公认的遗传密码,它是在1954年首先由盖莫夫提出具体设想,即四种不同的碱基怎样排列组合进行编码,才能表达出20种不同的氨基酸。1961年,由尼伦伯格等用大肠杆菌无细胞体系实验,发现苯丙氨酸的密码就是RNA上的尿嘧啶UUU密码子,到1966年,64种遗传密码全部破译。

在64个密码子中,一共有三个终止密码子,它们是UAA、UAG和UGA,不与tRNA结合,但能被释放因子识别。终止密码子也叫标点密码子或叫无意义密码子。有两个氨基酸密码子AUG和GUG同时兼作起密码子,它们作为体内蛋白质生物合成的起始信号,其中AUG使用最普遍。

密码的最终破译是由实验室而不是由理论得出的,遗传密码体现了分子生物学的核心,犹如元素周期表是化学的核心一样,但二者又有很大的差别。元素周期表很可能在宇宙中的任何地方都是正确的,特别是在温度和压力与地球都相似的条件下。但是如果在其他星球也有生命的存在,而那种生命也利用核酸和蛋白质,它们的密码很可能有巨的差异。在地球上,遗传密码只在某些生物中有微小的变异。克里克认为,遗传密码如同生命本身一样,并不是事物永恒的性质,至少在一定程度上,它是偶然的产物。当密码最初开始进化的,它很可能对生命的起源起重要作用。

二代密码

对生命遗传信息存储传递及表达的认识是20世纪生物学所取得的最重要的突破。其中的关键问题是由3个相连的核苷酸顺序决定蛋白质分子肽链中的1个氨基酸,即“三联遗传密码”(‘第一遗传密码“)的破译。但是蛋白质必须有特定的三维空间结构,才能表现其特定的生物功能。50年代Anfinsen提出假说,认为蛋白质特定的三维空间结构是由其氨基酸排列顺序所决定的,并因此获得诺贝尔奖.这一论断现在已被广泛接受,大量实验充分说明氨基酸

顺序与蛋白质空间结构之间确实存在着一定的关系。遗传信息的传递,应该是从核酸序列到功能蛋白质的全过程.现有的遗传密码仅有从核酸序列到无结构的多肽链的信息传递,因此是不完整的.本文讨论的是从无结构的多肽链到

有完整结构的功能蛋白质的信息传递部分。完整的提法应该是遗传密码的第二部分,即蛋白质中氨基酸序列与其空间结构的对应关系,国际上称之为第二遗传密码或折叠密码(以下简称第二密码)。Anfinsen原理认为,和一定的氨基酸序列相对应的空间结构是热力学上最稳定的结构,但多肽链折叠成为相应的空间结构在实际上还存在一个“这一过程是否能够在一定时间内完成”的动力学问题。事实上蛋白质最稳定结构与一些相似结构之间的能量差并不大,约在20.9~83.7kJ/mol左右。

蛋白质之所以最容易形成天然结构除能量因素外,是由动力学和熵的因素所决定的。近10余年来国际上在蛋白质天然结构形成的问题上发生了概念上的变革。过去曾经认为新生肽链能够自发地折叠成为完整的空间结构,分子伴侣的发现已经把过去经典的自发折叠概念转变为,有帮助的肽链的自发折叠和组装“的新概念”。“自发”是指由第二遗传密码决定折叠终态的“内因”亦即热力学因素,而“帮助”则是为保证该过程能高效完成的“外因”,是由一类新发现的分子伴侣蛋白和折叠酶来帮助完成的,主要是帮助克服动力学和熵的障碍,因而帮助克服细胞内由各种因素引起折叠错误并造成翻译后多肽链分子的聚集沉淀而最终导致信息传递中止。新生肽成熟为活性蛋白的过程中,不仅有折叠中间体与分子伴侣和折叠酶的相互作用,还有亚基间相互作用而组装成有功能的多亚基蛋白,以及错误折叠分子与特异蛋白水解酶的识别和作用以从细胞内清除构象错误的分子等。细胞内折叠过程也是一个蛋白分子内和分子间肽链相互作用的过程.细胞内新合成的多肽链浓度极高,这种“拥挤”状态会加剧蛋白分子间的错误相互作用而导致分子聚集。

医学应用

人类基因图谱的遗传密码序列最近即将全部揭晓,科学家大胆地预测医学即将进入分子医学与基因治疗的时代,我们不仅可以利用分子医学或生物晶片的方法,找出有问题的致病分子,利用基因工程的方法加以改造,进行所谓“基因治疗“,还可以分析某某人的全部遗传密码序列,提前预测将来发生某种疾病的倾向。一切似乎非常完美,真的是如此吗?

临床的疾病,真正属于单一基因发生突变的仍属少数,大部分的疾病依旧原因不明,据推测多基因(Polygenic)或多因子(Polyfactorial)的原因占了大宗。单基因的疾病,例如苯酮尿症(Phenylketonuria)、舞蹈症(Huntington’sChorea)、地中海型贫血(beta-Thalassemia)等只占了很小的比例,常见的疾病,例如高血压、糖尿病退化性关节炎、老人失智症,可能是好几个基因出了问题,加上环境的因素的影响。对于单基因的疾病,现在可以应用遗传连锁(Linkagestudy)的方法,将致病基因定位(Positionalcloning),再破解遗传密码,但是多基因或多因子造成的疾病,目前并没有可行的遗传学理论或实验方法,可以用来找到所有可能相关的基因。

因为受到医学伦理的约束,基因治疗的临床价值迄今仍未得到证明。基因治疗最早是针对ADA(Adenosinedeaminase)缺乏引起的免疫缺乏症(泡泡娃娃,Bubblebaby),由美国国家卫生院的FrancisAnderson等人主持,他们取出病人的骨髓细胞,用基因工程的技术加以改造,修补其免疫缺损,再重新输回病人的身体,基因治疗的同时,病人也接受ADA酵素的治疗,研究人员担心万一基因治疗无效,因此不敢贸然停止ADA的使用,基因治疗究竟是否有效,并没有客观的结论。

1980年代有学者在国际知名的Nature杂志上发表研究论文,指出精神分裂症及躁郁症与遗传的关系,精神分裂症的基因被定位于第五对染色体,躁郁症的基因则位于第十一对染色体,后来相关的研究并不能重复这些结果,因此早先发表的文章遭到撤回,试想高血压,糖尿病究竟是单基因、多基因、或者环境因素所造成,迄今仍原因未明,更何况这些复杂的精神疾病!

人类行为的遗传模式到现在仍不清楚,大部分精神分裂症及躁郁症的病人都是偶发的个案,偶而有家族史,但是很少有三代以上的家族病史,无法套用目前基因连锁定位(Linkagestudy)来做致病基因的染色体定位;大部分的病人多半在二十岁左右发病,不容易找到对象结婚,因此精神疾病如果完全是由于遗传基因的作用,他们的遗传基因也很难传递到下一代,但是人口中精神分裂症及躁郁症的病人所占的比例始终约略小于百分之一,这种现象很难以现有的遗传学理论解释;精神疾病目前诊断的方式,仍然以症状诊断为主,始终缺乏生物性的诊断方法,譬如抽血检查血液中的化学物质,或者影像学的检查,看看脑部那个结构出了问题;精神疾病的异质性(Heterogenecity)相当高,增加研究的困难度,很难区分究竟是先天遗传或者后天环境造成。

1980年代曾有学者以美国东部Amish族群作为研究躁郁症的对象,后来因为少数几个个案的诊断有疑义,整的研究结果受到质疑。自从Watson及Crick于1953年发表DNA的论文之后,分子生物学一日千里,经由国际上许多科学家的协同努力,今天终于揭开人类的遗传密码序列,但是行为科学与精神医学连入口在哪里,现在都还不知道,之所以如此艰难,是因为到目前为止,连最基本的心智功能都没有明确的定义,更遑论要整合各种研究的结论,例如记忆(Memory)就有好多种分法,譬如分成即时记忆、短程记忆及长程记忆,也可分为明确记忆(Explicitmemory)及隐含记忆(Implicitmemory),加上工作状态记忆(Workingmemory)等等;大脑可以记忆,小脑也有记忆能力,例如开车,遇到紧急状况踩煞车,通常是反射动作,不经过大脑考虑,单单对于记忆的了解就如此凌乱,其他如情绪、知觉、理解力、逻辑推理能力等等,迄今仍是浑沌一片。

乐观的看来,最近这十年,或者最近这一百年,不会有太大进展,悲观的一派则认为人类的心智永远没有解答,除非遗传学以及神经科学理论的基本架构有划时代突破性的发现。

意义

第一密码的阐明解决了基因在不同生物体之间的转移与表达,开辟了遗传工程和蛋白工程的新产业。但是在异体表达的蛋白质往往不能正确折叠成为活性蛋白质而聚集形成包含体。生物工程的这个在生产上的瓶颈问题需要第二密码的理论研究和折叠的实验研究来指导和帮助解决。由于分子伴侣在新生肽链折叠中的关键作用,它一定会对提高生物工程产物的产率有重要的实用价值。

蛋白工程的兴起,已经使人们不再满足于天然蛋白的利用,而开始追求设计自然界不存在的全新的具有某些特定性质的蛋白质,这就开辟了蛋白设计的新领域。前面提到的把原来主要是β-折叠结构改变为一个主要是α-螺旋的新蛋白的设计就是这方面的一个例子,更多的努力将集中于有实用意义的蛋白设计上。近年来得知某些疾病是由于蛋白质折叠错误而引起的如类似于疯牛病的某些神经性疾病老年性痴呆症帕金森氏症。这已引起人们极大的注意。异常刺激会诱导细胞立即合成大量应激蛋白帮助细胞克服环境变化,这些应激蛋白多半是分子伴侣。由于分子伴侣

在细胞生命活动的各个层次和环节上都有重要的甚至关键的作用,它们的表达和行为必然与疾病有密切关系.如局部缺血化疗损伤心脏扩大高烧炎症感染代谢病细胞和组织损伤以及老年化都与应激蛋白有关。因此在医学上不仅开辟了与分子伴侣和应激蛋白有关的新的研究领域,也开创了广阔的应用前景。

投稿
非常不爽,删了吧! 相关词条:其他 肽链 细胞结构 氨基酸 核苷酸 信使核糖核酸 mRNA 核糖核酸 碱基配对 摆动配对 二十种氨基酸 伽莫夫 噬菌体 基因 编码区 核糖体 酶系统 单体 转译 科兰纳 诺贝尔奖金