蛋白质组学的发展及在蚕学上的重要意义


              韦 亚 东  张 国 政
         (中国农业科学院蚕业研究所 江苏镇江 212018)

  随着生命科学研究领域不断拓宽和遗传物质-DNA结构与功能认识的不断深入,人们日益认识到生命功能的体现者-蛋白质研究的重要性。尤其90年代初期到现在,人们在基因方面已经取得了巨大成就,如10多种低等模式生物的基因组序列测定已完成、第一个多细胞生物-线虫基因组的DNA全序列测定也有可能提前在2003年完成等。生命科学已进入了后基因组时代,人们的兴趣。已集中到生命的体现者-蛋白质身上。于是90年代中期,国际上产生了一门研究细胞内全部蛋白质的组成及其规律的新兴学科-蛋白质组学。
  蛋白质组学一词是澳大利亚学者马克.威尔金斯(Mire.Wilkins)在1994年最先提出来的,最早见诸于文献是在1995年7月的“Electrophoresis”杂志上。它是指基因组表达的所有相应的蛋白质,也可以说是指细胞或组织或机体全部蛋白质的存在及其活动方式。蛋白质组学从整体的蛋白质水平的角度上,在一个更加深入、更加贴近生命本质的层次上去探索和发展生命活动的规律和重要生理、病理现象的本质等。
  大家共知,蛋白质组具有多样性和可变性。蛋白质的种类和数量在同一机体的不同细胞中各不相同。即使是同一种细胞,它在不同时期、不同条件下,其蛋白质组处在不断变化中。过去人们的研究往往是静止的、局部的,通常以个别基因或个别蛋白质为研究对象。面对复杂的、动态的、多因素的生命活动时,就表现出很大的局限性。因此,蛋白质学的出现是生命科学研究进展的必然结果,也是后基因时期的进一步延伸。
  蛋白质组研究内容包括对蛋白质表达模式的研究和对蛋白质功能模式的研究两个方面。其核心内容是蛋白质的群体研究。
  蛋白质的表达模式研究,需要解决的是各种细胞或组织的所有蛋白质的表达问题。目前,二维凝胶电泳(2DGE)是用来分离蛋白质组成分的主要手段。一种细胞或组织的蛋白质经2DGE分 离形成一个蛋白质组的二维图谱,通过计算机模式识别分析各蛋白质的等电点和分子量参数及蛋白质点强度、面积等,再结合以质谱分析为主要手段的蛋白质鉴定及数据库检索,从而大量鉴定其蛋白质组成员,建立相应的蛋白质组数据库,建立起机体或组织或细胞在“正常生理条件下”的蛋白质组图谱和数据库,是进行大规模蛋白质分析研究的基础,是蛋白质组表达分析的第一步。相关数据将作为检索机体或组织或细胞的二维参数图谱和数据库。蛋白质组分析的第二步,是比较分析在变化的条件下蛋白质组所发生的变化,如蛋白质表达量的数量、翻译后的加工修饰等。或者可能的条件下分析蛋白质在亚细胞水平上的定位的改变等,从而发现和鉴定其功能的蛋白质群。
      蛋白质组学的另一个重要的研究内容是蛋白质的功能模式研究,它揭示蛋白质功能模式,是蛋白质组研究的重要目标。因为不管是对基因组的研究,还是对蛋白质组的研究,最终目的揭示其功能及功能模式。我们知道,细胞或组织的蛋白质不是杂乱无章的混合物,蛋白质间的相互作用、相互协调是细胞进行信号传导及一切代谢活动的基础,对蛋白质组中蛋白质相互作用的内在联系的揭示是蛋白质组学的重要研究内容.另一方面,蛋白质结构是蛋白质发挥其功能所依赖的基础。
  对蛋白质结构的认识也成为我们了解涌现出的新基因的功能的一个重要基础。
  目前,进行蛋白质组研究的主要方法之一是利用双向聚丙烯酸胶凝胶电泳(2DPAGE)来分离复杂的蛋白质组分,并利用专门的计算机软件对所有图象进行数据采集和分析,然后采用氨基酸组成分析、微量蛋白质序列分析、质谱分析等技术,将从 胶上回收的蛋白质斑点进行精细的鉴定,获得有关部门蛋白质性质、表达变化及翻译局加工等方面的大规模信息。
  蛋白质研究目前还主要集中在原核生物及一些简单的真核生物,尤其是一些基因序列被完全搞清楚或大部分已知的生物,如支原体、细菌、酵母等。下面谈谈目前蛋白质组研究的进展情况及在蚕学上的研究意义。

  1 原核及简单真核生物的蛋白质组研究

  1.l 流感嗜血杆菌的蛋白质组研究
  流感嗜血杆菌是第一个获得基因组全序列的生物体。瑞士的一个小组通过 2D PAGE研方法研究了流感嗜血杆菌的蛋白质组分,在PH3-10的范围内鉴定了约300蛋白质组分,然后用有两个尿素浓度的麦黄酮胶分离了很难分离的5-20KD范围的蛋白质,还鉴定了其中的80种。另外用肝素亲和层析将碱性蛋白质富集后,在 PH6— 11的范围内又鉴定了102个蛋白质。其中许多是核酸结合蛋白,尤其是核糖体蛋白。华盛顿大学的另一个小组将用双向电泳得到的流感嗜血杆菌3个蛋白质斑点进行质谱分析,确定了263个蛋白质。其中大部分外 膜蛋白以及能量代谢和大分子合成相关的蛋白质。另外发现了几种不能在基因组中找到对应序列的蛋白质。令人惊奇的是,大约22%的被鉴定了的蛋白质表现出与预计不同的等电点和分子质量,显示它们可能经过了翻译后加工。
  1.2 大肠杆菌的蛋白质组研究
   到目前为止,大肠杆菌全部4000多个基因的DNA序列已被测定,而且建立了蛋白质-基因联合数据库,包括大约 1600个蛋白质斑点的数据。其中大约400个蛋白质斑点已与大约350个基因相对应.(基于有些基因可能有多个蛋白质产物)。对于这些蛋白质,这个数据库可以提供基因名称 、蛋白质名称、E.C编号、功能范畴、Swiss-Prot数据库编号、GeneBank序列号、基因图谱的位置、染色体上的转录方向以及一些生理信息。同时人们利用双向电泳技术,研究碳、氮、磷及硫元素限制导致的细胞内蛋白质谱的变化。在对营养成分磷限制的研究中,发现当磷饥饿时有137个蛋白质的合成速率明显改变,其中大部分(118个)的表现为诱导合成,其他则被抑制。
  1.3 致病微生物的蛋白质组研究
  蛋白质组的一个重要的应用是在阐明新抗生素作用机理的研究上,人们利用双向电泳技术,来研究抑制核糖体类抗生素对细菌的作用机制时,对12对作用于翻译过程的不同阶段和核糖体内不同分子的抗生素加以考察,发现其中8种诱导冷休克反应的一系列蛋白质,另4种诱导一系列热休克反应的蛋白质。因此预计新的作用与核糖体的化合物
也是诱导这两种反应,并且借此可以推测大肠杆菌对冷热的反应发生在核糖体水平上。
  1.4 酿酒酵母的蛋白质组研究
 人们在提出蛋白质组概念之前,就已开始利用双向电泳技术分析酵母蛋白谱的工作,并已完成6000多页的数据库,每页代表一个已知或推测的酵母蛋白,它主要包括以下几个方面的信息;①以序列为基础的已知和推测的酵母蛋白的特征信息,如分子质量、等电点、氨基酸组成、多肽片段大小等。②一些研究得到的关于各种蛋白质在翻译加工、亚细胞定位、功能分类方面的信息。③从以往的超过5000篇关于 酵母蛋白研究的文章中获得的有关各种蛋白质功能、相互作用、突变表型的信息,借助数据库的有利推动,在双向电泳蛋白质谱上最明显的蛋白质斑点的大部分得到鉴定。

  2 多细胞真核生物的蛋白质组研究

  2.1 线虫的蛋白质组研究
  利用双向电泳技术,Bini等对线虫(C.elegans)进行了蛋白质组分析,在等电点35-9和10-200Ku的范围内,可分辨2000个以上的蛋白质斑点,然后利用Edman微量测序技术,对其中24个斑点进行分析得到12个蛋白质的N端序列,其余的由于jN端封闭而未能测出序列。已测出的12个序列中有1个未能找到与其匹配的基因。另外11个与能量代谢、酸性核蛋白、G蛋白对应。C.elegans的19000个基因已于1998年12月全部测出,预计会对蛋白质组的研究提供帮助。
   2.2 果蝇的蛋白质组研究
   不同性别果蝇成虫的头、胸、腹部的蛋白质组图谱已被分别作出,总共约有12Q0个蛋白质被鉴出。其中的大多数在头、胸、腹中是相同的,但也发现了一部分其部位、性别特异的蛋白质。

  3 蚕学上蛋白质组学的发展前景

   目前,蛋白质组学在蚕学上的发展尚没起步,但蛋白质组学在蚕学上的研究基础早已经奠定。家 蚕遗传的研究是遗传学发展的基础,家蚕染色体上基因定位是少数几种遗传信息研究比较清楚的昆虫之一。尤其随着现在分子生物学的突飞猛进的发展和基因工程在家蚕的应用,认真探索和研究家蚕蛋白质组学成为蚕学发展的一个不可校少的方面。它的发展,势必使人们更加清楚家蚕基因控制与蛋白质表达之间的关系,可以改变少数几个基因,育成特殊要求丝质或特殊抗病、抗逆性的新品种。而且可以通过分子生物学手段,在家蚕体内获得对人类一些疾病有治疗作用的生物药。
  总之,当前蛋白质组研究还处在一个初期发展的阶段。相关技术手段及其配套应用亦还不成熟。但尽管蛋白质的研究刚刚开始不久,其进展还是比较显著的。美国、澳大利亚、日本和欧洲等近10个国家开展了蛋白质组研究。我国关于蛋白质组研究的国家自然科学基金项目也已启动。从蛋白质组学这个领域研究一开始,基础与实际应用的期望就表现出强烈结合的趋势。我们相信,随着蛋白质组学研究的深入发展,在揭示诸如生长、发育和代谢调控等生命活动的规律上将会有所突破,对探索重大疾病的机理、疾病诊断、疾病防治和新药开发将提供重要的理论指导。