-- 作者:admin
-- 发布时间:9/23/2004 2:05:00 AM
-- bioinformatics(2)
bioinformatics(2) 发信人: happymood (土豆块儿), 信区: Bioinformatics 标 题: bioinformatics(2) 发信站: 北大未名站 (2001年04月09日22:55:10 星期一), 站内信件 发信人: RolandGarros (Roland*等待相聚的日子), 信区: LifeScience 标 题: 生物信息学专题简介 发信站: BBS 水木清华站 (Wed Jan 10 15:50:54 2001) 生物信息学专题简介 一、生物信息学概述 生命科学的研究已经发展到一个新的阶段,人类基因组计划的实施标志着生物学的 研究在分子水平上有新的突破,另一方面,生物体并不是细胞的简单堆积,它是有多种 信号在多种通道中传递、调控的复杂网络系统,因此,必须在系统分析水平上有新的突 破。无论在分子水平还是在系统水平上进行深一步的研究,都需要与信息科学的密切结 合,生物信息学应运而生(1999/5/中国科学基金/307~308/李衍达/与信息科学的结合为 生命科学的研究开辟新的前景)。生物信息学是在数学、计算机科学和生命科学的基础 上形成的一门新型交叉学科,是指为理解各种数据的生物学意义,运用数学、计算机科 学与生物学手段进行生物信息的收集、加工、储存、传播、分析与解析的科学。作为一 门新的学科领域,它是将基因组DNA序列信息分析作为源头,在获得了蛋白质编码区的信 息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设 计。它由相互依赖、相互渗透的两个研究领域组成,即构筑现代生物学所必需的信息基 础研究,以及旨在解析基本生物学问题的基于计算机技术的基础生物学研究(1999/51( 2)/17~20/李伟章、恽榴红/生物信息学与新药研究)。因此,在基因组研究时代,基因 组信息学、蛋白质的结构模拟以及药物设计必将有机的结合在一起,它们是生物信息学 的三个重要组成部分(1999/19(4)/11~14/生物工程进展/陈润生/当前生物信息学的重 要研究任务)。 生物信息学更多的具备研究领域的特征,而非一套完整的科学概念和原理,因而具 有独特的开放性和应用途径的多样性等特征。作为建立于应用数学、计算机科学、生物 学、物理学、化学等多学科加查结合基础之上的生物信息学,无疑具有坚实的理论基础 和广泛的应用前景。 当前生信息学的重要研究任务包括(1999/19(4)/11~14/生物工程进展/陈润生/当前生 物信息学的重要研究任务): 基因组相关信息的收集、储存、管理与提供 随着当前互联网提供的大量重要的生物学数据库及相关服务器,有关基因组相关 数据库的发展相应受到研究者的广泛关注:建立基因组信息的评估与检测系统、数据标 准化、进行基因组信息的可视化和专家系统的研究、次级及专业数据库的发展、以因特 网为基础的基因组信息学传输网络。 新基因的发现、鉴定 新基因的确认、鉴定将为更好的了解与其相关的生理功能或疾病的本质提供依据, 从而为新药的开发、设计奠定基础。目前利用EST序列信息寻找新基因成为国际基因争夺 战的热点。 非编码区信息结构分析 从生物进化观点看,占据人类基因组的95%非编码区的信息结构必将具备重要的生物 功能,普遍认为其与基因在四维时空的表达调控密切相关,因此寻找非编码区的编码特 征、信息调节及表达规律无疑将是未来相当长时间内的热点课题。 生物进化的研究 自1859年达尔文的物种起源发表以来,进化是对人类自然科学和自然哲学发展的最 重大贡献之一。随着分子生物学的发展,特别是生物信息学时代的到来,使得分子进化 的研究具备了极好的时机。 完整基因组的比较研究 在后基因组时代,生物信息学家面对的不仅是序列和基因,更多的则是越来越多的 完整基因组,有完整基因组研究导致的比较基因组学必将为后基因组研究开辟新的领域 。 基因组信息分析方法研究 为了更有效的发展生物信息学,发展相应的分析方法及手段是至关重要的。因此, 发展有效的能够支持大尺度作图与测序需要的软件和数据库以及若干数据库工具,改进 现有的理论分析方法,无疑将更好、更快的引导生物信息学的发展。 大规模基因功能表达谱的分析 目前,基因组的研究已经从结构基因组逐渐过渡到功能基因组,因此获得基因的功 能表达谱将存在于人类基因祖上的静的基因图谱,向时间、空间维上展开将是新阶段基 因组研究的核心。为了获得基因表达的功能谱,国际上在核酸和蛋白质两个层次上均发 展了新技术。在核酸层次上的新技术是DNA芯片,在蛋白质层次上则是二维凝胶电泳和测 序质谱技术。 蛋白质分子空间结构预测、模拟和分子设计 当前不论国际还是国内,蛋白质空间结构预测与蛋白质分子的改性设计均在广泛展 开。 药物设计 近年来随着结构生物学的发展,相当数量的蛋白质以及一些核酸、多糖的三维结构 获得精确测定,基于生物大分子结构知识的药物设计成为当前的热点。生物信息学的研 究不仅可提供生物大分子空间结构的信息,还能提供电子结构的信息,如能级、表面电 荷分布、分子轨道相互作用等以及动力学行为的信息,如生物化学反应中的能量变化、 电荷转移、构象变化等。理论模拟还可研究包括生物分子及其周围环境的复杂体系和生 物分子的量子效应。 二、生物信息学研究内容 基因组 基因进化 基因组的进化包括在大小、组成、序列、三维结构等方面的进化,它是一种具有 整体效应的过程。从而基因组进化的各个方面都是相互联系,并与基因组的整体进化密 切相关的。其中,基因组的大小和组成的进化就很能体现出基因组整体发展的趋势,而 且基因组组成成份的特点还能反映出基因组进化的大体途径。因此,基因组的进化可以 通过其个别方面来进行深入研究。(1999/38(1)/中山大学学报/张尚宏,屈良鹄/基因 组的进化与内含子中的基因的进化) 内含子是基因组组成中的一种重要而又令人迷惑的成份。继在基因中发现非编码 的内含子后,又发现某些内含子可含有编码与它们活动有关的蛋白质的基因,近年更在 一些核mRNA内含子中发现编码核仁小分子RNA的基因。(1999/38(1)/49-52/中山大学 学报/张尚宏,屈良鹄/基因组的进化与内含子中的基因的进化) 30年代后,不少学者认为调节发育时间或速度的基因,一定参与形态进化的调节 。以后,随着遗传密码的解读、基因表达调控机理的阐述,生理和形态学进化的分子机 理研究进入了新阶段。1970年前后,Britten等人提出了物种进化变异的分子基础,引起 生物学家的极大重视。他们将基因分成"生产区"和"感受区"两部分,即现在所说的"编码 区"和"启动区"。根据推断,认为进化将主要涉及"调控基因"即由所谓的"顺式调控元件 "的改变而引发(2000/3/143-146/中国科学基金/金振华/生物形态进化和转录调控基因 )。 所谓转录调节基因,即其产物能够直接结合于顺式调控元件,并特异地调节基因 表达的基因。目前有关转录调节基因与进化的关系的研究,动物方面集中在含同源域的 转录调节蛋白,植物体系则集中在含MADS框的转录调节蛋白。转录调节蛋白常被认为是 天然物种,如原种和表型相似又有明确差异的物种,甚至分类上不同种属物种之间形态 的"转换器"。对于转录调节基因顺式调控区的修饰是新形态进化的主要模式,不仅具有 统计学上的可预见性,而且还拥有大量纪录在案的实际事例。 生物进化的研究历史表明,认识物种的遗传机制是揭示进化本质的基础。因此,集中力 量将个体发育过程中的整合基因从活化(结构、功能、互作)到生理生化活动进行形态 的详细过程探讨,特别是集中探讨转录调控基因顺式调控区的进化,无疑对于研究形态 进化机理提供了有力的依据。 基因芯片 分子标记 广义的分子标记是指可遗传的并可检测的DNA序列或蛋白质。蛋白质标记包括种子储 藏蛋白和同工酶(指由一个以上基因位点编码的酶的不同分子形式)及等位酶(指由同 一基因位点的不同等位基因编码的酶的不同分子形式)。狭义的分子标记概念只是指DN A标记,而这个界定现在被广泛采纳。 理想的分子标记必须达到以下几个要求:(1)具有高的多态性;(2)共显性遗传,即 利用分子标记可鉴别二倍体中杂合和纯和基因型;(3)能明确辨别等位基因;(4)遍 布整个基因组;(5)除特殊位点的标记外,要求分子标记均匀分布于整个基因组;(6 )选择中性(即无基因多效性);(7)检测手段简单、快速(如实验程序易自动化); (8)开发成本和使用成本尽量低廉(9)在实验室内和实验空间重复性好(便于数据交 换) 分子标记的分类: (1)限制性片段长度多态性 (2)一般选择单拷贝探针 (3)以PCR为基础的分子标记 进化-发育生物学 EST EST是cDNA的部分序列,平均长度为300~500bp,由大规模cDNA克隆一次测序得到, 因此称作表达序列标签。通常是从已有的cDNA文库中随机取出几百到几千个克隆一次测 序产生。一般使用载体多克隆位点互补序列作为通用引物。一个EST代表生物体某种组织 某一时期的一个表达基因。 起初,由Genebank、EMBL-EBI、DDBJ三大数据库收集EST信息;1993年NCBI建立专门 的EST数据库dbEST来收集和保存所有的EST数据。DbEST刚建立的时候,包括22537个EST 数据,分别来自7种不同的生物体。经过6年的发展,到1999年5月14日,dbEST已收录24 37303个EST序列,分别来自161种不同的生物体。在dbEST中记录了每个EST序列的登记号 、测序引物、碱基序列和cDNA文库的来源等详细资料。 目前,比较常用的EST或包括EST的DNA数据库有: 数据库名称 网址 dbEST http://www.ncbi.nlm.nih.gov/dbEST/index.htmlGeneBank GeneBank http://www.ncbi.nlm.nih.gov/web/GeneBank/index.htmlEMBL-EBI EMBL-EBI http://www.ebi.ac.uk/databases/index.html DDBJ http://www.ddbj.nig.ac.jp/ TDB http://www.tigr.org/tdb/tdb.html ATCC http://www.atcc.org/catalogs/recomb.html EST目前主要被用于寻找新基因和了解基因表达概况。一般步骤如下:建立组织或细胞的 cDNA文库-〉从文库中随机取出足够量的cDNA克隆进行自动测序-〉生物信息学分析(即 将所得的EST数据与dbEST等数据库的数据比较,确定哪些代表已知基因、哪些代表未知 基因)-〉进一步分析未知基因或归类分析全部EST以获得组织或细胞的基因表达概况。 EST被广泛用于肿瘤细胞、正常人体组织和胚胎细胞的基因表达概况研究。 EST还被用于确定编码区的边界,与酵母双杂交系统结合进行蛋白质相互作用的研究,分 析基因组的转录图谱等。在EST刚刚兴起的时候,由于构建cDNA文库和序列测定技术还不 够完善,所以其应用受到一定的限制。随着激光显微切割、cDNA文库标准化、RACE等技 术的出现,使得科研人员能够建立高质量的有代表性的cDNA文库并有可能获得全长或比 较长的cDNA。同时,测序及DNA芯片技术的发展也使得快速大规模cDNA序列测序和分析成 为可能。而且,经过近十年的应用已经积累了一个信息量相当庞大的EST数据库。因此认 为从分析EST来研究基因表达是一种行之有效的方法,它具有快速、大规模、含信息量多 等优点。随着科学技术以及生物信息学的迅猛发展,EST必将和许多新的方法一起帮助人 们最终揭开生命的奥秘。 人类基因组 自1990年10月1日美国在世界上第一个实施人类基因组计划以来,已经整整过去了9 年。这项被称之为与"曼哈顿计划"、"登月计划"相媲美的巨大生命科学提出之初,即受 到全世界的科学家、新闻媒体等各界的广泛关注,并就此展开了激烈的讨论,沸沸扬扬 中研究计划启动了。如今,随着新技术、新方法的提出、发现,人类基因组计划顺利进 行。(2000/中国科学基金/108~111/江虎军、王钦南、 撕合?人类基因组计划中目前的 几个重要研究领域) 我国于1994年也开始进行人类基因组研究计划,并提出了计划的各研究阶段,根据 "有所为、有所不为"的原则,充分发挥我国的资源优势,力求在基因组多样性以及疾病 基因和重要功能基因的研究方面取得新突破,并及时展开功能基因组学的研究,争取在 国际人类基因组中真正占有一席之地。 随着人类基因组学研究的展开,当前迫切、重要的研究领域涉及(2000/中国科学基 金/108~111/江虎军、王钦南、 撕合?人类基因组计划中目前的几个重要研究领域): (1)人类基因组测序 人类基因组计划的最终目的是希望用15年时间,完成人全部23对染色体的遗传图谱 、物理图谱、序列图谱和转录图谱,提供一张精度达99.99%的人类基因组序列图是整个 研究计划的重点和难点,因此,测序手段的改进和测序方法的创新一直是该计划的资助 重点。 目前,世界上已有美国、英国、法国、德国和日本5个国家正在进行人基因组的大规 模测序,进展速度异常之快。1999年12月2日英国的The Sanger Center在《自然》上正 式公布完成了人第22号染色体的全序列测定(其中尚有11个序列间隙有待填补),这是 待测序的24条人染色体中第一条完成测序的人染色体。该染色体不大,仅33.4Mb,至少 包含有545个基因和134个假基因,通过这次测序新发现148个基因。令人感兴趣的是该染 色体上分布有与人的一些遗传疾病有关的基因,如CES、VCFS等。显而易见,这项工作的 完成使得科学家今后能够较容易的从DNA序列中鉴定出而不是分离出所感兴趣的基因。这 也说明开展人类基因组大规模测序的重要性。 (2)测序手段的改进 在测序手段上,Perkin-Elmer推出了ABI PRISM3700全自动DNA测序仪,它是在ABI PRISM 377的基础上改进而来。加样孔由原来的36孔增加到384孔,全部采用毛细管自动 进样,无须人工制作测序胶,省力达80%以上。 在测序方法上,鸟枪法测序(Shotgun Sequencing)是目前的一种全新的测序方法 。其基本原理是在人基因组随机文库的基础上,直接对随机文库中的各克隆进行测序, 同时从3'和5'两端对同一克隆测序。 (3)生物芯片技术 随着大量基因的被克隆,人类基因组的下一步的工作难点和重点将是分析基因的功 能,了解基因在时间和空间上的表达特征。生物芯片技术正是在这种需求下应运而生, 它集生物技术,微电子加工技术,分析化学技术,激光技术,甚至计算机软件技术融为 一体。 (4)人基因的定位和克隆 在基因克隆的过程中,有2种类型的基因格外引人注意:一是具有重要社会行为功能 的基因;二是与疾病相关的基因。因为根据这些基因可以开发出新的药物,所以这些基 因一旦被克隆便会被专利保护其知识产权。 人的疾病相关基因的研究一直是遗传学领域的一个研究热点。目前已克隆到的疾病 相关基因几乎全是以孟德尔方式遗传的质量性状基因。然而,不少严重威胁人生命的疾 病,如肿瘤、高血压、糖尿病等,均表现为多基因性状,发病的早晚轻重与环境、个人 生活方式等有关,研究这些疾病相关基因已成为今后的一个重点和难点。 (5)基因组流行病学 在现实生活中,不同人群间由多基因控制疾病的发生概率明显不同,如我国的南方 广东人群的鼻咽癌发病率较其他地区人群高,而山西、河南人群的食管癌的发病率则显 著高于其他地区人群。要真正认清这些疾病的机制,仅从个体出发进行研究是远不够的 ,需要以整个地区人群为研究对象,要研究疾病相关基因及其基因频率、生活环境、当 地人群的饮食习惯及其相互间的作用等,从基因水平开展流行病研究。 专家们呼吁应尽快开展如下四方面的工作: (1)研究不同人群间疾病相关基因的变异频率; (2)确定不同人群间基因突变与疾病发生间的密切程度 (3)研究不同人群间基因与基因、基因与环境互作对疾病发生的影响 (4)寻找针对不同人群有效的遗传学检测方法,并制定相应的措施以提高预防疾病的能 力。 SNP 即DNA多态性(DNA Polymorphism),又称单核苷酸多态性(Single Nucleotide P olymorphism, SNPs)。对SNP的研究已列入美国人类基因组计划最后的一个五年计划( 1999-2003)的资助重点,并提出要建立一张包含有至少10万个SNPs的遗传图谱,使得在 人基因组中每3万个核苷酸中即有一个SNP标记。这种高密度的SNP遗传图将有利于开展人 全基因组研究,特别是对寻找复杂性状疾病如肿瘤、糖尿病、精神病等的相关基因,并 据此开发出针对不同人的特效药物。(2000/中国科学基金/108~111/江虎军、王钦南、 撕合?人类基因组计划中目前的几个重要研究领域) 2. 蛋白质组 蛋白质组(proteome)一词是澳大利亚Macquarie大学的Willkins和Williams在199 4年首次提出,最早见诸于文献是在1995年7月的<Electrophoresis>杂志上。它是指基因 组表达的全部蛋白质及其存在方式。蛋白质组学旨在阐明生物体全部蛋白质的表达模式 及功能模式,其内容包括鉴定蛋白质的表达、存在方式(修饰形式)、结构、功能和相 互作用等。 从蛋白质组的定义上就可以清楚的看出,蛋白质组学不同于传统的蛋白质学科之处 在于它的研究是在生物体或其细胞的整体蛋白质水平上进行的,它从一个机体或一个细 胞的蛋白质整体活动的角度来揭示和阐明生命活动的基本规律。 蛋白质组研究分为两个方面:(1)对蛋白质表达模式(蛋白质组组成)的研究(2 )蛋白质组功能模式(目前主要集中在蛋白质相互作用网络关系)的研究。对蛋白质组 组成的分析鉴定是蛋白质组学中的与基因组学相对应的内容。它要求对蛋白质组进行表 征,即所有蛋白质的分离与鉴定及其图谱化。具体有两个步骤:(1)从样品中分离蛋白 质,(2)鉴定被分离的蛋白质。双向凝胶电泳(2DGE)和质谱(MS)技术是当前上述两 个步骤中的两个支撑技术。 近年来,蛋白质组学有关的技术和生物信息学在不断的并迅速的开发和发展中。作 为蛋白质组当前的关键技术之一的双向电泳技术的灵敏度和分辨率不断得到提高,最高 可达到11000个蛋白质点的分辨率。与此同时,一种基于芯片技术的蛋白质检测的更先进 的方法--抗体与蛋白质阵列技术也在迅速发展。此外,大规模的酵母双杂交技术已发展 成为蛋白质组功能模式研究的主要手段之一,诸如质谱法与同位素标记方法相结合定量 分析蛋白质表达水平的差异、蛋白质组中膜蛋白的分析鉴定等一系列蛋白质组学的新方 法也在不断的涌现出来。 计算机辅助药物设计 计算机辅助药物设计是以计算机为工具,采用各种理论计算方法和分子图形模拟技 术,根据累积的大量结构和功能有关材料,设计出具有一定药效的新分子。由于分子图 形学的发展以及三维图形工作站的出现,计算机辅助分子设计的技术日益便利。 计算机辅助药物设计可区分为直接药物设计方法和间接药物设计方法。 直接药物方法:如果受体或受体-配基相结合的复合物的三维结构已经揭晓,就可根 据结合点的三维要求设计新药的结构;如果受体蛋白仅知道所组成的残基序列而不知道 空间结构,则可以根据同源模建方法获得其空间构象,进而进行新药设计。 间接药物方法:由于大部分受体的结构尚未阐明,只能在一系列配体结构的基础上 ,通过活性同类物方法进行构象研究,首先搜索各个化合物的较低能量构象,然后按照 一定的规则进行构象重叠,以求得在这一系列化合物中可以重叠的构象。 合理药物设计师计算机辅助药物设计的重要研究方向。合理药物设计以三维结构搜 寻和全新药物设计两种方法为主。三维结构搜寻是在三维结构数据库中,利用模式识别 技术寻找与生物大分子相结合、具有一定药效基团的化合物。全新药物设计按照研究手 段可分为:模板定位法、原子生长法、分子碎片法。模板定位法是指在受体活性部位使 用模板构建出一个性质互补的骨架,再根据其他作用性质转化为具体分子;原子生长法 是指在受体活性部位根据静电性质、氢键性质、疏水性质逐个增加原子,以生长出与受 体活性部位的形状、性质互补的新分子;分子碎片法则是用单一官能团作为基本碎片, 连结为分子。 生物信息学在药物设计中的应用 基因药物 结构生物学--结构生物学时代已经到来 近年来,结构生物学作为分子生物学的重要组成部分,取得了飞速进展,在分子生 物学研究中已经占据了主流地位,并且毫无疑问的成为生物学各领域的基石,进而成为 生命科学的前沿和带头学科,在生物大分子结构与功能的研究上,生物学家最感兴趣的 是功能。由于大分子在结构和功能上存在着密切的联系,因而结构生物学对于大分子和 大分子复合物结构的研究,必将导致对其生物功能的冲击。1993年,在英国《自然》周 刊组织的每年一次的分子生物学国际学术讨论会上,作为最新研究动态的结构生物学成 为该讨论会的主题。曾任哈佛大学、麻省理工学院教授的美国科学家Petsko在会上宣称 :结构生物学的时代已经到来。 结构生物学是以生物大分子的特定空间结构、结构的特定运动于生物学功能的关系 为基础,来阐明生命现象的。生物大分子发挥生物学功能(分子间的识别、结合、能量 及信息传递等相互作用),必须具备具有稳定的三维结构,以及其三维结构在各个水平 上的运动。50年代DNA双螺旋结构的确定,以及其后血红蛋白三维结构的阐明,为分子生 物学和结构生物学奠定了基础。当前分子生物学的每一个前沿领域,都与大分子三维结 构的突破密切相关。从发展趋势分析,未来生物学的主要挑战之一,可能仍是解决结构 和功能的问题,这正是结构生物学研究的核心。 结构生物学研究内容 核酸的结构与功能研究-- 核酸是一类重要的生物大分子,在生命活动中起着关键的作用。作为遗传信息载体 的DNA和遗传信息流中间环节的RNA,参与遗传信息在细胞内的储存、编辑、传递和表达 。在一定意义上说,生命的一切过程,都是根据储存在DNA(有时是RNA)内的程序进行 的。因此,要揭示生命过程的奥秘,就必须从研究核酸的物质结构和信息结构入手,进 而探索其生物学功能。 遗传信息储存于核酸分子的一维核苷酸序列中。DNA储存的生物遗传信息通过转录, 拷贝到RNA的一维线性序列上。 核酸分子的二级结构,对RNA而言,是指单链RNA分子通过自身碱基的配对,折叠而 成的螺旋、突环相间排列的结构;而DNA的二级结构,则通常是双股核苷酸链通过碱基的 配对作用形成的双螺旋结构。RNA二级结构的结构单元间的碱基,在空间上还会发生长程 相互作用,从而形成RNA的三级结构。 蛋白质的结构与功能研究-- 蛋白质是生命活动的主要承担者,在生命活动中具有重要作用,一切生命活动无不 与之息息相关。新陈代谢是生命活动的主要特征,而构成新陈代谢的所有化学变化,绝 大部分都是在一种特殊的蛋白质--酶的催化作用下进行的。 蛋白质的空间结构、肽链的折叠与其生物学功能的关系,是结构生物学领域的核心 和前沿问题之一。空间结构是在一级结构基础上卷曲折叠而成的。一般认为,一级结构 决定蛋白质的构象。 结构生物学的研究手段: 实验研究手段,主要是采用物理学方法,辅之以各种生物化学和分子生物学的方法 。目前采用的研究方法有X射线晶体衍射技术、二维及多维核磁共振技术、电子和中子衍 射技术、波谱技术,以及近年来发展起来的扫描隧道技术和原子力显微术等。 目前,理论方法在结构生物学研究中已经占有一席之地,其发展势头也颇为引人注目。 作为实验手段的补充,尤其是实验无法进行时,理论方法是相当有用的。在大分子结构 与测方面,已建立和发展了计算机结构预测方法。其内容主要包括序列分析、二级结构 预测、三维结构预测、分子力学和分子动力学模拟等,理论工具主要为热力学、统计力 学和经验统计。 结构生物学中新的理论方法-- (I)蛋白质功能基团三维模体及其应用(2000/45(12)/科学通报/叶玉珍、解涛、丁 达夫/蛋白质功能基团三维模体及其应用/1243~1251) 蛋白质的序列、结构和模体(motif)的比较是获取其功能信息的重要手段。为了在 边缘同源和趋同进化情况下仍能获取蛋白质的功能信息,许多学者发展了以残基为最小 单位,用残基的主链骨架或侧链的代表原子组成的空间结构来刻画蛋白质的活性部位的 三维模体方案及其搜索方法,并用于基因的功能预测和蛋白质分子设计。然而,有些情 况下这类三维模体方案不能有效的对功能区进行刻画和识别,如胰蛋白酶、枯草杆菌蛋 白酶、一些α/β水解酶,整体结构很不相似,但具有相似的催化机制,其功能的结构基 础是三联体,为检测三维模体方案的可行性的很好的例子。但最近发现的很多三联体"变 异体",如天 0访 中以Lys替代His执行碱的功能,以Thr替代Ser执行亲核功能;疥疮 病 咕ッ钢胁皇怯葾sp或Glu,而是由残基Trp的主链羰基执行酸的功能等,这些蛋白 质不能用基于残基的三维模体方案加以有效的识别。另外的很多实验表明,除了三联体 ,氧穴一般由两个或多个氢键供体组成,用于稳定催化过程中酰化酶过渡态。 叶等提出以功能基团来描述蛋白质的三维模体,即蛋白质功能基团三维模体,并发 展相应的搜索算法,用于阐明蛋白质功能的结构基础以及预测未知蛋白质的功能。以从 胰蛋白酶中提取的"三联体和氧穴"功能基团三维模体及其搜索为例,在整体结构极不相 似的胰蛋白酶、枯草杆菌蛋白酶、α/β水解酶中搜索到上述功能基团三维模体,为三者 具有相似的催化机制进行了合理解释,对一些具有"变异三联体"的酶也用上述功能三维 模体给予了识别,对蛋白质结构库的搜索结果充分展示了其在功能预测中的应用。 (II)蛋白质表面功能区的嫁接(2000/45(10)/科学通报/梁世德、肖岚、毛凤楼等/ 1052)报道了一种蛋白质-蛋白质相互作用表面位点的嫁接方法。通过确定被嫁接配基表 面的结合区的重要残基,在骨架蛋白质中搜索适用于嫁接上述残基的位点,进而基于残 基的主链碳原子坐标,将骨架蛋白叠加到配基蛋白上,评估骨架蛋白与受体蛋白的互补 性并留下互补性较好的骨架蛋白。细微调节骨架蛋白质与受体蛋白的相对位置,使之具 有合理的界面堆积密度,然后在骨架蛋白质选出的位置上移植配基蛋白的相应残基。另 外,对于与受体有严重碰撞的残基,进行突变,经过优化确定适于嫁接的打分函数,最 终对骨架蛋白的结合自由能进行评估。 用嫁接活性位点方法设计新的功能蛋白质(1999/31(3)/303~308/生物化学于生物 物理学报/叶玉珍、汤海旭、丁达夫)提出将蛋白质的活性位点,嫁接到另一个分子量较 小但是稳定的蛋白质(骨架蛋白)上,从而形成一种新的功能蛋白质。利用这种蛋白质 设计重的有效方案,借助发展的异型自洽系综最优化方法,通过三维模体搜索工具,建 立位点嫁接方法。以卡律蝎毒素分子骨架上嫁接碳酸酐酶B的Zn2+结合位点的设计为例进 行了分析。 蛋白质折叠--基于结构分类的蛋白质折叠模识别方法 生物膜构象--生物膜研究的一个难点于热点 象水溶性蛋白质一样,要深入了解膜蛋白的功能必须解析他们的三维结构。然而至 今解析的膜蛋白的三维结构仅有20个左右,占所有已知蛋白质三维结构的千分之二。膜 蛋白分为两种,一种是外周蛋白,一种是内在蛋白(他们的分子部分或全部嵌入膜内, 有的则是跨膜部分)。外周膜蛋白一般是水溶性的,容易分离、纯化,也较易获得结晶 供X-射线衍射分析。困难的是内在膜蛋白。 目前,研究内在膜蛋白三维结构的困难主要可归纳为以下几点:(1)内在膜蛋白的 分离、纯化比较困难,只有用较剧烈的条件(如:去垢剂、有机溶剂、超声波等)才能 将他们溶解下来。分离后一旦将去垢剂或有机溶剂全部除去,很容易聚为不溶性的物质 ,(2)大多数内在膜蛋白的含量都非常低,应用基因工程方法大量表达内在膜蛋白也存 在着很大的困难。(3)目前测定蛋白质三维结构的主要手段为:X射线晶体衍射法,电 子晶体衍射和核磁共振波谱法。由于核磁共振波谱法仅适用于分子量小于35kD的蛋白质 ,对于非水溶性的内在膜蛋白来说更具有局限性;X射线晶体衍射仍然是内在膜蛋白获得 高分辨率三维结构的主要方法,但其前提条件是必须获得高质量的单晶。水溶性蛋白质 的结晶主要靠亲水与亲水的相互作用,由于内在膜蛋白的疏水表面以及在膜上不均一的 取向,使三维结晶极为困难。这是制约内在膜蛋白三维结构解析的因素之一。另外一条 途径是电子晶体衍射方法。由于电子与物质的相互作用远远大于X-射线,因此很薄和较 小的二维晶体也可应用这一方法。晶体的形成主要靠疏水-疏水相互作用,鉴于内在膜蛋 白的疏水性,与三维晶体相互比较,二维晶体较易形成。一般将内在膜蛋白分离纯化后 重组于脂双层,使其形成二维晶体。之后应用电子显微镜将二维晶体经低剂量的电子束 辐射,收录其电子衍射强度和相位信息,再经图像处理进行三维重建从而解出其立体结 构。一般讲,用这种方法只能得到中、低分辨率(15-20埃)的结果。但从90年代以来由 于技术方面的改进,也有些内在膜蛋白(如: 尉现实 )应用电子晶体衍射方法 已能确定接近原子分辨率(3.4~3.5埃)的三维结构。随着电镜技术的不断发展,以及计 算机运算能力的加强,可以预计这一方面的前景是非常广阔的。 构象病 1972年,美国的Prusiner对巴布亚新几内亚土著居民的Kuru病以及在羊群中时见的 搔痒病的研究中,发现两种病都在脑中发现海绵状病灶,又都找不到病原物,经过10年 研究,1982年Prusiner声称这一类疾病的病原物是一种不含核酸的蛋白质(称为Prion, 蛋白质性质的感染粒子)。后来,又发现疯牛病、人克雅氏病也可能与此有关。 蛋白质家族 角蛋白中间丝结构、功能和动力学 Synuclein蛋白家族 Synuclein是一个广泛分布于中枢神经系统突触前成分的小分子蛋白质家族,N端以 11个氨基酸残基为周期的双极性 螺旋是其二级结构的共同特征。Synuclein的生理功能 尚不明晰,但大量研究提出Synuclein可能和突触的发育与可塑性有关。同时,Synucle in与阿尔茨海默病、帕金森病等多种神经系统退行性疾病的关系,及其在乳腺癌侵袭过 程中的作用日益受到关注。 分子伴侣 1978年,Laskey等首先使用术语"分子伴侣"来描述核质素在核小体组装过程中的作 用。研究结果表明,包括核质素在内的一些蛋白质可以协助其它蛋白质的折叠和组装, 而且这类蛋白质广泛分布于原核和真核细胞中。1987年,Ellis将凡是能够促进蛋白质折 叠和组装的一类蛋白质统称为分子伴侣。 分子伴侣的定义如下:在蛋白质的折叠和组装的过程中,分子伴侣防止多肽链内或 链间因疏水面等相互作用表面瞬间暴露而形成错误结构,并且还可以破坏已经形成的错 误结构。分子伴侣并非蛋白质组装或折叠产物的一部分。近期的研究表明,分子伴侣除 参与蛋白质的合成和成熟外,还参与一系列其它细胞过程:蛋白质跨膜移位和运输、蛋 白质分子间的相互作用(DNA的复制、包涵素笼的组装去组装等)、各种应激反应以及蛋 白质的降解等。 目前,已确认的分子伴侣可分为三个高度保守的蛋白质家族,即伴侣蛋白Hsp60、H sp70、Hsp90。 蛋白质折叠是生命科学的基本问题之一。分子伴侣概念的提出和研究加深了对蛋白质折 叠规律和机制的认识。蛋白质自装配原则仍然正确,但是蛋白质在细胞内的折叠需要分 子伴侣的协助。分子伴侣不仅可以防止蛋白质在折叠过程中形成聚集物或无活性结构, 提高正确折叠率,而且还能够影响折叠路径,因此研究分子伴侣的作用机理具有重要的 理论意义和应用价值。 功能基因组学 功能基因组研究的内容是利用结构基因组所提供的信息,发展和应用新的实验手段 系统的分析基因的功能。目前人类和酵母的功能基因组研究已经全面展开,尤其是对已 完成全基因组测序的酵母来说,其功能基因组任务更加紧迫。 植物 植物基因组研究虽然起步较晚,但由于吸收了人类基因组研究中积累的一些经验, 所以进展也相当迅速,对植物功能基因组学的研究目前也已经受到重视,在1998年12月 出版的最新一期Plant Cell和Plant Physiol.上均编发了关于植物功能基因组学研究的 编者按,并由Bouchez和Hofte综述了植物尤其是拟南芥功能基因组学研究的现状。 以拟南芥和水稻为代表的植物基因组研究已取得了迅速的进展。到目前为止,占拟 南芥基因组近1/3的DNA序列已被测定并在Genebank数据库中注册登记,预测到2001年通 过全球合作将完成拟南芥全基因组的序列测定工作。随着植物基因组计划的实施和进展 ,Genebank中集中了大量的未知功能的DNA序列,如何鉴定出这些基因的功能将成为基因 组研究的重点课题。(2000/22(1)/57~60/李子银、陈受宜/遗传/植物的功能基因组学 研究进展) 基因的时空差异表达是植物发育、分化、衰老和抗逆等生命现象的分子基础。基因 在不同组织、不同器官以及不同环境条件下的差异表达特征,为基因的功能提供了重要 的信息。Velculescu等将在特定组织或细胞内转录的所有基因及其表达丰度称为转录组 ,因此在转录水平上进行的基因表达差异分析实际上就是进行转录组研究。经典的减法 杂交、差示筛选、cDNA代表差异分析以及mRNA差异分析等技术已被广泛的用于鉴定和克 隆差异表达的基因,但是这些技术不能胜任对大量的植物基因进行全面的、系统的分析 ,于是,基因表达的系统分析、cDNA微阵列和DNA芯片等能够大规模的进行基因差异表达 分析的技术应运而生。 离子通道 离子通道是镶嵌在细胞膜酯质双层上的特殊蛋白质大分子,构成具有高度选择性的 亲水性通道,允许适当大小和适当电荷的离子通过。大多数离子通道大部分时间是关闭 的,在特殊刺激下通道蛋白构象发生变化,打开的几率大大增加。体内细胞均具有使细 胞完成特殊功能的离子通道。 (I)钙通道与人类遗传病(2000/23(3)/134/汤熙翔等/国外医学遗传学分册/) 钙通道不仅调节Ca2+跨膜运动的速度和量,而且参与一系列Ca2+依赖生理活动,包括肌 肉收缩,激素和神经递质的释放以及细胞内的信号传导等。钙通道分为钙进入通道和钙 释放通道两大类。 (II)钾通道孔结构的计算机模型:氧笼机理(1997/29(3)/赵善荣等/生物化学与生 物物理学报/229) 电压门控型钾离子通道是一种膜蛋白,它在细胞信号的传导与放大过程中起着极其重要 的作用。若其功能出现异常,将会导致许多疾病尤其是心血管疾病的产生。虽然目前许 多钾通道的一级序列已经被克隆出来,但由于通道膜蛋白的纯化和结晶都比较困难,其 三维结构还无法用X-射线衍射或NMR直接测定。因此人们只能主要依赖于电生理、药理和 位点突变的实验结果,用计算机来构建其三维结构,从而来进一步指导实验研究,解释 通道离子选择性和通道药物(阻断剂和开放剂)作用的分子机制。 电压门控型钾离子通道由4个亚基组成,每个亚基含有6个疏水跨膜段(S1~S6),大 量的序列-功能研究表明,4个连结跨膜段S5和S6的连接域构成了通道的孔形成区,并与 通道的离子选择性以及通道阻断剂有着密切的关系。 -- ※ 来源:·北大未名站 bbs.pku.edu.cn·[FROM: 166.111.185.231]
|