15018752330

您所在的位置:首页 > 文献频道 > 文献频道详情

欧猥迭宫绦虫膜联蛋白E1基因的生物信息学分析

发表时间:2012-12-13     浏览次数:486次

文章摘要:目的:从欧猥迭宫绦虫成虫cDNA文库中识别出膜联蛋白E1(Annexin E1)基因,并对其进行生物信息学分析和功能预测。方法:从欧猥迭宫绦虫cDNA文库中获取Annexin E1基因的核酸序列,应用NCBI、ExPASy等多种生物信息学在线分析工具结合Vector NTI Advance 10、Geneious Pro等软件包,对所获基因及其编码蛋白的基本理化特征、亚细胞定位、保守功能域、抗原表位、二级结构及拓扑结构等进行预测,建立蛋白质三级空间结构模型及构建其分子进化树。结果:Annexin E1编码354个氨基酸残基,理论分子量为40168.0Da,具有4个完整的保守功能域。位于细胞内,无信号肽及跨膜结构,存在6个潜在抗原表位。二级结构主要以α 螺旋为主,结构和功能有关的位点高度保守,具有多个磷酸化位点。在进化的过程中与绦虫类亲缘较近,而与脊椎类亲缘较远。结论:Annexin E1编码蛋白及潜在的抗原表位与宿主同源性低,可能作为研发新型免疫诊断方法的理想分子靶标。

作者                作者单位

邬强     海南医学院热带医学与检验医学院,海南 海口 571101

李东冬   海南医学院热带医学与检验医学院,海南 海口 571101

马盼盼   海南医学院热带医学与检验医学院,海南 海口 571101

吕刚     海南医学院热带医学与检验医学院,海南 海口 571101

[ABSTRACT] Objective: To identify the Annexin E1 gene from cDNA library of Spirometra erinaceieuropaei adult worm and predict its structure and function by applying the bioinformatics. Methods: Nucleic acid sequences of Annexin E1 gene was obtained from cDNA library of Spirometra erinaceieuropaei, and application tools were provided by bioinformatics websites and other bioinformatics software packages such as Vector NTI Advance 10, Geneious Pro etc. The status of encoded proteins were predicted including the basic physical and chemical properties, subcellular localization, conservative functional domains, domains, antigenic epitopes, secondary structure and topology, etc. Besides, tertiary structure of the protein was established based on homology modeling, undertook multisequence homological alignment and phylogenetic analysis. Results: Annexin E1 encoded 354 amino acid residues with a theoretical molecular 40168.0Da. The main secondary structure was αhelix with four complete conservative domains. Structure and function of the highly conserved sites were with multiple phosphorylation sites. It contained no signal peptide and transmembrane helices, six potential antigenic epitopes, locates outside of membrane. In evolution, it was close relative to tapeworm and distant relative to the vertebrate. Conclusions: Homology is low between encoded protein and potential antigen epitopes of Annexin E1 and host′s, it might be a desirable molecular target for immunological tests.

[KEY WORDS] Spirometra erinaceieuropaei; Annexin; Structure; Function; Bioinformatics

欧猥迭宫绦虫(Spirometra erinaceieuropaei)又名曼氏迭宫绦虫(Spirometra mansoni),是迭宫属寄生虫研究的重要模式生物,寄生于人体可引起裂头蚴病[1]。Annexin是一类钙依赖的磷脂结合蛋白超家族,广泛分布于各种真核生物细胞中,约占细胞总蛋白质的2%左右,具有多种生物学功能,在细胞中主要参与膜转运及膜表面一系列依赖于钙调蛋白的活动。Annexin超家族各成员在结构上具有高度保守性,C端均具有由约70个氨基酸残基组成的4个保守重复序列,而其N末端由于氨基酸序列、长度不同而功能各异[2]。目前,国内、外关于寄生虫Annexin基因家族的研究较少,其具体生物学功能尚不清楚。本研究在构建欧猥迭宫绦虫成虫全长cDNA文库、5′端表达序列标签(EST)测序的基础上,利用生物信息学方法对欧猥迭宫绦虫Annexin E1基因及编码的蛋白质进行了理化性质、物种进化、空间结构等分析及预测,为其重组蛋白表达、纯化及作为研发新型免疫诊断抗原的侯选分子靶标等研究提供基础。

邬强等.欧猥迭宫绦虫膜联蛋白E1基因的生物信息学分析

1 材料与方法

1.1 材料

欧猥迭宫绦虫Annexin E1基因源自欧猥迭宫绦虫成虫的cDNA文库,通过EST 5′端大规模随机测序,归并unigene后进行初步生物信息学分析,发现基因号GDTC004_G12的氨基酸水平与Annexin家族高度相似性,且5′端完整,然后进行3′端延长测序至Poly(A)拼接获得。其他寄生虫及模式生物的Annexin核酸序列及蛋白质序列均源自美国国立生物技术信息中心数据库,所获物种及Genbank序列号为:猪带绦虫(Taenia solium, AY998562.1)、日本血吸虫(Schistosoma japonicum, FN315079.1)、马来丝虫(Brugia malayi, XP_001894032)、黑腹果蝇(Drosophila melanogaster, NM_167519.1)、秀丽隐杆线虫(Caenorhabditis elegans, AAA99775)斑马鱼(Danio rerio, AAI54294)、拟南芥(Arabidopsis thaliana, NP_196584)、非洲爪蟾(Xenopus laevis, NP_001082442.1)、原鸡(Gallus gallus, XM_421623.2)、小鼠(Mus musculus, NM_009674.3)、人(Homo sapiens, BT007975.1)。

1.2 方法

将基因的核苷酸、编码氨基酸序列与Genbank中的数据进行比对,鉴定其来源,判断与其他物种基因的一致性及是否为全长;将该蛋白氨基酸序列进行多序列同源比对分析,并与其他物种的Annexin进行比对,用Geneious Pro 4.8.2以NJ法构建出分子进化树;采用蛋白质专家分析工具ExPASy和Vector NTI Advance 10对蛋白质的基本理化性质进行预测;应用TargetP、Tmpred和PredictProtein等程序对蛋白质的亚细胞定位、跨膜和信号肽情况进行推测;通过Motif scan、InterproScan、ScanProsite、Pfam及BepiPred等对模体、功能域、催化位点、抗原表位等进行预测;运用PredictProtein、COILS等工具对蛋白质的二级结构进行预测;在SWISSMODEL中寻找空间结构同源模板,优化产生该蛋白的三维结构模型,并用Rastop软件进行可视化分析。

2 结果

2.1 保守功能域、蛋白质功能基序、蛋白质结构域预测

利用Blastn进行核酸水平相似性的搜索,没有得到与该基因序列高度相似的基因。经ORF finder程序寻找开放阅读框架,显示该基因全长为1250bp,编码区为50~1112bp,编码354个氨基酸,具Poly(A)尾,具体序列如下。

该氨基酸序列具有4个完整的保守功能域(3196aa, 103176aa, 208274aa, 284348aa),为全长基因,确定为Annexin家族成员(已提交Genbank,Accession: HM572242),见图1。

2.2 Annexin E1与其他物种Annexin氨基酸序列多序列比对、同源性及分子进化分析

Annexin E1氨基酸序列与其他物种Annexin氨基酸序列进行多序列比对,在多个氨基酸位点上各物种间完全相同,高度保守。Blastp氨基酸序列相似性分析结果表明,欧猥迭宫绦虫Annexin E1与猪带绦虫、日本血吸虫的相似性最高,分别为60.4%、42.3%,而与人、小鼠等脊椎动物的相似性最低,均低于33.2%。选取了11个代表性物种的膜联蛋白,使用Geneious Pro 4.8.2软件用NJ算法构建出分子进化树,见图2。结果表明欧猥迭宫绦虫Annexin E1与脊椎动物的亲缘关系较远,而与其他寄生虫的亲缘关系接近。

2.3 蛋白质的基本理化性征

通过Expasy的protprom工具及Vector NTI Advance 10软件可得出以下的预测结果,Annexin E1编码354个氨基酸,理论分子质量为40168.0 Da,理论等电点为6.28,理论分子式为C1773H2858N486O544S15,天冬氨酸和谷氨酸共51个,精氨酸和赖氨酸共49个。280nm处水溶液中消光系数在35870和36120之间,如果成熟的Annexin E1蛋白N末端为甲硫氨酸时,在体外的哺乳动物网状细胞中的半衰期为30h,在酵母菌和大肠杆菌中半衰期分别为20h和10h。不稳定系数为39.95,可认为是稳定蛋白。脂肪系数为90.40,总平均亲水性为0.504,说明该蛋白为疏水蛋白。

2.4 细胞内蛋白质亚细胞定位、信号肽、跨膜结构及潜在抗原表位的预测

经targetP1.1 server分析,Annexin E1蛋白存在于胞内,不在线粒体中,无信号肽序列,为非分泌性蛋白质。将Annexin E1蛋白通过TMHMM 2.0分析,该蛋白不存在跨膜结构。利用TMpred等对细胞的亲水、疏水性分析,Annexin E1大部分肽段基本上都具有较强的疏水性。经BepiPred分析,该蛋白质可能存在6个潜在抗原线性表位(232aa, 149164aa, 179200aa, 246254aa, 260268aa, 333341aa)。与人Annexin家族进行同源性比对发现,位于232aa位点的潜在表位的相似性最低,低于9.4%,故可能是较为理想的特异性诊断抗原表位。

2.5 蛋白质二级结构预测

Annexin E1氨基酸序列的二级结构及拓扑结构预测结果显示其以α 螺旋为主,占62.15%,β折叠、转角占2.54%,无规则卷曲占35.31%,见图3。

注:第一行为编号,第二行为氨基酸序列,第三行代表预测结果,其中H代表α螺旋,E代表β折叠、转角,···代表无规则卷曲,L代表环形loop结构。

2.6 蛋白质的三级结构预测

在SWISSMODEL中找到一个同源性最高的模板1wa3a,其同源性为39%,可根据其晶体结构进行同源建模[3]。进行再次比对,保守部位对齐,调整主链中各原子的位置,进行模型优化,产生其空间结构模型,见图4。4个保守功能域均由α螺旋组成,以黄色螺旋标出。232aa段抗原表位在图中以红色部分标出。抗原表位上还包括了一个依赖蛋白激酶C的磷酸化位点,以蓝球标出。

3 讨论

Annexin超家族由超过1000种不同基因表达产物组成,广泛存在于大多数真核生物细胞中,物种间高度保守[4]。目前Annexin超家族可以分为A、B、C、D、E 5个家族,E族主要存在于各类寄生虫细胞,故本研究中将新发现的欧猥迭宫绦虫Annexin命名为Annexin E1。近年来国内、外研究发现Annexin具有多种生物学功能,包括胞吐作用中的膜融合、囊泡运输、信号转导、钙离子通道的形成、调控炎性反应、参与凝血过程、参与细胞凋亡、细胞分化和细胞骨架蛋白间的相互作用等[5]。采用基因抑制、基因敲除及RNA干扰等技术提示了不同Annexin的生物功能的新见解。目前,对Annexin家族的研究主要集中在A家族,即脊椎动物的Annexin,其与心血管疾病、肿瘤、炎症、糖尿病及自身免疫病等密切相关,而对其他4个家族的Annexin研究甚少[6]。Zhang等[7]从猪带绦虫续绦期cDNA文库中克隆出Annexin B1,证明其为研发预防囊尾蚴病疫苗的有效保护性抗原,并参与类似脊椎动物Annexin的炎症、细胞凋亡过程。后续研究中发现Annexin B1可被分泌到细胞外,与人嗜酸性细胞膜结合致使钙离子流入并诱导细胞凋亡,很可能是猪带绦虫抵制宿主防御的新机制[8]。

本研究通过对欧猥迭宫绦虫Annexin E1基因进行生物学信息学分析和预测,发现该蛋白属于Annexin家族的一员,具有很高的种属特异性。与该家族的其他成员一样,具有位于C端由4个功能域组成的中心结构域,呈圆盘状,具有凸面和凹面。其中凸面包含膜磷脂结合位点及钙离子结合位点,面向细胞膜。N端位于圆盘结构的凹面,包括蛋白水解位点、磷酸化位点及细胞质蛋白结合位点,为膜联蛋白的调节区[9]。该蛋白不存在于细胞膜上,不含信号肽,不是分泌蛋白,这也其他Annexin家族一致。其是否可发生类似Annexin A族及猪带绦虫Annexin B1不依赖信号肽而转运出细胞的现象,尚待其他研究来证实。

人体裂头蚴病主要依靠从局部检查出虫体作出诊断,应用裂头蚴粗抗原作为免疫辅助诊断,临床误诊率较高,若有特异的诊断性抗原,就能及早诊断、治疗。欧猥迭宫绦虫Annexin E1的二级结构含有无规则卷曲结构,说明其有成为抗原的潜力。本研究发现Annexin E1与人Annexin家族各成员的同源性均低于25%,其潜在的主要抗原表位(232aa段)与同区域宿主蛋白的同源性更低,故可以利用基因重组技术,将其制成重组抗原,或是合成含有特征抗原决定簇的多肽抗原,相对于传统的抗原物质,其特异性、敏感性很可能更高,继而可研制出合适的新型诊断性抗原。

【参考文献】

1 裘明华, 裘明德. 人裂头蚴病和无头蚴病:病原学的过去和现在[J]. 中国寄生虫学与寄生虫病杂志, 2009, 2(27):5460.

2 Fatimathas L, Moss SE. Annexins as disease modifiers[J]. Histol Histopathol, 2010, 25(4):527532.

3 Arnold K, Bordoli L, Kopp J, et al. The SWISSMODEL Workspace: A web based environment for protein structure homology modeling[J]. Bioinformatics, 2006, 22(12):195201.

4 Monastyrskaya K, Babiychuk EB, Draeger A. The annexins: spatial and temporal coordination of signaling events during cellular stress[J]. Cell Mol Life Sci, 2009, 66(16):26232642.

5 Mortimer JC, Laohavisit A, Macpherson N, et al. Annexins: multifunctional components of growth and adaptation[J]. J Exp Bot,2008, 59(3):533544.

6 Talukdar T, Gorecka KM, de CarvalhoNiebel F, et al. Annexinscalciumand membranebinding proteins in the plant kingdom: potential role in nodulation and mycorrhization in Medicago truncatula[J]. Acta Biochim Pol,2009, 56(2):199210.

7 Zhang Y, Wang KH, Guo YJ, et al. Annexin B1 from Taenia solium metacestodes is a newly characterized member of the annexin family[J]. Biol Chem,2007, 388(6):601610.

8 Yan HL, Xue G, Mei Q, et al. Calciumdependent proapoptotic effect of Taenia solium metacestodes annexin B1 on human eosinophils: a novel strategy to prevent host immune response[J]. Int J Biochem Cell Biol,2008, 40(10):21512163.

9 Rescher U, Gerke V. Annexinsunique membrane binding proteins with diverse functions[J]. J Cell Sci,2004, 117(Pt 13):26312639.