蜜蜂vha16基因推測編碼蛋白質的功能預測
摘 要:本文采用生物信息學的方法對蜜蜂(Apis mellifera)vha16基因的cDNA序列推測編碼蛋白(GenBank登記號為AAQ21381)進行性質分析和功能預測。分析表明該基因有一個ORF,起始密碼子在第59位,終止密碼子在第527位,推測編碼156個氨基酸,預測其理論相對分子量為15.97kDa,理論等電點pI=6.71。TMHMM-2.0軟件分析發現,該基因的推測編碼蛋白質序列的第15~34位、第55~77位、第92~114位和第127~149位分別有一個跨膜區。保守結構功能域分析發現該推測編碼蛋白序列與目前已知的蛋白質結構功能域數據庫中許多物種的ATP合成酶具有相似的結構功能域,在其第13~78位和第91~156位分別為ATP合成酶C亞基保守結構功能域。據此可推測該基因編碼蛋白即為蜜蜂ATP合成酶16kDa蛋白脂質C亞基。
關鍵詞:蜜蜂(Apis mellifera);vha16基因;生物信息學;功能預測
生物信息學是當前生物科學的研究熱點之一,蛋白質結構功能預測是其中一項重要的內容。由于蛋白質的生物學功能在很大程度上依賴其空間結構,因而進行蛋白質的結構預測對于理解蛋白質結構與功能的關系具有重要的意義[1]。目前國際上正在研究通過完整基因組的數據采集來確定蛋白質的功能。艾森伯格工作組(洛杉磯加利福尼亞大學)根據某些物種間存在同源性蛋白質,且這些同源性蛋白質可以相互作用這一原理發展了一種預測蛋白質功能的方法[2]。最近,又發展了幾種計算機識別蛋白質功能的新方法,這些方法的原理是根據相同特征的蛋白質之間具有功能上的關聯或直接作用[3]。一般來說,對于蛋白質功能預測分析而言,最為重要的莫過于分析目的蛋白質是否和具有功能信息的已知蛋白質相似。其中主要有兩個策略:同源序列分析和功能區相關的保守序列特點分析。
到目前為止,已經從多種動物的質膜上都發現了運輸質子的液泡型ATP合成酶(vacuolar-type ATPase,V-ATPase)[4-7]。陳大福也利用EST數據庫電子克隆了蜜蜂(Apis mellifera)vha16基因的cDNA序列(另文發表)。本文將采用生物信息學的方法分析蜜蜂vha16基因的cDNA序列(GenBank登記號為AY343324)推測編碼蛋白質的基本性質,并與其他物種的同源蛋白比較,進行同源序列和功能區相關的保守序列特點分析,初步推測其功能。
1方法
1.1基本性質分析
本研究是使用Amersham公司的RESearch-version 1.0軟件分析蜜蜂vha16 cDNA序列推測編碼蛋白質的氨基酸組成、理論分子量;聯網到http://au.expasy.org/tools/pi_tool.html用其Compute pI/MW工具分析其等電點(pI)[8]。
1.2跨膜區分析
蛋白質的跨膜螺旋特征是可通過序列分析直接得到預測,并能獲得較為理想的結果。聯網至“http://genome.cbs.dtu.dk/services/TMHMM-2.0”或者“http://www.ch.embnet.org/software / TMPRED _form.html”可進行蛋白質序列的跨膜區分析。
1.3蛋白質的結構功能域分析
簡單模塊構架搜索工具(Simple Modular Architecture Research Tool,SMART)是目前較為理想的蛋白質結構功能域分析工具[9]。該數據庫由EMBL建立,其中集成了大部分目前已知的蛋白質結構功能域的數據,可用于蛋白質結構功能域的分析。1.4不同物種間蛋白質同源性比較
從NCBI的蛋白質庫中下載美洲煙夜蛾(Heliothis virescens,AAC37176)、煙草天蛾(Manduca sexta,CAA46187)、紅火蟻(Solenopsis invicta,AAG17394)、 2種果蠅(Drosophila melanogaster,NP_724476;Drosophila yakuba,AAR10032)、按蚊(Anopheles gambiae,XP_311406)、伊蚊(Aedes aegypti,AAB71660)等昆蟲的ATP合成酶16kDa蛋白脂質C亞基蛋白序列,將蜜蜂vha16基因的推測蛋白序列(AAQ21381)與之進行多重對齊。Clustal W/X軟件(http://www.ddbj.nig.ac.jp/E-mail/clustalw-e.html或http://www.ebi.ac.uk/clustalw/)是十分重要的序列多重對齊分析軟件。
2 結果與分析
2.1基本性質
經RESearch-version 1.0軟件分析蜜蜂vha16 cDNA序列,發現僅有一個ORF,起始密碼子在第59位,終止密碼子在第527位,推測編碼蛋白含有156個氨基酸,預測其理論相對分子量為15.97 kDa,理論等電點pI=6.71。
2.2跨膜區
將蜜蜂vha16基因推測蛋白輸入http://genome.cbs.dtu.dk/services/TMHMM-2.0/分析發現,該蛋白質序列的第15~34位、第55~77位、第92~114位和第127~149位分別含有一個跨膜區(圖1)。
圖 1 蜜蜂vha16推測編碼蛋白質的跨膜區分析結果 跨膜:transmembrane; 膜內:inside; 膜外:outside
2.3蛋白質的結構功能域分析
輸入http://www.ncbi.nlm.nih.gov/BLAST/進行保守結構功能域分析,結果發現該推測編碼蛋白序列與目前已知的蛋白質結構功能域數據庫中許多物種的ATP合成酶具有相似的結構功能域,在其第13~78位和第91~156位分別為ATP合成酶C亞基保守結構功能域(圖2)。
圖 2 蜜蜂vha16 cDNA推測編碼蛋白保守結構功能域的檢索結果
ATP-synt_C:ATP合成酶C亞基;頂部數字表示推測蛋白的氨基酸序列位
2.4不同物種間蛋白質同源性比較
通過多重對齊分析發現,將蜜蜂vha16基因的推測蛋白質序列與美洲煙夜蛾、煙草天蛾、紅火蟻、2種果蠅、按蚊、伊蚊等昆蟲的ATP合成酶16kDa蛋白脂質C亞基蛋白序列,其保守區域的一致性在85%以上,同源性都在90%以上(圖3)。
3 討論
推測未知蛋白的功能較好的方法是利用同源對比發現蛋白質序列的保守區域。如果發現一個蛋白質序列和較多不同種屬或者同一種屬的蛋白質序列具有較高的同源性(大于30%),那么提示待分析的蛋白質序列可能是相應家族的成員[10]。所以,根據蛋白質同源性和保守結構功能域分析的結果,可以初步推測蜜蜂vha16基因的推測編碼蛋白與其他物種的ATP合成酶在功能上應該存在著確實的相關性,屬于同一個蛋白質家族,據此可推測該基因編碼蛋白即為蜜蜂ATP合成酶16kDa蛋白脂質C亞基。
參考文獻
[1]來魯華. 蛋白質結構預測與分子設計. 北京: 北京大學出版社, 1993
[2]Spengler S J. Bioinformatics in the information age. Science, 2000, 287(5456): 1221-1223
[3]劉秀艷, 滕勝. 應用計算機識別蛋白質功能. 生命的化學, 2000, 20(3): 100-102
[4]Finbow M E, Goodwin S F, Meagher L, et al. Evidence that the 16 kDa proteolipid (subunit c) of the vacuolar H+-ATPase and ductin from gap junctions are the same polypeptide in Drosophila and Manduca: molecular cloning of the Vha16k gene from Drosophila. Journal of Cell Science, 1994, 107: 1817-1824
[5]Azuma M, Ohta Y. Changes in H+-translocating vacuolar-type ATPase in the anterior silk gland cell of Bombyx mori during metamorphosis. The Journal of Experimental Biology, 1998, 201: 479-486
[6]Wieczorek H, Gruber G, Harvey W R, et al. The plasma membrane H+-V-ATPase from tobacco hornworm midgut. Journal of Bioenergetics and Biomembranes, 1999, 31: 67-74
[7]Vitavska O, Wieczorek H, Merzendorfer H. A novel role for subunit C in mediating binding of the H+-V-ATPase to the actin cytoskeleton. The Journal of Biological Chemistry, 2003, 278: 18499-18505
[8]Bjellqvist B, Basse B, Olsen E, Celis J E. Reference points for comparisons of two-dimensional maps of proteins from different human cell types defined in a pH scale where isoelectric points correlate with polypeptide compositions. Electrophoresis, 1994, 15: 529-539
[9]Schultz J, Milpetz F, Bork P, Ponting C P. SMART, a simple modular architecture research tool: Identification of signalling domains. Proc Natl Acad Sci USA, 1998, 95: 5857-5864
[10]張成崗, 賀福初. 生物信息學方法與實踐. 北京: 科學出版社, 2002, 93
熊翠玲 陳大福 福建農林大學蜂學學院
1126下一篇:蜜蜂基因組測序完成后的啟示