演化是個變廢為寶的大師,新基因可從“垃圾DNA”中產生
這似乎是不可能的——神秘的新基因竟會從“垃圾”DNA中產生,但最新的數(shù)據(jù)卻支持這個理論。
和人類一樣,基因也有家族——穿越時間的紐帶將它們與一位始祖聯(lián)系在一起。那個祖先不斷復制和擴散,每經(jīng)過一個循環(huán)都會有些許改變。
過去40年的大多數(shù)時間里,科學家們都認為這就是新基因誕生的基本方式——從已有基因的拷貝中產生。原來的版本繼續(xù)忠實地執(zhí)行使命,新的版本則獲得了演化出新功能的自由。
然而,某些基因似乎是要挑戰(zhàn)這個最初的觀點。它們沒有已知的親戚,和別的基因毫無相似之處。它們就像分子版的神秘野獸——隱藏在偏遠雨林的深處,似乎與地球上其他任何生物都毫不相干。
“孤兒基因”從何而來的謎團已經(jīng)困擾了科學家?guī)资辍5鼛啄陙?,一種曾被視為異端邪說的解釋變得越來越有影響力——許多孤兒基因來自所謂的“垃圾DNA”,也就是基因與基因之間神秘的非編碼DNA片段。加州大學戴維斯分校的生物學家David Begun形容道:“不知怎的,遺傳功能就這樣出現(xiàn)了?!?
新基因產生的鼓點 在老鼠世系的演化歷史(圖中紅線所示)中,新的基因似乎是集中在幾個時間點上出現(xiàn)。大約800萬年前的新基因產生高峰與地球走出“雪球”狀態(tài)的時間一致,在此之前,地球幾乎完全是冰封的。最近的一次高峰代表著許多新產生的基因,它們中有許多此后將在演化中消失。如果所有的基因都是通過復制產生的,它們應該全部在生命起源不就之后產生,也就是大約38億年前(圖中綠線所示)。圖片來源:Tautz and Domazet-Lo?o,,Nature Reviews Genetics,2011
這種從非編碼DNA到基因的轉變曾被認為是不可能的。然而,從酵母、果蠅到老鼠和人類,越來越多來自不同生物的例子已經(jīng)讓大多數(shù)專家相信這些從頭起源基因(de novo genes)的確存在,一些科學家認為它們甚至可能是很常見的。就在不久前,在維也納舉行的分子生物學與演化學會(Society for Molecular Biology and Evolution)年會上公布的一項研究新識別出了600個潛在的人類基因。巴塞羅那馬爾醫(yī)院研究所(Hospital del Mar Research Institute)的演化生物學家Mar Albà 作了這場報告。他說:“人們原來認為從頭起源基因是很罕見的,但現(xiàn)在他們開始越來越頻繁地發(fā)現(xiàn)這類基因?!?
研究人員開始意識到,從頭起源基因可能是基因組重要的一部分,但依然不清楚它們的數(shù)量有多少,功能是什么。更重要的是,這類基因的突變會導致災難性的后果。德國明斯特大學(University of Münster)的生物信息學家Erich Bornberg-Bauer說:“看來,這些新的基因通常也是最重要的基因?!?
追蹤孤兒基因
成千上萬的已知基因家族中,許多基因的產生能夠用標準的基因復制模型解釋。但這個模型也有局限,它意味著絕大多數(shù)新基因的創(chuàng)造活動在生物演化史的極早期就都完成了,35億年前最早的生物大分子就已創(chuàng)立了一系列遺傳學的基本結構單元,之后生命每歷經(jīng)一輪循環(huán)都只能對這些結構單元做細微的改動。然而,如果生命的工具箱內容如此有限,今天地球上如此豐富多彩的生物王國又是如何通過演化產生的呢?Bornberg-Bauer指出:“如果新的零件只能從舊的產生,我們將很難解釋演化過程中根本性的變化。”
20世紀90年代,隨著DNA測序技術的興起,第一條證據(jù)出現(xiàn)了,它說明嚴格的復制模型是不足以解釋所有基因的起源的。在分析酵母基因組的過程中,研究人員發(fā)現(xiàn)有三分之一的酵母基因和來自其他生物體的已知基因沒有相似性。當時,許多科學家認為這些孤兒屬于還未被發(fā)現(xiàn)的基因家族,但這個假設沒有得到證實。近十年來,科學家對成千上萬種生物的DNA進行了測序,但許多孤兒基因依然沒能被歸類,它們的來源依然是一個謎。
2006年,Begun發(fā)現(xiàn)了第一個證據(jù),非編碼DNA中的確能產生新的基因。他比較了標準實驗室果蠅(Drosophila melanogaster)和其他果蠅物種的基因序列。不同種果蠅的基因組大部分是相似的,但Begun和他的同事發(fā)現(xiàn)了幾個基因,它們僅僅在一兩個物種中存在,意味著它們不是已有基因祖先的后代。Begun 提出,果蠅非編碼DNA的“隨機”序列可能可以通過突變轉化為有功能的基因。
然而,從隨機的DNA序列中創(chuàng)造基因看起來幾乎是不可能的,這簡直就像是把一罐印了字母的積木塊隨意地倒在地上,指望它們能自動拼成一句通順的句子?!袄鳧NA”必須積累一定的突變,使它能被細胞讀取、轉錄為RNA,或是成為調控元件,指示基因應該在何時何地被激活。并且,和句子一樣,基因也要有開頭和結尾,一定要有短序列指明它在哪里開始、又在哪里結束。
此外,基因產生的RNA或蛋白質必須是有用的。新產生的基因可能是有害的,可能會產生有害蛋白,就像阿爾茨海默病患者大腦中凝集成塊的蛋白質一樣。圖森市亞利桑那大學的生物學家Joanna Masel告訴我們:“蛋白質很容易錯誤折疊并帶來破壞。鑒于隨機序列的產物會造成很多麻煩,這就很難解釋它們是怎樣制造出有用的新蛋白質的?!盡asel正在研究演化是怎樣解決這個問題的。
Begun的假設面臨的另一個挑戰(zhàn)是,把從頭起源基因和那些經(jīng)歷巨變后與不再與祖先相像的基因區(qū)分開來不是件容易的事。(確定真正的從頭起源基因很有難度,這依然是該領域內爭論的來源之一。)
十年前,馬普演化生物學研究所的生物學家Diethard Tautz和許多研究人員一樣,對Begun的想法持懷疑態(tài)度。Tautz找到了孤兒基因產生的另一種解釋:一些神秘的基因演化得非???,使得它們與祖先的相似之處難以被辨識;另一些則由已有基因碎片的重新組合產生。
后來,他的研究團隊偶然發(fā)現(xiàn)了Pldi基因,這個基因是用前阿森納球員波多爾斯基(Lukas Podolski)的名字命名的。小鼠、大鼠和人類都有這段序列。在后兩個物種里,這段DNA保持沉默,也就是說不會被轉化為RNA或蛋白質。它只在小鼠里有活性,能夠被轉錄為RNA,并且有著重要的作用。雄性小鼠如果缺失這個基因,它們的精子將會游動得更遲緩,睪丸會更小。
研究人員成功追蹤到了將這段沉默的非編碼DNA轉化為活性基因的一系列變異。這項研究顯示,該基因的確是從頭產生的,而不是屬于已有的基因家族,只是在演化過程中變得面目全非了。Tautz說:“這時候我想,好吧,它(從頭起源基因)一定是可能的?!?
蜂擁而至的新基因
科學家現(xiàn)在已經(jīng)確定了不少支持基因從頭產生的明白無誤的例子:酵母中一個決定有性還是無性生殖的基因;果蠅和其他雙翅目昆蟲中一個關鍵的飛行基因;還有一些只在人類中發(fā)現(xiàn)的基因,它們的功能尚未查明。
在今年的分子生物學與演化學會年會上,Albà及其合作者發(fā)布了他們的成果。使用強大的RNA分析新技術,他們在人類和黑猩猩的基因組中鑒別出了幾百個推定為從頭起源的基因,這個數(shù)目是此前研究得到的基因數(shù)目的整整10倍。Albà小組找到的600個人類特有的基因中,80%是全新的,之前還從來沒有被發(fā)現(xiàn)過。
不幸的是,破譯從頭起源基因的功能要比鑒別它們困難得多。但至少,它們中的一部分不是等閑之輩。證據(jù)表明,一部分新基因很快變得至關重要,比如果蠅20%的新基因是生存所必需的。還有很多新基因帶有自然選擇的痕跡,說明它們對生物體有所貢獻。
至少有一個人類的新基因在腦中表達得很活躍,使得一些科學家猜測這樣的基因可能推動了腦的演化。還有的突變與癌癥相關,說明它們在細胞中有著重要的功能。都柏林圣三一學院的遺傳學家,曾鑒定了第一個人類的從頭起源基因的Aoife McLysaght說:“功能失常會導致如此嚴重的后果,這說明該基因的正常功能很重要,或是它能造成很大的影響。”
水性楊花的蛋白質
對從頭起源基因的研究也在促進一個更大的觀念轉變,它們改變了我們對蛋白質形態(tài)和功能的理解。從頭起源基因通常很短,產生的蛋白質比較小。傳統(tǒng)的看法認為蛋白質應該會折疊成一個精確的結構,而從頭起源的新蛋白有著更為無序的結構,這讓它們較為松弛,能夠和種類更多的分子結合。用生物化學的說法,這些新生的蛋白質是混雜(promiscuous)的。
科學家對這些短鏈蛋白質的行為依然知之甚少,很大程度上是因為常規(guī)的篩查技術容易忽略它們。大多數(shù)尋找基因及其相應蛋白質的手段會挑出與已知基因相似的較長序列。Begun說:“我們很容易漏掉它們?!?
這樣的現(xiàn)狀正在改變,科學家意識到了短鏈蛋白質的重要性,正開始采用探測基因的新技術,從頭起源基因的數(shù)目很可能因此而有爆炸式的增長。Masel說:“我們還不知道這些較短基因的具體功能,對于它們的生物學功能,我們還有很多要探索?!?
科學家還想弄清一個特別令人困惑的問題:從頭起源基因是怎樣整合入驅動細胞運作的復雜反應網(wǎng)絡的。這就像一輛自行車自發(fā)長出了一個新零件,又很快地將它整合進自己的機械裝置之中,盡管沒有這個零件自行車也能很好地運作。Begun說:“這個問題非常有吸引力,但也是完全未知的。”
一個叫做ESRG的人類特有基因是這個謎團很好的例子,它的一些片段在猴子和其他靈長類中也有發(fā)現(xiàn)。但這個基因只在人類中有活性,并對維護最初的胚胎干細胞非常重要??墒牵镒雍秃谛尚蔁o需它也能很好地制造胚胎干細胞。McLysaght指出:“這個人類特有基因執(zhí)行的功能必定先于此基因存在,因為其他生物也有這些干細胞。”
“新基因如何獲得功能?它又是如何成為細胞生命過程的一部分?”McLysaght說,“對我來說,這是眼下最為重要的問題。”
- 上一篇:我國局部省份擬將基因測序納入醫(yī)保,二胎優(yōu)生有望普及 2015/11/3
- 下一篇:基因測序發(fā)展新態(tài)勢:在上游發(fā)展三四代技術,在下游完成樣本積累 2015/10/21