假基因
維基百科,自由的 encyclopedia
假基因(Pseudogenes,Pseudo-意爲「假」)是一類染色體上的基因片段。假基因的序列通常與對應的基因相似,但至少是喪失了一部分功能,如基因不能表達或編碼的蛋白質沒有功能[3]。
一般認爲,假基因最初是功能對生物生存並非必要的基因。隨着突變的積累,出現編碼區提前出現終止密碼子、移碼突變(英语:Translational frameshift)等情況,逐漸變爲無功能的假基因。另外,拷貝數變異(英语:Copy-number variation)(Copy-number variation, CNV)也可能產生假基因。在拷貝數變異中,1kb(千鹼基對)以上的DNA片段會發生複製或刪除[4]。一部分假基因既沒有內含子,也沒有啓動子(這種啓動子被認爲是通過mRNA的逆轉錄轉移到染色體上的,稱爲「加工」假基因(processed pseudogenes))[5],但部分假基因仍然擁有一些與正常基因相同的特徵,比如擁有CpG島等啓動子、RNA剪接位點等。
假基因這一名詞是由雅克(Jacq)等人於1977年最早提出的[6]。長期以來生物學家們認爲假基因是沒有功能的垃圾DNA,惟近年來的研究還表明假基因和其他非編碼片段一樣,擁有調控基因表達的功能。假基因的調控作用對維持生物體的生理活動有着重要意義,一部分假基因在某些疾病的發展中也扮演着重要角色[7]。
在進化生物學研究中,這些因為演化而喪失功能的假基因,對他們進行序列分析意義則相對重大,一直是研究者獲知生物進化歷程的手段。假基因一般會擁有一些源基因的特徵。按照進化論的觀點,兩個親緣關係較近的物種擁有同一祖先。對假基因進行序列比對、分析,即可驗證兩物種是否擁有同一祖先,並能計算出兩物種開始分離的時間(結果能精確到百萬年)。