組蛋白基因(histone gene) 組蛋白基因是已知的重復基因中唯一具有蛋白質(zhì)編碼機能的基因。它們在DNA合成開(kāi)始前短暫地表達,因而它們的活動(dòng)與細胞周期密切相關(guān)。

概述

組蛋白基因(histone gene)

組蛋白基因在各種生物體內重復的次數不一樣,但都在中度重復的范圍內。通常每種組蛋白的基因在同一種生物中拷貝數是相同的。雞的基因組中組蛋白基因有10個(gè)拷貝,在哺乳動(dòng)物中為20拷貝,非洲爪蟾為40拷貝,而海膽的每種組蛋白的基因達300-600拷貝。不同生物中組蛋白基因在基因組中的排列不一樣,組蛋白基因沒(méi)有一定的排列方式,而在拷貝數高的基因組中(>100拷貝),大部份組蛋白基因串聯(lián)重復形成基因簇。

發(fā)育

海膽發(fā)育早期五種組蛋白基形成一個(gè)重復單位,每種組蛋白基因之間是非轉錄間隔區,5個(gè)間隔區均不相同。這樣的重復單位在整個(gè)基因組中重復300次以上,而且這些重復單位基本上是相同的。在海膽中,5種組蛋白基因的轉錄方向都是相同的,每種組蛋白基因獨立的產(chǎn)生自己的mRNA。非洲爪蟾卵細胞5S基因重復單位包括一個(gè)基因和一個(gè)假基因。在三種不同的海膽中,其組蛋白基因重復單位中非轉錄間隔區在長(cháng)度和序列上差異是很大的,盡管它們的組蛋白基因的長(cháng)度和序列相差不多。實(shí)際上,在同一種海膽內不同的組蛋白基因重復單位之間,相應的非轉錄間隔區也不是完全相同的。另外,在海膽胚胎發(fā)育晚期,要由晚期組蛋白基因來(lái)編碼組蛋白,該基因與上述的早期組蛋白基因有輕微的差異,但該組蛋白基因不成簇排列,整個(gè)基因組僅有10個(gè)拷貝,呈散在分布。

果蠅和非洲爪蟾中,5種組蛋白也排成一個(gè)重復單位,也存在間隔區,而且組蛋白基因的轉錄方向不一樣。多個(gè)重復單位也形成串聯(lián)重復排列。進(jìn)化到哺乳動(dòng)物,組蛋白基因一般不再形成重復單位,而呈散在分布或集成一小群。盡管組蛋白基因在基因組中的排列和分布在不同生物之間相差甚大,但是所有組蛋白基因都不含內含子,而且在序列上相應的組蛋白基因都很相似,從而編碼的組蛋白在結構上和功能上也極為相似。

基因組中存在大量重復序列用以編碼組蛋白是有其重要意義的。DNA復制時(shí),組蛋白也要成倍增加,而且往往在DNA合成一小段后,組蛋白馬上就要與其相結合,這要求在較短的時(shí)間內合成大量的組蛋白,因而需要有大量的組蛋白基因存在。人體基因組中還有幾個(gè)大的基因簇,也屬于中度重復順序長(cháng)的分散片段型。在一個(gè)基因簇內含有幾百個(gè)功能相關(guān)的基因,這些基因簇又稱(chēng)為超基因(Super gene),如人類(lèi)主要組織相容性抗原復合體HLA和免疫球蛋白重鏈及輕鏈基因都屬于超基因。超基因可能是由于基因擴增后又經(jīng)過(guò)功能和結構上的輕微改變而產(chǎn)生的,但仍保留了原始基因的結構及功能的完整性。

引自http://www.37c.com.cn/topic/004/theory/LL1_2_6.htm