方法介紹
定位克隆首先是獲取基因在染色體上的位置的信息,然后采用各種實(shí)驗方法克隆基因和進(jìn)行定位?;虻亩ㄎ豢寺〔呗源篌w上可以分成四個(gè)步驟。
①通過(guò)家系連鎖分析資料或染色體微小缺失(雜合性丟失,LOH)等數據,確定基因在染色體上的位置;
②通過(guò)染色體步移(chromosomewalking)、染色體區帶顯微切割等技術(shù),獲得基因所在區段的DNA片段疊連群(contig),繪制出更精細的染色體圖譜;
③確定含有候選基因的染色體片段;
④從這些片段中進(jìn)一步篩選目的基因,并作突變檢測驗證和功能分析。
重要地位
當前,人類(lèi)基因組研究的重心正在由“結構”向“功能”轉移,一個(gè)以基因組功能研究為主要內容的所謂“后基因組時(shí)代”(post-genomics),也即功能基因組(functionalgenomics)時(shí)代,即將到來(lái)。如何獲取基因的功能信息,即與人類(lèi)重大疾病和重要生理功能相關(guān)的基因信息,就擺在了我們面前。定位候選克隆策略(positionalcandidatecloning)是傳統定位克隆(positionalcloning)的改進(jìn)和發(fā)展,并以其在克隆疾病相關(guān)基因中的有效性而日益受到重視。
人類(lèi)基因組計劃已確定了一系列分布于全基因組24條染色體上的分子標記。根據這些分子標記的序列和定位信息,結合雜交或PCR的方法可以快速檢測染色體上與腫瘤或遺傳性疾病相關(guān)的熱點(diǎn)位置,進(jìn)而從中克隆疾病相關(guān)基因。定位候選克隆克服了經(jīng)典的定位克隆純粹依靠連鎖分析進(jìn)行染色體定位的繁冗而緩慢的弊端,大大加快了克隆工作的進(jìn)程,而且它也不僅僅局限于遺傳病,現在已更多地運用于腫瘤易感基因的克隆工作。
1994年國際上開(kāi)始構建并于1996年首次公布的基因圖譜是一個(gè)以cDNA為基礎的STS(sequence-taggedsite)標記的物理圖和多態(tài)性微衛星標記的遺傳圖相結合的圖譜,它一方面使染色體定位更加準確、可靠、精密,同時(shí)為從候選區域內獲得疾病相關(guān)的候選基因提供了極大的便利,使得目的基因的克隆更加簡(jiǎn)便而快捷,為這種方法的發(fā)展和應用注入了更大的活力,表現為此后相繼克隆出16條新的疾病相關(guān)基因,如從胰腺癌中分離得到的抑癌基因DPC4等。1998年10月GeneBank公布了最新的“基因圖譜98”,它的信息量更大,且準確度和精確度都有大幅度的提高,包含有41464個(gè)STS標記,代表了30181條基因的定位信息,也即完成了人的全部基因組約6萬(wàn)~7萬(wàn)條基因中的一半左右的定位工作??傊?,隨著(zhù)人類(lèi)基因組計劃的推進(jìn),定位候選克隆已成為一種有效的克隆疾病相關(guān)基因的方法。
基本步驟
綜述
定位候選克隆包括三個(gè)基本步驟:基因組定位、候選cDNA的獲得、全長(cháng)及功能分析。本文即對此策略的發(fā)展和應用作一概要介紹。
基因組定位
新發(fā)展起來(lái)的,尤其在分離腫瘤易感基因中常用的方法是用PCR方法檢測多樣本的雜合性丟失(LOH)或純合性丟失的高發(fā)頻率區,從而獲得疾病候選基因定位。體細胞抑癌基因的失活是導致癌變的一個(gè)主要因素,最常見(jiàn)的表現即雜合性缺失。通常在染色體上雜合性缺失的高發(fā)頻率區含有一個(gè)或多個(gè)抑癌基因。利用散布于各條染色體上的分子標記(包括STS、微衛星標記等),用PCR檢測多個(gè)腫瘤樣本的染色體各區帶的缺失情況,可確定LOH的高發(fā)頻率區,也即確定了相關(guān)腫瘤生長(cháng)負調控因子的染色體定位,并可精確到基因組分子標記指示的區域,進(jìn)一步可作基因的克隆工作。利用這一方法已成功地克隆了幾個(gè)抑癌基因,如乳腺癌中的BRCA1、BRCA2及胰腺癌中的DPC4基因等。同時(shí),FISH技術(shù)的不斷發(fā)展及推廣應用,染色體顯微切割技術(shù)的成熟,可在顯微鏡下切割特定的染色體區帶,制備染色體區帶特異探針,對正常和病變組織作FISH分析,比較確定疾病相關(guān)基因的染色體區帶定位。近些年來(lái),RH譜(radiationhybridmap)的建立,使染色體精細定位成為可能。這些方法比原先連鎖分析的檢測速度更快、精確度更高。例如L-CTsui用連鎖分析花費了大約10年的時(shí)間才把囊性纖維變性基因定位在7號染色體,而現在可能只要一年或更短的時(shí)間就可完成這項工作。
候選cDNA的獲得
基因組定位提供的信息包含一定的分子標記,可用PCR或雜交的方法直接從YAC(yeastartificialchromosome)庫,或從BAC(bacterialartificialchromosome)庫、PAC(P1artificialchromosome)庫中篩選相對應的克隆。YAC庫的嵌合性嚴重且操作難度較大,已逐步為PAC庫和BAC庫取代。PAC系統是以噬菌體P1為基礎的克隆系統,它可容納70~100kb的插入片段,并可選擇性地區分重組子和非重組子,且同時(shí)有兩套復制機制。單拷貝復制子可用于穩定克隆增殖,而多拷貝復制子則可在Lac操縱子的控制下用于DNA的制備。BAC系統是基于大腸桿菌中可大容量容納基因且穩定性良好的F因子衍生而來(lái)的載體系統,可容納超過(guò)100kb的插入片段,BAC克隆的插入片段的平均長(cháng)度為120kb,最大可達到240kb左右。良好的穩定性和操作的簡(jiǎn)便性是BAC系統的主要優(yōu)點(diǎn)。由這些克隆入手,采用依賴(lài)于適當cDNA文庫的方法、依賴(lài)于特征序列的方法或依賴(lài)于表達性質(zhì)等方法獲得候選cDNA。
全長(cháng)及功能分析
獲得了眾多的候選cDNA后,通過(guò)篩選cDNA文庫或RACE等方法克隆全長(cháng)基因。為確定其中的致病基因,需要逐個(gè)檢測它們在患病家系中的變化情況,并分析其功能。功能分析往往是定位克隆中的一個(gè)難點(diǎn),因為不同的疾病有不同的特征,也就需要用不同的功能檢測系統進(jìn)行分析。常用的如細胞水平的正義或反義基因的表達后細胞形態(tài)和功能變化的研究,在腫瘤研究中檢測細胞形態(tài)和接觸抑制的變化,軟瓊脂生長(cháng)能力的變化及裸鼠致瘤性分析等。更進(jìn)一步的功能分析則包括個(gè)體水平的基因敲除實(shí)驗等。
現在還發(fā)展出了一些與其它方法相結合的新思路,如與差減雜交相結合,篩選位于候選區域的差異表達基因,大大提高了獲得有價(jià)值基因的可能性。同時(shí)人類(lèi)基因組計劃中轉錄圖譜〔15〕工作的開(kāi)展,有很多EST已被精確定位于染色體的不同區帶上,可以直接進(jìn)行功能研究。隨著(zhù)研究的深入,越來(lái)越多的EST定位工作的完成,基因轉錄圖譜的不斷完善,我們完全可以直接跳過(guò)定位克隆的第二個(gè)步驟而直接進(jìn)入功能鑒定和基因全長(cháng)的克隆工作,這可能將是定位克隆中最快的方法。在分析分離手段不斷提高,人類(lèi)基因組計劃緊鑼密鼓地實(shí)施的今天,各種新思路新方法層出不窮,定位克隆方法的周期也將不斷縮小,為人類(lèi)最終克隆各種疾病基因提供了可能性。
篩選方法
直接篩選法依賴(lài)適當cDNA文庫的方法有直接篩選法和cDNA選擇法(cDNAselection)。直接篩選法即用基因組DNA直接從cDNA文庫中篩選位于該基因組片段內的cDNA,如從覆蓋有候選區域的YAC、PAC、BAC克隆中分離外源片段作為探針從文庫中篩選候選基因;而cDNA選擇法恰恰與直接篩選法相反,它把基因組DNA固定在膜上,用總cDNA與之雜交,通過(guò)PCR從中回收可與基因組片段結合的cDNA片段。直接篩選法的優(yōu)點(diǎn)在于避免了對候選區域大片段地亞克隆操作,且在單一的篩選中可以獲得多個(gè)轉錄子的信息。但缺點(diǎn)是大片段地純化,標記較困難,而PAC、BAC克隆片段純化相對方便的優(yōu)點(diǎn)就成為這種方法發(fā)展的趨勢;同時(shí)由于探針的復雜性,使雜交背景加深,假陽(yáng)性增多,而且容易忽略短的外顯子或低豐度cDNA。cDNA選擇法的最大優(yōu)越性在于PCR反應的介入,大大提高了選擇的靈敏度,可以檢測到一些稀有轉錄子。
表達依賴(lài)法也即Northern雜交分析法。用候選區域基因組DNA作為探針與總RNA雜交,切下陽(yáng)性條帶,反轉錄為cDNA并克隆,即可獲得位于此基因組片段中的轉錄子。
上述方法都各有其優(yōu)缺點(diǎn),必須根據原材料及要達到的目的,選擇適當的一種或多種方法組合來(lái)達到研究目的。此外,其它方法還很多,如微切割和微克隆法、減法cDNA雜交法、重組篩選法等。
依賴(lài)特征序列依賴(lài)特征序列的方法是依據轉錄子內部及其兩側的序列特征直接從基因組DNA中分離cDNA片段,主要有CpG島搜尋法、外顯子捕獲法(exontrapping)、交叉物種序列同源性比較法(cross-speciessequencehomology)、AluPCR法與直接序列分析法等。CpG島也稱(chēng)為HTF島,是一些富含GC的小區域。大部分轉錄子的附近(通常是在5′上游區域)都含有非甲基化的CpG島。利用一些識別CpG島的稀有酶,如SacⅡ、BssHⅡ、EagⅠ等,切割基因組DNA,獲得位于CpG島附近的序列作為探針從總RNA或cDNA文庫中得到轉錄子。外顯子捕獲法是基于對外顯子兩側的功能性5′和3′剪接位點(diǎn)的識別,從基因組DNA中分離外顯子片段。交叉物種序列同源性比較的依據是編碼區序列在不同物種間的保守性要遠高于非編碼區,把候選區域的DNA分為多個(gè)亞克隆,分別與不同的物種總DNA雜交,與不同物種DNA都有陽(yáng)性信號的DNA克隆可能就是編碼區基因。這種方法依賴(lài)的是物種間DNA水平上的序列同源性。Alu序列是散布于人基因組中的短的重復序列,通過(guò)設計人特異的Alu序列作為引物,可直接快速用PCR方法從YAC、BAC、PAC克隆或人鼠雜合細胞中得到人源的特異序列。直接序列分析法則在基因組序列信息中用GRAIL和GeneScan等軟件分析推測編碼基因的方法。