作者:吳上豪/有勁生物科技
對次世代定序來說,定序重複出現的DNA短片段是一項挑戰。由於基因文庫製作時必須打斷DNA,這過程無法控制DNA斷裂的位置,倘若斷裂後的DNA片段未能包含完整重複的序列,就可能影響定序後的基因體組裝。在此與大家分享一篇利用專一性DNA截切技術—CRISPR/Cas9,在基因文庫製作過程中減少重複序列被從中打斷的機會,藉此提高對重複序列定序能力的研究。
前面提到的重複序列又被稱為微衛星序列 (microsatellite),這個序列在生物基因體中由2至6個核苷酸做為單元體,重複排列數十次甚至達上百次,所以也被稱為簡單重複序列或短縱列重複序列。微衛星序列在複製DNA或減數分裂的基因重組時容易產生插入或刪除突變,突變率遠高於核苷酸單點突變,且具高度異型結合性 (heterozygosity),因此微衛星序列單元體重複的次數常用來做為判別個體或族群間親緣關係的指標。
微衛星序列的定序目前常採用聚合酶連鎖反應 (polymerase chain reaction, PCR) ,先擴增目標片段數量後,再經毛細管電泳得到完整微衛星序列。然而毛細管電泳對微衛星定序有以下幾個缺點:
- 1. PCR一次能擴增的目標片段有限,故毛細管電泳一次只能針對少量微衛星序列進行定序。
- 2. 序列分析的資料通量小。
- 3. PCR過程中,DNA聚合酶可能在DNA模板滑動造成插入或刪除重複單元體的現象,導致最後得到錯誤的單元體重複次數。
另一種定序方法─ 次世代定序可對欲分析的樣品進行全面性分析,通量大且能利用barcode區分不同樣品來源,大大改善毛細管電泳低通量的缺點。雖然次世代定序對微衛星序列分析有許多優點,但由於微衛星序列是個體間歧異度非常大的重複序列,建立基因文庫過程中,由於進行樣品DNA片段化所使用的超音波震盪或酵素截切皆採取非專一性打斷DNA的方式,一旦DNA在微衛星序列所在處從中間被打斷,進行序列組裝時可能就無法正確計算微衛星序列重複的次數,甚至無法判別是否有微衛星序列存在;因此如何提升微衛星序列的定序正確率是目前待改進之處。
今年2月發表於Nature Communications 的一篇文獻中,作者導入CRISPR/Cas9系統製作基因文庫,增加片段化DNA中完整微衛星序列的比例,提升了次世代定序分析微衛星序列的正確率。CRISPR/Cas9原為細菌中用來降解外來DNA的機制,Cas9辨認與切割降解外來DNA的機制在2012年發表。Cas9會與gRNA (small guide RNA, sgRNA 或引導RNA) 結合,當gRNA與外來DNA序列互補,且互補序列之後跟著一段叫做PAM (protospacer adjacent motif) 的短序列(圖一紅色GG處)時,Cas9 便會將DNA雙股同時切斷(圖一)。2013年此機制被應用於基因編輯 (gene editing) 上,由於gRNA序列決定Cas9的專一性,藉由人工合成與目標序列互補的gRNA,便可利用Cas9將想針對的目標DNA雙股切斷。相較其他專一性切割DNA的方式,CRISPR/Cas9僅需合成gRNA及加入Cas9核酸內切酶,其合成速度較快、成本較低,所以此系統現今已成為專一性DNA切割與基因編輯的重要工具。
圖一、CRISPR/Cas9系統辨認與切割目標DNA的機制示意圖
回到今年2月這篇文獻,作者使用Illumina系統,選擇總長度小於100個鹼基對的微衛星序列做為分析目標,比較若在隨機片段化DNA樣品之前,先採用CRISPR/Cas9專一性地從目標微衛星序列上游進行切割,藉以減少微衛星序列在DNA隨機片段化過程中序列被從中打斷的機會,觀察此法對尋找及分析完整微衛星序列是否有所幫助。以毛細管電泳得到的470個微衛星序列 (CE ground truth genotypes) 為例,過去利用基因體定序僅能找到其中260至290個微衛星序列 (available WGS genotypes),而使用CRISPR/Cas9處理過的樣品 (STR-Seq genotypes),其定序結果可找到超過450個微衛星序列(表一)。此外,經CRISPR/Cas9處理過的樣品,其目標序列的定序深度明顯較未處理的樣品高,表示這個方法的確可以針對微衛星序列提升組裝能力。
表一、微衛星定序與毛細管電泳、全基因體定序的比較
製作基因文庫過程中,聚合酶連鎖反應 (PCR) 的DNA聚合酶有可能在反應過程中因滑動而產生插入或刪除序列,改變微衛星的重複次數。作者觀察基因文庫製作時進行PCR與否對微衛星重複次數的影響,發現不進行PCR反應可以增加微衛星重複次數計算的準確率(圖二)。
圖二、基因文庫製備過程中PCR對微衛星序列定序結果的影響
對法醫檢驗來說,如何在不同來源的DNA混合樣品中找到少量來自特定來源的微衛星序列標的一直是個挑戰。本實驗中,作者將作為目標樣本的DNA以不同比例與其他來源的DNA做混合,再以微衛星定序法看看是否能夠從其中找出目標樣本的微衛星序列。結果發現,即使目標樣本DNA僅占總樣品含量的0.1%,來自此樣本的微衛星序列依然能被找到;此顯示微衛星定序法對偵測混合DNA樣品中的微量微衛星序列有相當不錯的靈敏度。
總結來說,在基因文庫製作時使用CRISPR/Cas9系統,可專一性辨認並切割在微衛星序列上游不遠處,減少微衛星序列在DNA隨機片段化過程裡序列從中間被打斷的機會,藉此增加定序深度及組裝辨識能力。若配合PCR-free基因文庫製備,可降低因DNA聚合酶在擴增過程中滑動造成微衛星重複次數增加或減少的偽陽性結果。這種微衛星定序法具良好的靈敏度,因此也可能應用在法醫鑑定與基因體族群間親緣關係的判別上。
參考文獻:
1. Shin G, Grimes SM, Lee H, Lau BT, Xia LC, Ji HP. CRISPR–Cas9-targeted fragmentation and selective sequencing enable massively parallel microsatellite analysis. Nature Communications. 2017 Feb; 8: 14291.
2. Mali P, Esvelt KM, Church GM. Cas9 as a versatile tool for engineering biology. Nature methods. 2013 Oct; 10(10): 957-963.
留言列表