在進行 de novo sequencing 時,假如我們只利用NGS的資料要將全基因體序列組裝起來,通常要非常高的覆蓋率 (coverage) 才可能將基因體組裝起來,但是,如此高的覆蓋率,不但定序費用相當高,而且面對龐大的資料量,組裝所需的硬體需求將是我們所面臨的第一個難題,組裝所需的漫長運算時間,則是另一個難題,此外,組裝錯誤亦無法被查覺。

利用 Optical mapping 可以更有效率地進行 de novo sequencing ,以更低的成本,更快的速度組完全基因體序列。

首先,我們利用 Optical mapping 建立全基因體的圖譜。


新圖片 (2).png

圖一 optical mapping 全基因體圖譜


然後,將NGS所產生的contigs利用MapSolver產生contigs的限制酶圖譜

新圖片 (3).png  

圖二 contigs 的限制酶圖譜

接下來,利用 MapSolver 將contigs 對映到全基因體圖譜。

圖片1.png  

圖三 contigs 對映全基因體圖譜,紅色框中的就是全基因體圖譜

在圖三中,contig 與全基因體圖譜直接對齊的表示該contig 能直接對映到全基因體圖譜,如下圖

map.png  

圖四 contig 直接對映到全基因體圖譜

在圖三中,contig 與全基因體圖譜對映的線是交錯的話,表示該contig的方向前後顛倒了,如下圖

reverse.png  

圖五 contig的方向前後顛倒

當然,contig 也有可能組裝錯誤,下圖藍色框中的contig 在對映回全基因體圖譜時,發現各部分對到全基因體圖譜的不同部分,這表示這些區塊應分在各處,卻被誤組在一起。

圖片2.png  

圖六 藍色框中為組裝錯誤的contig

利用MapSolver,我們可以將顛倒的contig轉正,將組裝錯誤的 contig 予以分開,此時,我們就可以得到 contigs 正確對應該全基因體圖譜的結果,並得到 contig 應有的正確序列。


新圖片 (5).png

圖七 contigs 正確對映全基因體圖譜的結果

最後,我們只需要針對沒 contig 對映到的地方以實驗方式去補gap,即可完成全基因體定序。


logo_121_55.png 

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()