在進行 de novo sequencing 時,假如我們只利用NGS的資料要將全基因體序列組裝起來,通常要非常高的覆蓋率 (coverage) 才可能將基因體組裝起來,但是,如此高的覆蓋率,不但定序費用相當高,而且面對龐大的資料量,組裝所需的硬體需求將是我們所面臨的第一個難題,組裝所需的漫長運算時間,則是另一個難題,此外,組裝錯誤亦無法被查覺。
利用 Optical mapping 可以更有效率地進行 de novo sequencing ,以更低的成本,更快的速度組完全基因體序列。
首先,我們利用 Optical mapping 建立全基因體的圖譜。
圖一 optical mapping 全基因體圖譜
然後,將NGS所產生的contigs利用MapSolver產生contigs的限制酶圖譜
圖二 contigs 的限制酶圖譜
接下來,利用 MapSolver 將contigs 對映到全基因體圖譜。
圖三 contigs 對映全基因體圖譜,紅色框中的就是全基因體圖譜
在圖三中,contig 與全基因體圖譜直接對齊的表示該contig 能直接對映到全基因體圖譜,如下圖
圖四 contig 直接對映到全基因體圖譜
在圖三中,contig 與全基因體圖譜對映的線是交錯的話,表示該contig的方向前後顛倒了,如下圖
圖五 contig的方向前後顛倒
當然,contig 也有可能組裝錯誤,下圖藍色框中的contig 在對映回全基因體圖譜時,發現各部分對到全基因體圖譜的不同部分,這表示這些區塊應分在各處,卻被誤組在一起。
圖六 藍色框中為組裝錯誤的contig
利用MapSolver,我們可以將顛倒的contig轉正,將組裝錯誤的 contig 予以分開,此時,我們就可以得到 contigs 正確對應該全基因體圖譜的結果,並得到 contig 應有的正確序列。
圖七 contigs 正確對映全基因體圖譜的結果
最後,我們只需要針對沒 contig 對映到的地方以實驗方式去補gap,即可完成全基因體定序。
留言列表