一樣用一句話去去解釋 mate-paired 和 paired-end 的差異:mate-paired 技術可以讓定序兩端的間隔高達 2k-5k (目前新 kit 可到 10k )。如下圖所示:
首先我們將 DNA 打斷成長度為 2000~5000bp 的片段,然後將這些片段的尾端給連接起來,因此可以形成一個環狀的 DNA。圖中的紅色和綠色圓點分別代表 DNA 的 5’和 3’端。然後再將此環形 DNA 給打斷,帶有紅色和綠色圓點的區域即為我們最後要定序的 DNA 片段。由上圖可知,mate-paired 的特色除了含有極長片段的資訊之外,也由於經過環形連接,因此其定序的方向也與 paired-end 相反,分別由原始 DNA 片段的內側往外側延伸定序,這在生物資訊的處理時是要特別注意到的地方。
Mate-paired 的資訊在處理 De Novo assembly 方面的效果是相當顯著的,下方的數據是我們實際處理過所得到的結果:
Paired 75bp, 5.8 m pass filter reads, cov = 160x
- Only paired-end sequencing information
- 134 contigs, largest contig 319 kb
- Paired-end and mate-paired sequencing information
- 25 contigs, largest contig = 2.3mb
由以上結果可發現,相較於單純使用 paired-end 的資料,mate-paired 的資訊確實可以大幅改善序列組裝的效果。可是以上方的資料為例,雖然 contig 的數目已經縮減到 25 個,可是假如要靠著傳統實驗的方式一個個驗證每一個 contig 彼此之間的相對位置,還是一件很大的工程。然而最近發展出來的 Optical Mapping 技術正好可以幫助我們解決這樣的問題。有關於 Optical Mapping 所具有的強大功能及介紹,可以按此獲得詳細說明。
留言列表