一句話去去解釋 single end 和 paired-end 的差異: single end 只讀取DNA片段的一端,而 paired-end 則是讀取兩端。如下圖所示:

新圖片 (9).png 

為何要有 paired-end 這樣的技術發明呢?主要的原因在於 illumina 在每一次定序的過程中,最多只能定序到 150bp 的長度。這樣的長度對比於第一代的 Sanger 定序法(約 1000bp )或是同樣屬於 NGS 的 454 定序儀(約 400bp),顯然是短了許多。因此 illumina 發展了 paired-end 的定序,先將 DNA 打斷成固定長度範圍的片段( 200~500bp ),再利用此技術讀取片段兩端的序列,我們即可得到 300bp ( 150x2 )的定序長度。此一技術不僅拉近了 illumina 和 454 之間的差距,也大大的改善了生物資訊的分析。

舉例來說,藉由 pair-end 的技術,假設有一個 DNA 片段剛好跨越了重複序列區域(下圖左側)以及獨特序列區域(下圖右側)。假如只讀取 single end,我們只會獲得紅色實線的序列資料,也就是 ATATATAT。接下來當我們想要將這段 read reference genome 做比對的時候,便會出現問題:到底這段 read 是出自於紅色實線的位置,還是紅色虛線的位置?這個問題我們可以藉由 paired-end 的技術來加以解決。由於 paired-end reads 之間的距離為已知(在此我們假設為 34 bp),我們便可以先定位綠色 read 的位置,再正確定位出左方紅色 read 的位置,而不至於將其誤判在紅色虛線的位置。如下圖所示:

 

新圖片 (10).png 

此外,根據我們內部的一個測試。在進行 de novo assembly 的時候,序列長度以及 paiedr-end 的資訊可以讓我們獲得最好的組裝結果。透過下表我們可以發現,paired-end 的資訊甚至比序列長度要來得更為重要。因此建議大家在選擇定序方案的時候,盡量選擇 paired-end 吧!

新圖片 (8).png     

 

 

 

 

logo yourgene    

 

YourGene 發表在 痞客邦 PIXNET 留言(3) 人氣()


留言列表 (3)

發表留言
  • ERIC
  • 請問 SOAP DENOVO ASSEMBER 裡面的MAX_RE_LENTGH 是要如何去決定!?
  • 關於SOAPdenovo的參數"max_rd_len"
    設定的數值決定於所使用定序資料的maximal read length

    其他參數設定,建議參考SOAPdenovo的網站
    http://soap.genomics.org.cn/soapdenovo.html

    YourGene 於 2013/03/22 12:21 回覆

  • 訪客
  • 我舉個例子好了 如果序列長度有70. 60 . 80 MAX_RED_LEN是設定80嗎?
  • 是的,"max_rd_len"的參數設定是決定於最長的read長度
    以你所舉出的例子,則將"max_rd_len"設定在80

    YourGene 於 2013/05/01 15:16 回覆

  • 請問定序後,序列的方向?
  • 有勁您好,
    請問illumina的定序後,read的方向是一致的嗎? 以single-end舉例來說,定序後是否所有的read都是從reference的5'到3'呢? 最近在寫簡單的比對演算法,不知道是否要考慮反向的比對,謝謝您回答。
  • 您好, 關於您的問題回答如下,如果您定序的序列為DNA,那麼無論是Single-end 或者paired-end皆會發生reverse complement 的情況;如果定序序列為RNA,則可透過某些操作獲取特定strand 的序列。

    YourGene 於 2015/06/30 15:41 回覆