目前分類:生物資訊工具與技術 (83)

瀏覽方式: 標題列表 簡短摘要

一樣用一句話去去解釋 mate-paired 和 paired-end 的差異:mate-paired 技術可以讓定序兩端的間隔高達 2k-5k (目前新 kit 可到 10k )。如下圖所示:

新圖片 (7).png 

首先我們將 DNA 打斷成長度為 2000~5000bp 的片段,然後將這些片段的尾端給連接起來,因此可以形成一個環狀的 DNA。圖中的紅色和綠色圓點分別代表 DNA 的 5’和 3’端。然後再將此環形 DNA 給打斷,帶有紅色和綠色圓點的區域即為我們最後要定序的 DNA 片段。由上圖可知,mate-paired 的特色除了含有極長片段的資訊之外,也由於經過環形連接,因此其定序的方向也與 paired-end 相反,分別由原始 DNA 片段的內側往外側延伸定序,這在生物資訊的處理時是要特別注意到的地方。

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

RNA-seq 是透過次世代定序的技術來偵測基因表現量的方法,在衡量基因表現量時,若是單純以 map 到的 read 數來計算基因的表現量,在統計上是一件相當不合理事,因為在隨機抽樣的情況下,序列較長的基因被抽到的機率本來就會比序列短的基因較高,如此一來,序列長的基因永遠會被認為表現量較高,而錯估基因真正的表現量,所以 Ali Mortazavi 等人在 2008 年提出以 RPKM 在估計基因的表現量。

RPKM 是將 map 到基因的 read 數除以 mapgenome 的所有 read(million 為單位)RNA 的長度(KB 為單位)

 

其公式為:

Yourgene Health 發表在 痞客邦 留言(6) 人氣()

一句話去去解釋 single end 和 paired-end 的差異: single end 只讀取DNA片段的一端,而 paired-end 則是讀取兩端。如下圖所示:

新圖片 (9).png 

為何要有 paired-end 這樣的技術發明呢?主要的原因在於 illumina 在每一次定序的過程中,最多只能定序到 150bp 的長度。這樣的長度對比於第一代的 Sanger 定序法(約 1000bp )或是同樣屬於 NGS 的 454 定序儀(約 400bp),顯然是短了許多。因此 illumina 發展了 paired-end 的定序,先將 DNA 打斷成固定長度範圍的片段( 200~500bp ),再利用此技術讀取片段兩端的序列,我們即可得到 300bp ( 150x2 )的定序長度。此一技術不僅拉近了 illumina 和 454 之間的差距,也大大的改善了生物資訊的分析。

Yourgene Health 發表在 痞客邦 留言(3) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼