生物資訊工具與技術－有勁的基因資訊

目前分類：生物資訊工具與技術 (83)

瀏覽方式：標題列表簡短摘要

Jul 27 Wed 2011 11:25
Mate-Paired V.S. Paired-End

一樣用一句話去去解釋 mate-paired 和 paired-end 的差異：mate-paired 技術可以讓定序兩端的間隔高達 2k-5k (目前新 kit 可到 10k )。如下圖所示：

新圖片 (7).png

首先我們將 DNA 打斷成長度為 2000~5000bp 的片段，然後將這些片段的尾端給連接起來，因此可以形成一個環狀的 DNA。圖中的紅色和綠色圓點分別代表 DNA 的 5’和 3’端。然後再將此環形 DNA 給打斷，帶有紅色和綠色圓點的區域即為我們最後要定序的 DNA 片段。由上圖可知，mate-paired 的特色除了含有極長片段的資訊之外，也由於經過環形連接，因此其定序的方向也與 paired-end 相反，分別由原始 DNA 片段的內側往外側延伸定序，這在生物資訊的處理時是要特別注意到的地方。

(繼續閱讀...)

TIGS 發表在痞客邦留言(0) 人氣()

個人分類：生物資訊工具與技術

▲top

Jul 27 Wed 2011 10:32
RPKM 簡介

RNA-seq 是透過次世代定序的技術來偵測基因表現量的方法，在衡量基因表現量時，若是單純以 map 到的 read 數來計算基因的表現量，在統計上是一件相當不合理事，因為在隨機抽樣的情況下，序列較長的基因被抽到的機率本來就會比序列短的基因較高，如此一來，序列長的基因永遠會被認為表現量較高，而錯估基因真正的表現量，所以 Ali Mortazavi 等人在 2008 年提出以 RPKM 在估計基因的表現量。

RPKM 是將 map 到基因的 read 數除以 map 到 genome 的所有 read 數 (以 million 為單位) 與 RNA 的長度(以 KB 為單位)。

其公式為:

(繼續閱讀...)

TIGS 發表在痞客邦留言(6) 人氣()

個人分類：生物資訊工具與技術

▲top

Jul 22 Fri 2011 16:12
Paired-End V.S. Single-End

一句話去去解釋 single end 和 paired-end 的差異： single end 只讀取DNA片段的一端，而 paired-end 則是讀取兩端。如下圖所示：

新圖片 (9).png

為何要有 paired-end 這樣的技術發明呢？主要的原因在於 illumina 在每一次定序的過程中，最多只能定序到 150bp 的長度。這樣的長度對比於第一代的 Sanger 定序法(約 1000bp )或是同樣屬於 NGS 的 454 定序儀(約 400bp)，顯然是短了許多。因此 illumina 發展了 paired-end 的定序，先將 DNA 打斷成固定長度範圍的片段( 200~500bp )，再利用此技術讀取片段兩端的序列，我們即可得到 300bp ( 150x2 )的定序長度。此一技術不僅拉近了 illumina 和 454 之間的差距，也大大的改善了生物資訊的分析。

(繼續閱讀...)

TIGS 發表在痞客邦留言(3) 人氣()