目前分類:De novo (4)

瀏覽方式: 標題列表 簡短摘要

NCBI、GenBank等序列資料庫的開放性使許多人的研究如虎添翼,特別是那些早被定過千千萬萬條序列的模式物種,各種基因的序列、註解與表現量資訊皆可信手拈來。反之,以往非模式物種的研究者卻常常必須使用痛苦指數很高的工具如degenerate PCR除草開路,或是在經費限制下使用表現序列標幟(Expressed sequence tag, EST)取得所需的序列資源。

 

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

之前我們探討了兩種會造成組裝過程產生錯誤結果的因素,這次我們要再來探討第三種因素。

3.重複區域Repeat region

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

目前 De Novo 序列組裝演算法有兩種, 一種稱為 overlap-layout-consensus , 簡稱 OLC. 另一種則是 de-bruijn-graph , 簡稱 DBG.

OLC 方法較為直觀, 先是將所有的 reads 做兩兩比對( pair-wise alignment ), 找出 reads 重疊( overlap )的區域, 再以圖學( graph theory )的方式呈現( layout ) reads 之間的重疊的關係, 以節點( vertex )表示 read,( edge )表示 read 之間的重疊, 見圖一.

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

當我們想要研究一個物種,可是卻發現這個物種的序列資料 (DNA or RNA) 並不存在於世界上現有的資料庫。當我們遇到這種情況,便可以利用 NGS 的資料來進行所謂的 de novo assembly,藉此幫助我們獲取此物種的序列內容。而一個常見的 de novo assembly 流程概念如下:

新圖片 (5) 

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()