作者:張益祥/有勁基因

     

  我們在進行總體基因體學(Metagenomics)16S序列分析的時候,常常會為了如何有效運用辛苦實驗所定序出來的序列而絞盡腦汁,還好有不少這個領域的大神們相繼開發出相關演算法來幫忙解決問題,嘉惠眾人。本篇文章就要來介紹針對操作分類單元(Operational taxonomic units; OTUs)叢集分群以及校正擴增子序變異(Amplicon sequence variants; ASVs)錯誤而開發出來的兩種演算方法,順便比較一下之間的差異性。

 

  針對操作分類單元進行演算的OTUs叢集分群,這個方法會根據「序列與序列間的相似程度」去進行分群。為什麼要這麼做呢?這是因為定序的時候會受制於定序機器本身的侷限,以致定序結果可能會出現零星的鹼基定序錯誤;假如能在定序之前先將序列進行分群,就可以大大降低因定序錯誤而導致的物種分析出錯情形。

 

  叢集分群還有另一個好處,那就是可以提升物種分類的效率。這要怎麼做呢?首先要先隨機挑選一條序列當作參考序列,並將之命名為OTU1,然後再拿另一條序列來與這個參考序列做比對,如果序列的相似度大於97%(數值依使用者的需求而訂定),操作分類單元演算法就會將兩條序列直接歸類在OTU1群組中;反之,如果序列相似度不及97%,演算法就會新增一個群組並命名為OTU2,以此類推直到將所有序列完成分群。由於當兩物種序列相似度高於使用者所設定的分界(cut off)值時例如上面的97%,就會被歸類為同一個OTU。這種叢集分群最後會得到一個OTU列表,但可以想見表中所列出的每個OTU未必僅代表一個物種,也有可能代表著相似度高的多個物種;因此這種不夠精確的分類方式其實是會影響微生物物種分析的精確度的。

 

  像這樣,序列極相似到只有幾個核酸差異的不同物種,利用操作分類單元叢集分群去做分類時會遇到的困難,就可以考慮用去噪分析(DADA; Divisive Amplicon Denoising Algorithm)1去解決。去噪分析目前最新的版本是2016年發佈的2.0版(DADA2);它是根據Illumina擴增子序列的錯誤模型(error model),藉由去噪(Denoising)演算去排除定序儀器所造成的幾個核酸差異的錯誤2,讓後續的微生物物種分析可以因此取得較高的精準度。

 

  下圖一的例子就將DADA2與OTUs叢集分群兩種演算模型的定序分析結果做了個比較。若我們採用的是OTU叢集分群方法,分析結果很可能會給你兩大物種(紅色與藍色),如此一來,一些序列相似度高但數量相對少的物種就被忽視掉了。而DADA2演算模型就會盡可能幫你還原出該環境中實際的物種數量。

 

圖一、DADA2與OTUs叢集分群兩種演算模型的定序結果比較

0930_1.png

左邊sample sequences區塊中的4色圓圈(綠、紅、藍、灰),代表不同的序列集合,圓圈大小代表該序列的豐度,圓圈與圓圈之間的距離為序列相似的程度,距離越大表示序列相似度越低。中間擴增子序列(amplicon reads)區塊內標示的是定序後所得到的序列,其中若包含了一些鹼基定序錯誤的序列,就會出現小圓點。OTU叢集分群方法(以右向箭頭表示),分析結果很可能會給你兩大物種(紅色與藍色),而一些序列相似度高但數量相對少的物種就被忽視掉了。DADA2演算模型(以左向箭頭表示)則會盡可能還原出該環境中實際的物種數量。(圖片來源:Callahan, B.J., et. al. Nature Methods. 2016 May; 13:581-583)

 

 

參考資料

1. Rosen, M. J., et al. Denoising PCR-amplified metagenome data. BMC Bioinformatics. 2012, Oct; 13:283-298. Retrieved from https://doi.org/10.1186/1471-2105-13-283

2. Callahan, B.J., et. al. DADA2: high-resolution sample inference from Illumina amplicon data. Nature Methods. 2016 May; 13:581-583. Retrieved from https://doi.org/10.1038/nmeth.3869. (Supplementary Figure 1. Retrieved from https://chmi-sops.github.io/papers/dada2_methods.pdf)

 

 

 

thumbnail_官網用CC創用_ND_YH.png

arrow
arrow

    Yourgene Health 發表在 痞客邦 留言(0) 人氣()