作者:張美虹/有勁生物科技

 

EzBioCloud1是由韓國企業ChunLab開發、整合了多個生物資訊功能的雲端服務系統。此資料庫主要收錄細菌與古細菌的16S rRNA基因序列與全基因體組裝序列,目的是提供序列的搜尋比對以達成菌種的鑑定與分類,能廣泛應用在細菌/古細菌分類學、生態學,以及環境基因體學研究等領域。

 

以往利用菌種的16S rRNA基因進行定序歸類是研究上常見的策略;然而僅憑16S rRNA基因序列並不足以作為某單一菌種的鑑定分類根據,因此EzBioCloud資料庫還將NCBI資料庫的菌種全基因體定序組裝相關資料也一併納入。

 

目前公認的物種鑑定方法是將目標菌株的基因序列與參考序列進行ANI(average nucleotide identity)數值計算。兩個原核基因體序列之間的ANI數值假如超過設定門檻(門檻建議設定「不小於95%」),就會判定它們為相同物種。EzBioCloud的物種分析鑑定便是根據此基礎,使用OrthoANI軟體以ANI篩選低標95%作為物種的定義邊界來進行計算,並透過UPGMA(Unweighted Pair Group Method with Arithmetic Mean;未加權算術平均對群法)輸出樹狀圖表,呈現鑑種結果。(詳見本文參考文獻1的圖一「利用全基因體組裝序列進行物種分類確立的邏輯示意圖」)

 

在EzBioCloud收錄基因序列與建立資料庫時,有時會發現其鑑定結果中的全基因體定序組裝序列註解名稱與其他現行資料庫有所出入。舉例來說,NCBI資料庫中的strain 6_1_63FAA菌株(NCBI Assembly accession GCF_000209425.1),被標示物種為Lachnospiraceae bacterium 6_1_63FAA;但此菌株序列資料經EzBioCloud分析,在OrthoANI演算出98.7%的ANI數值,結果鑑定實應歸屬Blautia hansenii。(詳見本文參考文獻1的圖二「UPGMA圖表範例」)

 

這也說明透過EzBioCloud演算能協助改善以往全基因體定序組裝序列被識別錯誤和菌株未成功分類的問題。作者預期未來這個資料庫在菌種基因體序列收錄更完備後,對於物種或亞種層級上的鑑別力就會更精確。EzBioCloud資料庫截至2017年本文參考文獻1發表時,即已收錄了61,700個菌株,其中13,132株已具備經有文獻驗證的種名;此外資料庫還收錄了62,362株細菌或古細菌的全基因體組裝序列,這些序列也全都已確立「屬」級或更精確層級的分類鑑定。

 

參考文獻

Yoon, S.H., Ha, S.M., Kwon, S., Lim, J., Kim, Y., Seo, H. and Chun, J. (2017). Introducing EzBioCloud: A taxonomically united database of 16S rRNA and whole genome assemblies. Int J Syst Evol Microbiol. 67(5):1613-1617. doi: 10.1099/ijsem.0.001755. Epub 2017 May 30.

arrow
arrow

    Yourgene Health 發表在 痞客邦 留言(0) 人氣()