作者:張益祥/有勁基因
總體基因體學(Metagenomics)的概念是由Jo Handelsman等人於1998年所提出,意指特定環境(如:人類腸道、大自然環境)中所有微生物遺傳物質的總和。次世代定序(Next Generation Sequencing; NGS) 是總體基因體學的工具,透過次世代定序可以研究特定環境下微生物的組成與相對數量的多寡。
總體基因體學的定序策略分成兩大類:全基因體霰彈槍法(whole genome shotgun sequencing)以及16S目標區間定序 (16S targeted sequencing)。前者可對特定環境中存在的微生物種類進行全面性分析,但由於目前可用的參考數據庫還很有限,想要分析讀取序列通常仍有困難。後者是針對特定高變區(Highly Variable Region)的序列進行定序,執行上相對較容易、快速;但由於只有拿目標區段去做定序,物種分類的解析度也會因此受到限制。
16S rRNA位在原核細胞的核醣體小次單元(Ribosomal Small Subunit; SSU)上,其序列包含9個高變區(V1~V9)及10個保守區(Conserved Regions),如圖一所示1。利用上述16S rRNA的這些高變區去做定序,可以鑑定微生物的種類,因此目前16S rRNA序列經常被拿來當作鑑定微生物種類的指標序列(marker)。有勁基因目前為客戶分析土壤、糞便菌相時,主要是定序V3-V4這個區段。定序所使用的引子(primer)為341F/805R,採用的儀器是illumina的Miseq機型,定序類型為paired-end300;並分別從正向與反向進行雙端測序,讀數長度則剛好跨過V3-V4區段(長度約為428bp)。
圖一、16S rRNA的保守區與高變區
16S rRNA序列上有10個保守區(以藍色標示);相較於古菌(Archaea)的菌種,細菌(Bacteria)菌種在保守區上的序列差異並不明顯。而9個高變區(紅色標示的V1~V9區段)則可用來鑑定分類。(圖片來源:EZBioCloud Help center. (2019, Feb. 20). 16S rRNA and 16S rRNA Gene.)
想要分類鑑定,當然就要用到資料庫囉,目前最常用的資料庫有RDP、SILVA、Greengenes,如表一所示。
表一、RDP、SILVA、Greengenes資料庫數據統計表
SILVA最搶眼的表現在其可處理的序列量最龐大、且資料庫更新的頻率比其他資料庫快。相對的,Greengenes資料,雖然僅更新到2013年5月,但是它有機會鑑別到「種」的演化層級。(表格來源: 張益祥/ 有勁基因)
RDP(全名為Ribosomal Database Project)可用來註釋比對細菌和古菌的16S rRNA序列、以及真菌的28S rRNA序列,共計3,356,809條序列。目前最新版本為2016/09更新的Release 11。2
SILVA為提供三大界微生物(細菌、古細菌、真核)rRNA基因序列的綜合資料庫;其資料庫涵蓋了原核和真核微生物的核糖體小次單元(即16S rRNA和18S rRNA)以及核糖體大次單元(Ribosomal Large Subunit; LSU,即23S rRNA和28S rRNA),共計9,469,656條序列。目前最新版本為2019/12更新的SILVA138。3
Greengenes則是提供細菌、古菌16S rRNA基因序列分析參考的資料庫。目前最新版本為2013/05更新的gg_13_5,共計1,262,986條序列。4
看到這裡,大家對Metagenomics和其參考資料庫應該已經有一些粗淺的概念了吧。下次筆者再來為大家介紹Metagenomics分析工具與分析結果,例如α. β diversity是甚麼?它們的差異是什麼?那我們就相約下次見囉~
參考文獻
1. EZBioCloud Help center. (2019, Feb). 16S rRNA and 16S rRNA Gene. Retrieved from https://help.ezbiocloud.net/16s-rrna-and-16s-rrna-gene/
2. Center for Microbial Ecology at Michigan State University. (2016, Sep). RDP Announcements. Retrieved from https://rdp.cme.msu.edu/
3. SILVA. (2019, Dec). Retrieved from https://www.arb-silva.de/
4. Second Genome, Inc. (2013). The Greengenes Database. Retrieved from https://greengenes.secondgenome.com/
留言列表