在做Metagenomics分析時,大家很容易遇到的問題,便是專門資料庫的不足以及想要跟過去的研究比較時的困難性。在這裡我們介紹給大家一個Metagenomics資料庫EBI Metagenomics (EMG) (Figure 1)

1220-1.png

Figure 1. EBI Metagenomics website

EMG和歐洲核酸資料庫(European Nucleotide Archive, ENA)都是屬於歐洲生物資訊研究所(European Bioinformatics Institute, EBI)下的資料庫。EMG採用了和ENA一樣的數據提交(data submission)的基礎與介面,讓使用者更容易上傳,可接受的定序平台包含Roche 454Ion TorrentIlluminaOxford Nanopore,且所上傳之資料也可以和ENA原有的資料互通,提升了資料挖掘(data mining)的可行性。並且EMG開發了一套自有的metagenomics分析流程,所有上傳至EMG的資料,都可套用這個流程分析,使得不同的研究計畫甚至是不同資料格式(e.g. metagenomic versus metatranscriptomic)的結果,均可以互相比較。若使用者想比較自己的資料以及過去其他上傳者公開的資料,也可藉由這套固定的分析流程,得到比較分析後的結果。

1220-2.png

Figure 2. EMG analysis pipeline.

上圖為EMG分析流程的示意圖(Figure 2),此流程更新於20161月,目前已開發到第三版。第三版流程和前幾版主要的差異是在使用HMMER (v3.1b)軟體來找出ncRNA,並將資料區分為「不含ncRNA」以及「16S rRNA」兩部分。「不含ncRNA」的部分後續會進行ORF預測,並且使用InterProScan進行功能分析(Functional analysis);「16S rRNA」的部分則會使用QIIME並搭配GreenGenes資料庫進行分類分析(Taxonomic analysis)

EMG資料庫包含的資料原本是以WGS (whole-genome shotgun) metagenomic資料為主,但隨著現在16S rRNA的定序與分析增加快速,以及許多的Human microbiome projects,現在EMG資料庫也包含了amplicons的定序分析結果。截至目前為止,EMG已收錄了72,945筆資料組合,其中包括了781筆公開的計畫以及154筆未公開的計畫;並且已有11,779metagenomes53,853amplicons889metatranscriptomes74筆組裝的分析結果。

除了資料龐大以外,EMG的使用介面也非常容易上手,使用者可以根據生物群落(bioms)來瀏覽不同的定序分析資料,或是根據最新的研究計畫來搜尋。另外針對已公開的定序分析結果,也可以直接選取兩筆不同的資料,進行兩兩間的功能性比較分析(Figure 3)。並且針對每筆分析結果,也會將功能性和分類分析的結果整合成summary files供使用者下載,讓使用者可以更方便的評估分析結果。

1220-3.png

Figure 3. EMG analysis pipeline.

綜合以上的特點,對於初入門想要分析metagenome的朋友來說,EMG是一個操作簡單且非常容易使用的介面。在沒有自己的定序資料之前,也可以上去搜尋過去其他使用者的資料,進行一些事前分析。而且EMG資料庫或包含的資料組,目前正在快速增加中,尤其是其中包含了兩個大的海洋微生物研究計畫 Ocean Sampling DayTara Oceans,這兩個計畫所定序的微生物體,除了原核之外更包含了大量的真核與病毒,此種資料對於想要研究在微生物群落中不同物種的相互生存關係,會有非常大的幫助。

Reference:

1. https://www.ebi.ac.uk/metagenomics/

2. Alex Mitchell, Francois Bucchini, Guy Cochrane, Hubert Denise, Petra ten Hoopen, Matthew Fraser, Sebastien Pesseat, Simon Potter, Maxim Scheremetjew, Peter Sterk and Robert D. Finn (2015). EBI metagenomics in 2016 - an expanding and evolving resource for the analysis and archiving of metagenomic data. Nucleic Acids Research (2015) doi: 10.1093/nar/gkv1195

創作者介紹

有勁的生技資訊

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()