作者:張家豪/有勁基因

 

  人類、細菌、病毒等基因體研究的大量基因資訊,該如何才能簡單明瞭地呈現出來呢?2009年,加拿大卑詩省癌症研究機構BCCA (The BC Cancer Agency)的生物資訊團隊在Genome Research上發表了一篇論文1,提供大家一個可以視覺化基因體序列相關數據的工具─Circos。Circos可以同時將直方圖、折線圖、熱圖等多種類型的圖表資訊整合在一起,以圓形圖像格式輸出。

 

  Circos這項工具推出至今已有十年,這段期間可以看到許多學者將其應用在基因體研究上;光是在Circos的官方網站1,2上,就收錄了393篇採用Circos繪製結果圖表的文獻。筆者在這裡將以2013年PLoS One的論文《A High-Dimensional, Deep-Sequencing Study of Lung Adenocarcinoma in Female Never-Smokers》3作為範例,從圓圈內層到外層一一敘述介紹(詳見圖一)。

 

  首先,此篇論文所繪製出來的Circos圓形圖,最外圈結構展開的是人類的染色體,其內部又有七層的展示圓圈(詳見圖二)。在最內層/第一層的圓形圖(Structural Variantion)上可以看到多組融合基因(Fusion gene)的染色體結構變異;橙色線條清楚連接的就是第15及22號染色體的MKL1-NIPA1融合基因。第二層圓圈(Copy Number Variation)顯示的是拷貝數變異,紅色折線標示出拷貝數有增加(copy number gains)的基因及拷貝數增幅,藍色折線標示拷貝數有減少(copy number losses)的基因及拷貝數減幅;可看到在1, 5, 8, 16, 19, 20, X染色體上的基因有拷貝數明顯增加的情形,1, 6, 9, 16, 17, 18, 19, 22染色體上則有基因拷貝數明顯減少的現象。第三層圓圈(mRNA expression)顯示mRNA的表現量,金黃色折線標示出mRNA表現量有上升的基因及增幅,橄欖色折線則代表mRNA表現量下降的基因及減幅。第四層圓圈(DEmiR)顯示microRNA有差異表現(differentially expressed microRNAs)的基因;紅色點代表表現量有上升的情形,綠色點代表表現量下降,列在此圖上microRNA有差異表現的基因共40個。第五層圓圈(DNA methylation)用暗橙色折線標示DNA甲基化情況有變多的基因及增幅,草綠色折線則標示DNA甲基化情況減少的基因及其減幅。第六層圓圈(somatic mutations)用紅色點標示出有發生體細胞突變的基因,此圖共標出了46個體細胞突變基因。另外,染色體根據所使用染色法的不同,會在染色體不同位置產生明暗相間的條狀帶紋;Circos是利用UCSC基因組瀏覽器(UCSC Genome Browser)提供的G染帶法(G-banding)染色資訊繪製而成4,在第七層圓圈所看到的深淺或明暗區段,就是染色體區帶(chromosomal cytobands)。

 

圖一、將基因體視覺化的Circos圓形圖

191023_1.jpg

圓圈從內層到外層分別標示出染色體基因的以下7種資訊:染色體結構變異(Structural Variantion)、拷貝數變異 (Copy Number Variation)、mRNA表現量(mRNA expression)、microRNA的差異表現(differentially expressed microRNAs)、DNA甲基化(DNA methylation)、體細胞突變(somatic mutations)、以及染色體區帶(chromosomal cytobands)。(圖片來源:Kim, S.C. et al. PLoS One. 2013 Feb; 8(2):e55596- e55603.)

 

 

圖二、圖一的局部放大圖

191023_2.png

藍色小圈紅色數字標示各層的層數編號。(圖片來源:Kim, S.C. et al. PLoS One. 2013 Feb; 8(2):e55596- e55603.)

 

 

  綜上所述,Circos不僅讓數據閱讀起來更加直觀,也能提高圖片的美觀度;只不過當所有資料都擺在一起呈現時,往往需要將圖片放大才能清晰地閱讀內容,如果缺乏導讀說明,就只會被視為一個漂亮的藝術品,缺乏實用性。另一方面,由於Circos是使用Perl語言開發的,需要先安裝好所需的模組之後,才能用指令模式進行操作,這一點就限制了其大眾化應用的可能性。除此之外,使用時還得注意需嚴謹地配置文件,儘管在官方網站有提供大量配置檔案的範例,供使用者將Circos的功能一步步展示出來,但這需要花費不少時間去學習。由於以上因素,Circos至今仍然只是少數人會使用的工具,令人深感遺憾!

 

 

參考資料

1. Krzywinski ,M. et al. Circos: an Information Aesthetic for Comparative Genomics. Genome Research. 2009 Sep; 19 (9) : 1639-1645. Retrieved from https://doi.org/10.1101/gr.092759.109

2. Circos. Circos Images in Scientific Literature. Retrieved from http://www.circos.ca/images/scientific_literature/

3. Kim, S.C. et al. A High-Dimensional, Deep-Sequencing Study of Lung Adenocarcinoma in Female Never-Smokers. PLoS One. 2013 Feb; 8(2):e55596- e55603. Retrieved from https://doi.org/10.1371/journal.pone.0055596

4. Circos. Drawing Ideograms. Retrieved from http://circos.ca/documentation/tutorials/ideograms/karyotypes/

 

 

thumbnail_官網用CC創用_ND_YH.png

arrow
arrow

    Yourgene Health 發表在 痞客邦 留言(0) 人氣()