作者:李覺白/有勁生物科技

 

疾病表現型 (disease phenotype)所對應的基因型 (genotype),對科學家了解疾病致病機制及生物體代謝路徑來說是很重要的資訊。隨著基因體技術的進步,不同解析度下被找到的變異基因型與疾病表現型的關聯快速大量被發現,並登記在生醫資料庫中供使用者查詢。本篇簡介近二十多年來應用在基因型辨識的技術及目前常使用到的基因型對應疾病表現型資料庫。

 

過去二十多年來,基因體基因型的探索從最早的染色體組型辨識,演進到近十年的NGS定序技術,讓我們得於今日以高通量檢視基因體上的單一核苷酸基因型,如圖一所示。

 

 

圖一基因體探索技術近二十多年來的演進

171206-1.png

1990年代的G-banding讓科學家得以辨識整個染色體的組型 (當時的解析度低於1,000萬個核苷酸)。1990後期出現使用探針的螢光素標記方法 (解析度約5百萬~1千萬個核苷酸)。2000年代數以萬計的寡核苷酸探針染色體晶片出現 (解析度約1千 ~1百萬個核苷酸)。近十年的NGS定序,解析度達到可分辨單一核苷酸的精確程度。圖片來源:Northcott, P.A., et al. Neurosurgical focus 2010 Jan; 28(1): E6.

 

 

早期的G-Banding已經幫我們指出染色體變異的基因型與疾病表現型的關聯例子,舉例來說唐氏症是因為染色體21號多出一條,如圖二所示。隨後的FISH技術也有相關的應用:譬如患有慢性骨髓性白血病的病人有很高比例是由於染色體9號和22號發生互換,在斷點區域產生BCR-ABL融合基因導致,使用FISH便可辨識病人是否帶有BCR-ABL的基因型,如圖三所示。

 

 

圖二唐氏症患者的G-banding結果

171206-2.png

G-banding結果顯示唐氏症患者的染色體21號有三條 (藍色圈所示)。圖片來源:National Human Genome Research Institute

 

 

圖三、慢性骨髓性白血病病人BCR-ABL融合基因的FISH技術辨識結果

171206-3.png

圖中綠色光點代表BCR基因,紅色光點代表ABL基因, BCR-ABL融合基因則出現了黃色的光點。圖片來源:Sysmex Europe (https://www.sysmex-europe.com/academy/library/image-gallery/bcr-abl-fusion-gene-detected-by-fluorescence-in-situ-hybridisation-1286.html)

 

 

近十年NGS的高通量DNA定序應用於全基因體定序、全外顯子體定序、目標區域定序,更幫科學家找出了許多與疾病相對應的基因型資訊,且解析度並不侷限在基因型的變異,如圖四所示。

 

 

圖四、NGS技術可應用偵測的變異基因型

171206-4.png

應用NGS技術可偵測的變異基因型,包含最小解析度的點突變、微缺失或微插入、序列拷貝數變異及染色體易位。圖片來源:Meyerson, et al., Nature Reviews Genetics 2010 Oct; 11(10): 685-696.

 

 

以上不同技術所找到的關聯數據持續不斷地被更新到常見基因型的對應疾病表現型資料庫中。以NCBI維護的Clinvar資料庫為例:變異資訊由全世界各實驗室發現及提供,2014年12月到2016年3月,平均每個月增加6,000筆,如圖五所示。

 

 

圖五、Clinvar資料庫變異資訊提交數目統計

171206-5.png

2014年12月到2016年3月,提交至Clinvar資料庫的變異資訊數目劇增,平均每個月有6,000筆新資訊出現。圖片出處:Genomeweb;原始資料來源:http://www.ncbi.nlm.nih.gov/clinvar/

 

 

目前全球有非常多不同類型的基因型對應疾病表現型資料庫,在這分享比較常見的知名資料庫;讀者如果在研究上需要搜尋基因型對應疾病表現型的資訊,可參考列表一的統整資訊。

 

 

列表一、全球紀錄疾病表現型與基因型關聯資訊的常見資料庫

171206-6.png

列表來源:Brookes, A.J., and Robinson, P.N. Nature Reviews Genetics 2015 Dec.; 16(12): 702-715.

 

 

筆者較常使用的資料庫包括 (1) NCBI維護的Clinvar,資料庫提供各種疾病 (不侷限於癌症或遺傳疾病)的資訊。(2) 英國Wellcome Trust Sanger Institute維護的Decipher資料庫,此資料庫對於微小缺失症候群的資訊收錄算完整。(3) COSMIC資料庫,也是由英國Wellcome Trust Sanger Institute維護,對癌症研究人員來說絕對是經常搜尋的資料庫。(4) NCBI維護的OMIM資料庫,此資料庫收錄了許多與遺傳疾病及罕見疾病有關的資訊,多數資訊以文獻探勘的方式記錄。希望這些資訊可幫助讀者更了解基因型與對應疾病表現型的關聯,並提供科學研究人員找到適合的資料庫以進行基因型的註解。

 

 

參考文獻

1. Northcott, P.A., Rutka, J.T., and Taylor, M.D. "Genomics of medulloblastoma: from Giemsa-banding to next-generation sequencing in 20 years." Neurosurgical focus 2010 Jan.; 28(1): E6.

2. Meyerson, M., Gabriel, S., and Getz, G. "Advances in understanding cancer genomes through second-generation sequencing." Nature Reviews Genetics 2010 Oct.; 11(10): 685-696.

3. Brookes, A.J., and Robinson, P.N. "Human genotype-phenotype databases: aims, challenges and opportunities." Nature Reviews Genetics 2015 Dec.; 16(12): 702-715.

 

 

官網用CC創用_SA.png

 

文章標籤
創作者介紹

有勁的生技資訊

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()