作者:金漢強/有勁生物科技

 

從第一台商業應用的次世代定序儀器推出至今已有十餘年;此期間的次世代定序技術與應用持續蓬勃發展。而次世代定序應用服務,尤其是臨床上的,應該如何進行呢?最近一期《基因體與人類遺傳學年度回顧期刊Annual Review of Genomics and Human Genetics》1提供我們如下的建議。

 

 

品質控制

 

美國醫學遺傳與基因體學會(ACMG)與美國疾病管制與預防中心(CDC)針對次世代定序系統與應用有提出指導原則。這些原則依據美國臨床實驗改進法案,針對測試驗證、品質控管、能力試驗與標準物質等項目都提出建議2。而在臨床微生物與公共衛生領域,次世代定序也有諸多應用,包括全基因體定序、微生物組分析、總體基因體學、轉錄體分析、感染病診斷、探索病原與公共衛生調查等等。關於這些領域的作業原則,在臨床微生物學雜誌2016年發表的一篇文獻中也有深入討論。3

 

ACMG與CDC建議實驗室用在檢測服務上的所有不同定序平台、不同測試項目,不同資訊分析流程及確認性測試方法如Sanger定序等,皆需驗證。品管需要使用具備足夠基因體複雜性的合適品管物質來進行。驗證時需針對這些品管物質,分析比較其品管分數、深度、均一度、圖譜序列比對品質、GC偏差。為確認測試的可靠性,需使用合適的檢體,針對測試項目進行能力試驗。這些檢體可以是與疾病相關或是有自然發生變異點位的檢體。若有序列低覆蓋性、不存在的變異點位、有疑義的變異點位等等限制,皆需列在報告中並後續追蹤。倘若有附帶的發現,必須進行確認流程,在記入報告前要小心檢視其是否的確與病人疾病表現狀況有關。

 

報告中,目標區域定序組合(targeted NGS panel)應該只解讀已有足夠科學證據證明與病人疾病相關的基因,同時須註明目標富集(target enrichment)的方法與限制。針對基因體高變異性的疾病,可考慮使用外顯子組定序或全基因體定序,以取得更充分的資訊;但仍需在報告中指出並說明放入分析的疾病相關基因與其覆蓋深度等資訊。除此之外,整體測試的表現報告也應包含分析靈敏度(anlytical sensitivity)、偽陽性與偽陰性比率、預測臨床靈敏度、測試強健度與再現性等資訊。

 

 

序列比對

 

序列比對應使用兩種以上的比對工具來進行。比對需針對全基因體區域,以避免錯誤比對(例如因為吸引到錯誤的核酸片段)。針對插入或刪除類型的變異,建議在全基因體區域比對完後再增加區域性的序列比對,以得到較正確的結果。CDC也建議使用區域比對來移除PCR重複序列並再次校正鹼基判定。此外,使用多種比對工具與參數設定也對變異點位的確認有所幫助。另,還可藉由「標準物質」例如美國國家標準技術研究所(NIST)提供的RM9398標準品,來衡量全基因定序時對於序列比對與變異判別的正確性。

 

 

標準序列

 

由於標準序列會定期更新,在進行序列比對時,需要標註該標準序列加入資料庫的日期與標準物質的檔案版本。相關分析工具的所有變更皆需明列版本,便於他人追溯。此外,由於次世代定序可提供比傳統培養法更快速且更靈敏的檢測,所以次世代定序也越來越被廣泛使用在感染源的確認上。致病原的分析需要各種致病菌的基因體標準序列,而美國國家生物科技資訊中心(NCBI)所發展與維護的標準序列資料庫,便可提供許多分類豐富且具備良好註解的序列資料。對於感染性病菌,美國食藥署(FDA)則有管制級微生物序列資料庫,提供許多臨床與環境相關的微生物序列資料。美國國家標準技術研究所也有食品安全與臨床微生物相關標準品的豐富蒐集,提供多樣的大小基因體、質體與GC內容給實驗室使用。

 

 

基因與變異點位的註解

 

關於基因註解,實驗室需發展出可以自動區別良性變異與稀少有害變異的方法。目前許多資料庫都有提供群體頻率資料,像是dbSNP(https://www.ncbi.nlm.nih.gov/projects/SNP)資料庫、美國國家心肺與血液研究所的外顯子組定序計畫(US National Heart, Lung, and Blood Institute's Exome Sequencing Project (http://evs.gs.washington.edu/EVS)、Broad Institute的外顯子累積聯盟(Broad Institute's Exome Aggregation Consortium; ExAChttp://exac.broadinstitute.org),以及International Genome Sample Resource (IGSR)的千人基因體計畫(1000 Genomes Project)。

 

實驗室在制定群體頻率的臨界值時,考量到特定人群的統計差異以及未被記錄、低穿透性基因、未被診斷的無表現型病患,建議採用大於理論最大值的數值來做為臨界值。使用資料庫時也需注意是否有錯誤分類的情形,例如把良性的分類成有害的。

 

變異點位的解讀方面,我們可先預設遺傳性疾病的變異點位都是稀少且與疾病高度相關(high penetration)的。實驗室應進一步建立基因與變異點位的篩選機制,按部就班的篩選方式加上彈性化的篩選標準便可以有效減少篩選的錯誤與偏差。在評估變異判別的表現時,則需要使用包含不同變異型態的不同來源樣品來進行。而同源序列(sequence homology)與重複序列的問題,則建議在全基因體比對後再增加局部區域重新比對來提高正確率。如果過程中附帶找到可能致病的基因與變異點位,但其與病人的臨床表現型態無關,則應過濾掉該變異,並依照ACMG與美國分子病理協會(Association for Molecular Pathology)的建議處理此類附帶發現的變異點位。在篩選過濾的過程中,可以考慮採用最小族群的等位基因頻率、對蛋白質結構與功能改變或RNA拼接改變進行預測、或是使用疾病變異點位資料庫,例如:人類基因變異資料庫Human Gene Mutation Database (http://www.hgmd.cf.ac.uk)、ClinVar (http://www.clinvar.com)、與線上人類遺傳資料庫Online Mendelian Inheritance of Man (https://www.ncbi.nlm.nih.gov/omim) 等。同樣地,使用這些資源時需考慮提供單位可能有因沒做好審查而帶來的偽陽性與偽陰性誤判風險;因此需小心確認變異點位是否與造成基因功能缺陷有關,即使有關,這樣的缺陷是否的確會改變病人的健康狀態,並確認這樣的改變是否與臨床表徵相關。

 

 

結語

 

在次世代定序技術越來越普遍的今日,使用次世代定序技術的臨床服務實驗室應該要參考上述各建議,謹慎評估測試項目的表現。由於在大量定序資料中有可能也會找到許多未充分註解或是新發現的變異,臨床實驗室若能與學術單位一同合作,將有助進一步確認變異的正確性。另一方面也建議各實驗室應將資料有效整合到資料庫中,一方面可確認變異判別的一致性,同時也可以擴充資料庫的豐富性。

 

 

 

參考文獻

  1. 1. Chakravorty, S.and Hegde, M. (). Gene and Variant Annotation for Mendelian Disorders in the Era of Advanced Sequencing Technologies. Annu Rev Genomics Hum Genet. 2017 Aug 31; 18:229-256.
  2. 2. Rehm, H.L., et al.. ACMG clinical laboratory standards for next-generation sequencing. Genet Med. 2013 Sep; 15(9):733–747.
  3. 3. Gargis AS, Kalman L, and Lubin IM. Assuring the quality of next-generation sequencing in clinical microbiology and public health laboratories. J. Clin. Microbiol. 2016 Dec; 54(12):2857-2865.

 

 

 

官網用CC創用_SA.png

文章標籤
創作者介紹
創作者 YourGene 的頭像
YourGene

有勁的生技資訊

YourGene 發表在 痞客邦 留言(0) 人氣()