作者:劉祥欽/有勁生物科技
血液中會有一些大小在150~200 bp左右,被稱為cell-free DNA (cfDNA) 的小片段游離DNA,它們是來自於細胞凋亡的過程中尚未被完全降解的殘餘DNA。當身體中有癌症組織不斷增長時,部分癌細胞也會因為免疫系統的對抗而凋亡,進而釋放出一些游離的DNA到血液中 (circulating tumor DNA, ctDNA)。組織的癌化常常是因為不斷累積的基因突變所造成的不可逆反應,如果可以辨識出這些可能導致癌化的突變點位,那我們就有機會提早發現癌症與監測治療的效果。
現在,次世代定序 (next generation sequencing, NGS) 為此提供了可能的解方。從大量的cfDNA序列資料中,我們可以從中提取出含有突變點位的序列,但是因為在癌症病程的早期ctDNA所佔的比例通常很低,因此能正確檢測到含量多低的ctDNA會是檢測能否成功的關鍵所在。一般來說,要定出佔2.5%的ctDNA會需要1000倍以上的定序深度。要在特定區域達到這樣的定序深度,可使用hybridization capture或PCR放大的方式來完成。因為有只須少量DNA及實驗流程相對簡單的好處,PCR放大的方法是較被偏好的一種方式。然而在放大過程中,無可避免的會產生一些PCR造成的錯誤 (每個base因為PCR polymerase所造成的錯誤率大約10-6),此外,定序時所導入的錯誤率更高,例如Illumina MiSeq系統會有每個base約0.01到0.1的錯誤機率。低佔比加上高錯誤率大幅提高了辨識變異ctDNA的難度。
為了解決這樣的問題,每一條DNA在被放大之前就要加上一段可供辨識與複製,被稱為分子條碼 (molecular barcode)的獨特序列,如此, 因為PCR或定序而產生的錯誤就可以被辨識與排除,而計算分子條碼的數量亦可估計出偏差較少的變異ctDNA比例。目前,市面上已經有一些可以用來製備定序用DNA文庫 (library) 的產品,但導入分子條碼的產品屈指可數,其中,QIAGEN的QIAseq™ targeted DNA panel是一個可使用在Ion Torrent或Illumina這兩個主流系統的產品。它在製備library時,會先將帶有分子條碼的adapter接上任意cfDNA的5’端位置,如此每一條cfDNA皆會有自己的一組分子條碼,附帶一提,這個分子條碼由12個任意鹼基對組成,因此可標記412 (16,777,216) 條cfDNA。接好後,再用設計好針對欲定序區域特定序列的引子與針對adapter上固定序列的引子用PCR放大,最後,再用一組universal primer導入sample index及進一步放大以供定序 (https://goo.gl/771N8Z, 圖一)。
QIAGEN不僅僅提供文庫製備所需的試劑,亦建置了一套名為smCounter的線上分析軟體,這套軟體可以讀取分子條碼並用以計算single nucleotide variants (SNV) 及short insertion and deletions (indel) 所佔的比例。
針對一些偽陽性的分析結果,smCounter有提供多重濾網讓使用者做進一步篩選。測試報告顯示1(圖二),smCounter在只有1% variants的條件下,針對coding region 的TPR (True Positive Rate) 及PPV (Positive prediction value) 都在九成以上的水準。
正確偵測微量DNA變異對癌症病患早期診斷及體細胞突變偵測的潛力是被高度期許的,因此,像QIAGEN這樣的產品或許可以幫助相關研究及診斷方法的提升,這是我們可以期待的。
參考文獻:
1. Xu, C., Nezami Ranjbar, M.R., Wu, Z., DiCarlo, J. & Wang, Y. Detecting very low allele fraction variants using targeted DNA sequencing and a novel molecular barcode-aware variant caller. BMC Genomics 18, 5 (2017).
留言列表