定序的技術不僅讓英國科學家 Frederick Sanger 於諾貝爾化學獎梅開二度外,亦深深奠定往後次代定序 (Next- generation sequencing, NGS) 的基礎,此項技術將生物、化學與電腦運算三者整合為一,徹底改變多樣化的基因組應用,更帶來劃時代進展,其目的無非是將生物體內大量的有字天書作趨近於完美的詮釋。為了因應大量序列數據的辨認,因此發展出條碼系統(Barcode system),拜此辨識概念的引入,即允許混合多數樣品並於同時間進行大量定序(Bystrykh, 2012),本文主要探討條碼對於次代定序的貢獻,從日常生活的有形化乃至生技層面的無形化,比比皆是,隨處可尋條碼的蹤跡,可見其對於人類生活息息相關,以下分三部分做詳細介紹:
壹、日常生活應用
日常生活中常見的有形條碼,舉凡商業應用,如:物流管理的識別系統,超商貨品盤點的便利性與其結帳的效率性,再再都顯示條碼的辨識功能強大。條碼不僅即時性高且錯誤率低,更可連結電腦,達到系統性的自動化整合管理,亦是一種全球統一化的圖像語言。近年來,更在智慧型手機的意識形態裡,將商品、餐飲美食與旅遊的廣告宣傳等,取代成二維條碼的黑白小方塊圖像(如圖一所示,擷取自Liu et al., 2012),以手機掃描條碼圖示,輕鬆得到豐富又經濟實惠的資料訊息,達到秀才不出門能知天下事的便利生活。
圖一、 Examples of the seven different types of 2D barcodes
貳、生物分類應用
何謂無形的生物條碼?科學家將解碼的 DNA 序列,從中尋找跨物種皆共同擁有且專一的特定基因區域,作為鑑別物種的分類依據(如:植物的葉綠體或動物的粒線體),像位於粒腺體中廣為學者應用的,即全長 650 bp 的細胞色素C氧化酶基因(cytochrome c oxidase 1, co1),此區域已被證實適用於多種真核生物的鑑別(如:鳥類、魚類、昆蟲、真菌、哺乳類與各種節肢動物),那麼條碼長度是否會左右本身的鑑識度?Meusnier等學者研究發現條碼長度確會影響物種間之鑑別度(圖二),該團隊更從 co1 基因中找出足以媲美全長的代表區域,稱 mini-barcode,其除可更有效增加 PCR 成功性外,亦降低尋找生物條碼的困難度(圖三)(Meusnier et al., 2008)。另外,更有學者利用co1基因之mini-barcode生物條碼結合NGS進行環境生物的監測,有效識別河流內棲底生物 (如:蜉蝣目與毛翅目水生昆蟲) 族群之種類與其分布的區域,亦初步建立高通量之環境生物監測模式 (Hajibabaei et al., 2011)。除此之外,結合生物條碼的應用,可用來進行一些加工食物製品或藥品其物種製成的成份鑑定,甚至是追朔考古化石的物種,此部分於之前『利用NGS平臺揭開中藥的神秘面紗』與『藉由NGS的技術穿梭古今中外』二文內容有詳細闡述。
圖二
圖三
關於植物方面,由於植物演化出特別的胞器-葉綠體,因此對其條碼之尋找較著重於葉綠體,Hollingsworth 等學者研究歸納出許多適用的植物條碼區域及其鑑別之植物種類,其應用層面包羅萬象,如:食品成分來源鑑定、植物入侵種鑑定、中草藥組成鑑定等…(表一) (Hollingsworth et al., 2011)。有此可見特定區域的條碼辨識,所涉效益影響層面,確與生活息息相關。
表一、Applications of DNA barcoding in plants.
叁、生物技術應用
DNA 條碼科技的使用,誠如上述,大部分皆利用於物種鑑定或發現,但如何將冗繁的無形DNA序列與有形條碼符號進行連結,方便於資訊的整合、儲存、辨識與檢索等處理,有鑑於此構想,Liu 等學者在 2012 年發表一篇論文,將 DNA 條碼序列以二維形式的 quick response (QR) 條碼進行對應轉換 (圖四),產生一個專屬該物種的QR身分證條碼,應用於生物資料庫的建檔及檢索,便於進行物種序列之間的搜尋與比較,此舉也提升資料儲存的品質(Liu et al., 2012)。
圖四
另一方面,對於 NGS 樣品製備技術而言,如何給予每個不同待測樣品的身分條碼,而達到多樣並行的定序能力?無非是利用鹼基之間排列組合的機率,並且搭配生物資訊運算的誤差校正,產生一些可靠的參數進而加以運用。那麼每個樣品之辨別條碼,需幾個 DNA 鹼基才最合適?其設計概念與電腦解碼之錯誤校正率有極大關聯性。以Illumina公司的條碼系統而言,大致上利用6個鹼基的排列 ( DNA四種A、T、G、C鹼基,共46種組合 ) 所產生的最適組合,作為特定序列的標籤 (稱Index或Barcode ),之所以選定特定的鹼基長度,其主要目的是避免過長的 Index 序列,其占據定序的空間與時間。最終從4096個組合中,選出僅 24至48 種條碼為商業用途所用,其中所涉及到的編碼方式,主要是利用漢明碼 (Hamming code) 編碼原則進行設計 (Bystrykh., 2012),期望在混合多種定序樣品的反應空間裡,能夠正確無誤的判別出每個待測樣品的身分。另者,衍生出之雙條碼系統,其設計基礎亦建立此概念上。因此,綜觀而言,條碼 ( barcode ) 對於次代定序或日常生活的應用,拜日新月異的資訊科技所賜,其影響力不僅無遠弗屆,更可做為一種跨越國與國之間的共通文字圖騰。
參考文獻:
- Meusnier, I., Singer, G., Landry, J., Hickey, D., Hebert, P. and Hajibabaei, M. (2008) A universal DNA mini-barcode for biodiversity analysis. BMC Genomics 9:214.
- Bystrykh, L.V. (2012) Generalized DNA barcode design based on Hamming codes. PLoS ONE7(5):e36852.
- Hollingsworth, P.M., Graham, S.W., and Little, D.P. (2011) Choosing and using a plant DNA barcode. PLoS ONE 6(5): e19254.
- Hajibabaei, M., Shokralla, S., Zhou, X., Singer, G.A.C. and Baird, D.J. (2011) Environmental Barcoding:A Next-Generation Sequencing Approach for Biomonitoring Applications Using River Benthos. PLoS ONE 6(4): e17497.
- Liu, C., Shi, L., Xu, X., Li, H. and Xing, H. (2012) DNA Barcode Goes Two-Dimensions: DNA QR Code Web Server. PLoS ONE 7(5): e35146.
留言列表