定序的技術不僅讓英國科學家 Frederick Sanger 於諾貝爾化學獎梅開二度外,亦深深奠定往後次代定序 (Next- generation sequencing, NGS) 的基礎,此項技術將生物、化學與電腦運算三者整合為一,徹底改變多樣化的基因組應用,更帶來劃時代進展,其目的無非是將生物體內大量的有字天書作趨近於完美的詮釋。為了因應大量序列數據的辨認,因此發展出條碼系統(Barcode system),拜此辨識概念的引入,即允許混合多數樣品並於同時間進行大量定序(Bystrykh, 2012),本文主要探討條碼對於次代定序的貢獻,從日常生活的有形化乃至生技層面的無形化,比比皆是,隨處可尋條碼的蹤跡,可見其對於人類生活息息相關,以下分三部分做詳細介紹:

壹、日常生活應用

    日常生活中常見的有形條碼,舉凡商業應用,如:物流管理的識別系統,超商貨品盤點的便利性與其結帳的效率性,再再都顯示條碼的辨識功能強大。條碼不僅即時性高且錯誤率低,更可連結電腦,達到系統性的自動化整合管理,亦是一種全球統一化的圖像語言。近年來,更在智慧型手機的意識形態裡,將商品、餐飲美食與旅遊的廣告宣傳等,取代成二維條碼的黑白小方塊圖像(如圖一所示,擷取自Liu et al., 2012),以手機掃描條碼圖示,輕鬆得到豐富又經濟實惠的資料訊息,達到秀才不出門能知天下事的便利生活。

20121213_pic01

圖一、 Examples of the seven different types of 2D barcodes

 

貳、生物分類應用

    何謂無形的生物條碼?科學家將解碼的 DNA 序列,從中尋找跨物種皆共同擁有且專一的特定基因區域,作為鑑別物種的分類依據(如:植物的葉綠體或動物的粒線體),像位於粒腺體中廣為學者應用的,即全長 650 bp 的細胞色素C氧化酶基因(cytochrome c oxidase 1, co1),此區域已被證實適用於多種真核生物的鑑別(如:鳥類、魚類、昆蟲、真菌、哺乳類與各種節肢動物),那麼條碼長度是否會左右本身的鑑識度?Meusnier等學者研究發現條碼長度確會影響物種間之鑑別度(圖二),該團隊更從 co1 基因中找出足以媲美全長的代表區域,稱 mini-barcode,其除可更有效增加 PCR 成功性外,亦降低尋找生物條碼的困難度(圖三)Meusnier et al., 2008)。另外,更有學者利用co1基因之mini-barcode生物條碼結合NGS進行環境生物的監測,有效識別河流內棲底生物 (如:蜉蝣目與毛翅目水生昆蟲) 族群之種類與其分布的區域,亦初步建立高通量之環境生物監測模式 (Hajibabaei et al., 2011)。除此之外,結合生物條碼的應用,可用來進行一些加工食物製品或藥品其物種製成的成份鑑定,甚至是追朔考古化石的物種,此部分於之前『利用NGS平臺揭開中藥的神秘面紗』與『藉由NGS的技術穿梭古今中外』二文內容有詳細闡述。

20121213_pic02

圖二

 

20121213_pic03

圖三

 

    關於植物方面,由於植物演化出特別的胞器-葉綠體,因此對其條碼之尋找較著重於葉綠體,Hollingsworth 等學者研究歸納出許多適用的植物條碼區域及其鑑別之植物種類,其應用層面包羅萬象,如:食品成分來源鑑定、植物入侵種鑑定、中草藥組成鑑定等…(表一) (Hollingsworth et al., 2011)。有此可見特定區域的條碼辨識,所涉效益影響層面,確與生活息息相關。

表一、Applications of DNA barcoding in plants.

20121213_pic04  

 

叁、生物技術應用

    DNA 條碼科技的使用,誠如上述,大部分皆利用於物種鑑定或發現,但如何將冗繁的無形DNA序列與有形條碼符號進行連結,方便於資訊的整合、儲存、辨識與檢索等處理,有鑑於此構想,Liu 等學者在 2012 年發表一篇論文,將 DNA 條碼序列以二維形式的 quick response (QR) 條碼進行對應轉換 (圖四),產生一個專屬該物種的QR身分證條碼,應用於生物資料庫的建檔及檢索,便於進行物種序列之間的搜尋與比較,此舉也提升資料儲存的品質(Liu et al., 2012)

20121213_pic05

圖四

   另一方面,對於 NGS 樣品製備技術而言,如何給予每個不同待測樣品的身分條碼,而達到多樣並行的定序能力?無非是利用鹼基之間排列組合的機率,並且搭配生物資訊運算的誤差校正,產生一些可靠的參數進而加以運用。那麼每個樣品之辨別條碼,需幾個 DNA 鹼基才最合適?其設計概念與電腦解碼之錯誤校正率有極大關聯性。以Illumina公司的條碼系統而言,大致上利用6個鹼基的排列 ( DNA四種ATGC鹼基,共46種組合 ) 所產生的最適組合,作為特定序列的標籤 (IndexBarcode ),之所以選定特定的鹼基長度,其主要目的是避免過長的 Index 序列,其占據定序的空間與時間。最終從4096個組合中,選出僅 2448 種條碼為商業用途所用,其中所涉及到的編碼方式,主要是利用漢明碼 (Hamming code) 編碼原則進行設計 (Bystrykh., 2012),期望在混合多種定序樣品的反應空間裡,能夠正確無誤的判別出每個待測樣品的身分。另者,衍生出之雙條碼系統,其設計基礎亦建立此概念上。因此,綜觀而言,條碼 ( barcode ) 對於次代定序或日常生活的應用,拜日新月異的資訊科技所賜,其影響力不僅無遠弗屆,更可做為一種跨越國與國之間的共通文字圖騰。

 

 

參考文獻:

  1. Meusnier, I., Singer, G., Landry, J., Hickey, D., Hebert, P. and Hajibabaei, M. (2008) A universal DNA mini-barcode for biodiversity analysis. BMC Genomics 9214.
  2. Bystrykh, L.V. (2012) Generalized DNA barcode design based on Hamming codes. PLoS ONE7(5)e36852.
  3. Hollingsworth, P.M., Graham, S.W., and Little, D.P. (2011) Choosing and using a plant DNA barcode. PLoS ONE 6(5): e19254.
  4. Hajibabaei, M., Shokralla, S., Zhou, X., Singer, G.A.C. and Baird, D.J. (2011) Environmental BarcodingA Next-Generation Sequencing Approach for Biomonitoring Applications Using River Benthos. PLoS ONE 6(4): e17497.
  5. Liu, C., Shi, L., Xu, X., Li, H. and Xing, H. (2012) DNA Barcode Goes Two-Dimensions: DNA QR Code Web Server. PLoS ONE 7(5): e35146.

 

 

 

 

Yourgene Bioscience  

 

 

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()