NCBI、GenBank等序列資料庫的開放性使許多人的研究如虎添翼,特別是那些早被定過千千萬萬條序列的模式物種,各種基因的序列、註解與表現量資訊皆可信手拈來。反之,以往非模式物種的研究者卻常常必須使用痛苦指數很高的工具如degenerate PCR除草開路,或是在經費限制下使用表現序列標幟(Expressed sequence tag, EST)取得所需的序列資源。

 

但EST library的資訊量依舊有限,雖然能比較部分基因表現量的差異,卻會忽略掉許多表現量較少的基因。現在,你能選擇使用次世代定序儀建造自己的transcriptome sequence database,讓所有有興趣的序列信手拈來。有篇文獻正好說明這麼做的好處。

20120828_pic1

作者的目的是得到沼澤椎實螺Lymnaea stagnlis中樞神經系統的transcriptome sequence data,以了解該學術社群所關心的種種,使用的策略為transcriptome shotgun assembly(TSA)。他們收集L. stagnlis80隻螺的中樞神經系統的mRNA一起定序。定序儀為IlluminaGAIIx,使用single read的 flow cell,定序長度為每個reads 100-bp。上機前下了120 µl 濃度40 nM的cDNAlibrary,得到80M條左右的reads,經程式篩選後大概有20M條reads可供assembly。

20120828_pic2    20120828_pic3  

L. stagnlis和它那方便觀察的中樞神經系統(www.wikipedia.com photo by Dr. Lars Peters(left) Z-P. Fenget, et al.(right)

定序結果出來後,作者測試5種不同的de novo assembly 程式,包括ABySSVelvetOASESTrinity以及Rnnotator的序列組合效益,在比較經組合所得的contigs的平均長度、N50長度後,ABySSVelvet的資料被淘汰了(contigs長度太短,用已知序列去 blast 組合完的序列可能出現對不齊的狀況,作者在討論說這兩個程式本來是拿來做genome de novo assembly的,所以出現這種狀況也是情有可原,分析辛酸的)。接著,由於作者也想做 gene ontology (GO)的分析,在評估variants數量後,他們選擇使用variants數目較少的Rnnotator輸出結果,取得11萬條non-redundant transcript,總長為76 Mb左右。

20120828_pic4   

5種de novo assembly程式的組裝結果比較 轉貼自原文


20120828_pic5

採用Rnnotator assembly後所得到的結果 轉貼自原文

 

重頭戲來啦,究竟燒了這次錢能得到什麼有趣的結果呢?將結果拿去invertebrate protein database blast後發現,所有blast結果只有1.6% 的基因對應到軟體動物。表示這群生物還是研究的藍海啊,根本沒有幾個人用類似的尺度做過,先搶先贏!

20120828_pic6  不只如此,將這次得到的序列們拿去比對現成的L. stagnlis螺腦EST 資料發現,過去的資料僅能比對到5% 左右的新定出序列,表示有很多基因是在這個物種第一次發現。更甚者,有些與神經調節機制有關的基因如tyrosinhydroxylate (TH),、dopa decarboxylase (DDC)與tyramine beta hydroxylate (TBH)是第一次在軟體動物門被發現。

 20120828_pic7

比較以往EST序列資料庫與經由TSA所得序列的結果 轉貼自原文。

 


Reference:

1. Hisayo Sadamoto, Hironobu Takahashi, Taketo Okada, Hiromichi Kenmoku, Masao Toyota, and Yoshinori Asakawa  De Novo Sequencing and Transcriptome Analysis of the Central Nervous System of Mollusc Lymnaea stagnalis by Deep RNA Sequencing. PLoS One. 2012; 7(8): e42546.

2. Feng ZP, Zhang Z, van Kesteren RE, Straub VA, van Nierop P, Jin K, Nejatbakhsh N, Goldberg JI, Spencer GE, Yeoman MS, et al.  Transcriptome analysis of the central nervous system of the mollusc Lymnaea stagnalis. BMC Genomics. 2009; 10:451.


 

Yourgene Bioscience  

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()