RNA-Seq 雖然是這幾年發展的技術,但已經成為分析 transcriptome 的方法,可用來組裝 transcript ,發現 splicing variants 、 single-nucleotide variations 及 fusion genes 等,而 strand specific RNA 更可協助 transcript 組裝及 genome annotation 的正確性。 Lin Wang 等人在 2011 年發表在 PLoS ONE 期刊所發表的研究,提到如何做 strand specific RNA 的 Library construction、與 non-strand specific RNA protocol 比較,及協助證實 gene model 正確性,以下就做個介紹:
Library construction of Strand-Specific RNA-seq
Lin Wang 等人發展的 strand specific RNA-seq 的 Library construction 的方法(如下圖),與 Illumina 原廠所使用的方法差異性不大,只是在第二股 cDNA 合成時,使用 dUTP 取代 dTTP ,並在 Y-shaped Adapter 接上後,利用 uracil-DNA glycosylase (UDG)切除含 dUTP-marked strand。
Comparison to non strand-specific protocols
為了瞭解 strand-specific (SS) 與 standard non strand-specific (NSS) 的 Library construction 方式是否會影響基因表現的結果,研究者使用 2 周大的水稻幼苗的葉子當樣品,利用 GAII 各跑了 100 million reads , 35nt 的長度,並計算 2 個 Library construction 定序結果的 RPKM 值,兩者間呈現高度的相關(correlation coefficient, r= 0.987),如下圖:
Analyzing anti-sense alignments
儘管 mRNA de novo 組裝軟體的進步,但研究者提出水稻基因註解模式(annotated gene models)還是有些錯誤。將 Strand Specific RNA-seq 的 reads 進行 genome alignment (SS alignment),有 2 種 gene model (Os07g36080.1,Os07g36090.1);而 NSS alignment 的 gene model 只有 1 種 (Os07g36090.3),因此利用 Strand specific 方法可幫助證實 gene model 及基因表現量上的正確性。
研究者也透過 Strand specific 方法,發現許多 antisense reads 對到 transcript termini(就像 UTR 區域),這種現象已經發表在一些動物及酵母菌,認為可調控基因的表現,而此水稻研究是植物上的首篇實驗。另外,研究者推測可能是基因的兩端有較少的 thymine(T),造成許多 antisense reads 對上 transcript termini 。
Reference:
A Low-Cost Library Construction Protocol and Data Analysis Pipeline for Illumina-Based Strand-Specific Multiplex RNA-Seq.
Lin Wang; Yaqing Si; Dedow, Lauren K.; Ying Shao; Peng Liu; Brutnell, Thomas P. PLoS ONE; 2011, Vol. 6 Issue 10, p1-12
留言列表