在 RNA 樣品製備 NGS 定序上機的前端作業方面,Illumina 所採用的方式是使用 Oligo-dT 來篩選出帶有 PolyA tail 的 mRNA,然而這種方式面對品質較差的 RNA 時,將會受到限制,並且一些不帶有 PolyA tail 的 mRNA,將無法被觀察到,因此有其他廠商使用其它的策略發展新的製備方式,如:NuGEN Ovation,它可以使用少至 500 pg 的 RNA 來完成 library,並且即使 RNA 品質較差,依然可以適用。
圖一、 NuGEN 開發Ribo-SPIA 技術轉成雙股 cDNA
NuGEN 開發的Ribo-SPIA 技術,使用了特殊的引子,針對 mRNA 轉換成第一股 cDNA,再利用引子 5’ 端專一的序列,進行互補股的合成,隨後在 RNAseH 與 polymerase 酵素作用下,最終獲得約 5 μg 的雙股 cDNA (見圖一)。
隨著 library 製備的方法不同,會產生以下幾個疑問:
1. 這是否會影響基因表現量的差異?
2. 是否會影響 SNV (single nucleotide variation) 的偵測?
3. 在分析 non-coding RNA 時,NuGEN 是否比 poly-A 的製備方式來的優勢?
以 8 種不同處理的 RNA 樣品,分別使用Illumina 及NuGEN 的 protocol 製備後,同樣在 Illumina 平台上定序,並分析結果統計資料,Illumina 的 Mapping rate (90%) 較 NuGEN 高 (75%),而被偵測到的基因種類數來說,Illumina 較 NuGEN 多出 12-20%,而在這兩種製備方式所定序出的基因,使用 RPKM 分析後呈現表現量,PolyA 的 protocol 相較於 NuGEN 的基因表現趨勢來的高 (圖二),除此之外,兩種製備方式所定序獲得的基因數,在 PolyA protocol 有2160 個基因無法在 NuGEN 中被找到,相反的,在 NuGEN 中有376 個基因無法在 PolyA 中被找到,這個結果顯示了 PolyA protocol 的基因多樣性是比較好的。
圖二、 (左圖) RPKM normalize 後 poly-A protocol (.pa) 在八個樣品間平均基因表現量較 NuGEN protocol (.ng) 為高。(右圖) 以BSO19B 樣品為例,各基因表現量傾向用 poly-A protocol (.pa) 較 NuGEN protocol (.ng) 高。
偵測 RNA-seq 資料中的 SNVs 在某些方面是具有意義的,例如:腫瘤樣品,也因此製備方式的不同若影響 SNVs 的判讀,有可能對結果的解釋有不一樣的影響,在 PolyA protocol 方面,平均每個樣品有 30,000 個 variants 被觀察到,但在 NuGEN 中卻有 PolyA 結果的 5-6 倍 variants 被觀察到,而將它們互相比較後,發現相同 SNVs只有 30% (圖三),若更進一步研究,可發現兩種 library 的 SNVs 在 coding regions 的相似度極高,但在 intergenic 和 intragenic regions,NuGEN library 的 SNVs 就比 PolyA 高出 23.5 (intergenic) 和 12.7 (intragenic) 倍 (圖四)。
圖三、NuGEN 比較 PolyA SNVs,結果發現相同 SNVs只有 30%。
圖四、在 intergenic 和 intragenic regions,NuGEN library 的 SNVs比 PolyA 高出 23.5 和 12.7倍
NuGEN protocol 相較於 PolyA protocol有一項潛在的優點,那就是NuGEN 可能能夠觀察到缺少polyA tail 的基因,為了查證這一點,將 command gene 拿掉後,兩種protocol 的 additional gene,polyA 有 7600 個對上 NuGEN 6900 個,polyA 較 NuGEN 明顯多出的基因大多屬於 coding protein、lincRNAs、antisense RNA (圖五、標示*者),相反的,NuGEN 大多屬於 pseudogenes、snRNA、snoRNA、mics RNA、miRNA (圖五、未標示*者)。另外,雖然在 lincRNAs 的種類發現上,polyA 較 NuGEN多,但是若是研究資料庫尚未知的 non-coding RNA 時,NuGEN protocol 具有較多 “Novel” 的 lincRNA。
圖五、PolyA (.pa) 及 NuGEN (.ng) protocol 的 additional genes 種類比較
使用 NuGEN 製備 NGS RNA library 有著 input 門檻低、可使用降解 RNA的優勢,而這是 polyA 的製備方式的弱點,但當 RNA 品質同樣優良時,研究基因種類及表現量差異, NuGEN 的製備方式可能會損失一些基因,更進一步研究 SNVs、fusion gene、alternative splicing 時,由於 coverage 的不平均更有可能影響結果正確性的判讀,因此研究學者們選擇製備流程時,更需要好好的判斷適合自己樣品及實驗的方式,才能獲得最貼近事實的實驗結論。
Reference:
Sun Z, Asmann YW, Nair A, Zhang Y, Wang L, et al. (2013) Impact of Library Preparation on Downstream Analysis and Interpretation of RNA-Seq Data: Comparison between Illumina PolyA and NuGEN Ovation Protocol. PloS one 8: e71745.
留言列表