目前分類:Transcriptom Sequencing (18)

瀏覽方式: 標題列表 簡短摘要

160527_1.png

近年來,應用NGS定序技術於RNA層面的研究,給予科學家全面性分析及定量生物體中的不同類型的RNA (例如:mRNA, long non-coding RNA, miRNA, rRNA..等)。進而讓我們更了解基因型 (Genotype)及表現型 (Phenotype)之間的關聯性。Monika Stefaniuk在2015年回顧了近幾年多個團隊使用RNA-Seq分析的研究成果,主要可分為三個面向,(1) Gene expression profiling (馬的基因表現譜);(2) Physiological state (馬的生理狀態) ;(3) Hereditary diseases (馬的遺傳疾病)

 

(1) Gene expression profiling (馬的基因表現譜)

YourGene 發表在 痞客邦 留言(0) 人氣()

多形性膠質母細胞瘤(GBM),又稱為Malignant astrocytoma, gradeⅣ astrocytoma 或Glioblastoma。是最常見且惡化性很高的原發性腦瘤,是死亡率最高的一種,有中央壞死和新生血管的特徵。所有年齡都有可能罹病,不過GBM好發於中晚年,男女發生的比率約為3:2。每年平均新增200~300案例,GBM佔所有顱內腫瘤約12~15%。雖然診斷和治療技術飛速發展,但手術預後狀況非常糟,容易對放療與化療產生抵抗性,腫瘤縮小的效果有限。病人多在診斷後一年內死亡(9~12 months)。單單只有手術治療,中期存活約僅有3-4個月;加上手術後放射治療,可延長至10個月。手術後放射治療及化療藥物Carmustine(BCNU),可將存活時間再延長一些至一年,不到5%的病患能存活5年以上。GBM的增殖是一個多步驟的過程,受到很多因子調控。控制細胞增殖、細胞死亡和遺傳穩定性有關的許多基因,這些基因的表現程度受到影響和改變。


微小RNA:MicroRNAs (miRNAs)是真核生物中廣泛存在的一種長約18到25個核酸的RNA分子,透過 miRNA 與 mRNA(message RNA) 的 3' UTR 區域結合,抑制轉譯作用或降解 mRNA來降低基因的表現,達到調控基因表達的目的。許多研究推論miRNA可能參予癌化過程。是新興的細胞信號的重要調節劑,包括在癌細胞增殖分析腫瘤與正常組織,或是不同腫瘤型態之間miRNA 表現的差異,可以找到與癌症高度相關的miRNA,因此推論miRNA可能是癌化過程的一個導因。作為分類癌症、診斷癌症及監控預後結果。甚至可發展治療方式,所以miRNA可當作生物性指標。

最近幾年很多學者對miRNA在GBM發生擴展中的作用進行了深入的研究。發表於『OMICS A Journal of Integrative Biology』的一項研究,用次世代定序Next Generation Sequencing (NGS)分析miRNA,發現與正常腦組織相比,在GBM組織中miR-127-3p有顯著性的向下調節(down-regulated)。發現miR-127-3p均可以透過調控其target proteins來影響GBM癌細胞的生長。研究發現,DNA甲基化和組蛋白去乙醯化(Histone deacetylases,HDACs)抑制導致miR-127-3p的表現量有向下調節的情況。研究中也通過體內外實驗證實了miR-127-3p使細胞分裂阻滯在G1期,抑制了GBM細胞的生長。最後發現miR-127-3p藉著抑制原癌基因SKI和活化的轉化生長因子transforming growth factor-b (TGF-β)訊號抑制GBM癌細胞生長。 GBM細胞系中miR-127-3p的表現量與細胞的遷移和侵襲能力有著正相關,能調控更多與此相關之基因。研究表明,miR-127-3p在神經膠質母細胞瘤中是一個關鍵因子,也是一個潛在的神經膠質母細胞瘤治療靶點。

YourGene 發表在 痞客邦 留言(0) 人氣()

Long Non-Coding RNAs為一種不會轉譯成protein的transcripts,長度通常大於200bp,最長可超過10000bp,部分的lncRNA跟mRNA一樣會有alternative splicing,因為和基因的結構相似但不會轉譯成蛋白,早期稱為假基因(pseudogene) ,然而越來越多的研究顯示lncRNA本身參與許多生物調控,如下圖

20131002_pic1  

a.     lncRNA HOTAIR,Xist,RepA,Kcnqot1會促使Polycomb complex調控X染色體進行Chromatin remodeling (X異染色質生成,抑制其上面的基因表現)。
b.     以基因cyclin D1基因為例,會受到lncRNA的調控抑制基因表現 (cyclin D1基因表現下降)。

YourGene 發表在 痞客邦 留言(1) 人氣()

1  

上圖來源於(http://sourceforge.net/projects/trinityrnaseq/files/misc/RNASEQ_WORKSHOP/rnaseq_workshop_slides.pdf/download)

此套分析流程的開發團隊將此protocol取名為燕尾服(Tuxedo Suite),目的是將NGS技術定序RNA-Seq的reads透過alignment到已知基因體序列後,進行重組轉錄本(transcript reconstruction)、genes/transcripts 定量及分析不同condition間有顯著差異的genes/ transcripts,最後在搭配R語言將統計結果圖像化;此套分析流程適用於有已知基因體序列的物種(例如:人類、老鼠、斑馬魚、阿拉伯芥、番茄..等)。

  2  

文章標籤

YourGene 發表在 痞客邦 留言(2) 人氣()

過去在進行 miRNA 的研究時,大多是以定序得到的短片段RNA(18~24 bp)去比對 miRBase ( miRNA precursor  mature miRNA),找出miRNA 的種類的表現量,但是這種方法主要的問題在於:

  1. 需要依賴miRBase 的完整性,miRBase沒有記錄的miRNA 即無法被發現;
  2. 只考慮到 mature miRNA 的序列相似度,但是卻忽略 miRNA形成過程(pri-miRNA → pre-miRNA → mature miRNA)pri-miRNA  pre-miRNA 會形成 hairpin 結構的特性;即便某樣品的短片段RNA能比對到 miRBase ,但是在 transcriptome 上卻無法形成 hairpin 結構,亦很難認定該短片段RNA 是有表現的 miRNA

 

為了解決傳統方法的問題,最近有些研究同時考慮了 miRNA 與 transcriptome 序列,並以多個面向進行分析:

 transcriptome方面:

YourGene 發表在 痞客邦 留言(0) 人氣()

新興感染(emerging infection disease)疾病的病原可能來自於:

  1. 尚未偵測到或者未知的病原
  2. 已知的病原但散佈到新的地理位置
  3. 已知病源經過突變感染更強

對於新興感染疾病的預防,其中重要的一部份就是主動尋找偵測可能造成疾病流行的病源。國外學者發現包含蚊子、線蟲等無脊椎動物的small RNA中會帶有遭到感染的病毒序列,且彼此之間有overlap,可組裝出完整病毒序列[1];除此之外有時候甚至可以組出一組以上的病毒,且與已知病毒序列比對發現存在著差異,有new species存在的可能性,因此認為定序其small RNA可做為檢測病源的方法。Maijuan Ma[2]以家蚊為實驗對象分析其small RNA,組裝比對到具有大部分相同序列(80%)的三種病毒,分別為Aedes albopictus parvovirus, Anopheles gambiae densonucleosis virus, Aedes aegypti densovirus strain 0814616,為了確認答案,將組裝好的三種病毒genome作為reference,將reads貼回此三種reference genome上後,map比例最高者為Anopheles gambiae densonucleosis virus(78.5%),且組裝出來的consensus region與最新發表的的同種病毒(Anopheles gambiae)序列有98%的相似度,接著以PCR方式進一步確認,僅有Anopheles gambiae densonucleosis virus得到positive的結果,因此確認感染的病毒是Anopheles gambiae densonucleosis virus。無脊椎動物抵抗病毒感染的機制使得病毒片段出現於small RNA中尚未完全清楚,且coat protein的coverage最高,non-structure protein排行第二[2],此生物現象發生的原因也不清楚,這些問題仍待未來更深入的研究闡明。

 

References:

文章標籤

YourGene 發表在 痞客邦 留言(0) 人氣()

NCBI、GenBank等序列資料庫的開放性使許多人的研究如虎添翼,特別是那些早被定過千千萬萬條序列的模式物種,各種基因的序列、註解與表現量資訊皆可信手拈來。反之,以往非模式物種的研究者卻常常必須使用痛苦指數很高的工具如degenerate PCR除草開路,或是在經費限制下使用表現序列標幟(Expressed sequence tag, EST)取得所需的序列資源。

 

但EST library的資訊量依舊有限,雖然能比較部分基因表現量的差異,卻會忽略掉許多表現量較少的基因。現在,你能選擇使用次世代定序儀建造自己的transcriptome sequence database,讓所有有興趣的序列信手拈來。有篇文獻正好說明這麼做的好處。

20120828_pic1

YourGene 發表在 痞客邦 留言(0) 人氣()

piRNA 又稱為 piwi-interacting RNA為 small non-conding RNA 的主要類別之一,piRNA 主要具備幾個特性:

  1. 目前僅在動物細胞中被發現
  2. 目前常見動物的生殖腺細胞中
  3. 長度大約是 26~31 nt
  4. 5’ 端偏好以 U 做為起始

 

 為了探索piRNA 的生成與機制,有人利用 NGS 的方法試著找出 piRNA 可能存在的 profile。

在該研究中,研究人員分別從8天、17天大的老鼠和成熟的老鼠睪丸上取得「Type A精原細胞 (Type A spermatogonia, A)」、「粗絲期晚期精母細胞 (pachytene spermatocytes, PS)」、「圓形精細胞 (round spermatids, RS)」,利用電泳之方式,選出長度在 18-26 nt 之 small RNAs,然後將這些 small RNA 進行定序。

YourGene 發表在 痞客邦 留言(0) 人氣()

近幾年來,由於科學家發現 miRNA 與調節基因的表現量有相關,甚至與疾病也有一定的關係存在,所以生物學家慢慢將研究重心趨向 miRNA。Figure1 是從 2001 年到 2010 年與 miRNA 相關研究的資料,由下圖可以看出近年來研究 miRNA 是越來越多了

新圖片 

 

因為 miRNA 的表現量與疾病有關,所以可以藉由 miRNA 定量來找出疾病的作用機轉作為新藥物開發之標的。miRNA 定量是藉由 real-time reverse transcription PCR、microarray 與 NGS,而後者 NGS 與前兩者最大不同是在於 NGS 不僅可以找到已知 miRNA 還可以找到未知的 miRNA,則更有利藥物開發,以下 table1 為目前針對 miRNA 所以開發藥物的例子。

YourGene 發表在 痞客邦 留言(0) 人氣()

RNA-Seq 雖然是這幾年發展的技術,但已經成為分析 transcriptome 的方法,可用來組裝 transcript ,發現 splicing variants 、 single-nucleotide variations 及 fusion genes 等,而 strand specific RNA 更可協助 transcript 組裝及 genome annotation 的正確性。 Lin Wang 等人在 2011 年發表在 PLoS ONE 期刊所發表的研究,提到如何做 strand specific RNA 的 Library construction、與 non-strand specific RNA protocol 比較,及協助證實 gene model 正確性,以下就做個介紹:

Library construction of Strand-Specific RNA-seq
Lin Wang 等人發展的 strand specific RNA-seq 的 Library construction 的方法(如下圖),與 Illumina 原廠所使用的方法差異性不大,只是在第二股 cDNA 合成時,使用 dUTP 取代 dTTP ,並在 Y-shaped Adapter 接上後,利用 uracil-DNA glycosylase (UDG)切除含 dUTP-marked strand

YourGene 發表在 痞客邦 留言(0) 人氣()

在次世代定序 RNA-seq 成為 transcriptome 研究的主要來源前,我們多是使用 microarray 來分析基因體表現量的變化與樣本條件之間的關聯性,例如:基因表現量與不同組織細胞的性狀。每一個個體的 transcriptome 受到基因體變異而不一樣,像是 SNP、copy number 的變異。而直接分析轉錄本的表現量變化是最容易觀察到與性狀之間的關係。一般定義真核細胞中的一個基因被轉錄後,其調控會透過 RNA edit (例如 splicing ) 形成多種轉錄本。不同轉錄本的表現量變化造成性狀不同的關聯性可能更高。RNA-seq 高解析度的定量 mRNA,提供給研究人員們一個機會來研究轉錄本的變化。

於是有西班牙生物資訊學家開始研究如何用 RNA-seq 來分析 reference genome 上的同一個基因內不同轉錄本表現量的差異。轉錄體的比較比基因表現量的比較要來的複雜。計算上,我們會假設不同的基因之間表現量的資訊是獨立變數,但是相同基因內的轉錄本數量,卻有相依性。某一轉錄本的數量越多會造成其他轉錄本的表現量減少。因此需要思考各個轉錄本 RPKM 在個體間的差異要如何分析。

如圖所示,我們利用 microarray 或是 RNA-seq 所偵測到的基因表現量與轉錄本之間的表現量可能存在著以下四類關係(在極端的情況下)a) 基因及其轉錄本的比例變化皆不大、 b) 基因表現量在個體間差異大,但是轉錄本的表現量比例一致較無變化、 c) 基因表現量穩定,但是所屬的轉錄本表現量比例變化大、 d) 表現量及轉錄本的表現量變化皆很大。有此可見,如果只看基因表現量的變化,其代表性及關連性可能不足以讓我們發現和性狀之間的關係,因此忽略了這些變化比例不定的轉錄本所隱含的功能。

 

YourGene 發表在 痞客邦 留言(0) 人氣()

當我們進行 miRNA 定序時,有時我們會發現有一些 reads 沒有辦法 map miRBase 中的miRNA 序列,那這些 reads 究竟是什麼呢?

由於在樣本備製時,是以 size selection 來決定要定序的 RNA ,只要 RNA size 是落在我們所設定範圍內,都會被定序到,所以這些無法對到miRBase RNA ,有可能是其他的 small RNA ,也有可能是 degrade RNA,當然也有可能是 Novel miRNA

我們該如何判斷得到的 reads 是屬於 Novel miRNA,並知道此 Novel miRNA hairpin 的位置與序列呢?

首先,我們要先有我們所研究之物種的 genome sequence

YourGene 發表在 痞客邦 留言(1) 人氣()

研究生物基因轉錄體的方法有許多種,而使用次代定序儀系統進行轉錄體定序是目前相當熱門的一種方式,科學家們使用 RNA-seq 分析轉錄體表現主要期望能夠獲得三種重要資訊:1. 了解整個轉錄體構造、splicing 位置以及註解基因的功能。2. 將所有轉錄體的表現量多寡定量。3. 找出 alternative splicing 的可能性方式。

   相較於使用轉錄體反應 DNA-RNA 雜合為基礎的 RNA microarray,可以直接地得知轉錄體的方向性,但目前 RNA-seq 所常用的製備方法必須反轉錄成 cDNA,因此缺少了轉錄體序列的方向性,而分析上針對這個問題所作的解決方式為,例如:利用轉譯的蛋白質基因預測 open reading frame、利用 3’端定序量常較 5’端多的 bias、以及藉由真核生物 splicing 位置方向來做判斷。但即使如此,發展能區分出方向性的 RNA-seq 製備方式是很重要的,這是因為當面對較小基因體的物種,如微生物或低等真核生物時,基因會密集的出現在 DNA 的正負股上,而無法確認方向性會造成評估基因表現量上的誤判,另外,當轉錄體表現時,也有機會產生負股調控基因的轉錄體,這些轉錄體並不轉譯,但與蛋白質表現量卻息息相關。

目前被用來製備 strand-specific RNA-seq library 的方式五花八門,容易會讓操作者困惑不知該選用何種方法為佳,因此 20109Levin 等人於 Nature Methods 上發表了一篇文章統整了這些製備方式,筆者使用同一來源的 RNA 作為材料,用不同的製備方式製造 cDNA library,爾後使用 illumina 定序系統獲得序列資料再分析,而評斷這些製備方式孰優孰劣的標準在於:

1. Library complexity-這些 reads 的獨特性高低、

YourGene 發表在 痞客邦 留言(0) 人氣()

目前發展成熟而被應用在許多研究的次世代定序技術中,被定序的library 大多為DNA而非RNA(定序原理請參照本部落格先前文章),在現有的mRNA-seq技術中,需先將RNA反轉錄為DNA,製備出DNA型態的library後,始能執行定序反應。針對mRNA-seq,近日Lira Mamanova團隊以Illumina定序平台為基礎,發展出可直接以RNA library做為定序材料的新技術,名為FRT-seq(Flowcell Reverse Transcription sequencing),此技術將RNA library注入flowcell內,並且直接在flowcell內執行反轉錄及bridge PCRFRT-seq能完整保留RNA正負股的資訊(strand-specific mRNA sequencing),除此之外,其製備library過程中不需經由PCR的放大,所以可以減少PCR所產生的錯誤(請參照本部落格PCR free文章)

FRT-seq library的製備過程中,首先將mRNA純化出來並且打斷,再將RNA3'5'端分別接上兩段特殊設計且不同序列的adapter,經由qPCRlibrary分子大小的檢查後,便能以Illumina cBotRNA library注入flowcell內,經由反轉錄及bridge PCR反應後,即可執行定序反應,流程如下圖所示。

新圖片 (3).png 

YourGene 發表在 痞客邦 留言(1) 人氣()

在原核生物中,mRNA 只佔全部 RNA 的 1-5%,其餘絕大部分是 ribosomal RNA,因此若要定序 mRNA 首先必須先將 mRNA 純化出來,然而,原核生物並不像真核生物 mRNA 具有 poly A 的結構,因此,無法直接利用 oligo T 將 mRNA 純化出來,如果拿 total RNA 進行定序,那麼定序的效率一定會非常差,因為大部分的序列都來自 rRNA;如何提升原核生物 mRNA 的量,已成為 NGS 系統的重要議題,目前,提升原核生物 mRNA 的量,最主要的方式不外乎分為兩大類,第一類是減少 rRNA 的量(下圖 a 與 b ),圖 a 的方式是利用 rRNA 的 probe 將 rRNA 去除,這也是最常用的方式,然而,去除 rRNA 的效率會與 probe 序列的設計與生物物種有關;圖 b 的方式是利用針對 rRNA 作用的酵素將 rRNA 去除,主要是利用原核生物的 mRNA 5’端有三個磷酸,而此酵素無法對三個磷酸的結構作用,因此,能夠有效去除 rRNA。

新圖片 (5).png 

 

YourGene 發表在 痞客邦 留言(2) 人氣()

由於原核生物的 mRNA缺乏poly-A的結構,使得要純化出原核生物的mRNA技術困難度要比真核生物高出許多,目前比較常用的方式是利用hybridization去除rRNA後,再進行RNA的定序,然而,不同的物種去除的效果差異頗大,定序結果中,往往只有大約10-20%的mRNA,其餘大部分為rRNA的序列,圖一為Shaomei He團隊的研究結果,a與b分別來自兩個的環境樣品metatranscriptome的結果,結果可以發現hybridization去除rRNA效果不盡理想,尤其是樣品b,即使利用兩次hybridization,非rRNA的比例也只有11.3%,如何有效降低rRNA比例將是研究員何生物轉錄體的重要課題。

圖一:

新圖片.png 

YourGene 發表在 痞客邦 留言(0) 人氣()

microRNA(miRNA)是一段長度約22個核苷酸的RNA分子,由DNA轉錄而來但並不會表現成蛋白質。主要的功能為調控動物和植物的轉譯後修飾,很多癌症被發現可能由這些小RNA分子所影響。當miRNA與其被調控基因的binding target site 鍵結後,會抑制其基因的表現(抑制轉譯)或使其基因轉錄後的RNA序列斷裂。miRNA與基因binding target site通常是落在transcript的3’UTR,以miRNA 5’方向的第2到第8核苷酸(seed區域)與transcript完美鍵結,此外研究發現miRNA的seed區域與基因binding時,可以是G:U wobble的模式鍵結,或是在seed的區域有少數的核苷酸並沒鍵結(Imperfect seed);miRNA與基因的binding site也可能落在3’UTR以外的區域。

 

利用NGS的技術來定序miRNA(small RNA)後,可快速大量尋找以前未知的novel miRNA,從NGS的資料我們可以利用一些找尋novel miRNA的預測軟體例如:miRDeep and Mireap,這些軟體可以讓我們得到未知和已知miRNA和其表現量,使我們能夠更清楚了解某細胞或某組織下miRNA表現的多寡,可以減少做生物實驗的時間。了解可能會影響miRNA,其預測miRNA與其被調控的基因位置是一件很重要的事情,較早的預測軟體TargetScanPicTar可預測target binding site3’UTRseed區域完美鍵結的基因有哪些。隨後發展的miRanda可預測seed區域為G:U wobble的樣式及seed區域並非完美鍵結的情況。而PITArna22則可預測target binding site不是在3’UTR的情形。

YourGene 發表在 痞客邦 留言(0) 人氣()

相較於傳統的microarray方法,RNA sequencing究竟有著什麼樣的優點,讓我們必須讓我們從microarray轉換到RNA sequencing呢?


RNA seq 不需預先知道genome sequence,但Microarray 需預先知道genome sequence才能進行。因此,即便是尚未完全解序完成的物種,RNA seq仍能偵測其RNA的表現量。

YourGene 發表在 痞客邦 留言(0) 人氣()

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼