研究生物基因轉錄體的方法有許多種,而使用次代定序儀系統進行轉錄體定序是目前相當熱門的一種方式,科學家們使用 RNA-seq 分析轉錄體表現主要期望能夠獲得三種重要資訊:1. 了解整個轉錄體構造、splicing 位置以及註解基因的功能。2. 將所有轉錄體的表現量多寡定量。3. 找出 alternative splicing 的可能性方式。

   相較於使用轉錄體反應 DNA-RNA 雜合為基礎的 RNA microarray,可以直接地得知轉錄體的方向性,但目前 RNA-seq 所常用的製備方法必須反轉錄成 cDNA,因此缺少了轉錄體序列的方向性,而分析上針對這個問題所作的解決方式為,例如:利用轉譯的蛋白質基因預測 open reading frame、利用 3’端定序量常較 5’端多的 bias、以及藉由真核生物 splicing 位置方向來做判斷。但即使如此,發展能區分出方向性的 RNA-seq 製備方式是很重要的,這是因為當面對較小基因體的物種,如微生物或低等真核生物時,基因會密集的出現在 DNA 的正負股上,而無法確認方向性會造成評估基因表現量上的誤判,另外,當轉錄體表現時,也有機會產生負股調控基因的轉錄體,這些轉錄體並不轉譯,但與蛋白質表現量卻息息相關。

目前被用來製備 strand-specific RNA-seq library 的方式五花八門,容易會讓操作者困惑不知該選用何種方法為佳,因此 20109Levin 等人於 Nature Methods 上發表了一篇文章統整了這些製備方式,筆者使用同一來源的 RNA 作為材料,用不同的製備方式製造 cDNA library,爾後使用 illumina 定序系統獲得序列資料再分析,而評斷這些製備方式孰優孰劣的標準在於:

1. Library complexity-這些 reads 的獨特性高低、

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

目前發展成熟而被應用在許多研究的次世代定序技術中,被定序的library 大多為DNA而非RNA(定序原理請參照本部落格先前文章),在現有的mRNA-seq技術中,需先將RNA反轉錄為DNA,製備出DNA型態的library後,始能執行定序反應。針對mRNA-seq,近日Lira Mamanova團隊以Illumina定序平台為基礎,發展出可直接以RNA library做為定序材料的新技術,名為FRT-seq(Flowcell Reverse Transcription sequencing),此技術將RNA library注入flowcell內,並且直接在flowcell內執行反轉錄及bridge PCRFRT-seq能完整保留RNA正負股的資訊(strand-specific mRNA sequencing),除此之外,其製備library過程中不需經由PCR的放大,所以可以減少PCR所產生的錯誤(請參照本部落格PCR free文章)

FRT-seq library的製備過程中,首先將mRNA純化出來並且打斷,再將RNA3'5'端分別接上兩段特殊設計且不同序列的adapter,經由qPCRlibrary分子大小的檢查後,便能以Illumina cBotRNA library注入flowcell內,經由反轉錄及bridge PCR反應後,即可執行定序反應,流程如下圖所示。

新圖片 (3).png 

YourGene 發表在 痞客邦 PIXNET 留言(1) 人氣()

不管是測DNA、RNA或是protein濃度單位大多以ng/μl為準,很少會以nM為單位。因此對於這方面的單位換算來說許多人都很陌生,也因為陌生可能導致遺忘如何換算或因陌生而不敢接觸,所以在這我們將舉個簡單的例子來說明ng/μl與nM的單位換算方式。
例子1.
      假如DNA濃度是10ng/μl
      DNA size是300bp (DNA每個bp 分子量為650)

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

在原核生物中,mRNA 只佔全部 RNA 的 1-5%,其餘絕大部分是 ribosomal RNA,因此若要定序 mRNA 首先必須先將 mRNA 純化出來,然而,原核生物並不像真核生物 mRNA 具有 poly A 的結構,因此,無法直接利用 oligo T 將 mRNA 純化出來,如果拿 total RNA 進行定序,那麼定序的效率一定會非常差,因為大部分的序列都來自 rRNA;如何提升原核生物 mRNA 的量,已成為 NGS 系統的重要議題,目前,提升原核生物 mRNA 的量,最主要的方式不外乎分為兩大類,第一類是減少 rRNA 的量(下圖 a 與 b ),圖 a 的方式是利用 rRNA 的 probe 將 rRNA 去除,這也是最常用的方式,然而,去除 rRNA 的效率會與 probe 序列的設計與生物物種有關;圖 b 的方式是利用針對 rRNA 作用的酵素將 rRNA 去除,主要是利用原核生物的 mRNA 5’端有三個磷酸,而此酵素無法對三個磷酸的結構作用,因此,能夠有效去除 rRNA。

新圖片 (5).png 

 

YourGene 發表在 痞客邦 PIXNET 留言(2) 人氣()

在處理NGS的資料時,一開始會碰到的資料型態即是Fastq的序列格式,可以想成是fasta格式+quality值。

在前幾週的blog我們介紹了fasta的序列格式,格式如下

>sequence_name
TTAATTGGTAAATAAATCTCCTAATAGCTTAGATNTTACCTTNNNNNNNNNNTAGTTTCTTGAGATTTG

 

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

病毒在生物界扮演著舉足輕重的地位,幾乎所有的生物都能被特定的病毒所感染。而昆蟲同樣對於生物界以及人類非常重要,保護對人類有益的昆蟲,以及研究傳播病害的昆蟲是非常重要的事,例如:保障蜜蜂以及幼蠶的健康、探究疾病媒介昆蟲的帶毒,或是利用病毒製作生物性殺蟲劑等等,都是科學家們努力研究昆蟲病毒的目的。

   在過去,科學家們已花了許多時間研究昆蟲體內所帶的病毒種類,然而,並非所有的病毒都能夠被傳統的實驗技術所偵測到,過去常用在研究昆蟲病毒的技術包括了:直接觀察的TEM、血清學的ELISA、以核酸雜合為主的Southern、Northern blot,也有人直接分析 EST Library 的序列,找出新的病毒,不過這會受限在病毒濃度高的狀況下,後期常見有人使用 Microarray 技術監測如蜜蜂族群的帶毒率,但這項技術受限在只能偵測已知的病毒種類。

   如今,結合上新的次代定序系統,許多在蟲體內的微量病毒都陸續的在過去五年間被檢測到。由於次代定序系統有著快速、相對傳統實驗方式價廉的優點,以及可獲得高通量和正確性高的序列資料,因此即使看不出病徵的染病昆蟲,都能夠被有效的被偵測出微量的帶毒,所以次代定序系統可被用來當作一種監測病毒感染節肢動物們的有利工具。在製備 DNA 或是 RNA 材料時有兩種選擇,可以直接使用所有樣品的核酸製備,或是純化出病毒顆粒後再萃取核酸,後者的好處是可以避免掉寄主核酸的汙染,不僅如此,寄主進食食物上的病毒、還有被導入寄主基因體的病毒基因,都可以避免以減少誤判的可能性。

新圖片 (1).png  

YourGene 發表在 痞客邦 PIXNET 留言(1) 人氣()

  • Nov 25 Fri 2011 09:28
  • FASTA

 當我們需要記錄DNARNA和蛋白質的序列時,我們常用一種稱為FastA的檔案格式。其檔案範例如下:

>Annotation….

ATGCGGATCGATCGA

AAACCCTGA

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

Velvet 是 Daniel Zerbin 與 Ewan Birney 提出的一種應用在序列組裝 (assembly) 的演算法,這個演算法是利用一種特殊的序列索引 (De Bruijn graph) 來記錄各條互相配對 read 序列,並且在此索引上依照序列 depth 以及較長序列組裝路徑來處理定序誤差及 repeat 的情況。De Bruijn graph 索引結構的設計特別適合短序列並且索引結構本身並不容易受到 read 序列庫大小而增大,同時還可記錄序列上 repeat 的片段,因此此一演算法大多應用於 Solexa 所產生的序列庫。

新圖片.png  

Velvet 在組裝序列的過程中,先將 read 序列儲存於一張網絡結構 (De Bruijn graph) 以及一張查詢表格中(上圖節錄於原作論文中,是一張非常簡化的網絡)。此一網絡結構主要是將所有 read 片段以固定長度 (K-mer,像是一個 reading frame) 抓取序列下來,單一 read 序列由多個K-mer組成,並在網絡中以一個 base 位移相互並列在一起(也就是上圖傾斜排列的序列)。如果有遇到與其配對的 read,就會把配對的 K-mer 分離出(形成上圖中藍色的區塊),並且將原來鄰近的 K-mer 以一個箭頭連接起來。將 read 序列轉變成上圖的過程中也會將各 read 在 De Bruijn graph 起始位置以及與其它序列配對的資訊記錄在一個表格中。

YourGene 發表在 痞客邦 PIXNET 留言(1) 人氣()

在談論eQTL之前,首先要介紹一下它的由來。

 

最早在研究遺傳與性狀時,大多數是根據孟德爾遺傳定律,認為性狀的不同主要是來自於等位基因不同組合所造成,當然,在某些性狀上,我們可以發現確實是如此,但是在一些性狀上卻不是這樣,例如黑貓和白貓交配的後代就可能是灰色、黑白斑,而不會只有黑或白兩種結果,於是有些人開始提出多基因調控一性狀的理論,會被多基因調控的性狀就稱為數量性狀 (Quantitative trait),而參與調控的基因則稱為數量性狀基因座 (QTL, Quantitative trait loci)。

 

YourGene 發表在 痞客邦 PIXNET 留言(1) 人氣()

Library construction過程中,DNA及RNA濃度的精準測定是相當重要的。尤其在製備library之前,必須要了解樣品的濃度,才能取出適當總量的DNA或RNA做為製備的原料,若因為濃度偵測的不準確,會導致最後library產物總量不足夠上機定序。目前常見的DNA及RNA濃度測定方法有吸光值測定法、專一性螢光染劑測定法。

 

一.  吸光值測定法

Beer-Lambert law顯示,分子對於特定波長光之吸光程度會隨著分子濃度而有所不同,所以可以藉由測量溶液的吸光程度optical density推估分子的濃度1DNARNA分子會吸收波長260nm的光,所以可藉由260nm的吸光值換算成濃度(如下圖所示)。此測定法操作簡單且快速,但極容易造成量測的不準確,因為若萃取DNARNA的過程中,溶液混有其他也會吸收260nm波長光的物質,常常會造成高估DNARNA的濃度,進而影響後續實驗的進行。

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

對於初學生物資訊的不知道 DNA 序列中的「N」是什麼是很正常的,對於有經驗的人,大多也只知道「N」是代表 A 或 T 或 G 或 C,其實這個符號是來自NC-IUB (Nomenclature Committee of International Union of Biochemistry) 所建議的編號,也稱為 NC-IUB codes 或 IUB codes。

IUB codes可分為兩類,一為 Standard Bases,一為 Mixed Bases (Wobble)。

Standard Bases:

Code Base Origin of designation
G G Guanine
A A Adenine
T T Thymine
C C Cytosine

Mixed Bases (Wobble):

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼