不管是測DNA、RNA或是protein濃度單位大多以ng/μl為準,很少會以nM為單位。因此對於這方面的單位換算來說許多人都很陌生,也因為陌生可能導致遺忘如何換算或因陌生而不敢接觸,所以在這我們將舉個簡單的例子來說明ng/μl與nM的單位換算方式。
例子1.
      假如DNA濃度是10ng/μl
      DNA size是300bp (DNA每個bp 分子量為650)

TIGS 發表在 痞客邦 留言(1) 人氣()

在原核生物中,mRNA 只佔全部 RNA 的 1-5%,其餘絕大部分是 ribosomal RNA,因此若要定序 mRNA 首先必須先將 mRNA 純化出來,然而,原核生物並不像真核生物 mRNA 具有 poly A 的結構,因此,無法直接利用 oligo T 將 mRNA 純化出來,如果拿 total RNA 進行定序,那麼定序的效率一定會非常差,因為大部分的序列都來自 rRNA;如何提升原核生物 mRNA 的量,已成為 NGS 系統的重要議題,目前,提升原核生物 mRNA 的量,最主要的方式不外乎分為兩大類,第一類是減少 rRNA 的量(下圖 a 與 b ),圖 a 的方式是利用 rRNA 的 probe 將 rRNA 去除,這也是最常用的方式,然而,去除 rRNA 的效率會與 probe 序列的設計與生物物種有關;圖 b 的方式是利用針對 rRNA 作用的酵素將 rRNA 去除,主要是利用原核生物的 mRNA 5’端有三個磷酸,而此酵素無法對三個磷酸的結構作用,因此,能夠有效去除 rRNA。

新圖片 (5).png 

 

TIGS 發表在 痞客邦 留言(2) 人氣()

在處理NGS的資料時,一開始會碰到的資料型態即是Fastq的序列格式,可以想成是fasta格式+quality值。

在前幾週的blog我們介紹了fasta的序列格式,格式如下

>sequence_name
TTAATTGGTAAATAAATCTCCTAATAGCTTAGATNTTACCTTNNNNNNNNNNTAGTTTCTTGAGATTTG

 

TIGS 發表在 痞客邦 留言(0) 人氣()

病毒在生物界扮演著舉足輕重的地位,幾乎所有的生物都能被特定的病毒所感染。而昆蟲同樣對於生物界以及人類非常重要,保護對人類有益的昆蟲,以及研究傳播病害的昆蟲是非常重要的事,例如:保障蜜蜂以及幼蠶的健康、探究疾病媒介昆蟲的帶毒,或是利用病毒製作生物性殺蟲劑等等,都是科學家們努力研究昆蟲病毒的目的。

   在過去,科學家們已花了許多時間研究昆蟲體內所帶的病毒種類,然而,並非所有的病毒都能夠被傳統的實驗技術所偵測到,過去常用在研究昆蟲病毒的技術包括了:直接觀察的TEM、血清學的ELISA、以核酸雜合為主的Southern、Northern blot,也有人直接分析 EST Library 的序列,找出新的病毒,不過這會受限在病毒濃度高的狀況下,後期常見有人使用 Microarray 技術監測如蜜蜂族群的帶毒率,但這項技術受限在只能偵測已知的病毒種類。

   如今,結合上新的次代定序系統,許多在蟲體內的微量病毒都陸續的在過去五年間被檢測到。由於次代定序系統有著快速、相對傳統實驗方式價廉的優點,以及可獲得高通量和正確性高的序列資料,因此即使看不出病徵的染病昆蟲,都能夠被有效的被偵測出微量的帶毒,所以次代定序系統可被用來當作一種監測病毒感染節肢動物們的有利工具。在製備 DNA 或是 RNA 材料時有兩種選擇,可以直接使用所有樣品的核酸製備,或是純化出病毒顆粒後再萃取核酸,後者的好處是可以避免掉寄主核酸的汙染,不僅如此,寄主進食食物上的病毒、還有被導入寄主基因體的病毒基因,都可以避免以減少誤判的可能性。

新圖片 (1).png  

TIGS 發表在 痞客邦 留言(1) 人氣()

  • Nov 25 Fri 2011 09:28
  • FASTA

 當我們需要記錄DNARNA和蛋白質的序列時,我們常用一種稱為FastA的檔案格式。其檔案範例如下:

>Annotation….

ATGCGGATCGATCGA

AAACCCTGA

TIGS 發表在 痞客邦 留言(0) 人氣()

Velvet 是 Daniel Zerbin 與 Ewan Birney 提出的一種應用在序列組裝 (assembly) 的演算法,這個演算法是利用一種特殊的序列索引 (De Bruijn graph) 來記錄各條互相配對 read 序列,並且在此索引上依照序列 depth 以及較長序列組裝路徑來處理定序誤差及 repeat 的情況。De Bruijn graph 索引結構的設計特別適合短序列並且索引結構本身並不容易受到 read 序列庫大小而增大,同時還可記錄序列上 repeat 的片段,因此此一演算法大多應用於 Solexa 所產生的序列庫。

新圖片.png  

Velvet 在組裝序列的過程中,先將 read 序列儲存於一張網絡結構 (De Bruijn graph) 以及一張查詢表格中(上圖節錄於原作論文中,是一張非常簡化的網絡)。此一網絡結構主要是將所有 read 片段以固定長度 (K-mer,像是一個 reading frame) 抓取序列下來,單一 read 序列由多個K-mer組成,並在網絡中以一個 base 位移相互並列在一起(也就是上圖傾斜排列的序列)。如果有遇到與其配對的 read,就會把配對的 K-mer 分離出(形成上圖中藍色的區塊),並且將原來鄰近的 K-mer 以一個箭頭連接起來。將 read 序列轉變成上圖的過程中也會將各 read 在 De Bruijn graph 起始位置以及與其它序列配對的資訊記錄在一個表格中。

TIGS 發表在 痞客邦 留言(1) 人氣()

在談論eQTL之前,首先要介紹一下它的由來。

 

最早在研究遺傳與性狀時,大多數是根據孟德爾遺傳定律,認為性狀的不同主要是來自於等位基因不同組合所造成,當然,在某些性狀上,我們可以發現確實是如此,但是在一些性狀上卻不是這樣,例如黑貓和白貓交配的後代就可能是灰色、黑白斑,而不會只有黑或白兩種結果,於是有些人開始提出多基因調控一性狀的理論,會被多基因調控的性狀就稱為數量性狀 (Quantitative trait),而參與調控的基因則稱為數量性狀基因座 (QTL, Quantitative trait loci)。

 

TIGS 發表在 痞客邦 留言(1) 人氣()

Library construction過程中,DNA及RNA濃度的精準測定是相當重要的。尤其在製備library之前,必須要了解樣品的濃度,才能取出適當總量的DNA或RNA做為製備的原料,若因為濃度偵測的不準確,會導致最後library產物總量不足夠上機定序。目前常見的DNA及RNA濃度測定方法有吸光值測定法、專一性螢光染劑測定法。

 

一.  吸光值測定法

Beer-Lambert law顯示,分子對於特定波長光之吸光程度會隨著分子濃度而有所不同,所以可以藉由測量溶液的吸光程度optical density推估分子的濃度1DNARNA分子會吸收波長260nm的光,所以可藉由260nm的吸光值換算成濃度(如下圖所示)。此測定法操作簡單且快速,但極容易造成量測的不準確,因為若萃取DNARNA的過程中,溶液混有其他也會吸收260nm波長光的物質,常常會造成高估DNARNA的濃度,進而影響後續實驗的進行。

TIGS 發表在 痞客邦 留言(0) 人氣()

對於初學生物資訊的不知道 DNA 序列中的「N」是什麼是很正常的,對於有經驗的人,大多也只知道「N」是代表 A 或 T 或 G 或 C,其實這個符號是來自NC-IUB (Nomenclature Committee of International Union of Biochemistry) 所建議的編號,也稱為 NC-IUB codes 或 IUB codes。

IUB codes可分為兩類,一為 Standard Bases,一為 Mixed Bases (Wobble)。

Standard Bases:

Code Base Origin of designation
G G Guanine
A A Adenine
T T Thymine
C C Cytosine

Mixed Bases (Wobble):

TIGS 發表在 痞客邦 留言(0) 人氣()

心肌病變可分為擴張型(dilated)、肥厚型(hypertrophic)或限制型(restrictive)三種,而這些心肌病變的臨床表現是依收縮壓舒張壓功能障礙而有所不同,現今

擴張型心肌病變普遍被認為是心臟衰竭與心臟移植的問題所在。目前研究顯示,

TIGS 發表在 痞客邦 留言(0) 人氣()

由於原核生物的 mRNA缺乏poly-A的結構,使得要純化出原核生物的mRNA技術困難度要比真核生物高出許多,目前比較常用的方式是利用hybridization去除rRNA後,再進行RNA的定序,然而,不同的物種去除的效果差異頗大,定序結果中,往往只有大約10-20%的mRNA,其餘大部分為rRNA的序列,圖一為Shaomei He團隊的研究結果,a與b分別來自兩個的環境樣品metatranscriptome的結果,結果可以發現hybridization去除rRNA效果不盡理想,尤其是樣品b,即使利用兩次hybridization,非rRNA的比例也只有11.3%,如何有效降低rRNA比例將是研究員何生物轉錄體的重要課題。

圖一:

新圖片.png 

TIGS 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼