在Re-sequencing 的分析中,將Paired-end reads 對回到參考序列後的SAM 格式中,其中一個欄位”FLAG”,將會記錄paired-end reads 對回參考序列的特性。FLAG定義reads對回參考序列後的幾種特性,如圖一所式,其計算方法則是將read含有的每一個特性所對應的數值相加。

20130125_pic1  

 

圖一:SAM format中的FLAG欄位

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

Fusion gene 從基因體或轉錄體來講,是2個分開的基因的成為1個混合基因(hybride gene)。在生物資訊分析上,若只做map到Reference genome,

生物資訊參數有時會設為90%相似性,即定序長度100bases情況下,有90bases以上核甘酸序列是一樣的,就可map到Reference genome,因此就只能看小片段的 Insertion/deletion。

 

有些研究,是想看virus genome插在chromosome哪個位置,此需要用fusion gene生物資訊分析方式。首先,要將reads map到Reference genome後,因有些reads與Reference genome相似性低,無法將Map上,就會產生unmapped reads。如下圖: 

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

過去在進行 miRNA 的研究時,大多是以定序得到的短片段RNA(18~24 bp)去比對 miRBase ( miRNA precursor  mature miRNA),找出miRNA 的種類的表現量,但是這種方法主要的問題在於:

  1. 需要依賴miRBase 的完整性,miRBase沒有記錄的miRNA 即無法被發現;
  2. 只考慮到 mature miRNA 的序列相似度,但是卻忽略 miRNA形成過程(pri-miRNA → pre-miRNA → mature miRNA)pri-miRNA  pre-miRNA 會形成 hairpin 結構的特性;即便某樣品的短片段RNA能比對到 miRBase ,但是在 transcriptome 上卻無法形成 hairpin 結構,亦很難認定該短片段RNA 是有表現的 miRNA

 

為了解決傳統方法的問題,最近有些研究同時考慮了 miRNA 與 transcriptome 序列,並以多個面向進行分析:

 transcriptome方面:

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

五萬瀏覽人次  

 

 

 

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

20121221_pic1

心肌病(CVD)是指伴有心肌功能障礙的心肌疾病。這類心血管疾病各個國家中一直是罹病死亡的主要因素,在2005年在全世界約有30%的死亡人數(1700百萬)離病死亡。新聞常常看到有青壯年發生心臟性猝死。這些情況常常是突發的心悸、暈倒之後休克,較嚴重的可能會無預警的猝死;但是病患在平常是很難被診斷出來的。單光在歐洲,就有48%的人死於心血管疾病,也造成23%的醫療負擔。儘管現代醫療管理方面進步,像是CVD的預後、致病機制研究和尋找潛在治療方法仍非常重要。

 

CVD常常伴隨著高血壓、高類固醇和抽煙等危險因子,但是這些因子僅和部分遺傳疾病類型有關。於是開始有人將研究CVD發展機制的希望轉向遺傳學和基因體學,希望可以找到其他致病的相關因子。只是上述因子相互影響而無法確認相互關係。其中比較困難的是在一些家族遺傳疾病中所發現的對應遺傳證據也不一定和其臨近基因有直接的關係,更不用說去釐清遺傳因子和環境因子的相互影響的關係。  

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

比較不同實驗條件下生物體的基因表現量差異,不再只能透過生物晶片觀察螢光反應定量基因表現量,亦可以藉由次世代定序偵測生物體的基因表現 (圖一) (Garber M, 2011)。而從RNA-seq結果尋找具有顯著表現量差異的基因是分析定序資料很重要的一部份,想要精確地定量和正規化定序資料,至少需要考慮兩個因素:基因長度和定序深度(或是總定序資料量)

20130104_pic1

圖一

 

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

定序的技術不僅讓英國科學家 Frederick Sanger 於諾貝爾化學獎梅開二度外,亦深深奠定往後次代定序 (Next- generation sequencing, NGS) 的基礎,此項技術將生物、化學與電腦運算三者整合為一,徹底改變多樣化的基因組應用,更帶來劃時代進展,其目的無非是將生物體內大量的有字天書作趨近於完美的詮釋。為了因應大量序列數據的辨認,因此發展出條碼系統(Barcode system),拜此辨識概念的引入,即允許混合多數樣品並於同時間進行大量定序(Bystrykh, 2012),本文主要探討條碼對於次代定序的貢獻,從日常生活的有形化乃至生技層面的無形化,比比皆是,隨處可尋條碼的蹤跡,可見其對於人類生活息息相關,以下分三部分做詳細介紹:

壹、日常生活應用

    日常生活中常見的有形條碼,舉凡商業應用,如:物流管理的識別系統,超商貨品盤點的便利性與其結帳的效率性,再再都顯示條碼的辨識功能強大。條碼不僅即時性高且錯誤率低,更可連結電腦,達到系統性的自動化整合管理,亦是一種全球統一化的圖像語言。近年來,更在智慧型手機的意識形態裡,將商品、餐飲美食與旅遊的廣告宣傳等,取代成二維條碼的黑白小方塊圖像(如圖一所示,擷取自Liu et al., 2012),以手機掃描條碼圖示,輕鬆得到豐富又經濟實惠的資料訊息,達到秀才不出門能知天下事的便利生活。

20121213_pic01

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

非洲裸鼠 (Naked mole rat) 學名:Heterocephalus glaber 是一群在東非地底底棲生活,大小約 8-10 cm,重約 30-35 g 的鼠輩,牠們擁有一般地底生物常見特性,例如:耐熱、耐 CO2、視力不佳、能敏銳感受震動,牠們進行鼠類中少見的團體生活,並且具有哺乳類動物中唯二的真社會化系統 (Eusociality),只有女王鼠能與少部份雄鼠繁衍後代。

20121130_pic1

不僅如此,這群生物還擁有許多神祕且迷人的特性,雖然身為哺乳類卻是冷血動物,能耐餓耐渴,還不怕毒、不怕酸、不怕痛,擁有易於攜氧的血球系統,因此牠們適應惡劣逆境的能力極強。單若光是以上的特性也許尚不足以吸引科學家的目光,特別的是這群鼠輩能活 30 年之久,聽起來普通卻是一般鼠類的 3 倍,在牠們走向生命盡頭的前一刻,身體內的器官不會衰竭,也不容易出現腫瘤造成癌症,而且一直到老都仍保有生育能力,如此強大物種的基因庫,成為科學家們醉心研究的目標。

    2011 年發表在 PLoS ONE 上的期刊,使用Roche 454 以及 Illumina GAIIx 次世代定序系統,在沒有 reference genome 下進行非洲裸鼠 transcriptome 定序,並使用 CLC bio 進行 454 reads RNA de novo 重組,並且將 GAIIx 獲得的 reads Mapping 回小鼠基因體進行比對分析。下表是將非洲裸鼠基因與野鼠基因比較後,超過五倍以上表現量的基因列出,從表中可得知在非洲裸鼠中,與 mitochondria 乙醯化、氧化還原等相關基因被大量表現,並在 KEGG pathway database 中找到與脂肪酸代謝相關的基因被大量表現。

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

        GATK ( Genome Analysis Toolkit),一套用來分析DNA sequencing data,找尋genomic variation的工具,由Broad Institute開發。目前已被應用在幾個大計畫中,例如1000 genomes projectTCGA(The Cancer Genome Atlas)。而在今年七月也更新成第二版。

20121128_pic1  

圖1. GATK流程圖

 

Yourgene Health 發表在 痞客邦 留言(1) 人氣()

 過去,是利用培養的方式來探究環境中微生物的組成,然而,百分之99以上的微生物是無法培養的 (Amann et al., 1995),因此,80年代發展出非培養的研究方式(cultured independent method),包含T-RFLP、DGGE、SSCP、以及cloning and sequencing的方式來研究環境微生物的族群 (Nocker et al., 2007),以上方式,皆是針對族群共有的目標基因的amplicons來分析,目標基因是依據不同的觀察目標而有所差異,常用的基因有18SrRNA (Eukaryotic microbes)、ITS (Eukaryotic microbes)、Bacterial 16S rRNA、Archaea 16S rRNA、與一些功能性的基因 (如 psbA、psaB、amoA與amoB)。T-RFLP、DGGE、SSCP、以及cloning and sequencing四種方式中,以cloning and sequencing的方式能夠提供最精確的資訊 (表一),然而,在面對高度複雜的環境生態時,必須挑選許多clone去進行定序,才能足以呈現真實的物種組成,例如,至少需要定序1000個clone才能夠呈現沿岸海水的細菌族群圖譜 (Acinas et al., 2004)。

從2006年開始有研究利用目標基因amplicons (如 bacterial V6),直接進行次代定序,即所謂的Amplicons high throughput sequencing,不但可以免除cloning繁複的流程,而且可以獲得大量的序列資訊 (Sogin et al., 2006),以Illumia定序技術定序平台為例,一次可以得到超過100,000,000條序列,這種方式同時擁有高輸出量以及高精確度的特性,因此能夠精確地呈現高度複雜的微生物族群圖譜 (表一)。這種amplicons的定序還能夠配合multiplexing(註一)的方式,讓兩種以上來源的樣品同時進行定序,使的定序更加有效率 (Binladen et al., 2007)。這樣的實驗方式已經被廣泛利用,包含人類共生菌的研究 (Huse et al., 2008 and Hummelen et al., 2010)、海水菌相研究 (Anderssonet al., 2010)以及土壤環境研究 (Chu et al., 2010)。


Yourgene Health 發表在 痞客邦 留言(0) 人氣()

       想知道某些環境因子的改變(如:生病的腸子或加了料的海水)會使環境中的某群生物(如:細菌或浮游生物)在群聚結構或基因表現有何反應嗎?20122月的PNAS剛好就有篇paper利用metatranscriptome分析Fe2+離子缺乏的海水加料(阿就是Fe2+離子)後,其藻相與基因表現是如何反應的[1]

20121019_pic1  

 圖1. 紅色與綠色區域為HNLC,位置分別在南大洋、太平洋赤道區域、北太平洋副極區 (http://www.geos.ed.ac.uk/homes/s0675905/MScBSc.html)


Yourgene Health 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼