20140428_pic1
除了透過Gene Ontology和KEGG pathway來註解蛋白質功能,也可以將蛋白質序列註解蛋白質結構域(protein domain),推測具有生物功能的序列。
InterPro是一個整合多個蛋白質功能註解的資料庫,透過蛋白質或是核酸序列,此工具由EMBL-EBI提供線上服務(http://www.ebi.ac.uk/interpro/),InterProScan可以註解其蛋白質功能,包含Domain, 2nd structure, GO terms, pathway...
只需要輸入蛋白質序列,就可以預期蛋白質功能,這對於非生物資訊人員而言,算是個簡單的分析方法。

TIGS 發表在 痞客邦 留言(0) 人氣()

20131204_pic1
在先前的部落格中我們介紹過了在Windows 7平台下利用bowtie或bowtie2將NGS定序的資料和reference序列作alignment,並利用samtools進行檔案的處理以及利用IGV觀看瀏覽alignment結果
詳細內容可參照:
1. bowtie教學

TIGS 發表在 痞客邦 留言(0) 人氣()

20130802_pic1
在今年五月的部落格” 基因體註解(genome annotation)面面觀 ─ 淺談KEGG資料庫”中,介紹到基因註解的粗略概念和簡介KEGG資料庫。在本篇部落格,我們將繼續介紹如何使用KEGG資料庫以及其他蛋白質交互作用資料庫。
 
上圖為該網站的首頁(http://www.kegg.jp/kegg/)

TIGS 發表在 痞客邦 留言(0) 人氣()

20130510_pic1
隨著定序技術不斷的創新,就算是定序人類基因體也不再是難事。當越來越多基因體定序資料的產生,在有限的經費下,如何大規模且有效地註解基因也越來越受到重視。
  
圖一、代表物種的基因體和基因大小
 

TIGS 發表在 痞客邦 留言(0) 人氣()

RPKM勘誤
先前發布的部落格RPKM 簡介中,Total exon read所引用的單位誤標為"million reads"。
共有四處標記錯誤,目前已將Total exon read的單位修正為"reads"。
若有其他不足之處,歡迎各位不吝指教。

TIGS 發表在 痞客邦 留言(0) 人氣()

Yourgene Bioscience



This page requires JavaScript. Please enable it in your browser settings.
我們在先前的文章SAM format中的FLAG概念及應用中提到SAM的格式。可是對於使用者來說要將FLAG的數字內容轉換成文字意義是不太方便的。

TIGS 發表在 痞客邦 留言(1) 人氣()

20130517_pic1
在先前我們已經介紹使用於window7下使用bowtie(http://yourgene.pixnet.net/blog/post/92081187),今天在來介紹在window7下使用bowtie2的流程,bowtie2跟bowtie的最大差別在於bowtie2將reads比對到參考序列上時能允許indel的容錯率。
 

TIGS 發表在 痞客邦 留言(2) 人氣()

20130419_pic1
IGV(Integrative Genomics Viewer) 也是Broad Institute開發的NGSarray-based定序資料的genome viewer。他跟GATK 一樣在java平台之上提供反應快速的視覺化界面來瀏覽在本機端或是網路上的多種基因體資料,並且讓我們快速地在不同放大倍率間的序列瀏覽搜尋。他也提供各種定序資料與其他臨床性狀資料的關聯,將不同資料放在一起比較。

TIGS 發表在 痞客邦 留言(2) 人氣()

20130301_pic1
            隨著現在次世代定序技術越來越進步,定序所需的成本也越來越低,許多研究者也開始紛紛進行許多物種的全基因體定序。當我們得到一個物種的全基因體DNA序列之後,下一步接著要做的便是基因體上的蛋白質coding region的預測。在這邊就來跟大家介紹一個適用於細菌及古生菌的基因預測軟體:Prodigal
 
            圖一:以Artemis查看在Anaeromyxobacter dehalogenansProdigal預測出來的基因(黃色部份)和其他基因預測軟體預測出來的基因(Glimmer:綠色、GeneMark:紅色)位置比較。

TIGS 發表在 痞客邦 留言(0) 人氣()

20130125_pic1
在Re-sequencing 的分析中,將Paired-end reads 對回到參考序列後的SAM 格式中,其中一個欄位”FLAG”,將會記錄paired-end reads 對回參考序列的特性。FLAG定義reads對回參考序列後的幾種特性,如圖一所式,其計算方法則是將read含有的每一個特性所對應的數值相加。
 

TIGS 發表在 痞客邦 留言(0) 人氣()

20121228_pic1
Fusion gene 從基因體或轉錄體來講,是2個分開的基因的成為1個混合基因(hybride gene)。在生物資訊分析上,若只做map到Reference genome,
生物資訊參數有時會設為90%相似性,即定序長度100bases情況下,有90bases以上核甘酸序列是一樣的,就可map到Reference genome,因此就只能看小片段的 Insertion/deletion。
 
有些研究,是想看virus genome插在chromosome哪個位置,此需要用fusion gene生物資訊分析方式。首先,要將reads map到Reference genome後,因有些reads與Reference genome相似性低,無法將Map上,就會產生unmapped reads。如下圖: 

TIGS 發表在 痞客邦 留言(0) 人氣()

20130104_pic1
比較不同實驗條件下生物體的基因表現量差異,不再只能透過生物晶片觀察螢光反應定量基因表現量,亦可以藉由次世代定序偵測生物體的基因表現 (圖一) (Garber M, 2011)。而從RNA-seq結果尋找具有顯著表現量差異的基因是分析定序資料很重要的一部份,想要精確地定量和正規化定序資料,至少需要考慮兩個因素:基因長度和定序深度(或是總定序資料量)。

TIGS 發表在 痞客邦 留言(0) 人氣()

Blog Stats
⚠️

成人內容提醒

本部落格內容僅限年滿十八歲者瀏覽。
若您未滿十八歲,請立即離開。

已滿十八歲者,亦請勿將內容提供給未成年人士。