何謂ChIP-Seq?

ChIP–seq ( Chromatin immunoprecipitation sequencing )是指染色質免疫沉澱後,所獲得的DNA片段進行高通量定序,並將此片段利用生物資訊的軟體對回至基因體,可以瞭解DNA-binding proteinshistone modifications的狀況,進而得知染色结合的調控因子的相互作用關係。

 

ChIP-chipChIP-Seq差異?

TIGS 發表在 痞客邦 留言(1) 人氣()

    次代定序( Next- generation sequencing, NGS ) 的技術自發展以來,應用層面相當之廣泛,舉凡:學術研究、醫學檢測、藥品查驗以及考古起源等,日新月異的定序技術發展之下,使得原本躓礙不前的考古科研有另一層突破性進展,本篇主旨探討利用NGS 巧妙的運籌帷幄,一窺歷史的跡象,揭開對古代生物迷思。古人曾云:「以史為鏡,可以知興替」。古老生物的遺傳密碼在NGS 抽絲剝繭下,間接了解生物演進,這些遠古的遺傳物質aDNA ( ancient DNA ) 經長年累月的歲月摧殘,會產生一些自發性的變異及損壞 ( 如:氧化、水解與 DNA crosslink ),或因外發性的降解 ( 如環境中的微生物所分泌核酸水解酵素,直接崩解 DNA 結構)。形成aDNA 三個主要特性:短片段、嘌呤丟失作用( depurination ) 與去胺基作用( deamination ) (Sawyer et al., 2012),亦在先前之『利用NGS觀察DNA降解現象』一文中,詳細敘述相關的發生過程及原理,但這些現象往往左右定序的正確性,容易造成鹼基配對錯誤 ( misincorporation 或稱 miscoding lesions ) 現象,導致產生錯誤的序列訊息,以下就由三方面的研究作介紹。

壹、遠古動物的研究方面:

    Stiller 等學者在 2006 年的研究,發現猛瑪象的 aDNA 序列,有以下現象:一、異類鹼基置換 ( transversion ):嘧啶與嘌呤間的置換,二、同類鹼基置換(transition):嘌呤之間或嘧啶之間的取代,造成定序的潛在誤配 (圖一),也因為有NGS的大量定序,顛覆研究古代基因組的模式,跳脫以往對於DNA的配對概念。另外,從時間角度來看,aDNA 的變化不易隨時間推移,而增加片段的瑣碎程度,Sawyer等學者觀察從幾十年一直到幾萬年的粒腺體DNA ( mitochondrial DNA, mtDNA ) 片段平均大小,研究發現似乎無太大差異,如紅點所示幾乎都集中分佈在40100 bp的片段範圍(圖二)

20120906_pic1 

TIGS 發表在 痞客邦 留言(0) 人氣()

遺傳學上將複雜疾病(complex disease)定義為多基因性(polygenic)或是多因性(multifactorial)造成的疾病,可能由多個組合的基因變異和環境因子促進而成。已知這種特性的疾病包含氣喘、乳癌、慢性白血病、肺腺癌、部分精神疾病、第二型糖尿病等等一百多種。除此之外部分的疾病還會有相同的症狀。最近新聞上有一組美國研究團隊與台灣和泰國的醫院合作發現一種俱有和愛滋病類似症狀的遺傳疾病-成人免疫缺乏症候群(http://www.nejm.org/doi/full/10.1056/NEJMoa1111160)也被認為是多因性的疾病。患有此病的人都是亞洲人,或亞洲出生、住在其他地方的人,因此該疾病可能和遺傳或是環境有關。

 

複雜疾病常涉及多個基因(上千或是上百個基因),使得研究這種疾病的病理並不容易有一個很好的對象(相對於由單一或是單一組合突變所引起的疾病)。因此當在比較患者和健康者之間的基因表現差異或是 SNP的差異時,常會發現患有相同疾病的基因差異數量不僅很多,並且還是不同基因的多種組合。在生物網路學方面常會將高通量的實驗所發現的表現量差異作分類,挑出俱有相同表現量變化的基因做聯結,因此可以構成一個以基因為節點的大型網路。這樣的網路和蛋白質交互作用(PPI)的網路有類似的特性,基因之間的聯結代表某些關聯,而彼此之間有高密度相互關聯的基因會被稱為基因模組(module)。一般認為致病基因可能就在這些表現量差異高密度相關的模組裡。

 

TIGS 發表在 痞客邦 留言(0) 人氣()

NCBI、GenBank等序列資料庫的開放性使許多人的研究如虎添翼,特別是那些早被定過千千萬萬條序列的模式物種,各種基因的序列、註解與表現量資訊皆可信手拈來。反之,以往非模式物種的研究者卻常常必須使用痛苦指數很高的工具如degenerate PCR除草開路,或是在經費限制下使用表現序列標幟(Expressed sequence tag, EST)取得所需的序列資源。

 

但EST library的資訊量依舊有限,雖然能比較部分基因表現量的差異,卻會忽略掉許多表現量較少的基因。現在,你能選擇使用次世代定序儀建造自己的transcriptome sequence database,讓所有有興趣的序列信手拈來。有篇文獻正好說明這麼做的好處。

20120828_pic1

TIGS 發表在 痞客邦 留言(0) 人氣()

    DNA 的甲基化現象 (DNA methylation) 是表觀基因體機制 (epigenetic mechanism) 中的一種,其對於真核生物基因調控而言是非常重要,真核生物基因的 5’ 端,常可見到高密度的雙鹼基 C-G 存在,其被稱為 CpG islands,而其中大約有 2-7%的胞嘧啶 (Cytosine),藉著 DNA 甲基轉移酶 (DNA methyltransferase) 作用下被甲基化。另外,在原核生物中,DNA 甲基轉移酶主要的功用是用作保護自己 DNA的手段,以避免遭受內生的限制酶剪切,而利用限制酶對付外來侵略性的 DNA,而在真核生物中,也有藉由 DNA 甲基化來避免 retrovirus 表現的防禦機制被報導過,但無論如何,最主要的功能還是在於調控基因表現為主。

    研究 DNA methylation 現象的實驗方法有許多種,包括重亞硫酸鹽 (bisulfate) 和非重亞硫酸鹽 (non-bisulfite) 的方法,在樣品處理重亞硫酸鹽的部分,胞嘧啶(Cytosine) 會脫去胺基變成尿嘧啶 (Uracil),但是被甲基化的胞嘧啶不會被改變,經 PCR 放大之後定序,比對原有參考物種序列,可以知道哪些胞嘧啶發生了點突變,沒有突變的胞嘧啶,有可能就是被甲基化的候選,在非使用重亞硫酸鹽的方法中,主要是使用對甲基化敏感的限制酵素來當作工具,隨後搭配AFLP (amplified fragment length polymorphism) 技術來做研究。

    2008 年,致力於開發 Optical mapping技術的 Schwartz 團隊,發表一篇利用這項技術來研究DNA 甲基化現象的期刊,他們首先在 E. coli 上做測試,當發現這項結合可行之後,將頭腦動到真核生物中,同樣被熱門研究的人類染色體上。在真核生物上進行 Optical mapping 時,較於原核生物容易出現一個問題

,即是不一定有能製造出足夠切位的限制酶,當電腦分析切位不足的單分子 DNA 影像時,無法轉換成鑑別性高的條帶 (barcode) 資訊,因此會面臨片段重組上的難題。在他們進行人類第九號染色體DNA 甲基化現象研究時,嘗試使用 2 種以上的限制酶來克服上述的問題,一種是在非重亞硫酸鹽研究方法中提到對甲基化敏感的限制酶:EagI (C^GGCCG),另一種是辨識切位完全與前一種不會重疊、對於 CMepG 甲基化不敏感、用來製造條帶資訊的限制酶:SwaI (ATTT^AAAT)SwaI 在人類基因體序列中,按照電腦分析大致上能切碎成平均約 15 kb 的片段,而 EagI 在不考慮甲基化情形下,按照電腦分析大致上能切碎成平均約 32 kb 的片段。如同預期的,EagI 的辨識切位可涵蓋了 78%、大約 27,437 個 CpG islands,而其中大約一半的是獨一切位,將這項預測結果搭配上用來製造條帶的SwaI 實際進行Optical mapping 實驗,電腦記錄分析了實際實驗後的結果 (圖一),並組成了一些 contig 片段,再與電腦模擬片段去做平行比較。

TIGS 發表在 痞客邦 留言(0) 人氣()

真核生物rRNA包含28S、18S、5.8S、5S四種rRNA,一般在判斷RNA是否有降解時,會去觀察28S與18S rRNA的狀況,在RNA品質佳的狀態下,28S rRNA總量應為18S rRNA的兩倍左右,如下圖分別為哺乳動物的RNA proflie,

20120817_pic1   


TIGS 發表在 痞客邦 留言(0) 人氣()

之前我們探討了兩種會造成組裝過程產生錯誤結果的因素,這次我們要再來探討第三種因素。

3.重複區域Repeat region

20120810_darren_pic1  

假設我們將NGS的定序資料隨機抽取出三條reads (紅色線條),發現這三條reads的尾端(藍色區域)均有相同的序列,所以藍色區域即為repeat region。當遇到這種情況時,程式會無法判定究竟哪兩條reads應該要組合在一起。但是假如我們使用paired-end reads,即可解決此一問題。如圖示:

TIGS 發表在 痞客邦 留言(0) 人氣()

當我們利用NGS定序儀器所產出的資料格式為FASTQ,細節的說明可參閱之前的介紹(http://yourgene.pixnet.net/blog/post/84563506),其後續的生物資訊分析步驟中,如定序的物種有已知的基因體參考序列,則可將定序出來的short reads針對已知的基因體參考序列做alignment。

 

傳統的alignment分析過程,最常使用的工具就是BLAST(Basic Local Alignment Search Tool),不過由於NGS的技術所產出的資料特點是資料量龐大,序列片段都較短,針對NGS產出的資料如使用傳統的BLAST針對已知的基因體參考序列做alignment是非常沒有效率的。因此在近幾年針對NGS的資料所設計的alignment工具大量的被發展出來。

 

TIGS 發表在 痞客邦 留言(0) 人氣()

現代人長時間生活在辦公室的空間,工作空間裡潛藏了許多的細菌,與我們朝夕相處的細菌到底有多少?有哪些種類的細菌?這些細菌會致病嗎?辦公室的哪些地方有特別多細菌?男生所處的環境真的比女生擁有更多的細菌嗎?           Hewitt的研究團隊在美國的三個不同城市,隨機挑選九十個辦公室,針對每個辦公室裡的椅子、電話、電腦、滑鼠、鍵盤及桌面約13平方公分面積的區域做細菌採樣,而這些辦公室的使用者分別為男女生各半。首先,作者將樣品稀釋後塗在R2A media的培養基上,經過五天的培養,統計樣品內的菌量,結果如下圖所示,橫軸及縱軸代表的意義分別為樣品的來源及細菌的數量,結果顯示椅子及電話上的菌量高於桌面、鍵盤及滑鼠,另外,男性使用的辦公用品得到的菌量比女性的多,而在不同城市的來源上,舊金山的辦公室菌量是三個城市中最低的,上述的菌量的差異作者使用ANOVA分析的確是有意義的差異性。20120803_pic1  

在菌種分析上,由於環境中的細菌組成複雜,無法以培養方式辨別樣品裡面所有的細菌種類,所以作者先將樣品中的DNA萃取出來,以PCR的方式將16S rRNA基因的高度變異區放大,並且將此產物以NGS技術定序,並且分析這些序列以得到細菌的種類。結果顯示這些辦公室用品附有二十種門中超過五百屬的細菌,其中含量最多的為變形菌門(Proteobacteria),其他比例由高至低依序是厚壁菌門(Firmicutes)、放線菌門(Actinobacteria)擬桿菌門Bacteroidetes,不同樣品細菌種類的相對比例圖如下。

20120803_pic2  

 與之前做人體各部位菌相的研究相比較2.3.4,辦公室環境中的細菌種類大多也出現在皮膚及口腔,另外特別的是,部分的種類與在人體的消化道內的菌種相同,辦公室細菌種類中,也有些會出現在土壤裡面的細菌,這些結果可以協助推測可能的細菌來源。

TIGS 發表在 痞客邦 留言(1) 人氣()

piRNA 又稱為 piwi-interacting RNA為 small non-conding RNA 的主要類別之一,piRNA 主要具備幾個特性:

  1. 目前僅在動物細胞中被發現
  2. 目前常見動物的生殖腺細胞中
  3. 長度大約是 26~31 nt
  4. 5’ 端偏好以 U 做為起始

 

 為了探索piRNA 的生成與機制,有人利用 NGS 的方法試著找出 piRNA 可能存在的 profile。

在該研究中,研究人員分別從8天、17天大的老鼠和成熟的老鼠睪丸上取得「Type A精原細胞 (Type A spermatogonia, A)」、「粗絲期晚期精母細胞 (pachytene spermatocytes, PS)」、「圓形精細胞 (round spermatids, RS)」,利用電泳之方式,選出長度在 18-26 nt 之 small RNAs,然後將這些 small RNA 進行定序。

TIGS 發表在 痞客邦 留言(0) 人氣()

隨著越來越多的基因體被定序,如何有系統地且大規模的收集和整理基因的功能和所在的生物路徑,顯得越來越重要。例如,可以透過Enzyme Commission number(EC number)得以了解酵素的分類和所催化的化學反應。在生物資訊領域,Gene Ontology (簡稱為GO)常用來協助了解一群感興趣的基因產物。

 

Gene Ontology是由Gene Ontology Consortium1998年所發起的計畫,主要目標為訂定對於所有基因功能之分類標準,起初整合了三個模式生物的資料庫,分別為FlyBase (果蠅)Saccharomyces Genome Database (酵母菌)the Mouse Genome Database (小鼠),現在已經GO的範圍已經涵蓋到原核生物和其他真核生物。

GO資料庫主要包含三個分支:

TIGS 發表在 痞客邦 留言(2) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼