有勁的基因資訊 :: 痞客邦 ::

Jun 21 Tue 2016 14:44
分類工具(1) - 支持向量機(Support Vector Machine)

‧什麼是支持向量機(Support Vector Machine)

支持向量機(Support Vector Machine，簡稱SVM)，是一種機械學習(machine learning)中監督式學習(Supervised learning)的方法，可以廣泛的應用於統計分類(classification)和回歸分析(regression analysis)。

SVM最主要的概念，就是希望可以在一個由不同類別混合而成的資料集中，依據一些特徵(feature)，找到一個最佳的超平面(hyper plane)將不同類別的資料分開來。所謂最佳的超平面就是其距離兩個類別的邊界可以達到最大，而最靠近邊界的這些樣本點提供SVM最多的分類資訊，就叫做支持向量(Support Vector)。

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(1) 人氣()

個人分類：生物資訊工具與技術

▲top

Jun 14 Tue 2016 10:34
USP9X基因缺失突變與X性聯遺傳智能障礙疾病研究

每位父母都希望生出一個健康寶寶，然而如果父母的基因里存在缺陷，就有可能生出患有遺傳病的孩子。X性聯遺傳智能障礙疾病 X-linked recessive intellectual disability (ID)在過去的認知中，因為男性只有一個X，所以當唯一的 X 染色體上的基因有缺陷時，隱性不正常基因就會表現，故一般性聯遺傳的疾病患者都以男性為主。而女性的X性聯遺傳智能障礙疾病的研究就不那麼多了。但是於2016年發表於The American Journal of Human Genetics的一篇期刊，主要研究USP9X (Ubiquitin-specific protease 9)基因的缺失突變因而失去功能導致女性特有的發展遲緩 (developmental delay (DD))和先天畸形 (Congenital Malformations)綜合特徵。University of Adelaide的研究已經證實該基因USP9X是開發人類大腦的早期階段的重要關鍵，因此當此基因缺失時就會導致智能缺陷。這些突變，可從一代繼承到下一代，顯現出腦細胞功能會因為此突變導致中斷。

我們的大腦複雜的細胞網絡架構在胚胎中就開始形成。USP9X同時控制初始幹細胞產生的神經細胞，它們彼此連接，並形成適當的網絡能力。毫無疑問地當此網絡細胞出現問題，就會發生如智力障礙，癲癇和自閉症等情況。

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(0) 人氣()

個人分類：基因醫學

▲top

Jun 07 Tue 2016 10:14
我在有勁的日子

我是慈濟大學醫學資訊學系學生張郁琳，於系上提供的資訊系統開發實習課程，來到了有勁生物科技有限公司，具有兩大部門：實驗部門、生資部門，而我的實習單位為生資部門。

生資部門負責任務如下圖橘色區塊的基因檢測流程圖，主要將實驗部門定序後的資料，以電腦處理進一步的生物資訊的基因分析，最後再將其分析結果製作成報告並呈現給客戶。

(基因檢測流程圖，為有勁生物科技有限公司官網流程圖)

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(0) 人氣()

個人分類：其他生命科學議題及研究

▲top

Jun 02 Thu 2016 10:02
高密度脂蛋白膽固醇與心血管危機

一個人的健康與否，跟基因改變與否，有著很大的關係。對於人體內膽固醇的多寡，一般的觀念是好的膽固醇越高越好，而壞的膽固醇則越低越好，這樣我們離心血管疾病就會越來越遠，但是，真的是這樣嗎？

這邊我們要釐清一點，膽固醇沒有所謂好與不好，而所謂好的膽固醇是指高密度脂蛋白膽固醇(HDL-C)，壞的膽固醇是指低密度脂蛋白膽固醇(LDL-C)，他們本身是在膽固醇代謝中扮演運輸的角色。

目前有一篇報導發表在科學期刊三月號，提出一個看法，認為某個基因點位的突變會使得血液中HDL-C增加，但是罹患心血管疾病的風險也跟著增加了！這究竟是怎麼回事呢？讓我們好好的了解一下。

在膽固醇代謝的路徑中，低密度脂蛋白(LDL)是將膽固醇(cholesterol)帶離開肝臟，在周邊血管堆積；而高密度脂蛋白(HDL)則是將周邊血管的膽固醇運回去肝臟代謝。以正常人的情況而言，如果血液中的HDL濃度增加的話，且膽固醇代謝相關基因沒有任何突變的情況，周邊血管的膽固醇累積會減少；反過來說，周邊血管膽固醇累積會增加。

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(0) 人氣()

個人分類：基因醫學

▲top

May 24 Tue 2016 16:34
RNA定序預示馬的生理狀態與健康

近年來，應用NGS定序技術於RNA層面的研究，給予科學家全面性分析及定量生物體中的不同類型的RNA (例如:mRNA, long non-coding RNA, miRNA, rRNA..等)。進而讓我們更了解基因型 (Genotype)及表現型 (Phenotype)之間的關聯性。Monika Stefaniuk在2015年回顧了近幾年多個團隊使用RNA-Seq分析馬的研究成果，主要可分為三個面向，(1) Gene expression profiling (馬的基因表現譜)；(2) Physiological state (馬的生理狀態) ；(3) Hereditary diseases (馬的遺傳疾病)

(1) Gene expression profiling (馬的基因表現譜)

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(0) 人氣()

個人分類：Transcriptom Sequencing

▲top

May 17 Tue 2016 14:33
DNA甲基化與老化

有人透過生物電阻分析儀器估算身體年齡，也有人可以透過膚質檢測計了解肌膚的狀態，目的都是要了解老化的情形，並了解自己是否保養得宜，更重要的是從古迄今，人們害怕變老、害怕死亡及好奇壽命的長短。科學家抽絲剝繭深入的探索並揭露生命的秘密，影響老化的機制，可能包括了DNA本身衰老 (senescence)、端粒縮短 (telomere shortening)、基因表現改變等等。基因外修飾被視為影響基因表現的重要角色，基因外修飾的特點是不會改變DNA本身之序列，而是透過DNA甲基化、histone acetylation等方式，去影響基因的表現。

DNA甲基化在基因體上的總量以及在特定的某些位點的變異程度，會隨著生命週期的發展而有所改變。在新生兒血液中，發現DNA甲基化的量低於各個生命期並在出生後的第一年，DNA甲基化才會開始增加。而增加的位置通常發生在CpG island shores and shelves、enhancers、promoters lacking CpG islands。兒童及青少年的相關研究較少，因此DNA甲基化程度，仍不是很清楚。在成人期則在血液及腦部中，發現DNA甲基化快速增加並且穩定下來，且隨著年紀增加，個體差異會越來越大。成人後期，血中DNA甲基化程度會隨著老化的增加而降低，然而，更深入分析時則發現，原先甲基化較低的區域，如與啟動子(promotor)有關的CpG islands，會隨著老化而增加DNA甲基化，相反的，原先有較高甲基化的區域，如intergenic nonisland CpGs 則是傾向失去甲基。

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(0) 人氣()

個人分類：Genome Sequencing

▲top

May 10 Tue 2016 15:56
NGS與『子宮內膜異位症惡性轉化之卵巢癌』研究

次世代序列定序 (NGS)已被廣泛應用於各種疾病的研究，藉由尋找疾病特有的變異特性了解生物機轉改變的原因，進而應用於精準的醫學檢測及個人化醫療的可能性 (以癌症為例，可參考Oncomine 精準醫學在癌症領域的應用)。台灣團隊 [1]於2016年發表於Journal of Molecular Medicine探討卵巢內的異位性子宮內膜所造成的卵巢癌為例，研究該疾病在台灣患者DNA發生變異的情況及屬於該疾病之個體變異。

前情提要：
卵巢癌被稱為恐怖的隱形殺手，其主因是患者初期不會有明顯的症狀，被確診的時候往往已是晚期且癌細胞已發生轉移，導致致死率極高 (表1)。依照衛福部的統計，卵巢癌在台灣地區103年度之女性十大癌症死亡率排名中的第八名，雖然死亡率相較其他癌症低，但致死率卻是第一名。

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(0) 人氣()

個人分類：次世代定序NGS

▲top

May 03 Tue 2016 13:34
淺談癌症假說

衛福部於2015年6月發表103年十大死因以慢性疾病為主，死亡率依序為(1)惡性腫瘤(2)心臟疾病(3)腦血管疾病(4)肺炎(5)糖尿病(6)事故傷害(7)慢性下呼吸道疾病(8)高血壓性疾病(9)慢性肝病及肝硬化(10)腎炎、腎病症候群及腎病變。

若以年齡觀察，1至24歲死因以事故傷害居首位；25至44歲死因以惡性腫瘤、事故傷害居前二位；45歲以上死因屬慢性疾病之惡性腫瘤、心臟疾病居前二位。65歲以上死亡者占69.8%，以惡性腫瘤居首位，經上述資料得知老化與癌症也許是有極度相關。

在今年初有篇文獻描述Dr. Alfred Knudson (艾爾弗雷德·克努森)所提出 Knudson hypothesis (克努森假說)，解釋癌變 (carcinogenesis)可能是因累積過多的細胞突變而形成，但是最近年來學者研究紛紛提出不只是單一累積細胞突變才會造成癌症，而可能與飲食老化…等等原因也有關連，因此出現新假說”geroncogenesis”，意旨，可能隨著年齡增長導致細胞內某些生理代謝途徑產生變化，進而誘使腫瘤形成的一種研究。如下圖：

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(0) 人氣()

個人分類：基因醫學

▲top

Apr 26 Tue 2016 14:05
16S rRNA總體基因體定序文庫的製備方式與優缺點

隨著定序價格的降低，以及Illumina定序長度的增加，越來越多人改用Illumina HiSeq或MiSeq平台進行16S metagenomics sequencing。定序所需之library製備方式，也不斷地在改進。以下列出幾種常見的幾種16S metagenomics sequencing之library製備方式，以及各自的優點與缺點。

採用 Barcoded 16S rRNA primer & Illumina TruSeq DNA Library Preparation

首先我們須先根據待定序的樣品數目, 設計不同的 16S-barcoded-primer。以16S的V1-V2 region為例，在27F以及338R primer 的5’端加上6-mer的barcod序列 (如下表，粗體底線的部分是barcode序列，其餘則是原本的16S primer序列)。

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(2) 人氣()

個人分類：Metagenome Sequencing

▲top

Apr 19 Tue 2016 10:22
metagenomic sequencing不只是16S rRNA

16S metagenomic sequencing目前被廣泛運用於微生物族群分析，過去無法被培養、被分類手冊定義的微生物，藉由分子實驗為人類所見，且不需要花費高昂的費用即可達成。藉由生物體中16S rRNA中高保存序列中的物種關聯性，來完整演化樹或完成菌相分佈的輿圖。然而16S metagenomics還無法完全滿足人類的求知欲。一方面16S metagenomics在準確性有其極限 (見測不準的微生物community)，且解析度方面亦需要更進一步的技術發展來補足。

　　目前能見度愈見增加的Single-cell sequencing是目前被看好的方法之一。簡單而言，藉由fluorescence-activated cell sorting (FACS)將微生物分出，再利用multiple displacement amplification (MDA)對單一細胞進行序列分析，可以僅針對有興趣的微生物族群做進一步的了解。

　　其序列可對應到已知基因及新陳代謝路徑，並提供對於菌系 (strain)變異性的評估證據，準確地完善原先無法被定義的演化樹分支 (Candidate division)，賦予鄰近微生物物種原先16S metagenomics所欠缺的生物學及演化學定義。其提供的完整序列所帶來的意義為單單分析16S rRNA所無法提供的。

　　Single-cell sequencing所獲得的序列資訊能與其他metagenomic資料及metatrascriptomic資料相搭配，如同同時建構骨幹及血肉，將總體基因分析結果及深度定序資料彼此驗證；另外，由single-cell發展而來的mini-metagenomes亦為目前對於single-cell技術應用的熱門領域，藉由蒐集環境微生物取樣分析，為大環境生物演化的觀察提供良好的視野。

(繼續閱讀...)

Yourgene Health 發表在痞客邦留言(0) 人氣()

個人分類：Metagenome Sequencing

▲top

Apr 12 Tue 2016 12:28
BIOM file format

BIOM全名為Biological Observation Matrix，其發音同 biome。是一種以JSON (JavaScript Object Notation)格式為基礎，設計出能呈現樣本、其觀察數據以及其他相關資料列聯表的格式。目的是希望能廣泛使用在體學 (Omics)研究上，因Omics研究領域中出現的檔案特性之一為其資料矩陣密度不高(例如：含有大量為零的數值)。由於矩陣在程式中常使用二維陣列表示，二維陣列的大小與使用的記憶體空間成正比，如果多數的元素沒有資料，則會造成記憶體空間的浪費。為此，開發BIOM格式作為更適合Omics研究領域的資料型態。

而Omics一詞於希臘原文意指一種整體的研究領域，常聽聞的有蛋白質體學 (Proteinomics)、代謝體學 (Metabolomics)、總體基因體學 (Metagenomics)等。近年來可見體學研究隨時間逐漸成長，或發展出各種與體學相關的資料類型。如圖一。因此，將MEDLINE文獻資料庫這些數據，以已知有限的分析方式如無母數統計中的Chao1分析方法。藉此去推測，隨著科技發展進入“ome-omics”新時代後可能會有超過三千種的Omics。