目前分類:生物資訊工具與技術 (77)

瀏覽方式: 標題列表 簡短摘要

作者:鄭翰欽/有勁基因

 

  細菌,一般人總會聯想到會帶來疾病與不適(如上吐下瀉、肺炎、破傷風、腦膜炎等),甚至還會奪走人們的性命;然而,細菌同時也促進了人們的生活品質。在醫療方面,對抗細菌感染的青黴素就是來自青黴菌;食品方面,人們常吃的優酪乳、優格都是由乳酸菌等發酵而成。只是,不論細菌在人們生活上能提供多大的幫助,還是別忘記,使用不當仍然會影響身體健康的;因此針對細菌產物,衛生品管單位仍需透過一系列檢測,證明其安全無虞後才能放行。例如:美國的Ganeden® Biotech公司想要將Bacillus coagulans GBI-30, 6086 (GanedenBC30) 3這株菌加到配方奶粉內,就得先通過美國食品藥品管理局(FDA; U.S Food and Drug Administration)的公認安全標準(Generally recognized as safe, GRAS) 1 才行。在GRAS的眾多標準中,其中一項就是要確認菌種本身沒有抗生素抗藥性(antibiotic resistance)的基因。一般常見的確認方法是將該菌種的蛋白質序列拿去比對抗生素抗藥性的資料庫,以證明其不帶有相關的基因。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張益祥/有勁生物科技

 

  自從2015年1月歐巴馬提議美國發展精準醫療(Precision Medicine)後,近幾年全球生醫界皆紛紛跟進。那麼,「精準醫療」究竟是甚麼呢?在過去,醫療傳統流程主要是病人先告知醫師症狀,由醫師進行基礎檢查與專業判讀並推估病人疾病類型,經過一連串的檢驗,等到報告結果出爐後才能確診,最後再由醫師依據確診結果施予治療藥物。也就是說,當甲、乙患者皆確診患有相同的A疾病,依照傳統醫療流程,一般都會給予相同或類似的治療A疾病的藥物。但在精準醫療時代,另外還會再參考生物檢測(例如基因檢測等)的結果;這些生物檢測可以找出患者基因變異的位點,透過資料庫比對分析後,便可提供患者更精準的個人化醫療。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:鄭翰欽/有勁生物科技

 

        隨著演算法的日新月異,很多變異點偵測(Variant Calling)軟體陸續被開發出來,如16gt、lancet等等。當然,老牌軟體諸如GATK、freebayes、varscan、vardict等也仍持續進行運作準確度與效率的改善。如今還有些軟體打著AI的旗幟,標榜自己使用AI來辨識變異點(variant),因此可得到極為準確的結果,例如DeepVariant1(相關原理可以參考有勁部落格《結合深度學習與基因檢測的DeepVariant》一文)。然而,究竟哪個軟體的變異點偵測比較準確?想要驗證這一點,就得先要有一個「標準結果」以供評比才行。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:王育彬/有勁生物科技

 

NGS次世代定序以及大量定序資料與生物資訊演算法的發展,讓我們得以更瞭解人類細胞的遺傳訊息,研究學者也因此能透過相關定序應用去預測並解決人類的健康問題⼀特別是現今備受關切的癌症問題。然而,光是藉由探索分子訊息去瞭解與改善疾病其實還不夠,研究「外在環境因子如何影響生理而致病」同樣很重要。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:徐銘鴻/有勁生物科技

 

  現今社會中的智能3C商品俯拾皆是;這些商品藉由許多不同的程式來滿足人類的各種需求。然而萬一程式突然發生錯誤,帶來的問題或傷害會有多嚴重?為了避免發生狀況,各國制訂了許多的規範,以防止因商品突然故障而造成遺憾。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:李覺白/有勁生物科技

 

  資料探勘(Data mining)是透過自動(由演算法自行完成探勘,不需人工介入)或半自動(探勘時仍需依賴人為介入過往處理資料的經驗判斷)的方式,從資料集(dataset)當中探索發掘有意義的資訊或模式的電腦科學,這裡的「模式」指的是「可重複出現的現象」,因此,也可以把資料探勘想成是一門從資料中探索知識的學科。資料探勘也是一門跨領域的學科,其包含了機器學習(machine learning)、人工智能(Artificial Intelligence)、模式辨別(Pattern cognition)、統計學(statistics)及資料庫系統(database systems)等等不同範疇(圖一)。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張美虹/有勁生物科技

 

     總體基因體學(Metagenomics)發展至今,已有數以百計的臨床研究證明人類體內微生物群與疾病之間存在著關聯;只不過,個別研究結果的呈現往往並不一致,而序列數據的處理與分析也缺乏標準方法。尤其在面對大量的研究數據時,該如何組織與整合這些研究成果是個大哉問

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

 

作者:郭任超/有勁生物科技

 

   如今,在醫療記錄從傳統紙本邁入電子病歷的數位資訊時代,區塊鏈的去中心化、資料的不可竄改性以及極低成本等特性,讓醫療界各方都能因此安全地分享彼此資料、或加速藥物的研發速度;「區塊鏈化」成了醫療服務單位及時治療患者的最佳候選方案。從另一個角度來看,由於區塊鏈技術可望解決現今諸如醫療糾紛、患者隱私等問題,健康醫療也被認為是該技術應用最廣泛、最有潛力的領域之一。

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

 

作者:謝維馨/有勁生物科技

 

    進行量化研究時,當我們想要檢定兩組資料的平均數是否具有顯著差異,最常使用的方法是t檢定(t-test)。然而當想要檢定的資料多於兩組時,直觀上我們可以將資料兩兩一組,分別進行多次t檢定,但是這種做法不僅耗時耗力,更會提高第一型誤差(Type I Error) 發生的機率;此時,我們就可以使用變異數分析(Analysis of Variance; ANOVA)來避免此類問題。

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:徐銘鴻/有勁生物科技

 

  對於寫程式的人來說,error和各種bug的出現應該司空見慣。如果是行數較少的小程式,要找出錯誤進行修正倒也還算簡單,但是碰到的程式如果有上千行的話,怎麼辦呢?光是找出錯誤可能就得費上半天光景。從另一方面來看,當程式的規模變大時,受到個人寫程式的習慣與熟練度影響,一些自己不易察覺出的錯誤很容易就會出現。為了預防發生這種情況,單元測試 (Unit test)1 可說是程式開發流程中不可或缺的步驟。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張凱迪/有勁生物科技

 

  隨著NGS在醫療檢測上的應用越來越廣泛,大量例行性的數據分析讓許多定序中心與醫療檢測等單位面臨資料分析承載力與儲存資源不足的窘境。本文以美國食品藥物管理局(FDA)為其資訊運算設備所設計的分析環境(High-Performance Integrated Virtual Environment; HIVE)為範例 1 ,來作為成立NGS大型計畫時需要考量哪些因素的參考。整體來說,一個靈活彈性化的計算環境必須能夠解決以下幾項問題。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:李覺白/有勁生物科技

 

人工智慧(Artificial Intelligence, AI)早在1950年代就被提出;隨著時間的演進,於1980年又衍伸出機器學習(machine learning)這塊領域,但礙於早期電腦及演算法上的效能與限制,能被應用解決的問題始終相當有限。近兩年因為AlphaGo在圍棋上不斷擊敗人類棋王,AI技術再次被人們討論並掀起熱潮。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張美虹/有勁生物科技

 

EzBioCloud1是由韓國企業ChunLab開發、整合了多個生物資訊功能的雲端服務系統。此資料庫主要收錄細菌與古細菌的16S rRNA基因序列與全基因體組裝序列,目的是提供序列的搜尋比對以達成菌種的鑑定與分類,能廣泛應用在細菌/古細菌分類學、生態學,以及環境基因體學研究等領域。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:林志鵬/有勁生物科技

 

凌晨兩點,熱血次世代定序資料分析員的你,不停強打精神盯著電腦看著一堆由NGS序列構成的序列比對圖;突然,不小心打了瞌睡,一頭撞上桌子打翻咖啡……電腦瞬間當機,你看著螢幕想哭但是哭不出來……你累了嗎?保力達蠻X

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:謝維馨/有勁生物科技

 

什麼是決策樹 (Decision Tree)

決策樹(Decision Tree)是常見的資料探勘(Data Mining)技術,主要是使用樹狀分枝的概念來作為決策模式,是一種強大且廣受歡迎的分析方法。

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:王育彬/有勁生物科技

 

資料圖形化(data visualization)是資料統計過程的重要元素,資料要經過適當的圖形化處理,大家才容易找出及理解資料背後所蘊藏的秘密;科學的研究領域中,資料圖形化更是呈現實驗數據的重要工具。論文內容裡,從簡單的長條圖、折線圖,到複雜的樹狀圖及網路圖,各種圖的應用都扮演重要的角色,再加上清楚的圖說,讀者就能簡單地消化研究數據所要傳達的概念。heatmap (熱圖)便是基因研究領域中大量被採用的一種資料圖形化工具。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:鄭翰欽/有勁生物科技

 

由Pacific Biosciences公司(簡稱PacBio)所建立的第三代定序技術─Single Molecule Real Time (SMRT) (相關技術原理可參考有勁2013/11/21部落格文章),其reads長度普遍都能超過10KB,因此可以跨過一些基因體(Genome)上的重複序列,讓組裝(Assembly)過程更容易。然而SMRT定序過程中,直接對單一DNA分子進行定序的話,錯誤率會偏高;若在此過程中使用SMRTbell template對同一條序列進行重複定序,並將這些重複的序列整合成Circular consensus sequencing (CCS) reads,就可將定序錯誤率壓到很低。於是現在愈來愈多人會利用SMRT定序技術去進行基因體定序及後續的組裝。然而,使用SMRT定序所得到的reads為HDF5格式,而非常見的fastq格式,想直接拿SMRT reads結果做分析會很不方便。因此,在這裡要介紹PacBio官方出版的分析軟體─SMRT link給大家參考。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:林志鵬 /有勁生物科技 

 

自2000年6月26日,美國總統柯林頓與英國首相布萊爾共同宣布人類基因組計劃 (Human Genome Project, HGP)工作草圖完成後,人類的染色體序列至今依然持續進行改版。這其中原因包含了:1. 人類的基因體中仍有許多的區域尚未獲得定序結果、2. 定序資料有誤以及 3. 註解資料的更新修正。無法獲得定序結果的原因主要來自於染色體的重複序列:例如染色體的中心區域 (centromere)及染色體末端區域 (telomere)就含有大量重複DNA序列。此種序列受到現今的定序技術限制,無法進行精確定序。此外,人類好幾個染色體區域,在不同人之間會出現一定程度的變異性,例如MHC region。這些區域序列是無法使用單一標準序列來代表。因此每當定序技術有所改進或是註解資料有所更新,人類的染色體序列便會持續進行改版。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張凱迪 /有勁生物科技

 

每當我們要編輯文件的時候,如果同時也想要保留舊版的檔案,最簡單的方式我們會複製不同的資料夾或是檔案名稱來標示,像是我們會用日期或是人名來做分類。但是長期來說,這樣的命名方式常常會產生一些問題,像是可能會忘記某個資料夾或是檔案究竟做了什麼編輯,哪些檔案是一樣的,哪一些檔案比較新。有時候我們還會遇到像是最新的檔案需要與之前某一個檔案整併,或是整併某幾個人的各自編輯的檔案,如果這只由單一個人編輯的話也許還可以保持一致性,但是如果是需要經過多人反覆編輯的話會是一個惱人的工作,更糟的是我們可能覆蓋掉某人編輯的檔案。這時我們會藉由一個專門的版本控制軟體來協助這些工作流程,也許可以減輕我們的負擔。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:謝維馨/有勁生物科技

 

進行統計分析時,常見的資料型態主要有連續型資料及類別型資料兩種。當我們想要檢定連續性資料之間的差異時,我們通常會使用回歸分析或t檢定等檢驗方法;而針對類別型資料,我們最常使用的檢定方法則為卡方分析。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

1 234

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼