目前分類:生物資訊工具與技術 (83)

瀏覽方式: 標題列表 簡短摘要

作者:黃千容/有勁基因

 

  PICRUSt2 (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States)是一套根據標記基因的序列去預測微生物基因功能的工具。相較於初版,這個2013年所發行的第二版,其改版部分包括:可以使用任何16s的序列(OTUs或ASVs)去進行預測、參考基因體的資料庫擴增10倍以上、並增加了MetaCyc代謝途徑的預測結果等等1, 2。本文就不詳細說明改版內容,而是直接解釋要如何將PICRUSt2運用在微生物基因功能的預測分析上,並介紹程式指令與常用參數,以及輸出的結果。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張家豪/有勁基因

 

有勁部落格文章《Illumina 平台上的「標籤跳躍」現象》中曾提到,NovaSeq™6000在兩天內就能量產出高達2 Tb的定序資料。為了節省成本會將多個樣品基因庫(library)混和定序,定序完成後會再經過一道「多工解訊(demultiplexing)」的步驟,將混和的樣品根據標籤(Index)分離出來。但是,萬一遇到未曾進行多工解訊處理的定序資料,該怎麼辦呢?這裡就以實際案例來跟讀者作個介紹。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張益祥/有勁基因

     

  我們在進行總體基因體學(Metagenomics)16S序列分析的時候,常常會為了如何有效運用辛苦實驗所定序出來的序列而絞盡腦汁,還好有不少這個領域的大神們相繼開發出相關演算法來幫忙解決問題,嘉惠眾人。本篇文章就要來介紹針對操作分類單元(Operational taxonomic units; OTUs)叢集分群以及校正擴增子序變異(Amplicon sequence variants; ASVs)錯誤而開發出來的兩種演算方法,順便比較一下之間的差異性。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張家豪/有勁基因

 

  隨著次世代定序技術的普及,定序價格下降讓愈來愈多學者得以利用這個技術平台進行定序。但是,定序完的資料該如何作分析呢?至於R語言,又和次世代定序有什麼關係呢?

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張家豪/有勁基因

 

  人類、細菌、病毒等基因體研究的大量基因資訊,該如何才能簡單明瞭地呈現出來呢?2009年,加拿大卑詩省癌症研究機構BCCA (The BC Cancer Agency)的生物資訊團隊在Genome Research上發表了一篇論文1,提供大家一個可以視覺化基因體序列相關數據的工具─Circos。Circos可以同時將直方圖、折線圖、熱圖等多種類型的圖表資訊整合在一起,以圓形圖像格式輸出。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張益祥/有勁基因

 

  現在人常被生活壓力追著跑,睡眠不正常等原因,導致癌症病患日益增多,身體健康檢查因此變成「全民運動」,有些佛心公司甚至掏腰包幫自家員工做健檢。身體健康檢查前,受檢者都會先填寫病歷表,表格中一定有一欄是「家族病史」。家族病史顧名思義就是紀錄某疾病在家族成員中發病的狀況,而家族成員也不僅僅侷限於親代與子代,更可以上推至祖父母等直系親屬,顯示遺傳影響深遠,所以請別輕忽家族病史的重要性。那麼,家族疾病究竟是源自哪個親代的哪些基因位點的什麼變異所造成的呢?健康檢查結合全外顯子定序(Whole Exome Sequencing; WES)這個技術,就可以幫助醫生找到答案。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:鄭翰欽/有勁基因

 

  細菌,一般人總會聯想到會帶來疾病與不適(如上吐下瀉、肺炎、破傷風、腦膜炎等),甚至還會奪走人們的性命;然而,細菌同時也促進了人們的生活品質。在醫療方面,對抗細菌感染的青黴素就是來自青黴菌;食品方面,人們常吃的優酪乳、優格都是由乳酸菌等發酵而成。只是,不論細菌在人們生活上能提供多大的幫助,還是別忘記,使用不當仍然會影響身體健康的;因此針對細菌產物,衛生品管單位仍需透過一系列檢測,證明其安全無虞後才能放行。例如:美國的Ganeden® Biotech公司想要將Bacillus coagulans GBI-30, 6086 (GanedenBC30) 3這株菌加到配方奶粉內,就得先通過美國食品藥品管理局(FDA; U.S Food and Drug Administration)的公認安全標準(Generally recognized as safe, GRAS) 1 才行。在GRAS的眾多標準中,其中一項就是要確認菌種本身沒有抗生素抗藥性(antibiotic resistance)的基因。一般常見的確認方法是將該菌種的蛋白質序列拿去比對抗生素抗藥性的資料庫,以證明其不帶有相關的基因。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張益祥/有勁生物科技

 

  自從2015年1月歐巴馬提議美國發展精準醫療(Precision Medicine)後,近幾年全球生醫界皆紛紛跟進。那麼,「精準醫療」究竟是甚麼呢?在過去,醫療傳統流程主要是病人先告知醫師症狀,由醫師進行基礎檢查與專業判讀並推估病人疾病類型,經過一連串的檢驗,等到報告結果出爐後才能確診,最後再由醫師依據確診結果施予治療藥物。也就是說,當甲、乙患者皆確診患有相同的A疾病,依照傳統醫療流程,一般都會給予相同或類似的治療A疾病的藥物。但在精準醫療時代,另外還會再參考生物檢測(例如基因檢測等)的結果;這些生物檢測可以找出患者基因變異的位點,透過資料庫比對分析後,便可提供患者更精準的個人化醫療。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:鄭翰欽/有勁生物科技

 

        隨著演算法的日新月異,很多變異點偵測(Variant Calling)軟體陸續被開發出來,如16gt、lancet等等。當然,老牌軟體諸如GATK、freebayes、varscan、vardict等也仍持續進行運作準確度與效率的改善。如今還有些軟體打著AI的旗幟,標榜自己使用AI來辨識變異點(variant),因此可得到極為準確的結果,例如DeepVariant1(相關原理可以參考有勁部落格《結合深度學習與基因檢測的DeepVariant》一文)。然而,究竟哪個軟體的變異點偵測比較準確?想要驗證這一點,就得先要有一個「標準結果」以供評比才行。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:王育彬/有勁生物科技

 

NGS次世代定序以及大量定序資料與生物資訊演算法的發展,讓我們得以更瞭解人類細胞的遺傳訊息,研究學者也因此能透過相關定序應用去預測並解決人類的健康問題⼀特別是現今備受關切的癌症問題。然而,光是藉由探索分子訊息去瞭解與改善疾病其實還不夠,研究「外在環境因子如何影響生理而致病」同樣很重要。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:徐銘鴻/有勁生物科技

 

  現今社會中的智能3C商品俯拾皆是;這些商品藉由許多不同的程式來滿足人類的各種需求。然而萬一程式突然發生錯誤,帶來的問題或傷害會有多嚴重?為了避免發生狀況,各國制訂了許多的規範,以防止因商品突然故障而造成遺憾。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(1) 人氣()

作者:李覺白/有勁生物科技

 

  資料探勘(Data mining)是透過自動(由演算法自行完成探勘,不需人工介入)或半自動(探勘時仍需依賴人為介入過往處理資料的經驗判斷)的方式,從資料集(dataset)當中探索發掘有意義的資訊或模式的電腦科學,這裡的「模式」指的是「可重複出現的現象」,因此,也可以把資料探勘想成是一門從資料中探索知識的學科。資料探勘也是一門跨領域的學科,其包含了機器學習(machine learning)、人工智能(Artificial Intelligence)、模式辨別(Pattern cognition)、統計學(statistics)及資料庫系統(database systems)等等不同範疇(圖一)。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張美虹/有勁生物科技

 

     總體基因體學(Metagenomics)發展至今,已有數以百計的臨床研究證明人類體內微生物群與疾病之間存在著關聯;只不過,個別研究結果的呈現往往並不一致,而序列數據的處理與分析也缺乏標準方法。尤其在面對大量的研究數據時,該如何組織與整合這些研究成果是個大哉問

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(1) 人氣()

 

作者:郭任超/有勁生物科技

 

   如今,在醫療記錄從傳統紙本邁入電子病歷的數位資訊時代,區塊鏈的去中心化、資料的不可竄改性以及極低成本等特性,讓醫療界各方都能因此安全地分享彼此資料、或加速藥物的研發速度;「區塊鏈化」成了醫療服務單位及時治療患者的最佳候選方案。從另一個角度來看,由於區塊鏈技術可望解決現今諸如醫療糾紛、患者隱私等問題,健康醫療也被認為是該技術應用最廣泛、最有潛力的領域之一。

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

 

作者:謝維馨/有勁生物科技

 

    進行量化研究時,當我們想要檢定兩組資料的平均數是否具有顯著差異,最常使用的方法是t檢定(t-test)。然而當想要檢定的資料多於兩組時,直觀上我們可以將資料兩兩一組,分別進行多次t檢定,但是這種做法不僅耗時耗力,更會提高第一型誤差(Type I Error) 發生的機率;此時,我們就可以使用變異數分析(Analysis of Variance; ANOVA)來避免此類問題。

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:徐銘鴻/有勁生物科技

 

  對於寫程式的人來說,error和各種bug的出現應該司空見慣。如果是行數較少的小程式,要找出錯誤進行修正倒也還算簡單,但是碰到的程式如果有上千行的話,怎麼辦呢?光是找出錯誤可能就得費上半天光景。從另一方面來看,當程式的規模變大時,受到個人寫程式的習慣與熟練度影響,一些自己不易察覺出的錯誤很容易就會出現。為了預防發生這種情況,單元測試 (Unit test)1 可說是程式開發流程中不可或缺的步驟。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張凱迪/有勁生物科技

 

  隨著NGS在醫療檢測上的應用越來越廣泛,大量例行性的數據分析讓許多定序中心與醫療檢測等單位面臨資料分析承載力與儲存資源不足的窘境。本文以美國食品藥物管理局(FDA)為其資訊運算設備所設計的分析環境(High-Performance Integrated Virtual Environment; HIVE)為範例 1 ,來作為成立NGS大型計畫時需要考量哪些因素的參考。整體來說,一個靈活彈性化的計算環境必須能夠解決以下幾項問題。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:李覺白/有勁生物科技

 

人工智慧(Artificial Intelligence, AI)早在1950年代就被提出;隨著時間的演進,於1980年又衍伸出機器學習(machine learning)這塊領域,但礙於早期電腦及演算法上的效能與限制,能被應用解決的問題始終相當有限。近兩年因為AlphaGo在圍棋上不斷擊敗人類棋王,AI技術再次被人們討論並掀起熱潮。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:張美虹/有勁生物科技

 

EzBioCloud1是由韓國企業ChunLab開發、整合了多個生物資訊功能的雲端服務系統。此資料庫主要收錄細菌與古細菌的16S rRNA基因序列與全基因體組裝序列,目的是提供序列的搜尋比對以達成菌種的鑑定與分類,能廣泛應用在細菌/古細菌分類學、生態學,以及環境基因體學研究等領域。

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

作者:林志鵬/有勁生物科技

 

凌晨兩點,熱血次世代定序資料分析員的你,不停強打精神盯著電腦看著一堆由NGS序列構成的序列比對圖;突然,不小心打了瞌睡,一頭撞上桌子打翻咖啡……電腦瞬間當機,你看著螢幕想哭但是哭不出來……你累了嗎?保力達蠻X

 

文章標籤

Yourgene Health 發表在 痞客邦 留言(0) 人氣()

1 2345
Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼