我是慈濟大學醫學資訊學系學生張郁琳,於系上提供的資訊系統開發實習課程,來到了 有勁生物科技有限公司,具有兩大部門:實驗部門、生資部門,而我的實習單位為生資部門。
生資部門負責任務如下圖橘色區塊的基因檢測流程圖,主要將實驗部門定序後的資料,以電腦處理進一步的生物資訊的基因分析,最後再將其分析結果製作成報告並呈現給客戶。
(基因檢測流程圖,為有勁生物科技有限公司官網流程圖)
- 實習初期準備
- 因生物資訊處理的工具幾乎都在linux上操作,所以練習了linux指令操作與perl大魔王考題
- 閱讀序列分析相關資料與網站
- 生資主管每周以兩至三個小時作生物資訊分析的教育訓練課程
- 實習中期演練
- 序列變異分析操作工具與軟體
經一連串輸入執行指令、調整閾值或篩選過濾後,進行序列處理,不過光這樣輸入指令不算完成,在開頭步驟還需要運用軟體來判斷定序品質,例如評估定序品質 – FastQC,假如定序品質差,
就要判斷是否是實驗受汙染需重新實驗,或是刪除定序品質差的reads。
(圖為評估定序品質FastQC)
以及最後產出的檔案可以進行預測此變異點是否真正會造成影響,與影響程度 –VEP(Variant Effect Predictor),或者參考許多現有基因與疾病相關的資料庫,才能達到最後的分析結果。
(圖為預測變異之影響VEP)
還有操作IGV(Integrative Genomics Viewer),以視覺介面來呈現序列變異、基因體資料。
(圖為IGV介面)
- 閱讀1000 Genomes Project
這項全球性的大計畫彙集與提供人類群體的基因變異資料,閱讀了相關資訊與三大階段進程意義。
圖為1000 Genomes Project)
- Perl 抓取網頁的資料
由於生物相關資訊數量多,且有時所需的參數繁多,所以想要做資料存取不可能人工點擊,在公司裡我學著以Perl語言擷取網頁的資料,例如PharmGKB是結合臨床藥物和基因資訊關係的資料庫,寫程式以網頁代理人方式做瀏覽網頁的動作,像是點擊進入連結、登入帳號密碼、點擊與輸入參數、抓取所需資訊。
- 實習結尾ending
- 操作GATK(Genome Analysis Toolkit)
應用於序列變異的最後分析步驟,而GATK具有嚴格的篩選條件,所以當整套流程分析完成後,能產生可靠性高的詳細Variants註解檔(VCF檔)。
- 實習心得
這學期二月至六月的實習時間其實很短暫,從學習與練習序列分析後卻驚覺實習到結尾了,但從基礎一步步延伸到學會序列變異分析很有成就感,也讓我明白變異點的繁瑣分析步驟,要由大量資料找尋變異點,不過這個變異是真的變異或是定序錯誤,會需要再做判斷、調整、篩選,而如果確定是變異,還需對照現有資料庫查看是否會影響人體健康,像是倒金字塔般層層篩選出最後具影響力的真變異點。
公司環境乾淨明亮,而且生資主管與同事都會熱心教導與照顧我,重點是學習和體驗到與學校不同的知識與生活,也了解生資領域中的序列分析現在外界的需求是什麼,但是想要成為像生資部門這樣的基因序列分析人員,我真的還要再加油再加油了!
有勁,我很喜歡這裡!謝謝生資部門!謝謝有勁!
留言列表