作者:鄭翰欽/有勁生物科技
由Pacific Biosciences公司(簡稱PacBio)所建立的第三代定序技術─Single Molecule Real Time (SMRT) (相關技術原理可參考有勁2013/11/21部落格文章),其reads長度普遍都能超過10KB,因此可以跨過一些基因體(Genome)上的重複序列,讓組裝(Assembly)過程更容易。然而SMRT定序過程中,直接對單一DNA分子進行定序的話,錯誤率會偏高;若在此過程中使用SMRTbell template對同一條序列進行重複定序,並將這些重複的序列整合成Circular consensus sequencing (CCS) reads,就可將定序錯誤率壓到很低。於是現在愈來愈多人會利用SMRT定序技術去進行基因體定序及後續的組裝。然而,使用SMRT定序所得到的reads為HDF5格式,而非常見的fastq格式,想直接拿SMRT reads結果做分析會很不方便。因此,在這裡要介紹PacBio官方出版的分析軟體─SMRT link給大家參考。
SMRT link最大的特點是它提供了兩種模式:command line模式和網頁操作介面模式。對一般人來說,command line模式極難上手,故這裡先不談。至於網頁模式,它的介面如圖一所示。
圖一、SMRT link網頁介面
圖片來源:SMRT link網頁介面截圖;PACBIO (2017) SMRT link user guide. Sequel® System
SMRT link介面提供5個功能,其中我們會用到的是最後兩個:Data Management和SMRT analysis。Data Management可用來管理資料(見下圖二)。使用者可以在這裡管理現有資料(見下圖三),或是點選import來匯入資料。Import選項中,可選的格式有:Reference、Sequel sequence Data、RSII data、Barcodes等。其中Sequel和RSII為SMRT sequencer的機型,看當初定序使用的機型是哪一種,就選擇相對應的選項。
圖二、Data Management功能介面
使用者可點選Name那一欄(藍框所示區域)來觀看此資料的詳細內容。或是選擇上方指令選項〝VIEW OR IMPORT SEQUENCE DATA〞(紅框所示)來匯入資料。圖片來源:SMRT link網頁介面截圖;PACBIO (2017) SMRT link user guide. Sequel® System
圖三、匯入資料格式選項
紅色框標示區為匯入資料格式選項,可依據要匯入的資料來選擇適當的資料種類,其中RSII和Sequel都是SMRT sequencer的機型。圖片來源:SMRT link網頁介面截圖;PACBIO (2017) SMRT link user guide. Sequel® System
SMRT analysis功能可用來分析資料。在這邊它會列出所有分析過(或正在分析)的資料、狀態和分析類型(見下圖四)。已經完成的分析,其狀態(State)會顯示SUCCESSFUL,此時使用者可以點進去看分析結果。若使用者想要進行新的分析,則是按〝+CREATE NEW ANALYSIS〞接著再選擇想要分析的項目,如基因體的組裝等(見下圖五)。
圖四、SMRT analysis功能操作介面
State欄位顯示此計畫的狀態,當此計畫狀態顯示為SUCCESSFUL時,代表分析已經完成,此時可選擇計劃名稱(藍框所示)來看分析結果;選擇〝+ CREATE NEW ANALYSIS〞則可進行新的分析。圖片來源:SMRT link網頁介面截圖;PACBIO (2017) SMRT link user guide. Sequel® System
圖五、分析選項畫面
使用者可以在這邊選擇想要分析的資料(藍框所示),並選擇想要使用的分析功能(紅框所示)進行分析。圖片來源:SMRT link網頁介面截圖;PACBIO (2017) SMRT link user guide. Sequel® System
不過這邊要注意的是,倘若資料格式為RSII,唯一能選擇的就只有轉檔了。因為SMRT link在分析時,沒有辦法直接使用最原始的h5格式;故一定要先轉檔,轉換之後,再去選擇格式(bam data)來做後續的分析(見下圖六)。
圖六、RSII資料格式轉檔畫面
使用者可以在這邊選擇想要轉換的RSII資料(籃框所示)。並選擇〝Convert RS to Bam〞(紅框所示)來轉檔。圖片來源:SMRT link網頁介面截圖;PACBIO (2017) SMRT link user guide. Sequel® System
是不是看起來很簡單,很容易上手?如果想要用用看,可以去PacBio官網下載這套免費軟體並依照說明書進行安裝;以後對PacBio的資料進行轉檔和後續分析就容易多了。
參考資料
- 1. SMRT link user guide. Sequel® System. 2017, Pacific Biosciences of California, Inc.
- 2. SMRT link software installation (v5.0.1). Pacific Biosciences of California, Inc.
留言列表