在大家的研究的過程中,應該很容易遇到需要將組裝的基因體上傳到NCBI資料庫上的需求。現在這些步驟,可以很輕易地使用一連串NCBI提供的網頁介面或是工具完成,這篇文章就來簡單的介紹這些工具該如何使用。

利用 NCBI Submission Portal 上傳 draft genome

2014NCBI更新Whole Genome Shotgun (WGS)資料的上傳方式之後,現在上傳draft genome (意即組裝序列中間有N,或是未完全連接起來的scaffolds)的步驟變得非常簡易以及方便。可以直接根據網站上的指示,一步步地完成上傳工作。

首先登入你的NCBI帳號,並開啟Submission Protal頁面(https://submit.ncbi.nlm.nih.gov/),如下圖,便可以看到Genome (WGS) 的上傳頁面

0830-1.png

只要跟著頁面的指示,將所有分頁的資訊都填寫完畢,就完成了。若先前已經有申請過BioProjectBioSample的話,可在後續頁面中填入accession number,若沒有也沒關係,在submission的流程中會自動幫你建立,所有資料都填寫完畢後,再根據指示上傳組裝完成的fasta檔案,所有流程結束之後會收到NCBI寄給你的確認信件,如下圖:

0830-2.png

後續可能會再次收到NCBI寄送的信件,詢問有關上傳的基因體的一些問題,以及一些需要補充的資訊,回覆完問題之後,接下來就是等待NCBI審核完畢了。

利用tbl2asn製作complete genomeASN.1檔案(*.sqn)並上傳

若要上傳完整的基因體組裝資料,則就比較麻煩一些了。我們需要使用tbl2asn這支程式,將fasta檔案和基因體相關資訊合併為NCBI接受的sqn格式。tbl2asnNCBI提供的一個 command-line工具,可以在NCBI FTP下載(ftp://ftp.ncbi.nih.gov/toolbox/ncbi_tools/converters/by_program/tbl2asn/) LinuxMacWindows版本均有提供。tbl2asn執行時所需要準備的必要檔案如下:

必要檔案及資訊:

1. Fasta file (基因體組裝結果,當多個chromosome時,可併為一個或多個檔案)

2. Template file (上傳者、文獻、BioProjectBioSample資訊,可至https://submit.ncbi.nlm.nih.gov/genbank/template/submission/ 頁面產生。

BioProjectBioSample accession number可先利用NCBI Submission Portal申請)

非必要檔案:

3. ASM file (Genome-Assembly-Data Structured Comment,包含組裝方式、定序深度及定序平台等資訊,可至https://submit.ncbi.nlm.nih.gov/structcomment/genomes/ 頁面產生)

4. Feature Table (如上傳之基因體需要加上自己的基因註解,則需要此檔案)

執行流程 (以下內容以windows版本,不含Feature table資訊來介紹)

將上述檔案都準備好了之後,和下載下來並解壓縮的tbl2asn主程式放在同一個資料夾下,之後在Windows的命令提示字元執行

tbl2asn.exe -i genome.fasta -t template.sbt -w genome.asm -M n -Z discrep

執行完後便會產生genome.sqn 檔案了(請見以下截圖)

0830-3.png

0830-44.png

0830-5.png

若要將物種名稱加入,除了可直接修改 fasta 檔案 ”>” 後面的文字之外,也可使用tbl2asn並搭配 -j 參數完成,如:-j "[organism=Saccharomyces cerevisiae] [strain=S288C]" (見以下截圖)

0830-66.png

上述指令執行完後,除了sqn檔案之外,另外還會產生discrep (Discrepancy Report)以及附檔名為.val的兩個檔案,這些檔案都可以使用純文字編輯軟體開啟。只要 .val 檔案的內容中,沒有任何 error 出現,我們便可以上傳 sqn 檔案了。若是 .val 檔案內有error,可能是指令執行過程有誤,或是有缺少什麼資料,則需再重新執行一次程式。確認沒問題的sqn檔案可以透過ftpemail夾帶檔案或是透過GenomesMarcroSend頁面

(http://www.ncbi.nlm.nih.gov/projects/GenomeSubmit/genome_submit.cgi) 上傳至NCBI,接下來就一樣是等待NCBI審核內容並回覆了。

參考資料:

1. NCBI Submission Protal: https://submit.ncbi.nlm.nih.gov/

2. Guide for Complete Genome Submission: http://www.ncbi.nlm.nih.gov/genbank/genomesubmit/

3. bl2asn: http://www.ncbi.nlm.nih.gov/genbank/tbl2asn2/

4. Discrepancy Report: http://www.ncbi.nlm.nih.gov/genbank/asndisc/

5. GenomesMarcroSend: http://www.ncbi.nlm.nih.gov/projects/GenomeSubmit/genome_submit.cgi

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()