作者:紀雅齡/有勁生物科技
TCGA的舊有使用者應該都有發現,在前一陣子(約2016/6月)官方進行了一次短暫的維修
圖表 1 TCGA維修畫面截圖
原以為維修完之後,就可以一如往常的下載所需資料
圖表 2 TCGA舊版資料下載畫面截圖
盼呀盼的終於盼到維修完,立馬打開網頁準備要下載所需資料了,結果一打開天啊~~~ 這是什麼 ??? TCGA居然整個大改版了 !!!
圖表 3 TCGA新版資料下載畫面截圖
與舊版相同的地方,是它很貼心的幫使用者將各種癌症分裝起來(Project),便於下載,更將相關資訊與數據列在後面,讓使用者一覽無遺,清楚明瞭。
圖表 4 TCGA Project畫面截圖
與舊版相異的地方,就是使用者操作介面完全長得不一樣了,不但介面漂亮了許多,還多了相關統計數據以及色彩繽紛的圖表,讓使用者能夠一目瞭然、更能清楚看出各種數據分布狀況。
圖表 5 TCGA圖表與相關數據
除此之外,TCGA更將各種資料條件細分排列出來,讓使用者可以設定需要哪些條件的資料,分成兩個部分,case可以設定癌症的類型,甚至連病患的性別、年紀、哪個時段的病患資料也都可以設定(詳見圖表6);file的部分則可以設定資料的分類、型態、格式、實驗策略、定序平台……等等(詳見圖表7)。
圖表 6 TCGA - case 條件設定
圖表 7 TCGA - file 條件設定
講到這邊滿滿的都是優點,但是操作到後面,卻發現了一個超級大的問題,有些資料居然沒辦法下載???
圖表 8 TCGA – access error
原來TCGA多了一個Access Level的條件限制!!!
它有兩種型態:open以及controlled。open意即開放的資料,任何人都可以下載並加以利用;controlled則是被鎖住的資料,因為相關的病患相關個資疑慮,所以限制了這些資料的存取權。Controlled的資料如下:VCFs、MAF、Primary sequence data (BAM and FASTQ files)、SNP array、Exon array……等等。
該如何獲得這些controlled access data的存取權呢?
申請流程必須由PI或是相關機構對dbGaP提出申請,實驗室內的博士後、研究生、大學部成員都只能被填寫為合作者/共同研究者,在提出申請前,必須先確認同個機關內還有誰要共同申請,還必須確認簽署正式合約人(通常不是PI,而是機關主管…之類),而簽約人、相關合作者都必須同意並遵守相關的法約,提出申請之後,會由TCGA去審核,約幾個星期內就會回復通過與否。
相關詳細流程可參見:
https://wiki.nci.nih.gov/display/TCGA/Application+Process
關於TCGA的相關簡介與open data下載教學可以參見此篇文章 淺談TCGA與資料下載教學 。
參考資料/網站:
https://wiki.nci.nih.gov/dashboard.action
https://gdc-portal.nci.nih.gov/
留言列表