TCGA的舊有使用者應該都有發現,在前一陣子(2016/6)官方進行了一次短暫的維修

1012-1.png

圖表 1 TCGA維修畫面截圖

原以為維修完之後,就可以一如往常的下載所需資料

1012-2.png

圖表 2 TCGA舊版資料下載畫面截圖

盼呀盼的終於盼到維修完,立馬打開網頁準備要下載所需資料了,結果一打開天啊~~~ 這是什麼 ??? TCGA居然整個大改版了 !!!

1012-3.png

圖表 3 TCGA新版資料下載畫面截圖

與舊版相同的地方,是它很貼心的幫使用者將各種癌症分裝起來(Project),便於下載,更將相關資訊與數據列在後面,讓使用者一覽無遺,清楚明瞭。

1012-4.png

圖表 4 TCGA Project畫面截圖

與舊版相異的地方,就是使用者操作介面完全長得不一樣了,不但介面漂亮了許多,還多了相關統計數據以及色彩繽紛的圖表,讓使用者能夠一目瞭然、更能清楚看出各種數據分布狀況。

1012-5.png 

圖表 5 TCGA圖表與相關數據

除此之外,TCGA更將各種資料條件細分排列出來,讓使用者可以設定需要哪些條件的資料,分成兩個部分,case可以設定癌症的類型,甚至連病患的性別、年紀、哪個時段的病患資料也都可以設定(詳見圖表6)file的部分則可以設定資料的分類、型態、格式、實驗策略、定序平台……等等(詳見圖表7)

1012-6.png

圖表 6 TCGA - case 條件設定

1012-7.png

圖表 7 TCGA - file 條件設定

講到這邊滿滿的都是優點,但是操作到後面,卻發現了一個超級大的問題,有些資料居然沒辦法下載???

1012-8.png

圖表 8 TCGA – access error

原來TCGA多了一個Access Level的條件限制!!!

它有兩種型態:open以及controlled。open意即開放的資料,任何人都可以下載並加以利用;controlled則是被鎖住的資料,因為相關的病患相關個資疑慮,所以限制了這些資料的存取權。Controlled的資料如下:VCFs、MAF、Primary sequence data (BAM and FASTQ files)、SNP array、Exon array……等等。

該如何獲得這些controlled access data的存取權呢?

申請流程必須由PI或是相關機構對dbGaP提出申請,實驗室內的博士後、研究生、大學部成員都只能被填寫為合作者/共同研究者,在提出申請前,必須先確認同個機關內還有誰要共同申請,還必須確認簽署正式合約人(通常不是PI,而是機關主管…之類),而簽約人、相關合作者都必須同意並遵守相關的法約,提出申請之後,會由TCGA去審核,約幾個星期內就會回復通過與否。

相關詳細流程可參見:

https://wiki.nci.nih.gov/display/TCGA/Application+Process

關於TCGA的相關簡介與open data下載教學可以參見此篇文章 淺談TCGA與資料下載教學

參考資料/網站:

https://wiki.nci.nih.gov/dashboard.action

https://gdc-portal.nci.nih.gov/

http://cancergenome.nih.gov/

 

YourGene 發表在 痞客邦 PIXNET 留言(0) 人氣()