作者:郭任超/有勁基因

 

  新興主題(Emerging Topic),是指處於成長階段但還尚未成為熱點的研究主題。瞭解科技研究領域新興主題的形成機制,對預測未來具發展潛力的新興主題、或對科技政策的實施與研究資金的分配都有幫助;不僅能協助政府機構和投資者確認可以及早投資的潛力新領域,對生物科技業決定未來的發展方向也有相當的影響。

 

  由於年年都有大量不同研究主題的論文被發表,因此發現科學研究的新興趨勢一直都是項挑戰。面對如此大的資料量,想用手動方式去尋找可用的資料,根本就是緣木求魚。筑波大學研究人員最近在Scientometrics期刊發表了一項研究1,他們採用書目計量學分析(Bibliometric Analysis)的方法,針對1970年至2017年間PubMed資料庫(此為目前最大的生物醫學文獻資料庫)上3千萬篇左右已發表的文章進行分析,試圖找出新興主題形成的機制。

 

  筑波大學該項研究,首先先將PubMed資料庫那3千萬篇左右的每篇文章所標示的醫學標題(Medical Subject Headings;簡稱MeSH)列表出來,然後將各指定年份區間中出現率最高的前百分之五定義為「新興關鍵詞(Emerging Keywords)」。再透過「共現詞分析(Co-Word Analysis)」去觀察各個新興詞彙在成為新興關鍵詞的前一年,與其他特定新興詞彙同時出現在同一篇文章中的次數或比重,藉此來發掘由這些「新興關鍵詞」所群集形成的「新興主題」。

 

  分析結果發現,約有四分之三的新興詞彙以及重覆出現的關鍵詞在被確立為新興關鍵詞的1年之前,在同一篇文章中都曾與其他特定的新興關鍵詞同時一起出現過。這個結果和筑波大學研究人員對新興主題如何形成的機制假設不謀而合:「某個領域曾經出現過的新興主題,能幫助在該領域形成更新的新興主題,或者可將該領域已經出現過的主題活化變成新興的主題」。

 

  表一是1971年至2015年出現最頻繁的十大新興詞彙分類結果。所有新興詞彙中有超過8成5的詞彙會反覆出現而成為新興關鍵詞,其中有3成以上的關鍵詞會重覆出現在5個以上的不同年份區間(詳見表一),這些重覆出現的關鍵詞就會被標示為「複現關鍵詞(Comeback-Emerging Keywords)」。換句話說,如果某關鍵詞是個新興詞彙,之後在不同年份反覆出現並成為新興關鍵詞的可能性便很高。然而,表一的結果顯示,生命科學領域大部分的新興研究關鍵詞其實很少成為新興主題,即便有新的主題出現,也很少有辦法在之後進一步演化出其他的新興主題。此外,研究人員也發現,能成功形成新興主題的新興關鍵詞,往往都會跟其他先前曾經出現過的關鍵詞同時出現;這代表調查現階段表現突出的新興主題,有助於預測醞釀中的下一個新興主題。

 

表一、1971年到2015年期間重複出現次數排名前10名的新興關鍵詞

191129_1.png

單元格中的數字代表新興關鍵詞在每5年區間單位內重複出現的次數。粗斜體數字代表該年份區間內出現次數最頻繁的前10名新興關鍵詞。相同深淺顏色背景的單元格,是經過共現詞分析後被歸類在同一群集中的相關新興關鍵詞。白色背景單元格則是未被歸類的新興關鍵詞。(圖片來源:Ohniwa, R.L. & Hibino, A. Scientometrics. 2019, Dec; 121(3):1549-1561.)

 

 

  這篇研究還對新興主題的形成機制做了假設:某時期的某個新興主題,有可能會隨著時間的演進而擷取或移除不同元素,然後形成另一個新興主題,如下圖一的示意圖模型。該圖中時期一(Period I)的新興主題ETα,在進入時期二(Period II)之前,主題中的元素b和c已經消失,而由元素d和e所取代,轉變成新興主題ETβ;ETα移除元素b、c後,在原本的元素c之外又加入了元素g,於時期二形成了另一個新興主題ETγ。而之前曾消失過的舊年份主題元素,有時會在跳過某些年代後,併入其他新興主題,重新復出;例如,元素b曾在時期二的ETβ中消失,卻在時期三(Period III)的新興主題ETε中再度出現。但事實上,一個主題中大多數的元素,其實對新興主題的形成起不了什麼作用,例如元素f、h、j、k、l、m、n和o,不論是在哪個時期,都不曾成為新興主題內的元素。

 

圖一、新興主題形成機制的示意圖模型

191129_2.png

小寫字母(a到o)元素是生命科學研究主題MeSH詞庫所標列出的醫學標題。大寫字母(A和B)則代表新出現的新興主題元素。ET是新興主題的英文縮寫,ETα至ETζ則代表不同時期的不同新興主題。(圖片來源:Ohniwa, R.L. & Hibino, A. Scientometrics. 2019, Dec; 121(3):1549-1561.)

 

 

  然而值得注意的是,對生命科學研究領域影響重大的幾個新興主題的關鍵詞,竟似乎都是獨立出現的,之前皆不曾與其他新興主題的關鍵詞同時出現過。例如,1980年的「癌基因蛋白(Oncogene Proteins)」與「病毒的(Viral)」、以及1991年的「細胞凋亡(Apoptosis)」,都是被公認非常成功、新穎的新興關鍵詞,而這幾個在之前都未曾和其他新興關鍵詞同時出現過。另外,這些關鍵字正好也是下面兩個諾貝爾獎獲獎主題的核心概念關鍵字:1989年「逆轉錄病毒癌基因的細胞起源(the cellular origin of retroviral oncogene)」、以及2002年「器官發育的遺傳調控和程序性細胞死亡(genetic regulation of organ development and programmed cell death)」。換句話說,其他諸如此類影響重大的新興關鍵詞,也有可能成為具潛力的諾貝爾獎主題。

 

  從以上研究可以看出生命科學研究發展的兩種趨勢:(1)基於既有新興主題所演變出來的新興主題;以及(2)異軍突起,與其他新興主題不相關卻具有高度影響力的新興主題。

 

  分析科學研究熱點和演變趨勢的意義很重要,因為這有助釐清產業和科學技術發展的策略和重點。筑波大學這篇研究使用了系統化的MeSH詞庫,同時也結合了共現詞分析,從詞語的內在層次結構層面對新興主題形成機制做了理論和模型的詮釋。這項研究,若未來也可以再結合其他外在因素─例如:過去對研究的投資、研究活動的繼承關係等等做進一步分析,這樣或能對預測新興研究主題有所幫助,在實踐研究和制定研究政策時,提供發掘潛力新興技術的參考依據。

 

 

 

參考文獻

1. Ohniwa, R.L. & Hibino, A. Generating process of emerging topics in the life sciences. Scientometrics. 2019, Dec; 121(3):1549-1561. Retrieved from https://link.springer.com/article/10.1007/s11192-019-03248-z

 

thumbnail_官網用CC創用_ND_YH.png

arrow
arrow

    Yourgene Health 發表在 痞客邦 留言(2) 人氣()