作者:謝維馨/有勁生物科技

 

    進行量化研究時,當我們想要檢定兩組資料的平均數是否具有顯著差異,最常使用的方法是t檢定(t-test)。然而當想要檢定的資料多於兩組時,直觀上我們可以將資料兩兩一組,分別進行多次t檢定,但是這種做法不僅耗時耗力,更會提高第一型誤差(Type I Error) 發生的機率;此時,我們就可以使用變異數分析(Analysis of Variance; ANOVA)來避免此類問題。

 

    變異數分析是一種假設檢定(Hypothesis Testing)。其虛無假設(Null Hypothesis, H0)為「各組樣本的母體平均數沒有顯著差異(或是各組樣本是來自於同一母群體)」;而對立假設(Alternative Hypothesis, H1)則是「至少有一組樣本的母體平均數與其他組有差異」。表示方法如下:

                 112233.png

 

    此時你或許會有一個疑問:既然是檢定「平均數」,為何要叫做「變異數」分析?這是因為當我們在探討多組樣本間的母體平均數時,我們是利用「樣本資料間的變異」來推斷各組樣本的母體平均數是否具有顯著差異。

 

    接下來,我們來看看這個分析法的前提假設、概念以及方法。

 

【變異數分析的前提假設】

    變異數分析主要是用來檢定多組相互獨立樣本的母體平均數是否具有顯著差異;例如:亞洲各國家的成人平均身高是否相同。在進行檢驗前,我們希望確定每組獨立樣本的平均數的確能夠被拿來互相比較;因此各組樣本的母體除了需要符合常態分布外,還希望其資料離散分布的狀況能具有相似性,也就是說,樣本的母體變異數必須具有同質性。

   

    因此,在進行變異數分析之前,我們會先進行樣本母體變異數的同質性檢定,若各樣本的母體變異數皆具有同質性,就可以使用變異數分析來進行之後的檢定。

 

【變異數分析的概念與方法】

    在做變異數分析時,我們需要先知道兩種樣本變異的資訊:

●組間變異(Between-group variation):不同組樣本之間的資料變異程度

●組內變異(Within-group variation):各組樣本本身資料間的變異程度

 

    得到樣本的變異資訊後,就可以利用組間變異與組內變異的相對大小來檢定不同組樣本之間母體平均數的差異。

 

    倘若每組樣本資料的母體平均數差異不顯著,就表示每組樣本的母體分佈狀況差異不大,其組間變異和組內變異會頗為接近。反之,當每組樣本資料的母體平均數差異顯著時,組間的變異則會明顯大於組內變異,且當組間變異越大,組內變異越小時,拒絕虛無假設H0的機率就越高,也就表示被比較的各組樣本,其中至少有一組樣本的母體平均數與他組樣本的母體平均數有著顯著的差異。

 

 

參考資料

Wikipedia. One-way analysis of variance. Retrieved from  https://en.wikipedia.org/wiki/One-way_analysis_of_variance

 

官網用CC創用_SA.png

 

文章標籤
創作者介紹
創作者 YourGene 的頭像
YourGene

有勁的生技資訊

YourGene 發表在 痞客邦 留言(0) 人氣()