作者:謝維馨/有勁生物科技
進行統計分析時,常見的資料型態主要有連續型資料及類別型資料兩種。當我們想要檢定連續性資料之間的差異時,我們通常會使用回歸分析或t檢定等檢驗方法;而針對類別型資料,我們最常使用的檢定方法則為卡方分析。
常見的卡方檢定分成以下三類:配適度檢定 (Test of Goodness-of-fit)、獨立性檢定 (Test of Independent)以及同質性檢定 (Test of homogeneity)。
配適度檢定 (Test of Goodness-of-Fit)
在進行資料分析前,我們通常希望先了解資料的分佈型態,以便找出最適合的分析方法。此時就可以使用配適度檢定 (或稱適合度檢定)來驗證欲分析的樣本組是否符合某一特定的機率分佈;例如:某醫院病患的血型分佈是否和臺灣人的血型分佈相符。
獨立性檢定 (Test of Independence)
獨立性檢定適用在探討在同一組樣本中兩個變數間的關聯性;例如:長期過量飲酒和肝癌發生的相關性。當檢定結果為顯著時 (亦即結果拒絕虛無假設),就表示兩個變數相關;反之當檢定結果不拒絕虛無假設時,則代表兩變數互為獨立。
由於獨立性假設只能檢定兩個變數是否相關,無法知道關聯性的強度與方向,因此當檢定結果為顯著相關時,我們便會依據不同的資料型態 (例如:不同大小的列聯表)選擇不同的係數來計算變數之間關聯性的強度與方向:
1. ϕ係數 (phi coefficient):僅適用於2 x 2的列聯表
2. 列聯係數 (coefficient of contingency):適用於大於2 x 2方陣的列聯表
3. Cramer’s V係數:可用於非方陣列聯表
同質性檢定 (Test of Homogeneity)
前述兩種卡方檢定的方法,都是用來探討單一樣本組的資料,而同質性檢定則是用來檢定不同樣本組間對於某變數的關聯性是否一致 (例如:檢定抽菸、喝酒及吃檳榔是否都會增加口腔癌的發生機率)。
由於獨立性檢定與同質性檢定的資料皆可用列聯表來表示,因此這兩種分析方法又稱為列聯表分析。
留言列表