你知道分類數據的統計分析技巧有哪些嗎?你知道什麼是分類數據的統計分析嗎?下面是本站小編爲大家帶來的關於分類數據的統計分析技巧的知識,歡迎閱讀。
分類數據的統計分析
1. 樣本數據與總體比較
1)二分類資料:
(1)小樣本數據:用二項分佈進行確切概率法檢驗;
(2)大樣本數據:用U檢驗;
2)多分類數據:用Pearson檢驗(又稱擬合優度檢驗)。
2. 四格表(2×2表)數據
1)完全隨機設計的四格表數據的分析
(1)當樣本量n>40,並且4個格子理論數均大於5時,則用Pearson 檢驗;
(2)當樣本量n>40,並且4個格子理論數均大於1且至少存在一個格子的理論數<5時,則用校正檢驗或用Fisher’s精確概率法檢驗;
(3)當樣本量n£40或存在任一格子理論數<1,則用精確概率法檢驗;
2)配對設計的四格表數據的分析
(1)b+c≥40,則用McNemar配對檢驗;
(2)b+c<40,則用二項分佈確切概率法檢驗;
3. 2×C表或R×2表數據的統計分析
1)列變量爲效應指標,並且爲有序多分類變量,行變量爲分組變量,則可以採用行平均得分差(Row Mean Scores Differ)的CMH 或成組的Wilcoxon秩和檢驗;
2)列變量爲效應指標並且爲二分類,行變量爲有序多分類變量,則可採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。
3)行變量和列變量均爲無序分類變量:
(1)當樣本量n>40,並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗;
(2)當樣本量n£40,或理論數小於5的格子數多於行列表中格子總數的25%,則用Fisher’s確切概率法檢驗;
4. R×C表數據的統計分析
1)完全隨機設計的R×C表數據的統計分析
(1)列變量爲效應指標,並且爲有序多分類變量,行變量爲分組變量,則CMH 或Kruskal Wallis的秩和檢驗;
(2)列變量爲效應指標,並且爲無序多分類變量,行變量爲有序多分類變量,則採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義;
(3)列變量和行變量均爲有序多分類變量,可以作Spearman相關分析或者非零相關(none zero correlation)的CMH ;
(4)列變量和行變量均爲無序多分類變量:
i. 當樣本量n>40並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗進行分析;
ii. 當樣本量n£40或理論數小於5的格子數多於行列表中格子總數的`25%,則用Fisher’s 確切概率法檢驗;
2)配對設計的C×C表數據:
(1)配對比較:用McNemar配對檢驗;
(2)一致性檢驗(Agreement):用Kappa檢驗;
Poisson分佈數據
1. 單樣本數據與總體比較:
1)當觀察值較小時:可以用確切概率法進行檢驗。
2) 當觀察值較大時:可以用正態近似的U檢驗。
2. 兩個樣本數據的比較:可以用正態近似的U檢驗。
兩個變量之間的關聯性分析
1. 兩個變量均爲連續型變量
1)當兩變量爲小樣本並且兩個變量服從雙正態分佈時,可以用Pearson相關係數來衡量兩個變量之間的關聯性;
2)當兩變量爲大樣本或兩個變量不服從雙正態分佈,則用Spearman相關係數來衡量兩個變量之間的關聯性;
2. 如果兩個變量均爲有序分類變量,可以用Spearman相關係數來衡量兩個變量之間的關聯性;
3. 如果一個變量爲有序分類變量,另一個變量爲連續型變量,可以用Spearman相關係數來衡量兩個變量之間的關聯性。