當前位置:學問君>人在職場>財會金融>

分類數據的統計分析技巧

學問君 人氣:1.5W

你知道分類數據的統計分析技巧有哪些嗎?你知道什麼是分類數據的統計分析嗎?下面是本站小編爲大家帶來的關於分類數據的統計分析技巧的知識,歡迎閱讀。

分類數據的統計分析

1. 樣本數據與總體比較

1)二分類資料:

(1)小樣本數據:用二項分佈進行確切概率法檢驗;

(2)大樣本數據:用U檢驗;

2)多分類數據:用Pearson檢驗(又稱擬合優度檢驗)。

2. 四格表(2×2表)數據

1)完全隨機設計的四格表數據的分析

(1)當樣本量n>40,並且4個格子理論數均大於5時,則用Pearson 檢驗;

(2)當樣本量n>40,並且4個格子理論數均大於1且至少存在一個格子的理論數<5時,則用校正檢驗或用Fisher’s精確概率法檢驗;

(3)當樣本量n£40或存在任一格子理論數<1,則用精確概率法檢驗;

2)配對設計的四格表數據的分析

(1)b+c≥40,則用McNemar配對檢驗;

(2)b+c<40,則用二項分佈確切概率法檢驗;

3. 2×C表或R×2表數據的統計分析

1)列變量爲效應指標,並且爲有序多分類變量,行變量爲分組變量,則可以採用行平均得分差(Row Mean Scores Differ)的CMH 或成組的Wilcoxon秩和檢驗;

2)列變量爲效應指標並且爲二分類,行變量爲有序多分類變量,則可採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義。

3)行變量和列變量均爲無序分類變量:

(1)當樣本量n>40,並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗;

(2)當樣本量n£40,或理論數小於5的格子數多於行列表中格子總數的25%,則用Fisher’s確切概率法檢驗;

4. R×C表數據的統計分析

1)完全隨機設計的R×C表數據的統計分析

(1)列變量爲效應指標,並且爲有序多分類變量,行變量爲分組變量,則CMH 或Kruskal Wallis的秩和檢驗;

(2)列變量爲效應指標,並且爲無序多分類變量,行變量爲有序多分類變量,則採用普通的Pearson 檢驗比較各組之間有無差別,如果總的來說有差別,還可進一步作兩兩比較,以說明是否任意兩組之間的差別都有統計學意義;

(3)列變量和行變量均爲有序多分類變量,可以作Spearman相關分析或者非零相關(none zero correlation)的CMH ;

(4)列變量和行變量均爲無序多分類變量:

i. 當樣本量n>40並且理論數小於5的格子數少於行列表中格子總數的25%,則用Pearson 檢驗進行分析;

ii. 當樣本量n£40或理論數小於5的格子數多於行列表中格子總數的`25%,則用Fisher’s 確切概率法檢驗;

2)配對設計的C×C表數據:

(1)配對比較:用McNemar配對檢驗;

(2)一致性檢驗(Agreement):用Kappa檢驗;

Poisson分佈數據

1. 單樣本數據與總體比較:

1)當觀察值較小時:可以用確切概率法進行檢驗。

2) 當觀察值較大時:可以用正態近似的U檢驗。

2. 兩個樣本數據的比較:可以用正態近似的U檢驗。

兩個變量之間的關聯性分析

1. 兩個變量均爲連續型變量

1)當兩變量爲小樣本並且兩個變量服從雙正態分佈時,可以用Pearson相關係數來衡量兩個變量之間的關聯性;

2)當兩變量爲大樣本或兩個變量不服從雙正態分佈,則用Spearman相關係數來衡量兩個變量之間的關聯性;

2. 如果兩個變量均爲有序分類變量,可以用Spearman相關係數來衡量兩個變量之間的關聯性;

3. 如果一個變量爲有序分類變量,另一個變量爲連續型變量,可以用Spearman相關係數來衡量兩個變量之間的關聯性。

TAGS:統計分析