Mann-Whitney U test란
- 평균이나 분산등의 모수(parameter)를 이용하지 않는 비모수적 검정방법의 하나.
- 표본이 연속값이 아니거나 정규분포를 따르지 않는 등 t-test를 사용할 수 없는 경우에 사용됨
검정과정
- X집단과 Y집단의 data를 크기순으로 나열
- 각 data가 속한 집단명을 data 아래에 기록
- x 좌측에 위치한 y의 갯수를 기록 (x >y 를 만족하는 data 갯수 기록), 마찬가지로 y 좌측에 위치한 x의 갯수를 기록 (x < y 를 만족하는 data 갯수 기록)
- x > y를 만족하는 갯수를 모두 더하고(Ux), x < y를 만족하는 갯수끼리 모두 더한다(Uy). 이 때 Ux +Uy =(Nx)(Ny)가 된다.
- Ux 와 Uy중 적은 값을 선택한다. [U=min(Ux,Uy)]
- 산출된 U값을 이용하여 표에서 찾아 p-value를 확인
예제1
group X와 Y사이에 유의미한 차이가 있는 지 검정하라.
- X : 19,22,16,29,24
- Y : 20,11,17,12
[풀이]
data | 11 | 12 | 16 | 17 | 19 | 20 | 22 | 24 | 29 |
---|---|---|---|---|---|---|---|---|---|
group | Y | Y | X | Y | X | Y | X | X | X |
X > Y | 2 | 3 | 4 | 4 | 4 | ||||
Y > X | 0 | 0 | 1 | 2 |
- Ux = 2+3+4+4+4=17
- Uy = 0+0+1+2=3
- U=min(Ux,Uy) =3
- 표에서 U=3일 때 p-value를 찾으면 0.11로 0.05보다 크므로 귀무가설을 기각할 수 없다. 즉 두 집단 사이에 유의미한 차이는 발견되지 않는다.
[r code]
A <- c(19,22,16,29,24,20,11,17,12)
B <- c(1,1,1,1,1,0,0,0,0)
wilcox.test(A~B)
Wilcoxon rank sum test
data: A by B
W = 3, p-value = 0.1111
alternative hypothesis: true location shift is not equal to 0
예제2
‘mtcars’ dataset을 이용하여 수동기어 차량과 자동기어 차량에서 연비가 차이가 없다는 귀무가설을 세우고 이 가설을 검증하라.
- 연비 data
mtcars$mpg
[1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4
[16] 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7
[31] 15.0 21.4
- 각 차량의 변속기 형식 (0 = automatic, 1 = manual)
mtcars$am
[1] 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1
[r code]
wilcox.test(mpg~am,data=mtcars)
Warning in wilcox.test.default(x = c(21.4, 18.7, 18.1, 14.3, 24.4, 22.8, :
cannot compute exact p-value with ties
Wilcoxon rank sum test with continuity correction
data: mpg by am
W = 42, p-value = 0.001871
alternative hypothesis: true location shift is not equal to 0
여기서 계산된 p-value가 0.05보다 적으므로 귀무가설은 기각되고, mtcars dataset에서 수동변속기 차량과 자동변속기 차량은 연비가 같다고 볼 수 없다는 결론을 내릴 수 있다.
'통계학' 카테고리의 다른 글
[통계학개론]포아송분포 (0) | 2020.12.03 |
---|---|
[통계학개론] 이항분포 (0) | 2020.12.03 |
[통계학개론]베르누이분포 (2) | 2020.12.02 |
[데이터시각화]Visualizing the State of Government Debt Around the World (0) | 2020.06.03 |
[통계학개론]각종 수식 및 증명 (0) | 2020.06.03 |