Mann-Whitney U test

통계학 2020. 7. 5. 16:50

  • 평균이나 분산등의 모수(parameter)를 이용하지 않는 비모수적 검정방법의 하나.
  • 표본이 연속값이 아니거나 정규분포를 따르지 않는 등 t-test를 사용할 수 없는 경우에 사용됨

검정과정

  • X집단과 Y집단의 data를 크기순으로 나열
  • 각 data가 속한 집단명을 data 아래에 기록
  • x 좌측에 위치한 y의 갯수를 기록 (x >y 를 만족하는 data 갯수 기록), 마찬가지로 y 좌측에 위치한 x의 갯수를 기록 (x < y 를 만족하는 data 갯수 기록)
  • x > y를 만족하는 갯수를 모두 더하고(Ux), x < y를 만족하는 갯수끼리 모두 더한다(Uy). 이 때 Ux +Uy =(Nx)(Ny)가 된다.
  • Ux 와 Uy중 적은 값을 선택한다. [U=min(Ux,Uy)]
  • 산출된 U값을 이용하여 표에서 찾아 p-value를 확인

예제1

group X와 Y사이에 유의미한 차이가 있는 지 검정하라.

  • X : 19,22,16,29,24
  • Y : 20,11,17,12

[풀이]

data 11 12 16 17 19 20 22 24 29
group Y Y X Y X Y X X X
X > Y     2   3   4 4 4
Y > X 0 0   1   2      
  • Ux = 2+3+4+4+4=17
  • Uy = 0+0+1+2=3
  • U=min(Ux,Uy) =3
  • 표에서 U=3일 때 p-value를 찾으면 0.11로 0.05보다 크므로 귀무가설을 기각할 수 없다. 즉 두 집단 사이에 유의미한 차이는 발견되지 않는다.

[r code]

A <- c(19,22,16,29,24,20,11,17,12)
B <- c(1,1,1,1,1,0,0,0,0)
wilcox.test(A~B)

    Wilcoxon rank sum test

data:  A by B
W = 3, p-value = 0.1111
alternative hypothesis: true location shift is not equal to 0

예제2

‘mtcars’ dataset을 이용하여 수동기어 차량과 자동기어 차량에서 연비가 차이가 없다는 귀무가설을 세우고 이 가설을 검증하라.

  • 연비 data
mtcars$mpg
 [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4
[16] 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7
[31] 15.0 21.4
  • 각 차량의 변속기 형식 (0 = automatic, 1 = manual)
mtcars$am
 [1] 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1

[r code]

wilcox.test(mpg~am,data=mtcars)
Warning in wilcox.test.default(x = c(21.4, 18.7, 18.1, 14.3, 24.4, 22.8, :
cannot compute exact p-value with ties

    Wilcoxon rank sum test with continuity correction

data:  mpg by am
W = 42, p-value = 0.001871
alternative hypothesis: true location shift is not equal to 0

여기서 계산된 p-value가 0.05보다 적으므로 귀무가설은 기각되고, mtcars dataset에서 수동변속기 차량과 자동변속기 차량은 연비가 같다고 볼 수 없다는 결론을 내릴 수 있다.

 

Posted by 화공쟁이
,