Statistics/통계 검정

5. 통계 검정 기초 : Wilconxon Signed Rank검정(윌콕슨 부호 순위 검정) 예제, 정규분포가 아닐때

Coco___ 2021. 7. 4. 01:27
728x90
반응형

1. Wilcoxon 검정이란?

 

만약 모집단이 정규성을 만족하지 않는 다면 어떻게 해야할까? 정규성이 만족하지 않는 경우에는 T검정 Z검정등 우리가 기존에 공부한 검정 방법을 적용할 수 없다. 왜냐하면 이 검정 방법들의 사전 가정은 모집단이 정규 분포를 만족한다는 전제가 깔려 있기 때문이다. 

 

하지만 우리의 실제 생활에서 분석되는 통계 자료들은 정규성을 만족하지 않는 경우가 많다. 이럴 때는 어떤 방식으로 통계 검정을 해야하는 가 오늘 알아보자. 

 

다음 그림은 데이터 자료에 붙여둔 통계 검정 정리표이다. 오늘 공부할 내용은, Wilcoxon 이며, 이게 어떤 분석인지 한 눈에 파악하기 쉽도록 표를 붙여 놓았다. 

 

※ 그림 출처 https://nittaku.tistory.com/467

 

 


2. Wilcoxon 검정의 종류

 

Wilcoxon 검정이란 모집단이 정규성을 만족하지 못할 때 사용하는 검정으로, 두 모집단의 관계에 따라 2종류로 나뉜다. 

두 모집단이 서로 연관성을 가진다면, Wilcoxon signed rank test (윌콕슨 부호 순위 검정)를 두 모집단이 서로 독립이라면, wilcoxon rank sumtest 혹은 Mann - Whitney test 검정 방법을 사용한다. 

 

 

2-1. Wilcoxon signed rank test (윌콕슨부호순위검정)

 

이 TEST는 T 검정과 같이 목적은 두 그룹의 평균이 같은지 여부를 비교하는 비모수적 분석 방법이다. 

정규분포를 따르지 않거나(표본의 크기가 10이하로 작거나) 분포 형태를 모를 경우의 중위값 차이에 의한 비모수 검정이라고 생각하면 된다. 

 

두 모집단의 관계는 연관되어 있고, 이 모집단에서 랜덤하게 표본을 구하면 다음과 같이 나온다. 

 

  • (X1,Y1),(X2,Y2),...,(Xn,Yn)X1−Y1,X2−Y2,...,Xn−Yn∼F(x−Δ)

 

귀무가설은 위치 모수가 0이다 라고 가정한다. 자연스럽게 대립가설은 위치모수가 0이 아니다가 된다. 

 

 

두 표본의 절대차 |Yi−Xi|=0을 제외한 절대차의 순위(rank)라고 하면 검정 통계량 W 는 다음과 같다.

 

5 장 가설검정 의학통계 (dongguk.ac.kr)

 

 

 


2-2. Wilcoxon signed rank test (윌콕슨부호순위검정) 예시

 

다음과 같이 치료제 투약 전의 약 효과에 따른 관측 값이 A _ B 로 관측되었다고 하자. 

모수가 적으며, 정규 분포를 따르지 않을 때, 검증 방법으로 치료제 투약이 효과가 있는 지 검정할 것이다. 

 

 

 

1. 귀무가설 세우기. 

 

윌콕슨 부호,순위 검정에서의 귀무가설은 중위값이 0이다. 

 

 

 

 

 

 

 

 

그러면 다음과 같이 정리할 수 있다. 이를 조금 더 보기 좋게 정리하면 다음과 같다. 

이는 각 Rank 별로 절대값과 부호 그리고 Group 순위를 순서대로 나열한 값이다. 

 

 

3. Wilcoxon 부호 순위 검정 

 

여기서 Wilcoxon 부호 순위 검정 방법은 다음과 같이 적용 가능하다. 

 

먼저, 순위 절대값이 - 인 Group ,+ 인 Group을 따로 분리하여야 한다. 

 

[ '-' 부호 Group ]

  • 이 그룹의 Rank 값을 더해주어야 한다. 
  • 즉, 1+2+4 = 7 이 나온다. 

[ '+' 부호 Group ]

 

  • 이 그룹의 Rank 값을 더해주어야 한다. 
  • 3+5.5+5.5+7+8+9+10+11+12 = 71

*주의 할 점은, 5/6 Rank 의 값이 같으므로 5->5.5, 6->5.5 가 들어가야 한다. 

 

 

4. 귀무가설 기각 여부 판단하기 

 

W- 값이 7이고, W+값이 71이다. 여기서 윌콕슨 검정은 작은 값을 채택한다. 

따라서 W 값을 7로 채택한다. 

 

양측 검정 TEST를 시작한다면 윌콕스 Rank TEST 에서 P-Value 0.05 수준에서 검증한다는 가정하에, 

13이라는 값이 나옴을 알 수 있다. (아래 표 참고)

 

 

즉, 우리가 구한값 Wsiai=7, 윌콕슨 값 W=erit=13 이 되고, 

Wsiai < Werit (7<13) 이 되므로, 귀무가설은 기각된다.  즉, 투약 약이 효과가 있다고 판단할 수 있다. 

 

 

5. 만약 n(n+1)/2 가 20 보다 크다면 Z검정을 통해 판단할 수 있다. 

 

 

윌콕슨 검정 값은 다음과 같은 식이 성립된다.  (R+ =W+ 이며, R- 는 W- 임.)

현재 예시는 n=12이므로 (W+ + W- =78) = 12*13/2 =78 이 나온다. 

 

검정통계량 중 작은 값 즉, W-를 T라고 하는데, 데이터가 모두 같은 방향으로 변화한다면, T=0이 되고, 변화의 방향이 일정하지 않는 다면 T 값은 커지게 된다. 커진 T 값은 n(n+1)/4,이 된다. 

 

T 값은 근사적으로 평균이 n(n+1)/4, 표준편차가 √((n(n+1)(2n+1))/24) 인 정규 분포를 따르게 된다. 

 

 

 

여기서 추가적으로 tied ranks 라고 현재 5,6번이 동일한 순위(t=2)를 가졌기 때문에 σ 값에서 t^3-t/48 을 빼주어야 한다. 여기에서는 t=2 이므로 8-2/48=0.125 가 나온다. 그래서 다음 식에서 0.125를 반영한 값까지 계산하면 아래와 같다. 

 

 

  • μ: n(n+1)/4.
  • σ: √((n(n+1)(2n+1))/24)

즉 Z값은 다음과 같이 구해진다. 

Z값을 P-Value로 변환하면 Excel =1-ERF(ABS(2.51)/SQRT(2)) , 0.012임을 확인할 수 있다. 

 

양측 검정에서 0.05 신뢰 수준에 대한 기각역은  Z>1.96, Z<-1.96 이고, Z값은 기각역에 속해 있으므로, 귀무가설이 기각된다. 따라서 치료 약은 효과가 있다 라고 판단할 수 있다. 

 

 

 

728x90
반응형