8. 카이제곱 검정 2 : 동일성 검정 예제

2021년 07월 07일 by Coco___

    8. 카이제곱 검정 2 : 동일성 검정 예제 목차
728x90
반응형

카이제곱 검정은, 다시 말하자면 연관성을 검정하는 방법이다. 

 

연관성을 검정하는 방법에는 여러가지가 있고, 이번에는 Test of homogenetiy 동일성 검정을 알아보도록 하겠다. 

동일성 검정이란, 두 집단의 분포의 동일 여부를 검정하는 방법이다. 

 

 


1. 동일성 검정. 

 

동일성 검정은 부모집단 각각으로 부터 정해진 표본의 크기만큼 자료를 추출할 때, 분할표에서 부모집단의 비율이 동일한지 검정하는 방법이다. 

 

이를 수식으로 표현한다면, n개의 모집단에서 각각에 속하는 개체의 특성이 r개로 나뉘어질 때, i째에 속하는 특성을 가질 확률을 Pij 라고 한다면, 아래와 같은 귀무가설과 대립가설을 만족한다는 의미이다. 

 

10.pdf (kocw.net)

 

즉, 만약 귀무가설이 기각되지 않는다면, 한 실험대상이 B 그룹에 속할 확율은 어떤 부모집단이든 동일하다는 의미를 가지게 된다. 

 

 

2. 동일성 검정 예시. 

 

2.1 동일성 검정 문제

 

남녀 성별에 따른 자동차 모델에 대한 선호도 조사 결과표이다. 남,녀 각각 500명을 임의로 추출하였고, 성별에 따른 선호도가 관련성이 있는지, 유의수준 0.05에서 검정하라는 문제를 예시로 동일성 검정을 알아보자. 

 

10.pdf (kocw.net)

 

 

2.2 추정 기대 도수 구하기. 

 

남자가 각 모델을 좋아할 확률을 P11 P12 P13 P14 라고 하고, 

여자가 각 모델을 좋아할 확률을 P21 P22 P23 P24 라고 하자. 

 

그렇다면 귀무가설을 각각의 확률이 동일하다 라는 것을 알 수 있다. 

 

추정 기대 도수를 구해보자. 추정 기대 도수란, 남자,여자 상관 없이 A 모델, B 모델, C 모델, D 모델을 좋아할 확률을 구하게 된다. 즉, 남자/여자 구분을 하지 않고 각 모델을 좋아할 확률을 구한 뒤 2로 나뉘어 주어야 한다. 혹은 간단하게 A 모델을 좋아하는 남자 + A 모델을 좋아하는 여자 를 구한 뒤 2로 나누어 줘도 상관 없다. 

 

 

 

2.3 검정 통계량 구하기.

 

이제 검정 통계량 카이제곱 값을 구해야 한다. 

검정 통계량 카이제곱을 말로 풀어서 설명한다면, 실제 A를 선택한 남자의 수에서 추정 기대값을 빼준 뒤 제곱 하여 추정 기대값으로 나눈 모든 경우의 합이다. 

 

10.pdf (kocw.net)

 

이 식의 의미 역시, 표준 편차의 확률을 다 더해 준 값이라고 생각할 수 있을 것 같다. 

이 값을 계산하면 카이제곱은 30.114 라는 값이 나오게 된다. 

 

2.4 귀무가설 기각 여부 결정하기.

 

자유도는 (2-1)(4-2) = 3 이므로 카이제곱(3.0.05) 인 값을 구하면 7.815임을 알 수 있고, 

우리가 구한 카이제곱 검정 값 30.114는 7.815보다 훨씬 크기 때문에 귀무가설이 기각된다. 

 

 

3. 동일성 검정 요약

 

이를 정리하면 다음과 같다. 

 

 

10.pdf (kocw.net)

 

 

 

728x90
반응형