2. 통계 검증 기초 - 대응 표본 T 검정

2021년 06월 29일 by Coco___

    2. 통계 검증 기초 - 대응 표본 T 검정 목차
728x90
반응형

T 검정 - 대응표본 및 독립 표본

T 검정이란, 양적 데이터의 검증 방법이다. T 검정의 방법에는 모집단의 관계가 중요한 역할을 한다. 모집단 A와 모집단 B가 연관성이 있다면, 대응 표본 T 검정을 사용하고, 모집단 A와 모집단 B가 연관되지 않는다면 독립표본 T 검정을 통한 데이터 검정이 필요하다.  이러한 대응표본과 독립 표본 비교는 두 모집단의 평균 차이에 대한 비교 방법이다. 

 

  • 대응 표본 

-표본끼리 연관성이 존재함.

-한 집단 내, 데이터를 반복 추출하는 경우

-실험 약 투약 전/후 끼리의 비교 방법이 있다. 

 

  • 독립 표본

-서로 다른 두 모집단에서 데이터를 추출하는 방법

 

 


 

대응표본 t-test의 논리

  • 두 모집단의 차이를 구한다. 
  • 귀무가설 : 두 모집단에서의 차이의 평균은 0이다. 
  • 검정통계량 T가 기각역에 속한다면, 귀무가설이 기각된다. 
  • 두 집단간의 차이가 존재한다. 

 


대응 표본 예시. 

 

다음은 Program을 시행하기 전/후의 통계 검정 방법이다. 

 

1. 데이터의 종류는 ? 

양적 데이터임을 알 수 있다. 

2. 데이터를 분석 하기 위해서는 어떤 방법이 필요한가? 

 - Program 전/후 두개의 모집단이 서로 연관되어있으므로, 대응표본 관계에 있다. 

3. 귀무가설 대립가설 세우기

 

귀무가설 Ho : Program의 효과는 없을 것이다. (두 모집단의 평균 차이는 같다.)

 

4. 표본 분산 및 표본 표준 편차를 구해라. 

다음에서 분산의 합은 9+0+4+1+16 = 30 임을 알 수 있다. 

 

표본 차이의 분산 = 분산의 합/자유도 이기 때문에 

표본 분산 = 30/4 = 7.5 이며, 표준 편차는 분산의 루트값인 2.74 임을 확인할 수 있다. 

 

 

5. 검정 통계량 T값 구하기. 

 

검정통계량 T는 신뢰 수준 100(1-a) 에 대해 다음 값을 만족한다. 

의미를 생각해보면, 두 집단 차이의 평균을 (표준편차/모수의 루트값)으로 나눠준 것이다. 

 

따라서 T 값은 평균 2/ (편차 2.74 / 루트5) 가 되어 1.64 라는 값이 나온다. 

 

 

6. 기각역 구하기. 

 

그렇다면 구한 검정 통계량 T값이 기각역에 속하는지의 여부만 판단하면 가설 검증이 완료된다. 

기각역은 유의수준 0.05내에서, 자유도(n-1) 즉 4인 영역에 속한다는 것을 알 수 있다. 

 

양측 검정으로 검정할 경우, 0.05를 2로 나누어주면 t(0.025,4) 영역의 t 분포표를 참고하면 된다. 

 

 

7. 기각 여부 결정하기.

 

신뢰수준 95%인 양팔 검증에서, 검정 통계량 t값은 기각역에 속하지 않으므로, 귀무가설을 기각할 수 없다. 

즉 프로그램의 전,후 차이는 나타나지 않으며 프로그램이 효과가 없다는 결론을 지을 수 있다. 

 

728x90
반응형