썸네일 9. 카이제곱 검정 : 독립성 검정 (교차 분석) 카이제곱의 마지막 검정 방법인 독립성 검정이다. 두 범주형 변수가 있을 때 서로 연관성이 있는 지, 혹은 독립인지 검정하는 방법이다. 예를 들자면, 연령때에 따른 자동차 선호도가 유의미 한가를 판단할 때 사용한다. 1. 카이제곱 독립성 검정 예제. 테이블 1: 영화 간식류 데이터에 대한 분할표 영화 장르 간식류 간식류 비구매 작업 50 75 코미디 125 175 가족 90 30 공포 45 10 카이제곱 독립성 검정 예제 | 통계 소개 | JMP 다음 예제를 통해 카이제곱 독립성 검정을 알아보자. 2. 기대 개수 계산 각 영화-간식류 조합에 대한 기대 개수를 구하려면 먼저 아래 나온 행과 열 합계가 필요합니다. 테이블 2: 행 합계와 열 합계가 포함된 영화 간식류 데이터에 대한 분할표 (카이제곱 독립성 검..
썸네일 8. 카이제곱 검정 2 : 동일성 검정 예제 카이제곱 검정은, 다시 말하자면 연관성을 검정하는 방법이다. 연관성을 검정하는 방법에는 여러가지가 있고, 이번에는 Test of homogenetiy 동일성 검정을 알아보도록 하겠다. 동일성 검정이란, 두 집단의 분포의 동일 여부를 검정하는 방법이다. 1. 동일성 검정. 동일성 검정은 부모집단 각각으로 부터 정해진 표본의 크기만큼 자료를 추출할 때, 분할표에서 부모집단의 비율이 동일한지 검정하는 방법이다. 이를 수식으로 표현한다면, n개의 모집단에서 각각에 속하는 개체의 특성이 r개로 나뉘어질 때, i째에 속하는 특성을 가질 확률을 Pij 라고 한다면, 아래와 같은 귀무가설과 대립가설을 만족한다는 의미이다. 즉, 만약 귀무가설이 기각되지 않는다면, 한 실험대상이 B 그룹에 속할 확율은 어떤 부모집단이든 ..
썸네일 7. 카이제곱 검정 : 적합도 검정 (Pearson의 카이제곱 검정) Goodness of fit test 예제. 1. 카이제곱 검정 카이 제곱 검정은, 관찰된 빈도가 기대되는 빈도와 유의미하게 다른지를 검증하는 통계 검정 방법이다. 주로 범주형 자료로 구성된 데이터 분석에 이용된다. 핵심은 두 범주형 변수가 서로 상관이 있는 지 혹은 독립 관계인지 이다. 참고로 범주형 자료는 categorical data 로, 월 소득 100만원 미만, 이상 등 구간에 대한 자료를 의미한다. 카이제곱 검정의 형태는 다음과 같다. 1. Goodness of fit test : 적합도 검정. (Pearson의 카이제곱 검정) 적합도 검정이란, 어떤 모집단의 표본이 그 모집단을 대표할 수 있는 지 검정하는 방법으로, 관찰 된 비율 값이 기대값과 같은지 여부를 검정하는 방법이다. 변수는 1개 이다. 2. Test of homogeneit..
썸네일 6. 통계 검정 기초 : Wilcoxon Rank sum 검정/Mann Whitney U 검정 예제, 정규분포가 아닐때 이번에는 두 모집단이 독립이면서 정규분포를 따르지 않을 때의 검정 방법이다. Wilcoxon Rand sum TEST (윌콕슨 순위 합 검정) 혹은 Mann Whitney U 검정이라고 불린다. 1. Wilcoxon Rank sum TEST (Mann Whitney U) 란? Mann Whitney U 검정이라고도 잘 알려져 있는 이 검정은, 표본이 서로 독립일때의 비모수 검정 방법이다. 두 모집단의 표본의 갯수가 다를 때 사용 가능하다. 이 검정은 임의로 선택된 X값과 Y 값에 대해서 X가 Y보다 클 확률과 Y가 X보다 클 확률이 같다고 귀무가설을 세운다. 즉, X와 Y의 데이터가 중앙값이 같은 연속된 분포에서 추출된 표본이다 라고 할 수 있다. 이 말은 두 모집단의 중앙값이 동일한지 여부를 검정한다는..
썸네일 5. 통계 검정 기초 : Wilconxon Signed Rank검정(윌콕슨 부호 순위 검정) 예제, 정규분포가 아닐때 1. Wilcoxon 검정이란? 만약 모집단이 정규성을 만족하지 않는 다면 어떻게 해야할까? 정규성이 만족하지 않는 경우에는 T검정 Z검정등 우리가 기존에 공부한 검정 방법을 적용할 수 없다. 왜냐하면 이 검정 방법들의 사전 가정은 모집단이 정규 분포를 만족한다는 전제가 깔려 있기 때문이다. 하지만 우리의 실제 생활에서 분석되는 통계 자료들은 정규성을 만족하지 않는 경우가 많다. 이럴 때는 어떤 방식으로 통계 검정을 해야하는 가 오늘 알아보자. 다음 그림은 데이터 자료에 붙여둔 통계 검정 정리표이다. 오늘 공부할 내용은, Wilcoxon 이며, 이게 어떤 분석인지 한 눈에 파악하기 쉽도록 표를 붙여 놓았다. 2. Wilcoxon 검정의 종류 Wilcoxon 검정이란 모집단이 정규성을 만족하지 못할 때 사..
썸네일 4. 통계 검정 기초 , 독립 표본 T검정 : 이분산일때 (Welch`s t test) 독립 표본 T검정 : 이분산일때 (Welch`s t test) 4번인 표본개수가 불충분하면서도 모분산 동일성을 모를 때 사용하는 검정이다. 이는 Welch`s t test 라고도 한다. 즉, 이 검정을 사용하는 경우는 바로 모집단들의 분산을 모를때인데, 사실 실제 통계에서는 이런 경우가 더 많다는 것을 쉽게 알아차릴 수 있을 것이다. 등분산과 이분산을 쉽게 구별하는 방법엔 어떤 것이 있을까 ? 등분산은 아래 그림에서와 왼쪽에서와 같이 분산이 같은 모습을 확인 할 수 있다. 그림에는 표현되어있지 않지만, 당연히 평균은 다를 수 있다. 이분산은 오른쪽과 같이 분산이 다른 경우를 말한다. 등분산 이분산 여부를 알 수 있는 것은 바로 F 검정법인데, 이는 전 시간에 Excel data로 설명했으므로 넘어가도록 ..