썸네일 [통계 실전] [002] R을 활용한 통계분석 - 주석처리, 메모리초기화, 데이터 읽고 저장하기 R을 활용한 통계분석 : 주석처리, 메모리초기화, 데이터 읽고 저장하기 이번 시간에는 주석 처리 방법 및 메모리 초기화 그리고 데이터 읽고 저장하는 방법에 대해 간단히 공부하는 시간이다. 다음과 같은 경로에, 읽을 데이터를 저장했다. text 파일을 불러 읽고 저장할 예정이다. 여기서 중요한 점은 File -> 작업 디렉토리 변경에서, data가 저장된 파일경로로 디렉토리를 변경해주어야 한다는 점이다. 위의 디렉토리를 아래 데이터 파일 저장 경로와 일치 시켜 주었다. 다음과 같이 경로를 바꿨다면, 이제 R data를 입력해보자. 여기까지가 오늘 공부할 분량이다. 하나하나 차근차근 따라해보자. 먼저, R에 다음과 같이 입력하자. DATA를 읽어오는 과정을 진행 할 것이다. > #READ DATA FILE ..
썸네일 [통계 실전] R을 활용한 통계분석 - R 다운로드 R을 활용한 통계 분석 R을 사용해서 실전! 통계 분석을 시작하기 전, 먼저 통계 툴 R 다운받기 작업이 완료되어야 한다. 아래의 사이트에서 R을 무료로 다운받을 수 있다. R의 가장 큰 장점은 바로 무료로 사용가능 하다는 점이다. R: The R Project for Statistical Computing (r-project.org) R: The R Project for Statistical Computing www.r-project.org 홈페이지에 들어갔다면, 왼쪽 download라고 적혀있는 곳을 보자. 밑에 CRAN이라고 되어있는데 이 곳을 클릭하면 된다. 각 나라 버전으로 다운 받을 수 있는데, KOREA 버전으로 다운을 받겠다. Korea 를 보면 여러가지 다운 가능한 사이트를 확인 할 수 ..
썸네일 9. 카이제곱 검정 : 독립성 검정 (교차 분석) 카이제곱의 마지막 검정 방법인 독립성 검정이다. 두 범주형 변수가 있을 때 서로 연관성이 있는 지, 혹은 독립인지 검정하는 방법이다. 예를 들자면, 연령때에 따른 자동차 선호도가 유의미 한가를 판단할 때 사용한다. 1. 카이제곱 독립성 검정 예제. 테이블 1: 영화 간식류 데이터에 대한 분할표 영화 장르 간식류 간식류 비구매 작업 50 75 코미디 125 175 가족 90 30 공포 45 10 카이제곱 독립성 검정 예제 | 통계 소개 | JMP 다음 예제를 통해 카이제곱 독립성 검정을 알아보자. 2. 기대 개수 계산 각 영화-간식류 조합에 대한 기대 개수를 구하려면 먼저 아래 나온 행과 열 합계가 필요합니다. 테이블 2: 행 합계와 열 합계가 포함된 영화 간식류 데이터에 대한 분할표 (카이제곱 독립성 검..
썸네일 8. 카이제곱 검정 2 : 동일성 검정 예제 카이제곱 검정은, 다시 말하자면 연관성을 검정하는 방법이다. 연관성을 검정하는 방법에는 여러가지가 있고, 이번에는 Test of homogenetiy 동일성 검정을 알아보도록 하겠다. 동일성 검정이란, 두 집단의 분포의 동일 여부를 검정하는 방법이다. 1. 동일성 검정. 동일성 검정은 부모집단 각각으로 부터 정해진 표본의 크기만큼 자료를 추출할 때, 분할표에서 부모집단의 비율이 동일한지 검정하는 방법이다. 이를 수식으로 표현한다면, n개의 모집단에서 각각에 속하는 개체의 특성이 r개로 나뉘어질 때, i째에 속하는 특성을 가질 확률을 Pij 라고 한다면, 아래와 같은 귀무가설과 대립가설을 만족한다는 의미이다. 즉, 만약 귀무가설이 기각되지 않는다면, 한 실험대상이 B 그룹에 속할 확율은 어떤 부모집단이든 ..
썸네일 7. 카이제곱 검정 : 적합도 검정 (Pearson의 카이제곱 검정) Goodness of fit test 예제. 1. 카이제곱 검정 카이 제곱 검정은, 관찰된 빈도가 기대되는 빈도와 유의미하게 다른지를 검증하는 통계 검정 방법이다. 주로 범주형 자료로 구성된 데이터 분석에 이용된다. 핵심은 두 범주형 변수가 서로 상관이 있는 지 혹은 독립 관계인지 이다. 참고로 범주형 자료는 categorical data 로, 월 소득 100만원 미만, 이상 등 구간에 대한 자료를 의미한다. 카이제곱 검정의 형태는 다음과 같다. 1. Goodness of fit test : 적합도 검정. (Pearson의 카이제곱 검정) 적합도 검정이란, 어떤 모집단의 표본이 그 모집단을 대표할 수 있는 지 검정하는 방법으로, 관찰 된 비율 값이 기대값과 같은지 여부를 검정하는 방법이다. 변수는 1개 이다. 2. Test of homogeneit..
썸네일 6. 통계 검정 기초 : Wilcoxon Rank sum 검정/Mann Whitney U 검정 예제, 정규분포가 아닐때 이번에는 두 모집단이 독립이면서 정규분포를 따르지 않을 때의 검정 방법이다. Wilcoxon Rand sum TEST (윌콕슨 순위 합 검정) 혹은 Mann Whitney U 검정이라고 불린다. 1. Wilcoxon Rank sum TEST (Mann Whitney U) 란? Mann Whitney U 검정이라고도 잘 알려져 있는 이 검정은, 표본이 서로 독립일때의 비모수 검정 방법이다. 두 모집단의 표본의 갯수가 다를 때 사용 가능하다. 이 검정은 임의로 선택된 X값과 Y 값에 대해서 X가 Y보다 클 확률과 Y가 X보다 클 확률이 같다고 귀무가설을 세운다. 즉, X와 Y의 데이터가 중앙값이 같은 연속된 분포에서 추출된 표본이다 라고 할 수 있다. 이 말은 두 모집단의 중앙값이 동일한지 여부를 검정한다는..