Research Methodologies & Statistics
-
이원분산분석 (Two Way ANOVA)Research Methodologies & Statistics 2022. 9. 27. 22:40
이원분산분석은 두개의 독립변수가 종속변수에 어떠한 영향을 미치는지를 분석하는 것으로 각각의 독립변수가 종속변수에 미치는 영향을 주효과(Main Effect)라고 하고 2개의 독립변수가 동시에 작용하여 종속변수에 영향을 미치는 것을 상호작용효과(Interaction Effect))라고 한다. 그래서 이원분산분석을 할 때에는 주효과와 상호작용효과 모두를 살펴보아야 한다. 그러나 모든 이원분산분석에서 주효과와 상호작용효과를 살펴볼 수 있는 것은 아니다. 예를 들어 집단을 나타내는 두개의 독립변수가 1개의 관측치만 갖고 있을 경우에는 주효과만 살펴보면 되고, 관측치가 2개 이상인 집단이 있으면 상호작용효과까지 살펴봐야 한다. ( [주효과만 봐야 하는 경우] 만약 분석을 하기 위한 데이터가 아래와 같이 각 셀이 ..
-
일원분산분석(One-Way ANOVA)Research Methodologies & Statistics 2022. 4. 13. 05:33
install.packages("ggplot2") library(ggplot2) 분산분석 I 흔히 One-Way ANOVA를 일원분산분석 또는 일원배치분산분석이라고 한다(이하 일원분산분석). 분산분석은 3개 혹은 그 이상의 집단 간 평균을 비교하는 것으로 독립변수는 집단을 나타내야하고 종속변수는 연속변수이어야 한다. 참고로 일원분산분석은 한개의 독립변수를, 이원분산분석은 두개의 독립변수를 사용하는 것이다. 분산분석을 함에 있어 중요한 세가지의 가정이 있는데 1. 독립성, 2.정규성, 3.등분산성이다. 첫째 독립성은 독립변수에 있는 하위 집단들은 서로 독립적이어야 한다는 것이다. 이 가정은 분석 단계가 아닌 표본을 추출하는 단계에서 충족시켜져야 한다. 두번째는 정규성으로 독립변수에 따른 종속변수는 정규분포..
-
대응표본 t 검정 (Paired t-test)Research Methodologies & Statistics 2021. 11. 10. 03:06
예를 통해서 대응표본 t 검정이 언제 사용되는지 살펴보았다. A학교 학생들이 영어시험을 학기 시작할 때 한번 보고, 학기 마칠때 한번 보았다고 가정하고 학기 사작할 때 본 시험을 사전검사 학기 마칠 때 본 시험을 사후검사라고 이름을 부여한 후 시험 성적을 입력하였다. 이렇게 성적을 입력한 데이터는 각각의 학생들은 사전검사와 사후검사 성적을 각각 갖게 되는데 이런 경우 대응표본 t 검정을 사용하면 된다. 또 다른 예로는, 약의 효과를 살펴보기 위해 동일 집단에 약 섭취 전후로 나누어 살펴보고자 한다면 이것 또한 대응표본 t검정이 된다. 즉 동일집단에 있는 개인이 갖고 있는 각 값의 평균의 차이가 있는지 살펴보고자 하는 것으로 위의 예에서 pre-test 평균과 post-test평균의 차이가 0인지 아닌지를..
-
독립표본 t 검정Research Methodologies & Statistics 2021. 11. 8. 06:29
독립표본 t 검정은 두 개 집단의 평균을 비교하는 것으로 예를들면, 남학생과 여학생의 학업성취도 평균차이를 들 수 있다. 독립표본 t검정에서 중요한 것은 두 집단의 분산이 같으냐 같지 않느냐에 따라 다르게 접근해야 하는데 이는 결과의 정확도를 높이기 위해서이다. 만약 두 모집단의 분산이 같다는 것을 가정할 수 없으면 우리는 unpooled를, 만약 두 모집단의 분산이 같다고 가정 할 수 있으면 pooled를 사용하면 된다. 두 집단의 분산이 같다는 것을 가정할 수 있는지 없는지 살펴볼 수 있는 방법 중의 한가지는 Levene test이다. 이를 위해서는 lawstat 패키지를 설치한 후 로드해야 한다. install.packages("lawstat") library(lawstat) 독립표본 t 검정을 위..
-
단일 모집단평균에 대한 가설 검정/일표본 t검정/t-test (2)Research Methodologies & Statistics/Contents 2021. 10. 20. 22:47
앞선 단일 모집단평균에 대한 가설 검정/일표본 t검정/t.test (1)에서는 t.test 명령어를 이용하여 분석하는 법을 살펴보았다. 이번 장에서는 각 단계별로 어떻게 계산되어지는지 그 절차를 살펴보고자 한다. 영가설은 ㄱ 자동차의 연비는 리터당 30km이다 이고, 연구가설은 리터당 30km가 되지 않는다였다. 가설을 검정하기 위하여 80대의 자동차를 무선으로 표집했으므로 n = 80이 된다. 표본평균을 구해보면 26.6이다. 첨부된 파일이 데이터프레임의 형태이기 때문에 mean(데이터&변수명)을 입력해줘야 한다. car.mean round(car.mean,1) [1] 26.6 표본의 표준편차를 구해보면 3.3이다. car.sd round(car.sd, 1) [1] 3.3 표본의 평균을 보면 26.6으..
-
단일 모집단평균에 대한 가설검정/일표본t검정/t.test (1)Research Methodologies & Statistics/Contents 2021. 10. 20. 12:03
일표본 t 검정 (또는 단일 모집단평균에 대한 가설검정)을 어느 경우에 사용하는지 예를 들어보면... [상황1] A 자동차 회사에서 연비가 1리터당 30km 가는 자동차라고 홍보하며 ㄱ자동차를 출시하였다. 연비가 좋다는 말에 많은 소비자들이 ㄱ 자동차를 구매하였다. 그런데 ㄱ 자동차를 구매한 많은 소비자들이 연비가 리터당 30km가 안된다며 민원을 제기하였다. 이에 A자동차 회사가 과연 연비가 리터당 30km 안되는지 확인하기 위하여 무선표집으로 전국에서 차량 80대 뽑아왔고, 시내 환경과 가장 유사한 곳에서 연비를 검증하였다. 그 결과 carfuel.csv 파일이다. 표본수(sample size) : 80 영가설 : ㄱ 자동차의 연비가 1리터당 30Km이다. 연구가설: ㄱ 자동차의 연비가 1리터당 30..