1 F-검정 #
- 2개의 변수에 대해서 분산이 같은지 다른지 검정.
- R에서는 var.test 함수 이용
- F 통계량
- F 통계량 = (SSA/자유도) / (SSE/자유도)
- 체계적 분산(SSA, 집단간 분석) : 어떤 변인의 영향에 의한 분산 (각 집단 평균들이 전체평균으로 부터 떨어진 정도)
- 오차 분석(SSE, 집단내 분석) : 표본에서 우연히 생기는 분석
a <- c(61,60,56,63,56,63,59,56,44,61)
b <- c(55,54,47,59,51,61,57,54,62,58)
var.test(a,b)
결과는 다음과 같다.
F test to compare two variances
data: a and b
F = 1.4815, num df = 9, denom df = 9, p-value = 0.5675
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.3679936 5.9646717
sample estimates:
ratio of variances
1.48154
>
결과해석
- 가설
- 귀무가설: 분산에 차이가 없다.
- 대립가설: 분산에 차이가 있다.
- p-value가 0.5675로 유의수준 0.05보다 크므로 대립가설은 뻑. 그러므로 귀무가설 지지.
2 로버스트한 방법 #
- 표본 평균 대신 표본 중위수로부터 관측치까지의 거리를 사용
- 변수들 중 분산이 하나라도 다른 것이 있는지에 대한 검정
- R에서는 leveneTest를 이용
a <- c(61,60,56,63,56,63,59,56,44,61)
b <- c(55,54,47,59,51,61,57,54,62,58)
x1 <- data.frame(a,b)
df1 <- stack(x1)
library("car")
leveneTest(values~ind, data=df1)
결과는 다음과 같다.
> leveneTest(values~ind, data=df1)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 1 0.0039 0.9508
18
결과해석
- 가설
- 귀무가설: 분산의 차이가 없다.
- 대립가설: 분산의 차이가 있다.
- p-value = 0.9508 로 유의수준 0.05보다 크다. 그러므로 대립가설은 뻑남. 귀무가설 지지.
c1 <- c(3.6, 4.1, 4.0)
c2 <- c(3.1, 3.2, 3.9)
c3 <- c(3.2, 3.5, 3.5)
c4 <- c(3.5, 3.8, 3.9)
x1 <- data.frame(c1,c2,c3,c4)
df2 <- stack(x1)
library("car")
leveneTest(values~ind, data=df2)
결과는 다음과 같다.
> leveneTest(values~ind, data=df2)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 3 0.2593 0.8528
8
역시 귀무가설 지지..