t-검정 (t-test)
t-검정은 두 개의 집단 간에 평균 차이가 통계적으로 유의미한지를 판단하는 데 사용된다.
"두 모집단의 평균간의 차이는 없다"라는 귀무가설과 "두 모집단의 평균간에 차이가 있다"라는 대립가설 중에 하나를 선택하는 통계적 검정방법이다.
모든 통계적 검정방법과 마찬가지로, t-검정은 귀무가설이 옳다는 가정 하에 두 모집단으로부터 추출된 표본들로부터 계산된 검정통계량 근거하여 귀무가설을 부정할 수 있는 상당한 근거를 보이면 귀무가설을 기각하고, 그렇지 않을 경우에는 귀무가설을 받아들이게 된다.
t-검정통계량을 계산하여 두 표본평균간의 차이가 귀무가설 하에 있을 확률, 표본오차로 인해 차이가 발생할 확률 (유의확률, p-값)을 계산한다. 만약 계산된 확률이 귀무가설을 기각하기로 설정한 유의수준 (일반적으로 5%, 1%)과 같거나 작다면 귀무가설을 기각하고 대립가설을 채택하게 된다.
1. 가설 설정 :
- 귀무 가설 (H0): 두 집단의 평균은 같다.
μ1 = μ2
- 대립 가설 (H1): 두 집단의 평균은 다르다.
μ1 ≠ μ2 또는 μ1 > μ2 또는 μ1 < μ2와 같이 어떤 방향성을 가진 차이가 있다
※ μ1과 μ2는 각각 두 집단의 평균
2. 표본 추출 : 두 집단에서 무작위로 표본을 추출한다. 이 표본은 해당 집단을 대표하는 데이터이다.
3. t-통계량 계산 : t-통계량은 두 집단의 평균 차이를 표준 오차로 나눈 값이다. 일반적으로 다음과 같이 계산된다.
4. 유의 수준 설정 : 실험자는 유의 수준(일반적으로 0.05 또는 0.01)을 결정하여 가설 검정을 수행한다. 이 값은 통계적으로 유의한 차이를 정의한다.
5. 결과 해석 : t-통계량을 자유도와 함께 t-분포에서 비교하며, p-값을 계산한다. p-값은 귀무 가설이 참일 때 표본에서 얻은 결과보다 더 극단적인 결과를 얻을 확률을 나타낸다.
만약 p-값이 유의 수준보다 작으면 귀무 가설을 기각하고 대립 가설을 채택한다. 이는 두 집단 간에 통계적으로 유의미한 평균 차이가 있다는 것을 의미한다.
t-검정은 두 집단의 평균 비교에 사용되며, 더 많은 변수 또는 집단 간의 비교가 필요한 경우 분산 분석(ANOVA) 등의 다른 통계적 기법을 고려할 수 있다.
t-검정은 두 모집단의 독립여부에 따라, "독립 표본 t-검정"과 "대응 표본 t-검정"으로 나눌 수 있다.
독립 2표본 t-검정 (Independent Samples t-test)
이 검정은 두 개의 서로 다른, 독립적인 집단 간의 평균 차이를 비교하는 데 사용된다.
즉, 두 집단 간의 관측치가 서로 독립적이며, 각 집단의 데이터는 다른 집단과 무관하게 수집된다.
예를 들어, 두 그룹의 학생들이 서로 다른 수학 시험의 평균 점수를 비교하는 경우, 이들 그룹은 서로 독립적이며, 두 그룹의 데이터는 서로 관련이 없다.
대응 2표본 t-검정 (Paired Samples t-test 또는 Dependent Samples t-test)
이 검정은 두 개의 집단 간의 평균 차이를 비교하는 데 사용된다.
그러나 이 경우, 두 집단의 데이터가 서로 의존적인 경우에 적용된다.
이것은 동일한 개체 또는 단위에 대한 두 가지 다른 조건 또는 시점에서 데이터를 수집한 경우에 사용된다.
예를 들어, 어떤 치료 전후에 환자들의 혈압을 측정하는 경우, 각 환자의 혈압은 치료 전과 후에 대응되는 데이터로 간주되며, 이 경우 대응표본 t-검정을 사용하여 두 조건 간의 차이를 검정한다.
독립 표본 F검정 및 t-검정
R / Rstudio
두 집단(그룹)간 판매량의 차이가 있는지를 검정 t.test(group_A, group_B)
신규 상품이 출시되어, 두 개 지역의 규모가 유사한 20개 점포(지역별 10개)를 선정하여, 1주간 점포별 판매량을 조사했다고 할 때,
A지역(그룹) | B지역(그룹) | ||
점포01 | 70 | 점포11 | 60 |
점포02 | 68 | 점포12 | 65 |
점포03 | 82 | 점포13 | 55 |
점포04 | 78 | 점포14 | 58 |
점포05 | 72 | 점포15 | 67 |
점포06 | 68 | 점포16 | 59 |
점포07 | 67 | 점포17 | 61 |
점포08 | 68 | 점포18 | 68 |
점포09 | 88 | 점포19 | 77 |
점포10 | 60 | 점포20 | 66 |
# 두 독립적인 그룹의 데이터 group_A <- c(70, 68, 82, 78, 72, 68, 67, 68, 88, 60) group_B <- c(60, 65, 55, 58, 67, 59, 61, 68, 77, 66) mean( group_A ) sd(group_A) mean( group_B) sd(group_B) |
> mean( group_A ) [1] 72.1 > sd(group_A) [1] 8.252272 > mean( group_B) [1] 63.6 > sd(group_B) [1] 6.363088 |
- A그룹의 평균 판매량은 72.1이고, B그룹의 평균 판매량은 63.6이다.
- 각 그룹의 표준편차를 보면, A그룹의 변동 폭(8.25)이 B그룹의 변동 폭(6.36)보다 크다.
20개 점포의 1주간의 판매량에 국한하여 결론을 내린다면, A지역의 판매량이 많다고 할 것이다.
그러나, 지역별 10개 점포(표본)가 아닌 각 지역의 모든 점포(모집단)의 경우, A지역과 B지역의 판매량의 차이가 있다고 할 수 있을까? 표본추출과정에서 발생된 차이일 수도 있지 않을까?
F-검정
# F-검정 (분산 분석) 수행 result <- var.test(group_A, group_B) print(result) |
> print(result) F test to compare two variances data: group_A and group_B F = 1.6819, num df = 9, denom df = 9, p-value = 0.4505 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.4177708 6.7714924 sample estimates: ratio of variances 1.681943 |
- F-통계량 (F-statistic): F = 1.6819
F-통계량은 두 그룹 간의 분산 비율을 나타내며, 그룹 A의 분산을 그룹 B의 분산으로 나눈 값이다. - p-값 (p-value): p-value = 0.4505
p-값은 귀무 가설을 "두 그룹의 분산은 같다"라는 전제 하에 얻은 결과보다 더 극단적인 결과를 얻을 확률을 나타낸다.
여기서 p-value가 0.05보다 크기 때문에, 귀무 가설을 기각할 충분한 증거가 없다.
즉, 이 결과는 두 그룹의 분산이 통계적으로 유의미하게 다르다는 증거를 제공하지 않는다. - 대립 가설 (alternative hypothesis): true ratio of variances is not equal to 1
대립 가설은 검정 결과를 요약하는 부분으로, 여기에서는 "두 그룹의 분산 비율은 1이 아닐 것"이라는 의미다. - 신뢰 구간 (confidence interval): 95 percent confidence interval: 0.4177708 6.7714924
신뢰 구간은 두 그룹의 분산 비율에 대한 95% 신뢰 구간을 나타낸다. 이 구간에 포함된 값은 분산 비율이 어디에 위치할 가능성이 높은지를 나타낸다. 이 경우, 1을 중심으로 한 비율 값이 포함되어 있으며, 큰 차이가 없음을 시사한다.
두 집단의 모분산이 같은지 다른지를 검정하는 F-검정의 귀무가설("두 집단의 모분산은 같다")의 유의수준이 0.05(5%)라 할 때, 검정통계량의 p-값은 0,4505로 유의수준보다 크므로 귀무가설을 채택한다. 즉, 두 집단의 모분산이 같다고 할 수 있다.
두 집단의 모분산이 같으므로, 두 집단간에 평균치의 검정에는 등분산 t-검정을 수행한다.
등분산 t-검정
# 등분산 t-검정 수행 result <- t.test(group_A, group_B, var.equal = TRUE) print(result) |
> print(result) Two Sample t-test data: group_A and group_B t = 2.5794, df = 18, p-value = 0.0189 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 1.576868 15.423132 sample estimates: mean of x mean of y 72.1 63.6 |
- t-통계량 (t-statistic): t = 2.5794
t-통계량은 두 그룹 간의 평균 차이가 표준 오차로 나눈 값으로, 두 그룹의 평균이 얼마나 다른지를 나타낸다.
여기서 t-통계량은 2.5794로 양의 값을 가지므로, 그룹 A의 평균이 그룹 B의 평균보다 크다는 것을 나타낸다. - 자유도 (degrees of freedom, df): df = 18
t-검정의 자유도는 18로 표시되며, 이는 두 그룹의 자료 수에서 1을 뺀 값입니다. - p-값 (p-value): p-value = 0.0189
p-값은 귀무 가설을 "두 집단의 평균은 같다"라는 전제 하에 얻은 결과보다 더 극단적인 결과를 얻을 확률을 나타낸다.
p-value가 0.05보다 작기 때문에 (0.0189 < 0.05), 귀무 가설을 기각할 충분한 증거가 있으며, 두 그룹 간에 통계적으로 유의미한 평균 차이가 있다고 말할 수 있다. - 대립 가설 (alternative hypothesis): true difference in means is not equal to 0
대립 가설은 검정 결과를 요약하는 부분으로, 여기에서는 "두 집단의 평균 차이가 0이 아니라"라는 의미이다. - 신뢰 구간 (confidence interval): 95 percent confidence interval: 1.576868 15.423132
신뢰 구간은 두 집단의 평균 차이에 대한 95% 신뢰 구간을 나타낸다. 이 구간에는 [1.576868, 15.423132]로 표시되며, 이것은 평균 차이가 양의 값을 가질 가능성이 높음을 나타낸다.
"두 그룹의 판매량은 차이가 있다"라는 결론을 내릴 수 있다.
평균이 큰 A그룹(72.1)이 B그룹(63.6)보다 판매량이 더 많다고 할 수 있다.
모분산이 다른 경우 (등분산이 아닌 t-검정 또는 Welch's t-검정)
모분산이 다른 경우, R의 t.test() 함수는 자동으로 등분산이 아닌(two-sample unequal variance 또는 Welch's t-test) t-검정을 수행하므로 별도의 옵션을 지정할 필요가 없다.
위 데이터가 모분산이 다르다고 F-검정 결과가 나왔다가 가정
# 독립 2표본 t-검정 수행 result <- t.test(group_A, group_B) print(result) |
> print(result) Welch Two Sample t-test data: group_A and group_B t = 2.5794, df = 16.907, p-value = 0.01955 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 1.544643 15.455357 sample estimates: mean of x mean of y 72.1 63.6 |
- t-통계량 (t-statistic): t = 2.5794
t-통계량은 두 그룹 간의 평균 차이가 표준 오차로 나눈 값으로, 두 그룹의 평균이 얼마나 다른지를 표시 - 자유도 (degrees of freedom, df): df = 16.907
t-분포의 자유도를 나타내며, t-분포에서 p-값을 계산하는 데 사용
분석 결과를 해석하고 보고할 때, Welch Two Sample t-test는 등분산성 가정을 하지 않는 경우에 사용되며, 이로 인해 자유도가 소수점일 수 있다. - p-값 (p-value): p-value = 0.01955
p-값은 귀무 가설을 "두 집단의 평균은 같다"라는 전제 하에 얻은 결과보다 더 극단적인 결과를 얻을 확률을 나타내며, p-value가 0.05보다 작은 경우 (0.01955 < 0.05), 귀무 가설을 기각할 충분한 증거가 있으며, 두 그룹 간에 통계적으로 유의미한 평균 차이가 있다고 말할 수 있다. - 대립 가설 (alternative hypothesis): true difference in means is not equal to 0
대립 가설은 검정 결과를 요약하는 부분으로, 여기에서는 "두 집단의 평균 차이가 0이 아니라"라는 의미이다. - 신뢰 구간 (confidence interval): 95 percent confidence interval: 1.544643 15.455357
신뢰 구간은 두 집단의 평균 차이에 대한 신뢰 구간을 표시
이 구간은 95% 확률로 실제 평균 차이가 이 범위 안에 있을 것으로 추정된다.
여기서는 [1.544643, 15.455357]로 표시되며, 이것은 평균 차이가 양의 값을 가질 가능성이 높음
"두 그룹의 판매량은 차이가 있다"라는 결론을 내릴 수 있다.
평균이 큰 A그룹(72.1)이 B그룹(63.6)보다 판매량이 더 많다고 할 수 있다.
Summary
등분산이 가정됨 | 등분산이 가정되지 않음 | |
t-통계량 (t-statistic) | 2.5794 | 2.5794 |
자유도 (degrees of freedom, df) | 18 | 16.907 |
p-값 (p-value) | 0.0189 | 0.01955 |
신뢰 구간 (confidence interval) | 1.576868 15.423132 | 1.544643 15.455357 |
평균(mean) | 72.1 63.6 | 72.1 63.6 |
SPSS로 t-검점을 실행하면, 위 표와 유사한 수행 결과를 얻을 수 있으며,
F-검정 결과를 확인하여 등분산 가정 여부에 따라, 해당하는 통계값을 확인해야 한다.
대응 표본 t-검정
[R Studio] 평균의 비교 대응 표본 T-검정(test) (논문 작성을 위한 네 번째 분석) (tistory.com)
'데이터 분석 (with Rstudio)' 카테고리의 다른 글
[R Studio] 이원배치 분산분석 ANOVA (논문 작성을 위한 다섯 번째 분석) (0) | 2023.10.01 |
---|---|
[R Studio] 평균의 비교 대응 표본 T-검정(test) (논문 작성을 위한 네 번째 분석) (0) | 2023.09.28 |
[R 기초] 기술통계 (논문 작성을 위한 세 번째 분석) (1) | 2023.09.26 |
[R 기초] 결측값 결측치 처리 (데이터 클린징) (0) | 2023.09.21 |
[R 기초] 교차 분석 (논문 작성을 위한 두 번째 분석) (0) | 2023.09.18 |