본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
데이터 분석 (with Rstudio)

[R Studio] 평균의 비교 T-검정(test) (논문 작성을 위한 네 번째 분석)

by Vitaminymc 2023. 9. 28.
반응형

t-검정 (t-test)

t-검정은 두 개의 집단 간에 평균 차이가 통계적으로 유의미한지를 판단하는 데 사용된다. 

"두 모집단의 평균간의 차이는 없다"라는 귀무가설과 "두 모집단의 평균간에 차이가 있다"라는 대립가설 중에 하나를 선택하는 통계적 검정방법이다.

 

모든 통계적 검정방법과 마찬가지로, t-검정은 귀무가설이 옳다는 가정 하에 두 모집단으로부터 추출된 표본들로부터 계산된 검정통계량 근거하여 귀무가설을 부정할 수 있는 상당한 근거를 보이면 귀무가설을 기각하고, 그렇지 않을 경우에는 귀무가설을 받아들이게 된다.

 

t-검정통계량을 계산하여 두 표본평균간의 차이가 귀무가설 하에 있을 확률,  표본오차로 인해 차이가 발생할 확률 (유의확률, p-값)을 계산한다. 만약 계산된 확률이 귀무가설을 기각하기로 설정한 유의수준 (일반적으로  5%, 1%)과 같거나 작다면 귀무가설을 기각하고 대립가설을 채택하게 된다.

 

1. 가설 설정 :
   - 귀무 가설 (H0): 두 집단의 평균은 같다. 
                         μ1 = μ2

   - 대립 가설 (H1): 두 집단의 평균은 다르다.
                         μ1 ≠ μ2 또는 μ1 > μ2 또는 μ1 < μ2와 같이 어떤 방향성을 가진 차이가 있다

※ μ1과 μ2는 각각 두 집단의 평균

2. 표본 추출 : 두 집단에서 무작위로 표본을 추출한다. 이 표본은 해당 집단을 대표하는 데이터이다.

3. t-통계량 계산 : t-통계량은 두 집단의 평균 차이를 표준 오차로 나눈 값이다. 일반적으로 다음과 같이 계산된다.

4. 유의 수준 설정 : 실험자는 유의 수준(일반적으로 0.05 또는 0.01)을 결정하여 가설 검정을 수행한다. 이 값은 통계적으로 유의한 차이를 정의한다.

 

5. 결과 해석 : t-통계량을 자유도와 함께 t-분포에서 비교하며, p-값을 계산한다. p-값은 귀무 가설이 참일 때 표본에서 얻은 결과보다 더 극단적인 결과를 얻을 확률을 나타낸다.
만약 p-값이 유의 수준보다 작으면 귀무 가설을 기각하고 대립 가설을 채택한다. 이는 두 집단 간에 통계적으로 유의미한 평균 차이가 있다는 것을 의미한다.

 

t-검정은 두 집단의 평균 비교에 사용되며, 더 많은 변수 또는 집단 간의 비교가 필요한 경우 분산 분석(ANOVA) 등의 다른 통계적 기법을 고려할 수 있다.

 

300x250

 

t-검정은 두 모집단의 독립여부에 따라, "독립 표본 t-검정"과 "대응 표본 t-검정"으로 나눌 수 있다.

독립 2표본 t-검정 (Independent Samples t-test)

이 검정은 두 개의 서로 다른, 독립적인 집단 간의 평균 차이를 비교하는 데 사용된다.

즉, 두 집단 간의 관측치가 서로 독립적이며, 각 집단의 데이터는 다른 집단과 무관하게 수집된다.
예를 들어, 두 그룹의 학생들이 서로 다른 수학 시험의 평균 점수를 비교하는 경우, 이들 그룹은 서로 독립적이며, 두 그룹의 데이터는 서로 관련이 없다.

대응 2표본 t-검정 (Paired Samples t-test 또는 Dependent Samples t-test)

이 검정은 두 개의 집단 간의 평균 차이를 비교하는 데 사용된다.

그러나 이 경우, 두 집단의 데이터가 서로 의존적인 경우에 적용된다.

이것은 동일한 개체 또는 단위에 대한 두 가지 다른 조건 또는 시점에서 데이터를 수집한 경우에 사용된다.
예를 들어, 어떤 치료 전후에 환자들의 혈압을 측정하는 경우, 각 환자의 혈압은 치료 전과 후에 대응되는 데이터로 간주되며, 이 경우 대응표본 t-검정을 사용하여 두 조건 간의 차이를 검정한다.

 

독립 표본 F검정 및 t-검정

R / Rstudio

두 집단(그룹)간 판매량의 차이가 있는지를 검정   t.test(group_A, group_B)

신규 상품이 출시되어, 두 개 지역의 규모가 유사한 20개 점포(지역별 10개)를 선정하여, 1주간 점포별 판매량을 조사했다고 할 때,

A지역(그룹) B지역(그룹)
점포01 70 점포11 60
점포02 68 점포12 65
점포03 82 점포13 55
점포04 78 점포14 58
점포05 72 점포15 67
점포06 68 점포16 59
점포07 67 점포17 61
점포08 68 점포18 68
점포09 88 점포19 77
점포10 60 점포20 66
# 두 독립적인 그룹의 데이터
group_A <- c(70, 68, 82, 78, 72, 68, 67, 68, 88, 60)
group_B <- c(60, 65, 55, 58, 67, 59, 61, 68, 77, 66)

mean( group_A )
sd(group_A)
mean( group_B)
sd(group_B)
> mean( group_A )
[1] 72.1

> sd(group_A)
[1] 8.252272

> mean( group_B)
[1] 63.6

> sd(group_B)
[1] 6.363088
  • A그룹의 평균 판매량은 72.1이고, B그룹의 평균 판매량은 63.6이다.
  • 각 그룹의 표준편차를 보면, A그룹의 변동 폭(8.25)이 B그룹의 변동 폭(6.36)보다 크다.

20개 점포의 1주간의 판매량에 국한하여 결론을 내린다면, A지역의 판매량이 많다고 할 것이다.

그러나, 지역별 10개 점포(표본)가 아닌 각 지역의 모든 점포(모집단)의 경우, A지역과 B지역의 판매량의 차이가 있다고 할 수 있을까? 표본추출과정에서 발생된 차이일 수도 있지 않을까?


F-검정

# F-검정 (분산 분석) 수행
result <- var.test(group_A, group_B)
print(result)
> print(result)

F test to compare two variances

data:  group_A and group_B
F = 1.6819, num df = 9, denom df = 9, p-value = 0.4505
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.4177708 6.7714924
sample estimates:
ratio of variances 
          1.681943 
  • F-통계량 (F-statistic): F = 1.6819
    F-통계량은 두 그룹 간의 분산 비율을 나타내며, 그룹 A의 분산을 그룹 B의 분산으로 나눈 값이다.
  • p-값 (p-value): p-value = 0.4505
    p-값은 귀무 가설을 "두 그룹의 분산은 같다"라는 전제 하에 얻은 결과보다 더 극단적인 결과를 얻을 확률을 나타낸다.
    여기서 p-value가 0.05보다 크기 때문에, 귀무 가설을 기각할 충분한 증거가 없다.
    즉, 이 결과는 두 그룹의 분산이 통계적으로 유의미하게 다르다는 증거를 제공하지 않는다.
  • 대립 가설 (alternative hypothesis): true ratio of variances is not equal to 1
    대립 가설은 검정 결과를 요약하는 부분으로, 여기에서는 "두 그룹의 분산 비율은 1이 아닐 것"이라는 의미다.
  • 신뢰 구간 (confidence interval): 95 percent confidence interval: 0.4177708 6.7714924
    신뢰 구간은 두 그룹의 분산 비율에 대한 95% 신뢰 구간을 나타낸다. 이 구간에 포함된 값은 분산 비율이 어디에 위치할 가능성이 높은지를 나타낸다. 이 경우, 1을 중심으로 한 비율 값이 포함되어 있으며, 큰 차이가 없음을 시사한다.

두 집단의 모분산이 같은지 다른지를 검정하는 F-검정의 귀무가설("두 집단의 모분산은 같다")의 유의수준이 0.05(5%)라 할 때, 검정통계량의 p-값은 0,4505로 유의수준보다 크므로 귀무가설을 채택한다. 즉, 두 집단의 모분산이 같다고 할 수 있다.


두 집단의 모분산이 같으므로, 두 집단간에 평균치의 검정에는 등분산 t-검정을 수행한다.

등분산 t-검정

# 등분산 t-검정 수행
result <- t.test(group_A, group_B, var.equal = TRUE)
print(result)
> print(result)

Two Sample t-test

data:  group_A and group_B
t = 2.5794, df = 18, p-value = 0.0189
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  1.576868 15.423132
sample estimates:
mean of x mean of y 
     72.1      63.6 
  • t-통계량 (t-statistic): t = 2.5794
    t-통계량은 두 그룹 간의 평균 차이가 표준 오차로 나눈 값으로, 두 그룹의 평균이 얼마나 다른지를 나타낸다.
    여기서 t-통계량은 2.5794로 양의 값을 가지므로, 그룹 A의 평균이 그룹 B의 평균보다 크다는 것을 나타낸다.
  • 자유도 (degrees of freedom, df): df = 18
    t-검정의 자유도는 18로 표시되며, 이는 두 그룹의 자료 수에서 1을 뺀 값입니다.
  • p-값 (p-value): p-value = 0.0189
    p-값은 귀무 가설을 "두 집단의 평균은 같다"라는 전제 하에 얻은 결과보다 더 극단적인 결과를 얻을 확률을 나타낸다.
    p-value가 0.05보다 작기 때문에 (0.0189 < 0.05), 귀무 가설을 기각할 충분한 증거가 있으며, 두 그룹 간에 통계적으로 유의미한 평균 차이가 있다고 말할 수 있다.
  • 대립 가설 (alternative hypothesis): true difference in means is not equal to 0
    대립 가설은 검정 결과를 요약하는 부분으로, 여기에서는 "두 집단의 평균 차이가 0이 아니라"라는 의미이다.
  • 신뢰 구간 (confidence interval): 95 percent confidence interval: 1.576868 15.423132
    신뢰 구간은 두 집단의 평균 차이에 대한 95% 신뢰 구간을 나타낸다. 이 구간에는 [1.576868, 15.423132]로 표시되며, 이것은 평균 차이가 양의 값을 가질 가능성이 높음을 나타낸다.

"두 그룹의 판매량은 차이가 있다"라는 결론을 내릴 수 있다.

평균이 큰 A그룹(72.1)이 B그룹(63.6)보다 판매량이 더 많다고 할 수 있다.

 


모분산이 다른 경우 (등분산이 아닌 t-검정 또는 Welch's t-검정)

모분산이 다른 경우, R의 t.test() 함수는 자동으로 등분산이 아닌(two-sample unequal variance 또는 Welch's t-test) t-검정을 수행하므로 별도의 옵션을 지정할 필요가 없다.

 

위 데이터가 모분산이 다르다고 F-검정 결과가 나왔다가 가정

# 독립 2표본 t-검정 수행
result <- t.test(group_A, group_B)
print(result)
> print(result)

Welch Two Sample t-test

data:  group_A and group_B
t = 2.5794, df = 16.907, p-value = 0.01955
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  1.544643 15.455357
sample estimates:
mean of x mean of y 
     72.1      63.6 
  • t-통계량 (t-statistic): t = 2.5794
    t-통계량은 두 그룹 간의 평균 차이가 표준 오차로 나눈 값으로, 두 그룹의 평균이 얼마나 다른지를 표시
  • 자유도 (degrees of freedom, df): df = 16.907
    t-분포의 자유도를 나타내며, t-분포에서 p-값을 계산하는 데 사용
    분석 결과를 해석하고 보고할 때, Welch Two Sample t-test는 등분산성 가정을 하지 않는 경우에 사용되며, 이로 인해 자유도가 소수점일 수 있다.
  • p-값 (p-value): p-value = 0.01955
    p-값은 귀무 가설을 "두 집단의 평균은 같다"라는 전제 하에 얻은 결과보다 더 극단적인 결과를 얻을 확률을 나타내며, p-value가 0.05보다 작은 경우 (0.01955 < 0.05), 귀무 가설을 기각할 충분한 증거가 있으며, 두 그룹 간에 통계적으로 유의미한 평균 차이가 있다고 말할 수 있다.
  • 대립 가설 (alternative hypothesis): true difference in means is not equal to 0
    대립 가설은 검정 결과를 요약하는 부분으로, 여기에서는 "두 집단의 평균 차이가 0이 아니라"라는 의미이다.
  • 신뢰 구간 (confidence interval): 95 percent confidence interval: 1.544643 15.455357
    신뢰 구간은 두 집단의 평균 차이에 대한 신뢰 구간을 표시
    이 구간은 95% 확률로 실제 평균 차이가 이 범위 안에 있을 것으로 추정된다.
    여기서는 [1.544643, 15.455357]로 표시되며, 이것은 평균 차이가 양의 값을 가질 가능성이 높음

"두 그룹의 판매량은 차이가 있다"라는 결론을 내릴 수 있다.

평균이 큰 A그룹(72.1)이 B그룹(63.6)보다 판매량이 더 많다고 할 수 있다.

 

Summary

  등분산이 가정됨 등분산이 가정되지 않음
t-통계량 (t-statistic) 2.5794 2.5794
자유도 (degrees of freedom, df) 18 16.907
p-값 (p-value) 0.0189 0.01955
신뢰 구간 (confidence interval) 1.576868 15.423132 1.544643 15.455357
평균(mean) 72.1      63.6 72.1      63.6 

SPSS로 t-검점을 실행하면, 위 표와 유사한 수행 결과를 얻을 수 있으며,

F-검정 결과를 확인하여 등분산 가정 여부에 따라, 해당하는 통계값을 확인해야 한다. 


대응 표본 t-검정

[R Studio] 평균의 비교 대응 표본 T-검정(test) (논문 작성을 위한 네 번째 분석) (tistory.com)

 

[R Studio] 평균의 비교 대응 표본 T-검정(test) (논문 작성을 위한 네 번째 분석)

t-검정은 두 모집단의 독립여부에 따라, "독립 표본 t-검정"과 "대응 표본 t-검정"으로 나눌 수 있다. 독립 2표본 t-검정은 두 독립적인 집단 간의 평균 차이를 비교하는 데 사용되며, 대응 2표본 t-

logistician.tistory.com

 

728x90