빅데이터분석기사/작업형3

[작업형3] 독립표본 t-test (two-sample/independent t-test)

seo0seok 2023. 6. 23. 02:27

// 퇴근후딴짓 님의 강의를 참고하였습니다. //

 

[배경]

  • 빅데이터 분석기사 실기시험을 공부하면서 강사가(또는 도서에서) 제공한 코드를 복사-붙여넣기 하며 학습하는 사람들(A 집단)과 직접 코딩하면서 에러를 마주하는 사람들(B 집단)의 평균 점수는 다르다고 할 수 있을까요?

 

문제1) 귀무가설과 대립가설1

  • 귀무가설(H0): μ1 = μ2, A집단과 B집단 시험 평균 점수는 같다.
  • 대립가설(H1): μ1 < μ2, A집단이 B집단 보다 평균 점수가 작다.
  • 유의수준: 0.05
import pandas as pd
from scipy import stats
# 정규분포를 따른 다는 가정
df = pd.DataFrame({
    "Agroup":[80,69,78,88,100,85,83,81,80,91,95,59,59,49,69,39,49,59,90,90,91,93,79,78,68,58,78,88,88],
    "Bgroup":[78,86,83,91,90,87,85,82,88,100,78,88,78,58,100,97,76,81,90,85,78,91,84,81,80,78,68,68,69]
})
df.head(3)

→ 임의적으로 두 그룹의 평균 점수 데이터프레임을 만들어준다. 

 

# 모분산이 같을 때
stats.ttest_ind(df['Agroup'], df['Bgroup'], alternative="less")

실행 결과 : 
Ttest_indResult(statistic=-1.8619610028956959, pvalue=0.03392942991277301)
# 모분산이 다를 때
stats.ttest_ind(df['Agroup'], df['Bgroup'], alternative="less", equal_var=False)

실행 결과 : 
Ttest_indResult(statistic=-1.8619610028956959, pvalue=0.034487526990986284)

 ttest_ind의 디폴트 값이 alternative = "equal_var=True"이기 때문에 생략하여도 된다.

→ pvalue값이 0.03로 유의수준 0.05보다 낮아 귀무가설을 기각한다.

→ 즉, 대립가설이 채택되므로 A집단이 B집단보다 평균 점수가 작다고 할 수 있다.

 

→ R은 ttest_ind의 디폴트 값이 alternative = "equal_var=False" 이다.

 

 

문제2) 귀무가설과 대립가설2

  • 귀무가설(H0): μ1 = μ2, A집단과 B집단 시험 평균 점수는 같다.
  • 대립가설(H1): μ1 > μ2, A집단이 B집단 보다 평균 점수가 크다.
stats.ttest_ind(df['Agroup'], df['Bgroup'], alternative="greater", equal_var=False)

실행 결과 : 
Ttest_indResult(statistic=-1.8619610028956959, pvalue=0.9655124730090137)

→ pvalue값이 0.96으로 유의수준 0.05보다 높아 귀무가설을 기각하지 못했다.

    (귀무가설을 채택했다고 잘 표현 안함)

→ 즉, 대립가설이 기각되므로 A집단과 B집단의 평균 점수가 같다고 볼 수 있다.

 

 

 

문제3) 귀무가설과 대립가설3

  • 귀무가설(H0): μ1 = μ2, A집단과 B집단 시험 평균 점수는 같다.
  • 대립가설(H1): μ1  μ2, A집단이 B집단 보다 평균 점수가 다르다.
stats.ttest_ind(df['Agroup'], df['Bgroup'], alternative="two-sided", equal_var=False)

실행 결과 : 
Ttest_indResult(statistic=-1.8619610028956959, pvalue=0.06897505398197257)

→ pvalue값이 0.06으로 유의수준 0.05보다 높아 귀무가설을 기각하지 못했다.

    (귀무가설을 채택했다고 잘 표현 안함)

→ 즉, 대립가설이 기각되므로 A집단과 B집단의 평균 점수가 같다고 볼 수 있다.