본문 바로가기
올키즈 자료실/쉬운통계

SPSS를 활용한 쉬운 통계 5.독립표본 t검정

by 함께걷는아이들 2018. 3. 13.


오늘은 드디어 T-test를 소개하는 시간! 

spss에서 가장 많이 활용하게 되는 t검정은 두 집단 간의 평균을 비교할 때 사용되는 방법이다.


여기서 잘 구분해야하는 두 가지가 있는데,

t-test에는 '독립표본 검정'과 '대응표본 검정'이 있다. 독립과 대응 무엇이 다를까? 

▶ 독립표본 검정은, 서로 다른 두 집단을 비교할 때 활용할 수 있고 (ex. 남자와 여자)

▶ 대응표본 검정은, 같은 집단의 대응되는 두 변수를 비교할 때 활용할 수 있다. (ex. 사전점수와 사후점수 / 국어점수와 수학점수)



그럼~ 독립표본 T 검정'부터 차근차근 살펴보도록 하자! Go Go~!!

늘의 예시데이터는 아이들의 사전,사후 국어,수학 점수를 보여주고 있다. 


* 성별 : 1=남자, 2=여자 

이렇게 아래와 같이 데이터를 입력해준다. (케이스 수=80) 



* 데이터 사용에 대한 주의!

t검정은 각 집단의 케이스 수가 많은 경우(일반적으로 30개 이상일 때)는 모집단의 분포에 상관없이 정규성을 만족하여

데이터를 사용할 수 있다. 그러나 케이스 수가 작은 경우에는 모집단이 정규분포를 따른다는 가정을 만족하는 데이터여야 함을 잊지말자.


1. 분석하고자 하는 변수를 선정하고 가설을 세워보자.

✽ 이 때 주의할 것! 두 집단 변수는 명목.순서척도 일 때, 검정을 하고 싶은 변수는 등간.비율척도이어야 한다. 

 척도가 헷갈린다면? 클릭!  

위 변수에서는 <성별>,<학년>이 명목,순서척도 <점수>는 등간척도에 속한다는 걸 알 수 있다.


척도를 구분하고 분석할 준비가 되었다면, 이제 두 집단의 평균차이를 검증하기 위해 아래와 같이 가설을 세울 수 있다.

귀무가설 : 성별에 따른 국어점수 평균에 차이가 없다.

대립가설 : 성별에 따른 국어점수 평균에 차이가 있다. 




2. spss상단메뉴에서 분석> 평균비교> ‘독립표본 t검정’을 선택하면 아래와 같이 창이 뜬다.

검정변수에는 차이를 알고자 하는 변수(점수)를, 그룹화변수에는 비교하는 대상인 변수(성별)을 넣어준다. 

여기서 두 집단에 대한 정의를 해주어야 하는데, 그룹정의를 클릭해보자.




3. 그룹정의를 클릭하면 아래의 창이 뜬다.

그룹정의에서는 <내가 비교하고자 하는 두 집단을 무엇으로 코딩했는지>를 묻는다. 

우리는 <성별>을 그룹변수로 두었고, 1=남자, 2=여자로 코딩하였으므로 해당 숫자를 넣어주면 되는 것이다.


이제 [확인]을 클릭하고 결과를 살펴보자~!




<결과해석! 전에 알고가야할 정보> 

※ 두 집단의 평균 차이를 검정하는 T검정통계량은 

 두 모집단의 분산이 ①같다고 가정할 수 있는 경우①같다고 가정할 수 없는 경우에 따라 다르게 해석된다. 

 이를 알아보기 위해서는 분산의 동질성을 검정하게 되는데, SPSS에서는 Levene의 등분산 검정결과로 이를 확인할 수  

 있다. 이 때 가설은 다음과 같다.

귀무가설 : 두 모집단의 분산은 같다.

대립가설 : 두 모집단의 분산은 다르다. 

 검정결과 유의확률이 유의수준(일반적으로 0.05)보다 작으면 -> 귀무가설을 기각하므로 두 모집단의 분산은 같다고 가정할 수 없는 것. 유의수준(0.05)보다 크면 -> 귀무가설을 채택하므로 두 모집단의 분산은 같다고 가정할 수 있는 것이다.





이제 결과를 해석해보자~!!


첫 번째 표에는 두 그룹(남자, 여자)의 통계량을 보여주고 있다. 
t분석은 두 번째 표를 잘 해석하는 것이 중요하다.

먼저, Levene의 등분산 검정결과를 보면 유의확률 값이 0.604로 유의수준 5%(0.05)보다 크므로 
‘등분산을 가정함’에 해당되는 값을 해석하면 된다.


따라서, t통계량 값은 2.536 유의확률 p=0.013으로 귀무가설이 기각되어 성별에 따른 국어점수에 차이가 있음을 확인할 수 있다.


위의 내용을 이해했다면, 다른 변수로도 얼마든지 분석이 가능할 것이다! 
예를들어 위 데이터를 참고하면, 두 학년 간의 수학점수 차이를 보거나, 지난시간에 배운 코딩변경방법을 활용해
저학년(1-3학년)과 고학년(4-6학년) 두 집단으로 구분한 다음, 두 그룹간의 점수 차이를 볼 수도 있는 것이다. 
데이터변환과 t분석이 함께하는 것만으로도 다양한 결과를 볼 수 있으니 꼭 활용해보길 바라며.!


 t-test의 두 번째. 대응표본 t검정은 다음시간에 만나용~



댓글