SPSS를 활용한 쉬운 통계 7.상관분석

by 함께걷는아이들 2018.07.27 12:07

오랜만에 돌아온 spss를 활용한 쉬운통계 시간~!
오늘은 두 변수 간 관련성을 알아보는 상관분석에 대해 알아보도록 하자.


상관분석이란?

서로 관련된다고 예측되는 두 변수(구간.비율척도)들 간에 얼마나 연관성이 있는지 알아보는 분석이다.

두 변수간의 관련성은 아래와 같이 각 케이스의 값을 좌표위에 점으로 표시한 산점도 그래프를 통해 한 눈에 확인할 수 있고, Pearson의 상관계수를 통해 두 변수간 연관성이 어느정도 인지, 유의미한 상관관계가 있는지 검정할 수 있다.

 

 

<상관계수에 따른 데이터 분포>

상관계수를 뜻하는 r은 두 변수간의 선형적 관련 정도를 –1에서 1 사이의 값으로 나타낸다.
r이 양의 값을 가질 때에는 두 변수가 동시에 증가하는 경우이며(비례), r이 1에 가까울수록 두 변수간 상관 관계가 강한 것을 나타낸다.
r이 음의 값을 가질 때에는 한 변수가 감소할 때 다른 변수는 증가하는 경우이며(반비례), 마찬가지로 r이 –1에 가까울수록 두 변수 간 상관 관계가 강한 것을 나타낸다.


그렇다면 r이 0이라는 것은 어떤 상태일까?
r이 0에 가까워질수록 두 변수 간 상관 관계가 약함을 나타내고, 0인 경우에는 상관이 없음을 나타낸다. 따라서 위 그래프를 보면 뚜렷한 분포 양상을 보이지 않는 것을 알 수 있다.

 

*상관계수로 상관관계의 정도를 판단하는 기준은 아래와 같다. 

 0.8≤r 일 때, 강한 상관이 있다.
 0.6≤r<0.8 일 때, 상관이 있다.
 0.4≤r<0.6 일 때, 약한 상관이 있다.
 r≤0.4 거의 상관이 없다.

 

 

그렇다면 이제 본격적으로 spss를 통한 상관분석을 살펴보자.
오늘의 예시데이터는 읽기,쓰기 점수이다. (구간.비율척도만 상관분석이 가능!)

 

 

1. 분석하고자 하는 변수에 대하여 가설을 세워보자.
읽기점수와 쓰기점수의 연관성을 검정하기 위해 아래와 같이 가설을 세울 수 있다.

 귀무가설 : 읽기점수와 쓰기점수 간의 상관관계가 없다.
 대립가설 : 읽기점수와 쓰기점수 관의 상관관계가 있다.

 

 

2. spss상단메뉴에서 분석>상관분석>‘이변량 상관계수’를 선택하면 아래와 같이 창이 뜬다.

☞ 변수란에는 검정하고자 하는 변수를 넣어주고 Pearson상관계수를 클릭해준다.

 

3. 우측 <옵션>에서 ‘평균과 표준편차’를 선택하고 확인을 클릭!

 

 

이제 결과를 해석해보자~!

첫 번째 표에는 읽기, 쓰기 점수 각각의 통계량을 보여주고 있다.
두 번째 표를 보면 두 변수 간의 상관계수를 통해 상관정도와 유의미 여부를 알 수 있는데 읽기점수와 쓰기점수 간의 상관계수는 0.646으로 양의 관련성이 있음을 알 수 있다. 즉, 읽기점수가 높을수록 쓰기점수도 높은 양상을 보인다는 것을 확인할 수 있고, 유의확률이 유의수준 5%(0.05)보다 작으므로 읽기 점수와 쓰기 점수 간의 상관관계가 있음을 확인할 수 있다.


검정결과로는 상관관계가 있음이 확인이 되었지만, 어떤 분포를 보이는지 눈으로 직접 살펴보기 위해 <산점도>를 출력해보았다.
* 산점도는 두 변수들간의 관계가 선형관계인지 알아보고자 할 때 유용하다.
* spss에서는 '그래프>레거시대화상자>산점도/점도표' 에서 보고자 하는 도표유형을 선택하여 아래와 같이 살펴볼 수 있다.

 

 <읽기점수와 쓰기점수 산점도>

 

그래프를 보니, 상관관계가 뚜렷하지는 않지만 어느정도 양의 선형 상관관계가 있음을 알 수 있다.

분석결과와 산점도를 같이 본다면 결과를 더 쉽게 이해할 수 있으니 필요에 따라 활용해보길 바라며~!
다음시간에는 세개 이상의 변수 간 평균 차이를 검정하는 분산분석을 살펴보자.

 

다음시간에 또 만나용~

 

 

| 1 2 3 4 5 ··· 7 |

티스토리 툴바