오랜만에 돌아온 spss를 활용한 쉬운통계 시간~!
오늘은 두 변수 간 관련성을 알아보는 상관분석에 대해 알아보도록 하자.
상관분석이란?
서로 관련된다고 예측되는 두 변수(구간.비율척도)들 간에 얼마나 연관성이 있는지 알아보는 분석이다.
두 변수간의 관련성은 아래와 같이 각 케이스의 값을 좌표위에 점으로 표시한 산점도 그래프를 통해 한 눈에 확인할 수 있고, Pearson의 상관계수를 통해 두 변수간 연관성이 어느정도 인지, 유의미한 상관관계가 있는지 검정할 수 있다.
<상관계수에 따른 데이터 분포>
상관계수를 뜻하는 r은 두 변수간의 선형적 관련 정도를 –1에서 1 사이의 값으로 나타낸다.
⇒ r이 양의 값을 가질 때에는 두 변수가 동시에 증가하는 경우이며(비례), r이 1에 가까울수록 두 변수간 상관 관계가 강한 것을 나타낸다.
⇒ r이 음의 값을 가질 때에는 한 변수가 감소할 때 다른 변수는 증가하는 경우이며(반비례), 마찬가지로 r이 –1에 가까울수록 두 변수 간 상관 관계가 강한 것을 나타낸다.
그렇다면 r이 0이라는 것은 어떤 상태일까?
r이 0에 가까워질수록 두 변수 간 상관 관계가 약함을 나타내고, 0인 경우에는 상관이 없음을 나타낸다. 따라서 위 그래프를 보면 뚜렷한 분포 양상을 보이지 않는 것을 알 수 있다.
*상관계수로 상관관계의 정도를 판단하는 기준은 아래와 같다.
0.8≤r 일 때, 강한 상관이 있다. |
그렇다면 이제 본격적으로 spss를 통한 상관분석을 살펴보자.
오늘의 예시데이터는 읽기,쓰기 점수이다. (구간.비율척도만 상관분석이 가능!)
1. 분석하고자 하는 변수에 대하여 가설을 세워보자.
읽기점수와 쓰기점수의 연관성을 검정하기 위해 아래와 같이 가설을 세울 수 있다.
귀무가설 : 읽기점수와 쓰기점수 간의 상관관계가 없다. |
2. spss상단메뉴에서 분석>상관분석>‘이변량 상관계수’를 선택하면 아래와 같이 창이 뜬다.
☞ 변수란에는 검정하고자 하는 변수를 넣어주고 Pearson상관계수를 클릭해준다.
3. 우측 <옵션>에서 ‘평균과 표준편차’를 선택하고 확인을 클릭!
이제 결과를 해석해보자~!
첫 번째 표에는 읽기, 쓰기 점수 각각의 통계량을 보여주고 있다.
두 번째 표를 보면 두 변수 간의 상관계수를 통해 상관정도와 유의미 여부를 알 수 있는데 읽기점수와 쓰기점수 간의 상관계수는 0.646으로 양의 관련성이 있음을 알 수 있다. 즉, 읽기점수가 높을수록 쓰기점수도 높은 양상을 보인다는 것을 확인할 수 있고, 유의확률이 유의수준 5%(0.05)보다 작으므로 읽기 점수와 쓰기 점수 간의 상관관계가 있음을 확인할 수 있다.
검정결과로는 상관관계가 있음이 확인이 되었지만, 어떤 분포를 보이는지 눈으로 직접 살펴보기 위해 <산점도>를 출력해보았다.
* 산점도는 두 변수들간의 관계가 선형관계인지 알아보고자 할 때 유용하다.
* spss에서는 '그래프>레거시대화상자>산점도/점도표' 에서 보고자 하는 도표유형을 선택하여 아래와 같이 살펴볼 수 있다.
<읽기점수와 쓰기점수 산점도>
그래프를 보니, 상관관계가 뚜렷하지는 않지만 어느정도 양의 선형 상관관계가 있음을 알 수 있다.
분석결과와 산점도를 같이 본다면 결과를 더 쉽게 이해할 수 있으니 필요에 따라 활용해보길 바라며~!
다음시간에는 세개 이상의 변수 간 평균 차이를 검정하는 분산분석을 살펴보자.
다음시간에 또 만나용~
'올키즈 자료실 > 쉬운통계' 카테고리의 다른 글
SPSS를 활용한 쉬운통계 9.단순선형회귀분석 (2) | 2019.05.15 |
---|---|
SPSS를 활용한 쉬운통계 8.분산분석 (2) | 2019.05.02 |
SPSS를 활용한 쉬운 통계 6.대응표본 t검정 (0) | 2018.04.10 |
SPSS를 활용한 쉬운 통계 5.독립표본 t검정 (2) | 2018.03.13 |
SPSS를 활용한 쉬운 통계 4.데이터변환(케이스선택, 코딩변경, 변수계산) (0) | 2017.11.29 |
SPSS를 활용한 쉬운 통계 3.교차분석 (5) | 2017.08.02 |
SPSS를 활용한 쉬운통계 2.빈도분석 (0) | 2017.03.30 |
댓글