Spss 상관분석 유의확률 - spss sang-gwanbunseog yuuihwaglyul

오랜만에 돌아온 spss를 활용한 쉬운통계 시간~!
오늘은 두 변수 간 관련성을 알아보는 상관분석에 대해 알아보도록 하자.

상관분석이란?

서로 관련된다고 예측되는 두 변수(구간.비율척도)들 간에 얼마나 연관성이 있는지 알아보는 분석이다.

두 변수간의 관련성은 아래와 같이 각 케이스의 값을 좌표위에 점으로 표시한 산점도 그래프를 통해 한 눈에 확인할 수 있고, Pearson의 상관계수를 통해 두 변수간 연관성이 어느정도 인지, 유의미한 상관관계가 있는지 검정할 수 있다.

<상관계수에 따른 데이터 분포>

상관계수를 뜻하는 r은 두 변수간의 선형적 관련 정도를 –1에서 1 사이의 값으로 나타낸다.
⇒ r이 양의 값을 가질 때에는 두 변수가 동시에 증가하는 경우이며(비례), r이 1에 가까울수록 두 변수간 상관 관계가 강한 것을 나타낸다.
⇒ r이 음의 값을 가질 때에는한 변수가 감소할 때 다른 변수는 증가하는 경우이며(반비례), 마찬가지로 r이 –1에 가까울수록 두 변수 간 상관 관계가 강한 것을 나타낸다.

그렇다면 r이 0이라는 것은 어떤 상태일까?
r이 0에 가까워질수록 두 변수 간 상관 관계가 약함을 나타내고, 0인 경우에는 상관이 없음을 나타낸다. 따라서 위 그래프를 보면 뚜렷한 분포 양상을 보이지 않는 것을 알 수 있다.

＊상관계수로 상관관계의 정도를 판단하는 기준은 아래와 같다.

0.8≤r 일 때, 강한 상관이 있다.
0.6≤r<0.8 일 때, 상관이 있다.
0.4≤r<0.6 일 때, 약한 상관이 있다.
r≤0.4 거의 상관이 없다.

그렇다면 이제 본격적으로 spss를 통한 상관분석을 살펴보자.
오늘의 예시데이터는 읽기,쓰기 점수이다. (구간.비율척도만 상관분석이 가능!)

1. 분석하고자 하는 변수에 대하여 가설을 세워보자.
읽기점수와 쓰기점수의 연관성을 검정하기 위해 아래와 같이 가설을 세울 수 있다.

귀무가설 : 읽기점수와 쓰기점수 간의 상관관계가 없다.
대립가설 : 읽기점수와 쓰기점수 관의 상관관계가 있다.

2. spss상단메뉴에서 분석>상관분석>‘이변량 상관계수’를 선택하면 아래와 같이 창이 뜬다.

☞ 변수란에는 검정하고자 하는 변수를 넣어주고 Pearson상관계수를 클릭해준다.

3. 우측 <옵션>에서 ‘평균과 표준편차’를 선택하고 확인을 클릭!

이제 결과를 해석해보자~!

첫 번째 표에는 읽기, 쓰기 점수 각각의 통계량을 보여주고 있다.
두 번째 표를 보면 두 변수 간의 상관계수를 통해 상관정도와 유의미 여부를 알 수 있는데 읽기점수와 쓰기점수 간의 상관계수는 0.646으로 양의 관련성이 있음을 알 수 있다. 즉, 읽기점수가 높을수록 쓰기점수도 높은 양상을 보인다는 것을 확인할 수 있고, 유의확률이 유의수준 5%(0.05)보다 작으므로 읽기 점수와 쓰기 점수 간의 상관관계가 있음을 확인할 수 있다.

검정결과로는 상관관계가 있음이 확인이 되었지만, 어떤 분포를 보이는지 눈으로 직접 살펴보기 위해 <산점도>를 출력해보았다.
* 산점도는 두 변수들간의 관계가 선형관계인지 알아보고자 할 때 유용하다.
* spss에서는 '그래프>레거시대화상자>산점도/점도표' 에서 보고자 하는 도표유형을 선택하여 아래와 같이 살펴볼 수 있다.

<읽기점수와 쓰기점수 산점도>

그래프를 보니, 상관관계가 뚜렷하지는 않지만 어느정도 양의 선형 상관관계가 있음을 알 수 있다.

분석결과와 산점도를 같이 본다면 결과를 더 쉽게 이해할 수 있으니 필요에 따라 활용해보길 바라며~!
다음시간에는 세개 이상의 변수 간 평균 차이를 검정하는 분산분석을 살펴보자.

다음시간에 또 만나용~

안녕하세요 풍요로운 쫑아입니다. 오늘은 상관관계 분석에 대해 알아보도록 하겠습니다. 일반적으로 상관관계 분석은 두 변수가 모두 연속적인 변수일 때 활용하는 피어슨의 상관관계 검증방법을 이용합니다. 상관관계는 말그대로 두 변수 사이의 관계를 살펴보는 것입니다. 예를 들면 소득과 삶의 만족도와의 관계가 있을수 있습니다. 그리고 상관관계는 독립변수와 종속변수의 관계가 불분명하고 두 변수의 상호 관련성만을 파악하고자 할 때 주로 사용됩니다. 즉, 소득이 높아서 삶의 만족도가 높아진다고 생각할 수 있지만 반대로 삶의 만족도가 높기 때문에 소득이 높아질 가능성도 있습니다. 이런 경우 독립변수와 종속변수의 관계가 모호하다고 할 수 있습니다.

서론이 길었습니다. 여기서는 소득과 삶의 만족도 변수를 활용하여 상관관계 분석을 해보도록 하겠습니다. 영가설은 '소득과 삶의 만족도간에 상관관계가 없다'라고 세워줍니다.

그림 1

그림 1을 보시면 SPSS 프로그램에서 소득 변수와 삶의 만족도 변수가 입력되어 있는 것을 알 수 있습니다. 소득은 만원 단위이며, 삶의 만족도는 10점 척도입니다. 점수가 높을 수록 만족도가 높음을 의미합니다.

그림 2

이제 본격적으로 상관관계 분석을 위해 위의 그림2 처럼 분석 -> 상관분석 -> 이변량 상관을 차례대로 눌러줍니다.

그림 3

위의 그림 3을 봐주시길 바랍니다. 그림 상으로는 소득과 삶의 만족도가 오른쪽 변수 박스에 들어가 있는데 처음에는 왼쪽 박스에 위치해 있습니다. 두 변수를 오른쪽에 변수 박스에 넣어주시면 위의 그림과 같이 됩니다.

그림 4

이제 그림4에서 빨간 박스 안의 옵션을 눌러줍니다. 그럼 아래 그림5와 같은 작은 창이 뜨게 됩니다.

그림 5

일반적으로 상단의 통계량 박스에서 '평균과 표준편차'에 체크를 해줍니다. 그런데 계속을 눌러줍니다.

그림 6

마지막으로 확인을 눌러 소득과 삶의 만족도 간의 상관관계를 분석해봅시다.

그림 7

그림7과 같이 결과값이 도출되어 나타납니다. 먼저, 가장 상단에는 기술통계량에 대한 결과표가 나타납니다. 우리가 그림5에서 '평균과 표준편차'를 체크해준 결과표입니다. 소득의 평균은 228.07만원이고, 표준화 편차는 77.9입니다. 그리고 삶의 만족도 평균은 6.70점, 표준편차는 2.231입니다.

그리고 두번째 표가 상관관계의 결과값을 나타냅니다. 소득과 삶의 만족도가 각각 행과 열에 위치해있습니다. 우리는 소득과 삶의 만족도가 만나는 지점을 보고 판단하면 됩니다. Pearson 상관이라고 되어있는 곳의 첫 번째 행을 보면 1과 0.823이라는 수치가 나타납니다. 1은 소득과 소득 사이의 상관관계를 나타내므로 1로 나타납니다. 참고로 이를 상관계수라고 하며 r로 표시합니다. 상관계수는 크기는 -1과 1사이에 항상 위치해있습니다. 여기서 0.823이 소득과 삶의 만족도간의 상관계수를 나타냅니다.

결론적으로 소득과 삶의 만족도는 +0.823으로 강한 양의 상관관계를 나타낸다고 볼 수 있습니다. 즉, 이를 풀어서 설명하면 소득이 올라가면 삶의 만족도도 올라가는 데 그 수준이 0.823 만큼이라고 보면 됩니다.

그 밑에 유의확률은 상관계수가 유의미 한지를 보는 것입니다. 이 유의확률이 0.05보다 작으면 위의 상관계수인 0.823이 유의하다고 볼 수 있습니다.