이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

점점 분산분석이 어려워지는것 같다. 어렵다는 얘기는 고려해야 할 변수가 많아진다는 것이고, 그만큼 해석하기가 까다롭다는 것이다.

오늘은 독립처치변수가 2개인 이원분산분석에 대해 얘기하고자 한다.

일반적으로 분산분석은 일원분산분석을 생각하게 된다. 영어로는 One-Way ANOVA이다. 일원분산분석은 독립변수가 1개, 종속변수가 1개였다. 그 다음 나오는 분석이 무작위 블럭디자인 분산분석이다. 영어로는 Randomized block design ANOVA이다. 이것은 독립변수에 해당하는 처치변수가 2개이지만 1개를 블럭변수로 처리하여 결과적으로는 독립처치변수 1개, 종속변수 1개의 분석이다. 

그리고 오늘은 이원분산분석이다. 영어로는 Two-Way ANOVA로서 일원분산분석에서 1개였던 독립변수가 여기서는 2개의 독립처치변수로 변하게 된다. 하지만 종속변수는 여전히 1개이다.

두 개 이상의 독립처치변수의 수준변화에 따른 결과변수 값의 변화를 조사하기 위한 실험 디자인을 팩토리얼 디자인이라고 부르며 각 처치변수를 factor라고 한다. 따라서 factor A의 처치수준이 a 이고, factor B의 처치수준이 b 의 a x b 팩토리얼 디자인을 위한 분석을 이원분산분석이라고 한다. 마찬가지로 a x b x c 형태의 팩토리얼 디자인은 삼원분산분석이라고 한다.

일원분산분석에서 연구자의 관심은 한 처치변수의 변화가 결과변수에 미치는 영향에 관한 것으로 주효과(main effect)에 관심을 둔다. 반면 이원분산분석은 한 처치변수의 변화가 결과변수에 미치는 영향이 다른 처치변수의 수준에 따라 달라지는가 하는 것으로 상호작용효과(interaction effect)에 관심을 둔다.

기본 가정사항은 일원분산분석, 블럭디자인분산분석과 같다. 다만, 실제 분석에서 등분산성에 대한 정보는 따로 제공하지 않는다.

그런데 정규성을 만족하지 않는다면 어떻게 해야 할까?

다행이도 비모수검정에 Friedman test 가 있다.

Kruskal-Wallis 검정이 요인이 하나 있는 일원분산분석의 대안이 될 수 있는 것처럼, Friedman 검정도 일반적 이원분산분석의 대안으로 사용될 수 있다.

심장 박출계수(Cardiac Ejection Fraction; EF)는 심장의 펌프기능을 나타내는 지표로서 EF=(좌심실의 확장기말용적/심박출량)*100 으로 계산된다. 정상범위는 60~75%로 알려져 있는데, 실제 병원에서는 MRI, CT, 초음파를 이용한 비교 연구가 활발히 진행되고 있다. 

오늘의 예제는 그 연구 중 일부로서, MRI, CT, 초음파로 측정한 심장 박출계수를 각각의 모달리티 및 남녀의 성별에 따라 차이가 있는지를 비교하는 것이다. 모달리티는 범주형으로 1:MRI, 2:CT, 3:초음파로 설정하였으며, 성별은 1:남성, 2:여성으로 설정하였다. EF은 연속형으로 백분율로 표기하였다.

귀무가설(H0) : 심장 박출계수에 대한 각 모달리티와 성별 간에는 상호작용화과가 없다.

대립가설(H1) : 심장 박출계수에 대한 각 모달리티와 성별 간에는 상호작용화가가 있다.

먼저 정규성 검정을 아래와 같이 진행한다.

그리고 정규성을 만족하면 이원분산분석을 진행한다.

첨부된 Two-Way ANOVA.sav 파일을 오픈한다. 위의 영상은 "데이터보기(D)" 화면으로 "Modality" 열에는 1~3까지, "Sex"열에는 1과 2로 구분되어 있으며, "EF" 열에는 심박출계수가 백분율로 표기되어 있다.

"변수 보기(V)" 화면으로 여기에서는 "값" 항목을 정의해야한다.

"Modality" 행의 "값"을 클릭하면 위와 같이 화면이 나오는데 1:MRI, 2:CT, 3:초음파 를 순서대로 입력한다.

마찬가지로 "Sex" 행의 "값"을 클릭하고 1:남성, 2:여성 을 차례대로 입력한다.

정규성 검정에서 K-S, S-W 모두 p>0.05 이므로 정규성을 만족하는 것으로 보고 이원분산분석을 진행한다.

"분석(A) ==> "일반 선형 모형(G)" ==> "일변량(U..." 을 차례대로 클릭한다.

이때 "종속변수에(D):" 항목에는 "박출계수(%)[EF]" 변수를 삽입하고, "모수요인(F):" 항목에는 "장비별(Modality)", "성별[Sex]" 변수를 삽입한다.

"모형(M)..." 클릭한다. 변경할게 없으므로 "계속" 버튼을 클릭한다.

참고로, 모형설정의 두 메뉴는 아래와 같은 내용을 포함한다.

완전요인모형 : 분석결과에는 두 처치변수의 주효과, 상호작용효과 및 절편이 포함된다(기본설정).

사용자 정의 : 만약, 사용자 정의를 선택해서 Modality, Sex, Modality*Sex 을 "모형(M)"으로 보내고 상호작용효과를 클릭한 후 "모형에 절편 포함"을 그대로 두면 완전요인모형을 설정한 경우의 결과와 동일한 결과가 나타난다.

"대비(N)..." 를 클릭한다. 역시 그대로 둔다. "계속"을 클릭한다.

"수평축 변수(H):" 항목에 "Modality" 변수를, "행구분 변수(S):" 항목에 "Sex" 변수를 이동시킨다.

"도표(T):" 항목에 "Modality*Sex" 이 들어온걸 확인한 후 "계속" 버튼을 클릭한다.

"요인(F):" 항목에 있는 "Modality" 변수만 "사후 검정변수(P):" 항목으로 이동시킨다.

그리고 사후분석 방법 중에서 "Tukey 방법"을 선택한다. Tukey 방법을 선택한 이유는 각 변수들의 샘플 수가 같기 때문이며, "Bonferroni" 또는 "Scheffe" 방법도 많이 활용되므로 본인에게 맞는 분석 방법을 선택한다.

"저장(S)" 을 클릭한다. 변경할게 없으므로 그대로 두고, "계속"을 클릭한다.

"옵션(O)..." 을 클릭한다.

"기술통계(D)", "효과크기 추정값(E)" 를 선택 후 "계속" 을 클릭한다.

세 모달리티와 성별에 따른 기술통계량이 나타나있다.

연구자의 초점은 상호작용항의 유의성인데, F=0.670, p=0.514 로 나타났다. 따라서 상호작용효과는 유의적이지 않으며, 모달리티에 대한 심박출계수는 성별에 따라 다르다고 할 수 없다. 즉, 귀무가설을 기각하지 못하고 채택해야 한다. 

여기서 각 집단에서 세 모달리티에 대한 태도의 차이가 유의적인지를 보기 위해서는 각 집단별로 일원분산분석을 실시하면 된다.

위의 표는 남성 집단의 일원분산분석 결과이다. 이 결과 역시 F=2.434, p=0.098 로 유의하지 않다.

여성 집단 역시 F=1.068, p=0.354 로서 유의하지 않은 결과를 보여주었다.

무작위 블럭디자인 분산분석에서 설명했던 부분 에타제곱에 대한 내용이다.

위의 "오브젝트간 효과검정" 표에서 부분 에타제곱 η2 = 0.016 으로서 효과가 매우 작은 것으로 나타났다. 이는 회귀분석 R2 에 비유되는 것으로 R= 0.082 로 매우 작은 값을 보여주고 있다.

귀무가설을 기각하지 못했으므로 사후검정은 평균 차이 비교로서 활용될 수 있다. 

표에서 보면 심박출계수는 평균적으로 CT > 초음파 > MRI 순으로 나타났다. 

물론 이 포스팅을 위해 만들어진 데이터 이므로 너무 결과 값에 너무 신경쓰지 않도록 한다.

마찬가지로 유의확률 p 값이 0.05 를 초과하므로 모두 같은 그룹으로 묶여지는 것을 볼 수 있다.

이와같이 통계는 무조건 유의확률이 유의수준 보다 낮은 것이 좋은 것만은 아니다. 때에 따라서는 유의하지 않은 것이 연구자의 목표가 될 수 도 있는 것이다.

마지막으로 프로파일 도표는 상호작용효과의 패턴을 그림으로 보여준다. 이 그래프와 위의 기술통계량 표를 볼 때 여자들보다 남자들의 심박출계수가 약간 높은 것으로 추정된다(남=71.490, 여=69.721).  

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

두 개의 독립변수에 따른 종속변수의 평균 차이, 이원 분산분석

이원분산분석(Two way Anova)은 두 개의 독립변수에 따라 집단 간 종속변수의 평균 차이를 비교 검정 하는 방법입니다.

이원 분산분석 결과는 처치효과로 주효과와 상호작용효과를 보여주고, 두 개의 독립변수 간 관계에 따라 두 가지로 구분합니다.

*주효과는 독립변수들이 각각 독립적으로 종속변수에 미치는 영향을 검정하는 것인데, 즉 한 처치변수의 변화가 결과변수에 미치는 영향을 말합니다.

*상호작용효과는 독립변수들이 서로 연관되어 종속변수에 미치는 영향을 검정하는 것인데, 즉 다른 처치변수의 변화에 따라 한 처치변수가 결과변수에 미치는 영향에 관한 것입니다.

예를 들어 이원분산분석을 실시해 볼게요.

독립변수는 2개의 범주형 자료, 종속변수는 연속형 자료가 되어야 합니다.

A회사가 신제품 광고로 세 가지 광고 대안을 기획하고, 피실험자들에게 노출시킨 다음 광고태도를 측정하여 소비자들이 좋아하는 광고를 선택하고자 한다고 가정할게요.

마케팅 기획 담당자는 광고 대안 기획들에 대한 태도가 성별에 따라 다를 것이라 생각하고 어느 집단이 더 좋아할까를 알고 싶어합니다.

실험은 남녀 각 9명의 피실험자들을 6개의 셀에 할당하고 각 피실험자에게 세 가지 광고 중 하나를 보여줍니다.

점수는 0~5점 까지 0.1간격으로 체크한 후 태도 결과 점수는 다음과 같이 나왔다고 가정합니다.

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

따라서 가설은 다음과 같습니다.

1. 광고대안에 따라 광고태도가 다를까?

2. 성별에 따라 광고태도가 다를까?

3.성별과 광고대안 간에 상호작용효과가 있을까?

SPSS에서 분석-일반선형모형-일변량 클릭

변수목록에서 태도점수 클릭 - 종속변수로 이동 - 광고와 성별 클릭 - 모수요인으로 이동

- 도표 - 광고 선택(요인분석창) - 수평축변수로 이동 - 성별 선택(요인분석창) - 선구분변수로 이동 - 추가

- 사후분석 클릭 - 광고 선택(요인분석창) - 사후검정변수로 이동 - 사후분석방법 (Bonferroni(B), Tukey방법(T), Scheffe(C)체크)

- 옵션 클릭 - 기술통계량과 주효과크기추정값 체크 - 계속 클릭 - 확인 클릭

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

<개체 간 효과 검정>결과표를 보면 태도 점수에 대한 광고 대안과 성별의 주효과, 두 변수의 상호작용효과가 나타납니다.

먼저, 상호작용효과를 보면 F=1.344, 유의확률(p-value)=.297로 나타나

"광고대안과 성별은 상호작용효과가 없는 것"으로 확인됩니다.

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

<도표>는 상호작용효과를 보여주는데 두 개의 선이 나란히 나타나 상호작용 효과가 없다는 것을 보여주고 있습니다.

상호작용효과가 유의하지 않기 때문에 성별에 따라 광고 대안들에 대한 태도의 패턴이 다르다고 할 수 없죠.

여기서 잠깐~~~~!!

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

이원배치 분산분석에서 그래프가 꼭 X자로 교차해야 할까요?

교차하지 않아도 두 직선의 기울기 차이가 매우 크다면 상호작용 효과는 유의하게 나타납니다.

그럼 그래프가 X자로 교체되었다고 꼭 상호작용 효과가 있을까요?

교차되더라도 두 직선의 기울기가 매우 작다면 두 변수의 상호작용 효과는 유의하지 않게 나타납니다.

즉, 그래프 보다 상호작용 변수의 p값이 유의수준(.05) 보다 작다면 상호작용효과는 유의한 것입니다.

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

다음으로 광고 대안의 주효과를 보면, F=21.811, 유의확률(p-value)=.000으로 나타나

"광고대안에 따라 태도점수에는 차이가 있는 것"으로 확인됩니다.

<기술통계량>을 확인해보면 결국, 태도점수는 광고1(3.45), 광고3(2.97), 광고2(2.60)의 순이 됩니다.

다음으로 성별의 주효과를 보면, F=100.278, 유의확률(p-value)=.000으로 나타나

"성별에 따라 태도 점수에는 차이가 있는 것"으로 확인됩니다.

<기술통계량>을 확인해보면 결국, 남자들의 태도점수(3.533)가 여자들의 태도점수(2.48)보다 높습니다.

<개체 간 효과검정>의 결과표에 부분 에타 제곱값은 효과크기를 나타내는 값이에요.

분산분석에서 효과크기는 집단 간 평균 차이를 나타내는 표준치에요.

분산분석에서 효과크기를 판단하는 값인 부분에타제곱의 값이 .01이면 효과크기가 작고, .06이면 중간, .14이면 크다고 판단합니다.

위 표에 상호작용효과의 부분에타제곱값이 .183으로 비교적 크다고 할 수 있습니다.

그런데 효과크기가 큼에도 불구하고 유의하지 않은 결과가 나온것은 표본의 크기가 각 셀당 3개씩 너무 작기 때문이에요.

따라서 표본의 크기가 커질수록 분석결과가 통계적으로 유의하게 나타나고 통계적 검증력 또한 커질 것으로 짐작할 수 있죠.

광고와 성별의 주효과의 부분에타제곱은 각 .784, .893으로 매우 큽니다.

<개체 간 효과검정>의 최하단에 있는 R제곱은 두 개의 처치변수와 그 상호작용이 종속변수의 분산을 설명하는 정도를 나타냅니다.

이 경우 두개의 주효과에 관련된 제곱합과 상호작용효과에 관련된 제곱합을 더한 값(2.181+5.014+.134)을 수정합계 값(7.329)로 나누면 값이 .924가 되죠.

즉, 수정모형의 부분에타제곱값에 해당하고, 이는 회귀분석의 R2(알스케어)에 비유될 수 있어요.

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

<다중비교>는 세 집단의 태도값들 간의 사후검증결과를 나타냅니다.

광고1-광고2, 광고2-광고3, 광고1-광고3의 비교 결과 세 가지 방법 모두에서 유의한 차이를 보였습니다.

사후검증에서는 Tukey법에 의한 차이가 가장 유의적으로 나타났어요.

광고1-광고3을 보면 Tukey는 .007, Scheffe는 .010, Bonferroni는 .008이 확인되죠?

그리고 Tukey법에 의한 신뢰구간이 가장 좁아요.

이러한 결과는 각 Cell의 크기가 같은 경우 Tukey법을 사용한다면 집단 간 차이를 가장 정밀하게 감지하는 장점이 있습니다.

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong
이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

이번에는 다른 예를 들어 보도록 하겠습니다.

성별과 배달앱 브랜드(A,B,C사)가 선호도에 미치는 영향에 대하여 알아보겠습니다.

선호도는 9점 리커트 척도를 사용한 것으로 가정합니다.

가설은 다음과 같습니다.

1.배달 앱 브랜드에 따라 선호도에 유의한 차이가 있다.

2. 성별에 따라 선호도에 유의한 차이가 있다.

3. 선호도에 대하여 성별과 배달앱 브랜드 간에 유의한 상호작용 효과가 있을 것이다.

좀 전 분석해 본 방법과 약간 다른 방식으로 해보겠습니다.

분석방법은 위와 동일합니다.

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong

이원 분산분석 결과 상호작용효과와 두 개의 주효과는 모두 .05수준에서 유의적으로 확인되었습니다.

X축을 배달앱 Y축을 선호도로 하여 그림을 그려보면 남자와 여자의 선이 서로 교차하여 상호작용 효과가 있음을 알 수 있어요.

개체간 효과검정에도 유의하게 나오죠.

특히 배달앱 A사의 경우 남자들의 선호도보다 여자들의 선호도가 매우 높으며 이에 따라 상호작용효과가 크게 나타난 것으로 판단됩니다.

주효과와 상호작용효과의 효과크기(부분에타제곱)은 모두 큰 것으로 확인되었습니다.

다중비교를 보면, 선호도는 A와 C사, B사와 C사가 유의한 차이를 보이고, A사와 B사는 유의한 차이를 보이지 않네요.

대소 관계를 표현한다면, C사 < B사, A사 라고 할 수 있습니다.

퀵데이터는 여러분의 성공을 위해 오늘도 함께 하겠습니다~~^^

(주)한국교육데이터

이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong
이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong
이원분산분석 상호작용 - iwonbunsanbunseog sanghojag-yong