'part correlation'에 해당되는 글 1건

  1. 2011.10.18 상관, 부분상관, 준부분상관(correlation, partial correlation, semi-partial correlation)

상관, 부분상관, 준부분상관(correlation, partial correlation, semi-partial correlation)

통계분석 2011. 10. 18. 22:48
상관계수는 변인 X와 Y사이의 관련성 혹은 결합 정도를 나타내는 값이다. 그러나 이 값은 다른 변인 들이 앞의 변인들과 어떤 관련성이 있는지에 따라 설명하는 정도가 달라 질 수 있다. 이를 설명하는 것이 부분상관계수와 준부분상관계수이다(경우에 따라서 편상관, 준편상관(part correlation), 혹은 여과상관, 준여과상관이라고도 한다).

부분상관은 Y와 X1의 상관계수 값이 제 3의 변인인 X2에 의해서 영향을 받거나 혹은 X2 변인이 Y와 X1 모두에 공통으로 영향을 미쳐 나타난 관련성이 X2를 제외했을 때도 나타나는지를 알고 싶을 때 구하게 된다. 예를 들어 언어능력과 발을 크기간의 관계를 연구하였을 때 연령이라는 변인을 제거하여도 언어능력과 발의 크기간에 관계가 유지될 수 있을 것이냐에 답을 해야 한다면 부분상관을 구하는 것이 필요하다. 물론 부분상관은 통제해야 할 변인의 수가 2개 이상일 때에도 구할 수 있으며 이를 제 이차 편상관(second order partial coefficient)라고 한다.

만약 제 3의 변인을 통제하여 분석한 결과 상관계수가 0에 가까워진다면 제3의 변인은 두 변인간의 관계를 부풀리는 역할을 한 것이면 두변인간의 관계는 허위적인 관계(spurious relationship)관계라고 할 수 있다. 예를 들어 옷의 노출 정도와 청량음료의 판매량의 관계에서 기온을 통제한다면 아마도 상관은 낮아질 것이며 이때 옷을 노출 정도와 청량음료의 판매량은 허위적 관계라 할 수 잇다. 하지만 반대로 제 3의 변인을 통제하였을 경우 두 변인 간의 관계가 더 높아 진다면 제 3의 변인은 두 변인간의 관계를 억누르는 억제변인(suppressor variable) 으로 작용한 것이다.

아래 그림은 Y와 X1, X2간의 관계를 나타낸 것이다. 여기서 Y는 준거변인(criterion variable)이며, X1과 X2는 예언변인(predictor variable)이다. 



위 그림에서 X2에 의해서 설명되는 부분은 b, c, e이므로 이 부분을 모두 제거하고 Y에 대한 X1의 상관을 계산하면 부분 상관계수가 된다. 즉 Partial for X1=a/(a+d)이며. 마찬가지로 Partial for X2=c/(c+d)이다. 

준부분상관은 부Y를 설명하는 두 변인 중 X1 또는 X2 각각으로 만 설명할 수 있는 부분 즉 X1 혹은 X2 고유의 설명량이 어느정도 되는지를 알아보려는 경우 사용할 수 있다. 위의 그림에서 Part for X1=a/(a+b+c+d)이며, 마찬가지로 Part for X2=c/(a+b+c+d)가 된다. 준부분상관이 가지는 가장 큰 장점은 분모에 있다. 준부분상관에서의 분모는 연구자가 예측하고자 하는 변인의 전체 변량을 나타낸다. 따라서 준부분 상관계수는 예측하고자 하는 준거변인을 설명하는 예언변인의 고유한 설명량을 확인할 수 있는 것이다. 



: