소프트웨어 공부/수학

상관 분석(Correlation analysis)

야곰야곰+책벌레 2021. 10. 19. 15:25
728x90
반응형

  상관 분석(Correlation analysis, 상관관계, 상관)은 확률론과 통계학에서 두 변수 간에 어떤 선형적 또는 비선형적 관계를 갖고 있는지를 분석하는 방법이다. 두 변수는 서로 독립적인 관계이거나 상관된 관계일 수 있으며 이때 두 변수 간의 관계의 강도를 상관관계(Correlation analysis)라고 한다. (위키백과)

상관관계

  상관관계는 일정한 수치로 계산되어 두 대상이 서로 관련성이 있다고 추측되는 관계를 말한다. '상관 연구'는 연구 대상 간의 상호 관련성을 알아보는 데 사용된다. 관계성의 정도는 상관계수(correlation coefficient)라고 불리는 수치로 표시된다. 상관 계수는 양(+)의 값 혹은 음(-)의 값을 가진다. 상관 계수가 0일 때는 대상 간에 아무 관련성이 없음을 의미한다.

상관도

  두 변량 x, y의 값을 좌표평면 위의 (x, y)에 점으로 나타낸 그림을 상관도라고 한다. 상관도에는 양 혹은 음의 상관관계가 나타나고, 상관관계의 강약도 파악할 수 있다.

왼쪽의 두 개의 그림은 양의 상관관계를 보여주고 오른쪽 두 개는 음의 상관관계를 보여준다. 

상관계수

  상관계수는 두 개의 변수 사이의 직선적인 관련 정도를 측정하기 위한 통계량이라고 볼 수 있다. 즉, 산점도에서 나타난 선형 관계의 정도를 다시 말해서, 직선과 점들이 어느 정도 흩어져 있느냐에 따라 선형 관계에 대한 강도를 측정하는 수치적 측도가 상관 계수다.

사례

  그럼에서 보듯이 상관관계는 기울기가 중요하지 않다. 얼마나 직선에 가까운지가 중요하다.

 

728x90
반응형