-
ADsP 데이터분석준전문가 - 상관분석, 피어슨 스피어만 상관계수S T U D Y/DataBase 2023. 2. 4. 17:01728x90반응형
상관계수
두 변수의 관련성의 정도를 의미합니다(-1 ~ 1의 값으로 나타냄)
상관관계가 존재하지 않으면 상관계수는 0임
상관관계가 높다고 인과관계가 있다고 할 수는 없음
R의 cor.test()함수를 사용해 상관계수 검정을 수행하고 유의성검정을 판단할 수 있음피어슨 상관계수
두 변수간의 선형적 크기만 측정 가능
등간척도, 비율척도 사용
피어슨 상관계수 = x, y의 공분산/ x표준편차 * y표준편차
(예시) 응답자1의 표준편차2, 응답자2의 표준편차2, 두 응답자의 공분산 4라고 하면
피어슨 상관계수 = 4 / (2*2) = 1스피어만 상관계수
두 변수 간 비선형적 관계도 나타낼 수 있음
대상자료는 서열척도 사용
각 변수에 대해 순위를 매긴 값을 기반으로 함
두 변수 안의 순위가 완전일치하면 1, 완전 반대이면 -1
연속형 외에 이산형도 가능함
관계가 랜덤이거나 존재하지 않을 경우 상관계수 모두 0에 가까움공분산
Covariance
2개의 확률변수의 선형 관계를 나타내는 값
공분산이 0이면 서로 독립임728x90반응형'S T U D Y > DataBase' 카테고리의 다른 글
ADsP 데이터분석준전문가 - 시계열 예측, 시계열 모형 (0) 2023.02.04 ADsP 데이터분석준전문가 - 차원 축소 기법 (0) 2023.02.04 ADsP 데이터분석준전문가 - 과대적합, Regularization, Scaling (0) 2023.02.04 ADsP 데이터분석준전문가 - 다중공선성, 설명변수 선택방법 (0) 2023.02.03 ADsP 데이터분석 준전문가 - 회귀분석, 회귀 모형의 가정, 회귀 모형의 해석 (0) 2023.01.31