728x90
반응형
설명변수선택방법
-
ADsP 데이터분석준전문가 - 다중공선성, 설명변수 선택방법S T U D Y/DataBase 2023. 2. 3. 22:16
다중공선성 모형의 일부 설명변수(=독립변수)가 다른 설명변수와 상관되어 있을 때 발생하는 조건 중대한 다중공선성은 회귀계수의 분산을 증가시켜 불안정하고 해석하기 어렵게 만들기 때문에 문제가 됨 R의 vif 함수를 사용해서 구할 수 있고, VIF > 10 이면 다중공선성 존재한다고 봄 다중공선성 해결방법 높은 상관관계가 있는 설명변수를 모형에서 제거 설명변수를 제거하면 대부분 R-square(결정계수)가 감소 => 설명력 감소 그래서 단계적 회귀분석을 이용해서 제거함 설명변수의 선택 원칙 y에 영향을 끼칠 수 있는 모든 설명변수 x들은 y값을 예측하는데 참여시킴 설명변수 x들의 수가 많아지면 관리에 많은 노력이 요구돼서 가능한 범위 내에 적은 수의 설명변수를 포함시켜야 함 두 원칙이 이율배반적이어서 적절한..