728x90
반응형
scaling
-
ADsP 데이터분석준전문가 - 과대적합, Regularization, ScalingS T U D Y/DataBase 2023. 2. 4. 16:35
과적합(Overfitting) 주어진 샘플들의 설명변수와 종속변수의 관계를 필요이상 너무 자세하고 복잡하게 분석 샘플에 심취한 모델로 새로운 데이터가 주어졌을 때 제대로 예측해내기 어려울 수 있음 해결 방법으로 Feature 개수 줄이거나 Regularization 수행하는 방법 있음 Regularization(정규화) 베타 값에 제약을 주어 모델에 변화를 주는 것 람다 값은 정규화 모형을 조정하는 hyper parameter 람다 값이 클수록 제약이 많아져 적은 변수가 사용되고, 해석이 쉬워지지만 underfitting 됨 람다 값이 작아지면 제약이 적어져 많은 변수가 사용되지만, 해석이 어려워지고 overfitting됨 L1, L2 Norm Norm 선형대수학에서 벡터의 크기나 길이를 측정하는 방법 ..