728x90

차원이 증가할수록 예측 신뢰도가 떨어지고 과적합(overfitting)이 발생할 가능성이 높다. PCA(주성분 분석)과 같은 방법을 사용하여 고차원의 데이터를 저차원으로 축소할 수 있다. 메모리, 용량 절약!!

*PCA(주성분 분석): 분산은 유지하면서 특성(feature)의 수를 줄이는 선형 차원 축소 기법

 

파이썬에서 주성분을 사용하여 특성 줄이기

-> whitening을 True로 해 주어야 스케일(값의 범위)이 맞춰진다.

 

- 손글씨 데이터를 활용하여 특성 행렬 표준화 및 주성분 특성 줄이기

- 선형적으로 구분되지 않는 데이터 차원 축소하기 

- 선형 판별 분석(LDA)로 데이터 특성 축소하기

 

728x90

+ Recent posts