728x90
차원이 증가할수록 예측 신뢰도가 떨어지고 과적합(overfitting)이 발생할 가능성이 높다. PCA(주성분 분석)과 같은 방법을 사용하여 고차원의 데이터를 저차원으로 축소할 수 있다. 메모리, 용량 절약!!
*PCA(주성분 분석): 분산은 유지하면서 특성(feature)의 수를 줄이는 선형 차원 축소 기법
파이썬에서 주성분을 사용하여 특성 줄이기
-> whitening을 True로 해 주어야 스케일(값의 범위)이 맞춰진다.
- 손글씨 데이터를 활용하여 특성 행렬 표준화 및 주성분 특성 줄이기
- 선형적으로 구분되지 않는 데이터 차원 축소하기
- 선형 판별 분석(LDA)로 데이터 특성 축소하기
728x90
'MS AI School' 카테고리의 다른 글
DAY 44 - 텍스트 데이터 처리 (0) | 2022.12.13 |
---|---|
DAY 42 - 범주형 데이터 처리 방법: Scikit-Learn, Pandas, 딕셔너리, 행렬 데이터 (0) | 2022.12.13 |
DAY 40 - 데이터 처리 방법: 정규화, 표준화 (0) | 2022.12.09 |
DAY 39 - 데이터 처리 개요 (0) | 2022.12.09 |
DAY 38 - CRUD 애플리케이션 만들기 (0) | 2022.12.09 |