728x90
정규화(Normalization), 표준화(Standardization)를 하는 이유?
편향된 모델을 만드는 것을 방지하기 위해서
- 정규화(Normalization)?
데이터 분포를 특정 구간으로 바꾸어 준다.
스케일링에 최대값과 최소값 사용
변수를 0~1(또는 -1~1)의 값으로 만든다.
*식 = (측정값 - 최소값) / (최대값 - 최소값)
- 표준화(Standardization)?
스케일링에 평균과 표준편차 사용
변수의 범위를 평균 0, 분산 1이 되게 만든다.
값의 범위 차이가 큰 서로 다른 통계 데이터를 비교하기에 용이하다.
식(z-score표준화) : (측정값 - 평균) / (표준편차)
*표준편차 = √분산
*분산 = (측정값1-평균)^2+(측정값2-평균)^2+(측정값3-평균)^2+... +(측정값n-평균)^2
파이썬에서 정규화(Normalization), 표준화(Standardization) 해 보기
*실제로 사용할 땐 내장된 함수를 사용한다.

다음과 같은 실행 결과가 나타난다.
6x5 사이즈의 랜덤한 2차원 배열 데이터를 만든 뒤 표준화, 정규화를 하였다.
728x90
'MS AI School' 카테고리의 다른 글
DAY 42 - 범주형 데이터 처리 방법: Scikit-Learn, Pandas, 딕셔너리, 행렬 데이터 (0) | 2022.12.13 |
---|---|
DAY 41 - 데이터 처리 방법: 차원 축소 (0) | 2022.12.10 |
DAY 39 - 데이터 처리 개요 (0) | 2022.12.09 |
DAY 38 - CRUD 애플리케이션 만들기 (0) | 2022.12.09 |
DAY 34 - CNN, 이미지의 증식(오버피팅 줄이는 방법) (0) | 2022.12.07 |