728x90
정규화(Normalization), 표준화(Standardization)를 하는 이유?
편향된 모델을 만드는 것을 방지하기 위해서

- 정규화(Normalization)?

데이터 분포를 특정 구간으로 바꾸어 준다.

스케일링에 최대값과 최소값 사용

변수를 0~1(또는  -1~1)의 값으로 만든다.

*식 = (측정값 - 최소값) / (최대값 - 최소값)

 

 

- 표준화(Standardization)?

스케일링에 평균과 표준편차 사용

변수의 범위를 평균 0, 분산 1이 되게 만든다.

값의 범위 차이가 큰 서로 다른 통계 데이터를 비교하기에 용이하다. 

식(z-score표준화) : (측정값 - 평균) / (표준편차)

*표준편차 = √분산

*분산 = (측정값1-평균)^2+(측정값2-평균)^2+(측정값3-평균)^2+... +(측정값n-평균)^2

 

 

파이썬에서 정규화(Normalization), 표준화(Standardization) 해 보기

*실제로 사용할 땐 내장된 함수를 사용한다.

 

다음과 같은 실행 결과가 나타난다.

6x5 사이즈의 랜덤한 2차원 배열 데이터를 만든 뒤 표준화, 정규화를 하였다.

 

728x90

+ Recent posts