questionet

정규화 본문

Deep questions/수학적 바탕

정규화

orthanc 2021. 8. 24. 16:54

어떤 샘플 X들의 집합이 있을 때

X_new = (X - mean) / Std
각 샘플에서 샘플들의 평균을 빼주고 표준편차로 나눠주는 것 = z1 score 정규화 (표준화)

X_new = (X - X_min) /( X_max - X_min)
각 샘플에서 최소값을 빼주고 최대값과 최소값의 차이로 나눠주는 것 = min-max scaling or 정규화

X_new = X / ||X|
각 샘플들을 L2 norm으로 나눠주는 것 = L2 norm 정규화

공통점
값이 원래보다 작아진다

표준화의 특징
0 데이터들을 zero-centered 시킨다. (데이터들의 평균이 0, 분산이 1이 되도록한다)
1 데이터들을 특정 값의 범위 내에 분포하게 만들지 않는다.
2 아웃라이어에 영향을 덜 받는다. 
3 데이터들이 정규분포나 가우시안 분포를 따를 때 도움이 된다.

min-max scaling or 정규화의 특징
1 데이터의 값들을 0,1 또는 -1, 1 사이에 위치하도록 한다. 
2 이 정규화는 데이터에 아웃라이어가 없을 때 유용하다
3 이 정규화는 데이터가 어떤 분포를 따르는지 모를 때 유용하다.

 

Comments