questionet
정규화 본문
어떤 샘플 X들의 집합이 있을 때
X_new = (X - mean) / Std
각 샘플에서 샘플들의 평균을 빼주고 표준편차로 나눠주는 것 = z1 score 정규화 (표준화)
X_new = (X - X_min) /( X_max - X_min)
각 샘플에서 최소값을 빼주고 최대값과 최소값의 차이로 나눠주는 것 = min-max scaling or 정규화
X_new = X / ||X|
각 샘플들을 L2 norm으로 나눠주는 것 = L2 norm 정규화
공통점
값이 원래보다 작아진다
표준화의 특징
0 데이터들을 zero-centered 시킨다. (데이터들의 평균이 0, 분산이 1이 되도록한다)
1 데이터들을 특정 값의 범위 내에 분포하게 만들지 않는다.
2 아웃라이어에 영향을 덜 받는다.
3 데이터들이 정규분포나 가우시안 분포를 따를 때 도움이 된다.
min-max scaling or 정규화의 특징
1 데이터의 값들을 0,1 또는 -1, 1 사이에 위치하도록 한다.
2 이 정규화는 데이터에 아웃라이어가 없을 때 유용하다
3 이 정규화는 데이터가 어떤 분포를 따르는지 모를 때 유용하다.
'Deep questions > 수학적 바탕' 카테고리의 다른 글
선형변환과 linear layer 의 관계 (1) | 2024.02.20 |
---|---|
단어 벡터(word vector), 코사인 유사도(cosine similarity) (1) | 2021.02.14 |
확률로 보기 (0) | 2021.02.13 |
Comments