목록Learning questions (27)
questionet
그래프란? 그래프는 정점 · 꼭지점(vertex)과 간선 · 변(edge)으로 구성된 자료구조를 의미한다. 그래프를 구현하는 방법 그래프를 표현하는 방법에는 인접리스트(adjacency list)와 인접행렬(adjacency matrix)이 있다. 인접리스트로 표현한다는 건 무슨 말일까? 각 노드가 인접한 노드의 리스트를 가지고 있는 구조다. 파이썬에서는 딕셔너리 자료형을 사용하면 출발 노드를 key로 도착노드를 value로 표현할 수 있다. 도착노드는 여러 개가 될 수 있으므로 리스트 형태가 된다. graph = { 1 : [2, 3, 4,], 2 : [5], 3 : [5], 4 : [ ], 5 : [6, 7], 6 : [ ], 7 : [3], } 리스트 구조는 sparse graph에 적합하며 적은 ..
1. 자료구조(Data Structure)란? 1. 데이터에 효율적으로 접근하고 조작하기 위한 데이터의 조직, 관리, 저장구조를 말한다. 2. 일반적으로 원시자료형을 기반으로 하는 배열, 연결리스트, 객체 등을 말한다. 3. 추상자료형의 실제 구현은 대부분 배열, 연결리스트를 기반으로 한다. cf) 자료형(Data Type)이란? : 컴파일러 또는 인터프리터에게 프로그래머가 데이터를 어떻게 사용하는지를 알려주는 일종의 데이터 속성(attribute)이다. ex) 파이썬 언어에서 지원하는 자료형 None, 숫자[정수-불리언, 실수], 집합, 매핑(딕셔너리 복합자료형), 시퀀스[문자열, 튜플, 바이트(불변), 리스트(가변)] 원시자료형(Primitive Data Type)이란? 1. C나 JAVA 같은 성능..
이미지 출처 jalammar.github.io/visual-numpy/ numpy에서 dim, axis, rank, shape, size 의 의미 1. size 는 총 element의 개수를 뜻한다. 2. dim 은 텐서가 존재하는 축의 개수를 뜻한다. 여기서 축이란, 1차원 벡터, 2차원 행렬, 3차원,...,n차원 텐서에서의 각 1, 2, n을 말한다. 위의 넘파이 배열 b와 그것을 시각화한 그림을 보면 1차원 벡터가 총 8개 있고 [1,2] [3,4] [5,6] [7,8] >>> dim1 [1,2] [3,4] 와 [5,6] [7,8] 을 묶어 2차원 행렬 2개를 만든 후 [[1,2] , [3,4]] [[5,6] , [7,8]] >>> dim2 각 행렬이 3차원 상에 배열된다. [ [[1,2] , [..
제곱손실함수와 절대값 손실함수의 차이 제곱손실함수를 사용할 때 scale이 너무 크면 값이 비정상적으로 커져서 노이즈 데이터가 생성될 수 있다. 노이즈 데이터가 너무 많이 생성될 거 같으면 절대값 손실 함수를 사용한다.
normalization 값의 범위(scale)을 0~1 사이 값으로 바꾸는 것 = scaling scaling이란 표현도 여기저기서 조금씩 다른 뜻으로 많이 쓰여 헷갈린다 standardization 값의 범위(scale)을 평균이 0, 분산이 1이 되도록 바꾸는 것 정규분포를 표준정규분포로 변환하는 것과 같음 이렇게 하면 무슨 효과를 보는 거지? regularization weight를 조정하는데 규제(제약)를 거는 기법 정확히 이해하지 못했다 over fitting 을 막기 위해 사용 normalization, standardization의 공통점 1 학습전에 scaling 2 오버피팅을 방지 어떻게? 3 머신러닝에서 scale이 큰 feature의 영향이 비대해지는 걸 방지 4 딥러닝에서 loca..