목록Deep learning (30)
questionet
algorithmic trading (컴퓨터 프로그램으로 하는 주식거래)을 포함한 많은 영역에서 강화학습이 적용되고 있다. 이 논문은 증권거래소에서의 주식매매가 마르코프 성질을 가진 게임(상태, 행위, 보상을 주체로 하는 강화학습)으로 해석될 수 있다는 걸 보여주고자 한다 this is based on the 강화학습 기법인듯 method with the use of several neural network architectures. The application of recurrent layers in this approach is investigated 사용된 딥러닝 모델은 RNN(LSTM) 실험은 익명화된 데이터로 수행되었다. 가장 좋은 성능을 낸 기법은 RTS Index futures (MOEX:R..
레이어를 깊이 쌓는 CNN은 최근 몇년새 이미지 인식 문제해결방법에 많은 진전을 보였다 특히 인셉션 기법은 상대적으로 적은 계산비용으로 좋은 성능을 내고 있다. 최근 residual connection 잔차 연결 기법도 SOTA 성능을 내고 있는데 이 기법은 인셉셥-v3네트워크의 성능과 유사하다. 그럼 잔차연결과 인셉션 기법을 합치면 더 좋은 성능을 낼 수 있을까? 우리는 잔차연결기법이 인셉션 네트워크의 훈련을 상당히 가속화 해준다는 경험적인 증거를 제시하고자 한다. 학습속도 개선이 가능했다. 성능에 개선이 있는 건 아니다. 아주 와이드한 잔차 인셉션 네트워크(레지듀얼을 더 추가한 인셉션 네트워크)에서 학습이 안정화될 수 있게 하는 방법을 보여주려 한다.
주식거래전략 : 주식시장에서 최적의 전략을 찾는 문제 개발 배경 : deep reinforcement learning 으로 최적의 주식거래전략을 찾을 수 있을까? 방법 : 1 30종목의 주가를 가지고 실험을 해보았다. 2 agent의 performance는 다우존스 산업평균지수DJI와 전통적인 min-variance portfolio allocation strategy (최소분산 포트폴리오 할당전략)으로 평가 결론 : 논문에서 제안된 접근법은 샤프지수sharpe ratio(high risk, high return)와 누적수익cumulative returns 부문에서 더 나은 결과를 보여줬다.

개발배경 : 기존의 모델들은 주어진 text decription을 기반으로 이미지를 생성해낼 때 description의 내용을 충분히 살리지 못함. stackGAN : 특정 text description에 상응하는 256x256 규격의 이미지를 생성해 낸다. 특징1 : sketch-refinement process를 사용 stage1: 주어진 decription에 기반해 사물의 기초적인 형태와 색상을 sketch하여 저화질 이미지 생성 stage2: stage1의 결과물을 바탕으로 refinement process를 거쳐 고화질의 이미지 생성 특징2: Conditioning Augmentation 기법을 사용 사용 목적 : 생성된 결과물의 다양성과 conditional_GAN 학습의 안정성을 향상시키기 ..

LSTM, GRU에 이어서 questionet.tistory.com/37?category=961868 이 페이지는 밑바닥부터 시작하는 딥러닝 2권과 다음 강의를 정리, 부연한 것이다 www.youtube.com/watch?v=JVLY1S0H6AQ www.youtube.com/watch?v=YAgjfMR9R_M&list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r&index=13 1 seq2seq with attention 과 2 image captioning with attention 을 통해 attention의 원리에 대해 이해한 후 3 attention자체에 대해 살펴보자. 1. seq2seq with attention 도착어와 대응관계에 있는 출발어가 뭔지 seq2seq에게 학습시..

이 페이지는 밑바닥부터 시작하는 딥러닝2권과 다음 강의를 정리, 부연한 것이다 www.youtube.com/watch?v=dUzLD91Sj-o&list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r&index=12 www.youtube.com/watch?v=qkb4WoonjeI Feedforward Neural Network 와 Recurrent Neural Network 비교 Feedforward Neural Network에서 Image classification은 sequential data를 다루지 않는다. (입력에서든 출력에서든) 바꿔 말해 개별 이미지들은 한방에 처리된다. (대표적으로 CNN) 그런데 Recurent Neural Network에서는 Image classificat..

이 페이지는 '바닥부터 배우는 강화학습'의 내용을 정리한 것이다. 강화학습이란? : 순차적 의사결정 문제에서 누적보상을 최대화하기 위해 시행착오를 거쳐 행동을 교정하는 학습과정. 순차적 의사결정sequential decision making이란? : 달성해야할 목표를 이루기 위해 거쳐야 하는 단계들이 여러가지가 있는 문제의 경우 각 단계에서 내리게 되는 의사결정과정. 이전 단계에서의 결정에 따른 행동은 상황의 변화를 낳고 변한 상황은 다시 다음 단계에서의 행동에 영향을 준다. 순차적 의사결정과정 문제란? : 목표를 달성하고 난 다음 그 목표에 이르기까지의 행동들을 단계별로 돌이켜 보면 순차적일 수밖에 없다. 바꿔 말해 어떤 목표를 달성하기 위해선 매 단계에서 다음단계로 가기 위한 행동이 순차적으로 이뤄져..
밑바닥부터 시작하는 딥러닝 2권 80~81쪽 1. 시소러스 자연어처리에서 시소러스(Thesaurus)는 모든 단어에 대한 유의어 집합을 만든 다음, 단어들 간의 네트워크를 구성한 것이다. 이 단어 네트워크를 이용하면 컴퓨터에게 단어의 의미를 가리키게 할 수 있다. 2. WordNet WordNet은 시소러스의 하나로 유의어를 얻거나, 단어네트워크를 이용해 단어 사이의 유사도를 구할 수 있다. WordNet을 사용하려면 NLTK 라이브러리를 사용해야 한다. 이하 설명 참고 링크 github.com/philosucker/coding_practice/blob/master/WordNet.ipynb