목록분류 전체보기 (89)
questionet
자연어는 텍스트 함축textual entailment, 질의응답question answering, 의미 유사도 평가semantic similarity assessment 문서 분류 등 광범위한 태스크 래인지를 가진다. 레이블되지 않은 텍스트는 엄청 많은 반면 특정 태스크를 위해 레이블된 자료들은 드물다 We demonstrate that large gains on these tasks can be realized by generative pre-raining of a language model on a diverse corpus of unlabeled text, followed by discriminative fine-tuning on each specific task. 우리는 레이블되지 않은 다양한 종..
Quantitative investment 양적 투자 일정 기간 동안 돈 안 잃고 최대한 많이 버는 게 목적이다. 양적 투자 분야에서 인공지능 기술을 도입하고 있는데 우리는 Qlib이란 기술을 설계해봤다. 양적 투자에 인공지능 기술이 성공적으로 안착되려면 infrastructure upgrade가 요구된다 어떤 업그레이드냐면 to accommodate the renovated workflow 여기서 Infrastructure 가 뭘 가리키는 건지? Workflow는 뭐지? trading signals을 포착하는 능력, 어떤 factor들로부터 그걸 통해 거래 전략을 수립하는 것 factor가 매우 많은데 여기서 factor는 머신러닝에서의 feature에 상응 된다 data-driven의 의미 AI는 주..
COCO-GAN: Generation by Parts via Conditional Coordinating 인간은 자신을 둘러싼 환경의 일부분과만 상호작용할 수 있다. 생물학적 한계로인해. 그래서 그 환경의 부분들을 연속적으로 관찰해서 공간정보를 추론한다. 이러한 인간 인지 특성에서 영감을 받아 머신러닝 시 연산비용 문제를 고려해 conditional coordinate GAN을 제안해보려 한다. 생성자는 조건으로 주어지는 공간좌표에 기반해 부분 이미지를 생성해내고 판별자는 global coherence, local appearance, and edge-crossing continuity 를 바탕으로 부분들의 조합으로 만들어진 이미지의 사실성을 판별한다? global coherence, local-appe..
algorithmic trading (컴퓨터 프로그램으로 하는 주식거래)을 포함한 많은 영역에서 강화학습이 적용되고 있다. 이 논문은 증권거래소에서의 주식매매가 마르코프 성질을 가진 게임(상태, 행위, 보상을 주체로 하는 강화학습)으로 해석될 수 있다는 걸 보여주고자 한다 this is based on the 강화학습 기법인듯 method with the use of several neural network architectures. The application of recurrent layers in this approach is investigated 사용된 딥러닝 모델은 RNN(LSTM) 실험은 익명화된 데이터로 수행되었다. 가장 좋은 성능을 낸 기법은 RTS Index futures (MOEX:R..
레이어를 깊이 쌓는 CNN은 최근 몇년새 이미지 인식 문제해결방법에 많은 진전을 보였다 특히 인셉션 기법은 상대적으로 적은 계산비용으로 좋은 성능을 내고 있다. 최근 residual connection 잔차 연결 기법도 SOTA 성능을 내고 있는데 이 기법은 인셉셥-v3네트워크의 성능과 유사하다. 그럼 잔차연결과 인셉션 기법을 합치면 더 좋은 성능을 낼 수 있을까? 우리는 잔차연결기법이 인셉션 네트워크의 훈련을 상당히 가속화 해준다는 경험적인 증거를 제시하고자 한다. 학습속도 개선이 가능했다. 성능에 개선이 있는 건 아니다. 아주 와이드한 잔차 인셉션 네트워크(레지듀얼을 더 추가한 인셉션 네트워크)에서 학습이 안정화될 수 있게 하는 방법을 보여주려 한다.
일단 제목이 biased code가 아닌 coded bias라는 게 곱씹어 볼 만하다. 넷플릭스에서 한국어로 번역된 제목은 '알고리즘의 편견'인데 원제의 뉘앙스를 죽이는 번역같다. 똑같은 얘기를 몇번이나 반복해 1시간이면 충분했을 러닝타임이 90분이나 되는 것과 중간중간 마이크로소프트의 tei가 오글거리는 대사를 읊는 것만 빼면 비판적인 몇몇 다큐들이 굉장히 선동적이고, 확증편향에 사로잡혀 있으며, 음모론의 성격마저 띤다는 걸 염두에 두고 최대한 객관적인 시선으로 보았음에도 대부분의 주장에 동의할만한 괜찮은 다큐였다. 전체 줄거리 리뷰는 세 마디로 짧게 하고 다큐에서 충분히 짚어지고 고찰되지 않은 질문에 대한 나의 생각을 적어보겠다. 1. 알고리즘 자체는 편향되지 않고 될 수도 없다 수학이 발명된 거냐 ..
꼰러닝. 딥러닝을 꼬아서 보는, 꼰대의 시각으로 보는 딥러닝이랄까. 오전 노드를 끝내고 점심을 먹다가 문득 떠오른 이름이다. 이런 이름이 떠오르게 된 연유는 이러했다. 밥에 카레를 비벼 먹고 있는데 최신 삼성 스마트폰의 사진 어플에서 개체를 지우는 기능이 불현듯 생각났다. (딥러닝으로의 neuroplasticity이 이제 슬슬 돌아가는 모양이다) 처음 그 기능에 대해 들었을 땐 편리하고 유용하겠다 싶었는데 카레가 너무 매워서 그랬는지 이런 물음표가 점점 커져갔다. "이거 너무 잔인한 기능인데?" 잔인하다는 표현을 너무 오랜만에 써서 그런가 내가 말하려고 하는 감정이 제대로 담겨 있는 건지 가물가물했다. 곧바로 사전을 찾아봤다. '잔인하다 형용사, 인정이 없고 아주 모질다.' 스마트폰으로 찍은 사진에서 개..
주식거래전략 : 주식시장에서 최적의 전략을 찾는 문제 개발 배경 : deep reinforcement learning 으로 최적의 주식거래전략을 찾을 수 있을까? 방법 : 1 30종목의 주가를 가지고 실험을 해보았다. 2 agent의 performance는 다우존스 산업평균지수DJI와 전통적인 min-variance portfolio allocation strategy (최소분산 포트폴리오 할당전략)으로 평가 결론 : 논문에서 제안된 접근법은 샤프지수sharpe ratio(high risk, high return)와 누적수익cumulative returns 부문에서 더 나은 결과를 보여줬다.