목록전체 글 (91)
questionet

참고 1 d2.naver.com/helloworld/0315536 2 파이썬 알고리즘 인터뷰 3 알고리즘 라이프 4 hackernoon.com/timsort-the-fastest-sorting-algorithm-youve-never-heard-of-36b28417f399 5 docs.python.org 파이썬의 정렬 메서드는 크게 두 가지다. 1) 리스트 객체에서만 쓸 수 있는 sort() 2) 모든 이터러블 객체에 쓸 수 있는 sorted() sort()의 특징 1. 리스트에서만 쓸 수 있다. 2. 리스트는 mutable 한 객체이므로 sort() 메서드를 사용하면, 기존 리스트는 정렬된 리스트로 대체된다. # 기본은 오름차순 정렬 data = [2, 3, 5, 54, 123, 2, 3, 1, 2, 4..
자연어는 텍스트 함축textual entailment, 질의응답question answering, 의미 유사도 평가semantic similarity assessment 문서 분류 등 광범위한 태스크 래인지를 가진다. 레이블되지 않은 텍스트는 엄청 많은 반면 특정 태스크를 위해 레이블된 자료들은 드물다 We demonstrate that large gains on these tasks can be realized by generative pre-raining of a language model on a diverse corpus of unlabeled text, followed by discriminative fine-tuning on each specific task. 우리는 레이블되지 않은 다양한 종..
Quantitative investment 양적 투자 일정 기간 동안 돈 안 잃고 최대한 많이 버는 게 목적이다. 양적 투자 분야에서 인공지능 기술을 도입하고 있는데 우리는 Qlib이란 기술을 설계해봤다. 양적 투자에 인공지능 기술이 성공적으로 안착되려면 infrastructure upgrade가 요구된다 어떤 업그레이드냐면 to accommodate the renovated workflow 여기서 Infrastructure 가 뭘 가리키는 건지? Workflow는 뭐지? trading signals을 포착하는 능력, 어떤 factor들로부터 그걸 통해 거래 전략을 수립하는 것 factor가 매우 많은데 여기서 factor는 머신러닝에서의 feature에 상응 된다 data-driven의 의미 AI는 주..
COCO-GAN: Generation by Parts via Conditional Coordinating 인간은 자신을 둘러싼 환경의 일부분과만 상호작용할 수 있다. 생물학적 한계로인해. 그래서 그 환경의 부분들을 연속적으로 관찰해서 공간정보를 추론한다. 이러한 인간 인지 특성에서 영감을 받아 머신러닝 시 연산비용 문제를 고려해 conditional coordinate GAN을 제안해보려 한다. 생성자는 조건으로 주어지는 공간좌표에 기반해 부분 이미지를 생성해내고 판별자는 global coherence, local appearance, and edge-crossing continuity 를 바탕으로 부분들의 조합으로 만들어진 이미지의 사실성을 판별한다? global coherence, local-appe..
algorithmic trading (컴퓨터 프로그램으로 하는 주식거래)을 포함한 많은 영역에서 강화학습이 적용되고 있다. 이 논문은 증권거래소에서의 주식매매가 마르코프 성질을 가진 게임(상태, 행위, 보상을 주체로 하는 강화학습)으로 해석될 수 있다는 걸 보여주고자 한다 this is based on the 강화학습 기법인듯 method with the use of several neural network architectures. The application of recurrent layers in this approach is investigated 사용된 딥러닝 모델은 RNN(LSTM) 실험은 익명화된 데이터로 수행되었다. 가장 좋은 성능을 낸 기법은 RTS Index futures (MOEX:R..
레이어를 깊이 쌓는 CNN은 최근 몇년새 이미지 인식 문제해결방법에 많은 진전을 보였다 특히 인셉션 기법은 상대적으로 적은 계산비용으로 좋은 성능을 내고 있다. 최근 residual connection 잔차 연결 기법도 SOTA 성능을 내고 있는데 이 기법은 인셉셥-v3네트워크의 성능과 유사하다. 그럼 잔차연결과 인셉션 기법을 합치면 더 좋은 성능을 낼 수 있을까? 우리는 잔차연결기법이 인셉션 네트워크의 훈련을 상당히 가속화 해준다는 경험적인 증거를 제시하고자 한다. 학습속도 개선이 가능했다. 성능에 개선이 있는 건 아니다. 아주 와이드한 잔차 인셉션 네트워크(레지듀얼을 더 추가한 인셉션 네트워크)에서 학습이 안정화될 수 있게 하는 방법을 보여주려 한다.
일단 제목이 biased code가 아닌 coded bias라는 게 곱씹어 볼 만하다. 넷플릭스에서 한국어로 번역된 제목은 '알고리즘의 편견'인데 원제의 뉘앙스를 죽이는 번역같다. 똑같은 얘기를 몇번이나 반복해 1시간이면 충분했을 러닝타임이 90분이나 되는 것과 중간중간 마이크로소프트의 tei가 오글거리는 대사를 읊는 것만 빼면 비판적인 몇몇 다큐들이 굉장히 선동적이고, 확증편향에 사로잡혀 있으며, 음모론의 성격마저 띤다는 걸 염두에 두고 최대한 객관적인 시선으로 보았음에도 대부분의 주장에 동의할만한 괜찮은 다큐였다. 전체 줄거리 리뷰는 세 마디로 짧게 하고 다큐에서 충분히 짚어지고 고찰되지 않은 질문에 대한 나의 생각을 적어보겠다. 1. 알고리즘 자체는 편향되지 않고 될 수도 없다 수학이 발명된 거냐 ..