questionet
StackGAN: Text to Photo-Realistic Image Synthesis With Stacked Generative Adversarial Networks 본문
Deep learning/논문 abstract
StackGAN: Text to Photo-Realistic Image Synthesis With Stacked Generative Adversarial Networks
orthanc 2021. 4. 5. 16:26개발배경 : 기존의 모델들은 주어진 text decription을 기반으로 이미지를 생성해낼 때
description의 내용을 충분히 살리지 못함.
stackGAN : 특정 text description에 상응하는 256x256 규격의 이미지를 생성해 낸다.
특징1 : sketch-refinement process를 사용
stage1: 주어진 decription에 기반해 사물의 기초적인 형태와 색상을 sketch하여 저화질 이미지 생성
stage2: stage1의 결과물을 바탕으로 refinement process를 거쳐 고화질의 이미지 생성
특징2: Conditioning Augmentation 기법을 사용
사용 목적 : 생성된 결과물의 다양성과 conditional_GAN 학습의 안정성을 향상시키기 위해
encourages smoothness in the latent conditioning manifold
용어
latent : text description vecrtor를 의미, latent vector
conditioning : description에서 이미지 생성에 도움이 될 수 있는 단어들, bird is white 같은.
manifold : 분포, 데이터가 가진 분포

'Deep learning > 논문 abstract' 카테고리의 다른 글
Comments