questionet

StackGAN: Text to Photo-Realistic Image Synthesis With Stacked Generative Adversarial Networks 본문

Deep learning/논문 abstract

StackGAN: Text to Photo-Realistic Image Synthesis With Stacked Generative Adversarial Networks

orthanc 2021. 4. 5. 16:26

개발배경 : 기존의 모델들은 주어진 text decription을 기반으로 이미지를 생성해낼 때
              description의 내용을 충분히 살리지 못함.

stackGAN :
 특정 text description에 상응하는 256x256 규격의 이미지를 생성해 낸다.

특징1 : sketch-refinement process를 사용
  stage1: 주어진 decription에 기반해 사물의 기초적인 형태와 색상을 sketch하여 저화질 이미지 생성
  stage2: stage1의 결과물을 바탕으로 refinement process를 거쳐 고화질의 이미지 생성

특징2: Conditioning Augmentation 기법을 사용
  사용 목적 : 생성된 결과물의 다양성과 conditional_GAN 학습의 안정성을 향상시키기 위해

encourages smoothness in the latent conditioning manifold
용어
latent : text description vecrtor를 의미, latent vector
conditioning : description에서 이미지 생성에 도움이 될 수 있는 단어들, bird is white 같은.
manifold : 분포, 데이터가 가진 분포

Comments