๋ณธ ํฌ์คํธ๋ ์ ๊ฐ ํด๋จผ์ค์ผ์ดํ ๊ธฐ์ ๋ธ๋ก๊ทธ์ ๋จผ์ ์์ฑํ๊ณ ์ฎ๊ธด ํฌ์คํธ์
๋๋ค.
๋ณธ ํฌ์คํธ์์๋ ์ด์ ์ ํฌ์คํ
ํ๋ GAN์ ํ์ฉํ์๊ณ , ์ด์ ์ ํฌ์คํ
ํ๋ pix2pix์ฒ๋ผ image to image translation์ ๊ตฌํํ์ง๋ง pix2pix์์๋ ํ์ง ๋ชปํ๋ ๊ฒ๋ค์ ์๋ก์ด ํ ์ ์๊ฒ ๋ง๋ ๋
ผ๋ฌธ์ ๋ํด์ ๋ฆฌ๋ทฐํ๋ ค๊ณ ํฉ๋๋ค. ์ด ํฌ์คํธ๋ ์ด์ ํฌ์คํธ GAN์ ๋ํ ์ดํด๋ฅผ ๋ฐํ์ผ๋ก ์งํํ ์์ ์ผ๋ก, ์ด์ ํฌ์คํธ์ ๋ํ ๋ด์ฉ์ย ์ด๊ณณ(GAN)์ ์ฐธ๊ณ ํ์๋ฉด ์ข์ต๋๋ค. ๋ฆฌ๋ทฐํ๋ ค๋ ๋
ผ๋ฌธ์ ์ ๋ชฉ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
โUnpaired Image-to-Image Translation using Cycle-Consistent Adversaria Networksโ
Objective
๋
ผ๋ฌธ์์ ๋ชฉ์ ์ผ๋ก ํ๊ณ ์๋ ๊ฒ์ย unpaired image to image translation framework์ ๊ตฌํํ๋ ๊ฒ์
๋๋ค. ๋ถ์ฐ ์ค๋ช
์ ํ์๋ฉด, ๊ธฐ์กด์ pix2pix ๊ฐ์ general-purposed image to image translation framework ๊ฐ์ ๊ฒฝ์ฐ์๋ conditional gan์ ์ด์ฉํ์ฌ input์ ํด๋น๋๋ output์ ํ์ฑํ๊ธฐ ์ํด input๊ณผ ํจ๊ป ground truth output์ ํ์ต ๋ฐ์ดํฐ๋ก ๋ฃ์ด์ฃผ์์ต๋๋ค. ํ์ง๋ง, ์ง๊ธ ์๊ฐํ cycleGAN์ ๊ฒฝ์ฐ์๋ input ๋ฐ์ดํฐ์ ๊ทธ์ ํด๋นํ๋ ground truth ๋ฐ์ดํฐ๊ฐ ์๋, input data์ ๊ทธ์๋ ๋์๋์ง ์๋ ์ฌ๋ฌ ground truth data๋ค์ ์ด์ฉํด ํ์ต์ ์งํํฉ๋๋ค. ์ด์ ์ selfie2anime์ ๋ํด์ ํฌ์คํ
์ ์งํํ ์ ์ด ์์๋๋ฐ, ์ด๊ฒ์ ์๋ก ๋ค์๋ฉด pix2pix ์ ๊ฒฝ์ฐ์๋ ํ์ต๋ฐ์ดํฐ๋ก selfie์ ์ด๋ฅผ ๋ณํํ anime ์ฌ์ง์ ์ด์ฉํด ๋์๊ด๊ณ๋ฅผ ํ์ตํ ๋ฐ๋ฉด, cycleGAN์์ ์งํํ๋ ค๋ ๊ฒ์ anime ์ฌ์ง๋ค์ ํน์ฑ(๋
ผ๋ฌธ์์๋ distribution์ ์๋ฏธํฉ๋๋ค)๋ค์ ์ด์ฉํด selfie ์ฌ์ง์ animeํ ์ํจ๋ค๊ณ ๋ณด์๋ฉด ๋ ๊ฒ ๊ฐ์ต๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก, ์ด๋ ํ ๋ฐฐ๊ฒฝ์ด๋ ย paired image ์์ด image to image translation์ ๊ตฌํํ ์ ์๋๋ก ํ๋ ๊ฒ์ด ๋
ผ๋ฌธ์ ๋ชฉํ์ด๋ฉฐ ์ด๋ฅผ ๋ฌ์ฑํจ์ผ๋ก์จ ๋ค์ํ ์์ฉ์ด ๊ฐ๋ฅํจ์ ๋
ผ๋ฌธ์์ ์ ์ํฉ๋๋ค.
Cycle Consistency
๋
ผ๋ฌธ์์๋ ์์ ์ค๋ช
ํ unpaired image to image translation์ ๊ตฌํํ๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ์ฌ๋ฌ ๊ด๋ จ ์ฐ๊ตฌ๋ค์ ์ ์ํฉ๋๋ค. ๊ฐ์ฅ ๋จผ์ image to image translation์ด๋ผ๋ ์ ์์ ์์ ์ธ๊ธํ๋ pix2pix์ ๊ตฌ์กฐ๋ฅผ ์ธ๊ธํ๋๋ฐ, ์ด๋ paired image to image translation์ด๊ธฐ ๋๋ฌธ์ ๊ฒฐ์ด ์ฝ๊ฐ ๋ค๋ฅด๋ค๊ณ ์ ์ํฉ๋๋ค. ๋ค์์ผ๋ก Zhou et al.๊ณผ Godard et al.์์ ์๊ฐ๋ cycle consistency loss์์ ์๊ฐ์ ๋ฐ์์ ๋ณํ๊ณผ ์ญ๋ณํ์ด ์๋ก์ ๋ํด์ ์ผ๋์ผ ๋์์ด ๋๋๋ก ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก ๊ธฐ์กด์ neural style transfer ๋ฐฉ๋ฒ(ํ ์ด๋ฏธ์ง๋ฅผ ๋ค๋ฅธ ์ด๋ฏธ์ง์ style์ ๊ฐ์ง๋๋ก ๋ณํฉ)์ ์ธ๊ธํ๋๋ฐ, ์ด๋ฏธ์ง ํ๋์ ๊ฐ๋ณ์ ์ธ transfer์ด ์๋ ๋ ์ด๋ฏธ์ง ์ง๋จ์ ๋ณํ ๊ด๊ณ๋ฅผ ํ์ต์์ผ ์ผ๋ฐ์ ์ธ translation์ ํ์ตํ๊ณ ์ถ์๊ธฐ ๋๋ฌธ์ ์ด ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ง ์์ต๋๋ค.
๋ฐ๋ผ์ ๋
ผ๋ฌธ์์๋ ์ด ์ธ ๊ฐ์ง ๋ฐฉ๋ฒ ์ค ๋ ๋ฒ์งธ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๊ฒ ๋ฉ๋๋ค. ์์ ์ค๋ช
ํ ๋ณํ๊ณผ ์ญ๋ณํ์ ๊ฑฐ์ณ ์๋์ ์ด๋ฏธ์ง๊ฐ ๋๋ ค๋ ํน์ฑ์ย cycle consistency๋ผ๊ณ ์นญํฉ๋๋ค.
Cost Function Design
์์ ์ค๋ช
๋๋ฆฐ cycle consistency๋ฅผ ์ฐพ๋๋ค๋ผ๋ ๊ฒ์ ์์์ ์ผ๋ก ์ ๊ฐํ๋ฉด ๋ ์ง๋จ X, Y์ ๋ํด์ G(F(Y)) โ X, F(G(X)) โ Y๋ฅผ ๋ง์กฑํ๋ ๋ mapping G: X โ Y ์ F: Yโ X๋ฅผ ์ฐพ๋๋ค๋ผ๊ณ ๋ณผ ์ ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ด๋ฌํ ๋ mapping์ ํ์ต์ํค๊ธฐ ์ํด ๋
ผ๋ฌธ์์๋ ๋ discriminator์ธ D_X, D_Y๋ฅผ ์ค์ ํฉ๋๋ค. ๊ธฐ์กด์ GAN๊ณผ๋ ์ฐจ๋ณ์ ์ธ ์๋ก์ด cost function์ ์ค๊ณํฉ๋๋ค.
๋
ผ๋ฌธ์์ ์ ์ํ cost function์ ํฌ๊ฒ ๋ ๊ฐ์ง loss์ ๊ฒฐํฉ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค. ์ฒซ ๋ฒ์งธ๋ GAN ๋
ผ๋ฌธ๋ฆฌ๋ทฐ์์๋ ์ธ๊ธํ๋ adversarial loss์
๋๋ค.
์ ์๊ณผ ๊ฐ์ด adversarial loss๋ฅผ ํํํ ์ ์๋๋ฐ, GAN ๋
ผ๋ฌธ๋ฆฌ๋ทฐ๋ฅผ ๋ณด์ ๋ถ๋ค์ ์ต์ํ์ค ๊ฒ์
๋๋ค. ๋ณด์ง ์์ผ์ ๋ถ๋ค์ ์ํด ๊ฐ๋จํ ๋ถ์ฐ์ค๋ช
์ ํ์๋ฉด, G๋ generator์ด์ G: X โ Y mapping ์ด๋ฉฐ, D_Y๋ G๋ก ์ธํด์ mapping๋ xโX๊ฐ real์ธ์ง fake์ธ์ง ๊ตฌ๋ณํ๋ discriminator์
๋๋ค. ๊ธฐ์กด์ GAN์ฒ๋ผ discriminator๋ real์ real๋ก fake๋ฅผ fake๋ก ์ ๋๋ก ๊ตฌ๋ณํ๋ ๊ฒ์ด ๋ชฉ์ ์ด๊ธฐ ๋๋ฌธ์ real case์ธ ์ฒซ ๋ฒ์งธ ํญ D_Y(y)๋ฅผ 1๋ก, fake case์ธ ๋ ๋ฒ์งธ ํญ ๋ด๋ถ์ D_Y(G(x))๋ฅผ 0์ผ๋ก ๊ตฌ๋ณํ๋ ๊ฒ์ด optimalํ case๋ผ๊ณ ๋ณผ ์ ์์ต๋๋ค. ์ด ๋๋ฌธ์ discriminator๋ L_GAN์ ์ต๋ํ์ํค๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํฉ๋๋ค.๋ฐ๋ฉด generator๋ fake๋ฅผ real์ธ ๊ฒ ๋ง๋ฅ ๋ง๋ค์ด ๋ด๋ ๊ฒ์ด ๋ชฉ์ ์ด๊ธฐ ๋๋ฌธ์ D_Y(G(x))๋ฅผ discriminator๊ฐ 1๋ก ๊ตฌ๋ณํ๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํฉ๋๋ค. ์ด ๋๋ฌธ์ generator๋ L_GAN์ ์ต์ํ์ํค๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก min_G max_D L_GAN์ ๊ตฌํ๋ ๊ฒ์ cost function์ผ๋ก ์ค์ ์ ํ์์ต๋๋ค.
์ฌ๊ธฐ๊น์ง๊ฐ ์ผ๋ฐ์ ์ธ GAN์ ๋ฒ์์ธ ๊ฒ์ ๋นํด์ cycleGAN์์๋ adversarial loss๋ก ํ ๊ฐ์ง๊ฐ ๋ ์ถ๊ฐ๋ฉ๋๋ค. ์ ๊ณผ์ ์ ๋ฐ๋ ๊ณผ์ ์
๋๋ค. ์์ ์์ G: X โ Y mapping generator์ D_Y discriminator๋ฅผ ํ์ตํ๊ธฐ ์ํ loss์๋ค๋ฉด, cycle consistency๋ฅผ ์ํด์ ๋
ผ๋ฌธ์์๋ F: Yโ X mapping generator์ D_X discriminator ๋ํ ํ์ต์ ์งํํด์ผ ํฉ๋๋ค. ์ด๋ฅผ ์ํด์ ๋
ผ๋ฌธ์์๋ ์์ ์๊ฐํ๋ GAN loss์ ๋ฐ๋๊ณผ์ ์ ๋ฐ์ํ๋ L_GAN(F, D_X, Y, X)๋ฅผ adversarial loss๋ก ์ถ๊ฐํ์ฌ ์ค๊ณ๋ฅผ ์งํํ์ต๋๋ค.
์ด๋ ๊ฒ ๊น์ง๋ง ์งํํ๋ค๋ฉด G์ F๋ฅผ ๊ฐ๊ฐ ํ์ต ์ํฌ ์ ์๋ ์ถฉ๋ถํ ๊ทผ๊ฑฐ๋ฅผ cost function์ ํตํด์ ์ค๊ณํ ๊ฒ์
๋๋ค. ํ์ง๋ง, ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ์ ์ด๊ธฐ์์ ์ค๋ช
์ ๋๋ ธ๋ฏ์ด, cycle consistency๋ฅผ cost function์ ํตํด์ ๋ฐ์ํ๊ธฐ ์ํด์๋ cost function์ ์ถ๊ฐ์ ์ธ ํญ๋ชฉ์ ๊ธฐ์ฌ๊ฐ ํ์ํ์ต๋๋ค. ๊ทธ๋ ์ง ์๋ค๋ฉด input domain์ด target domain์ distribution๋ง ๊ฐ์ง ์ฑ๋ก randomํ๊ฒ mapping ๋์ด ๋ค์ ์ญ์ผ๋ก mapping ํ์ ์ ์๋์ image๋ก ๋์์ค์ง ์๊ฒ ๋ฉ๋๋ค. ์ด๋ฌํ ์ํฉ์ ํด๊ฒฐํ๊ธฐ ์ํด์ ๋
ผ๋ฌธ์์๋ cycle consistency loss๋ฅผ ์ถ๊ฐํฉ๋๋ค.
์์ ์์ด cycle consistency๋ฅผ ํ์ต์ํค๊ธฐ ์ํ ํญ์ผ๋ก ์ถ๊ฐํ cycle consistency loss์
๋๋ค. p_data(x) distribution์ ๋ฐ๋ฅด๋ x๋ค์ ๋ํด์ F(G(x))์ x ์ฌ์ด์ L1 loss๋ค์ mean๊ณผ p_data(y) distribution์ ๋ฐ๋ฅด๋ y๋ค์ ๋ํด์ G(F(y))์ y์ฌ์ด์ L1 loss๋ค์ mean์ ๋ฐ์ํ์ฌ cycle consistency loss๋ฅผ ์ต์ํํ๋ ํํ๋ก ํ์ต์ ์งํ์ํค๊ณ ์ ํ ๊ฒ์
๋๋ค.
์ด๋ค์ ์ข
ํฉํ์ฌ ์ต์ข
์ ์ผ๋ก ๋
ผ๋ฌธ์์ ์ ์ํ cost function์ ์๋์ ๊ฐ์ต๋๋ค.
ฮป๋ฅผ ์ค์ ํ ๊ฒ์ ์์ ์ค๋ช
ํ adversarial loss์ cycle consistency loss ๊ฐ์ ์ค์๋๋ฅผ ฮป๋ฅผ ํตํด์ ์กฐ์ ํ๊ณ ์ถ์ด์ ์ฌ์ฉ์ ํ ๊ฒ์
๋๋ค. ์ cost function์ ํตํด์ ์ต์ข
์ ์ผ๋ก ํ์ต ํ๊ณ ์ถ์ optimalํ mapping G*, F*์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
Network Architecture
๋คํธ์ํฌ์ ๊ตฌ์กฐ๋ ๋
ผ๋ฌธ์์ ์์ธํ ์ง๊ณ ๋์ด๊ฐ์ง๋ ์์ง๋ง, ๋ถ๋ก์ ์ฐ์ฌ์๋ ๋ด์ฉ์ ๊ฐ๋ตํ ์์ฝํด์ ์ ๋ฌ๋๋ฆฌ์๋ฉด, ํฌ๊ฒ๋ Johnson et al.์ ๋คํธ์ํฌ ๊ตฌ์กฐ๋ฅผ ๋ฐ๋ผ์ ์ค๊ณ๋ฅผ ์งํํ์ต๋๋ค.
Generator์ ๊ฒฝ์ฐ, ํฌ๊ฒ ๋ ๊ฐ์ง ๊ตฌ์กฐ 6 residual block structure, 9 residual block structure๊ฐ ์กด์ฌํ๋๋ฐ, ๋ ๊ตฌ์กฐ ๋ชจ๋ convolution-instance normalization-relu์ ํด๋น๋๋ dk, ๊ทธ๋ฆฌ๊ณ residual block์ ํด๋น๋๋ Rk, ๊ทธ๋ฆฌ๊ณ upsampling์ ์ํ fractional strided convolution-instance normalization-relu layer์ธ uk๋ค๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค.
Discriminator์ ๊ฒฝ์ฐ 70x70 patchGAN์ ์ฌ์ฉํ์ต๋๋ค. ์ด๋ convolution-instance normalization-leaky relu๋ก ๊ตฌ์ฑ๋ ck๋ค๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค.
์์ธํ ๋คํธ์ํฌ ์ํคํ
์ณ์ ๋ํด์ ๋
ผ๋ฌธ์์ ์ง์ ์ ์ผ๋ก ๋ค๋ฃจ์ง ์๊ธฐ ๋๋ฌธ์ ๊ถ๊ธํ์ ๋ถ๋ค์ ๋
ผ๋ฌธ 18 ์ชฝ์ Appendix๋ฅผ ๋ณด์๋ ๊ฒ์ ์ถ์ฒ๋๋ฆฝ๋๋ค!
Evaluation
๋
ผ๋ฌธ์์ ํ์ตํ mapping์ ํ๊ฐํ๊ธฐ ์ํด ์ฌ์ฉํ ์ฒ๋๊ฐ ๊ต์ฅํ ๋ค์ํ๊ฒ ์กด์ฌํฉ๋๋ค. ํฌ๊ฒ 4๊ฐ์ง๋ก ๋๋๋ฉด ๋ค์๊ณผ ๊ฐ์ด ์ ๋ฆฌํ ์ ์์ต๋๋ค.
1. Comparison against baselines2. Anaylsis of the loss function3. Image reconstruction quality4. Additional results on paired datatsets
๋จผ์ ์ฒซ ๋ฒ์งธ๋ก,ย Comparison against baselines๋ ๊ธฐ์กด์ ๋ค๋ฅธ ๋คํธ์ํฌ + cost function์ ๋นํด์ ๋
ผ๋ฌธ์ ๋คํธ์ํฌ + cost function์ ๊ตฌ์กฐ๊ฐ ๊ฐ์ง๋ ์ฑ๋ฅ์ ์ธ ์ฅ์ ์ ๋ณด๋ ์ฒ๋์
๋๋ค. ์ด ์ฒ๋๋ ๊ฑฐ์ ๋ชจ๋ ๋
ผ๋ฌธ๋ค์์ ๊ธฐ๋ณธ์ ์ผ๋ก ์ ์ํ๋ ๊ณตํต์ ์ธ ์ฒ๋์ด๊ณ , ์๊ฐ๋๋ฆฌ๋ ๋
ผ๋ฌธ์์๋ ๋ฑ์ฅํ๋ ๋ชจ๋ ํ์ ์ด ๋ด์ฉ์ ๋ด๊ณ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ด์ ๋ํ ์ถ๊ฐ์ ์ธ ์ธ๊ธ์ ํ์ง ์๋๋ก ํ๊ฒ ์ต๋๋ค. ๋ค๋ง ์์ฃผ ๋ฑ์ฅํ๋ test method์ธ AMT์ FCN scores์ ๋ํ ๋น๊ต๋ฅผ ์งํํ ๋ด์ฉ์ ๋ํด์ ํ๋ฅผ ์ฒจ๋ถํ๊ฒ ์ต๋๋ค.
AMT โreal vs fakeโ test
FCN scores
AMT test๋ real๊ณผ fake ์ด๋ฏธ์ง๋ฅผ ๊ตฌ๋ณํ๋ GAN์ ๋ํ test๋ก๋ ์ ์๋ ค์ ธ ์๋๋ฐ, ์ค์ ์ฌ๋๋ค์ ๋์์ผ๋ก real๊ณผ fake๋ฅผ ๊ตฌ๋ณํ๊ฒ ํ
์คํธ๋ฅผ ์ํค๊ณ , ์ผ๋ง๋ ๋ง์ fake ์ด๋ฏธ์ง๋ฅผ real๋ก ์์ด๋๋์ ์ด์ ์ด ๋ง์ถ์ด์ ธ ์๋ ๊ฒฐ๊ณผ์
๋๋ค. ๊ฒฐ๊ณผ๋ ์์์ ๋ณด์๋ ๋ฐ์ ๊ฐ์ด ๋
ผ๋ฌธ์ ์ํคํ
์ณ๊ฐ ๊ฑฐ์ 1/4์ ๊ฒฝ์ฐ๋ก ์ฌ๋๋ค์ ์์ผ ์ ์์๋ค๋ผ๊ณ ๋ณด์๋ฉด ๋ ๊ฒ ๊ฐ์ต๋๋ค.
FCN scores๋ AMT test์๋ ๋ค๋ฅด๊ฒ ์ธ๊ฐ์ด ์ง์ ํ
์คํธ์ ์ฐธ์ฌํ์ง ์์ต๋๋ค. FCN scores๋ semantic segmentation algorithm์ ํ๊ฐํ๋ ๊ฒ์ผ๋ก๋ ์ ๋ช
ํ๋ฐ, ์ด๋ค ์ด๋ฏธ์ง๋ฅผ ์ํ๋ label๋ก ์ ์ธ์ํ๋์ง๋ฅผ ์ฒ๋๋ก ํ๊ฐ๋ฅผ ์งํํ๊ฒ ๋ฉ๋๋ค. ์ด ๊ฒฝ์ฐ labels->photo์ image translation์์ photo๋ฅผ ์ํ๋ ๊ฒ์ผ๋ก ์ ๋ถ์ํด ๋๋์ง๋ฅผ ๋ณด๊ธฐ ์ํ ์ฌ์ฉํ๊ณ , ๊ทธ ๊ฒฐ๊ณผ ์ด์ ์ ์๊ฐ๋๋ ธ๋ pix2pix์ ๊ทธ๋๋ง ๊ทผ์ ํ ์์น๋ฅผ ๋ฝ์๋๋ค๋ ๊ฒ์ ์๋ฏธ๊ฐ ์๋ค๊ณ ๋ณด์๋ฉด ๋ ๊ฒ ๊ฐ์ต๋๋ค.
๋ค์์ผ๋กย Anaylsis of the loss functionย ์ ์์ ์๊ฐ๋๋ฆฐ cost function์ ์๊ฐํ ๊ณผ์ ์ด ์ ๋๋ก ์๋ฏธ๋ฅผ ๊ฐ์ง๋์ง ํ๊ฐ๋ฅผ ํ๊ธฐ ์ํ ์ฒ๋์
๋๋ค. ์ด๋ฅผ ์ํด์ ๋น๊ตํ๋ ๋์๋ค๋ก ์ต์ข
์ ์ผ๋ก ๋
ผ๋ฌธ์์ ์ค๊ณํ cost function์์ ํ๋ ๋ ์ฉ ํญ๋ชฉ์ ์ ๊ฑฐํด๊ฐ๋ฉด์ cost function์ ์๋ก์ด ๋ง๋ค๊ณ ๊ฐ์ task๋ฅผ ์๋ํ์ฌ ๋น๊ตํ๊ฒ ๋ฉ๋๋ค. ๊ทธ task๋ก ์ ํํ์ฌ ์ ์ํ ๊ฒ์ด labels->photos์ FCN scores ์ photos->labels์ classification performance์
๋๋ค.
FCN scores
Classification performance
๊ทธ ๊ฒฐ๊ณผ๊ฐ ์์ ๋ณด์ด์๋ ํ์ ์ ์ํ ๊ฐ๋ค์
๋๋ค. GAN loss ์์ฒด๋ฅผ ์์ ๋ ๊ฒ๊ณผ cycle consistency๋ฅผ ์์ ๋ ๊ฒ ๋ชจ๋ performance์ ์๋นํ ์ ํ๋ฅผ ๊ฐ์ ธ์๋ค๋ ์ฌ์ค์ ํ์ธํ ์ ์์ต๋๋ค. forward cycle๊ณผ backward cycle์ด๋ผ ์ ํ์๋ ๊ฒ๋ค์ ์์ ์ธ๊ธํ cycle consistency loss์์ ๊ฐ๊ฐ ํ ๊ฐ์ ํญ๋ง ํฌํจํ๋ค๋ ๊ฒ์
๋๋ค.
๋ค์์ผ๋กย Image reconstruction qualityย ์ cycle consistency๋ฅผ ํ์ธํ๋ ๋ถ๋ถ์
๋๋ค. ๊ทธ๋ฐ๋ฐ ๋
ผ๋ฌธ์์ ์ด๋ฅผ ์ ๋์ ์ผ๋ก ๋ถ์ํ์ง ์๊ณ ์ ์ฑ์ ์ผ๋ก ์ฌ์ง์ ํตํด์ reconstructed image์ input ์ด๋ฏธ์ง์ ์ฆ์ ์ ์ฌ์ฑ์ ์ค๋ช
ํฉ๋๋ค. ์๋๋ ๋
ผ๋ฌธ์์ ์์๋ก ๋ ์ฌ์ง๋ค์
๋๋ค.
์ด์ ๋๋ถ์ดย Additional results on paired datatsetsย ์์ paired learning dataset์ ๊ฐ์ง pix2pix์์ ์งํํ๋ dataset์ ๋ค์ด pix2pix์์ ์งํํ ์ ์์๋ ์์
๋ค์ ๋๊ฐ์ด ์งํํ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค. ์ฆ, ๋
ผ๋ฌธ์์ ์๊ฐํ ๋คํธ์ํฌ๊ฐ ๋ generalํ ์์
๋ฌผ์ด์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค. ์๋๋ ๊ทธ ๊ฒฐ๊ณผ์
๋๋ค.
Application
๋ง์ง๋ง์ผ๋ก ๋
ผ๋ฌธ์์ evalutaiton part์์ ์๊ฐํ๋ ๊ฒ์ ๊ต์ฅํ ๋ค์ํ ์์
๋ค์ด ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ฃผ๋ ์์
๋ฌผ๋ค์ด์์ต๋๋ค. ์๋นํ ํฅ๋ฏธ๋ก์ด ๊ฒ์ด ๋ง์์ ๋ช ๊ฐ์ง๋ง ๊ฐ๋จํ ์๊ฐํด๋๋ฆฌ๋ ค๊ณ ํฉ๋๋ค! ์ด ๋ถ๋ถ์ ์ด๋ฐ ๊ฒ๋ค๋ ๊ฐ๋ฅํ๊ตฌ๋ ์ ๋๋ก๋ง ๋ด์ฃผ์
๋ ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
Style transfer
input image๋ฅผ ๋ค์ํ ํ๊ฐ์ ์คํ์ผ์ ๋ง๊ฒ ๋ฐ๊พธ๋ ์์
์
๋๋ค.
Object transfiguration
object๋ฅผ ํํ๊ฐ ๋น์ทํ ๋ค๋ฅธ ๋ฌด์ธ๊ฐ๋ก ๋ฐ๊พธ๋ ์์
์
๋๋ค.
painting2photo
painting์ photo๋ก ๋ฐ๊พธ๋ ์์
์
๋๋ค.
photo enhancement
์ฌ์ง์ ์ ๋ช
ํ๊ฒ ๋ฐ๊พธ๋ ์์
์
๋๋ค.(DSLR์ style์ ๋ฐ๋ผํ๋ค๊ณ ๋ณด์๋ฉด ๋ฉ๋๋ค)
Conclusion
์ผ๋ง์ ์ GAN์ ์ญ์ฌ์ ๋ฐ์ ์ด๋ผ๋ ๊ธ์ ๋ณธ ์ ์์๋๋ฐ ์๋นํ ํฅ๋ฏธ๋ก์์ ์ฝ๊ฒ ๋ ๋
ผ๋ฌธ cycleGAN์ ๋ฆฌ๋ทฐ์์ต๋๋ค. GAN์ด ์ฒ์ ๋ฑ์ฅํ์ ๋๋งํผ์ ์ถฉ๊ฒฉ์ ์๋์ง๋ง, ๊ทธ๋๋ unpaired image translation์์ ํฐ ์ญํ ์ ํด ์ฃผ์๋ค๊ณ ์๊ฐ์ด ๋ญ๋๋ค. ํนํ application ์ชฝ์์ ๊ต์ฅํ ๋ค์ํ ์ ์ฌ์ฑ์ ๊ฐ์ง๊ณ ์๊ณ , ๊ทธ๊ฒ๋ค์ ์ฒ์ ๋ณด๋ฉด์ ์ฌ๋ฏธ์๊ฒ ์ฝ์ ์ ์์๋ ๊ฒ ๊ฐ์ต๋๋ค. ํฅ๋ฏธ๋ก์ด ์ฃผ์ ์ ๋ค์ํ ์์ฉ์ ๋
ผ๋ฌธ์ ์ฐพ๊ณ ์ถ์ผ์๋ฉด์ GAN์ ๊ด์ฌ์ด ์๋ค ํ๋ฉด ์ฝ์ด๋ณด์๋ ๊ฒ์ ์ถ์ฒ๋๋ฆฝ๋๋ค!