Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Main Results #1

Closed
affromero opened this issue Oct 23, 2018 · 3 comments
Closed

Main Results #1

affromero opened this issue Oct 23, 2018 · 3 comments

Comments

@affromero
Copy link
Collaborator

1_000

1_000_random

1_000

Resultados finales: Circulos verdes significan inicio y final de interpolación de estilos, respectivamente.
Estos resultados son SIN regularizar el estilo. Me di cuenta que simplemente inyectando ruido aleatorio genera mejores imágenes, que si reconstruyo el estilo. Y lo más raro es que no hace mode collapse, al menos no muy grave. Es decir, no necesitamos un "style encoder". Esto va en contra de lo que se dice que inyectar ruido aleatorio hace que la red lo ignore si no se regulariza.

@parbela

@parbela
Copy link
Member

parbela commented Oct 23, 2018

@affromero: excelente! Me gusta Mr. Smith de capul.

Inclusive podríamos tener un ejemplo de una imagen de la película en la que originalmente haya muchos Mr. Smith iguales y luego los cambiamos a todos para confundir a Neo.

@affromero
Copy link
Collaborator Author

affromero commented Oct 27, 2018

@parbela
Mejoré sobre nuestros resultados:
Finalmente pude hacer funcionar la parte estocástica con el attention loss, los resultados hablan por sí solos:
024_5708_style_g
024_5708_style_g_attn

380_135_style_h
380_135_style_h_attn

Ya que tenemos tiempo, entrené edges2shoes y edges2handbags juntos, como un meta-dataset con 4 etiquetas: bordes_zapatos, bordes_bolsos, imagen_zapato, imagen_bolso (aquí sin el attention loss porque no tiene mucho sentido):
Aún va en la época 9, normalmente yo lo dejo hasta la 30 que es cuando ya se ve algo decente. A veces incluso hasta 70 épocas.
007_11775_style_b_random
007_11775_style_e_random

La parte cuantiativa ya la tengo la próxima semana porque estoy reentrenando DRIT y MUNIT para estas dos bases de datos y también para Yosemite, ya que MUNIT usa edges en la parte cuantitativa y DRIT usa Yosemite, entonces para poder hacer algo chévere en esta parte. Adicionalmente ya por fin tengo acceso a unas GPUs buenas en el cluster de ETH entonces ya estos baselines los tendré listos el lunes.

@parbela
Copy link
Member

parbela commented Oct 28, 2018

Excelente!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants