<a href="https://colab.research.google.com/github/NahuelCostaCortez/AI_notebooks/blob/main/3D_image_generationES.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 💻 Generación de Imágenes 3D.
<small><i>**Autores**: Shih, Meng-Li and Su, Shih-Yang and Kopf, Johannes and Huang, Jia-Bin, ([Web del proyecto](https://shihmengli.github.io/3D-Photo-Inpainting/))</i><br>
<i>**Adaptación del cuaderno**: Carlos Santana Vega (**Más sobre IA!** - [DotCSV](https://www.youtube.com/c/dotcsv))</i></small>

<img width=300px src='https://i.imgur.com/fLM3rkW.gif'>
<img width=300px src='https://i.imgur.com/n95djqo.gif'>



---



📹 **Video tutorial:** Puedes ver el siguiente [vídeo](https://www.instagram.com/tv/CK4Tgm9oWb4/) para entender mejor el funcionamiento del proyecto, con todos los pasos explicados.


---



### 💡 **Introducción**

¿Alguna vez has soñado con poder convertir en muy pocos clicks de ratón tus fotos planas, bidimensionales, en hermosas reconstrucciones 3D? Seguramente no, es un sueño raro... **¡Pero igualmente, esto es posible!**  *Rápido, sencillo y a coste cero.* 💸

**Completa los pasos que encontrarás en este Notebook** *(así se llama a este soporte de documento que estás leyendo ahora mismo, donde texto y código en Python se intercalan)* y podrás obtener resultados similares. Pero antes, dejame que responda a algunas preguntas que te pueden estar rondando por la cabeza...

**🔰 ¡Importante!** Para que la ejecución no se demore más de lo que debería, comprueba en la pestañá *'Entorno de ejecución' > 'Cambiar tipo de entorno de ejecución'* que en el menú desplegable *'Acelerador por hardware'* está **GPU** seleccionado.

<br>


❓ - **¿De qué va esto? ¿Cómo funciona?**

El código que te va a permitir convertir tus imágenes en vídeos con profundidad 3D, es el trabajo resultante de un proyecto de investigación desarrollado [por estos autores](https://shihmengli.github.io/3D-Photo-Inpainting/). Se trata de un proyecto de **Machine Learning** que usando avanzados algoritmos de visión por ordenador consigue automáticamente calcular la profundidad 3D de tu escena, y sintetizar los posibles huecos que al mover la cámara surjan. **Todo automáticamente y sin intervención humana.** Es lo que tiene la Inteligencia Artificial, que mola mucho.

Si quieres saber más sobre IA, un buen punto de comienzo es [mi canal de Youtube](https://www.youtube.com/c/dotcsv).

<br>

❓ - **Y... ¿Es gratis?**

Sí. Por un lado los autores han puesto a disposición de cualquiera su código con el fin de que pueda ser utilizado y que esta línea de investigación pueda seguir avanzando. Por otra parte, normalmente la ejecución de estos algoritmos requeriría contar con un equipo informático potente *(una buena GPU, memoria, etc)*, pero esto no es problema, porque en este caso estamos utilizando Google Colab (esta web), que nos permite ejecutar este código gratuitamente en la infraestructura que Google nos facilita. Así que... todo gratis!

<br>

❓ - **¿Tengo que saber algo de programación?**

Nada. En los siguientes pasos irás ejecutando celdas con código que estarán escupiendo mucho texto que ni entenderás, ni hace falta que entiendas. Simplemente sigue mis pasos, y tendrás rápidamente tu resultado.


### 1️⃣ **Primer Paso:** ¡Puesta a punto!

**¡Comencemos!** Lo único que te tienes que encargar es de ir ejecutando las siguientes celdas en orden y seguir las intrucciones. Para ejecutar una celda, situate encima de ella y clicka en el botón de ▶ que aparece en la esquina superior izquierda. Durante la ejecución verás que ese icono mostrará un círculo dando vueltas, y cuando haya finalizado mostrará un número que indicará que la ejecución ya ha terminado.

**1.- Empieza ejecutando la siguiente celda.** - *(Tiempo estimado: 3-4 min)* Esto lo que hará será automáticamente instalar todas las librerías necesarias para hacer funcionar al sistema, y también descargará de GitHub el proyecto.

In [None]:
### TIEMPO APROXIMADO: 3-4 minutos ###

# Preparación del entorno.

!pip3 install torch==1.4.0+cu100 torchvision==0.5.0+cu100 -f https://download.pytorch.org/whl/torch_stable.html
!pip3 install opencv-python==4.2.0.32
!pip3 install vispy==0.6.4
!pip3 install moviepy==1.0.2
!pip3 install transforms3d==0.3.1
!pip3 install networkx==2.3
!sudo apt install sed

# Descarga y configuración del modelo preentrenado.

%cd /content/
!git clone https://github.com/vt-vl-lab/3d-photo-inpainting.git
%cd 3d-photo-inpainting
!sh download.sh
!sed -i 's/offscreen_rendering: True/offscreen_rendering: False/g' argument.yml

Looking in links: https://download.pytorch.org/whl/torch_stable.html
Collecting torch==1.4.0+cu100
[?25l  Downloading https://download.pytorch.org/whl/cu100/torch-1.4.0%2Bcu100-cp36-cp36m-linux_x86_64.whl (723.9MB)
[K     |████████████████████████████████| 723.9MB 25kB/s 
[?25hCollecting torchvision==0.5.0+cu100
[?25l  Downloading https://download.pytorch.org/whl/cu100/torchvision-0.5.0%2Bcu100-cp36-cp36m-linux_x86_64.whl (4.0MB)
[K     |████████████████████████████████| 4.1MB 27.2MB/s 
Installing collected packages: torch, torchvision
  Found existing installation: torch 1.7.0+cu101
    Uninstalling torch-1.7.0+cu101:
      Successfully uninstalled torch-1.7.0+cu101
  Found existing installation: torchvision 0.8.1+cu101


### 2️⃣ **Segundo Paso:** Sube tus imágenes.

**2.a - (opcional) Borra las imágenes subidas anteriormente.** - Si ya has subido imágenes con anterioridad, o si quieres borrar la imagen que por defecto viene en el proyecto *(The First Moonwalk)* , puedes ejecutar la siguiente celda para borrar todas las imágenes y que estas no se procesen.

In [None]:
# Borrar imágenes subidas.
!rm /content/3d-photo-inpainting/image/*

**2.b - Sube la imagen o imágenes que quieras convertir a 3D.** - Ejecuta la siguiente celda, y verás que te aparecerá una opción para subir un imagen. Una vez aparezca el botón de 'Elegir archivos', púlsalo para elegir una imagen de tu ordenador. Una vez seleccionada la celda deberá de finalizar su ejecución y se te indicará en texto que tu imagen ha sido guardada.


🔰 **Importante:** Comprueba que la extensión de las imágenes que subas estén en formato **.jpg** (No válido *.jpeg*, *.JPG*, ...)


```
Saving tu_imagen.jpg to tu_imagen.jpg
```

**Puedes repetir este paso para subir tantas imágenes como quieras procesar.** Eso sí, evita subir imágenes de gran tamaño y/o resolución, ya que el sistema podría fallar. 🧨


In [None]:
# Subida de la imagen o imágenes.

!rm /content/3d-photo-inpainting/image/moon.jpg

%cd image
from google.colab import files
uploaded = files.upload()
for fn in uploaded.keys():
  print('User uploaded file "{name}" with length {length} bytes'.format(
      name=fn, length=len(uploaded[fn])))
%cd ..

### 3️⃣ **Tercer Paso:** ¡A procesar!

**3 - Procesamos las imágenes!** - En este punto, ejecutando la siguiente celda, el sistema empezará a procesar todas las imágenes que haya subido. Este proceso es el más lento y puede demorarse unos 5 minutos por imágenes. *Buen momento para irte a tomar un café* ☕


In [None]:
!rm /content/3d-photo-inpainting/video/*
!rm /content/3d-photo-inpainting/depth/*
!rm /content/3d-photo-inpainting/mesh/*
!python main.py --config argument.yml

### 4️⃣ **Cuarto Paso:** Descarga tus vídeos.

Una vez se hayan procesado las imágenes, ejecutando la siguiente celda obtendrás una previsualización de los vídeos generados y podrás ir descargándolos uno a uno clickando en el botón de descarga. 

Por cada imagen obtendrás 4 vídeos con diferentes técnicas de cámara (***Circle***, ***Dolly Zoom***, ***Swing*** y ***Zoom-in***).

In [None]:
from IPython.display import HTML
from google.colab    import output
from base64          import b64encode
import uuid
import copy

video_path =  '/content/3d-photo-inpainting/video/'
urls = !ls -1 '/content/3d-photo-inpainting/video/'

class InvokeButton(object):
  def __init__(self, title, callback):
    self._title = title
    self._callback = callback

  def _repr_html_(self):
    callback_id = 'button-' + str(uuid.uuid4())
    output.register_callback(callback_id, self._callback)

    template = """<button id="{callback_id}">{title}</button>
        <script>
          document.querySelector("#{callback_id}").onclick = (e) => {{
            google.colab.kernel.invokeFunction('{callback_id}', [], {{}})
            e.preventDefault();
          }};
        </script>"""
    html = template.format(title=self._title, callback_id=callback_id)
    return str(html)

for idx, url in enumerate(urls):

  mp4 = open(video_path + url,'rb').read()
  data_url = "data:video/mp4;base64," + b64encode(mp4).decode()
  display(InvokeButton(str((idx+1)) + "/" + str(len(urls)) + " ⬇ Descargar '" + url + "'",
                       lambda u=url: files.download(video_path + u)))
  display(HTML("""
  <video width=500 controls>
        <source src="%s" type="video/mp4">
  </video>
  """ % (data_url)))