#Máster en Big Data y Data Science: Ciencia e Ingeniería de Datos
### ASIGNATURA: Indexación, búsqueda y análisis en repositorios multimedia
### PARTE: Multimedia (imagen, video)
### Práctica 1: Introducción al diseño de redes neuronales convolucionales con Pytorch mediante Google Colaboratory

---

Autor: Juan C. SanMiguel (juancarlos.sanmiguel@uam.es), Universidad Autónoma de Madrid


# 1. Setup
En este script interativo de python aprendera como utilizar la herramienta Google Colaboratory https://colab.research.google.com 

Colaboratory permite utilizar gratuitamente una máquina virtual con Ubuntu que proporciona un entorno de Jupyter para ejecutar interactivamente instrucciones en una consola de Python. 

Información adicional (política de uso, restricciones,...) disponible en https://research.google.com/colaboratory/faq.html

## Ejecutar instrucciones de sistema

Utilize el símbolo '!' delante de cada instrucción de sistema que desee ejecutar. Como por ejemplo la instruccion 'ls' muestra el contenido del directorio actual

```
$ !ls
```
Por ejemplo, ejecute cualquiera de las siguientes instrucciones para analizar los detalles de la máquina virtual ejecutando este entorno de Jupyter

In [1]:
# Show linux release
!lsb_release -a

No LSB modules are available.
Distributor ID:	Ubuntu
Description:	Ubuntu 18.04.6 LTS
Release:	18.04
Codename:	bionic


In [2]:
# Show CPU info
!cat /proc/cpuinfo

processor	: 0
vendor_id	: GenuineIntel
cpu family	: 6
model		: 85
model name	: Intel(R) Xeon(R) CPU @ 2.00GHz
stepping	: 3
microcode	: 0xffffffff
cpu MHz		: 2000.174
cache size	: 39424 KB
physical id	: 0
siblings	: 2
core id		: 0
cpu cores	: 1
apicid		: 0
initial apicid	: 0
fpu		: yes
fpu_exception	: yes
cpuid level	: 13
wp		: yes
flags		: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss ht syscall nx pdpe1gb rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid tsc_known_freq pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c rdrand hypervisor lahf_lm abm 3dnowprefetch invpcid_single ssbd ibrs ibpb stibp fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm mpx avx512f avx512dq rdseed adx smap clflushopt clwb avx512cd avx512bw avx512vl xsaveopt xsavec xgetbv1 xsaves arat md_clear arch_capabilities
bugs		: cpu_meltdown spectre_v1 spectre_v2 spec_store_bypass l1tf mds swapgs taa mmi

In [3]:
# Show RAM info
!cat /proc/meminfo

MemTotal:       13297228 kB
MemFree:        10465640 kB
MemAvailable:   12448828 kB
Buffers:           72716 kB
Cached:          2071812 kB
SwapCached:            0 kB
Active:           578228 kB
Inactive:        2019684 kB
Active(anon):        884 kB
Inactive(anon):   417008 kB
Active(file):     577344 kB
Inactive(file):  1602676 kB
Unevictable:           0 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:              6212 kB
Writeback:             0 kB
AnonPages:        453508 kB
Mapped:           223592 kB
Shmem:              1168 kB
KReclaimable:      89240 kB
Slab:             120064 kB
SReclaimable:      89240 kB
SUnreclaim:        30824 kB
KernelStack:        4416 kB
PageTables:         7564 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:     6648612 kB
Committed_AS:    2596432 kB
VmallocTotal:   34359738367 kB
VmallocUsed:       44972 kB
VmallocChunk:          0 kB
Percpu:          

In [4]:
# Show mounted directories 
!df -h

Filesystem      Size  Used Avail Use% Mounted on
overlay          79G   23G   56G  30% /
tmpfs            64M     0   64M   0% /dev
shm             5.7G     0  5.7G   0% /dev/shm
/dev/root       2.0G  1.1G  910M  54% /sbin/docker-init
/dev/sda1        50G   25G   26G  50% /opt/bin/.nvidia
tmpfs           6.4G   36K  6.4G   1% /var/colab
tmpfs           6.4G     0  6.4G   0% /proc/acpi
tmpfs           6.4G     0  6.4G   0% /proc/scsi
tmpfs           6.4G     0  6.4G   0% /sys/firmware


En esta práctica, vamos a verificar la versión de Python que estamos ejecutando (recuerde que el código de esta práctica se ha comprobado sobre Python 2.7)

In [5]:
#Check Python version
import sys
sys.version

'3.8.16 (default, Dec  7 2022, 01:12:13) \n[GCC 7.5.0]'

## Verificar existencia de GPU
Una de las principales ventajas de *Google Colaboratory* es la disponibilidad gratuita de recursos de calculo intensivo mediante GPUs (Graphic Processing Unit). En esta sección describiremos como verificar la existencia de esta GPU.

Primeramente, debe activar el recurso GPU. Para ello navege por el menu "Edit-->Notebook Settings" y seleccione la opción "GPU" en la parte "Hardware acceleretor". En la otra parte "Runtime type", seleccione "Python3" pues que todo el código de esta práctica ha sido verificado con Python 3. 

A continuación se muestra un ejemplo visual de las opciones en "Notebook Settings"

![alt text](https://cdn-images-1.medium.com/max/1600/1*WNovJnpGMOys8Rv7YIsZzA.png)

Posteriormente vamos a utilizar la instrucción  *nvidia-smi* para identificar cuantas GPUs existen en nuestro sistema:

In [6]:
!nvidia-smi

Wed Dec 28 09:58:39 2022       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.32.03    Driver Version: 460.32.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   63C    P0    27W /  70W |      0MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Proces

## Instalacion de paquetes necesarios

En esta sección vamos a mostrar el procedimiento para instalar el software necesario para realizar esta práctica

### Jupyter notebook
En el caso de que la máquina virtual de https://colab.research.google.com/ no esté disponible (puede verificar que aparece la palabra "CONNECTED" arriba a la derecha de su pantalla). Se sugiere realizar la práctica en local (e.g. PC o portátil personal). Para ejecutar los scripts interactivos \*.ipynb, necesitará instalar *Jupyter*. 

Ejecute los siguientes comandos en un terminal de linux


```
$ pip install jupyter #version 2.X python (recomendada)
$ pip3 install jupyter #version 3.X python
$ jupyter notebook # lanza jupyter y abre un navegador para ejecutar scripts ipynb
```

El procedimiento completo está descrito en http://jupyter.readthedocs.io/en/latest/install.html

NOTA: los scripts ipynb de esta práctica están preparados para funcionar tanto en local como en colab.research.google.com (asumiendo una conexión directa a internet, sin proxy alguno).


### Pytorch 
En esta práctica utilizaremos ```Pytorch``` para las tareas de *deep learning* y el paquete ``torchvision`` que proporciona funcionalidad extendida. 

A continuación se muestran las instrucciones necesarias para instalar Pytorch con/sin soporte para cálculo intensivo mediante GPUs (descomente aquella opción que desee instalar):

In [7]:
#install pytorch for python 2.7 without CUDA support
#!pip install torchvision==0.2.0
#!pip install http://download.pytorch.org/whl/cpu/torch-0.3.1-cp27-cp27mu-linux_x86_64.whl 

#install pytorch for python 2.7 with CUDA 8.0 support
!pip install torchvision==0.2.0
!pip install http://download.pytorch.org/whl/cu80/torch-0.3.1-cp27-cp27mu-linux_x86_64.whl 

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
[31mERROR: torch-0.3.1-cp27-cp27mu-linux_x86_64.whl is not a supported wheel on this platform.[0m


### Pillow

También utilizaremos la librería ``Pillow`` para lectura/escritura de imágenes. En esta práctica utilizaremos la versión 5.0.0 debido a que 
la versión 4.0.0 tiene problemas de compatibilidad con Colaborative (en concreto para la lectura de imágenes con plugins de lectura *TiffImageFile*)

In [8]:
!pip install Pillow==5.0.0
!pip show pillow #check pillow version

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Name: Pillow
Version: 5.0.0
Summary: Python Imaging Library (Fork)
Home-page: https://python-pillow.org
Author: Alex Clark (Fork Author)
Author-email: aclark@aclark.net
License: Standard PIL License
Location: /usr/local/lib/python3.8/dist-packages
Requires: 
Required-by: wordcloud, torchvision, scikit-image, imgaug, imageio, fastai, bokeh


Para actualizar el entorno y se utilice la versión 5.0 del paquete ``Pillow``, deberá resetear el *runtime* de esta sesión de ``Jupyter``.

Para ello, utilice la opción del menu "Runtime"->"Restart Runtime" ó seleccione Ctrl+M.

## Conectarse a sus carpetas en google drive
Debido a que el uso del entorno *colab.research.google.com* está registringido a un máximo de 12 horas continuadas (tras las cuales, se reseteará su máquina virtual y podrá volver a utilizar otra distinta) se sugiere conectar esta máquina virtual a la unidad de *Google Drive* asociada a su usuario con cuenta @gmail. Así podrá guardar datos y resultados que genere para un posterior uso.

Debido a que el procedimiento descrito a continuación requiere acceder a su cuenta personal @gmail, **se sugiere crear una nueva cuenta @gmail para la realización de esta práctica**.

Tras identificarse con su nueva cuenta @gmail, vuelva a cargar este script refrescando esta página web en el navegador.


A continuación utilizaremos el paquete *drive* de *Google.Colab* que permite montar sus directorios de Drive en la carpeta del sistema */content/gdrive/*

Estas instrucciónes le pediran autorizar el acceso a su cuenta proporcionándole un enlace. Haga click sore el enlace y copie en el código que obtenga en el cuadro de texto.

In [9]:
from google.colab import drive
drive.mount('/content/gdrive')

Mounted at /content/gdrive


Podemos visualizar el contenido de nuestra carpeta raíz en Google Drive con la siguiente instrucción

In [10]:
!ls /content/gdrive/My\ Drive/

foo.txt  practica1indexacion


A continuación creamos un fichero de ejemplo para verificar el correcto funcionamiento de las instrucciones anteriores



In [11]:
with open('/content/gdrive/My Drive/foo.txt', 'w') as f:
  f.write('Hello Google Drive!')
!cat /content/gdrive/My\ Drive/foo.txt

Hello Google Drive!

Por último podemos crear un carpeta para guardar los datos de esta práctica

In [12]:
!mkdir /content/gdrive/My\ Drive/practica1indexacion

mkdir: cannot create directory ‘/content/gdrive/My Drive/practica1indexacion’: File exists


## Operaciones comúnes

En esta sección repasaremos operaciones/comandos de utilidad para el resto de partes de la práctica

### Moverse a otros directorios

El directorio de trabajo por defecto es '/content'. Si hemos seguido el paso anterior, lo deseable es que trabajemos en nuestros directorios de *Google Drive*. 

Para movernos entre directorios normalmente utilizariamos la instrucción **cd**. De manera alternativa se sugiere utilizar la libreria *os* para moverse entre directorios.


In [13]:
#show current directory
!pwd

#move to a specific directory
import os
os.chdir('/content/gdrive/My Drive/practica1indexacion/')
!pwd

/content
/content/gdrive/My Drive/practica1indexacion


### Generación de scripts

Frecuentemente, tras desarrollar una nueva funcionalidad es conveniente utilizar un fichero *.py* para encapsular esta funcionalidad.

En el siguiente código puede ver como se generan el fichero *textproc.py*

In [14]:
%%writefile textproc.py

def plural(word):
    if word.endswith('y'):
        return word[:-1] + 'ies'
    elif word[-1] in 'sx' or word[-2:] in ['sh', 'ch']:
        return word + 'es'
    elif word.endswith('an'):
        return word[:-2] + 'en'
    else:
        return word + 's'

Overwriting textproc.py


In [15]:
#list directory contents
!ls

__pycache__  textproc.py


### Ejecución de scripts

Tras encapsular la funcionalidad deseada en un fichero *.py*, tenemos dos maneras utilizar dicha funcionalidad

In [16]:
#example 1 for importing library
from textproc import plural

#create object
plural('wish') 

'wishes'

In [17]:
#example 2 for running an external script

%run -i textproc.py #runs script and keeps variables
plural('wish')

'wishes'

### Reiniciar la máquina virtual
Es posible que realice diversas operaciones sobre el sistema (e.g. instalación de paquetes) que produzca un sistema inestable. 

En ese caso, se recomienda:

1) Haga un "restart runtime" mediante las teclas Ctrl+M

2) En el caso de que no se resuelva su problema, ejecute la siguiente instrucción para forzar un reseteo del sistema. Tras ejecutar esta instrucción la máquina sufrirá un bloqueo durante un pequeño lapso de tiempo (1-2 minutos). Refresque la página y verifique que se conecta a la máquina virtual ("CONNECTED" en la esquina superior derecha)

```
!kill -9 -1
```
   




In [None]:
!kill -9 -1