# Clasificador de flores

Bienvenidos. En este ejercicio haremos un clasificador para flores. Usaremos el siguiente dataset: http://www.robots.ox.ac.uk/~vgg/data/flowers/, que contiene 102 categorías y 8192 imágenes de flores de alta calidad. En un momento te diré cómo descargar el dataset ya editado por mi para hacerlo más fácil de manejar.

Al final lograremos llegar a 99.21% de accuracy, aún cuando tenemos 102 tipos de flores diferentes. Esto es muy impresionante, sobre todo considerando que en [este paper](https://www.robots.ox.ac.uk/~vgg/research/flowers_demo/docs/Chai11.pdf) reportan 81% de accuracy, y que en [este otro](http://www.cs.huji.ac.il/~daphna/IsraeliFlowers/flower_classification.html) reportan 93.8%! 

Es decir, lo haremos **7.7 veces mejor** que ese último!! (0.8% vs 6.2% de error)

Vamos a incluir las bibliotecas que usaremos, que son [fast.ai](https://www.fast.ai/) y [pytorch](https://pytorch.org).

In [10]:
import fastai.vision.all as fv

from pathlib import Path

### ¿Cómo son nuestros datos?

Siempre antes de empezar a trabajar en algún problema, hay que entender bien qué problema queremos resolver. En este caso, simplemente queremos clasificar flores en base a sus imágenes.

Después, hay que entender los [datos](https://my.pcloud.com/publink/show?code=XZiwtw7Z15TY80dPm4b3KwmNcf1ChfphgM5y). En este caso, de las flores, pensemos que ya los descargamos, descomprimimos y están en un carpeta llamada "flowers".

In [6]:
!ls flowers/

[0m[01;34mmodels[0m/  [01;34mtmp[0m/  [01;34mtrain[0m/  [01;34mvalid[0m/


Posiblemente tú no tendrás tmp ni models aún. Eso se crean solitos después.

In [7]:
!ls flowers/train

[0m[01;34malpine-sea-holly[0m/    [01;34mfire-lily[0m/                  [01;34mperuvian-lily[0m/
[01;34manthurium[0m/           [01;34mfoxglove[0m/                   [01;34mpetunia[0m/
[01;34martichoke[0m/           [01;34mfrangipani[0m/                 [01;34mpincushion-flower[0m/
[01;34mazalea[0m/              [01;34mfritillary[0m/                 [01;34mpink-primrose[0m/
[01;34mball-moss[0m/           [01;34mgarden-phlox[0m/               [01;34mpink-yellow-dahlia[0m/
[01;34mballoon-flower[0m/      [01;34mgaura[0m/                      [01;34mpoinsettia[0m/
[01;34mbarbeton-daisy[0m/      [01;34mgazania[0m/                    [01;34mprimula[0m/
[01;34mbearded-iris[0m/        [01;34mgeranium[0m/                   [01;34mprince-of-wales-feathers[0m/
[01;34mbee-balm[0m/            [01;34mgiant-white-arum-lily[0m/      [01;34mpurple-coneflower[0m/
[01;34mbird-of-paradise[0m/    [01;34mglobe-flower[0m/               [01;34mred-gi

Ya entendimos cómo están las imágenes y su clasificación. (Nota: el archivo original que bajas de oxford no estaba bien acomodado así, estaba en un csv y así, medio feito, yo lo convertí.)

In [11]:
flowers = Path("flowers/")

In [12]:
(flowers/"train").ls()

(#102) [Path('flowers/train/stemless-gentian'),Path('flowers/train/rose'),Path('flowers/train/cautleya-spicata'),Path('flowers/train/monkshood'),Path('flowers/train/globe-flower'),Path('flowers/train/tiger-lily'),Path('flowers/train/peruvian-lily'),Path('flowers/train/bishop-of-llandaff'),Path('flowers/train/azalea'),Path('flowers/train/yellow-iris')...]

In [14]:
files = fv.get_image_files("flowers"); files

(#8188) [Path('flowers/train/stemless-gentian/image_05227.jpg'),Path('flowers/train/stemless-gentian/image_05216.jpg'),Path('flowers/train/stemless-gentian/image_05253.jpg'),Path('flowers/train/stemless-gentian/image_05269.jpg'),Path('flowers/train/stemless-gentian/image_05214.jpg'),Path('flowers/train/stemless-gentian/image_05273.jpg'),Path('flowers/train/stemless-gentian/image_05248.jpg'),Path('flowers/train/stemless-gentian/image_05261.jpg'),Path('flowers/train/stemless-gentian/image_05243.jpg'),Path('flowers/train/stemless-gentian/image_05263.jpg')...]

In [19]:
fv.doc(fv.get_image_files)

## Abriendo los datos en fastai

Dado que nuestros datos están bien acomodados en folders, vamos a crear un "ImageDataBunch" a partir del folder.

Usaremos "data augmentation" (más sobre esto después), estableciendo transformadas.

In [18]:
fv.doc(fv.aug_transforms)

**Nota:** bs = batch size. Es decir, cuántas imágenes pasa al mismo tiempo a la red neuronal. Mi tarjeta de video tiene 11GB de memoria, por es puedo poner un número relativamente grande. Si obtienes "CUDA error: out of memory", disminuye la batch size!

Podríamos también cargar los datos "a mano", como se muestra en las siguientes celdas. Para más información, ver el [datablock-api](https://docs.fast.ai/data_block.html)

In [None]:
def load_data(folder, img_size, batch_size):
    tfms = fv.get_transforms(flip_vert=True, max_rotate=360, max_lighting=0.3,max_zoom=1.2,max_warp=0.2) #tfms = transforms
    data = (fv.ImageList
            .from_folder(folder)
            .split_by_folder()
            .label_from_folder()
            .transform(tfms,size=img_size)
            .databunch(bs=batch_size))
    return data

In [None]:
data = load_data(flowers, img_size=224, batch_size=64)

In [None]:
data.show_batch(rows=3)

## Entrenamiento

Ahora crearemos un objeto de tipo "Learner" (más sobre esto después), con arquitectura de "resnet18". Qué es esto? No te preocupes!

In [None]:
learner = fv.cnn_learner(data, fv.models.resnet18, metrics=fai.accuracy)

### Entrenamos *sólo de las últimas capas*

Vamos a usar la función "fit_one_cycle", que es una manera muy rápida de entrenar (discutiremos por qué después). wd significa "weight decay" y es para hacer "regularización l2" (veremos qué significa después)

In [None]:
learner.fit_one_cycle(4)

In [None]:
learner.recorder.plot_lr(show_moms=True)

No sabemos qué taza de aprendizaje usar, y de hecho hemos estado usando la que trae por defecto (0.003). ¿Qué learning rate usamos? Pues vamos a averiguar!

In [None]:
learner.lr_find(); learner.recorder.plot()

In [None]:
learner.fit_one_cycle(4, max_lr = 1e-2)

In [None]:
learner.lr_find(); learner.recorder.plot()

In [None]:
learner.fit_one_cycle(3,1e-4)

In [None]:
learner.save('stage1')

In [None]:
learner.load("stage1");

### Taza de aprendizaje cíclica 

Como funciona el método fit_one_cycle? Se ha encontrado, experimentalmente, que ir modificando la taza de aprendizaje (learning rate) en "ciclos" mejora mucho el resultado final de la red. Después entenderemos la razón, pero tiene que ver con que son mejores los "mínimos gordos" que los "mínimos flacos". [Paper](https://arxiv.org/abs/1506.01186)

In [None]:
learner.recorder.plot_losses()

In [None]:
learner.recorder.plot_lr(show_moms=True)

In [None]:
learner.model

In [None]:
learner.summary()

### Entrenamiento de TODAS las capas

En realidad **no hemos estado entrenando a toda la red neuronal!!** Sólo entrenamos las últimas dos capas, y las demás estaban **pre-entrenadas en imagenet**. Por defecto, si pides una arquitectura pre-hecha, vienen "congeladas" las primeras capas. Vamos a entrenar con cuidado toda la red.

In [None]:
learner.unfreeze() # ahora hay que tener cuidado!

In [None]:
learner.lr_find(); learner.recorder.plot()

In [None]:
learner.summary()

Vamos a entrenar toda la red, pero vamos a modificar las primeras capas **menos que las últimas**. Para entender por qué, veamos este paper: [Visualizing and Understading ...](https://cs.nyu.edu/~fergus/papers/zeilerECCV2014.pdf)

In [None]:
learner.fit_one_cycle(5, max_lr=slice(1e-5,1e-3))

In [None]:
learner.save('stage2')

In [None]:
learner.show_results(ds_type=fai.DatasetType.Train, rows=3) # Podemos cambiar Valid por Train

# Interpretando los resultados

#### Test Time Augmentation
Así como hicimos data augmentation al entrenar, ¿por qué no hacerlo también al inferir?

In [None]:
fai.accuracy(*learner.TTA())

Vamos a revisar los resultados que tenemos

In [None]:
interp = learner.interpret()

In [None]:
interp.plot_top_losses(9,heatmap=False)

Las dos que predecimos mallow pero deberíamos predecir camellia... están de hecho mal clasificadas en el validation set!

Esto es algo muy común, los datasets no son perfectos. Y hacer este tipo de cosas nos da herramientas para encontrar estos errores.

In [None]:
interp.plot_confusion_matrix(figsize=(16,16), dpi=300)

In [None]:
interp.most_confused(1)