In [None]:
# Crea, entrena y guarda un modelo de clasificación de imágenes vulcanológicas.
# Puede tardar bastante tiempo (una hora o más) y requiere de la gran mayoría de la potencia de la computadora mientras se ejecuta.
# La estructura está basada en la arquitectura que Francois Chollet recomienda para este tipo de sets de datos "limitados"

In [1]:
# importa todas las librerias necesarias
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K

Using TensorFlow backend.


In [2]:
# Define la normalizacion de las dimensiones de las imágenes
img_width = 255
img_height = 255

train_data_dir = 'images_crop/train/'
validation_data_dir = 'images_crop/validation/'

# es el número de imágenes en train y validation
nb_train_samples = 227 + 39
nb_validation_samples = 9 + 15

# convierte el formato

if K.image_data_format() == 'channels_first':
    input_shape = (3, img_width, img_height)
else:
    input_shape = (img_width, img_height, 3)

In [3]:
#  crear el modelo que tendrá de output un "feature map"(height, width, features)

model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(1))
model.add(Activation('sigmoid'))



#






Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.


In [4]:
#  Define el tipo de compilación del modelo
model.compile(loss='binary_crossentropy',
             optimizer='rmsprop',
             metrics=['accuracy'])





Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where


In [5]:
# Agrega transformaciones a las imagenes de entrenamiento para agrandar el set
train_datagen = ImageDataGenerator(
    rescale=1./255,
    zoom_range=0.2,
    horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1. / 255)

In [6]:
# Las "epochs" definen la cantidad de rounds de entrenamiento. Incrementarlo puede ocasionar problemas si no se observan cuidadosamente las métricas
epochs = 200
batch_size = 16

train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='binary')

Found 324 images belonging to 2 classes.


In [7]:
validation_generator = test_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='binary')



Found 34 images belonging to 2 classes.


In [8]:
# Esta es la parte donde se tardará el 99% del tiempo en ejecutarse, e irá imprimendo las métricas de entrenamiento
model.fit_generator(
    train_generator,
    steps_per_epoch=nb_train_samples // batch_size,
    epochs=epochs,
    validation_data=validation_generator,
    validation_steps=nb_validation_samples // batch_size)




Epoch 1/200





Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 55/200
Epoch 56/200
Epoch 57/200
Epoch 58/200
Epoch 59/200
Epoch 60/200
Epoch 61/200
Epoch 62/200
Epoch 63/200
Epoch 64/200
Epoch 65/200
Epoch 66/200
Epoch 67/200
Epoch 68/200
Epoch 69/200
Epoch 70/200
Epoch 71/200
Epoch 72/200
Epoch 73/200
Epoch 74/200
Epoch 75/200
Epoch 76/200
Epoch 77/200


<keras.callbacks.History at 0x7fd4c5e4d650>

In [9]:
# Guarda el modelo en un archivo nuevo
# si no se cambia el nombre, se sobreescribe el modelo anterior
# si sí, se crea uno nuevo con ese nombre
model.save('volcano_analysis1.0.h5')

In [57]:
# Genera datos de una prueba casi idéntica a clasifica.py
test_datagen = ImageDataGenerator(rescale=1./255)

test_generator = test_datagen.flow_from_directory(
        'test_images/',
        target_size=(255, 255),
        color_mode="rgb",
        shuffle = False,
        class_mode='binary',
        batch_size=1)

filenames = test_generator.filenames
nb_samples = len(filenames)

predict = model.predict_generator(test_generator,steps = nb_samples)

Found 10 images belonging to 1 classes.


In [58]:
# Imprime las clasificaciones en orden
print(predict)

[[1.0000000e+00]
 [1.0000000e+00]
 [1.0000000e+00]
 [1.0000000e+00]
 [1.0000000e+00]
 [5.4585020e-04]
 [2.4906127e-08]
 [8.7574035e-02]
 [0.0000000e+00]
 [3.4938570e-02]]
