In [None]:
# Eliminar el archivo paintings.csv
!rm paintings.csv

# Eliminar la carpeta wikiart_images y su contenido
!rm -r wikiart_images

rm: cannot remove 'wikiart_images': No such file or directory


In [None]:
import requests
from bs4 import BeautifulSoup
import csv

def scrape_wikiart_names(artist_url, author_name):
    url = f"https://www.wikiart.org/en/{artist_url}/all-works/text-list"
    response = requests.get(url)

    soup = BeautifulSoup(response.text, 'html.parser')
    paintings = soup.find_all('li', class_='painting-list-text-row')

    # Abrir el archivo en modo "agregar" ('a') para no sobrescribir los datos existentes
    with open('paintings.csv', mode='a', newline='') as file:
        writer = csv.writer(file)

        # Verificar si el archivo está vacío para escribir el encabezado solo una vez
        if file.tell() == 0:
            writer.writerow(["Author", "Painting Name", "URL"])  # Encabezados solo si el archivo está vacío

        for painting in paintings:
            painting_name = painting.find('a').text.strip()  # Obtener el nombre de la obra y quitar espacios en blanco
            img_page = painting.find('a')['href']
            writer.writerow([author_name, painting_name, f"https://www.wikiart.org{img_page}"])
            #print(f"Autor: {author_name}, Obra: {painting_name}")

# Ejemplo para obtener los datos de las obras de varios artistas
scrape_wikiart_names("vincent-van-gogh", "Vincent van Gogh")
scrape_wikiart_names("pablo-picasso", "Pablo Picasso")
scrape_wikiart_names("leonardo-da-vinci", "Leonardo da Vinci")
scrape_wikiart_names("claude-monet", "Claude Monet")
scrape_wikiart_names("salvador-dali", "Salvador Dali")

In [None]:
import os
import pandas as pd
import requests
from concurrent.futures import ThreadPoolExecutor
from bs4 import BeautifulSoup

# Lee el archivo CSV
df = pd.read_csv('paintings.csv')

# Crear la carpeta principal 'wikiart_images' si no existe
save_dir = 'wikiart_images'
if not os.path.exists(save_dir):
    os.makedirs(save_dir)

# Función para obtener la URL de la imagen
def get_image_url(page_url):
    try:
        response = requests.get(page_url)
        if response.status_code == 200:
            soup = BeautifulSoup(response.content, 'html.parser')
            img_tag = soup.find('img', itemprop='image')
            if img_tag and 'src' in img_tag.attrs:
                return img_tag['src'].replace(':large', '')
        else:
            print(f"Error al acceder a {page_url}: {response.status_code}")
    except Exception as e:
        print(f"Error al acceder a {page_url}: {e}")
    return None

# Función para descargar imágenes
def download_image(row):
    # Obtener el nombre del autor y de la obra
    author = row['Author'].replace(' ', '_').replace('/', '_')  # Limpiar el nombre del autor
    painting_name = row['Painting Name'].replace(' ', '_').replace('/', '_')  # Limpiar el nombre de la obra

    # Crear una carpeta para el autor dentro de 'wikiart_images'
    author_dir = os.path.join(save_dir, author)
    os.makedirs(author_dir, exist_ok=True)  # Esto asegura que no haya error si la carpeta ya existe (Sirve para un entorno con múltiple hilos)

    # Obtener la URL de la imagen
    image_url = get_image_url(row['URL'])
    if image_url:  # Verifica que la URL de la imagen no sea None
        # Generar el nombre del archivo usando el nombre de la obra
        image_name = f"{painting_name}.jpg"

        try:
            response = requests.get(image_url)
            if response.status_code == 200:
                # Guardar la imagen en la carpeta del autor
                with open(os.path.join(author_dir, image_name), 'wb') as f:
                    f.write(response.content)
                print(f"Descargada: {os.path.join(author_dir, image_name)}")
            else:
                print(f"Error al descargar {image_name}: {response.status_code}")
        except Exception as e:
            print(f"Error al descargar {image_name}: {e}")
    else:
        print(f"No se pudo obtener la URL de la imagen para {painting_name}")

# Descargar las imágenes usando múltiples hilos
with ThreadPoolExecutor(max_workers=10) as executor:  # max_workers determina cuántas descargas en paralelo
    # Pasar cada fila del DataFrame para la descarga
    futures = [executor.submit(download_image, row) for _, row in df.iterrows()]

    # Verificar la finalización de las tareas
    for future in futures:
        future.result()

[1;30;43mSe han truncado las últimas 5000 líneas del flujo de salida.[0m
Descargada: wikiart_images/Vincent_van_Gogh/Two_Heads_of_Men.jpg
Descargada: wikiart_images/Vincent_van_Gogh/Peasant_Woman,_Head.jpg
Descargada: wikiart_images/Vincent_van_Gogh/A_Pair_of_Shoes.jpg
Descargada: wikiart_images/Vincent_van_Gogh/A_Public_Garden_with_People_Walking_in_the_Rain.jpg
Descargada: wikiart_images/Vincent_van_Gogh/A_Square_in_Paris.jpg
Descargada: wikiart_images/Vincent_van_Gogh/A_View_of_Paris_with_the_Op.jpg
Descargada: wikiart_images/Vincent_van_Gogh/Belvedere_Overlooking_Montmartre.jpg
Descargada: wikiart_images/Vincent_van_Gogh/Basket_of_Carnations_and_Zinnias.jpg
Descargada: wikiart_images/Vincent_van_Gogh/Coleus_Plant_in_a_Flowerpot.jpg
Descargada: wikiart_images/Vincent_van_Gogh/Bowl_with_Peonies_and_Roses.jpg
Descargada: wikiart_images/Vincent_van_Gogh/Female_Nude,_Seated.jpg
Descargada: wikiart_images/Vincent_van_Gogh/Female_Nude,_Standing.jpg
Descargada: wikiart_images/Vincent_van

In [None]:
import numpy as np
import cv2
import os

def load_images_from_folder(folder):
    images = []
    labels = []
    # Recorrer todas las subcarpetas en el directorio principal
    for subfolder in os.listdir(folder):
        subfolder_path = os.path.join(folder, subfolder)
        if os.path.isdir(subfolder_path):  # Verificar que sea un directorio
            # Recorrer todas las imágenes en la subcarpeta
            for filename in os.listdir(subfolder_path):
                img_path = os.path.join(subfolder_path, filename)
                img = cv2.imread(img_path)
                if img is not None:
                    img = cv2.resize(img, (299, 299))  # Redimensionar a 299x299 para InceptionV3
                    images.append(img)
                    labels.append(subfolder)  # Usar el nombre de la subcarpeta como etiqueta
    return images, labels

# Ejemplo de uso
images, labels = load_images_from_folder('wikiart_images')

print(f"Total de imágenes cargadas: {len(images)}")
print(f"Total de etiquetas cargadas: {len(labels)}")

print("Primeras etiquetas:", labels[:10])  # Mostrar las primeras 10 etiquetas para verificar

Total de imágenes cargadas: 4898
Total de etiquetas cargadas: 4898
Primeras etiquetas: ['Vincent_van_Gogh', 'Vincent_van_Gogh', 'Vincent_van_Gogh', 'Vincent_van_Gogh', 'Vincent_van_Gogh', 'Vincent_van_Gogh', 'Vincent_van_Gogh', 'Vincent_van_Gogh', 'Vincent_van_Gogh', 'Vincent_van_Gogh']


In [None]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Crear un generador de datos con aumentación que simula condiciones típicas de fotos de celulares
datagen = ImageDataGenerator(
    rotation_range=15,          # Rotaciones pequeñas (0-15 grados)
    width_shift_range=0.1,      # Desplazamiento horizontal menor
    height_shift_range=0.1,     # Desplazamiento vertical menor
    zoom_range=0.1,             # Zoom aleatorio pequeño
    brightness_range=[0.8, 1.2],# Ajuste de brillo (más oscuro o más claro)
    horizontal_flip=True,       # Voltear horizontalmente
    rescale=1/255.0,            # Normalizar los píxeles
    fill_mode='nearest'         # Modo de relleno para áreas vacías
)

# Configurar el flujo de datos desde el directorio
train_generator = datagen.flow_from_directory(
    'wikiart_images',          # Directorio principal con subcarpetas de autores
    target_size=(224, 224),    # Tamaño de entrada esperado por MobileNetV2
    batch_size=32,             # Tamaño del batch
    class_mode='categorical',  # Clasificación multiclase
    shuffle=True               # Activar el shuffle
)

Found 4901 images belonging to 5 classes.


In [None]:
for batch in train_generator:
    print(f"Tamaño del lote: {len(batch[0])}")  # Verifica el tamaño de cada lote
    break

print(f"Total de imágenes en el generador: {train_generator.samples}")
print(f"Tamaño del batch: {train_generator.batch_size}")
print(f"Clases encontradas: {train_generator.class_indices}")

for batch_images, batch_labels in train_generator:
    print(f"Tamaño del lote: {len(batch_images)}")
    break  # Solo para mostrar un lote y no iterar indefinidamente

Tamaño del lote: 32
Total de imágenes en el generador: 4901
Tamaño del batch: 32
Clases encontradas: {'Claude_Monet': 0, 'Leonardo_da_Vinci': 1, 'Pablo_Picasso': 2, 'Salvador_Dali': 3, 'Vincent_van_Gogh': 4}
Tamaño del lote: 32


In [None]:
from tensorflow.keras.applications import MobileNetV2
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D
from tensorflow.keras.models import Model

# Crear el modelo base de MobileNetV2 (sin las capas superiores)
base_model = MobileNetV2(weights='imagenet', include_top=False)

# Añadir una capa de pooling global y una capa densa
x = base_model.output
x = GlobalAveragePooling2D()(x)  # Reduce la dimensionalidad
x = Dense(512, activation='relu')(x)  # Capa densa con menos unidades
predictions = Dense(len(set(labels)), activation='softmax')(x)  # Capa de salida

# Definir el modelo final
model = Model(inputs=base_model.input, outputs=predictions)

# Congelar las capas del modelo base
for layer in base_model.layers:
    layer.trainable = False

# Compilar el modelo
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

  base_model = MobileNetV2(weights='imagenet', include_top=False)


In [None]:
from tensorflow.keras.callbacks import ReduceLROnPlateau

# Configurar el callback para reducir la tasa de aprendizaje
reduce_lr = ReduceLROnPlateau(
    monitor='loss',  # Puedes usar 'val_loss' si tienes un conjunto de validación
    factor=0.5,      # Factor por el cual la tasa de aprendizaje se reducirá
    patience=2,      # Número de épocas sin mejora antes de reducir la tasa
    min_lr=1e-6      # Límite inferior para la tasa de aprendizaje
)

In [None]:
# Entrenar el modelo utilizando el generador
model.fit(
    train_generator,
    epochs=5,
    steps_per_epoch=min(100, train_generator.samples // train_generator.batch_size), # Ajusta el número de pasos
    #steps_per_epoch = max(1, (train_generator.samples // train_generator.batch_size) - 1), #Por si la cantidad de img no es divisible entre el tamaño del batch
    #steps_per_epoch = train_generator.samples // train_generator.batch_size,
    callbacks=[reduce_lr]
)

Epoch 1/5


  self._warn_if_super_not_called()


[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m181s[0m 2s/step - accuracy: 0.6009 - loss: 1.0928 - learning_rate: 0.0010
Epoch 2/5
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m84s[0m 837ms/step - accuracy: 0.7864 - loss: 0.5914 - learning_rate: 0.0010
Epoch 3/5


  self.gen.throw(typ, value, traceback)


[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m171s[0m 2s/step - accuracy: 0.8070 - loss: 0.5385 - learning_rate: 0.0010
Epoch 4/5
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m85s[0m 844ms/step - accuracy: 0.8180 - loss: 0.4909 - learning_rate: 0.0010
Epoch 5/5
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m170s[0m 2s/step - accuracy: 0.8443 - loss: 0.4364 - learning_rate: 0.0010


<keras.src.callbacks.history.History at 0x7fd0bbe9f4f0>

In [None]:
# Ahora, hacer fine-tuning de las últimas capas convolucionales de InceptionV3
# Descongelar las últimas capas convolucionales (puedes experimentar con cuántas capas descongelar)
for layer in model.layers[:20]:
    layer.trainable = False
for layer in model.layers[20:]:
    layer.trainable = True

# Recompilar el modelo con un optimizador SGD de baja tasa de aprendizaje
from keras.optimizers import SGD
model.compile(optimizer=SGD(learning_rate=0.0001, momentum=0.9), loss='categorical_crossentropy', metrics=['accuracy'])

In [None]:
from tensorflow.keras.callbacks import EarlyStopping

early_stopping = EarlyStopping(
    monitor='val_loss',  # O 'loss' si no tienes un conjunto de validación
    patience=3,          # Número de épocas sin mejora antes de detener el entrenamiento
    restore_best_weights=True
)

In [None]:
# Entrenar nuevamente con las capas descongeladas
model.fit(
    train_generator,
    epochs=10,
    steps_per_epoch=min(100, train_generator.samples // train_generator.batch_size),
    #steps_per_epoch = max(1, (train_generator.samples // train_generator.batch_size) - 1),
    callbacks=[reduce_lr, early_stopping]
)

Epoch 1/10
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m468s[0m 4s/step - accuracy: 0.6929 - loss: 0.8391 - learning_rate: 1.0000e-04
Epoch 2/10


  current = self.get_monitor_value(logs)


[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m235s[0m 2s/step - accuracy: 0.8214 - loss: 0.5094 - learning_rate: 1.0000e-04
Epoch 3/10
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m503s[0m 4s/step - accuracy: 0.8394 - loss: 0.4501 - learning_rate: 1.0000e-04
Epoch 4/10
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m231s[0m 2s/step - accuracy: 0.8323 - loss: 0.4811 - learning_rate: 1.0000e-04
Epoch 5/10
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m447s[0m 4s/step - accuracy: 0.8454 - loss: 0.4296 - learning_rate: 1.0000e-04
Epoch 6/10
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m233s[0m 2s/step - accuracy: 0.8592 - loss: 0.4021 - learning_rate: 1.0000e-04
Epoch 7/10
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m449s[0m 4s/step - accuracy: 0.8594 - loss: 0.4120 - learning_rate: 1.0000e-04
Epoch 8/10
[1m100/100[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m236s[0m 2s/step - accuracy: 0.8613 - loss: 0.4

<keras.src.callbacks.history.History at 0x7fd0b9ee1de0>

In [None]:
import tensorflow as tf
import requests
from io import BytesIO
from tensorflow.keras.preprocessing.image import load_img, img_to_array
import numpy as np

# Asumiendo que el modelo se llama 'model'
# URL de la imagen que quieres probar
url = 'https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcTKN1Kkg-pWB7WQnM-1_ML22lGKN_FFbczAYw&s'

# Descargar la imagen desde la URL
response = requests.get(url)

# Verificar si la respuesta es una imagen
if 'image' in response.headers['Content-Type']:
    # Redimensionar a 224x224 para MobileNetV2
    img = load_img(BytesIO(response.content), target_size=(224, 224))
    img = img_to_array(img) / 255.0  # Normalización al rango [0, 1]
    img = np.expand_dims(img, axis=0)  # Añadir dimensión de batch

    # Hacer predicción con el modelo cargado
    predictions = model.predict(img)

    # Obtener la clase predicha
    predicted_class = np.argmax(predictions, axis=1)[0]

    # Invertir el mapeo class_indices para obtener el nombre del autor
    class_labels = {v: k for k, v in train_generator.class_indices.items()}

    # Mostrar la clase predicha (nombre del autor)
    predicted_label = class_labels[predicted_class]
    print(f"La clase predicha es: {predicted_label}")
else:
    print("La URL no apunta a una imagen válida.")

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 96ms/step
La clase predicha es: Claude_Monet


In [None]:
interpreter = tf.lite.Interpreter(model_path='modelo_entrenado_mejorado.tflite', experimental_delegates=[])
interpreter.allocate_tensors()
input_details = interpreter.get_input_details()
output_details = interpreter.get_output_details()
print(f"Detalles de entrada: {input_details}")
print(f"Detalles de salida: {output_details}")

Detalles de entrada: [{'name': 'serving_default_keras_tensor_314:0', 'index': 0, 'shape': array([1, 1, 1, 3], dtype=int32), 'shape_signature': array([-1, -1, -1,  3], dtype=int32), 'dtype': <class 'numpy.float32'>, 'quantization': (0.0, 0), 'quantization_parameters': {'scales': array([], dtype=float32), 'zero_points': array([], dtype=int32), 'quantized_dimension': 0}, 'sparsity_parameters': {}}]
Detalles de salida: [{'name': 'StatefulPartitionedCall_1:0', 'index': 288, 'shape': array([1, 5], dtype=int32), 'shape_signature': array([-1,  5], dtype=int32), 'dtype': <class 'numpy.float32'>, 'quantization': (0.0, 0), 'quantization_parameters': {'scales': array([], dtype=float32), 'zero_points': array([], dtype=int32), 'quantized_dimension': 0}, 'sparsity_parameters': {}}]


In [None]:
import tensorflow as tf

# Convertir el modelo Keras a TensorFlow Lite
converter = tf.lite.TFLiteConverter.from_keras_model(model)
# Opcional: habilitar optimizaciones para reducir el tamaño del modelo
converter.optimizations = [tf.lite.Optimize.DEFAULT]
# Aplicar cuantización dinámica
converter.target_spec.supported_types = [tf.float16]
tflite_model = converter.convert()

# Guardar el modelo convertido en un archivo .tflite
with open('modelo_entrenado_mejorado.tflite', 'wb') as f:
    f.write(tflite_model)

print("Modelo exportado a modelo_entrenado_mejorado.tflite")

Saved artifact at '/tmp/tmpoe5t_wy9'. The following endpoints are available:

* Endpoint 'serve'
  args_0 (POSITIONAL_ONLY): TensorSpec(shape=(None, None, None, 3), dtype=tf.float32, name='keras_tensor_314')
Output Type:
  TensorSpec(shape=(None, 5), dtype=tf.float32, name=None)
Captures:
  140534375826704: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375826352: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375831104: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375825648: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375829344: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375834800: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375834272: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375838144: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375835504: TensorSpec(shape=(), dtype=tf.resource, name=None)
  140534375836384: TensorSpec(shape=(), dtype=tf.resource, name=None)
  14053437