# Carga del set de datos

In [2]:
import os
import numpy as np
import cv2
from sklearn.model_selection import train_test_split

# Ruta de la carpeta que contiene las imágenes de pulmones con COVID
covid_folder = 'dataset\images\COVID_target'
# Ruta de la carpeta que contiene las imágenes de pulmones sanos
healthy_folder = 'dataset\images\Other'

# Lista para almacenar las imágenes y las etiquetas correspondientes
X = []
y = []

# Cargar imágenes de pulmones con COVID
for filename in os.listdir(covid_folder):
    if filename.endswith('.png'):
        img = cv2.imread(os.path.join(covid_folder, filename), cv2.IMREAD_GRAYSCALE)
        X.append(img)
        y.append(1)  # Etiqueta 1 para COVID

# Cargar imágenes de pulmones sanos
for filename in os.listdir(healthy_folder):
    if filename.endswith('.png'):
        img = cv2.imread(os.path.join(healthy_folder, filename), cv2.IMREAD_GRAYSCALE)
        X.append(img)
        y.append(0)  # Etiqueta 0 para pulmones sanos

# Convertir las listas en matrices numpy
X = np.array(X)
y = np.array(y)

# Aplanar las imágenes en un vector unidimensional
X = X.reshape(X.shape[0], -1)

# Dividir el conjunto de datos en entrenamiento y prueba
X_entrenamiento, X_prueba, y_entrenamiento, y_prueba = train_test_split(X, y, test_size=0.2, random_state=42)


In [3]:
# Verificar el tamaño de las matrices
print("Tamaño de X_entrenamiento:", X_entrenamiento.shape)
print("Tamaño de X_prueba:", X_prueba.shape)
print("Tamaño de y_entrenamiento:", y_entrenamiento.shape)
print("Tamaño de y_prueba:", y_prueba.shape)

Tamaño de X_entrenamiento: (16932, 89401)
Tamaño de X_prueba: (4233, 89401)
Tamaño de y_entrenamiento: (16932,)
Tamaño de y_prueba: (4233,)


# Feature engineering

In [4]:
from sklearn.preprocessing import StandardScaler

# Preprocesamiento de las imágenes
preprocessed_images = []
for image in X:
    # Redimensionar la imagen a un tamaño adecuado
    resized_image = cv2.resize(image, (64, 64))  # Ajusta el tamaño según tus necesidades

    # Normalizar la imagen
    normalized_image = resized_image.astype(float) / 255.0  # Normalización en el rango [0, 1]

    preprocessed_images.append(normalized_image)

# Convertir las imágenes preprocesadas en una matriz numpy
X_preprocessed = np.array(preprocessed_images)

# Aplanar las imágenes preprocesadas en un vector unidimensional
X_preprocessed = X_preprocessed.reshape(X_preprocessed.shape[0], -1)

# Dividir el conjunto de datos en entrenamiento y prueba
X_entrenamiento, X_prueba, y_entrenamiento, y_prueba = train_test_split(X_preprocessed, y, test_size=0.2, random_state=42)

# Normalizar las características utilizando un escalador estándar
scaler = StandardScaler()
X_entrenamiento = scaler.fit_transform(X_entrenamiento)
X_prueba = scaler.transform(X_prueba)

In [5]:
# Verificar el tamaño de las matrices
print("Tamaño de X_entrenamiento:", X_entrenamiento.shape)
print("Tamaño de X_prueba:", X_prueba.shape)
print("Tamaño de y_entrenamiento:", y_entrenamiento.shape)
print("Tamaño de y_prueba:", y_prueba.shape)

Tamaño de X_entrenamiento: (16932, 4096)
Tamaño de X_prueba: (4233, 4096)
Tamaño de y_entrenamiento: (16932,)
Tamaño de y_prueba: (4233,)


# Sklearn

In [6]:
from sklearn.neural_network import MLPClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import accuracy_score
import time

In [7]:
mlp = MLPClassifier(activation='logistic', alpha=0.01, hidden_layer_sizes=(10,10), max_iter=1000, random_state=42, solver='sgd')

start_time = time.time()
mlp.fit(X_entrenamiento, y_entrenamiento)
end_time = time.time()

y_pred = mlp.predict(X_prueba)

print("Predicciones: ", y_pred)
print("Valor real  : ",y_prueba)

accuracy = accuracy_score(y_prueba, y_pred)
print("Precisión: {:.2f}".format(accuracy))

Predicciones:  [1 0 0 ... 0 0 0]
Valor real  :  [0 0 1 ... 0 0 1]
Precisión: 0.85


# Prueba con feature extractor del enunciado

In [None]:
import os
import numpy as np
import cv2
from sklearn.model_selection import train_test_split

# Ruta de la carpeta que contiene las imágenes de pulmones con COVID
covid_folder = 'dataset\images\COVID_target'
# Ruta de la carpeta que contiene las imágenes de pulmones sanos
healthy_folder = 'dataset\images\Other'

# Lista para almacenar las imágenes y las etiquetas correspondientes
X = []
y = []

# Cargar imágenes de pulmones con COVID
for filename in os.listdir(covid_folder):
    if filename.endswith('.png'):
        img = cv2.imread(os.path.join(covid_folder, filename), cv2.IMREAD_GRAYSCALE)
        X.append(img)
        y.append(1)  # Etiqueta 1 para COVID

# Cargar imágenes de pulmones sanos
for filename in os.listdir(healthy_folder):
    if filename.endswith('.png'):
        img = cv2.imread(os.path.join(healthy_folder, filename), cv2.IMREAD_GRAYSCALE)
        X.append(img)
        y.append(0)  # Etiqueta 0 para pulmones sanos

# Convertir las listas en matrices numpy
X = np.array(X)
y = np.array(y)

# Aplanar las imágenes en un vector unidimensional
X = X.reshape(X.shape[0], -1)

# Dividir el conjunto de datos en entrenamiento y prueba
X_entrenamiento, X_prueba, y_entrenamiento, y_prueba = train_test_split(X, y, test_size=0.2, random_state=42)
