# Problema 1

### Preprocesamiento para eliminar el contorno tipo microscopio de la imagen

In [47]:
import os
import numpy as np
from PIL import Image

# Define el directorio donde se encuentran las imágenes y dónde guardarlas
input_directory = './database'
output_directory = './database'

# Crea el directorio de salida si no existe
if not os.path.exists(output_directory):
    os.makedirs(output_directory)

# Procesa y aplica un umbral a cada imagen
for i in range(1, 21):  # Suponiendo que las imágenes están numeradas del 1 al 20
    # Construye el nombre de archivo
    file_namef = f'{i}.pgm'
    file_name = f'{i}'
    input_path = os.path.join(input_directory, file_namef)
    output_path = os.path.join(output_directory, f'{file_name}_1th.pgm')

    # Realiza la misma operación que antes, pero en un bucle para cada imagen
    try:
        # Carga y convierte la imagen a escala de grises
        image = Image.open(input_path).convert("L")
        image_np = np.array(image)

        # Aplica un umbral
        thresholded_np = np.where(image_np < 65, 160, image_np)
        thresholded_image = Image.fromarray(thresholded_np.astype(np.uint8))

        # Guarda la imagen umbralizada
        thresholded_image.save(output_path)
    except FileNotFoundError:
        print(f"Archivo {input_path} no encontrado. Saltando.")

# Devuelve la ruta al directorio que contiene las imágenes umbralizadas
output_directory


'./database'

### Binarización de Imagen

In [48]:
import cv2

def invert_colors(img):
    # Invertir los colores de la imagen
    return 255 - img

def bradley_roth_adaptive_threshold(image, s=15, t=0.07):
    # Convertir imagen a escala de grises si es necesario
    if image.mode != 'L':
        image = image.convert('L')
    img = np.array(image, dtype=np.float64)

    # Calcular las sumas integrales
    integral_img = np.cumsum(np.cumsum(img, axis=1), axis=0)

    # Definir tamaño de la ventana
    rows, cols = img.shape
    s2 = s // 2
    result = np.zeros_like(img)

    for i in range(rows):
        for j in range(cols):
            # Definir límites de la ventana
            x1 = max(j - s2, 0)
            x2 = min(j + s2, cols - 1)
            y1 = max(i - s2, 0)
            y2 = min(i + s2, rows - 1)

            count = (y2 - y1) * (x2 - x1)
            sum_ = integral_img[y2, x2] - integral_img[y1, x2] - integral_img[y2, x1] + integral_img[y1, x1]

            if img[i, j] * count <= sum_ * (1 - t):
                result[i, j] = 0
            else:
                result[i, j] = 255

    # Invertir colores justo antes de retornar la imagen
    result = invert_colors(result)
    return Image.fromarray(result.astype(np.uint8))

def process_images_in_folder(folder_path):
    for i in range(1, 21):  # Suponiendo 20 imágenes
        original_path = os.path.join(folder_path, f'{i}_1th.pgm')
        
        if os.path.exists(original_path):
            image = Image.open(original_path)
            binarized_image = bradley_roth_adaptive_threshold(image)
            binarized_image.save(os.path.join(folder_path, f'{i}_2bn.pgm'))
            print(f'Imagen procesada y guardada: {i}_2bn.pgm')
        else:
            print(f'Imagen no encontrada: {original_path}')

# Actualizar con la ruta de tu carpeta
folder_path = './database'
process_images_in_folder(folder_path)


Imagen procesada y guardada: 1_2bn.pgm
Imagen procesada y guardada: 2_2bn.pgm
Imagen procesada y guardada: 3_2bn.pgm
Imagen procesada y guardada: 4_2bn.pgm
Imagen procesada y guardada: 5_2bn.pgm
Imagen procesada y guardada: 6_2bn.pgm
Imagen procesada y guardada: 7_2bn.pgm
Imagen procesada y guardada: 8_2bn.pgm
Imagen procesada y guardada: 9_2bn.pgm
Imagen procesada y guardada: 10_2bn.pgm
Imagen procesada y guardada: 11_2bn.pgm
Imagen procesada y guardada: 12_2bn.pgm
Imagen procesada y guardada: 13_2bn.pgm
Imagen procesada y guardada: 14_2bn.pgm
Imagen procesada y guardada: 15_2bn.pgm
Imagen procesada y guardada: 16_2bn.pgm
Imagen procesada y guardada: 17_2bn.pgm
Imagen procesada y guardada: 18_2bn.pgm
Imagen procesada y guardada: 19_2bn.pgm
Imagen procesada y guardada: 20_2bn.pgm


### Postprocesamiento de la imagen para eliminar manchas

In [49]:
def apply_median_filter(image_path, output_path, kernel_size=3):
    
    # Aplica un filtro de medianas a una imagen para eliminar el ruido de sal y pimienta.
    
    # Cargar la imagen en escala de grises
    image = cv2.imread(image_path, 0)
    
    # Aplicar el filtro de medianas
    filtered_image = cv2.medianBlur(image, kernel_size)
    
    # Guardar la imagen procesada
    cv2.imwrite(output_path, filtered_image)


output_directory = './database'  # Asegúrate de que este sea el directorio correcto

for i in range(1, 21):
    input_path = os.path.join(output_directory, f'{i}_2bn.pgm')
    output_path = os.path.join(output_directory, f'{i}_3bn_filtered.pgm')
    
    # Aplica el filtro de medianas con un tamaño de kernel predeterminado
    apply_median_filter(input_path, output_path)


### Creación de Métricas

In [50]:
import numpy as np
import cv2
import os

def calculate_metrics(gt, pred):
    TP = np.sum((gt == 255) & (pred == 255))
    TN = np.sum((gt == 0) & (pred == 0))
    FP = np.sum((gt == 0) & (pred == 255))
    FN = np.sum((gt == 255) & (pred == 0))

    accuracy = (TP + TN) / (TP + TN + FP + FN)
    sensitivity = TP / (TP + FN) if (TP + FN) != 0 else 0
    specificity = TN / (TN + FP) if (TN + FP) != 0 else 0
    precision = TP / (TP + FP) if (TP + FP) != 0 else 0
    f1_score = 2*TP / (2*TP + FP + FN) if (2*TP + FP + FN) != 0 else 0

    return accuracy, sensitivity, specificity, precision, f1_score

folder_path = './database'

metrics = []

for i in range(1, 21):
    gt_path = os.path.join(folder_path, f'{i}_gt.pgm')
    bn_path = os.path.join(folder_path, f'{i}_3bn_filtered.pgm')
    
    if os.path.exists(gt_path) and os.path.exists(bn_path):
        gt = cv2.imread(gt_path, 0)
        pred = cv2.imread(bn_path, 0)
        
        metrics.append(calculate_metrics(gt, pred))
    else:
        metrics.append((None, None, None, None, None))

print("{:<6} | {:<9} | {:<11} | {:<11} | {:<9} | {:<7}".format("Image", "Accuracy", "Sensitivity", "Specificity", "Precision", "F1 Score"))
print("-" * 70)  # Imprime una línea separadora

for i, (accuracy, sensitivity, specificity, precision, f1_score) in enumerate(metrics, 1):
    print("{:<6} | {:<9.3f} | {:<11.3f} | {:<11.3f} | {:<9.3f} | {:<7.3f}".format(i, accuracy or 0, sensitivity or 0, specificity or 0, precision or 0, f1_score or 0))


Image  | Accuracy  | Sensitivity | Specificity | Precision | F1 Score
----------------------------------------------------------------------
1      | 0.935     | 0.480       | 0.955       | 0.321     | 0.385  
2      | 0.948     | 0.561       | 0.967       | 0.460     | 0.505  
3      | 0.946     | 0.495       | 0.965       | 0.384     | 0.432  
4      | 0.958     | 0.108       | 0.997       | 0.644     | 0.186  
5      | 0.924     | 0.598       | 0.937       | 0.261     | 0.364  
6      | 0.940     | 0.707       | 0.949       | 0.345     | 0.463  
7      | 0.854     | 0.306       | 0.883       | 0.119     | 0.171  
8      | 0.909     | 0.311       | 0.939       | 0.199     | 0.242  
9      | 0.926     | 0.648       | 0.941       | 0.370     | 0.471  
10     | 0.957     | 0.332       | 0.985       | 0.510     | 0.402  
11     | 0.936     | 0.504       | 0.954       | 0.316     | 0.389  
12     | 0.956     | 0.624       | 0.984       | 0.773     | 0.691  
13     | 0.932     | 0.687     

1. Accuracy
Qué mide: La proporción de predicciones correctas (tanto positivas como negativas) entre el total de casos.
Valores buenos: Valores cercanos a 1 (o 100%) son ideales, indicando que la mayoría de las predicciones son correctas.
2. Sensitivity (Recall)
Qué mide: La proporción de verdaderos positivos identificados correctamente de todos los casos positivos reales.
Valores buenos: Valores cercanos a 1 son mejores, lo que significa que el algoritmo es capaz de identificar correctamente la mayoría de los casos positivos reales.
3. Specificity
Qué mide: La proporción de verdaderos negativos identificados correctamente de todos los casos negativos reales.
Valores buenos: Al igual que con la Sensitivity, valores cercanos a 1 son ideales, indicando una alta capacidad para identificar correctamente los casos negativos.
4. Precision
Qué mide: La proporción de verdaderos positivos sobre el total de positivos predichos (verdaderos positivos + falsos positivos).
Valores buenos: Valores más altos (cercanos a 1) son deseables, lo que indica que cuando el modelo predice un caso positivo, es probable que sea correcto.
5. F1 Score
Qué mide: El promedio armónico de Precision y Sensitivity, ofreciendo un balance entre ambas.
Valores buenos: Un F1 Score cercano a 1 es excelente, indicando un equilibrio óptimo entre Precision y Sensitivity.