# Proyecto Inteligencia Artificial 2023-1 

En el presente estudio, se realizará la clasificación de imágenes utilizando redes neuronales convolucionales (CNN, por sus siglas en inglés). Se explorarán dos enfoques distintos: la creación de una red desde cero y el reentrenamiento de una red preentrenada mediante transfer learning. Estos métodos se aplicarán a un conjunto de datos compuesto por imágenes y etiquetas.

Las redes neuronales convolucionales son ampliamente utilizadas en tareas de visión por computadora, ya que son capaces de aprender patrones visuales y características relevantes en las imágenes. La creación de una red desde cero nos brinda la flexibilidad de diseñar la arquitectura a medida, mientras que el reentrenamiento de una red preentrenada permite aprovechar el conocimiento previo adquirido en conjuntos de datos masivos.

Para este estudio, se utilizará el conjunto de datos proporcionado en la siguiente [Imagenes orbital de Marte (HiRISE) conjunto de datos etiquetados versión 3](https://zenodo.org/record/4002935). Se trabajará en el preprocesamiento de las imágenes, la definición de las arquitecturas de las redes, el entrenamiento y la evaluación de los modelos resultantes.

## Descripción general de los datos

Este conjunto de datos contiene un total de 73,031 puntos de referencia. De estos, 10,433 puntos de referencia fueron detectados y extraídos de 180 imágenes de exploración de HiRISE, y 62,598 puntos de referencia fueron aumentados a partir de los 10,433 puntos de referencia originales.

Para cada punto de referencia original, se recortó una caja delimitadora cuadrada que incluye toda la extensión del punto de referencia más un margen de 30 píxeles a la izquierda, derecha, arriba y abajo. Cada punto de referencia recortado se redimensionó a 227x227 píxeles y luego se aumentó para generar 6 puntos de referencia adicionales utilizando los siguientes métodos:

Rotación de 90 grados en sentido horario
Rotación de 180 grados en sentido horario
Rotación de 270 grados en sentido horario
Volteo horizontal
Volteo vertical
Ajuste aleatorio de brillo
Este conjunto de datos es útil para la clasificación de imágenes de puntos de referencia en diferentes categorías. Los puntos de referencia se presentan como imágenes cuadradas de 227x227 píxeles, y cada imagen se ha aumentado para incluir variaciones en la orientación y el brillo. Además, se proporcionan etiquetas de clase para cada imagen, lo que permite la clasificación supervisada de los puntos de referencia utilizando técnicas de aprendizaje automático y de aprendizaje profundo.

las categorias que se usaron para etiquetar las imagenes son las siguientes: 

| Código | Descripción        |
|-------:|-------------------:|
|      0 |            other  |
|      1 |            crater |
|      2 |         dark dune |
|      3 |       slope streak |
|      4 |        bright dune |
|      5 |      impact ejecta |
|      6 |      swiss cheese  |
|      7 |   spider           |

## Procedimientos 
El proceso constará de los siguientes pasos para realizar la clasificación de imágenes utilizando redes neuronales convolucionales:

Carga de datos: Se deben cargar tanto las imágenes como sus etiquetas. Las imágenes se representan como matrices de píxeles y las etiquetas indican las categorías a las que pertenecen.

Preprocesamiento de datos: Antes de utilizar las imágenes en las redes neuronales, es común aplicar técnicas de preprocesamiento, como la normalización de píxeles, para asegurar que todas las imágenes tengan un rango de valores similar. También se pueden aplicar técnicas de aumento de datos para aumentar la cantidad de ejemplos en el conjunto de entrenamiento, como rotaciones, traslaciones o cambios de escala.

Creación de una red neuronal convolucional desde cero: En este enfoque, se diseñará y entrenará una red neuronal convolucional desde cero. Esto implica definir la arquitectura de la red, que consiste en capas convolucionales, capas de agrupación (pooling), capas totalmente conectadas y capas de salida. Luego, se entrenará la red utilizando el conjunto de datos de entrenamiento, ajustando los pesos de las conexiones entre las neuronas mediante la retropropagación del error.

Reentrenamiento de una red neuronal convolucional existente: En este enfoque, se utilizará una red neuronal convolucional preentrenada, [ResNet](https://huggingface.co/microsoft/resnet-50) que ha sido entrenada en un gran conjunto de datos. Se tomará esta red preentrenada y se ajustarán sus pesos utilizando el conjunto de datos específico de imágenes y etiquetas proporcionado. Este proceso se conoce como "transfer learning". La idea es aprovechar los conocimientos aprendidos por la red preentrenada en tareas generales de clasificación de imágenes y adaptarlos a la tarea específica en cuestión.

Evaluación y comparación de resultados: Una vez entrenadas ambas redes (la creada desde cero y la preentrenada con transfer learning), se deben evaluar y comparar sus resultados utilizando un conjunto de datos de prueba. Se pueden analizar métricas como la precisión, la exhaustividad y la puntuación F1 para medir el rendimiento de las redes en la clasificación de las imágenes.

Este procedimiento permite explorar las virtudes de ambos métodos: crear una red desde cero brinda flexibilidad en el diseño de la arquitectura y permite un ajuste más preciso a los datos específicos, mientras que utilizar transfer learning con una red preentrenada aprovecha el conocimiento previo y puede ahorrar tiempo y recursos de entrenamiento.

## preprocesamiento de los datos 
En primer lugar, obtenemos los nombres de las imágenes de la carpeta donde las tenemos almacenadas. Utilizaremos esta información junto con los nombres y etiquetas que se encuentran en el archivo "labels-map-proj-v3.txt" que posteriormente convertiremos en un archivo CSV por facilidad. Realizaremos la carga de los datos etiquetados.

In [14]:
import os
datos=os.listdir("C:/Users/User/Mi unidad/2023-1/Inteligencia Artificial/Proyecto/hirise-map-proj-v3/map-proj-v3")
print(len(datos))
print(datos)

7467
['ESP_011283_2265_RED-0030-r180.jpg', 'ESP_011289_1950_RED-0021-brt.jpg', 'ESP_011289_1950_RED-0021-r90.jpg', 'ESP_011289_1950_RED-0023-fh.jpg', 'ESP_011289_1950_RED-0024-fv.jpg', 'ESP_011289_1950_RED-0024-r180.jpg', 'ESP_011289_1950_RED-0026-r270.jpg', 'ESP_011289_1950_RED-0039.jpg', 'ESP_011289_1950_RED-0040-fh.jpg', 'ESP_011289_1950_RED-0043-brt.jpg', 'ESP_011289_1950_RED-0043-r90.jpg', 'ESP_011289_1950_RED-0050-r270.jpg', 'ESP_011289_1950_RED-0058-r180.jpg', 'ESP_011289_1950_RED-0063-fv.jpg', 'ESP_011289_1950_RED-0081-brt.jpg', 'ESP_011289_1950_RED-0081-r270.jpg', 'ESP_011289_1950_RED-0081-r90.jpg', 'ESP_011289_1950_RED-0083-r180.jpg', 'ESP_011289_1950_RED-0085-fh.jpg', 'ESP_011289_1950_RED-0097-fh.jpg', 'ESP_011289_1950_RED-0098-brt.jpg', 'ESP_011289_1950_RED-0098-r90.jpg', 'ESP_011289_1950_RED-0104-r90.jpg', 'ESP_011289_1950_RED-0112-r180.jpg', 'ESP_011289_1950_RED-0119-fh.jpg', 'ESP_011289_1950_RED-0119-r180.jpg', 'ESP_011289_1950_RED-0122-brt.jpg', 'ESP_011289_1950_RED-012

In [15]:
# Ruta del archivo de texto
ruta_archivo_txt = "C:/Users/User/Mi unidad/2023-1/Inteligencia Artificial/Proyecto/hirise-map-proj-v3/labels-map-proj-v3.txt"

# Ruta del archivo CSV de salida
ruta_archivo_csv = "C:/Users/User/Mi unidad/2023-1/Inteligencia Artificial/Proyecto/hirise-map-proj-v3/labels-map-proj-v3.csv"

# Abrir el archivo de texto en modo lectura
with open(ruta_archivo_txt, "r") as file:
    lineas = file.readlines()

# Abrir el archivo CSV en modo escritura
with open(ruta_archivo_csv, "w") as file:
    # Recorrer las líneas del archivo de texto
    for linea in lineas:
        # Eliminar los espacios en blanco al inicio y final de la línea
        linea = linea.strip()

        # Dividir la línea en elementos utilizando el espacio como delimitador
        elementos = linea.split(" ")

        # Unir los elementos con comas para formar una línea en formato CSV
        linea_csv = ",".join(elementos)

        # Escribir la línea en el archivo CSV
        file.write(linea_csv + "\n")

print("Archivo CSV generado exitosamente.")

Archivo CSV generado exitosamente.


In [16]:
import cv2
import numpy as np

carpeta_imagenes = "C:/Users/User/Mi unidad/2023-1/Inteligencia Artificial/Proyecto/hirise-map-proj-v3/map-proj-v3"

import csv

# Lista de nombres de archivos
nombres_archivos = os.listdir("C:/Users/User/Mi unidad/2023-1/Inteligencia Artificial/Proyecto/hirise-map-proj-v3/map-proj-v3")

# Ruta del archivo CSV con los nombres de imágenes y etiquetas
ruta_archivo_csv = "C:/Users/User/Mi unidad/2023-1/Inteligencia Artificial/Proyecto/hirise-map-proj-v3/labels-map-proj-v3.csv"

# Diccionario para almacenar el nombre de imagen y etiqueta
diccionario_etiquetas = {}

# Leer el archivo CSV
with open(ruta_archivo_csv, "r") as file:
    csv_reader = csv.reader(file, delimiter=',')
    for row in csv_reader:
        nombre_imagen, etiqueta = row

        # Verificar si el nombre de la imagen está en la lista de nombres de archivos
        if nombre_imagen in nombres_archivos:
            # Agregar el par nombre_imagen: etiqueta al diccionario
            diccionario_etiquetas[nombre_imagen] = int(etiqueta)

imagenes = []
etiquetas = []

for nombre_imagen, etiqueta in diccionario_etiquetas.items():
    ruta_imagen = carpeta_imagenes + "/" + nombre_imagen
    imagen = cv2.imread(ruta_imagen)
    imagenes.append(imagen)
    etiquetas.append(etiqueta)

imagenes = np.array(imagenes)
etiquetas = np.array(etiquetas)

In [17]:
print(len(imagenes),len(etiquetas))

7467 7467
