# Preparación del conjunto de datos a utilizar
Para poder evaluar después y hacer pruebas con los audios, borraremos los datos de 6 pacientes en especifico, tres de los cuales padecen la enfermedad de Parkinson y otros tres que no.
De esta manera, entrenaremos los modelos con la mayoria de la base de audios y haremos pruebas con seis casos de diferentes características.

Para ello, haremos una sola función que borre los datos de los pacientes identificados con la nomenclatura indicada.

Autor: Maider Murugarren Ilundain

In [1]:
# Importamos la librerias necesarias
import os
import pandas as pd

# Función para borrar los datos de prueba
def borrar_filas_por_id(carpeta, id_columna, ids_a_borrar):
    """
    Calcula el cuadrado de un número dado.

    Parámetros:
    - carpeta: directorio donde se encuentran los archivos con todos los datos.
    - id_columna: columna con la que identificaremos los casos.
    - ids_a_borrar: lista de los IDs de los pacientes a borrar de los datos generales.

    Retorna:
    - El cuadrado del número.
    """
    # Extraer la lista de archivos CSV en la carpeta
    archivos_csv = [archivo for archivo in os.listdir(carpeta) if archivo.endswith('.csv')]

    # Iterar sobre cada archivo CSV
    for archivo in archivos_csv:
        ruta_csv = os.path.join(carpeta, archivo)

        # Cargar el archivo CSV en un DataFrame
        df = pd.read_csv(ruta_csv, delimiter=';')

        # Verificar si la columna de ID existe en el DataFrame
        if id_columna not in df.columns:
            print(f"La columna {id_columna} no existe en el archivo {archivo}.")
            continue

        # Filtrar las filas que coinciden con los IDs a borrar
        filas_a_borrar = df[df[id_columna].isin(ids_a_borrar)].index

        # Borrar las filas del DataFrame
        df.drop(filas_a_borrar, inplace=True)

        # Guardar el DataFrame modificado en el mismo archivo CSV
        df.to_csv(ruta_csv, index=False, sep=';')

        print(f"Se han borrado {len(filas_a_borrar)} filas del archivo {archivo}.")


In [2]:
# Eliminar de los csv con las caracteristicas Spicy
carpeta_csv = 'union_carac_Spicy/'
columna_id = 'ID'
ids_a_borrar = ['ID107', 'ID111', 'ID123', 'ID152', 'ID160', 'ID174']  # IDs de las filas a borrar

borrar_filas_por_id(carpeta_csv, columna_id, ids_a_borrar)

Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Scipy_1.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Scipy_2.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Scipy_3.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Scipy_4.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Scipy_5.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Scipy_6.csv.


In [3]:
# Eliminar de los csv con las caracteristicas Pythorch
carpeta_csv = 'unio_carac_Pythorch/'
columna_id = 'ID'
ids_a_borrar = ['ID107', 'ID111', 'ID123', 'ID152', 'ID160', 'ID174']  # IDs de las filas a borrar

borrar_filas_por_id(carpeta_csv, columna_id, ids_a_borrar)

Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Vgg-pythorch_1.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Vgg-pythorch_2.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Vgg-pythorch_3.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Vgg-pythorch_4.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Vgg-pythorch_5.csv.
Se han borrado 6 filas del archivo unificacion_caracteristicas_audios_Vgg-pythorch_6.csv.
