In [None]:
import pandas as pd
import numpy as np
from scipy.stats import mode
import glob
from itertools import combinations

# Ruta a los archivos CSV
ruta_archivos = "*.csv"  # Cambia esta ruta según tu carpeta
archivos = glob.glob(ruta_archivos)  # Obtiene una lista de archivos CSV en la carpeta

if not archivos:
    raise FileNotFoundError("No se encontraron archivos CSV en la ruta especificada.")

# Leer los datos y almacenarlos en una lista
datos = []
for archivo in archivos:
    data = pd.read_csv(archivo)
    if 'numero_de_cliente' not in data.columns or 'Predicted' not in data.columns:
        raise ValueError(f"El archivo {archivo} no contiene las columnas requeridas.")
    data = data[['numero_de_cliente', 'Predicted']].sort_values(by='numero_de_cliente').reset_index(drop=True)
    datos.append(data)

# Asegurarse de que todos tienen el mismo conjunto de clientes
for i in range(1, len(datos)):
    if not datos[0]['numero_de_cliente'].equals(datos[i]['numero_de_cliente']):
        raise ValueError("Los archivos no tienen los mismos clientes o el orden no coincide.")

# Generar combinaciones de archivos y aplicar majority voting
combinaciones = []
for r in range(2, len(archivos) + 1):  # Desde combinaciones de 2 hasta todos los archivos
    combinaciones.extend(combinations(range(len(archivos)), r))

# Procesar cada combinación
numero_de_cliente = datos[0]['numero_de_cliente']  # Mantener los IDs de los clientes
for combo in combinaciones:
    # Obtener los datos de los modelos seleccionados
    predicciones = [datos[i]['Predicted'].values for i in combo]
    predicciones = np.array(predicciones)  # Convertir a matriz numpy

    # Aplicar majority voting
    majority_votes, _ = mode(predicciones, axis=0)

    # Crear un DataFrame con los resultados
    resultados_df = pd.DataFrame({
        'numero_de_cliente': numero_de_cliente,
        'Predicted': majority_votes.flatten()
    })

    # Crear un nombre de archivo descriptivo para la combinación
    nombre_archivo = f"predicciones_comboo_{'_'.join(map(str, combo))}.csv"
    resultados_df.to_csv(nombre_archivo, index=False)

    print(f"Predicciones generadas para la combinación {combo} y guardadas en {nombre_archivo}.")


In [2]:
import pandas as pd
import numpy as np
from scipy.stats import mode
import glob
from itertools import combinations
import os  # Para trabajar con nombres de archivos

# Ruta a los archivos CSV
ruta_archivos = "*.csv"  # Cambia esta ruta según tu carpeta
archivos = glob.glob(ruta_archivos)  # Obtiene una lista de archivos CSV en la carpeta

if not archivos:
    raise FileNotFoundError("No se encontraron archivos CSV en la ruta especificada.")

# Leer los datos y almacenarlos en una lista
datos = []
nombres_base = []  # Lista para almacenar los nombres base de los archivos
for archivo in archivos:
    data = pd.read_csv(archivo)
    if 'numero_de_cliente' not in data.columns or 'Predicted' not in data.columns:
        raise ValueError(f"El archivo {archivo} no contiene las columnas requeridas.")
    data = data[['numero_de_cliente', 'Predicted']].sort_values(by='numero_de_cliente').reset_index(drop=True)
    datos.append(data)
    nombres_base.append(os.path.splitext(os.path.basename(archivo))[0])  # Obtener el nombre base sin extensión

# Asegurarse de que todos tienen el mismo conjunto de clientes
for i in range(1, len(datos)):
    if not datos[0]['numero_de_cliente'].equals(datos[i]['numero_de_cliente']):
        raise ValueError("Los archivos no tienen los mismos clientes o el orden no coincide.")

# Generar combinaciones de archivos y aplicar majority voting
combinaciones = []
for r in range(2, len(archivos) + 1):  # Desde combinaciones de 2 hasta todos los archivos
    combinaciones.extend(combinations(range(len(archivos)), r))

# Procesar cada combinación
numero_de_cliente = datos[0]['numero_de_cliente']  # Mantener los IDs de los clientes
for combo in combinaciones:
    # Obtener los datos de los modelos seleccionados
    predicciones = [datos[i]['Predicted'].values for i in combo]
    predicciones = np.array(predicciones)  # Convertir a matriz numpy

    # Aplicar majority voting
    majority_votes, _ = mode(predicciones, axis=0)

    # Crear un DataFrame con los resultados
    resultados_df = pd.DataFrame({
        'numero_de_cliente': numero_de_cliente,
        'Predicted': majority_votes.flatten()
    })

    # Crear un nombre de archivo descriptivo basado en los nombres originales
    nombres_comb = "_".join([nombres_base[i] for i in combo])  # Concatenar nombres base
    nombre_archivo = f"predicciones_{nombres_comb}.csv"
    resultados_df.to_csv(nombre_archivo, index=False)

    print(f"Predicciones generadas para la combinación {combo} y guardadas en {nombre_archivo}.")

Predicciones generadas para la combinación (0, 1) y guardadas en predicciones_Flor_Leguizamon_Ignacio_Linari.csv.
Predicciones generadas para la combinación (0, 2) y guardadas en predicciones_Flor_Leguizamon_Florencia_Aldana.csv.
Predicciones generadas para la combinación (0, 3) y guardadas en predicciones_Flor_Leguizamon_ Ignacio_Arrmesto.csv.
Predicciones generadas para la combinación (0, 4) y guardadas en predicciones_Flor_Leguizamon_Fernando_Restelli.csv.
Predicciones generadas para la combinación (1, 2) y guardadas en predicciones_Ignacio_Linari_Florencia_Aldana.csv.
Predicciones generadas para la combinación (1, 3) y guardadas en predicciones_Ignacio_Linari_ Ignacio_Arrmesto.csv.
Predicciones generadas para la combinación (1, 4) y guardadas en predicciones_Ignacio_Linari_Fernando_Restelli.csv.
Predicciones generadas para la combinación (2, 3) y guardadas en predicciones_Florencia_Aldana_ Ignacio_Arrmesto.csv.
Predicciones generadas para la combinación (2, 4) y guardadas en predic

In [3]:
!zip -r /content/predicciones.zip /content

  adding: content/ (stored 0%)
  adding: content/.config/ (stored 0%)
  adding: content/.config/config_sentinel (stored 0%)
  adding: content/.config/active_config (stored 0%)
  adding: content/.config/.last_survey_prompt.yaml (stored 0%)
  adding: content/.config/hidden_gcloud_config_universe_descriptor_data_cache_configs.db (deflated 97%)
  adding: content/.config/default_configs.db (deflated 98%)
  adding: content/.config/configurations/ (stored 0%)
  adding: content/.config/configurations/config_default (deflated 15%)
  adding: content/.config/.last_opt_in_prompt.yaml (stored 0%)
  adding: content/.config/gce (stored 0%)
  adding: content/.config/logs/ (stored 0%)
  adding: content/.config/logs/2024.12.05/ (stored 0%)
  adding: content/.config/logs/2024.12.05/14.23.06.901164.log (deflated 93%)
  adding: content/.config/logs/2024.12.05/14.23.28.455145.log (deflated 58%)
  adding: content/.config/logs/2024.12.05/14.23.52.381553.log (deflated 56%)
  adding: content/.config/logs/2024.1