In [1]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.feature_selection import mutual_info_classif


def load_data(file_path):
    data = pd.read_csv(file_path)
    return data

def preprocess_data(data):
    # Codificar variables categóricas
    categorical_columns = data.select_dtypes(include=['object']).columns
    label_encoder = LabelEncoder()
    for col in categorical_columns:
        data[col] = label_encoder.fit_transform(data[col])
    return data

def select_features(X, y, threshold=0.01):
    # Calcular la información mutua entre las características y la variable objetivo
    mi_scores = mutual_info_classif(X, y, random_state=42)
    mi_scores = pd.Series(mi_scores, index=X.columns)
    
    # Filtrar características con puntajes de información mutua superiores al umbral
    selected_features = mi_scores[mi_scores > threshold].index
    return X[selected_features]

"""def save_features(data, features_path, target_path):
    # Guardar características y objetivo
    X = data.drop('deposit', axis=1)
    y = data['deposit']
    X.to_csv(features_path, index=False)
    y.to_csv(target_path, index=False)"""

def save_features(X, y, features_path, target_path):
    # Guardar características seleccionadas y objetivo
    X.to_csv(features_path, index=False)
    y.to_csv(target_path, index=False)

if __name__ == "__main__":
    data = load_data("D:/Documentos/Ai Labs/Clases/Sesión 13 cuatro proyectos/Proyecto 1 Clasificación ML/bank.csv")
    data = preprocess_data(data)

    # Separar características y variable objetivo
    X = data.drop('deposit', axis=1)
    y = data['deposit']
    
    # Selección de características utilizando Mutual Information
    X_selected = select_features(X, y, threshold=0.01)
    
    # Guardar las características seleccionadas y la variable objetivo
    save_features(X_selected, y, 'D:/Documentos/Ai Labs/Clases/Sesión 13 cuatro proyectos/Proyecto 1 Clasificación ML/features.csv', 'D:/Documentos/Ai Labs/Clases/Sesión 13 cuatro proyectos/Proyecto 1 Clasificación ML/target.csv')
   # save_features(data, 'D:/Documentos/Ai Labs/Clases/Sesión 13 cuatro proyectos/Proyecto 1 Clasificación ML/features.csv', 'D:/Documentos/Ai Labs/Clases/Sesión 13 cuatro proyectos/Proyecto 1 Clasificación ML/target.csv')
