In [1]:
# Importamos las librerías necesarias
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
from sklearn.metrics import classification_report
from sklearn.preprocessing import StandardScaler

# Cargamos el dataset diabetes.csv
df = pd.read_excel('farmacias_con_clusters.xlsx')
df = df.dropna()  # Eliminamos filas con valores nulos

# Convertir con map
mapping = {'PROPIA': 0, 'FRANQUICIA': 1}
df['tipofarmacia'] = df['tipofarmacia'].map(mapping)

mapping = {'ECONOMICAS': 0, 'MEDICITY': 1}
df['sucursal'] = df['sucursal'].map(mapping)

# Seleccionamos las columnas predictoras
X = df.drop('perfil', axis=1)
X = X.drop('farmacia', axis=1)
X = X.drop('tipofarmacia', axis=1)
X = X.drop('sucursal', axis=1)
X = X.drop('cluster', axis=1)
X.head()

# Seleccionamos la columna diabetes como variable objetivo
y = df['perfil']
y.head()
X

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2)

# Creamos un clasificador de tipo MLPClassifier con 2 capas ocultas de 100 neuronas cada una
# Usamos la función de activación 'relu' y el optimizador 'adam'
mlp = MLPClassifier(hidden_layer_sizes=(100, 100), activation='relu', solver='adam')

# Usamos el método 'fit()' para entrenar el clasificador
# Entrenamos el clasificador con los datos de entrenamiento 'X_train' y 'y_train'
mlp.fit(X_train, y_train)

# Predecimos las etiquetas de los datos de prueba 'X_test' usando el método 'predict()' del clasificador entrenado
y_pred = mlp.predict(X_test)
y_pred



array([47, 52, 46, 47, 46, 46, 47, 47, 47, 47, 50, 47, 45, 40, 46, 47, 45,
       49, 46, 46, 47, 48, 50, 47, 46, 46, 47, 47, 46, 46, 52, 47, 45, 47,
       52, 48, 46, 52, 47, 52, 43, 47, 46, 45, 52, 40, 47, 47, 48, 46, 52,
       52, 47, 47, 48, 52, 46, 47, 47, 43, 47, 47, 46, 49, 47, 40, 45, 48,
       46, 52, 46, 52, 52, 46, 40, 47, 49, 46, 47, 47, 50, 47, 47, 42, 47,
       46, 47, 47, 47, 46, 47, 46, 52, 42, 45, 46, 46, 48, 47, 47, 47, 45,
       46, 47, 48, 44, 47, 47, 47, 46, 47, 45, 47, 47, 52, 47, 47, 48, 47,
       46, 46, 46, 48, 47, 45, 47, 47, 47, 50, 46, 47, 45, 45, 52, 46, 46,
       46, 49, 45, 47, 52, 47, 46, 48, 47, 47, 50, 45, 49, 47, 46, 47, 47,
       46, 43, 40, 46, 45, 40, 45, 47, 52, 48, 45, 46, 45, 45, 46, 52, 49,
       46, 50, 42, 46, 47, 46, 48, 46, 47, 46, 47, 40, 46, 47, 47, 47, 47,
       47, 47, 44, 46, 46, 46])

In [2]:
X.head()

Unnamed: 0,venta,trx,nomina
0,63026.876,6949,4
1,61003.9857,5700,4
2,47367.4135,6742,4
3,44576.42,5601,3
4,42267.3465,5182,3


In [3]:
# Calculamos la precisión del modelo de clasificación 'mlp' con el método 'accuracy_score' 
# Usamos los datos 'y_test' y 'y_pred' como argumentos de la función 'accuracy_score'
# Guardamos el resultado en la variable 'accuracy'
accuracy = accuracy_score(y_test, y_pred)
accuracy

0.20207253886010362

In [24]:
nuevo_pinguino = [ 36109, 2159, 2]
pd.DataFrame([nuevo_pinguino])

nuevo_pinguino = scaler.transform(pd.DataFrame([nuevo_pinguino]))

# Hacemos una predicción de la especie del 'nuevo_pinguino' con el método 'predict' del modelo 'mlp'
# Guardamos la predicción en la variable 'nueva_prediccion'
nueva_prediccion = mlp.predict(nuevo_pinguino)
nueva_prediccion




array([47])

In [10]:
import joblib
# --- Guardar el modelo ---
joblib.dump(mlp, "mlp_model_3features.pkl")

# --- Cargar el modelo ---
loaded_clf = joblib.load("mlp_model_3features.pkl")