### Modelos

En este notebook se evaluarán los siguientes modelos:
1. Regresión Logística

In [None]:
# Instalación de librerías
%pip install -r '../requirements.txt'

In [None]:
# Importación de librerías
import pandas as pd
# Naive Bayes
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
from sklearn.preprocessing import MinMaxScaler
from sklearn.pipeline import Pipeline

In [None]:
# Carga de datos
dataset_entrenamiento = pd.read_csv('../5-dataset-final/dist/dataset-train.csv')
dataset_pruebas = pd.read_csv('../5-dataset-final/dist/dataset-test.csv')
dataset_validacion = pd.read_csv('../5-dataset-final/dist/dataset-validation.csv')

In [None]:
# Eliminar valores nulos
dataset_entrenamiento = dataset_entrenamiento.dropna()
dataset_pruebas = dataset_pruebas.dropna()
dataset_validacion = dataset_validacion.dropna()

In [None]:
# Ver cantidad de registros
print(f'Dataset de entrenamiento: {len(dataset_entrenamiento)} registros')
print(f'Dataset de pruebas: {len(dataset_pruebas)} registros')
print(f'Dataset de validación: {len(dataset_validacion)} registros')

In [None]:
# División de datos
# Entrenamiento
X_train = dataset_entrenamiento.drop(columns=['sentiment'])
y_train = dataset_entrenamiento['sentiment']
# Pruebas
X_test = dataset_pruebas.drop(columns=['sentiment'])
y_test = dataset_pruebas['sentiment']
# Validación
X_val = dataset_validacion.drop(columns=['sentiment'])
y_val = dataset_validacion['sentiment']

### Modelos de machine learning

In [None]:
# Instancia del modelo
modelo = Pipeline([('Normalizing', MinMaxScaler()),('MultinomialNB', MultinomialNB())])
modelo.fit(X_train, y_train)


In [None]:
y_pred_train = modelo.predict(X_train)

accuracy_train = accuracy_score(y_train, y_pred_train)
print(f'Precisión en el conjunto de entrenamiento: {accuracy_train}')
print(classification_report(y_train, y_pred_train))
print(confusion_matrix(y_train, y_pred_train))


In [None]:
# Pruebas
y_pred_test = modelo.predict(X_test)

accuracy_test = accuracy_score(y_test, y_pred_test)
print(f'Precisión en el conjunto de pruebas: {accuracy_test}')
print(classification_report(y_test, y_pred_test))
print(confusion_matrix(y_test, y_pred_test))


In [None]:
# Validación
y_pred_val = modelo.predict(X_val)

accuracy_val = accuracy_score(y_val, y_pred_val)
print(f'Precisión en el conjunto de validación: {accuracy_val}')
print(classification_report(y_val, y_pred_val))
print(confusion_matrix(y_val, y_pred_val))