In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import confusion_matrix

In [2]:
url = "https://raw.githubusercontent.com/vega/vega/main/docs/data/seattle-weather.csv"
datos = pd.read_csv(url)

In [3]:
X = datos[['temp_max', 'temp_min']]
y = datos['weather']

In [4]:
y_binary = np.where(y == 'rain', 1, 0)

In [5]:
x_train, x_test, y_train, y_test = train_test_split(X, y_binary, test_size=0.4, random_state=42)

In [6]:
modelo_naive_bayes = GaussianNB()
modelo_naive_bayes.fit(x_test, y_test)

In [7]:
y_pred = modelo_naive_bayes.predict(x_test)

In [8]:
matriz_confusion = confusion_matrix(y_test, y_pred)
(TN, FP, FN, TP) = matriz_confusion.ravel()

In [9]:
def calcularPrecision(TP, FP):
    precision = TP / (TP + FP)
    precision = precision * 100
    return precision

def calcularExactitud(TP, TN, FP, FN):
    exactitud = (TP + TN) / (TP + TN + FP + FN)
    exactitud = exactitud * 100
    return exactitud

def calcularSensibilidad(TP, TN, FP, FN):
    sensibilidad = TP / (TP + FN)
    sensibilidad = sensibilidad * 100
    return sensibilidad

def calcularEspecificidad(TP, TN, FP, FN):
    especificidad = TN / (TN + FP)
    especificidad = especificidad * 100
    return especificidad

precision = calcularPrecision(TP, FP)
exactitud = calcularExactitud(TP, TN, FP, FN)
sen = calcularSensibilidad(TP, TN, FP, FN)
especificidad = calcularEspecificidad(TP, TN, FP, FN)

print("Matriz de Confusión:")
print(matriz_confusion)
print("Verdaderos positivos:", TP)
print("Verdaderos negativos:", TN)
print("Falsos positivos:", FP)
print("Falsos negativos:", FN)
print("Precision:", precision, "%")
print("Exactitud:", exactitud, "%")
print("Sensibilidad:", sen, "%")
print("Especificidad:", especificidad, "%")


Matriz de Confusión:
[[213 112]
 [ 49 211]]
Verdaderos positivos: 211
Verdaderos negativos: 213
Falsos positivos: 112
Falsos negativos: 49
Precision: 65.3250773993808 %
Exactitud: 72.47863247863248 %
Sensibilidad: 81.15384615384616 %
Especificidad: 65.53846153846153 %
