# Laboratorio 3 - Práctica 4
### Gonzalo de las Heras de Matías - Jorge de la Fuente Tagarro
## ¿Lloverá o no lloverá?

<br>

![title](Images/lluvias.jpg)

### Objetivo 

Los agricultores de una comarca están preocupados por las lluvias ocurridas en los últimos años, en épocas
que no son habituales. Para ello han decidido crear un clasificador basado la probabilidad de que la
temperatura mínima y máxima y las precipitaciones sean bajas, medias o altas. Se considera que la
temperatura es baja si está por debajo de 10 grados, media si está entre 10 y 20 y alta si está por encima de 20. Se considera que ha llovido poco si la medida está por debajo de 1, normal si está entre 1 y 2, y que ha
llovido mucho si está por encima de 2.

Para ello usaremos el dataset “lluvias” que se encuentra en Moodle. Elige el clasificador que más se adapte de
entre los vistos en clase y usa scikit-learn junto con las librerías que necesites para resolver las siguientes
cuestiones.

### Cuestiones 

<ol type="o">
  <li>Realiza todo el preprocesamiento necesario para poder entrenar el clasificador. (Ojo: las
temperaturas están en grados Celsius.)</li>
  <li>Crea un clasificador e indica su error. Úsalo para saber si lloverá en los próximos 3 días. Obtener
los datos de cualquier fuente de Internet indicando que día es. </li>
</ol>

#### Librerias

In [22]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import warnings
from sklearn.metrics import accuracy_score
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
warnings.filterwarnings('ignore')

#### Funciones

In [23]:
def Temperatura(Temperatura):
    """
    Función para categorizar la temperatura.
    :param Temperatura: Temperatura a categorizar.
    :return: Devuelve la temperatura categorizada.
    """
    if Temperatura <= 10:
        return 0
    elif Temperatura > 10 and Temperatura <= 20:
        return 1
    else:
        return 2
    
def Precipitaciones(Precipitacion):
    """
    Función para categorizar la precipitación.
    :param Precipitacion: Temperatura a categorizar.
    :return: Devuelve la precipitación categorizada.
    """
    if Precipitacion <= 1:
        return 0
    elif Precipitacion > 1 and Precipitacion <= 2:
        return 1
    else:
        return 2
    
def TrueOrFalse(Lluvia):
    """
    Función para categorizar la lluvia.
    :param Lluvia: Temperatura a categorizar.
    :return: Devuelve la lluvia categorizada.
    """
    if Lluvia:
        return 1
    else:
        return 0

def PredecirLluvia(Modelo, Datos):
    """
    Función para predecir si va a llover o no.
    :param Modelo: Modelo con el que predecir.
    :param Datos: Datos con los que predecir.
    :return: Devuelve si va a llover o no.
    """
    resultado = modelo.predict([Datos])
    if resultado[0] == 1:
        print("Lloverá")
    else:
        print("No lloverá")

#### Dirección del dataset

In [24]:
DIR_DATASET = "Datos/lluvias.csv"

## 1. Preparación del dataset

<font color="blue">Cargamos el dataset de lluvias.</font>

In [25]:
Datos = pd.read_csv(DIR_DATASET)
del Datos["DATE"]
print("Hay " + str(len(Datos)) + " registros.")
Datos.head()

Hay 25551 registros.


Unnamed: 0,PRCP,TMAX,TMIN,RAIN
0,0.47,51,42,True
1,0.59,45,36,True
2,0.42,45,35,True
3,0.31,45,34,True
4,0.17,45,32,True


#### 1.1 Limpiamos los campos que son nulos.

<font color="blue">Contamos los campos nulos por cada columna.</font>

In [26]:
nulos = pd.DataFrame(Datos.isna().sum(), columns=["Número de nulos"])
nulos

Unnamed: 0,Número de nulos
PRCP,3
TMAX,0
TMIN,0
RAIN,3


<font color="blue">Volvemos a contar los registros nulos para cerciorarnos de que ya hemos limpiado todos los campos nulos.</font>

In [27]:
# Eliminamos las filas cuyos datos que nos interesan están a nulo.
Datos = Datos.drop(Datos[Datos["PRCP"].isnull() == True].index)
Datos = Datos.drop(Datos[Datos["RAIN"].isnull() == True].index)

nulos = pd.DataFrame(Datos.isna().sum(), columns=["Número de nulos"])
nulos

Unnamed: 0,Número de nulos
PRCP,0
TMAX,0
TMIN,0
RAIN,0


#### 1.2 Categorizamos las columnas del dataset.

In [28]:
DatosSinCategorizar = Datos.copy()

Datos['TMAX'] = Datos["TMAX"].apply(lambda row: Temperatura(row))
Datos['TMIN'] = Datos["TMIN"].apply(lambda row: Temperatura(row))
Datos['PRCP'] = Datos["PRCP"].apply(lambda row: Precipitaciones(row))

Datos['RAIN'] = Datos["RAIN"].apply(lambda row: TrueOrFalse(row))
DatosSinCategorizar['RAIN'] = DatosSinCategorizar["RAIN"].apply(lambda row: TrueOrFalse(row))
Datos.head()

Unnamed: 0,PRCP,TMAX,TMIN,RAIN
0,0,2,2,1
1,0,2,2,1
2,0,2,2,1
3,0,2,2,1
4,0,2,2,1


#### 1.3 Separamos los valores para predecir y la clase esperada.

In [29]:
esperado = Datos["RAIN"].values
del Datos["RAIN"]
valores = Datos.values

#### 1.4 Separamos los valores para entrenar y validar.

In [30]:
x_entrenam, x_test, y_entrenam, y_test = train_test_split(valores, esperado, test_size=0.2)

## 2. Creación del modelo

In [31]:
modelo = GaussianNB()
modelo.fit(x_entrenam, y_entrenam)

GaussianNB(priors=None)

In [32]:
predecido = modelo.predict(x_test)

In [33]:
# Calculamos el procentaje de precisión del modelo.
precision = round(accuracy_score(predecido, y_test) * 100, 1)

# Imprimimos el resultado
print("El modelo tiene una precisión del: " + str(precision) + "%")

El modelo tiene una precisión del: 58.4%


## 3. Prueba del modelo

<font color="blue">Sábado 24, domingo 25, lunes 26. 1: Lloverá, 0: No lloverá</font>

In [34]:
PredecirLluvia(modelo, [1,1,0])

No lloverá


In [35]:
PredecirLluvia(modelo, [1,1,0])

Lloverá


In [36]:
PredecirLluvia(modelo, [0,1,0])

Lloverá


## ANEXO I

#### Separamos los valores para predecir y la clase esperada.

In [37]:
esperado = DatosSinCategorizar["RAIN"].values
del DatosSinCategorizar["RAIN"]
valores = DatosSinCategorizar.values

#### Separamos los valores para entrenar y validar.

In [38]:
x_entrenam, x_test, y_entrenam, y_test = train_test_split(valores, esperado, test_size=0.2)

####  Creación del modelo.

In [39]:
modelo = GaussianNB()
modelo.fit(x_entrenam, y_entrenam)
predecido = modelo.predict(x_test)

# Calculamos el procentaje de precisión del modelo.
precision = round(accuracy_score(predecido, y_test) * 100, 1)

# Imprimimos el resultado
print("El modelo tiene una precisión del: " + str(precision) + "%")

El modelo tiene una precisión del: 100.0%


#### Prueba del modelo.

<font color="blue">Sábado 24, domingo 25, lunes 26. 1: Lloverá, 0: No lloverá</font>

In [40]:
PredecirLluvia(modelo, [1.9,13,7])

Lloverá


In [41]:
PredecirLluvia(modelo, [1.1,12,8])

Lloverá


In [42]:
PredecirLluvia(modelo, [0,12,2])

No lloverá


## Referencias

<ul>
    <li>https://dzone.com/articles/naive-bayes-tutorial-naive-bayes-classifier-in-pyt/</li>
    <li>https://stackabuse.com/the-naive-bayes-algorithm-in-python-with-scikit-learn/</li>
    <li>Apuntes de la asignatura</li>
</ul>