# Prediciendo los efectos del clima en el futból. 

Dadas las condiciones climáticas, queremos predecir cuando un partido de futbol entre dos rivales emblemáticos se dará. 

Para ello contamos con datos historicos de algunos de los partidos que han jugado previamente. Entre los atributos de los partidos tenemos la temperatura y clima en cada uno de los partidos y la variable objetivo que pretendemos predecir, tenemos si se jugó o no dicho partido. 

In [4]:
# En este caso, partimos con un data set dividido en tres listas. 

# La información del clima viene representada (En el espacio de simbolos) 
# por tres estados: Soleado, Lluvioso y Nublado.
clima=['Soleado','Soleado','Nublado','Lluvioso','Lluvioso','Lluvioso','Nublado','Soleado','Soleado',
'Lluvioso','Soleado','Nublado','Nublado','Lluvioso']

# De manera similar, la temperatura es descrita por los estados Caluroso, Frío
# y Moderado. 
temperatura=['Caluroso','Caluroso','Caluroso','Moderado','Frío','Frío','Frío','Moderado','Frío','Moderado','Moderado','Moderado','Caluroso','Moderado']

# Finalmente, tenemos registro de si el partido se jugó o no se jugó.
juego=['No','No','Si','Si','Si','No','Si','No','Si','Si','Si','Si','Si','No']

Lo primero que haremos será traducir esta información de manera que los algoritmos puedan entenderla. Para tal fin haremos primero un pre-procesamiento.

In [6]:
# Importamos la librería que nos permitirá codificar las etiquetas.
from sklearn import preprocessing

# Creamos un codificador de etiquetas
le = preprocessing.LabelEncoder()

# Y finalmente, convertimos las etiquetas tipo cadenas en números.
clima_codificado=le.fit_transform(clima)

# Finalmente vemos el vector clima ya codificado haciendo:
print(clima_codificado)

[2 2 1 0 0 0 1 2 2 0 2 1 1 0]


In [8]:
# Convertimos el resto de los datos tipo cadena en números. 

temp_codificada=le.fit_transform(temperatura)
variable_objetivo=le.fit_transform(juego)
print("Temp:",temp_codificada)
print("Juego:",variable_objetivo)

Temp: [0 0 0 2 1 1 1 2 1 2 2 2 0 2]
Juego: [0 0 1 1 1 0 1 0 1 1 1 1 1 0]


Observar que 0=No y 1=Si

In [9]:
# Creamos ahora nuestro conjunto de atributos en un solo conjunto
# en donde cada dato vendrá como una tupla (clima, temperatura)

atributos=list(zip(clima_codificado,temp_codificada))
print(atributos)

[(2, 0), (2, 0), (1, 0), (0, 2), (0, 1), (0, 1), (1, 1), (2, 2), (2, 1), (0, 2), (2, 2), (1, 2), (1, 0), (0, 2)]


In [10]:
# Iniciamos importando el modelo de Naïve Bayes Gaussiano.
from sklearn.naive_bayes import GaussianNB

# Creamos entonces un clasificador Gaussiano. 
modelo = GaussianNB()

# Procedemos a entrenar nuestro modelo usando el método fit. 
modelo.fit(atributos,variable_objetivo)

# Y finalmente podemos poderlo a prueba:
prediccion=modelo.predict([[0,2]]) # 0:Nublado, 2:Moderado
print("Valor Predicho:", prediccion)

Valor Predicho: [1]
