### Inteligencia Artificial. Tema 6: Introducción al Aprendizaje Automático

### Implementación de un clasificador Naive Bayes

José Luis Ruiz Reina - 28 de noviembre 2021

En este ejercicio implementaremos un clasificador Naive Bayes (suponiendo atributos con valores categóricos), y lo usaremos para predecir el partido (demócrata o republicano) de un congresista USA, a partir de sus votaciones. La descripción del entrenamiento y predicción del modelo Naive Bayes está en el tema 6. 

#### Conjuntos de datos

Importamos los conjuntos de datos. En primer lugar, los que usan en la explicación del tema 6 (día adecuado para jugar al tenis).

In [1]:
from jugar_tenis import X_tenis,y_tenis

La variable `X_tenis` contiene una lista de listas. Cada una de esas listas es un ejemplo del conjunto de datos. En `y_tenis` están los correspondientes valores de clasificación (en el mismo orden).   

In [2]:
X_tenis,y_tenis

([['Soleado', 'Alta', 'Alta', 'Débil'],
  ['Soleado', 'Alta', 'Alta', 'Fuerte'],
  ['Nublado', 'Alta', 'Alta', 'Débil'],
  ['Lluvia', 'Suave', 'Alta', 'Débil'],
  ['Lluvia', 'Baja', 'Normal', 'Débil'],
  ['Lluvia', 'Baja', 'Normal', 'Fuerte'],
  ['Nublado', 'Baja', 'Normal', 'Fuerte'],
  ['Soleado', 'Suave', 'Alta', 'Débil'],
  ['Soleado', 'Baja', 'Normal', 'Débil'],
  ['Lluvia', 'Suave', 'Normal', 'Débil'],
  ['Soleado', 'Suave', 'Normal', 'Fuerte'],
  ['Nublado', 'Suave', 'Alta', 'Fuerte'],
  ['Nublado', 'Alta', 'Normal', 'Débil'],
  ['Lluvia', 'Suave', 'Alta', 'Fuerte']],
 ['no',
  'no',
  'si',
  'si',
  'si',
  'no',
  'si',
  'no',
  'si',
  'si',
  'si',
  'si',
  'si',
  'no'])

Vamos a usar también para probar la implementación, un conocido conjunto de datos. Se trata de un conjunto con las 16 votaciones (sobre distintos temas) realizadas a lo largo del año 1984 por 435 congresistas en Estados Unidos, junto con el partido al que pertenecen (republicano o demócrata) 

Los valores posibles de cada voto son sí ("s"), no ("no") y presente ("?"). El voto "presente", en el congreso de Estados Unidos, podríamos asimilarlo al voto en blanco (aunque no es exactamente lo mismo).   

In [3]:
from votos import X_votos,y_votos

In [4]:
# El primero de los ejemplos:
X_votos[0],y_votos[0]

(['n',
  's',
  'n',
  's',
  's',
  's',
  'n',
  'n',
  'n',
  's',
  '?',
  's',
  's',
  's',
  'n',
  's'],
 'republicano')

#### Ejercicio 1

Definir una función `prob_prior(clase,y)` que calcula la probabilidad de una clase dada, a partir de un conjunto de datos (para esto, sólo es necesario la lista y de valores de clasificación). 

In [5]:
# -------   Solución:



In [6]:
# Ejemplos:

# >>> prob_prior("si",y_tenis)
# 0.6428571428571429

# prob_prior("demócrata",y_votos)
# 0.6137931034482759

#### Ejercicio 2

Definir una función `prob_cond(atributo,valor,clase,X,y)` que devuelve la estimación de la probabilidad de que un atributo tome un valor, condicionado a que se pertenece a una clase dada. La estimación se obtiene a partir del conjunto de datos X,y.

Los atributos los referenciaremos mediante el índice de la columna en la tabla de datos. Por ejemplo, en el conjunto de datos de jugar al tenis, el atributo Cielo es el 0, y el atributo Viento es el 3. 

In [7]:
# ----  Solución:




In [8]:
# Ejemplos:

# Probabilidad de Cielo soleado, dado que es un día bueno para jugar al tenis:
# >>> prob_cond(0,"Soleado","si",X_tenis,y_tenis)
# 0.2222222222222222

# Probabilidad de Cielo soleado, dado que es un día bueno para jugar al tenis:
# >>> prob_cond(3,"Fuerte","no",X_tenis,y_tenis)
# 0.6

#### Ejercicio 3

Para calcular todas las probabilidades a priori y condicionadas, podríamos llamar a las funciones anteriores para todas las combinaciones posibles de atributos, valores y clases. Pero si el conjunto de datos es muy grande, esto sería ineficiente, ya que cada llamada independiente realiza un recorrido por todo el conjunto de datos.

Sería aconsejable calcular todas las probabilidades de una única pasada. Se pide definir una función `calcula_probs(X,y)` que devuelva todas las probabilidades estimadas, a partir del conjunto de datos X,y, recorriendo los datos una sóla vez. 

Devolver el resultado en forma de dos diccionarios:

- Un diccionario cuyas claves son las clases y los valores son las probabilidades a priori de cada clase.
- Un diccionario cuyas claves son las ternas `(atributo,valor,clase)`y cuyos valores son las correspondientes probabilidades condicionadas. 


In [9]:
# ------ Solución:




In [10]:
# ---- Ejemplos:

# >>> calcula_probs(X_tenis,y_tenis)

#({'no': 0.35714285714285715, 'si': 0.6428571428571429},
# {(0, 'Nublado', 'no'): 0.0,
#  (0, 'Nublado', 'si'): 0.4444444444444444,
#  (0, 'Lluvia', 'no'): 0.4,
#  (0, 'Lluvia', 'si'): 0.3333333333333333,
#  (0, 'Soleado', 'no'): 0.6,
#  (0, 'Soleado', 'si'): 0.2222222222222222,
#  (1, 'Baja', 'no'): 0.2,
#  (1, 'Baja', 'si'): 0.3333333333333333,
#  (1, 'Suave', 'no'): 0.4,
#  (1, 'Suave', 'si'): 0.4444444444444444,
#  (1, 'Alta', 'no'): 0.4,
#  (1, 'Alta', 'si'): 0.2222222222222222,
#  (2, 'Normal', 'no'): 0.2,
#  (2, 'Normal', 'si'): 0.6666666666666666,
#  (2, 'Alta', 'no'): 0.8,
#  (2, 'Alta', 'si'): 0.3333333333333333,
#  (3, 'Fuerte', 'no'): 0.6,
#  (3, 'Fuerte', 'si'): 0.3333333333333333,
#  (3, 'Débil', 'no'): 0.4,
#  (3, 'Débil', 'si'): 0.6666666666666666})

#### Ejercicio 4

Una vez que hemos estimado las probabilidades a partir de los datos, vamos a definir una función `predicción_NB(probprior,probcond,ejemplo)` que a partir de las probabilidades calculadas, devuelve la clasificación que el modelo Naive Bayes predice para un ejemplo dado.    

In [11]:
# --------- Solución:




In [12]:
# ----- Ejemplo:

# >>> probpriors_tenis,probconds_tenis=calcula_probs(X_tenis,y_tenis)
# >>> predicción_NB(probpriors_tenis,probconds_tenis,["Soleado","Suave","Alta","Fuerte"])
# 'no'

#### Ejercicio 4

Recopilando lo realizado en los ejercicios anteriores, definir una clase `NaiveBayes` con dos métodos:

- Un método `entrena` para la estimación de las probabilidades
- Un método `predicción` para predecir nuevos ejemplos

Estimar las probabilidades usando suavizado. La constante `k` de suavizado debe ser un argumento del constructor (por defecto `k=1`). 


In [13]:
# ----- Solución
        
    

    
    
    

In [14]:
# ----- Ejemplo:

# >>> nb_tenis=NaiveBayes()
# >>> nb_tenis.entrena(X_tenis,y_tenis)
# >>> nb_tenis.predicción(["Soleado","Suave","Alta","Fuerte"])
# 'no'

#### Ejercicio 5

Vamos a aplicar ahora el clasificador Naive Bayes al conjunto de datos de los votos. Pero antes, vamos a separar (aleatoriamente) una parte de los datos para entrenamiento, dejando otra parte para evaluar el rendimiento del clasificador obtenido. 

Para ello, definir una función `divide_entrenamiento_prueba(X,y,prop_test)`, que devuelve `X_entr`, `y_entr`, `X_test`, `y_test`, resultado de partir `X` e `y`en dos partes, aleatoriamente. El argumento `prop_test` marca la proporción del total de datos que se apartan para test (por defecto 0.2).  Nota: usar `random.shuffle`

In [15]:
# ---------   Solución:




In [16]:
# ------ Ejemplo:

# >>> X_votos_entr,y_votos_entr,X_votos_test,y_votos_test=divide_entrenamiento_prueba(X_votos,y_votos)
# >>> len(X_votos),len(X_votos_entr),len(X_votos_test)
# (435, 348, 87)

#### Ejercicio 6

Entrenar un clasificador Naive Bayes sobre el conjunto de entrenamiento de los votos, y probar algunas predicciones sobre ejemplos del conjunto de prueba, comparando la predicción con el valor de clasificación que se conoce.


In [17]:
# ---- Ejemplo (pueden ser otros resultados, debidoa la aleatoriedad):

# Ejemplo 0. Predicción: demócrata. Clase real: demócrata.
# Ejemplo 10. Predicción: demócrata. Clase real: demócrata.
# Ejemplo 20. Predicción: republicano. Clase real: republicano.
# Ejemplo 30. Predicción: republicano. Clase real: demócrata.
# Ejemplo 40. Predicción: demócrata. Clase real: demócrata.
# Ejemplo 50. Predicción: demócrata. Clase real: demócrata.
# Ejemplo 60. Predicción: republicano. Clase real: republicano.
# Ejemplo 70. Predicción: demócrata. Clase real: demócrata.
# Ejemplo 80. Predicción: republicano. Clase real: republicano.

#### Ejercicio 7

Definir una función `rendimiento(clasificador,X,y)`, que devuelve la proporción de aciertos de un clasificador (como los que define la clase NaiveBayes), sobre un conjunto de datos X,y. Calcular el rendimiento del clasificador Naive Bayes aprendido para el conjunto de los votos.

In [18]:
# ----- Solución:




In [19]:
# ---Ejemplo (puede salir otro resultado, debido a la aleatoriedad ):

# >>> rendimiento(nb_votos,X_votos_test,y_votos_test)
# 0.8735632183908046