# Nombres: 



- Imanol Mendoza Saenz de Buruaga
- Luis Enrique Villalón Pineda

# Librerias

In [9]:
import numpy as np

# Funciones

In [10]:
def entrenamiento_bayesiano(data, labels):
    """
    Función para entrenar el clasificador bayesiano.

    Parameters:
    -----------
      data : list of list of int
          Representa los tipos o atributos de un documento.

      labels : list of int or str
          Lista de etiquetas de clase correspondiente a cada documento en `data`. 

    Returns:
    --------
      class_prob : dict
          Diccionario que contiene la probabilidad de cada clase `P(cls)`, donde la 
          clave es la clase y el valor es la probabilidad de esa clase.

      proba_condicional : dict
          Diccionario que contiene las probabilidades condicionales de cada tipo dado
          una clase `P(type|cls)`. La clave es la clase y el valor es un array que 
          representa la probabilidad condicional de cada tipo para esa clase.
    """

    # Obtener el número de clases y tipos
    classes = np.unique(labels)
    num_classes = len(classes)
    num_types = len(data[0])

    class_prob = {}
    proba_condicional = {}

    # Contar ocurrencias de clases y tipos para cada clase
    for cls in classes:
        cls_data = []  # Inicializar lista para documentos de la clase actual
        for i in range(len(data)):
            if labels[i] == cls:  
                cls_data.append(data[i]) 

        # Proba de la clase (P(cls))
        class_prob[cls] = len(cls_data) / len(data)  # P de a entre la p de omega

        # Sumar las ocurrencias de cada tipo en los documentos de la clase
        conteo = np.sum(cls_data, axis=0)
        print(np.sum(conteo))

        proba_condicional[cls] = conteo / np.sum(conteo)  # proba del registro dado la clase

    return class_prob, proba_condicional

In [11]:
def predictor_bayesiano(x, class_prob, proba_condicional):
    """
    Funcion para predecir la clase de un documento.

  Parameters:
    -----------
    x : list of int
        Representa los tipos o atributos de un documento.
    
    class_prob : dict
        Diccionario que contiene la probabilidad de cada clase `P(cls)`, donde la 
        clave es la clase y el valor es la probabilidad de esa clase.

    proba_condicional : dict
        Diccionario que contiene las probabilidades condicionales de cada tipo dado
        una clase `P(type|cls)`. La clave es la clase y el valor es un array que 
        representa la probabilidad condicional de cada tipo para esa clase.
  Returns:
    --------
    mejor_clase : object
        La clase con la probabilidad posterior más alta para el documento dado.
    """
    max_prob = 0
    mejor_clase = None

    for cls in class_prob:
        prob = class_prob[cls]  # Probabilidad de la clase, P de A
        prob *= np.prod(proba_condicional[cls] ** x)  # Probabilidad multinomial

        if prob > max_prob:
            max_prob = prob
            mejor_clase = cls

    return mejor_clase


# Ejemplo 

Datos

In [12]:
data = [
    [3, 0, 1],
    [2, 1, 0],
    [0, 1, 4],
    [1, 2, 3]
]

labels = [0, 0, 1, 1]  

In [13]:
class_prob, proba_condicional = entrenamiento_bayesiano(data, labels)

print("Probabilidades a priori de cada clase:")
print(class_prob)

print("\nProbabilidad de cada tipo dado cada clase:")
print(proba_condicional)


7
11
Probabilidades a priori de cada clase:
{np.int64(0): 0.5, np.int64(1): 0.5}

Probabilidad de cada tipo dado cada clase:
{np.int64(0): array([0.71428571, 0.14285714, 0.14285714]), np.int64(1): array([0.09090909, 0.27272727, 0.63636364])}


Nueva clase a predecir 

In [14]:
x_new = [2, 0, 1]  

predicted_class = predictor_bayesiano(x_new, class_prob, proba_condicional)
print(f"Clase predicha para x_new: {predicted_class}")

Clase predicha para x_new: 0
