# ALGORITMO AODE

#Descripción:

El algoritmo AODE (Averaged One-Dependence Estimators) es un clasificador probabilístico que se utiliza en el aprendizaje automático para tareas de clasificación. Es una extensión del algoritmo Naive Bayes que trata de mitigar la asunción de independencia condicional entre las características en Naive Bayes. AODE se basa en la idea de que, en lugar de asumir independencia condicional completa entre las características, permite que las características estén condicionalmente dependientes entre sí dentro de la misma clase, pero aún asume independencia entre las clases.

Las características clave de AODE incluyen:
* Modelo de Probabilidades Condicionales: AODE construye un modelo de probabilidad condicional para cada característica dado un valor objetivo (clase). Esto significa que calcula la probabilidad de que una característica específica tome un valor particular dado que se encuentra en una clase específica.

* Promedio de Estimadores: En lugar de seleccionar un solo estimador (modelo) para cada clase, AODE promedia los estimadores de todas las clases. Esto ayuda a reducir la varianza y a obtener estimaciones más robustas.

* Suavizado Laplaciano: Al igual que en Naive Bayes, AODE puede aplicar suavizado Laplaciano para evitar que las probabilidades condicionales sean cero cuando no hay ejemplos de entrenamiento que coincidan exactamente con una combinación de características y clase.

* Manejo de Características Categóricas: AODE es adecuado para manejar características categóricas y discretas, así como características numéricas.

#Bibtext y Referencias

@inproceedings{webb2002averaged,
  title={Averaged One-Dependence Estimators: Preliminary Results.},
  author={Webb, Geoffrey I and Boughton, Janice R and Wang, Zhihai},
  booktitle={AusDM},
  pages={65--74},
  year={2002}
}

# Herramientas utilizadas:
* Obtención de información: https://chat.openai.com/
* https://www.perplexity.ai/search/0d504068-30a3-4fd6-a727-5a2683f00db6?s=u
* https://www.geeksforgeeks.org/averaged-one-dependence-estimators-aode/


#Tipo de Modelo:

* MODELO DE APRENDIZAJE: No supervisado
* POR PARAMETROS: No parametrico
* DATOS APRENDIZAJE: Offline
* RESULTADOS DEL ENTRENAMIENTO: Instancias

#Supuestos y Restricciones

#Supuestos

* Eficiencia Computacional: Aunque AODE es más flexible que algunos otros enfoques de aprendizaje automático, aún puede ser computacionalmente costoso en conjuntos de datos grandes con muchas características, ya que requiere estimar y promediar múltiples modelos de probabilidad condicional.

* Supuestos de Independencia Relajados: Aunque AODE relaja la suposición de independencia total de Naive Bayes, aún supone independencia condicional, lo que puede ser una limitación en casos donde las características tienen dependencias complejas entre sí.

#Restricciones

* Datos Incompletos o Valores Ausentes: AODE puede tener dificultades al manejar datos con valores faltantes o incompletos. Dado que se basa en probabilidades condicionales, la falta de información en una característica puede afectar negativamente su rendimiento.

* Cantidad de Datos: AODE, al igual que Naive Bayes, puede no funcionar bien cuando hay una cantidad limitada de datos de entrenamiento, ya que puede tener dificultades para estimar de manera confiable las probabilidades condicionales.

* Interpretación Limitada: AODE, al igual que otros métodos basados en probabilidades, puede proporcionar buenas predicciones pero no siempre es el mejor enfoque para comprender las relaciones entre las características.


In [None]:
#Importar las librerias necesarias
from collections import defaultdict

# Función para entrenar el clasificador AODE


def train(dataset):
    # Crear un diccionario para almacenar las probabilidades de cada clase y valor de característica
    probabilities = defaultdict(lambda: defaultdict(dict))

    # Calcular la probabilidad de cada clase
    class_counts = defaultdict(int)
    for data in dataset:
        x, y = data
        class_counts[y] += 1
    for y, count in class_counts.items():
        probabilities[y]['total'] = count / len(dataset)

    # Calcular la probabilidad de cada feature para cada clase
    feature_counts = defaultdict(lambda: defaultdict(int))
    for data in dataset:
        x, y = data
        for i in range(len(x)):
            feature_counts[i][(x[i], y)] += 1
    for i, counts in feature_counts.items():
        for (x, y), count in counts.items():
            probabilities[y][i][x] = count / class_counts[y]

    return probabilities




In [None]:
#Función para hacer predicciones con el clasificador AODE


def predict(model, data):
    # Calcular la probabilidad conjunta de cada clase y los features del punto de datos
    joint_probabilities = defaultdict(int)
    for y, class_probabilities in model.items():
        joint_probabilities[y] = class_probabilities['total']
        for i, feature_probabilities in class_probabilities.items():
            if i != 'total':
                joint_probabilities[y] *= feature_probabilities.get(data[i], 0)

    # Calcular la probabilidad de cada clase
    likelihoods = defaultdict(int)
    for y, joint_probability in joint_probabilities.items():
        likelihoods[y] = joint_probability / sum(joint_probabilities.values())

    # Return de la clase con mayor probabilidad
    return max(likelihoods, key=likelihoods.get)


In [None]:
#Ejemplo con un dataset de prueba
dataset = [
    ([1, 1, 1, 1], 'A'),
    ([1, 1, 1, 0], 'A'),
    ([1, 1, 0, 1], 'A'),
    ([1, 1, 0, 0], 'A'),
    ([1, 0, 1, 1], 'B'),
    ([1, 0, 1, 0], 'B'),
    ([1, 0, 0, 1], 'B'),
    ([1, 0, 0, 0], 'B'),
    ([0, 1, 1, 1], 'C'),
    ([0, 1, 1, 0], 'C'),
    ([0, 1, 0, 1], 'C'),
    ([0, 1, 0, 0], 'C'),
    ([0, 0, 1, 1], 'D'),
    ([0, 0, 1, 0], 'D'),
    ([0, 0, 0, 1], 'D'),
    ([0, 0, 0, 0], 'D'),
]



D


In [7]:
#Entrenamiento del modelo
model = train(dataset)

In [8]:
#Prediccion
print(predict(model, [0, 0, 0, 0]))

D
