# Probabilidad y Estadística en Algoritmos

- Elementos de probabilidad y estadística aplicados a algoritmos, especialmente en algoritmos de clasificación y aprendizaje automático.
- Análisis de casos promedio versus peor caso en algoritmos.

### **Introducción**

La probabilidad y la estadística juegan roles fundamentales en el análisis y diseño de algoritmos, especialmente en áreas como la clasificación, el aprendizaje automático, y el análisis de rendimiento. Estas disciplinas matemáticas ofrecen herramientas para modelar incertidumbres, estimar comportamientos y evaluar la eficacia de los algoritmos bajo diversas condiciones. Este módulo explora cómo los elementos de probabilidad y estadística se aplican a los algoritmos, enfocándose en su utilidad para predecir rendimientos y tomar decisiones informadas durante el proceso de diseño.

### **Elementos de Probabilidad y Estadística en Algoritmos**

### **Modelado de Incertidumbre**

La probabilidad permite modelar la incertidumbre en los datos de entrada y en el comportamiento de los algoritmos. En el aprendizaje automático, por ejemplo, la probabilidad se utiliza para estimar la confianza en las predicciones de los modelos y para manejar la variabilidad en los conjuntos de datos de entrenamiento.

### **Estadísticas Descriptivas y Inferenciales**

Las estadísticas descriptivas resumen las características principales de los conjuntos de datos, mientras que las inferenciales permiten sacar conclusiones y hacer predicciones a partir de los datos. Estos conceptos son esenciales en la evaluación de algoritmos de clasificación, donde se busca entender la distribución de las características y predecir el comportamiento futuro del modelo.

### **Optimización Basada en Probabilidades**

Algunos algoritmos, como los genéticos o los de optimización por enjambre de partículas, utilizan principios probabilísticos para explorar el espacio de soluciones de manera eficiente, equilibrando entre la exploración de nuevas áreas y la explotación de las conocidas para encontrar óptimos globales.

### **Análisis de Casos Promedio Versus Peor Caso**

### **Análisis de Casos Promedio**

El análisis de casos promedio considera la eficiencia de un algoritmo bajo un modelo de probabilidad para la distribución de sus entradas. Este análisis es especialmente relevante en algoritmos cuyo rendimiento puede variar significativamente con diferentes tipos de datos, como el QuickSort, donde el tiempo de ejecución promedio es O(n log n), pero el peor caso es O(n^2).

### **Análisis de Peor Caso**

El análisis de peor caso proporciona una garantía sobre el rendimiento del algoritmo en las condiciones más desfavorables. Aunque este análisis es crucial para comprender los límites de los algoritmos, puede ser demasiado pesimista para algunas aplicaciones prácticas, donde los casos peores son raros o no representativos del uso típico.

### **Aplicaciones en Clasificación y Aprendizaje Automático**

En el aprendizaje automático, la probabilidad y la estadística son fundamentales para diseñar algoritmos de clasificación y regresión. Por ejemplo:

- **Teoría Bayesiana**: Los clasificadores bayesianos utilizan el teorema de Bayes para predecir la categoría de nuevas observaciones, basándose en la probabilidad de que pertenezcan a cada clase.
- **Estimación de Parámetros**: Métodos como la máxima verosimilitud y los bayesianos permiten estimar los parámetros de los modelos de manera que maximicen la probabilidad de los datos observados.

### **Conclusión**

La integración de la probabilidad y la estadística en el análisis de algoritmos enriquece significativamente nuestra capacidad para diseñar, analizar y optimizar algoritmos, especialmente en campos avanzados como el aprendizaje automático. Estas herramientas no solo facilitan una comprensión más profunda del comportamiento de los algoritmos en condiciones variadas sino que también mejoran la toma de decisiones durante el diseño algorítmico, asegurando soluciones más robustas y eficientes frente a la incertidumbre y la variabilidad de los datos.

## Ejercicios

### **Ejercicio 1: Análisis de Caso Promedio en QuickSort**

Dado un arreglo de números enteros, implemente el algoritmo QuickSort. Calcule su tiempo de ejecución promedio asumiendo que cualquier elemento tiene la misma probabilidad de ser elegido como pivote. Analice cómo la elección del pivote afecta el rendimiento promedio del algoritmo.

In [None]:
def quicksort(arr):
    if len(arr) <= 1:
        return arr
    else:
        pivot = arr[len(arr) // 2]
        left = [x for x in arr if x < pivot]
        middle = [x for x in arr if x == pivot]
        right = [x for x in arr if x > pivot]
        return quicksort(left) + middle + quicksort(right)

# Implemente la función y realice el análisis aquí

### **Ejercicio 2: Clasificador Bayesiano Simple**

Implemente un clasificador bayesiano simple para un conjunto de datos que contenga dos características y dos clases. Utilice la probabilidad condicional para clasificar un nuevo punto de datos. Asuma distribuciones gaussianas para las características.

In [None]:
import numpy as np

# Función para calcular la probabilidad gaussiana de x
def gaussian_probability(x, mean, std):
    return (1 / (np.sqrt(2 * np.pi) * std)) * np.exp(-((x - mean)**2 / (2 * std**2)))

# Implemente el clasificador aquí

### **Ejercicio 3: Simulación de Montecarlo para Estimar π**

Utilice el método de Montecarlo para estimar el valor de π. Genere puntos aleatorios dentro de un cuadrado que inscribe un círculo y calcule la proporción de puntos que caen dentro del círculo. Utilice esta proporción para estimar π.

In [None]:
import random

def estimate_pi(num_samples):
    points_inside_circle = 0
    for _ in range(num_samples):
        x, y = random.random(), random.random()
        if x**2 + y**2 <= 1:
            points_inside_circle += 1
    return 4 * points_inside_circle / num_samples

# Llame a la función con diferentes números de muestras

### **Ejercicio 4: Estimación de Parámetros con Máxima Verosimilitud**

Dado un conjunto de datos que sigue una distribución gaussiana, estime los parámetros (media y desviación estándar) utilizando el método de máxima verosimilitud.

In [None]:
def estimate_parameters(data):
    mean = sum(data) / len(data)
    variance = sum((x - mean) ** 2 for x in data) / len(data)
    std = variance ** 0.5
    return mean, std

# Use esta función para estimar los parámetros de su conjunto de datos

### **Ejercicio 5: Análisis de Peor Caso en Algoritmos**

Considere un algoritmo de búsqueda lineal en una lista. Analice el peor caso en términos de número de comparaciones realizadas. Luego, realice una simulación para calcular el número promedio de comparaciones en un conjunto de datos aleatorio.

In [None]:
def linear_search(arr, target):
    for i, num in enumerate(arr):
        if num == target:
            return i
    return -1

# Realice el análisis de peor caso y luego simule para encontrar el promedio

Estos ejercicios están diseñados para fortalecer su comprensión de cómo la probabilidad y la estadística se aplican en el análisis y diseño de algoritmos, especialmente en contextos que requieren modelado de incertidumbre y decisiones basadas en datos.