# Probabilidad y Estadística en Python

Este notebook cubre los fundamentos de combinatoria, probabilidad, distribuciones y pruebas de hipótesis en Python.
Incluye explicaciones teóricas, fórmulas y ejemplos prácticos con código bien documentado.

## 1. Fundamentos de Combinatoria y Probabilidad

### 1.1 Factoriales

El **factorial** de un número entero positivo `n`, representado como `n!`, se define como:

$$ 
n! = n \times (n-1) \times (n-2) \times \cdots \times 1 
$$


Por convención, se define que `0! = 1`.

Se usa en combinatoria para contar permutaciones y combinaciones.

In [None]:
# Importar la función factorial
from math import factorial

# Calcular el factorial de 3
n = 3
print(f'El factorial de {n} es:', factorial(n))

### 1.2 Combinaciones

Una combinación es la selección de `k` elementos de un conjunto de `n` elementos sin importar el orden.

La fórmula para calcular combinaciones es:

$$
C(n, k) = \frac{n!}{k!(n-k)!}
$$

In [None]:
# Calcular combinaciones
n = 5  # Número total de elementos
k = 3  # Número de elementos a elegir

combinations = factorial(n) / (factorial(k) * factorial(n - k))
print(f'El número de formas de elegir {k} elementos de {n} es:', combinations)

### 1.3 Distribuciones de Datos

Las distribuciones de datos nos permiten agrupar valores en categorías para analizarlos mejor.
A continuación, organizamos calificaciones de exámenes en categorías.

In [None]:
import numpy as np

# Datos de calificaciones
exam_results = np.array([
    42, 56, 59, 76, 43, 34, 62, 51, 50, 65,
    66, 50, 46, 5, 79, 99, 51, 26, 35, 8,
    34, 47, 64, 58, 61, 12, 30, 63, 20, 68
])

# Diccionario para categorizar los datos
summarized_data = {'excellent': 0, 'good': 0, 'average': 0, 'passable': 0, 'failed': 0}

# Clasificación de resultados
for score in exam_results:
    if score >= 90:
        summarized_data['excellent'] += 1
    elif score >= 70:
        summarized_data['good'] += 1
    elif score >= 50:
        summarized_data['average'] += 1
    elif score >= 20:
        summarized_data['passable'] += 1
    else:
        summarized_data['failed'] += 1

# Mostrar resultados
for category, count in summarized_data.items():
    print(f'{category}: {count}')

## 2. Distribución Binomial

La **distribución binomial** modela el número de éxitos en `n` ensayos independientes donde cada ensayo tiene probabilidad `p` de éxito.

Su fórmula es:

$$
P(k) = C(n, k) p^k (1 - p)^{n - k}
$$

In [None]:
# Calcular una probabilidad binomial
from math import factorial

p = 0.6  # Probabilidad de éxito
q = 0.4  # Probabilidad de fallo
n = 80   # Número total de clientes
k = 50   # Número de clientes que compran

probability = (factorial(n) / (factorial(k) * factorial(n - k))) * (p ** k) * (q ** (n - k))
print(f'Probabilidad de que exactamente {k} de {n} clientes compren:', probability)

## 3. Distribución Normal

La **distribución normal** se usa para modelar variables continuas con una media `μ` y desviación estándar `σ`.

Se define por la función de densidad de probabilidad:

\[ f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]

In [None]:
from scipy import stats as st

# Parámetros de la distribución
mu = 5000  # Media
sigma = 1500  # Desviación estándar
desired_cost = 4000  # Valor a evaluar

# Probabilidad acumulada
probability = st.norm(mu, sigma).cdf(desired_cost)
print(f'Probabilidad de que el costo sea menor a {desired_cost}:', probability)

## 4. Pruebas de Hipótesis

Las pruebas de hipótesis nos ayudan a determinar si una afirmación sobre una población es válida con cierto nivel de confianza.

Se usan valores `p` para decidir si rechazamos la hipótesis nula `H0`.

In [None]:
from scipy import stats as st
import pandas as pd

# Datos de prueba
scooters = pd.Series([15, 31, 10, 21, 21, 32, 30, 25, 21, 28])
optimal_value = 30  # Valor de referencia
alpha = 0.05  # Nivel de significación

# Prueba t de una muestra
results = st.ttest_1samp(scooters, optimal_value)
print('Valor p:', results.pvalue)

if results.pvalue < alpha:
    print('Rechazamos la hipótesis nula')
else:
    print('No podemos rechazar la hipótesis nula')

# Probabilidad y Estadística en Python

Se han añadido más ejercicios y explicaciones detalladas para hacer esta clase más extensa y completa.

## 1.4 Permutaciones

Las **permutaciones** son el número de formas en que podemos organizar un conjunto de `n` elementos en `k` posiciones considerando el orden.

La fórmula es:

\[ P(n, k) = \frac{n!}{(n-k)!} \]

In [None]:
# Calcular permutaciones
from math import factorial

n = 5  # Número total de elementos
k = 3  # Número de elementos a ordenar

permutations = factorial(n) / factorial(n - k)
print(f'El número de formas de ordenar {k} elementos de {n} es:', permutations)

## 1.5 Ejercicio de combinaciones y permutaciones

**Ejercicio:**
En una carrera de 8 participantes, ¿de cuántas maneras pueden ganar los 3 primeros lugares?

In [None]:
# Solución al ejercicio de combinaciones y permutaciones
n = 8  # Total de corredores
k = 3  # Posiciones en el podio

ways_to_win = factorial(n) / factorial(n - k)
print(f'Número de maneras de ganar los 3 primeros lugares:', ways_to_win)

## 2.1 Distribución Binomial con más ejemplos

**Ejercicio:**
Si lanzamos una moneda 10 veces, ¿cuál es la probabilidad de obtener exactamente 6 caras?

In [None]:
# Probabilidad binomial en un lanzamiento de moneda
p = 0.5  # Probabilidad de cara
q = 1 - p  # Probabilidad de cruz
n = 10  # Número total de lanzamientos
k = 6  # Número de éxitos (caras)

probability = (factorial(n) / (factorial(k) * factorial(n - k))) * (p ** k) * (q ** (n - k))
print(f'Probabilidad de obtener exactamente {k} caras en {n} lanzamientos:', probability)

## 3.1 Distribución Normal con Gráficos

Para visualizar la distribución normal, generaremos una gráfica con valores aleatorios.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# Parámetros
mu = 100  # Media
sigma = 15  # Desviación estándar

# Generar datos
x = np.linspace(mu - 4*sigma, mu + 4*sigma, 100)
y = norm.pdf(x, mu, sigma)

# Graficar la distribución normal
plt.plot(x, y, label='Distribución Normal')
plt.title('Distribución Normal')
plt.xlabel('Valor')
plt.ylabel('Densidad de Probabilidad')
plt.legend()
plt.grid()
plt.show()

## 4.1 Pruebas de Hipótesis con más ejemplos

**Ejercicio:**
Un profesor afirma que el tiempo promedio de estudio de sus alumnos es de 5 horas diarias.
Para comprobar esto, toma una muestra aleatoria de 30 estudiantes y registra el tiempo de estudio.
Realizaremos una prueba de hipótesis para verificar esta afirmación.

In [None]:
from scipy import stats as st
import numpy as np

# Datos de estudio de 30 alumnos
study_hours = np.array([4.5, 5.2, 6.1, 4.8, 5.0, 5.3, 5.1, 4.9, 5.6, 6.0, 
                         4.7, 5.8, 5.4, 5.2, 5.0, 5.1, 4.9, 5.3, 5.7, 5.5,
                         5.6, 4.9, 5.4, 5.2, 5.1, 5.8, 4.6, 5.0, 5.3, 5.7])

mu_claimed = 5  # Hipótesis del profesor
alpha = 0.05  # Nivel de significación

# Prueba t de una muestra
results = st.ttest_1samp(study_hours, mu_claimed)
print('Valor p:', results.pvalue)

if results.pvalue < alpha:
    print('Rechazamos la hipótesis nula: el tiempo de estudio es diferente de 5 horas')
else:
    print('No podemos rechazar la hipótesis nula: el tiempo de estudio es de 5 horas')

# Resumen y Conclusiones


- Fundamentos de combinatoria: factoriales, combinaciones y permutaciones.
- Distribuciones de probabilidad: binomial y normal.
- Pruebas de hipótesis en diferentes escenarios.
