<a href="https://colab.research.google.com/github/abxda/python-stats/blob/main/STAT_Semana_5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Conceptos Básicos de Probabilidad

La probabilidad es una medida de la posibilidad de que ocurra un evento. Se define matemáticamente como:

$P(A) = \frac{\text{Número de casos favorables}}{\text{Número de casos posibles}}$

Donde:
- $P(A)$ es la probabilidad del evento A
- $0 \leq P(A) \leq 1$

### Técnicas de Conteo

1. **Principio de la Adición**: Para eventos mutuamente excluyentes A y B:
   $P(A \cup B) = P(A) + P(B)$

2. **Principio de la Multiplicación**: Si un evento A puede ocurrir de m formas y un evento B de n formas, entonces ambos pueden ocurrir de $m \times n$ formas.

3. **Permutaciones**: Cuando el orden importa:
   $P(n,r) = \frac{n!}{(n-r)!}$

4. **Combinaciones**: Cuando el orden no importa:
   $\binom{n}{r} = \frac{n!}{r!(n-r)!}$

### Reglas Importantes

1. **Regla del Complemento**:
   $P(\bar{A}) = 1 - P(A)$

2. **Regla de la Suma Generalizada**:
   $P(A \cup B) = P(A) + P(B) - P(A \cap B)$

3. **Probabilidad Condicional**:
   $P(A|B) = \frac{P(A \cap B)}{P(B)}$

4. **Teorema de la Probabilidad Total**:
   $P(B) = \sum_{i} P(A_i) \cdot P(B|A_i)$

5. **Teorema de Bayes**:
   $P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}$


**Ejemplo del Teorema de la Probabilidad Total**

El Teorema de la Probabilidad Total es una herramienta fundamental en la teoría de la probabilidad que nos permite calcular la probabilidad de un evento considerando todas las formas posibles en que puede ocurrir. Este teorema es especialmente útil cuando un evento puede ocurrir a través de varios escenarios mutuamente excluyentes y colectivamente exhaustivos.

Formalmente, si tenemos un evento B y un conjunto de eventos A1, A2, ..., An que son mutuamente excluyentes y cubren todo el espacio muestral, entonces:

$P(B) = \sum_{i=1}^n P(A_i) \cdot P(B|A_i)$

Donde:
- $P(B)$ es la probabilidad total del evento B
- $P(A_i)$ es la probabilidad de que ocurra el evento $A_i$
- $P(B|A_i)$ es la probabilidad condicional de B dado que ocurrió $A_i$

**Ejemplo Práctico: Las Tres Urnas**

Vamos a analizar el ejemplo de las tres urnas paso a paso:

Datos:
- Urna 1: 1 bola roja, 3 bolas azules
- Urna 2: 2 bolas rojas, 2 bolas azules
- Urna 3: 3 bolas rojas, 1 bola azul
- Se selecciona una urna al azar y luego se extrae una bola

Queremos calcular: La probabilidad de extraer una bola roja

Paso 1: Definir los eventos
B: Extraer una bola roja
A1: Seleccionar la Urna 1
A2: Seleccionar la Urna 2
A3: Seleccionar la Urna 3

Paso 2: Calcular las probabilidades de selección de cada urna
P(A1) = P(A2) = P(A3) = 1/3 (ya que la selección es al azar)

Paso 3: Calcular las probabilidades condicionales de extraer una bola roja de cada urna
P(B|A1) = 1/4 (1 roja de 4 bolas en la Urna 1)
P(B|A2) = 2/4 = 1/2 (2 rojas de 4 bolas en la Urna 2)
P(B|A3) = 3/4 (3 rojas de 4 bolas en la Urna 3)

Paso 4: Aplicar el Teorema de la Probabilidad Total
$P(B) = P(A_1) \cdot P(B|A_1) + P(A_2) \cdot P(B|A_2) + P(A_3) \cdot P(B|A_3)$
$     = (1/3 \cdot 1/4) + (1/3 \cdot 1/2) + (1/3 \cdot 3/4)$
$     = 1/12 + 1/6 + 1/4$
$     = 1/12 + 2/12 + 3/12$
$     = 6/12$
$     = 1/2$

Conclusión: La probabilidad de extraer una bola roja es 1/2 o 50%.

Interpretación:
Este resultado tiene sentido intuitivamente. Si repetimos este experimento muchas veces:
- Un tercio de las veces elegiremos la Urna 1, donde tenemos 25% de probabilidad de sacar una bola roja.
- Un tercio de las veces elegiremos la Urna 2, donde tenemos 50% de probabilidad de sacar una bola roja.
- Un tercio de las veces elegiremos la Urna 3, donde tenemos 75% de probabilidad de sacar una bola roja.

El promedio de estas probabilidades es (25% + 50% + 75%) / 3 = 50%, que coincide con nuestro cálculo.

Este ejemplo ilustra cómo el Teorema de la Probabilidad Total nos permite calcular la probabilidad de un evento (sacar una bola roja) considerando todas las formas posibles en que puede ocurrir (a través de las diferentes urnas), ponderando cada posibilidad por su probabilidad de ocurrencia.

### **Ejemplo Teorema de Bayes**

En una ciudad, el 1% de la población tiene una enfermedad rara. Se ha desarrollado una prueba diagnóstica con una precisión del 99% tanto para detectar la enfermedad como para identificar correctamente a las personas sanas. Si una persona da positivo en la prueba, ¿cuál es la probabilidad de que realmente tenga la enfermedad?

### Paso 1: Definir los eventos y datos

Definimos los siguientes eventos:
- $E$: Tener la enfermedad.
- $P$: Dar positivo en la prueba.

Datos:
- $P(E) = 0.01$ (prevalencia de la enfermedad, es decir, el 1% de la población tiene la enfermedad).
- $P(P|E) = 0.99$ (sensibilidad de la prueba, es decir, la probabilidad de que la prueba sea positiva dado que la persona tiene la enfermedad).
- $P(\neg P|\neg E) = 0.99$ (especificidad de la prueba, es decir, la probabilidad de que la prueba sea negativa dado que la persona no tiene la enfermedad).

### Paso 2: Identificar lo que queremos calcular

Queremos calcular $P(E|P)$, la probabilidad de tener la enfermedad dado que la prueba es positiva.

### Importancia del Orden

Es fundamental entender que \( P(P|E) \) y \( P(E|P) \) representan dos probabilidades diferentes.

- \( P(P|E) \) (la probabilidad de que la prueba sea positiva dado que la persona tiene la enfermedad) refleja la precisión de la prueba en detectar la enfermedad cuando esta realmente está presente. Es una medida de la **sensibilidad** de la prueba.

- \( P(E|P) \) (la probabilidad de tener la enfermedad dado que la prueba es positiva) es lo que realmente nos interesa saber después de obtener un resultado positivo en la prueba. Esta probabilidad depende no solo de la precisión de la prueba, sino también de la prevalencia de la enfermedad en la población general. Esta es la **probabilidad posterior**, la cual se calcula usando el Teorema de Bayes.

### Paso 3: Recordar el Teorema de Bayes

El Teorema de Bayes se expresa como:

$$
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
$$
(donde $P(A|B)$ es la probabilidad del evento $A$ dado que ocurrió $B$, $P(B|A)$ es la probabilidad del evento $B$ dado que ocurrió $A$, $P(A)$ es la probabilidad del evento $A$, y $P(B)$ es la probabilidad del evento $B$).

En nuestro caso:

$$
P(E|P) = \frac{P(P|E) \cdot P(E)}{P(P)}
$$
(donde $P(E|P)$ es la probabilidad de tener la enfermedad dado que la prueba es positiva, $P(P|E)$ es la probabilidad de que la prueba sea positiva dado que la persona tiene la enfermedad, $P(E)$ es la probabilidad de tener la enfermedad, y $P(P)$ es la probabilidad de que la prueba sea positiva).

### Paso 4: Expandir $P(P)$ usando el Teorema de la Probabilidad Total
Para entender por qué podemos expandir $ P(P) $ usando el Teorema de la Probabilidad Total, primero debemos recordar qué implica este teorema.

El Teorema de la Probabilidad Total nos permite calcular la probabilidad de un evento considerando todas las formas posibles en que puede ocurrir. Este teorema es especialmente útil cuando un evento puede ocurrir a través de varios escenarios que son mutuamente excluyentes y colectivamente exhaustivos.

#### Definición de eventos mutuamente excluyentes y exhaustivos:
- **Mutuamente excluyentes**: Dos eventos son mutuamente excluyentes si no pueden ocurrir simultáneamente. En nuestro caso, una persona no puede tener la enfermedad y no tenerla al mismo tiempo.
- **Colectivamente exhaustivos**: Un conjunto de eventos es colectivamente exhaustivo si cubre todas las posibles situaciones. En nuestro caso, la persona o tiene la enfermedad o no la tiene, abarcando todas las posibilidades.

#### Aplicación al ejemplo:

Queremos calcular $ P(P) $, la probabilidad de que la prueba sea positiva. Este evento puede ocurrir de dos maneras:
1. La persona tiene la enfermedad ($ E $).
2. La persona no tiene la enfermedad ($ \neg E $).

Estos dos eventos ($ E $ y $ \neg E $) son mutuamente excluyentes (una persona no puede simultáneamente tener y no tener la enfermedad) y colectivamente exhaustivos (cubren todas las posibles situaciones de salud respecto a la enfermedad).

Por lo tanto, podemos usar el Teorema de la Probabilidad Total para descomponer $ P(P) $ en términos de $ E $ y $ \neg E $:

$$
P(P) = P(P|E) \cdot P(E) + P(P|\neg E) \cdot P(\neg E)
$$

(donde $ P(P) $ es la probabilidad de que la prueba sea positiva, considerando ambas posibilidades: tener la enfermedad y no tenerla).

- $ P(P|E) $ es la probabilidad de que la prueba sea positiva dado que la persona tiene la enfermedad.
- $ P(E) $ es la probabilidad de que la persona tenga la enfermedad.
- $ P(P|\neg E) $ es la probabilidad de que la prueba sea positiva dado que la persona no tiene la enfermedad.
- $ P(\neg E) $ es la probabilidad de que la persona no tenga la enfermedad.

#### Explicación del cálculo:

1. **Caso 1: La persona tiene la enfermedad ($ E $)**:
   - La prueba da un verdadero positivo con probabilidad $ P(P|E) $.
   - Esto ocurre con una probabilidad de $ P(E) $.

2. **Caso 2: La persona no tiene la enfermedad ($ \neg E $)**:
   - La prueba da un falso positivo con probabilidad $ P(P|\neg E) $.
   - Esto ocurre con una probabilidad de $ P(\neg E) $.

Sumando estas dos probabilidades, obtenemos la probabilidad total de que la prueba sea positiva, considerando ambos escenarios mutuamente excluyentes y colectivamente exhaustivos.

#### Aplicación en la fórmula de Bayes:

Esto nos da la fórmula expandida del Teorema de Bayes:

$$
P(E|P) = \frac{P(P|E) \cdot P(E)}{P(P|E) \cdot P(E) + P(P|\neg E) \cdot P(\neg E)}
$$

(donde cada término se explica como antes, pero ahora considerando ambas posibilidades para $ P(P) $).

### Importancia del Teorema de la Probabilidad Total

El valor de aplicar el Teorema de la Probabilidad Total radica en su capacidad para descomponer un problema complejo en partes más manejables. En este ejemplo, nos permite calcular la probabilidad total de un resultado de prueba positiva considerando todas las formas en que puede ocurrir, ponderando cada escenario por su probabilidad de ocurrencia. Esto es crucial para aplicar correctamente el Teorema de Bayes y obtener una estimación precisa de la probabilidad posterior, $ P(E|P) $.

### Paso 5: Calcular las probabilidades que faltan

$$
P(\neg E) = 1 - P(E) = 1 - 0.01 = 0.99
$$
(donde $P(\neg E)$ es la probabilidad de no tener la enfermedad).

$$
P(P|\neg E) = 1 - P(\neg P|\neg E) = 1 - 0.99 = 0.01
$$
(donde $P(P|\neg E)$ es la probabilidad de que la prueba sea positiva dado que la persona no tiene la enfermedad, calculada como uno menos la especificidad de la prueba).

#### Explicación Intuitiva:

La especificidad $P(\neg P|\neg E) = 0.99$ nos dice que si una persona no tiene la enfermedad, hay un 99% de probabilidad de que la prueba sea negativa. Esto implica que hay un 1% de probabilidad de que la prueba sea positiva a pesar de que la persona no tiene la enfermedad (un falso positivo). Por lo tanto, $P(P|\neg E) = 0.01$.

### Paso 6: Sustituir los valores en la fórmula

$$
P(E|P) = \frac{0.99 \cdot 0.01}{(0.99 \cdot 0.01) + (0.01 \cdot 0.99)}
$$
(sustituyendo $P(P|E)$, $P(E)$, $P(P|\neg E)$ y $P(\neg E)$ en la fórmula).

### Paso 7: Realizar los cálculos

$$
P(E|P) = \frac{0.0099}{0.0099 + 0.0099} = \frac{0.0099}{0.0198} = 0.5
$$
(realizando los cálculos aritméticos).

### Interpretación

Si una persona da positivo en la prueba, tiene un 50% de probabilidad de tener realmente la enfermedad.

### Explicación adicional

1. **Precisión y Prevalencia**: Aunque la prueba es 99% precisa, la probabilidad de tener la enfermedad después de un resultado positivo es solo del 50%. Esto se debe a la baja prevalencia de la enfermedad en la población.

2. **Análisis de un grupo de 10,000 personas**:
   - **100 personas** tendrán la enfermedad (1% de 10,000).
   - De estas **100 personas**, **99** darán positivo (99% de 100).
   - De las **9,900 personas sanas**, **99** darán un falso positivo (1% de 9,900).
   - En total, habrá **198 resultados positivos** (99 + 99).
   - De estos **198 positivos**, solo **99** realmente tienen la enfermedad.

3. **Importancia del contexto**: Este ejemplo ilustra por qué es importante considerar tanto la precisión de la prueba como la prevalencia de la condición al interpretar los resultados de pruebas médicas.

4. **Uso del Teorema de Bayes**: Este teorema nos permite actualizar nuestras creencias basadas en nueva evidencia, combinando la información previa (prevalencia) con los nuevos datos (resultado de la prueba).

## Ejemplo Práctico: Análisis de Control de Calidad

Consideremos un escenario de control de calidad en una fábrica de máquinas. Tenemos un lote de $n$ máquinas, de las cuales $d$ son defectuosas. Seleccionamos aleatoriamente $k$ máquinas para inspección.

### Cálculo de Probabilidad de Rechazo

La probabilidad de rechazar el lote si al menos una de las $k$ máquinas seleccionadas es defectuosa se calcula de la siguiente manera:

1. **Espacio Muestral ($S$)**:
   $S = \binom{n}{k}$

2. **Combinaciones Favorables ($F$)**:
   a) Una defectuosa y una no defectuosa:
  $F_1 = \binom{d}{1} \times \binom{n-d}{k-1}$
   b) Dos defectuosas (si $d \geq 2$ y $k \geq 2$):
  $F_2 = \binom{d}{2}$

3. **Probabilidad de Rechazo**:
   $P(\text{rechazo}) = \frac{F_1 + F_2}{S}$

### Ejemplo Numérico

Para $n = 4$, $d = 2$, y $k = 2$:

1. $S = \binom{4}{2} = 6$
2. $F_1 = \binom{2}{1} \times \binom{2}{1} = 4$
   $F_2 = \binom{2}{2} = 1$
3. $P(\text{rechazo}) = \frac{4 + 1}{6} = \frac{5}{6}$

Este ejemplo ilustra cómo aplicar los conceptos de combinatoria y probabilidad en un escenario de control de calidad.


In [1]:
import math

def probabilidad_rechazo(n, d, k):
    # Espacio muestral (S)
    total_formas = math.comb(n, k)
    formas_al_menos_una_defectuosa = 0

    # Considerar todas las combinaciones de 1 hasta k defectuosas
    for i in range(1, min(d, k) + 1):
        formas_i_defectuosas = math.comb(d, i) * math.comb(n - d, k - i)
        formas_al_menos_una_defectuosa += formas_i_defectuosas

    # Probabilidad de rechazo
    probabilidad = formas_al_menos_una_defectuosa / total_formas
    return probabilidad

# Ejemplo específico: n=4, d=2, k=2
print(f"Probabilidad de rechazo (n=4, d=2, k=2): {probabilidad_rechazo(4, 2, 2)}")

Probabilidad de rechazo (n=4, d=2, k=2): 0.8333333333333334


In [2]:
# Tiempos de las llamadas en segundos
tiempos_llamadas = [10, 28, 40, 46]

# Calcular los intervalos entre llamadas consecutivas
intervalos = [tiempos_llamadas[i+1] - tiempos_llamadas[i] for i in range(len(tiempos_llamadas) - 1)] # comprensión de listas, del inglés list comprehensions

# Calcular el tiempo medio entre llamadas
tiempo_medio = sum(intervalos) / len(intervalos)

varianza_intervalos = sum([(intervalo - tiempo_medio)**2 for intervalo in intervalos]) / (len(intervalos))

desviacion_estandar = math.sqrt(varianza_intervalos)

# Mostrar resultados
print(f"Tiempos de las llamadas: {tiempos_llamadas}")
print(f"Intervalos entre llamadas consecutivas: {intervalos}")
print(f"Tiempo medio entre llamadas: {tiempo_medio} segundos")
print(f"Varianza de intervalos: {varianza_intervalos}")
print(f"Desviación estándar: {desviacion_estandar}")

Tiempos de las llamadas: [10, 28, 40, 46]
Intervalos entre llamadas consecutivas: [18, 12, 6]
Tiempo medio entre llamadas: 12.0 segundos
Varianza de intervalos: 24.0
Desviación estándar: 4.898979485566356


Antes de analizar el escenario, revisemos algunos conceptos esenciales:

- **Espacio Muestral (S):** El conjunto de todos los posibles resultados de un experimento aleatorio.
- **Evento:** Un subconjunto del espacio muestral.
- **Probabilidad de un Evento:**  La probabilidad de un evento A, denotada como $P(A)$, es un valor numérico entre 0 y 1 que mide la posibilidad de que A ocurra. Se calcula como:
  $P(A) = \frac{\text{Número de casos favorables a A}}{\text{Número total de casos posibles en S}}$

## Ejemplo 1: Intersección de Eventos

Imaginemos que las piezas se clasifican según su longitud (L) y diámetro (D), con las siguientes categorías:

| Diámetro / Longitud |  $(-\infty, 19.9)$ | $[19.9, 20.1]$ | $(20.1, \infty)$ |
|---------------------|--------------------|----------------|--------------------|
| $(-\infty, 0.99)$   | A1                | B1              | C1                |
| $[0.99, 1.01]$     | A2                | B2              | C2                |
| $(1.01, \infty)$   | A3                | B3              | C3                |

**Pregunta:** ¿Es posible que una pieza pertenezca a las categorías A2 y A3 al mismo tiempo?

**Análisis:**

- **Categoría A2 (Longitud):**  Una pieza pertenece a A2 si su longitud está en el intervalo  $[0.99, 1.01]$.
- **Categoría A3 (Longitud):** Una pieza pertenece a A3 si su longitud está en el intervalo $(1.01, \infty)$.

Observamos que estos intervalos no tienen ningún punto en común. Por lo tanto, es **imposible** que una pieza pertenezca simultáneamente a A2 y A3.  En términos de probabilidad, diríamos que la intersección de estos eventos es vacía: $P(A2 \cap A3) = 0$

## Ejemplo 2: Unión de Eventos

**Pregunta:**  ¿Cuál es el rango de longitudes posible para las piezas que pertenecen a las categorías C1, C2 o C3?

**Análisis:**

- **Categorías C1, C2, C3 (Diámetro):**  Estas categorías comparten el mismo rango de diámetro: $(20.1, \infty)$.
- **Unión de Longitudes:** Para encontrar el rango total de longitudes, tomamos la unión de los intervalos de longitud de C1, C2 y C3:
    - C1:  $(-\infty, 0.99)$
    - C2: $[0.99, 1.01]$
    - C3:  $(1.01, \infty)$

La unión de estos intervalos resulta en: $(-\infty, \infty)$.

**Respuesta:** Las piezas en las categorías C1, C2 o C3 pueden tener cualquier longitud.

In [None]:
import pandas as pd
from IPython.display import display, Markdown

# Crear el DataFrame con las celdas correspondientes
data = {
    'Diámetro / Longitud': [r'$\left(-\infty, 19.9\right)$', r'$\left[19.9, 20.1\right]$', r'$\left(20.1, \infty\right)$'],
    r'$\left(-\infty, 0.99\right)$': ['A1', 'B1', 'C1'],
    r'$\left[0.99, 1.01\right]$': ['A2', 'B2', 'C2'],
    r'$\left(1.01, \infty\right)$': ['A3', 'B3', 'C3'],
}

df = pd.DataFrame(data)

# Convertir el DataFrame a una tabla de Markdown
markdown_table = df.to_markdown(index=False)

# Mostrar la tabla como Markdown
display(Markdown(markdown_table))

| Diámetro / Longitud          | $\left(-\infty, 0.99\right)$   | $\left[0.99, 1.01\right]$   | $\left(1.01, \infty\right)$   |
|:-----------------------------|:-------------------------------|:----------------------------|:------------------------------|
| $\left(-\infty, 19.9\right)$ | A1                             | A2                          | A3                            |
| $\left[19.9, 20.1\right]$    | B1                             | B2                          | B3                            |
| $\left(20.1, \infty\right)$  | C1                             | C2                          | C3                            |

In [None]:
import pandas as pd
from IPython.display import display, Markdown

# Definir las categorías con intervalos más descriptivos
categorias = {
    'A1': {'longitud': r'$\left(-\infty, 0.99\right)$', 'diametro': r'$\left(-\infty, 19.9\right)$', 'label': 'A1'},
    'A2': {'longitud': r'$\left[0.99, 1.01\right]$', 'diametro': r'$\left(-\infty, 19.9\right)$', 'label': 'A2'},
    'A3': {'longitud': r'$\left(1.01, \infty\right)$', 'diametro': r'$\left(-\infty, 19.9\right)$', 'label': 'A3'},
    'B1': {'longitud': r'$\left(-\infty, 0.99\right)$', 'diametro': r'$\left[19.9, 20.1\right]$', 'label': 'B1'},
    'B2': {'longitud': r'$\left[0.99, 1.01\right]$', 'diametro': r'$\left[19.9, 20.1\right]$', 'label': 'B2'},
    'B3': {'longitud': r'$\left(1.01, \infty\right)$', 'diametro': r'$\left[19.9, 20.1\right]$', 'label': 'B3'},
    'C1': {'longitud': r'$\left(-\infty, 0.99\right)$', 'diametro': r'$\left(20.1, \infty\right)$', 'label': 'C1'},
    'C2': {'longitud': r'$\left[0.99, 1.01\right]$', 'diametro': r'$\left(20.1, \infty\right)$', 'label': 'C2'},
    'C3': {'longitud': r'$\left(1.01, \infty\right)$', 'diametro': r'$\left(20.1, \infty\right)$', 'label': 'C3'},
}

# Función para parsear y evaluar una condición
def parsear_condicion(condicion):
    condicion = condicion.replace(r'$\left', '').replace(r'\right$', '').replace(r'\right', '').replace('$', '')
    if ',' in condicion:
        partes = condicion.strip('()[]').split(',')
        inicio = float(partes[0].strip()) if partes[0].strip() != '-\infty' else -float('inf')
        fin = float(partes[1].strip()) if partes[1].strip() != '\infty' else float('inf')
        es_cerrado_inicio = condicion.startswith('[')
        es_cerrado_fin = condicion.endswith(']')
        return inicio, fin, es_cerrado_inicio, es_cerrado_fin
    else:
        raise ValueError(f"Condición no soportada: {condicion}")

# Función para evaluar si hay intersección entre dos rangos
def evaluar_interseccion(rango1, rango2):
    inicio1, fin1, cerrado_inicio1, cerrado_fin1 = rango1
    inicio2, fin2, cerrado_inicio2, cerrado_fin2 = rango2

    if fin1 < inicio2 or fin2 < inicio1:
        return False
    if fin1 == inicio2:
        return cerrado_fin1 and cerrado_inicio2
    if fin2 == inicio1:
        return cerrado_fin2 and cerrado_inicio1
    return True

# Función para evaluar la intersección y generar el contenido en Markdown
def interseccion_markdown(categoria1, categoria2):
    longitud_rango1 = parsear_condicion(categorias[categoria1]['longitud'])
    diametro_rango1 = parsear_condicion(categorias[categoria1]['diametro'])
    longitud_rango2 = parsear_condicion(categorias[categoria2]['longitud'])
    diametro_rango2 = parsear_condicion(categorias[categoria2]['diametro'])

    longitud_interseccion = evaluar_interseccion(longitud_rango1, longitud_rango2)
    diametro_interseccion = evaluar_interseccion(diametro_rango1, diametro_rango2)

    interseccion = longitud_interseccion and diametro_interseccion

    longitud_markdown = f"L: {categorias[categoria1]['longitud']} ∩ {categorias[categoria2]['longitud']}"
    diametro_markdown = f"D: {categorias[categoria1]['diametro']} ∩ {categorias[categoria2]['diametro']}"

    resultado_longitud = "Es posible" if longitud_interseccion else "Es imposible"
    resultado_diametro = "Es posible" if diametro_interseccion else "Es imposible"

    resultado = "Es posible" if interseccion else "Es imposible"

    markdown_content = f"| Longitud | Diámetro |\n|:-------------|:------------|\n| {longitud_markdown} | {diametro_markdown} |\n {resultado_longitud} | {resultado_diametro} |\n| Resultado: {resultado} |"

    return markdown_content



In [None]:
# Evaluar dos eventos específicos y generar la celda de Markdown
categoria1 = 'A2'
categoria2 = 'A3'
markdown_output = interseccion_markdown(categoria1, categoria2)

# Mostrar la celda de Markdown
display(Markdown(markdown_output))

| Longitud | Diámetro |
|:-------------|:------------|
| L: $\left[0.99, 1.01\right]$ ∩ $\left(1.01, \infty\right)$ | D: $\left(-\infty, 19.9\right)$ ∩ $\left(-\infty, 19.9\right)$ |
 Es imposible | Es posible |
| Resultado: Es imposible |

In [None]:
# Evaluar dos eventos específicos y generar la celda de Markdown
categoria1 = 'A1'
categoria2 = 'B2'
markdown_output = interseccion_markdown(categoria1, categoria2)

# Mostrar la celda de Markdown
display(Markdown(markdown_output))

| Longitud | Diámetro |
|:-------------|:------------|
| L: $\left(-\infty, 0.99\right)$ ∩ $\left[0.99, 1.01\right]$ | D: $\left(-\infty, 19.9\right)$ ∩ $\left[19.9, 20.1\right]$ |
 Es imposible | Es imposible |
| Resultado: Es imposible |

In [None]:
# Evaluar dos eventos específicos y generar la celda de Markdown
categoria1 = 'A2'
categoria2 = 'A1'
markdown_output = interseccion_markdown(categoria1, categoria2)

# Mostrar la celda de Markdown
display(Markdown(markdown_output))

| Longitud | Diámetro |
|:-------------|:------------|
| L: $\left[0.99, 1.01\right]$ ∩ $\left(-\infty, 0.99\right)$ | D: $\left(-\infty, 19.9\right)$ ∩ $\left(-\infty, 19.9\right)$ |
 Es imposible | Es posible |
| Resultado: Es imposible |

In [None]:
import pandas as pd
from IPython.display import display, Markdown

# Definir las categorías con intervalos más descriptivos
categorias = {
    'A1': {'longitud': r'$\left(-\infty, 0.99\right)$', 'diametro': r'$\left(-\infty, 19.9\right)$', 'label': 'A1'},
    'A2': {'longitud': r'$\left[0.99, 1.01\right]$', 'diametro': r'$\left(-\infty, 19.9\right)$', 'label': 'A2'},
    'A3': {'longitud': r'$\left(1.01, \infty\right)$', 'diametro': r'$\left(-\infty, 19.9\right)$', 'label': 'A3'},
    'B1': {'longitud': r'$\left(-\infty, 0.99\right)$', 'diametro': r'$\left[19.9, 20.1\right]$', 'label': 'B1'},
    'B2': {'longitud': r'$\left[0.99, 1.01\right]$', 'diametro': r'$\left[19.9, 20.1\right]$', 'label': 'B2'},
    'B3': {'longitud': r'$\left(1.01, \infty\right)$', 'diametro': r'$\left[19.9, 20.1\right]$', 'label': 'B3'},
    'C1': {'longitud': r'$\left(-\infty, 0.99\right)$', 'diametro': r'$\left(20.1, \infty\right)$', 'label': 'C1'},
    'C2': {'longitud': r'$\left[0.99, 1.01\right]$', 'diametro': r'$\left(20.1, \infty\right)$', 'label': 'C2'},
    'C3': {'longitud': r'$\left(1.01, \infty\right)$', 'diametro': r'$\left(20.1, \infty\right)$', 'label': 'C3'},
}

# Función para parsear y evaluar una condición
def parsear_condicion(condicion):
    return condicion.replace(r'$\left', '').replace(r'\right$', '').replace(r'\right', '').replace('$', '')

# Función para generar la lista de intervalos en LaTeX
def representar_intervalos(intervalos):
    return ', '.join(f"${intervalo}$" for intervalo in intervalos)

# Función para evaluar la unión y generar el contenido en Markdown
def union_markdown(categorias):
    rangos_longitud = [categorias[cat]['longitud'] for cat in categorias]
    rangos_diametro = [categorias[cat]['diametro'] for cat in categorias]

    longitud_markdown = representar_intervalos(rangos_longitud)
    diametro_markdown = representar_intervalos(rangos_diametro)

    markdown_content = f"| Longitud | Diámetro |\n|:-------------|:------------|\n| {longitud_markdown} | {diametro_markdown} |"

    return markdown_content


In [None]:
import pandas as pd
from IPython.display import display, Markdown

# Crear el DataFrame con las celdas correspondientes
data = {
    'Diámetro / Longitud': [r'$\left(-\infty, 19.9\right)$', r'$\left[19.9, 20.1\right]$', r'$\left(20.1, \infty\right)$'],
    r'$\left(-\infty, 0.99\right)$': ['A1', 'B1', 'C1'],
    r'$\left[0.99, 1.01\right]$': ['A2', 'B2', 'C2'],
    r'$\left(1.01, \infty\right)$': ['A3', 'B3', 'C3'],
}

df = pd.DataFrame(data)

# Convertir el DataFrame a una tabla de Markdown
markdown_table = df.to_markdown(index=False)

# Mostrar la tabla como Markdown
display(Markdown(markdown_table))

| Diámetro / Longitud          | $\left(-\infty, 0.99\right)$   | $\left[0.99, 1.01\right]$   | $\left(1.01, \infty\right)$   |
|:-----------------------------|:-------------------------------|:----------------------------|:------------------------------|
| $\left(-\infty, 19.9\right)$ | A1                             | A2                          | A3                            |
| $\left[19.9, 20.1\right]$    | B1                             | B2                          | B3                            |
| $\left(20.1, \infty\right)$  | C1                             | C2                          | C3                            |

In [None]:
# Evaluar la unión de dos o más eventos específicos y generar la celda de Markdown
categorias_union = ['C1', 'C2', 'C3']
categorias_seleccionadas = {cat: categorias[cat] for cat in categorias_union}
markdown_output = union_markdown(categorias_seleccionadas)

# Mostrar la celda de Markdown
display(Markdown(markdown_output))



| Longitud | Diámetro |
|:-------------|:------------|
| $$\left(-\infty, 0.99\right)$$, $$\left[0.99, 1.01\right]$$, $$\left(1.01, \infty\right)$$ | $$\left(20.1, \infty\right)$$, $$\left(20.1, \infty\right)$$, $$\left(20.1, \infty\right)$$ |

## Ejemplo 3: Influencia de una Constante en la Media y la Desviación Estándar

**Pregunta:**  ¿Cómo afecta la suma de una constante a todos los valores de un conjunto de datos a su media y desviación estándar?

**Análisis:**

- **Media:** La media se ve afectada directamente por la suma de una constante. Si sumamos una constante *c* a cada valor, la media también aumentará en *c*.
- **Desviación Estándar:** La desviación estándar mide la dispersión de los datos alrededor de la media. Sumar una constante no cambia la dispersión relativa de los datos, por lo que la desviación estándar **no se ve afectada**.

**Ejemplo en Python:**

In [None]:
import numpy as np

datos = np.array([1, 2, 3, 4, 5])
constante = 3
datos_modificados = datos + constante

print(f"Media original: {np.mean(datos)}, Desviación estándar original: {np.std(datos)}")
print(f"Media modificada: {np.mean(datos_modificados)}, Desviación estándar modificada: {np.std(datos_modificados)}")

Media original: 3.0, Desviación estándar original: 1.4142135623730951
Media modificada: 6.0, Desviación estándar modificada: 1.4142135623730951
