![imagenes](logo.png)

# Medidas de las variables aleatorias

## Recordatorio:


### Definición Matemática
Una **variable aleatoria** es una función que asigna un número real a cada resultado de un experimento aleatorio. Se clasifica en:
- **Discretas**: Toman valores específicos y contables. Ejemplo: número de caras al lanzar dos monedas.
- **Continuas**: Toman cualquier valor dentro de un intervalo. Ejemplo: la altura de una persona.

### Explicación Conceptual
Imagina que estás realizando un experimento como lanzar un dado. Una variable aleatoria es una forma de traducir los posibles resultados de ese experimento (1, 2, 3, ...) en números que podamos analizar.

### Ejemplo
- **Variable Discreta**: Sea $X$ el número de caras al lanzar dos monedas. Los valores posibles de $X$ son $0$, $1$, o $2$.
- **Variable Continua**: Sea $Y$ la temperatura diaria en tu ciudad. $Y$ puede tomar valores como $25.3^\circ$C o $30.7^\circ$C.

---

## Variables Aleatorias Independientes

Decimos que dos variables son independientes si saber el resultado de una no te dice nada sobre la otra. Por ejemplo, lanzar un dado y lanzar una moneda son eventos independientes: el número del dado no afecta si sale cara o cruz.

### Definición Matemática
Dos variables aleatorias $X$ e $Y$ son **independientes** si:
$$
P(X \leq x, Y \leq y) = P(X \leq x) \cdot P(Y \leq y)
$$

### Ejemplo
Si $X$ es el resultado de lanzar un dado y $Y$ es el resultado de lanzar una moneda:
$$
P(X = 4 \, \text{y} \, Y = \text{cara}) = P(X = 4) \cdot P(Y = \text{cara}) = \frac{1}{6} \cdot \frac{1}{2} = \frac{1}{12}
$$

---

## Esperanza Matemática

La esperanza es el "promedio esperado" o el valor típico que obtendrías si repitieras el experimento muchas veces.

### Definición Matemática
La **esperanza matemática** (o valor esperado) de una variable aleatoria es:
- Para una variable discreta:
  $$
  E[X] = \sum_{x \in \text{Rango}(X)} x \cdot P(X = x)
  $$
- Para una variable continua:
  $$
  E[X] = \int_{-\infty}^\infty x \cdot f_X(x) \, dx
  $$

### Ejemplo
Si $X$ es el número de caras al lanzar dos monedas:
- $P(X = 0) = \frac{1}{4}$, $P(X = 1) = \frac{1}{2}$, $P(X = 2) = \frac{1}{4}$.
La esperanza es:
$$
E[X] = 0 \cdot \frac{1}{4} + 1 \cdot \frac{1}{2} + 2 \cdot \frac{1}{4} = 1
$$

Por lo tanto, si lanzamos muchas veces dos dados, esperaríamos que en la mayoría de las veces obtuvieramos una cara.

---

## Varianza y Desviación Estándar

- La varianza mide cuánto se "alejan" los resultados del promedio. Si los valores están muy dispersos, la varianza será grande.
- La desviación estándar es una medida más intuitiva de esa dispersión, ya que usa las mismas unidades que la variable.

### Definición Matemática
- La **varianza** mide qué tan dispersos están los valores de $X$ respecto a su promedio:
  $$
  \text{Var}(X) = E[(X - E[X])^2] = E[X^2] - (E[X])^2
  $$
- La **desviación estándar** es la raíz cuadrada de la varianza:
  $$
  \text{Desv}(X) = \sqrt{\text{Var}(X)}
  $$

### Ejemplo
Para $X$ (caras en dos monedas), $E[X] = 1$:
1. Calculamos $E[X^2]$:
   $$
   E[X^2] = 0^2 \cdot \frac{1}{4} + 1^2 \cdot \frac{1}{2} + 2^2 \cdot \frac{1}{4} = 1.5
   $$
2. La varianza es:
   $$
   \text{Var}(X) = E[X^2] - (E[X])^2 = 1.5 - 1^2 = 0.5
   $$
3. La desviación estándar es:
   $$
   \text{Desv}(X) = \sqrt{0.5} \approx 0.71
   $$

---

## Covarianza

La covarianza mide si dos variables tienden a aumentar o disminuir juntas:
- **Positiva**: Cuando una sube, la otra también sube.
- **Negativa**: Cuando una sube, la otra baja.
- **Cero**: No hay relación lineal entre las variables.


### Definición Matemática
La **covarianza** entre dos variables $X$ e $Y$ es:
$$
\text{Cov}(X, Y) = E[(X - E[X])(Y - E[Y])] = E[XY] - E[X]E[Y]
$$

### Ejemplo
Si $X$ es el resultado de lanzar una moneda y $Y$ el resultado de lanzar un dado, entonces $X$ e $Y$ son independientes y por lo tanto no hay relación lineal entre las variables. Así:
$$
\text{Cov}(X, Y) = E[XY] - E[X]E[Y] = 0
$$

---

## Correlación

- Una correlación cercana a $1$ indica una relación lineal fuerte y positiva.
- Una correlación cercana a $-1$ indica una relación lineal fuerte y negativa.
- Una correlación cercana a $0$ indica poca o ninguna relación lineal.

### Definición Matemática
La **correlación** estandariza la covarianza para que esté entre $-1$ y $1$:
$$
\rho_{X,Y} = \frac{\text{Cov}(X, Y)}{\text{Desv}(X) \cdot \text{Desv}(Y)}
$$

### Ejemplo
Si $X$ es el tiempo dedicado a estudiar y $Y$ es la calificación obtenida:
- Supongamos que $\text{Cov}(X, Y) = 10$, $\text{Desv}(X) = 2$, y $\text{Desv}(Y) = 5$.
La correlación es:
$$
\rho_{X,Y} = \frac{\text{Cov}(X, Y)}{\text{Desv}(X) \cdot \text{Desv}(Y)} = \frac{10}{2 \cdot 5} = 1
$$
Esto indica una relación perfecta y positiva.

---

## Resumen

| Concepto           | Definición Matemática                                     | Explicación Simple                               | Ejemplo                     |
|---------------------|----------------------------------------------------------|-------------------------------------------------|-----------------------------|
| **Esperanza**       | $E[X] = \sum x P(X = x)$ o $E[X] = \int x f_X(x) dx$      | El promedio esperado.                           | $E[X] = 1$ para dos monedas.|
| **Varianza**        | $\text{Var}(X) = E[X^2] - (E[X])^2$                      | Qué tanto se desvían los valores del promedio. | $\text{Var}(X) = 0.5$.      |
| **Desviación**      | $\text{Desv}(X) = \sqrt{\text{Var}(X)}$                  | Lo mismo que la varianza, pero más intuitivo.   | $\text{Desv}(X) \approx 0.71$. |
| **Covarianza**      | $\text{Cov}(X, Y) = E[XY] - E[X]E[Y]$                    | Mide si dos variables suben/bajan juntas.       | $\text{Cov}(X, Y) = 0$.     |
| **Correlación**     | $\rho_{X,Y} = \frac{\text{Cov}(X, Y)}{\text{Desv}(X) \cdot \text{Desv}(Y)}$ | Fuerza de la relación lineal.                  | $\rho_{X,Y} = 1$.           |




In [None]:
import pandas as pd
import numpy as np
from plotnine import *
import scipy as sp

caracteristicas = pd.read_csv("C:\\Users\\Usuario\\Documents\\scidata\\24_inf_est\\proyectos\\caracteristicas.csv")
caracteristicas

In [None]:
sp.stats.pearsonr(caracteristicas["Caracteristica_1"], caracteristicas["Caracteristica_2"])[0]

In [None]:
ggplot(data=caracteristicas) + geom_point(mapping=aes(x="Caracteristica_1",y="Caracteristica_2"))

In [None]:
sp.stats.pearsonr(caracteristicas["Caracteristica_1"], caracteristicas["Caracteristica_3"])[0]

In [None]:
ggplot(data=caracteristicas) + geom_point(mapping=aes(x="Caracteristica_1",y="Caracteristica_3"))

In [None]:
sp.stats.pearsonr(caracteristicas["Caracteristica_1"], caracteristicas["Caracteristica_4"])[0]

In [None]:
ggplot(data=caracteristicas) + geom_point(mapping=aes(x="Caracteristica_1",y="Caracteristica_4"))

In [None]:
sp.stats.pearsonr(caracteristicas["Caracteristica_1"], caracteristicas["Caracteristica_5"])[0]

In [None]:
ggplot(data=caracteristicas) + geom_point(mapping=aes(x="Caracteristica_1",y="Caracteristica_5"))