# Cabecera

## Ejercicio 1 — Aplicación de Distribuciones y Test de análisis
**Asignatura:** Metodología de la I+d y Documentación Científica  
**Autor:** Santiago Santana Martínez  
**Fecha:** 14 de enero de 2026  
**Entorno:** Jupyter Notebook (Python 3)

---

## Dependencias

In [None]:
import numpy as np
from scipy.stats import binom
from scipy.stats import poisson
from scipy.stats import norm
from scipy.stats import expon
from scipy.stats import pearsonr
import statsmodels.api as sm
from scipy.stats import shapiro
from scipy.stats import kstest
from scipy.stats import bartlett
from scipy.stats import t
from scipy.stats import wilcoxon
import matplotlib.pyplot as plt

## 1. Distribuciones Discretas

### 1.1 Distribución de Bernoulli

**Enunciado**  
Un sensor puede detectar correctamente un evento con probabilidad \(p = 0.9\).  
Definimos la variable aleatoria:

\[
X =
\begin{cases}
1 & \text{si el evento se detecta correctamente} \\
0 & \text{en caso contrario}
\end{cases}
\]

Se pide:
1. Calcular la probabilidad de detección correcta.
2. Simular 1000 detecciones y estimar empíricamente la probabilidad.


In [None]:
p = 0.9

# Probabilidad teórica
print("P(X=1) =", p)

# Simulación
np.random.seed(0)
samples = np.random.binomial(1, p, size=1000)
print("Probabilidad empírica:", samples.mean())

### 1.2 Distribución Binomial

**Enunciado**  
En un examen tipo test, cada pregunta tiene una probabilidad de acierto de 0.25.  
Un alumno responde a 10 preguntas.

Sea \(X\) el número de respuestas correctas.

Se pide:
1. Calcular la probabilidad de acertar exactamente 3 preguntas.
2. Calcular la probabilidad de acertar al menos 5 preguntas.

In [None]:
n = 10
p = 0.25

p_3 = binom.pmf(3, n, p)
p_5_or_more = 1 - binom.cdf(4, n, p)

print("P(X=3) =", p_3)
print("P(X>=5) =", p_5_or_more)

### 1.3 Distribución de Poisson

**Enunciado**  
En una central telefónica se reciben una media de 2 llamadas por minuto.

Sea \(X\) el número de llamadas en un minuto.

Se pide:
1. Probabilidad de recibir exactamente 3 llamadas.
2. Probabilidad de recibir más de 4 llamadas.

In [None]:
lam = 2

p_3 = poisson.pmf(3, lam)
p_more_4 = 1 - poisson.cdf(4, lam)

print("P(X=3) =", p_3)
print("P(X>4) =", p_more_4)

## 2. Distribuciones Continuas

### 2.1 Distribución Normal

**Enunciado**  
La altura de una población sigue una distribución normal con media 170 cm y desviación típica 10 cm.

Se pide:
1. Probabilidad de que una persona mida más de 180 cm.
2. Representar la distribución.

In [None]:
mu, sigma = 170, 10

p = 1 - norm.cdf(180, mu, sigma)
print("P(X>180) =", p)

x = np.linspace(140, 200, 400)
plt.plot(x, norm.pdf(x, mu, sigma))
plt.title("Distribución Normal de Alturas")
plt.show()

### 2.2 Distribución Exponencial

**Enunciado**  
El tiempo entre llegadas de clientes a un cajero sigue una distribución exponencial con media de 5 minutos.

Se pide:
1. Probabilidad de que un cliente espere más de 8 minutos.

In [None]:
mean = 5
scale = mean

p = 1 - expon.cdf(8, scale=scale)
print("P(T>8) =", p)

## 3. Correlación Lineal

**Enunciado**  
Se dispone de datos de horas de estudio y nota obtenida en un examen.

Se pide:
1. Calcular el coeficiente de correlación de Pearson.
2. Representar la relación.

In [None]:
hours = np.array([1,2,3,4,5,6,7,8])
grades = np.array([4,5,6,6,7,8,9,9])

r, p_value = pearsonr(hours, grades)
print("Coeficiente de correlación:", r)
print("p-valor:", p_value)

plt.scatter(hours, grades)
plt.xlabel("Horas de estudio")
plt.ylabel("Nota")
plt.title("Correlación lineal")
plt.show()

## 4. Tests de Análisis Estadístico

### 4.1 Q-Q Plot

Se utiliza para evaluar visualmente si una muestra sigue una distribución normal.

In [None]:
data = np.random.normal(0, 1, 100)
sm.qqplot(data, line='s')
plt.title("Q-Q plot")
plt.show()

### 4.2 Test de Shapiro-Wilk

Contrasta la hipótesis nula de normalidad.

In [None]:
stat, p = shapiro(data)
print("Estadístico:", stat)
print("p-valor:", p)

### 4.3 Test de Kolmogórov-Smirnov

Compara una muestra con una distribución teórica.

In [None]:
stat, p = kstest(data, 'norm')
print("Estadístico:", stat)
print("p-valor:", p)

### 4.4 Test de Bartlett

Contrasta la igualdad de varianzas entre varios grupos.

In [None]:
g1 = np.random.normal(0,1,50)
g2 = np.random.normal(0,1,50)

stat, p = bartlett(g1, g2)
print("Estadístico:", stat)
print("p-valor:", p)

### 4.5 Test de Grubbs

Se utiliza para detectar valores atípicos.

In [None]:
def grubbs_test(x, alpha=0.05):
    n = len(x)
    mean_x = np.mean(x)
    std_x = np.std(x, ddof=1)
    G = max(abs(x - mean_x)) / std_x
    t_crit = t.ppf(1 - alpha/(2*n), n-2)
    G_crit = (n-1)/np.sqrt(n) * np.sqrt(t_crit**2/(n-2+t_crit**2))
    return G, G_crit

data_g = np.array([10, 12, 11, 10, 9, 100])
G, Gc = grubbs_test(data_g)
print("G =", G, " G crítico =", Gc)

### 4.6 Test de Wilcoxon

Test no paramétrico para comparar dos muestras relacionadas.

In [None]:
before = np.array([70, 72, 68, 75, 71])
after = np.array([72, 74, 70, 76, 73])

stat, p = wilcoxon(before, after)
print("Estadístico:", stat)
print("p-valor:", p)